JPWO2017033275A1 - 画像読取装置および画像読取方法ならびに画像読取プログラム - Google Patents

画像読取装置および画像読取方法ならびに画像読取プログラム Download PDF

Info

Publication number
JPWO2017033275A1
JPWO2017033275A1 JP2016574303A JP2016574303A JPWO2017033275A1 JP WO2017033275 A1 JPWO2017033275 A1 JP WO2017033275A1 JP 2016574303 A JP2016574303 A JP 2016574303A JP 2016574303 A JP2016574303 A JP 2016574303A JP WO2017033275 A1 JPWO2017033275 A1 JP WO2017033275A1
Authority
JP
Japan
Prior art keywords
image
skew
reading
unit
skew angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016574303A
Other languages
English (en)
Other versions
JP6383441B2 (ja
Inventor
豊弘 根上
豊弘 根上
和美 鈴木
和美 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Publication of JPWO2017033275A1 publication Critical patent/JPWO2017033275A1/ja
Application granted granted Critical
Publication of JP6383441B2 publication Critical patent/JP6383441B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00718Skew
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0081Image reader

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Processing (AREA)

Abstract

帳票が矩形状でない場合であっても、欠損のない画像データを取得可能にする技術を提供する。帳票の画像を読み取る読取部を有する画像読取装置であって、読取部により読み取られた画像の画像データに基づき、帳票の傾きを補正するのに用いるスキュー角度を算出するスキュー角度算出部と、スキュー角度に基づき画像を回転させた第1スキュー補正後画像を生成し、生成した第1スキュー補正後画像を走査することで、第1スキュー補正後画像に含まれる、帳票の画像に外接する外接四角形を検出する外接領域検出部と、外接四角形の四隅点の座標に基づき、読取部により読み取られた画像から切出後帳票画像を切り出す画像切出部と、を有する。

Description

本発明は、画像読取装置および画像読取方法ならびに画像読取プログラムに関する。
OCR(Optical Character Reader)やスキャナなどの画像読取装置は、帳票の背景が黒であることを利用して帳票端を検出した後、帳票の四隅点を検出し、その後にスキュー補正を行い、文字成分を抽出して文字認識結果や画像データを取得する。
上述した技術を用いて、帳票の四隅点を検出して帳票の画像データを取得した場合、帳票が矩形状でない場合に、突き出し部分(例えば、タブ部分)の画像が欠損した画像データしか取得できないという問題がある。
特開2010−171492号公報(特許文献1)には、「読取装置による原稿の読取画像を処理する画像処理装置であって、原稿の読取画像が、帳票本体部の所定位置にタブ部分が突出して設けられているタブ紙の画像であることを認識する認識部と、認識部によりタブ紙の画像が認識される場合、タブ紙の画像からタブ部の画像を分離する分離部と、分離部により分離されたタブ部の画像を当該タブ部の画像が分離されたタブ紙の帳票本体部の画像上に重ね合わせることにより、当該帳票本体部の画像と同一の画像サイズを有するタブ埋込画像を生成する生成部とを有する」技術が開示されている。
特開2010−171492号公報
特許文献1に開示されている技術では、帳票が矩形状でない、例えばタブ帳票であっても、タブ部分(突き出し部分)が欠損しない画像データを取得できる。しかしながら、特許文献1に開示されている技術では、帳票本体部の画像上にタブ部分が重ね合わされる。そのため、特許文献1に開示されている技術では、帳票本体部の画像データの一部が欠損してしまう。
本発明の目的は、帳票が矩形状でない場合であっても、欠損のない画像データを取得可能にする技術を提供することである。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次の通りである。
本発明の一実施の形態の画像読取装置は、帳票の画像を読み取る読取部を有する画像読取装置であって、前記読取部により読み取られた前記画像の画像データに基づき、前記帳票の傾きを補正するのに用いるスキュー角度を算出するスキュー角度算出部を有する。また、前記スキュー角度に基づき前記画像を回転させた第1スキュー補正後画像を生成し、生成した前記第1スキュー補正後画像を走査することで、前記第1スキュー補正後画像に含まれる、前記帳票の前記画像に外接する外接四角形を検出する外接領域検出部を有する。また、前記外接四角形に基づき、前記読取部により読み取られた前記画像から切出後帳票画像を切り出す画像切出部を有する。
また、本発明の一実施の形態の画像読取方法は、帳票の画像を読み取る読取部を有する画像読取装置における画像読取方法であって、スキュー角度算出部が、前記読取部により読み取られた前記画像の画像データに基づき、前記帳票の傾きを補正するのに用いるスキュー角度を算出するスキュー角度算出ステップを有する。また、外接領域検出部が、前記スキュー角度に基づき前記画像を回転させた第1スキュー補正後画像を生成し、生成した前記第1スキュー補正後画像を走査することで、前記第1スキュー補正後画像に含まれる、前記帳票の前記画像に外接する外接四角形を検出する外接領域検出ステップを有する。また、画像切出部が、前記外接四角形に基づき、前記読取部により読み取られた前記画像から切出後帳票画像を切り出す画像切出しステップを有する。
また、本発明の一実施の形態の画像読取プログラムは、帳票の画像を読み取る読取部を有する画像読取装置のコンピュータに実行させるための画像読取プログラムであって、スキュー角度算出部が、前記読取部により読み取られた前記画像の画像データに基づき、前記帳票の傾きを補正するのに用いるスキュー角度を算出するスキュー角度算出ステップ前記コンピュータに実行させる。また、外接領域検出部が、前記スキュー角度に基づき前記画像を回転させた第1スキュー補正後画像を生成し、生成した前記第1スキュー補正後画像を走査することで、前記第1スキュー補正後画像に含まれる、前記帳票の前記画像に外接する外接四角形を検出する外接領域検出ステップを前記コンピュータに実行させる。また、画像切出部が、前記外接四角形に基づき、前記読取部により読み取られた前記画像から切出後帳票画像を切り出す画像切出しステップを前記コンピュータに実行させる。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
本発明の代表的な実施の形態によれば、帳票が矩形状でない場合であっても、欠損のない画像データを取得できる。
本発明の一実施の形態における画像読取装置の構成例の概要を示す斜視図である。 本発明の一実施の形態における画像読取装置の構成例の概要を示すブロック図である。 従来の画像読取装置における読取方法を説明するための図であり、(a)は、縦方向および横方向に走査することで帳票の端点を抽出する処理を説明するための図であり、(b)は、帳票の四隅点の座標を抽出する処理を説明する図である。 (a)〜(c)本発明の一実施の形態における画像読取装置のスキュー角度を算出する処理を説明するための図である。 (a)は、本発明の一実施の形態における外接領域検出部により生成される第1スキュー補正後画像の例を示す図であり、(b)は、本発明の一実施の形態における画像切出部が、外接四角形の四隅点の座標に基づき、帳票の画像を切り出す例を示す図である。 本発明の一実施の形態における外接領域検出部が、第1スキュー補正後画像に基づき、帳票の外接領域を検出する処理を説明するための図である。 本発明の一実施の形態における外接領域検出部が、第1スキュー補正後画像に基づき、帳票の外接領域を検出する処理を説明するための図である。 本発明の一実施の形態における外接領域検出部が、第1スキュー補正後画像に基づき、帳票の外接領域を検出する処理を説明するための図である。 本発明の一実施の形態における全体処理の概要を示す図である。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一の符号を付し、その繰り返しの説明は省略する。
<構成例>
図1は、本発明の一実施の形態における画像読取装置100の構成例の概要を示す斜視図である。図2は、本発明の一実施の形態における画像読取装置100の構成例の概要を示すブロック図である。
図1に示されるように、画像読取装置100は、帳票(所定の業務で用いられる書面であり、例えば請求書や小切手である)を吸入する吸入口110と、吸入口110から吸入された帳票を排出する排出口120とを有する。
また、画像読取装置100は、所定のハードウェアおよびソフトウェアにより実装される。例えば、画像読取装置100は、プロセッサやメモリなどを有するコンピュータにより構成され、プロセッサにより実行されるメモリ上のプログラムが、画像読取装置100としてコンピュータを機能させる。
吸入口110から吸入された帳票は、搬送ローラ(不図示)によって画像読取装置100の内部へと移動され、色彩が黒色である背景部に載置される。そして、帳票は、背景部に載置された状態で画像が読み取られる。これによって、読取部130により、帳票の画像データが取得される。
画像データが取得された帳票は、搬送ローラによって、排出口120から画像読取装置100外へと搬送される。排出口120から排出された帳票は、スタッカ121に蓄積される。
図2に示されるように、画像読取装置100は、読取部130と、スキュー角度算出部140と、外接領域検出部150と、画像切出部160と、画像記憶部170とを有する。
読取部130は、色彩が黒色である背景部に載置された帳票を走査(スキャン)することで、帳票の画像を読み取る。これによって、読取部130は、帳票の画像データを取得する。
スキュー角度算出部140は、読取部130により読み取られた画像の画像データに基づき、帳票の傾き(背景部に対する、水平方向の傾き)の程度を示すスキュー角度を算出する。スキュー角度算出部140は、算出したスキュー角度を、外接領域検出部150と画像切出部160へ入力する。
外接領域検出部150は、スキュー角度算出部140が算出したスキュー角度に基づき、読取部130により読み取られた画像を回転(正常な方向に補正)させた第1スキュー補正後画像(後述、図5(a))を生成する。
また、外接領域検出部150は、生成した第1スキュー補正後画像を走査することで、第1スキュー補正後画像に含まれる、帳票の画像に外接する外接四角形を検出する。外接領域検出部150は、検出した外接四角形の四隅点の座標を画像切出部160に入力する。
画像切出部160は、外接領域検出部150が検出した外接四角形の四隅点の座標に基づき、読取部130により読み取られた画像(帳票画像)から帳票の画像(切出後帳票画像)を切り出す。
また、画像切出部160は、切り出した帳票の画像(切出後帳票画像)を、スキュー角度算出部140から入力されたスキュー角度に基づき回転させた第2スキュー補正後画像を生成する。そして、画像切出部160は、生成した第2スキュー補正後画像を画像記憶部170に記憶する。
図3(a)と図3(b)とは、従来の画像読取装置における読取方法を説明するための図である。図3(a)は、縦方向および横方向に走査することで帳票3000の端点を抽出する処理を説明するための図であり、図3(b)は、帳票の四隅点の座標を抽出する処理を説明する図である。
図3(a)に示されるように、従来の画像読取装置は、縦方向に走査することで、縦方向の各走査線と帳票の端との交点を帳票の端点として抽出する。また、画像読取装置は、横方向に走査することで、横方向の各走査線と帳票の端との交点を帳票の端点として抽出する。
次に、図3(b)に示されるように、画像読取装置は、抽出した帳票の各端点より最小二乗法で四本の端辺を抽出する。そして、抽出した4本の端辺の各交点を帳票の四隅点(P0〜P3)として抽出する。その後、画像読取装置は、抽出した四隅点(P0〜P3)に基づき、帳票の画像の切り出しを行い、切り出した画像に対するスキュー補正を行う。
ここで、最小二乗法で四本の端辺を抽出した場合、直線P1−P3部分には実際にはタブが含まれているにも関わらず、タブを含まない辺(直線P1−P3)を端辺として抽出してしまう。そして、4本の端辺の各交点である四隅点に基づき帳票の画像を切り出した場合、タブ部分(突き出し部分)の画像が欠損した画像データしか取得できないという問題がある。
図4(a)〜(c)は、本発明の一実施の形態における画像読取装置100のスキュー角度を算出する処理を説明するための図である。
図4(a)に示されるように、画像読取装置100の読取部130は、所定間隔ごとに、横方向に帳票400を走査することで、横方向の走査線410と帳票400の端との交点を帳票の端点として抽出する。
詳細には、読取部130は、走査した位置の色が背景色から帳票色(背景色以外の色)へ変化した位置を第1端点411として抽出し、その後、走査した位置の色が帳票色から背景色へ変化した位置を第2端点412として抽出する。読取部130は、所定間隔ごとに横方向に帳票400を走査する。そのため、読取部130は、走査した位置ごとに第1端点411と第2端点412とを抽出する。
読取部130は、第1端点411と第2端点412とを抽出する度に、抽出した第1端点411と第2端点412とを、スキュー角度算出部140に入力する。
スキュー角度算出部140は、前回入力された第1端点411の座標と、直前に入力された第1端点411の座標とを結ぶ直線の角度を算出する。また、スキュー角度算出部140は、前回入力された第2端点412の座標と、直前に入力された第2端点412の座標とを結ぶ直線の角度を算出する。なお、算出した角度が、135°〜225°(135°以上であって、かつ225°以下)以外である場合、スキュー角度算出部140は、算出した角度に、90°、180°、270°うちのいずれかの値を加算することで、算出した角度が135°〜225°(図中、12〜20)の範囲に属するように補正する。なお、算出した角度に、90°、180°、270°うちのいずれかの値を加算しても135°〜225°の範囲に属しない場合、スキュー角度算出部140は、算出した角度を破棄しても良い。
図4(b)に示されるように、画像読取装置100の読取部130は、所定間隔ごとに、縦方向に帳票400を走査することで、縦方向の走査線420と帳票400の端との交点を帳票400の端点として抽出する。
詳細には、読取部130は、走査した位置の色が背景色から帳票色(背景色以外の色)へ変化した位置を第1端点411として抽出し、その後、走査した位置の色が帳票色から背景色へ変化した位置を第2端点412として抽出する。読取部130は、所定間隔ごとに縦方向に帳票400を走査する。そのため、読取部130は、走査した位置ごとに第1端点411と第2端点412とを抽出する。
読取部130は、所定間隔ごとに、第1端点411と第2端点412とを抽出する度に、抽出した第1端点411と第2端点412とを、スキュー角度算出部140に入力する。
スキュー角度算出部140は、前回入力された第1端点411の座標と、直前に入力された第1端点411の座標とを結ぶ直線の角度を算出する。また、スキュー角度算出部140は、前回入力された第2端点412の座標と、直前に入力された第2端点412の座標とを結ぶ直線の角度を算出する。なお、算出した角度が、135°〜225°(135°以上であって、かつ225°以下)以外である場合、スキュー角度算出部140は、算出した角度に、90°、180°、270°うちのいずれかの値を加算することで、算出した角度を、135°〜225°の範囲に属するように補正する。なお、算出した角度に、90°、180°、270°うちのいずれかの値を加算しても135°〜225°の範囲に属しない場合、スキュー角度算出部140は、算出した角度を破棄しても良い。
図4(c)に示されるように、スキュー角度算出部140は、算出したすべての角度(補正した角度については、補正後の角度)の数を角度ごとに集計する。そして、スキュー角度算出部140は、集計した結果、数が最大の角度をスキュー角度として算出する。そして、スキュー角度算出部140は、算出したスキュー角度を外接領域検出部150と画像切出部160へ入力する。
図4(c)に示される例では、スキュー角度算出部140が集計した角度は、202°(図中、18)の値が多い。そのためスキュー角度算出部140は、202°をスキュー角度として算出する。なお、スキュー角度算出部140は、算出したすべての角度(補正した角度については、補正後の角度)の平均値をスキュー角度として算出しても良い。また、スキュー角度算出部140は、算出したすべての角度(補正した角度については、補正後の角度)の中央値をスキュー角度として算出しても良い。
外接領域検出部150は、走査することで読み込んだ帳票画像を、スキュー角度算出部140から入力されたスキュー角度だけ回転させることで、図5(a)に示される第1スキュー補正後画像500を生成する。
そして、外接領域検出部150は、生成した第1スキュー補正後画像500を走査することで、第1スキュー補正後画像500における外接領域の四隅点501の座標であるp0(xx0,yy0)と、四隅点502の座標であるp1(xx1,yy1)と、四隅点503の座標であるp2(xx2,yy2)と、四隅点504の座標であるp3(xx3,yy3)とを算出する。外接領域検出部150が、第1スキュー補正後画像500における外接領域の四隅点501の座標p0〜p3を算出する具体的な方法については、図6〜図8を用いて後述する。
次に、図5(b)に示されるように、画像切出部160は、算出した第1スキュー補正後画像における外接領域の四隅点501〜504の座標p0(xx0,yy0)〜p3(xx3,yy3)を帳票画像における外接領域の四隅点の座標p0(x0,y0)〜p3(x3,y3)へと変換する。
詳細には、画像切出部160は、以下の式(1)と式(2)とを用いて、座標p0(xx0,yy0)を座標p0(x0,y0)へと変換する。
式(1):p0(x0)=X0+cosθ×xx0−sinθ×yy0
式(2):p0(y0)=Y0+cosθ×yy0+sinθ×xx0
また、画像切出部160は、以下の式(3)と式(4)とを用いて、座標p1(xx1,yy1)を座標p1(x1,y1)へと変換する。
式(3):p1(x1)=X0+cosθ×xx1−sinθ×yy1
式(4):p1(y1)=Y0+cosθ×yy1+sinθ×xx1
また、画像切出部160は、以下の式(5)と式(6)とを用いて、座標p2(xx2,yy2)を座標p2(x2,y2)へと変換する。
式(5):p2(x2)=X0+cosθ×xx2−sinθ×yy2
式(6):p2(y2)=Y0+cosθ×yy2+sinθ×xx2
また、画像切出部160は、以下の式(7)と式(8)とを用いて、座標p3(xx3,yy3)を座標p3(x3,y3)へと変換する。
式(7):p3(x3)=X0+cosθ×xx3−sinθ×yy3
式(8):p3(y3)=Y0+cosθ×yy3+sinθ×xx3
画像切出部160は、変換した後の帳票画像における外接領域の四隅点の座標p0(x0,y0)〜p3(x3,y3)と、帳票画像から切出後帳票画像を切り出す範囲を特定するためのパラメータとに基づいて、帳票画像から切出後帳票画像を切り出す。例えば、パラメータに基づいて、四隅点の座標p0(x0,y0)〜p3(x3,y3)を結んだ矩形よりも大きい範囲が、切出後帳票画像を切り出す範囲として特定される場合がある。その場合、画像切出部160は、四隅点の座標p0(x0,y0)〜p3(x3,y3)を結んだ矩形の外周を所定長(例えば、15mm)で囲う範囲で帳票画像から切出後帳票画像を切り出す。
画像切出部160は、切出後帳票画像を、スキュー角度だけ回転させることで、第2スキュー補正後画像を生成する。そして、画像切出部160は、生成した第2スキュー補正後画像を、画像記憶部170に記憶する。
次に、図6〜8を用いて、第1スキュー補正後画像(前述、図5(a))における外接領域の四隅点501の座標p0〜p3を算出する具体的な方法について説明する。
図6は、本発明の一実施の形態における外接領域検出部150が、横方向の横線ノイズ601および縦方向の縦線ノイズ602を帳票と誤認識することなく、帳票の外接領域を検出する処理を説明するための図である。
外接領域検出部150は、スキュー角度だけ回転されることでスキュー補正された第1スキュー補正後画像500を横方向(例えば、右方向から左方向や、左方向から右方向)に走査し、その後、縦方向(例えば、上方向から下方向や、下歩行から上方向)に走査することで、第1スキュー補正後画像500に含まれる帳票画像の外接領域の四隅点を算出する。これによって、外接領域検出部150は、第1スキュー補正後画像500に含まれる帳票画像の外接領域を検出する。
図6に示されるように、外接領域検出部150は、横方向に第1スキュー補正後画像を走査する。
外接領域検出部150は、縦方向に延びる走査線620が横方向(右方向から左方向)に一行分、第1スキュー補正後画像を走査する度に、走査した範囲に含まれる、連続する帳票色の画素数(以下、連続帳票画素数と呼ぶ場合がある)を算出し、算出した連続帳票画素数を保持する。そして、外接領域検出部150は、連続帳票画素数を算出する度に、直近のM(第2の数値)回の間に算出した連続帳票画素数が、L(第1の数値)を連続してM回超えたか否かを判定する。算出した連続帳票画素数がL(第1の数値)を連続してM(第2の数値)回超えている場合、外接領域検出部150は、最初に連続帳票画素数がLを超えた際に走査線620により走査された位置(図中、X+2)を、帳票の外接領域(帳票と背景画像との境目)として検出する。
なお、Lの数値を大きくすることで、横方向の横線ノイズ601を、帳票として誤認識しにくくなる。
また、Mの数値を大きくすることで、縦方向の縦線ノイズ(Lの数値を超えるノイズ)を、帳票として誤認識しにくくなる。
上述した方式により帳票の外接領域(帳票と背景画像との境目)として検出することで、横線ノイズ601および縦線ノイズ602への耐性を強化できる。また、帳票の角が円弧であっても安定して帳票の外接領域を検出できる。
なお、図7に示されるように、タブ紙の帳票のエッジを検出する場合は、Lの数値を、タブの高さ(縦方向の長さ)よりも小さくする。これによって、タブと背景画像との境目を、帳票の外接領域として検出できる。また、タブと帳票とを識別可能になる。逆に、Lの数値を、タブの高さよりも大きくすることで、タブを除く帳票部分のみを外接領域として検出できる。
次に、帳票の一部(隅部)が外側に向けて折れていることで、隅部が突き出している帳票(以下、突き出し帳票と呼ぶ場合がある)のエッジを検出する処理について、図8を用いて説明する。
まず、外接領域検出部150は、縦方向の走査線620が右方向から左方向に、第1スキュー補正後画像を一行分、走査する度に、走査した範囲に含まれる連続帳票画素数を算出し、算出した連続帳票画素数を保持する。そして、外接領域検出部150は、連続帳票画素数を算出する度に、算出した連続帳票画素数がLを超えたか否かを判定する。そして、外接領域検出部150は、Lを超えた位置(図中、X)から、右方向(帳票の外側方向)に、これまでに算出した連続帳票画素数をトレースする。なお、外接領域検出部150は、連続帳票画素数が、連続的に減少することを前提にトレースする。そして、外接領域検出部150は、連続帳票画素数が、0になる直前の位置(図中、X+3)を、帳票の外接領域(帳票と背景画像との境目)として検出する。これによって、突き出し帳票について、突き出した帳票の一部(隅部)を含めた外接領域を検出できる。
<全体処理>
図9は、本発明の一実施の形態における全体処理の概要を示す図である。
まず、S901にて、読取部130は、縦方向に走査する列の位置を特定するためのX座標に初期値(例えば、0)を設定する。また、読取部130は、横方向に走査する行の位置を特定するためのY座標に初期値(例えば、0)を設定する。
次に、S902にて、読取部130は、S901にて設定したX座標にて縦方向に帳票を走査することで、縦方向の走査線と帳票の端との交点を帳票の端点として抽出し、抽出した端点の座標をスキュー角度算出部140に入力する。
詳細には、読取部130は、走査した位置の色が背景色から帳票色(背景色以外の色)へ変化した位置を第1端点として抽出し、その後、走査した位置の色が帳票色から背景色へ変化した位置を第2端点として抽出する。そして、読取部130は、抽出した第1端点の座標と、第2端点の座標とをスキュー角度算出部140に入力する。
次に、S903にて、読取部130は、次に走査する位置を決定する。詳細には、読取部130は、縦方向に走査する列の位置を特定するためのX座標に所定値(例えば、1)を加算する。
次に、S904にて、読取部130は、S903にて加算した後のX座標にて縦方向に帳票を走査することで、縦方向の走査線と帳票の端との交点を帳票の端点として抽出し、抽出した端点の座標をスキュー角度算出部140に入力する。
詳細には、読取部130は、走査した位置の色が背景色から帳票色(背景色以外の色)へ変化した位置を第1端点として抽出し、その後、走査した位置の色が帳票色から背景色へ変化した位置を第2端点として抽出する。そして、読取部130は、抽出した第1端点の座標と、第2端点の座標とをスキュー角度算出部140に入力する。
次に、S905にて、スキュー角度算出部140は、前回入力された第1端点の座標と、直前に入力された第1端点の座標とを結ぶ直線の角度を算出する。また、スキュー角度算出部140は、前回入力された第2端点の座標と、直前に入力された第2端点の座標とを結ぶ直線の角度を算出する。
次に、S906にて、読取部130は、すべての縦方向への走査が完了したかを判定する。読取部130が、すべての縦方向への走査が完了していないと判定する場合(S906−No)、S903へ戻る。一方、読取部130が、すべての縦方向への走査が完了したと判定する場合(S906−Yes)、S907へ進む。
次に、S907にて、読取部130は、S901にて設定したY座標にて横方向に帳票を走査することで、横方向の走査線と帳票の端との交点を帳票の端点として抽出し、抽出した端点の座標をスキュー角度算出部140に入力する。
詳細には、読取部130は、走査した位置の色が背景色から帳票色(背景色以外の色)へ変化した位置を第1端点として抽出し、その後、走査した位置の色が帳票色から背景色へ変化した位置を第2端点として抽出する。そして、読取部130は、抽出した第1端点の座標と、第2端点の座標とをスキュー角度算出部140に入力する。
次に、S908にて、読取部130は、次に走査する位置を決定する。詳細には、読取部130は、横方向に走査するY座標に所定値(例えば、1)を加算する。
次に、S909にて、読取部130は、S908にて加算した後のY座標にて横方向に帳票を走査することで、横方向の走査線と帳票の端との交点を帳票の端点として抽出し、抽出した端点の座標をスキュー角度算出部140に入力する。
次に、S910にて、スキュー角度算出部140は、前回入力された第1端点の座標と、直前に入力された第1端点の座標とを結ぶ直線の角度を算出する。また、スキュー角度算出部140は、前回入力された第2端点の座標と、直前に入力された第2端点の座標とを結ぶ直線の角度を算出する。
次に、S911にて、読取部130は、すべての横方向への走査が完了したかを判定する。読取部130が、すべての横方向への走査が完了していないと判定する場合(S911−No)、S908へ戻る。一方、読取部130が、すべての縦方向への走査が完了したと判定する場合(S911−Yes)、S912へ進む。
次に、S912にて、スキュー角度算出部140は、S905にて算出したすべての角度およびS910にて算出したすべての角度に基づいて、スキュー角度を算出する。スキュー角度算出部140は、算出したスキュー角度を外接領域検出部150に入力する。
次に、S913にて、外接領域検出部150は、走査することで読み込んだ帳票画像をS912にて入力されたスキュー角度だけ回転させることで、第1スキュー補正後画像を生成する。
次に、S914にて、外接領域検出部150は、S913にて生成した第1スキュー補正後画像を走査することで、第1スキュー補正後画像における外接領域の四隅点の座標を算出する。外接領域検出部150は、算出した四隅点の座標を画像切出部160に入力する。
次に、S915にて、画像切出部160は、S914にて算出した第1スキュー補正後画像における外接領域の四隅点の座標を、帳票画像における外接領域の四隅点の座標へと変換する。
次に、S916にて、画像切出部160は、S915にて変換した後の帳票画像における外接領域の四隅点の座標と、切出後帳票画像を切り出す範囲を特定するためのパラメータとに基づいて、帳票画像から切出後帳票画像を切り出す。
次に、S917にて、画像切出部160は、S916にて切出した後の切出後帳票画像を、S912にて入力されたスキュー角度だけ回転させることで、第2スキュー補正後画像を生成し、生成した第2スキュー補正後画像を、画像記憶部170に記憶する。
<本実施の形態の効果>
以上説明した本実施の形態における画像読取装置100によれば、画像切出部160が、外接四角形の四隅点の座標に基づき、読取部130により読み取られた画像から前記帳票の画像を切り出すことで、帳票が矩形状でない場合であっても、欠損のない画像データを取得できる。また、突き出しのある帳票とない、突きだしのない帳票が混在していても、これらを一括で読取りできる。さらに、突き出し量、突き出し位置が不定であっても安定して欠損のない画像データを取得できる。さらに、矩形状の画像の画像データを取得できる。
また、外接領域検出部150が、第1スキュー補正後画像を走査する度に、走査した範囲に含まれる連続する黒色以外の色の画素の画素数を算出し、算出した画素数が第1の数値を連続して、第2の数値の回超えている場合に、最初に前記第1の数値を超えた際に走査された位置を外接四角形の辺として検出することで、横方向の横線ノイズ601および縦方向の縦線ノイズ602を帳票と誤認識することなく、帳票の外接領域を検出できる。
また、第1の数値を帳票に含まれるタブの縦方向の画素数よりも小さくすることで、タブと帳票とを識別可能になる。
また、外接領域検出部150が、第1スキュー補正後画像を走査する度に、走査した範囲に含まれる連続する黒色以外の色の画素の画素数を算出し、算出した画素数が第1の数値を超えている場合、これまでに算出した画素数をトレースし、画素数が0になる直前の位置を外接四角形の辺として検出することで、突き出し帳票の画像データを欠損なく取得できる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
100…画像読取装置、130…読取部、140…スキュー角度算出部、150…外接領域検出部、160…画像切出部、170…画像記憶部。

Claims (7)

  1. 帳票の画像を読み取る読取部を有する画像読取装置であって、
    前記読取部により読み取られた前記画像の画像データに基づき、前記帳票の傾きを補正するのに用いるスキュー角度を算出するスキュー角度算出部と、
    前記スキュー角度に基づき前記画像を回転させた第1スキュー補正後画像を生成し、生成した前記第1スキュー補正後画像を走査することで、前記第1スキュー補正後画像に含まれる、前記帳票の前記画像に外接する外接四角形を検出する外接領域検出部と、
    前記外接四角形に基づき、前記読取部により読み取られた前記画像から切出後帳票画像を切り出す画像切出部と、
    を有する、画像読取装置。
  2. 請求項1に記載の画像読取装置において、
    前記画像切出部は、切り出した前記帳票の前記画像を前記スキュー角度に基づき回転させた第2スキュー補正後画像を生成し、生成した前記第2スキュー補正後画像を画像記憶部に記憶する、画像読取装置。
  3. 請求項1に記載の画像読取装置において、
    前記読取部は、色彩が黒色である背景部に載置された前記帳票を走査することで前記画像を読み取り、
    前記外接領域検出部は、前記第1スキュー補正後画像を走査する度に、走査した範囲に含まれる連続する黒色以外の色の画素の画素数を算出し、算出した前記画素数が第1の数値を連続して、第2の数値の回超えている場合に、最初に前記第1の数値を超えた際に走査された位置を前記外接四角形の辺として検出する、
    画像読取装置。
  4. 請求項3に記載の画像読取装置において、
    前記第1の数値は、前記帳票に含まれるタブの縦方向の前記画素数よりも小さい、画像読取装置。
  5. 請求項1に記載の画像読取装置において、
    前記読取部は、色彩が黒色である背景部に載置された前記帳票を走査することで前記画像を読み取り、
    前記外接領域検出部は、前記第1スキュー補正後画像を走査する度に、走査した範囲に含まれる連続する黒色以外の色の画素の画素数を算出し、算出した前記画素数が第1の数値を超えている場合、これまでに算出した前記画素数をトレースし、前記画素数が0になる直前の位置を前記外接四角形の辺として検出する、
    画像読取装置。
  6. 帳票の画像を読み取る読取部を有する画像読取装置における画像読取方法であって、
    スキュー角度算出部が、前記読取部により読み取られた前記画像の画像データに基づき、前記帳票の傾きを補正するのに用いるスキュー角度を算出するスキュー角度算出ステップと、
    外接領域検出部が、前記スキュー角度に基づき前記画像を回転させた第1スキュー補正後画像を生成し、生成した前記第1スキュー補正後画像を走査することで、前記第1スキュー補正後画像に含まれる、前記帳票の前記画像に外接する外接四角形を検出する外接領域検出ステップと、
    画像切出部が、前記外接四角形に基づき、前記読取部により読み取られた前記画像から切出後帳票画像を切り出す画像切出しステップと、

    を有する、画像読取方法。
  7. 帳票の画像を読み取る読取部を有する画像読取装置のコンピュータに実行させるための画像読取プログラムであって、
    スキュー角度算出部が、前記読取部により読み取られた前記画像の画像データに基づき、前記帳票の傾きを補正するのに用いるスキュー角度を算出するスキュー角度算出ステップと、
    外接領域検出部が、前記スキュー角度に基づき前記画像を回転させた第1スキュー補正後画像を生成し、生成した前記第1スキュー補正後画像を走査することで、前記第1スキュー補正後画像に含まれる、前記帳票の前記画像に外接する外接四角形を検出する外接領域検出ステップと、
    画像切出部が、前記外接四角形に基づき、前記読取部により読み取られた前記画像から切出後帳票画像を切り出す画像切出しステップと、
    を前記コンピュータに実行させる、
    画像読取プログラム。
JP2016574303A 2015-08-25 2015-08-25 画像読取装置および画像読取方法ならびに画像読取プログラム Active JP6383441B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/073813 WO2017033275A1 (ja) 2015-08-25 2015-08-25 画像読取装置および画像読取方法ならびに画像読取プログラム

Publications (2)

Publication Number Publication Date
JPWO2017033275A1 true JPWO2017033275A1 (ja) 2017-08-31
JP6383441B2 JP6383441B2 (ja) 2018-08-29

Family

ID=58099753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016574303A Active JP6383441B2 (ja) 2015-08-25 2015-08-25 画像読取装置および画像読取方法ならびに画像読取プログラム

Country Status (6)

Country Link
US (1) US10091392B2 (ja)
EP (1) EP3258681B1 (ja)
JP (1) JP6383441B2 (ja)
KR (1) KR102001331B1 (ja)
CN (1) CN107211068B (ja)
WO (1) WO2017033275A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6642833B2 (ja) * 2016-10-28 2020-02-12 京セラドキュメントソリューションズ株式会社 画像処理装置
CN107918935B (zh) * 2017-12-05 2022-03-08 深圳市北电仪表有限公司 嵌入式系统的图像匹配切割装置及切割方法
JP7196474B2 (ja) * 2018-09-05 2022-12-27 セイコーエプソン株式会社 読取り装置およびプログラム
JP2020052916A (ja) * 2018-09-28 2020-04-02 日本電産サンキョー株式会社 画像処理装置、イメージスキャナ、及び画像処理方法
CN109409366B (zh) * 2018-10-30 2022-04-05 四川长虹电器股份有限公司 基于角点检测的畸变图像校正方法及装置
US11532145B2 (en) * 2019-01-07 2022-12-20 Microsoft Technology Licensing, Llc Multi-region image scanning

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000081964A (ja) * 1998-06-26 2000-03-21 Sony Corp プリンタ装置
JP2003209680A (ja) * 2002-01-15 2003-07-25 Canon Inc 画像処理装置
JP2007189577A (ja) * 2006-01-16 2007-07-26 Matsushita Electric Ind Co Ltd コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法
JP2008124828A (ja) * 2006-11-13 2008-05-29 Canon Electronics Inc 画像読取装置、画像読取方法及び該方法を実行するためのプログラム
JP2008259172A (ja) * 2007-03-15 2008-10-23 Ricoh Co Ltd 画像処理装置、画像処理方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19858968A1 (de) * 1998-01-14 1999-07-15 Eastman Kodak Co Verfahren und Vorrichtung zum Erkennen von Winkelabweichungen und dunklen Rändern bei einem Vorlagenbild in einem Hochleistungsscanner
US6831755B1 (en) * 1998-06-26 2004-12-14 Sony Corporation Printer having image correcting capability
JP3903932B2 (ja) * 2003-03-06 2007-04-11 セイコーエプソン株式会社 画像読み取り制御装置およびプログラム
JP5202037B2 (ja) * 2008-02-29 2013-06-05 キヤノン株式会社 特徴点位置決定方法及び装置
JP2010171492A (ja) 2009-01-20 2010-08-05 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法、および画像処理プログラム
CN101625760A (zh) * 2009-07-28 2010-01-13 谭洪舟 一种证件图像倾斜校正的办法
US8989515B2 (en) * 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
JP6070449B2 (ja) * 2013-07-08 2017-02-01 富士ゼロックス株式会社 傾斜角度補正装置、画像読取装置、画像形成装置およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000081964A (ja) * 1998-06-26 2000-03-21 Sony Corp プリンタ装置
JP2003209680A (ja) * 2002-01-15 2003-07-25 Canon Inc 画像処理装置
JP2007189577A (ja) * 2006-01-16 2007-07-26 Matsushita Electric Ind Co Ltd コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法
JP2008124828A (ja) * 2006-11-13 2008-05-29 Canon Electronics Inc 画像読取装置、画像読取方法及び該方法を実行するためのプログラム
JP2008259172A (ja) * 2007-03-15 2008-10-23 Ricoh Co Ltd 画像処理装置、画像処理方法およびプログラム

Also Published As

Publication number Publication date
EP3258681B1 (en) 2019-05-22
US10091392B2 (en) 2018-10-02
CN107211068B (zh) 2019-05-03
KR102001331B1 (ko) 2019-07-17
US20170237875A1 (en) 2017-08-17
CN107211068A (zh) 2017-09-26
EP3258681A1 (en) 2017-12-20
KR20170140313A (ko) 2017-12-20
WO2017033275A1 (ja) 2017-03-02
EP3258681A4 (en) 2018-03-28
JP6383441B2 (ja) 2018-08-29

Similar Documents

Publication Publication Date Title
JP6383441B2 (ja) 画像読取装置および画像読取方法ならびに画像読取プログラム
US8194983B2 (en) Method and system for preprocessing an image for optical character recognition
US8218875B2 (en) Method and system for preprocessing an image for optical character recognition
US9449210B2 (en) Method and system for detecting a correction pattern in a QR code
US8139897B2 (en) Detecting tilt in an image having different resolutions in different directions
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
US10275888B2 (en) Algorithmic method for detection of documents in images
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
CN109409178B (zh) 图像识别设备和图像识别方法
JP6883199B2 (ja) 画像処理装置、画像読み取り装置、および、プログラム
JP2011008770A (ja) 原稿方向の検出方法及び装置
JP2013047874A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び画像処理システム
US8452104B2 (en) Image determination apparatus, computer readable medium storing program, and method
JP5911122B2 (ja) 直線検出装置および直線検出方法
JP6950236B2 (ja) コンピュータプログラム及び画像処理装置
JP6950237B2 (ja) コンピュータプログラム及び画像処理装置
CN107680046A (zh) 影像矫正方法、装置、存储介质和计算机设备
US10375261B2 (en) Image scanning apparatus
JP5146199B2 (ja) 差分抽出装置及び差分抽出プログラム
JP2008258980A (ja) 画像情報処理装置および画像傾斜角度算出方法
JP6464891B2 (ja) 傍線問題採点方法、傍線問題採点プログラム及び傍線問題採点装置
US8582921B2 (en) Figure processing apparatus, figure processing method, and storage medium
CN113177885A (zh) 校正图像的方法、装置、存储介质及电子设备
JP2020119352A (ja) マーク選定装置および画像処理装置
JP2020149184A (ja) 情報処理装置、その制御方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180803

R150 Certificate of patent or registration of utility model

Ref document number: 6383441

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250