JP2007249580A - 画像処理装置、画像処理プログラムおよび画像処理方法 - Google Patents

画像処理装置、画像処理プログラムおよび画像処理方法 Download PDF

Info

Publication number
JP2007249580A
JP2007249580A JP2006071818A JP2006071818A JP2007249580A JP 2007249580 A JP2007249580 A JP 2007249580A JP 2006071818 A JP2006071818 A JP 2006071818A JP 2006071818 A JP2006071818 A JP 2006071818A JP 2007249580 A JP2007249580 A JP 2007249580A
Authority
JP
Japan
Prior art keywords
image
ruled line
ruled
detected
strip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006071818A
Other languages
English (en)
Inventor
Hiroko Eto
裕子 江藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2006071818A priority Critical patent/JP2007249580A/ja
Publication of JP2007249580A publication Critical patent/JP2007249580A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】FAX−OCR装置に用いる帳票の外観を損ねることがなく、また帳票のスペースを有効に利用できるようにする。
【解決手段】このFAX−OCR装置は、帳票の画像を取得するファクシミリ12とPC10とからなる。PC10は、画像整形部5を備える。画像整形部5は、ファクシミリ12により取得された帳票20の画像25から横罫線44を検出し、その横罫線44が含まれる画像を一定間隔wで短冊状に切り出し、切り出した各短冊画像同士の罫線の中心を予め定義された罫線の位置に一致させるように、短冊画像を再配置することで画像を整形(補正)する。
【選択図】図1

Description

本発明は、例えばファクシミリなどで受信された帳票のイメージデータを処理する画像処理装置、画像処理プログラムおよび画像処理方法に関する。
電話回線を通じて受信された帳票のイメージデータ(以下「画像」と称す。)を文字認識処理(以下「OCR」と称す)することで、帳票に記入された文字を読み取るFAX−OCR装置がある。
FAX−OCR装置では、受信された帳票の画像をOCRする際に、受信画像自体に既に帳票の縦方向のみが伸縮されていたり、または画像にゆがみが発生していることがある。この場合、画像に生じた伸縮やゆがみを補正する処理を行った後、文字認識することが行われる。
FAX−OCR装置では、ゆがみや伸縮が大きく、補正無しでは、正しい読取位置を得ることができないことが多い。
そこで、FAX−OCR専用の帳票にガイドマークを印刷して読取位置の目印としたり、あるいは帳票に二次元バーコードで帳票定義を印刷しておくことで読取位置を決定するなど、さまざまな工夫がなされている(特許文献1参照)。
特開平11-25209号公報
しかしながら、上記した従来技術においては、ガイドマークや二次元バーコードが帳票の表面に印刷されているため帳票の外観を損ねるという問題がある。
また、ガイドマークや二次元バーコードのための印刷エリアを帳票上に確保しなければならず、帳票のスペースを有効に利用できないという問題があった。
本発明はこのような課題を解決するためになされたもので、帳票の外観を損ねることがなく、また帳票のスペースを有効に利用できる画像処理装置、画像処理プログラムおよび画像処理方法を提供することを目的としている。
上記した目的を達成するために、本発明の画像処理装置は、帳票の画像を取得する画像取得手段と、前記画像取得手段により取得された帳票の画像の画素の配列から罫線を検出する罫線検出手段と、前記罫線検出手段により検出された前記罫線を含む画像を、前記罫線とほぼ直交する方向に所定間隔で短冊状に切り出す切出手段と、切り出された短冊状の画像に含まれる罫線の中心を、予め設定された帳票定義データ上の罫線の位置に一致させるように、前記短冊状の各画像を再配置し前記各画像を結合することで整形した画像を生成する整形手段とを具備したことを特徴とする。
本発明の画像処理プログラムは、画像処理装置に文字認識処理を実行させる画像処理プログラムであって、前記画像処理装置を、帳票の画像を取得する画像取得手段と、前記画像取得手段により取得された帳票の画像の画素の配列から罫線を検出する罫線検出手段と、前記罫線検出手段により検出された前記罫線を含む画像を、前記罫線とほぼ直交する方向に所定間隔で短冊状に切り出す切出手段と、切り出された短冊状の画像に含まれる罫線の中心を、予め設定された帳票定義データ上の罫線の位置に一致させるように、前記短冊状の各画像を再配置し前記各画像を結合することで整形した画像を生成する整形手段として機能させることを特徴とする。
本発明の画像処理方法は、コンピュータが画像を処理する画像処理方法であって、前記コンピュータが帳票の画像を取得するステップと、前記コンピュータが取得した帳票の画像の画素の配列から罫線を検出するステップと、前記コンピュータが検出した前記罫線を含む画像を、前記罫線とほぼ直交する方向に所定間隔で短冊状に切り出すステップと、前記コンピュータが切り出した短冊状の画像に含まれる罫線の中心を、予め設定された帳票定義データ上の罫線の位置に一致させるように、前記短冊状の各画像を再配置し前記各画像を結合することで整形した画像を生成するステップとを有することを特徴とする。
本発明では、文字の記入位置が線によって予め定められた帳票の画像を取得し、帳票の画像の画素の配列状況、つまり隣接する画素の連続性から罫線を検出し、その罫線を含む画像の範囲を罫線とほぼ直交する方向に所定間隔で短冊状に切り出して、切り出した画像同士の罫線の中心を一致させるように短冊状の各画像を再配置し元の画像を整形した画像を生成するので、ゆがんだ線はほぼ直線状に見えるようになる。また縦または横の一方のみ縮尺された画像の線などは、縮尺前の長さで見えるようになる。
すなわち、ガイドマークを設けることなく画像のゆがみや伸縮を補正するので、帳票の外観を損ねることがなく、また帳票のスペースを有効に利用できる。
以上説明したように本発明によれば、帳票の外観を損ねることがなく、また帳票のスペースを有効に利用できる画像処理装置、画像処理プログラムおよび画像処理方法を提供することができる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は本発明に係る一つの実施形態のFAX−OCR装置の構成を示す図、図2はFAX−OCR装置の処理対象の帳票の一例であるFAX−OCR専用帳票を示す図である。
図1に示すように、このFAX−OCR装置は、ハードウェア構成としては、ファクシミリ12と、電話回線11などの公衆通信網を介して接続されたパーソナルコンピュータ10(以下PC10と称す)とから構成されている。
ファクシミリ12は、読み取り台にセットされた帳票の表面をCCDセンサなどでイメージスキャンして帳票のイメージデータ(以下、「画像」と称す。)を生成し、電話回線を通じてPC10へ送信する。
PC10は、通信部2、制御部3、画像記憶部4、画像整形部5、帳票定義記憶部6、文字認識部7、認識結果記憶部8などを有している。これら各部は必要に応じてその機能を用いるものであり、すべての構成が必須とは限らない。例えば画像整形部5が画像記憶部4から読み出した帳票の画像から得た帳票の定義を文字認識部7がそのまま利用すれば、帳票定義記憶部6などは不要である。また画像取得部がファクシミリ12ではなくスキャナなどであった場合もファクシミリ12を利用した場合とほほ同じことが言える。さらにファクシミリ12を用いずに帳票の画像をファイルの形態でネットワークや記憶媒体などを介してPC10に直接入力し、通信部2を通じて画像記憶部4に保存しても良い。
PC10の機能は、CPU、RAM、ROMなどのメモリ、ハードディスク装置などの補助記憶装置、キーボードなどの入力装置およびマウスなどの指示装置、モニタなどの表示装置、ファクシミリ12とのインターフェースボードなどのハードウェアと、オペレーティングシステム(以下OSと称す)および画像処理アプリケーションソフトウェアなどのプログラムとが協動して実現される。
通信部2は、FAXモデムボードなどの通信インターフェースボードなどにより実現される。通信部2は、ファクシミリ12から電話回線11を通じて送信されてきた画像を受信する画像取得部として機能する。
制御部3は、OSおよび文字認識アプリケーションソフトウェアなどにより実現される。画像記憶部4および帳票定義記憶部6は、RAMなどに設けられる記憶領域であり、情報を一時的に記憶しておくための領域である。認識結果記憶部8は、ハードディスク装置などの記憶領域であり、情報を保存しておくための領域である。
制御部3は、ファクシミリ12から受信された帳票の画像を画像記憶部4に記憶する。その後、画像記憶部4に記憶された画像は、画像整形部5により読み出されて整形される。
画像整形部5は、画像記憶部4に記憶された帳票の画像を読み出して、画像の画素を走査して黒画素と白画素の配列状況が予めメモリに記憶された罫線の画素配列と適合する画素部分を罫線として検出する罫線検出手段として機能する。画像整形部5は、検出した罫線が含まれる画像を、罫線とほぼ直交する方向に一定間隔で短冊状に切り出す切出手段として機能する。
画像整形部5は、切り出した短冊画像に含まれる罫線の中心を、短冊画像同士で一致させるように、各短冊画像を再配置し、各短冊画像を結合することで帳票の画像を整形した画像を生成する整形手段として機能する。
文字認識部7は、帳票定義記憶部6から読み出した帳票定義データに基づき、整形された画像の該当箇所を切り出して、切り出した画像から文字を認識し文字認識結果(テキストデータや対応する切り出し部分画像など)を認識結果記憶部8に記憶する。
文字認識処理としては、予め登録されている文字認識用の辞書を参照して、切り出した文字のイメージデータと辞書のイメージデータとのパターンマッチングを行うものである。文字認識用の辞書には、文字のテキストデータとイメージデータが対応して記憶されている。
このFAX−OCR装置に用いる帳票としては、例えばFAX−OCR専用の帳票がある。
図2に示すように、FAX−OCR専用の帳票20には、ファクシミリ12において、原稿台から帳票20をCCDセンサの位置へフィードする方向、つまり搬送方向に沿って、少なくとも一つの罫線21が引かれており、このような配置の罫線の位置座標が帳票定義のデータとして記憶されているものとする。罫線の位置座標として最低下必要なのは、横罫線の始点、終点の座標である。この例では、帳票20に4本の横罫線が存在する。
以下、このFAX−OCR装置の動作を説明する。
帳票20をファクシミリ12にセットして送信操作を行うと、ファクシミリ12は、帳票20を装置内部に引き込んで、CCDセンサによる読み取り動作を行い、宛先のPC10へ送信される。
帳票20をファクシミリ12で読み取った場合、搬送系の搬送速度のずれなどの影響で、図3に示すように、一部領域24が上方へずれた(ゆがんだ)画像25が得られることがある。この画像25がPC10によって受信されることになる。
PC10では、ファクシミリ12から送信された画像25が通信部2により受信されて制御部3へ入力される。制御部3は、入力された画像25を画像記憶部4に画像ファイルとして記憶する。
次に、制御部3は、画像整形部5を制御して画像整形処理を実行させる。
画像整形部5は、画像記憶部4より画像ファイルを読み出して画像データをメモリに展開し、展開した画像内の画素を走査し、黒画素と白画素の配置状況、つまり各画素の位置座標を検出することで、画像に含まれる罫線を検出する。
(罫線検出)
画像を走査するにあたり、画像整形部5は、図4に示すように、一定間隔おきに列41ごとの白画素と黒画素との配列(白、白、黒、黒、黒など)を記録しておき、一定の幅で黒が繋がっているところ(符号42の箇所)を罫線として検出する。
一定の幅とは、この例の場合、黒画素が3つ連続する場所のことをさす。罫線検出には、一時的に幅が異なる場合を除外するようにしておくことで、途中に縦罫線43が存在するような場合であっても横罫線44を正しく検出することができる。
この罫線検出方法によれば、罫線が直線でなく、ゆがんでいても一本の線として抽出することができ、どこでゆがみが発生しているのかも知ることができる。なお、上記横罫線44の検出方法の例は一例であり、他の方法により罫線を検出しても良い。
(短冊分割およびゆがみ補正)
図5に示すように、罫線が含まれる画像に歪みが生じている場合、画像整形部5は、画像全体を、検出した罫線の方向と直交(縦)する方向に一定間隔で短冊状に区切って細長い画像(以下、短冊画像と称す。)を切り出す。
そして、画像整形部5は、図6に示すように、隣接する短冊画像同士に含まれる罫線がほぼ横に並ぶように個々の短冊画像を上下にずらして再配置し、画像全体の整形(補正)を行い、整形した画像を文字認識対象の画像として画像記憶部4に記憶する。
図7を参照して短冊画像の再配置方法について説明する。
上記罫線検出処理において、白画素と黒画素との配列を一定間隔wとして横罫線44を追跡した場合、画像上の横罫線44を点列として取得することができる。
画像整形部5は、ゆがみ補正を行うにあたり、帳票定義記憶部6から帳票定義データを読み出し、個々の短冊画像に含まれる罫線(横罫線44が一定間隔wの幅で分断されたもの)の中心位置を、帳票定義データで予め設定された罫線の位置に一致させるように、短冊画像全体を上下に移動する。
すなわち、画像整形部5は、画像を短冊状に区切る位置(x座標)を、図7に示すように、横罫線44上の一定間隔wで隣り合う2点の中点とし、検出した横罫線44上の点○が、帳票定義されている罫線の正しい位置に来るように短冊画像を上下に移動させる。
以上の処理により、帳票20にガイドマークが印刷されていない場合でも、帳票20の画像に含まれる横罫線44を利用することにより、画像のゆがみを補正することができる。
上記のようにして補正後の画像が画像記憶部4に記憶されると、文字認識部7は、帳票定義記憶部6より帳票定義を読み出し、読み出した帳票定義に基づいて画像記憶部4の画像に対して文字認識処理を実行し、認識結果を認識結果記憶部8に記憶する。
このようにこの第1実施例のFAX−OCR装置によれば、検出した罫線の位置座標を用いて、ゆがみや伸縮の補正を行うことで、ガイドマークを配置することなく、精度の高いOCR処理可能なシステムを提供することができる。
また、検出する罫線として、一般的な帳票に設けられている文字の記入枠などを用いるので、FAX−OCR専用の帳票ではなく、一般の記入用紙などを文字認識処理の対象とすることができる。
すなわち、画像から罫線を検出して、検出した罫線を基に画像のゆがみを補正する機能を付加したことで、ガイドマークを配置することなく、ゆがみを補正することができるようになり、従来のようにガイドマークのためにエリアを確保する必要がなくなる。また、帳票にガイドマークを印刷するのに比べて帳票の外観を損ねることもなくなる。
次に、第2実施例のFAX−OCR装置について説明する。この第2実施例は、画像の伸縮を補正する例である。
この第2実施例のFAX−OCR装置は、ハードウェアとしては、図1の構成と同じであり、帳票20の画像25を取得する画像取得手段としてのファクシミリ12および通信部2を備える。
画像整形部5は、通信部2により取得された帳票20の画像25の画素の配列から縦または横いずれかの方向の罫線を検出する罫線検出手段として機能する。また画像整形部5は、検出した一方向の罫線の幅で画像をいくつかの領域に分割した画像(以下、領域画像と称す。)を切り出す切出手段として機能する。
画像整形部5は、画像の端部から各罫線までの間隔を検出する手段として機能する。画像整形部5は、検出した画像の端部から罫線までの間隔と予め定義されている帳票の該当罫線の間隔とを対比して伸縮倍率を計算する手段として機能する。
画像整形部5は、画像の罫線の始点から終点までの長さと帳票定義記憶部6から読み出した帳票定義のデータ上の罫線の長さとの比が上記伸縮倍率と同じになるように、切り出した領域画像を伸縮し、各部分領域の画像を結合することで整形画像を生成する整形手段として機能する。
この例の伸縮の補正にも、帳票定義記憶部6に記憶された帳票定義データ(帳票の基準位置(例えば4つの角の中の一つの角)からの罫線の始点、終点の位置座標)を用いる。
この第2実施例では、ゆがみ補正を行った画像の罫線の開始位置および終了位置の座標と帳票20の端の位置とが、帳票定義記憶部6の帳票定義データ上の罫線の開始および終了位置と帳票20の端の位置とが同じ位置になるように、短冊画像を線形に拡大または縮小を行い、拡大または縮小したそれぞれの短冊画像を結合することで画像を整形(補正)する。
(伸縮補正の領域分け)
図2に示したように、罫線21で囲まれた領域が帳票20の中心を挟んで左右に2つあるように帳票が定義されている場合には、画像整形部5は、帳票20の画像25全体を走査して、図8に示すように、走査した画素の配列から縦または横いずれかの方向の罫線、例えば縦罫線を検出し、検出した一方向の罫線(縦罫線)の幅で画像をいくつかの領域、この場合、5つの領域81〜85に区分し、それぞれの領域を切り出することで部分領域の画像を生成しメモリに記憶する。なお、符号87は帳票の左角、符号88は帳票の右角を示している。
そして、切り出したそれぞれの部分領域の画像の幅が帳票定義通りになるように拡大、縮小、つまり伸縮を行うことにより画像を整形(補正)する。
以下、図8、図9を参照して、画像の伸縮補正処理について説明する。図8は帳票の画像の領域の区分の仕方を説明するための図、図9はこのFAX−OCR装置の伸縮補正処理を示すフローチャートである。
このFAX−OCR装置では、帳票20をファクシミリ12にセットして送信操作を行うと、ファクシミリ12は、帳票20を装置内部に引き込んで、CCDセンサによる読み取り動作を行い、宛先のPC10へ送信される。
PC10では、ファクシミリ12から送信された画像が通信部2により受信されて制御部3へ入力される。制御部3は、入力された画像を画像記憶部4に画像ファイルとして記憶する。
次に、制御部3は、画像整形部5を制御して画像整形処理(画像の補正)を実行させる。
この場合、画像整形部5は、画像記憶部4より画像ファイルを読み出して画像データをメモリに展開し、展開した画像内の画素をスキャンし、黒画素と白画素の配置状況、つまり各画素の位置座標を検出する。
位置座標の検出にあたり、画像整形部5は、図9のフローチャートの動作を行う。なお、図9のフローチャートでは、DLines[]:帳票定義された横罫線を始点x座標の昇順に並べ替えたもの、Lines[]:ゆがみ補正に使った横罫線を始点x座標の昇順に並べ替えたもの、lnum:横罫線の数と定義する。
画像整形部5は、まず最初に、補正処理で使う変数xs, xe, dxs, dxeと計数値iをメモリに設定し、各変数xs, xe, dxs, dxeに初期値を与える(図9のS101)。
なお、変数xs, xe は、処理している画像上の座標を表しており、変数dxs, dxe は、帳票定義上の座標を表している。例えば変数xe は帳票87のX座標を示す。
画像整形部5は、メモリに設定した計数値i を0とする(S102)。
画像整形部5は、変数xs, xe, dxs, dxe の値をそれぞれ以下のように更新する(S103)。
変数xsの値を変数xeに設定する。Line[i]の始点X座標を変数xeに設定する。変数dxeの値を変数dxsに設定する。DLine[i]の始点X座標を変数dxeに設定する。
例えば、変数xs, xeは、計数値i = 0 の場合には、図8の領域81の両端の座標を示す。計数値i = 1 の場合は、図8の領域83の両端の座標を示す。また、変数dxs, dxe は同じ領域の帳票定義上の座標を表す。
画像整形部5は、変数xs, xeの間の距離が変数dxs, dxeの間の距離と一致するように、各画素の位置座標を(dxe − dxs + 1 ) / (xe − xs + 1)倍して、伸縮後の画像の各画素の位置座標を求め、元の画像を補正する(S104)。
画像整形部5は、変数xs, xe, dxs, dxe の値をそれぞれフローチャートのように更新する(S105)。
この更新により、変数xs, xeは、例えば計数値i = 0 の場合には、図8の領域82の両端の座標を示すことになり、計数値i = 1 の場合は、図8の領域84の両端の座標を表すことになる。また、変数dxs, dxe は同じ領域の帳票定義上の座標を表す。
画像整形部5は、S104の処理と同様に画像の補正処理を実行する(S106)。
画像整形部5は、メモリに設定した計数値i をインクリメント、つまり1を足す(S107)。
画像整形部5は、計数値iと横罫線の数lnum とを比較する(S108)。
この比較の結果、計数値i が横罫線の数lnum よりも小さい場合(S108のYes)、画像整形部5は、S103の変数設定処理に戻り、変数xs, xe, dxs, dxeに次の値を設定する。
また、比較の結果、計数値i の値が横罫線の数lnum 以上の場合(S108のNo)、画像整形部5は、変数xs, xe, dxs, dxe の値をそれぞれフローチャートのように更新する(S109)。
この更新により、変数xs,xeは、図8の領域85の両端の座標を表すことになる。また、変数dxs, dxe は、同じ領域の帳票定義上の座標を表す。
画像整形部5は、上記S104の処理と同様に補正処理を実行する(S110)。
以上の処理によって、ガイドマークの代わりに、画像から検出した罫線を使うことで、ファックス送信時に伸縮した画像を、元の画像に近い形に補正することができる。
このように、ガイドマークの代わりに罫線情報を使うことにより、イメージの伸縮を補正することが可能になる。
以上のように、罫線情報を用いて、ゆがみや伸縮の補正を行う方法により、ガイドマークを配置することなく、精度の高いOCR処理可能なシステムを提供することができるようになる。また、罫線情報としては記入枠などを用いるため、FAX−OCR専用の帳票ではなく、一般の記入用紙を処理対象の帳票とすることができるという利点がある。
上記の結果、ガイドマークの代わりに罫線を用いることにより、帳票の全領域を自由に設計でき、帳票の外観にも影響を与えない画像処理装置を提供することができる。
ここで、画像整形部5の電子透かしの解読方法について詳述する。
画像整形部5は、画像記憶部4より読み出した画像ファイルのデータを、例えば横方向などの一定の方向に走査して、まず、白・黒の画素列を取得し、黒画素が一定数連続する部分を検出する。つまり、文字記入枠の横罫線を検出する。
黒画素が一定数連続する部分を検出すると、画像整形部5は、続いて、その横罫線の上または下の画素列を走査して、予め自身に設定されている探索パターンと比較して一致する画素パターンの有無を確認する。
この結果、探索パターンと一致した画素パターンが存在した場合、画像整形部5は、それが電子透かしと特定し、その後に続く画素パターンを帳票定義のデータ本体として取り出し、帳票定義記憶部6に記憶する。
帳票定義は、帳票上の文字記入位置に関する情報、つまり文字枠に関する情報であり、具体的には、X座漂、Y座漂、文字ピッチ、文字数、字種などである。
なお、電子透かしが帳票のどこにあるか分からないような場合、文字記入枠の横罫線の検出処理を始めに行う方が処理速度としては速いが、横方向の走査を画像全体に対して行い、一列毎に順に探索パターンと比較し電子透かしを特定するようにすれば、文字記入枠の横線の検出処理は省略しても良い。
この場合、画像整形部5は、画像記憶部4に記憶された帳票の画像を読み出してその画像に予め埋め込まれている電子透かしを読み取り解読することによりその帳票の帳票定義データを取り出し帳票定義記憶部6に記憶する。
つまり、画像整形部5は、帳票20の罫線に沿って並べられた白と黒の画素の配列より帳票定義の位置を特定し、帳票の画像から帳票定義のデータを取り出す。
ここで、文字認識部7の文字認識処理について詳述する。
文字認識部7は、帳票定義記憶部6より帳票定義を読み出し、読み出した帳票定義より文字記入枠の位置を特定し、文字単位に文字画像を切り出し、切り出した文字画像と辞書の文字画像とを比較、つまりイメージマッチングを行い、合致または類似した文字画像に対応するテキストデータを、辞書より呼び出して認識結果として出力、つまり認識結果記憶部8に記憶する。
次に、帳票上の罫線の位置を検出するために電子透かしを用いる場合について説明する。
申込者が名前や住所、電話番号などの必要事項(文字)を記入する欄、つまり枠線が黒い線(連続する黒画素)で印刷されているものとする。枠線は文字の記入位置を定めるものである。枠線の外側に、1または数ドット分、はみ出す形で黒画素と白画素とから構成される画素列を設ける。この画素列が電子透かしである。なお枠線の外側にはみ出させる形で電子透かしを設ける以外に枠線の内側に設けても良い。
電子透かしは、画像部分を拡大すると、例えば黒画素0.3mm,白画素0.3mm、黒画素0.9mm,白画素0.3mm、黒画素0.9mmなどのような所定の間隔の探索パターンと、その後に続けて設けられた黒画素と白画素とを組み合わせた画素列から成るデータ本体とで構成されている。
つまり、帳票の表面の文字記入用の枠線や罫線の部分に、線からはみ出す方向にほんのわずかな凹(白画素が構成する空白部分)、凸(黒画素)を印刷したものであり、画像整形部5は、帳票から取得した画像を横方向に走査したときの白画素と黒画素の並び具合で帳票定義の探索パターンを特定し、探索パターンに続く帳票定義データであるデータ本体を取り出す。データ本体において、黒画素は2値の「1」に対応付けられ、白画素は2値の「0」に対応づけられている。従って、データ本体は、黒画素と白画素とで表現される複数の2値データであり、これにより帳票定義データが設けられることになる。
この帳票定義データは、ヘッダー情報や帳票定義データ名及び帳票定義データとから構成される。この帳票定義データの設け方は、任意に決めればよく、特に限定されない。要するに、帳票定義データとして、黒画素と白画素とで表現される2値データで構成されれば、どのようなデータ構成でも良い。
次に、図10〜図12を参照し第3実施形態の画像処理装置について説明する。
この第3実施形態のハードウェア構成は、図1と同じである。上記第1実施例では、帳票定義のデータを帳票定義記憶部6に予め記憶しておくか、または電子透かしなどの技法によって利用者には見えないように帳票に埋め込んでおく必要があったが、この第3実施例では、帳票定義のデータを予め用意しておくことなく画像を補正する。つまり、画像から検出した罫線だけを用いてゆがみを補正する。
すなわち、この第3実施例のFAX−OCR装置において、PC10が有する画像整形部5は、画像記憶部4より読み出した帳票の画像全体から白画素と黒画素の配列を検出し、複数の横罫線の始点と終点の位置座標を検出する手段として機能する。
また、画像整形部5は、検出した複数の罫線の始点と終点の位置座標から各罫線の長さ(幅)を求め、検出した罫線の中から最も長い(最も幅の広い)罫線を選出し、選出した罫線を短冊状に切り出して、切り出した画像同士の罫線がほぼ直線になるように各画像を再配置し、ゆがみを補正する手段として機能する。
さらに、画像整形部5は、選出した罫線を除いた残りの罫線の中から、補正に使った罫線とx座標が重ならない罫線を選出し、選出した罫線により画像の補正処理を実行する手段として機能する。
この第3実施例の画像処理装置の概要動作を、図10を用いて説明する。
この場合、画像整形部5は、図10に示すように、画像記憶部4より読み出した帳票20の画像25全体から上記第1実施例のように白画素と黒画素の配列状況を調べ、初めに検出された横罫線91の始点と終点の位置座標を検出する。
画像整形部5は、検出した罫線の始点と終点の位置座標から罫線91の長さ(幅)を求め、検出した罫線91にユニークな番号を振って、その罫線91の番号と長さとを対応させてメモリに記憶する。
上記罫線検出および記憶動作を、画素をx方向へ順次走査して罫線91,93,95,97,96,98,99,94,92が検出されるたび行い、検出した罫線91,93,95,97,96,98,99,94,92の中から最も長い罫線、この場合、罫線91を選択し、選択した罫線91が直線になるように、その罫線91の幅の範囲を一定間隔で短冊状に区切り、上記実施例1で説明したゆがみ補正を実施する。
次に、画像整形部5は、選択した罫線91以外の残りの罫線93,95,97,96,98,99,94,92の中から、補正に使った罫線91とx座標が重ならない罫線、この場合、ほぼ同じ長さ(幅)の罫線93と罫線94があるがそのうち少しでも長い方を選出し、罫線91の場合と同様の処理を実施する。
次に、図11を参照して第3実施形態の画像処理装置による画像整形処理について詳細に説明する。
この第3実施例の場合、画像整形部5は、検出した横罫線を長い順に配列Lines[]に格納し、横罫線の数をlnum と設定する(図11のS201)。
画像整形部5は、配列x[]を用意し、各要素を0で初期化する。配列x[] の大きさは、画像の横幅とし、後の処理で画像上のピクセル列kにおいて補正を実施したかどうかをk番目の配列x[k]に記録するために利用する(S202)。
画像整形部5は、計数値i = 0 とする(S203)。
画像整形部5は、 検出した罫線Lines[i]を用いて画像のゆがみ部分の補正処理を実施する(S204)。なおこのS204の画像のゆがみの補正処理の詳細動作については、図12のフローチャートで説明する。
画像整形部5は、補正処理の後、検出した値i に1を足す(S205)。
画像整形部5は、計数値i がlnumより小さい場合(S206のYes)、次の画像について補正を行うため、S204の処理に戻る。計数値i がlnum以上となった場合(S206のNo)、画像整形部5は、補正処理の対象となる画像はないものと判定し処理を終了する。
ここで、図12を参照して上記S204のゆがみ補正処理の詳細動作について説明する。
画像のゆがみ補正処理を行う場合、画像整形部5は、変数xs をLines[i]の始点のx 座標、変数xe をLines[i]の終点のx座標としてメモリに設定する(S301)。
画像整形部5は、Lines[i] を用いた罫線補正を実施するかどうかを判定する(S212〜S215)。
画像整形部5は、変数xsを計数値j に代入して(S302)、x[j]の値が0か否かを判定する(S303)。
この判定結果、x[j]の値が0でない場合(S303のNo)、つまり1であれば、画像整形部5は、Lines[i]上には、既に補正された部分があるものと判定し、Lines[i]を用いたゆがみの補正処理を実行せずに処理を終了する。
一方、上記判定結果、x[j] の値が0の場合(S303のYes)、画像整形部5は、画像上のjピクセル列目はまだ補正されていないものと判定し、計数値jに1を足す(S304)。
次に画像整形部5は、計数値j が変数xe 以下か否かを判定する。
この判定結果、計数値j が変数xe 以下であれば(S305のYes)、S303の処理に戻り上記計数処理を繰り返す。
また、画像整形部5は、計数値j が変数xe を越えた場合(S305のNo)、Lines[i]の始点xsから終点xeまでの全てのピクセル列はまだ補正されていないため、画像整形部5は、Lines[i]を用いて始点xs、終点xe間の画像のゆがみの補正処理を実行する(S306)。
補正処理の後、画像整形部5は、ピクセル列x[k]は、補正済みとして、x[k]に1を設定し(k=xs, …,xe)(S307)、罫線補正を終了する。
なお、上記S302〜S305で各罫線について補正処理を実施するかどうかを判定するのは、x座標の位置が近い複数の罫線(図10参照)を用いて、同じピクセル列を何度も補正するのを防ぐためである。
以上の処理により、帳票定義をしない場合でも画像から検出した罫線を用いて帳票のゆがみを補正することができる。
このようにこの第3実施例によれば、帳票全体から罫線を検出し、罫線の長さと位置座標から、ゆがみ補正に利用する罫線を選択して、選択した罫線を用いて画像のゆがみを補正するので、帳票定義を行うことなく画像のゆがみを補正できる。
本発明の一つの実施形態のFAX−OCR装置の構成を示す図。 ファクシミリで送信する帳票の形式と帳票の読み取り方向の一例を示す図。 図2の帳票から読み取られた実際の画像を示す図。 帳票画像の拡大図。 画像のゆがみを補正する前の画像を示す図。 画像のゆがみを補正した後の画像を示す図。 短冊画像の再配置方法を説明するための図。 帳票の画像の領域の区分の仕方を説明するための図。 第2実施例のFAX−OCR装置の伸縮補正処理を示すフローチャート。 帳票定義を使わない罫線検出動作を説明するための図。 第3実施例のFAX−OCR装置の伸縮補正処理を示すフローチャート。 図11のS204の処理の詳細を示すフローチャート。
符号の説明
2…通信部、3…制御部、4…画像記憶部、5…解読部、6…帳票定義記憶部、7…文字認識部、8…認識結果記憶部、9…ディスプレイ、10…パーソナルコンピュータ(PC)、11…電話回線、12…ファクシミリ。

Claims (6)

  1. 帳票の画像を取得する画像取得手段と、
    前記画像取得手段により取得された帳票の画像の画素の配列から罫線を検出する罫線検出手段と、
    前記罫線検出手段により検出された前記罫線を含む画像を、前記罫線とほぼ直交する方向に所定間隔で短冊状に切り出す切出手段と、
    切り出された短冊状の画像に含まれる罫線の中心を、予め設定された帳票定義データ上の罫線の位置に一致させるように、前記短冊状の各画像を再配置し前記各画像を結合することで整形した画像を生成する整形手段と
    を具備したことを特徴とする画像処理装置。
  2. 前記罫線検出手段は、
    前記画像取得手段により取得された前記帳票の画像に電子透かしの形態で埋め込まれた前記罫線の位置を定義した帳票定義データを読み出すことで前記罫線を検出することを特徴とする請求項1記載の画像処理装置。
  3. 画像処理装置に文字認識処理を実行させる画像処理プログラムであって、
    前記画像処理装置を、
    帳票の画像を取得する画像取得手段と、
    前記画像取得手段により取得された帳票の画像の画素の配列から罫線を検出する罫線検出手段と、
    前記罫線検出手段により検出された前記罫線を含む画像を、前記罫線とほぼ直交する方向に所定間隔で短冊状に切り出す切出手段と、
    切り出された短冊状の画像に含まれる罫線の中心を、予め設定された帳票定義データ上の罫線の位置に一致させるように、前記短冊状の各画像を再配置し前記各画像を結合することで整形した画像を生成する整形手段
    として機能させることを特徴とする画像処理プログラム。
  4. コンピュータが画像を処理する画像処理方法であって、
    前記コンピュータが帳票の画像を取得するステップと、
    前記コンピュータが取得した帳票の画像の画素の配列から罫線を検出するステップと、
    前記コンピュータが検出した前記罫線を含む画像を、前記罫線とほぼ直交する方向に所定間隔で短冊状に切り出すステップと、
    前記コンピュータが切り出した短冊状の画像に含まれる罫線の中心を、予め設定された帳票定義データ上の罫線の位置に一致させるように、前記短冊状の各画像を再配置し前記各画像を結合することで整形した画像を生成するステップと
    を有することを特徴とする画像処理方法。
  5. 帳票の画像を取得する画像取得手段と、
    前記画像取得手段により取得された帳票の画像の画素の配列から縦または横いずれかの方向の罫線を検出する罫線検出手段と、
    前記罫線検出手段により検出された一方向の罫線の幅で部分領域の画像を切り出す切出手段と、
    前記画像の端部から各罫線までの間隔を検出する手段と、
    検出した前記画像の端部から前記罫線までの間隔と予め定義されている帳票の該当罫線の間隔とを対比して伸縮倍率を計算する手段と、
    前記画像の罫線の始点から終点までの長さと前記定義された罫線の長さとの比が前記伸縮倍率と同じになるように前記切出手段により切り出された部分領域の画像を伸縮し、各部分領域の画像を結合することで整形画像を生成する整形手段と、
    を具備したことを特徴とする画像処理装置。
  6. 前記罫線検出手段は、
    前記画像取得手段により取得された帳票の画像全体から白画素と黒画素の配列を検出し、複数の横罫線の始点と終点の位置座標を検出する手段と、
    検出した複数の罫線の始点と終点の位置座標から各罫線の長さを求め、検出した罫線の中から最も長い罫線を選出する手段と
    を具備したことを特徴とする請求項1または5いずれか記載の画像処理装置。
JP2006071818A 2006-03-15 2006-03-15 画像処理装置、画像処理プログラムおよび画像処理方法 Pending JP2007249580A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006071818A JP2007249580A (ja) 2006-03-15 2006-03-15 画像処理装置、画像処理プログラムおよび画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006071818A JP2007249580A (ja) 2006-03-15 2006-03-15 画像処理装置、画像処理プログラムおよび画像処理方法

Publications (1)

Publication Number Publication Date
JP2007249580A true JP2007249580A (ja) 2007-09-27

Family

ID=38593808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006071818A Pending JP2007249580A (ja) 2006-03-15 2006-03-15 画像処理装置、画像処理プログラムおよび画像処理方法

Country Status (1)

Country Link
JP (1) JP2007249580A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014048731A (ja) * 2012-08-29 2014-03-17 Fujitsu Frontech Ltd 文字認識装置、プログラム、及び方法
JP2015055890A (ja) * 2013-09-10 2015-03-23 株式会社東芝 帳票読取装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014048731A (ja) * 2012-08-29 2014-03-17 Fujitsu Frontech Ltd 文字認識装置、プログラム、及び方法
JP2015055890A (ja) * 2013-09-10 2015-03-23 株式会社東芝 帳票読取装置およびプログラム

Similar Documents

Publication Publication Date Title
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
JP2930612B2 (ja) 画像形成装置
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
US20100171999A1 (en) Image processing apparatus, image processing method, and computer program thereof
US6959121B2 (en) Document image processing device, document image processing method, and memory medium
US20100315681A1 (en) Image processing apparatus, image processing method, and computer-readable storage medium
JPH113430A (ja) 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体
JP2006270418A (ja) 画像処理装置およびその方法
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JP2007335920A (ja) 画像処理装置および画像処理プログラム
JP2001307014A (ja) 二次元コード抽出方法
EP2782065A1 (en) Image-processing device removing encircling lines for identifying sub-regions of image
JP2017161969A (ja) 文字認識装置、方法およびプログラム
JP4893643B2 (ja) 検出方法および検出装置
JP2011090578A (ja) 画像処理装置、画像処理方法及びプログラム
JP4436202B2 (ja) 部分的テンプレート照合を用いた画質向上
JP2010056691A (ja) 画像処理装置及び画像処理方法
JP2007249580A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
JP2008028716A (ja) 画像処理方法及び装置
JP2019029884A (ja) 画像処理装置
JP2019029882A (ja) 画像処理装置
JP4998176B2 (ja) 翻訳装置及びプログラム
JP2007295210A (ja) 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体
JP4517667B2 (ja) 文書画像照合装置、文書画像位置合わせ方法及びプログラム
JP2009141525A (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091215