JP2004341656A - Image processor and image processing program - Google Patents

Image processor and image processing program Download PDF

Info

Publication number
JP2004341656A
JP2004341656A JP2003135219A JP2003135219A JP2004341656A JP 2004341656 A JP2004341656 A JP 2004341656A JP 2003135219 A JP2003135219 A JP 2003135219A JP 2003135219 A JP2003135219 A JP 2003135219A JP 2004341656 A JP2004341656 A JP 2004341656A
Authority
JP
Japan
Prior art keywords
information
binarization
image
threshold value
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003135219A
Other languages
Japanese (ja)
Inventor
Katsumi Ide
克美 井出
Hideo Kamata
英夫 鎌田
Shunji Sakane
俊司 坂根
Kazumasa Komatsu
一正 小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2003135219A priority Critical patent/JP2004341656A/en
Publication of JP2004341656A publication Critical patent/JP2004341656A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To select a binarization parameter suitable for an objective part. <P>SOLUTION: When the image data of a predetermined slip are inputted from an image scanner 1 to an image processor 2, an identification information reading means 3 reads slip identification information from the image data, and transmits it to a definition information retrieving means 5. The definition information retrieving means 5 retrieves a definition information storing part 4 based on the slip identification information, and extracts the definition information corresponding to a target slip, and stores it in a binarization information storing part 6, and transfers it to a threshold selecting means 7. The threshold selecting means 7 selects the optimal threshold by using image data in an item area for each of the items of the slip based on the definition information. Also, the binarization parameter is set based on the definition information. The threshold and the binarization parameter are stored in the binarization information storing part 6. A binarization processing means 8 executes the binarization processing of the image data in the image area for each item based on the binarization information. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は画像処理装置および画像処理プログラムに関し、特に光学的に読み取られた帳票の画像情報を所定のしきい値を用いて2値化する画像処理を行なう画像処理装置および画像処理プログラムに関する。
【0002】
【従来の技術】
従来、帳票読み取り業務の効率化のため、置き台の上に置かれた帳票の光学的なイメージ情報を読み取り、そのイメージ情報を画像処理して文字認識などを行なう帳票読み取り装置が金融機関などに導入されている。
【0003】
帳票読み取り装置は、帳票を含む2次元領域を撮像して全体の画像(イメージ情報)を取得する非接触型イメージスキャナと、このイメージ情報の画像処理を行なう画像処理装置と、を具備する。
【0004】
帳票読み取り装置の動作について説明する。図15は、帳票の一例を示す図である。図は、銀行で使用される帳票(伝票)の一例である。図の例の帳票90には、「銀行名」、「支店名」、「受取人」、「依頼人」、「口座番号」、「金額」などの複数の項目を示すガイド文字91と、各項目に対応するデータを記入するための枠92、および印鑑を押下する印鑑欄93が予め印刷されている。例えば、客は、この帳票90の各枠92内に対応する数字や文字などを記入し、印鑑欄93に押印する。オペレータによって置き台の上に置かれた帳票90は、非接触型イメージスキャナによって全体の画像(イメージ情報)が読み取られ、画像処理装置に転送される。
【0005】
画像処理装置は、取得したイメージ情報を所定のしきい値を用いて2値化して、表示用の帳票全体の画像データ(表示用データ)を生成し、各枠92内のデータの文字認識を行なう。2値化に用いられるしきい値は、取得した帳票全体のイメージ情報の濃度レベルに応じて帳票ごとにダイナミックに選定される(例えば、非特許文献1参照)。
【0006】
【非特許文献1】
大津展之著,「判別および最小2乗基準に基づく自動しきい値選定法」,電子情報通信学会論文誌,J63−D,vol.4,1980年,P.349−356
【0007】
【発明が解決しようとする課題】
しかし、従来の画像処理装置では、しきい値は帳票全体の濃度レベルから選定されるため、選定されたしきい値が目的箇所に適していない場合が発生するという問題がある。
【0008】
上記の説明のように、イメージ情報の2値化の際には、帳票全体の濃度レベルからしきい値が選定されるが、帳票には、予め印刷されたガイド文字91や枠92などと、枠92内に記入された数字や文字などの手書き文字など、濃度レベルの異なる情報データが混在している。このため、帳票のガイド文字91や黒印字枠、あるいは文字認識の際には除去されるドロップアウトカラーなどの濃度レベルに影響されて、本来出力させたい手書き記入文字に適したしきい値とならない場合が発生する。しきい値が手書き記入文字の濃度レベルと合っていない場合、例えば、2値化のときに文字の薄い部分が出力されず、2値化後の文字がかすれたようになり、文字認識が困難になるという問題が生じる。また、表示用のイメージ生成においても、ガイド文字などの情報化させたい部分が欠落してしまうという問題が生じることが考えられる。
【0009】
また、一般に、文字認識を行なう認識領域、表示を行なう表示領域、印鑑情報を取得する印鑑領域などのように異なる用途の領域の2値化を行なう場合、それぞれの領域に合わせて2値化処理の微調整を行なうことが望ましい。しかしながら、従来は、全体的に一律の処理が行なわれていたため、領域ごとの特性に応じた調整は行なわれていなかった。
【0010】
以上の説明のように、帳票全体の濃度レベルで自動的にしきい値が選定されることによって、帳票の色の構成(見出しやガイド文字)や黒印刷の帳票全体に対する割合でしきい値が左右されてしまうという問題があった。また、文字認識用や表示用などの用途に合わせて2値化処理を微調整することも難しかった。このように、しきい値を含む2値化時の参照される2値化パラメータは領域ごとに最適化されておらず、この結果、手書き文字がかすれたり、表示情報が欠落するという問題が生じた。
【0011】
本発明はこのような点に鑑みてなされたものであり、目的箇所に適応した2値化パラメータを選定することが可能な画像処理装置および画像処理プログラムを提供することを目的とする。
【0012】
【課題を解決するための手段】
本発明では上記課題を解決するために、図1に示すような画像処理装置が提供される。本発明に係る画像処理装置2は、帳票の光学的な画像情報の読み取りを行なうイメージスキャナ1と接続し、イメージスキャナ1によって生成された画像データの画像処理を行なっている。
【0013】
読み取り対象の帳票は、帳票を識別するための帳票識別情報の他、各項目情報が所定の位置に記載されている。各項目の位置や範囲を定義する定義体情報は、帳票ごとに定義体情報記憶部4に格納されている。
【0014】
画像処理装置2では、イメージスキャナ1の読み取った帳票の画像データが入力されると、識別情報読み取り手段3は、帳票の画像データから帳票を識別するための帳票識別情報を読み取る。定義体情報検索手段5は、識別情報読み取り手段3の取得した帳票識別情報に基づいて定義体情報記憶部4を検索し、該当する帳票の定義体情報を抽出する。抽出された定義体情報は、2値化情報記憶部6に格納されるなどして、しきい値選定手段7へ伝えられる。しきい値選定手段7は、得られた定義体情報に基づいて、項目ごとに、項目領域の画像データを抽出し、前記項目領域の画像データの濃度レベルに応じたしきい値を選定する。2値化処理手段8は、項目ごとに、項目領域ごとに設定されたしきい値を用いてこの項目領域の2値化を行ない、2値化データを生成する。
【0015】
このように、本発明に係る画像処理装置2では、定義体情報に基づいて項目ごとに最適なしきい値が選定され、このしきい値を用いて項目領域ごとに2値化処理が施された画像データが出力される。
【0016】
また、上記課題を解決するために、コンピュータに、帳票を構成する項目ごとに定義される帳票における前記項目の位置、範囲を含む定義体情報を所定の記憶手段に格納するステップと、画像情報から帳票を識別するための帳票識別情報を読み取るステップと、帳票識別情報に基づいて、定義体情報が格納された所定の記憶手段を検索し、帳票に対応する定義体情報を抽出するステップと、定義体情報に基づいて前記項目ごとに定義される項目領域の画像情報の濃度レベルに応じたしきい値を選定するステップと、項目ごとに、前記しきい値を用いて項目領域の画像情報の2値化処理を行なうステップと、を実行させることを特徴とする画像処理プログラムが提供される。
【0017】
このような画像処理プログラムをコンピュータに実行させることにより、コンピュータは、画像処理装置2として機能する。コンピュータは、帳票を構成する各項目を定義する定義体情報を定義体情報記憶部4に格納しておき、イメージスキャナ1が読み取った画像データが入力されると、画像データから帳票を識別する帳票識別情報を読み取り、帳票識別情報に基づいて該当する帳票の定義体情報を抽出する。そして、項目ごとに抽出された定義体情報に基づいて2値化のためのしきい値が選定され、選定されたしきい値を用いて各項目領域の画像データに2値化処理を施す。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。まず、実施の形態に適用される発明の概念について説明し、その後、実施の形態の具体的な内容を説明する。
【0019】
図1は、本発明の実施の形態に適用される発明の概念図である。
本発明に係る画像処理装置2は、帳票の光学的なイメージ情報を読み取り、その画像データを出力するイメージスキャナ1に接続しており、画像データから帳票識別情報を読み取る識別情報読み取り手段3、帳票の各項目を定義する定義体情報を記憶する定義体情報記憶部4、帳票識別情報に基づいて該当する定義体情報を検索する定義体情報検索手段5、定義体情報を含む2値化のための2値化情報を記憶する2値化情報記憶部6、2値化のためのしきい値を選定するしきい値選定手段7、およびしきい値と2値化情報に基づいて各項目領域の2値化処理を行なう2値化処理手段8を具備する。
【0020】
イメージスキャナ1は、置き台の上に置かれた帳票の光学的なイメージ情報を読み取り、その画像データを生成して、画像処理装置2へ引き渡す。
識別情報読み取り手段3は、イメージスキャナ1が読み取った画像データから、帳票の所定の位置に記録されている、帳票を識別するための帳票識別情報の読み取り処理を行なう。読み取った帳票識別情報は、定義体情報検索手段5へ送る。
【0021】
定義体情報記憶部4には、画像処理装置2の処理対象である帳票を構成する各項目を定義する定義体情報が格納されている。定義体情報は、例えば、帳票を構成する各項目の位置を示す座標と領域の幅や高さなどの範囲、各項目の使用用途(表示用/文字認識用など)、および記入されている文字種(手書き/活字/印刷/印字など)などの定義が情報化されているものである。定義体情報は、帳票ごとに用意されている。
【0022】
定義体情報検索手段5は、識別情報読み取り手段3によって読み取られた帳票識別情報を用いて定義体情報記憶部4に格納された定義体情報を検索し、該当する帳票の定義体情報を抽出する。抽出された対象帳票の定義体情報は、例えば、2値化情報記憶部6に格納するなどして、しきい値選定手段7に引き渡される。
【0023】
2値化情報記憶部6には、2値化処理の実行時に必要となる情報が格納されている。2値化情報には、2値化処理に用いられるしきい値や、2値化処理を調整するための2値化パラメータがある。しきい値は、各項目の領域ごとに、その領域の濃度レベルに応じて選定された値である。2値化パラメータは、例えば、表示用や文字認識用などの用途に応じて、2値化処理を調整するためのパラメータである。また、そのほか、例えば、定義体情報検索手段5によって抽出された対象帳票の定義体情報が格納される。
【0024】
しきい値選定手段7は、定義体情報に基づいて、2値化処理の際に用いるしきい値と、2値化パラメータとを設定し、2値化情報記憶部6に格納するなどして、2値化処理手段8へ引き渡される。しきい値は、例えば、定義体情報によって規定される各項目領域の画像データのヒストグラム情報を作成し、ヒストグラム情報に基づいて最適なしきい値を選定する。ヒストグラム情報からしきい値を選定する手法については公知であるので、ここでの説明は省略する。2値化パラメータは、定義体情報に基づいて、項目領域の情報の用途が表示用であるか、文字認識用であるか、その両方であるかなどに応じて、選定される2値化処理用のパラメータである。2値化パラメータは、例えば、2値化処理時の画像データの濃度を調整するパラメータで、この値は用途に応じて規定される。従って、ある項目のデータが、表示用および認識用の2種類の用途に用いられる場合、2値化パラメータは、それぞれの用途用に2種類用意される。
【0025】
2値化処理手段8は、しきい値選定手段7により選定されたしきい値および2値化パラメータを用いて、その項目領域の画像データの2値化処理を行なう。しきい値選定手段7によって2値化パラメータが複数設定されている場合には、それぞれの2値化パラメ−タを用いて2値化処理を行なう。
【0026】
このような構成の画像処理装置の動作について説明する。
定義体情報記憶部4には、予め、処理対象の帳票について、帳票を構成する項目の位置や範囲、その用途などを定義した定義体情報が格納されている。
【0027】
イメージスキャナ1から画像処理装置2に所定の帳票の画像データが入力されると、識別情報読み取り手段3は、帳票上の所定の位置に記載されている帳票識別情報を読み取り、定義体情報検索手段5へ送る。定義体情報検索手段5は、帳票識別情報に基づいて定義体情報記憶部4を検索し、対象帳票に対応する定義体情報を抽出し、2値化情報記憶部6に格納して、しきい値選定手段7へ引き渡す。しきい値選定手段7は、定義体情報に基づいて、帳票の各項目ごとに、項目領域の画像データを抽出してヒストグラム情報を作成し、最適なしきい値を選定する。また、定義体情報に基づいて、2値化パラメータも設定する。しきい値および2値化パラメータは、2値化情報記憶部6に格納されて、2値化処理手段8へ引き渡される。2値化処理手段8は、2値化情報記憶部6に格納された2値化情報に基づいて、各項目ごとに、項目領域の画像データの2値化処理を行なう。2値化パラメータが複数設定されている場合には、それぞれの2値化パラメータを用いて2値化処理を行なう。
【0028】
次に、本発明が適用される実施の形態について説明する。図2は、本発明の実施の形態である画像読み取り装置とイメージスキャナのハードウェア構成図である。図1と同じものには同じ番号を付し、説明は省略する。
【0029】
画像処理装置は、CPU(Central Processing Unit)12によって装置全体が制御されている。CPU12には、バス16を介して、メモリ13、画像メモリ14、補助記憶装置15およびキャプチャボード11が接続されている。
【0030】
キャプチャボード11は、イメージスキャナ1と接続し、イメージスキャナ1の読み取った画像データを取り込み、画像メモリ14に保存する。メモリ13には、CPU12に実行させるプログラムの少なくとも一部、およびCPU12による処理に必要な各種データが一時的に格納される。画像メモリ14には、キャプチャボード11を介して入力する画像データが保存される。補助記憶装置15には、OS(Operating System)やアプリケーションプログラムが格納される。
【0031】
以上のハードウェア構成によって、実施の形態の処理機能を実現することができる。
以下、銀行で用いられる帳票の場合を例にとり、実施の形態について説明する。図3は、本発明の実施の形態の画像処理装置で読み取り処理を行なう帳票を示した図である。
【0032】
実施の形態における読み取り対象の帳票100は、帳票を識別するための帳票ID110、項目を示すガイド文字列120、文字認識の対象となる認識フィールド130、表示用データ生成の対象となる表示フィールド140、および印鑑が押印される印鑑フィールド150から構成される。
【0033】
帳票ID110は、帳票上の所定の位置に印刷された帳票を識別するためのコードであり、図の例では、帳票100の左上にある。入金用の帳票は「0101」、出金用の帳票は「0102」というように、IDが割り振られている。
【0034】
ガイド文字列120は、項目の内容を示すために予め印刷されている文字で、図の例では、「銀行名」、「支店名」、「受取人」、「住所」、「依頼人」、「住所」、「口座番号」、「金額」が印刷されている。
【0035】
認識フィールド130は、客がガイド文字列120を参照して手書き文字などによって記入した文字列が設定されているフィールドであり、文字認識の対象となっている。図の例では、「銀行名」、「支店名」、「受取人」、「依頼人」、「口座番号」、「金額」に対応する文字が記入されたフィールドが認識フィールド130になる。
【0036】
表示フィールド140は、オペレータの確認用などを目的として、表示画面に表示するための画像データを生成する対象となるフィールドである。図の例では、受取人の「住所」、依頼人の「住所」、「口座番号」のガイド文字列120と記入文字、および「金額」のガイド文字列120と記入文字とが表示フィールド140に含まれる。
【0037】
印鑑フィールド150は、印鑑が押下されているフィールドである。
このような帳票100を対象として、本発明に係る画像処理装置が実行する処理手順を順次説明する。
【0038】
イメージスキャナ1が読み取った帳票100の画像データが画像処理装置に入力され、定義体情報である帳票レコード取得処理が開始される。
図4は、本発明の実施の形態の画像処理装置における帳票レコード取得の処理手順を示した図である。図3と同じものには同じ番号を付し、説明は省略する。
【0039】
帳票100の画像データが入力されると、帳票を識別するための情報である帳票ID110の認識処理を行なう(ステップS1)。帳票ID110の認識処理では、所定の位置に印刷されている帳票ID110の画像データを抽出し、2値化を行なった後に文字認識をして、帳票IDを読み取る。
【0040】
続いて、帳票ID認識処理(ステップS1)で得られた帳票IDを用いて、この帳票の定義体情報である帳票レコードを取得する処理を行なう(ステップS2)。帳票レコード取得処理では、帳票レコード記憶部41に格納された帳票レコード(定義体情報)を、帳票IDをキーとして検索し、対応する帳票レコードを抽出する。抽出された帳票レコードの情報は、2値化レコード情報ファイル200に転記される。
【0041】
ここで、2値化レコード情報ファイル200について説明する。図5は、本発明の実施の形態の2値化レコード情報ファイルの構成図である。
2値化レコード情報ファイル200は、各項目(フィールド名)ごとに、その項目領域(以下、フィールドとする)の帳票上の座標201、フィールド幅202およびフィールド高さ203のフィールドの範囲に関する情報項目と、認識フィールド204、表示フィールド205、および印鑑フィールド206のフィールドの用途を示す情報項目とが、帳票レコードより抽出され、転記されている。さらに、2値化レコード情報ファイル200は、後述する処理で生成される2値化のための2値化しきい値207と2値化パラメータ208の情報項目を具備する。
【0042】
図3の例では、認識フィールド130、表示フィールド140および印鑑フィールド150の各フィールドは矩形としている。フィールドの範囲は、矩形の1点の座標(水平方向をX、垂直方向をYとした2次元)と、この座標を基準として水平方向のフィールド幅、垂直方向のフィールド高さにより指定される。これらの値は、座標201欄、フィールド幅202欄、フィールド高さ203欄の各フィールドに対応する箇所に記載される。また、図の例では、フィールドは、それぞれの文字認識される認識フィールド130か、表示用の表示フィールド140、あるいは印鑑用の印鑑フィールド150のいずれかの用途に分類される。各フィールドに対応して設けられた認識フィールド204欄、表示フィールド205欄、印鑑フィールド206欄には、該当する場合に印(○)が設定される。
【0043】
例えば、「銀行名」というフィールドは、座標(X=200、Y=180)の位置から幅750ドット、高さ75ドットの範囲に存在する。また、用途は認識フィールドである。なお、フィールドが認識フィールドと表示フィールドの双方を兼ねる場合もあり、図の例では、「口座番号」と「金額」のフィールドは認識用と表示用を兼ねた認識/表示フィールドであり、認識フィールド204欄と表示フィールド欄205に印が付けられている。
【0044】
以上の処理手順により、対象の帳票についての帳票レコード情報が2値化レコード情報に設定され、2値化レコード情報に基づいてフィールドの画像データ切り出し処理が開始される。図6は、本発明の実施の形態の画像処理装置における画像データ切り出しの処理手順を示した図である。図3、図5と同じものには同じ番号を付し、説明は省略する。
【0045】
2値化レコード情報ファイル200に帳票レコード情報が設定された後、帳票上のフィールド範囲を特定する座標201、フィールド幅202およびフィールド高さ203の切り出し情報を参照して、帳票100の画像データからフィールド範囲の画像データの切り出しを行なう(ステップS3)。切り出した画像データは、ワークイメージメモリ300に格納する。
【0046】
図の例では、「銀行名」のフィールドに対応する切り出し情報(座標、フィールド幅、フィールド高さ)が2値化レコード情報より抽出され、この切り出し情報に基づいて、「銀行名」フィールドの画像データ、「フジツウ ギンコウ」、がワークイメージメモリ300に切り出される。
【0047】
次に、切り出された画像データからフィールドのしきい値が算出される。図7は、本発明の実施の形態の画像処理装置におけるしきい値算出の処理手順を示した図である。
【0048】
しきい値算出処理では、まず、ワークイメージメモリ300に読み出された切り出し画像データの濃度レベルの分布を表すヒストグラム情報を生成する(ステップS4)。次に、2値化レコード情報ファイル200のフィールド用途を表す認識フィールド204、表示フィールド205および印鑑フィールド206の情報を参照し、フィールドの用途を判定する(ステップS5)。次に、ステップS4で作成されたヒストグラム情報を自動判別し、しきい値を算出する(ステップS6)。算出されたしきい値は、2値化レコード情報ファイル200の対応するフィールドの2値化しきい値207欄に登録される。さらに、ステップS5のフィールド情報判定に基づいて、フィールドの用途に応じて予め登録されている2値化パラメータを選択する(ステップS7)。2値化パラメータは、用途ごとに予め設定され、メモリに格納されている。ステップS7では、フィールド用途に基づいて対応する2値化パラメータ値を読み出し、2値化レコード情報ファイル200の対応するフィールドの2値化パラメータ値208欄に登録する。
【0049】
図の例では、「銀行名」フィールドに対応する画像データから算出されたしきい値155が、「銀行名」フィールドに対応する2値化しきい値207に設定される。また、「銀行名」フィールドに対応する認識フィールド204aに印があることから、このフィールドが認識フィールドであることが判別され、これに対応する2値化パラメータ0.99が対応する2値化パラメータ欄208aに設定される。なお、図の例の「口座番号」フィールドのように、フィールドが認識フィールドと表示フィールドを兼ねるような場合、各フィールド用途に対応する2値化パラメータ欄209a、209bが設けられ、それぞれのフィールド用途ごとに2値化パラメータが選択され、登録される。
【0050】
以上の手順により、帳票レコードに基づいてフィールドごとのしきい値と2値化パラメータが算出され、2値化レコード情報ファイルに格納される。
次に、設定された2値化レコード情報ファイルに基づいて、フィールドの2値化処理が行なわれる。図8は、本発明の実施の形態の画像処理装置における2値化の処理手順を示した図である。
【0051】
2値化処理では、座標を用いて帳票の画像データを順次走査し、フィールドごとに2値化処理を行なう。
走査されている現在の座標と、2値化レコード情報ファイル200の座標201欄の値とを比較し、フィールドを検出する(ステップS9)。フィールドを検出した場合、2値化レコード情報ファイル200の認識フィールド204欄、表示フィールド205欄および印鑑フィールド206欄を参照し、フィールド用途を判定する(ステップS10)。次に、2値化レコード情報ファイル200の2値化しきい値207欄と2値化パラメータ208欄から該当するフィールドの2値化しきい値と2値化パラメータを読み出し、2値化のためのしきい値と2値化パラメータを取得する(ステップS11)。そして、取得されたしきい値と2値化パラメータにより2値化処理を行なう(ステップS12)。このように、フィールドが検出された場合、しきい値および2値化パラメータをフィールドに合わせて設定された値に切り替え、2値化処理を行なう。
【0052】
上記の説明のように、本発明の画像処理装置は、帳票レコード情報に基づいて、フィールド内の限定されたエリアのしきい値を算出しておき、このフィールドの2値化処理の際には、算出されたしきい値に切り替えて処理を行なう。さらに、フィールドの用途に応じて、2値化パラメータの切り替えも行なう。
【0053】
このように、フィ−ルド内の限定されたエリアにて算出するため、帳票色/ガイド文字/黒印刷の割合に影響されることなく、しきい値を求めることができる。こうして算出されたしきい値に切り替えてフィールドの2値化を行なうため、フィールドの情報の欠落を最小限にすることができる。さらに、フィールドの用途を認識して2値化パラメータを選択することにより、それぞれの用途に合わせた2値化処理が可能となる。これにより、表示フィールドであればより鮮明な表示が可能となり、認識フィールドであれば文字の認識率が向上する。
【0054】
次に、本発明に係る画像処理プログラムによってコンピュータが実行する画像処理について説明する。この画像処理プログラムをコンピュータに実行させることにより、コンピュータは、本発明の係る画像処理装置として機能する。
【0055】
図9は、本発明の実施の形態の画像処理を示したフローチャートである。
本発明に係る画像処理は、イメージスキャナ1による帳票の読み取り処理の後、処理が開始される。
[ステップS21] イメージスキャナの読み取った画像データを入力して信号処理し、信号処理された画像データから帳票IDを読み取る処理を行なう。
[ステップS22] 帳票IDに基づいて定義体情報を取得する処理を行なう。
[ステップS23] 取得された定義体情報に基づいて、フィールドごとのしきい値(および2値化パラメータ)を算出する処理を行なう。
[ステップS24] フィールドごとに算出されたしきい値(および2値化パラメータ)に切り替えて帳票の2値化処理を行なう。
【0056】
それぞれの処理について、順に説明する。
画像データ入力、帳票ID読み取り処理(ステップS21)について説明する。図10は、本発明の実施の形態の画像データ入力、帳票ID読み取り処理の処理手順を示したフローチャートである。イメージスキャナ1が、帳票を撮像した画像データを入力し、処理が開始される。
[ステップS211] イメージスキャナのCCD素子が取得した光学的な画像データをイメージスキャナより読み取る。
[ステップS212] イメージスキャナより読み取った画像データに対し、シェーディング補正(影補正)を施して、影を除去する。
[ステップS213] 画像データ信号をR、G、Bに分割し、輝度成分Y信号を生成する。
[ステップS214] 輝度成分Y信号を用いて、帳票の帳票IDの画像データを切り出し、2値化を施す。
[ステップS215] 2値化が施された帳票IDの画像データを文字認識(OCR認識)して、帳票IDを取得する。
【0057】
以上の処理手順により、画像データと、帳票IDとが得られる。
次に、定義体情報取得処理(ステップS22)について説明する。図11は、本発明の実施の形態の定義体情報取得処理の処理手順を示したフローチャートである。帳票IDが取得された後、処理が開始される。
[ステップS221] 帳票IDの認識結果を取得し、取得された帳票IDに基づいて、帳票レコード情報記憶部を検索し、該当する帳票の帳票レコード(定義体)を取り出す。
[ステップS222] 2値化のための2値化レコード情報を作成する。
[ステップS223] ステップS221によって取り出された帳票レコードを2値化レコード情報の該当する欄にコピーする。コピーにより、フィールドの範囲を示す座標、フィールドの幅および高さと、フィールドの用途が認識フィールド、表示フィールド、印鑑フィールドのどれに該当するかを示す情報が2値化レコード情報ファイルに設定される。
【0058】
以上の処理手順により、2値化レコード情報ファイルに、フィールドの範囲に関する情報とフィールドの用途に関する情報が設定される。
次に、しきい値算出処理(ステップS23)について説明する。図12は、本発明の実施の形態のしきい値算出処理の処理手順を示したフローチャートである。2値化レコード情報ファイルに、フィールドの範囲情報(座標、幅、高さ)と用途情報(認識、表示、印鑑)とが設定された後、処理が開始される。
[ステップS231] 2値化レコード情報ファイルのフィールドの範囲情報(座標、フィールドの幅と高さ)を参照して、フィールドの画像データ(イメージ)を切り出す。
[ステップS232] 切り出した画像データ(イメージ)のヒストグラム情報を作成し、ヒストグラム情報に基づいてしきい値を求める。
[ステップS233] 算出されたしきい値を2値化レコード情報に反映する。対象のフィールドに対応する2値化しきい値の欄に算出されたしきい値を登録する。
[ステップS234] 2値化レコード情報ファイルのフィールド用途に応じて2値化パラメータを選択し、2値化レコード情報ファイルの該当する欄に設定する。フィールド用途が複数の場合は、それぞれの用途に対応する2値化パラメータを選択し、設定する。
[ステップS235] 2値化レコード情報ファイルに次フィールドの情報があるかどうかを判定し、フィールドがない場合は処理を終了する。次のフィールドが存在する場合は、ステップS231に戻って、次のフィールドについての処理を繰り返す。
【0059】
以上の処理により、2値化レコード情報ファイルに、各フィールドに対応する2値化しきい値と、2値化パラメータとが算出され、設定される。
次に、2値化処理(ステップS24)について説明する。図13は、本発明の実施の形態の2値化処理の処理手順を示したフローチャートである。2値化レコード情報ファイルに、全フィールドのしきい値と2値化パラメータとが設定された後、処理が開始される。
[ステップS241] 2値化処理を行なう座標を示すイメージポインタを帳票の左上に設定する。2値化処理は、イメージポインタに従って帳票を走査し、順に実行される。
[ステップS242] 2値化レコード情報ファイルのフィールド範囲情報とイメージポインタとを比較し、イメージポインタの指示する箇所が認識/表示フィールドであるかどうかが判定される。なお、認識フィールドと表示フィールドとを兼ねたものを認識/表示フィールドとする。認識/表示フィールドでない場合、処理をステップS244へ進める。
[ステップS243] イメージポインタの指示が認識/表示フィールドの場合、このフィールドに対応する2値化レコード情報ファイルを指示し、認識/表示フィールドを指定して指定フィールド2値化処理を実行する。2値化処理実行後、処理をステップS251へ進める。
[ステップS244] 認識/表示フィールドでない場合、イメージポインタの指示する箇所が認識フィールドであるかどうかが判定される。認識フィールドにある場合、処理をステップS246へ進める。
[ステップS245] イメージポインタの指示が認識フィールドの場合、このフィールドに対応する2値化レコード情報ファイルを指示し、認識フィールドを指定して指定フィールド2値化処理を実行する。2値化処理実行後、処理をステップS251へ進める。
[ステップS246] 認識フィールドでない場合、イメージポインタの指示する箇所が表示フィールドであるかどうかが判定される。表示フィールドでない場合、処理をステップS248へ進める。
[ステップS247] イメージポインタの指示が表示フィールドの場合、このフィールドに対応する2値化レコード情報ファイルを指示し、表示フィールドを指定して指定フィールド2値化処理を実行する。2値化処理実行後、処理をステップS251へ進める。
[ステップS248] 表示フィールドでない場合、イメージポインタの指示する箇所が印鑑フィールドであるかどうかが判定される。印鑑フィールドにない場合、処理をステップS250へ進める。
[ステップS249] イメージポインタの指示が印鑑フィールドの場合、このフィールドに対応する2値化レコード情報ファイルを指示し、印鑑フィールドを指定して指定フィールド2値化処理を実行する。2値化処理実行後、処理をステップS251へ進める。
[ステップS250] 2値化レコード情報に指定されたフィールドでない場合、帳票全体のしきい値にて2値化処理を行なう。
[ステップS251] イメージポインタを移動する。フィールドの処理が終了した場合は、イメージポインタはフィールドの最終端に移動する。例えば、左上から水平方向に順次スキャンをしていた場合、イメージポインタは、フィールドの左上から右上に移動する。
[ステップS252] イメージポインタの指示する箇所が、画像データ(イメージ)の終わりであるかどうかを判定する。画像データの最終地点であれば、処理を終了する。最終地点でなければ処理をステップS242に戻って処理を行なう。
【0060】
ここで、指定フィールドの2値化処理について説明する。
図14は、本発明の実施の形態の指定フィールド2値化処理の処理手順を示したフローチャートである。フィールドに対応する2値化情報ファイルが指示され、処理が開始される。
[ステップS261] 対応する2値化レコード情報からしきい値を取得する。
[ステップS262] 対応する2値化レコード情報から2値化パラメータを取得する。
[ステップS263] 取得したしきい値と2値化パラメータを設定する。
[ステップS264] 設定されたしきい値と2値化パラメータを用いて、指定されたフィールドの2値化処理を行なう。
[ステップS265] 指定フィールドが認識/表示フィールドであるかどうかを判定する。認識/表示フィールドでない場合、処理を終了する。
[ステップS266] 指定フィールドが認識/表示フィールドである場合、2値化パラメータは2種類あるので、全ての2値化パラメータを用いた処理が終了したかを判定する。全パラメータが終わっていた場合、処理を終了する。全パラメータが終わっていない場合、ステップS263に戻って、他の2値化パラメータを用いて2値化処理を行なう手順を繰り返す。
【0061】
以上のように、本発明の画像処理方法によれば、フィールドごとに最適なしきい値および2値化パラメータが設定され、このしきい値と2値化パラメータに基づいてフィールドごとに2値化処理が実行されるため、情報の欠落を最小限にすることが可能となる。
【0062】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、画像処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto−Optical disk)などがある。
【0063】
プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0064】
プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0065】
(付記1) 光学的に読み取られた帳票の画像情報を所定のしきい値を用いて2値化する画像処理を行なう画像処理装置において、
前記画像情報から前記帳票を識別するための帳票識別情報を読み取る識別情報読み取り手段と、
前記帳票を構成する項目ごとに定義される前記帳票における前記項目の位置、範囲を含む定義体情報を記憶する定義体情報記憶手段と、
前記帳票識別情報に基づいて前記定義体情報記憶手段を検索し、前記帳票に対応する前記定義体情報を抽出する定義体情報検索手段と、
前記定義体情報に基づいて、前記項目ごとに定義される項目領域の画像情報の濃度レベルに応じたしきい値を選定するしきい値選定手段と、
前記項目ごとに、前記しきい値を用いて前記項目領域の画像情報の2値化処理を行なう2値化手段と、
を具備することを特徴とする画像処理装置。
【0066】
(付記2) 前記しきい値選定手段は、さらに、
前記定義体情報から前記項目の用途を抽出し、前記用途に応じて規定される前記2値化処理を調整する2値化パラメータを選定することを特徴とする付記1記載の画像処理装置。
【0067】
(付記3) 前記項目領域は、前記用途に応じて、
前記項目領域の画像情報を表示に用いるための表示用フィールドと、
前記項目領域の画像情報の文字認識を行なうための認識フィールドと、
に分類されることを特徴とする付記2記載の画像処理装置。
【0068】
(付記4) 前記しきい値選定手段は、前記項目が複数の用途に用いられる場合、前記用途ごとに前記2値化パラメータを選定することを特徴とする付記2記載の画像処理装置。
【0069】
(付記5) 前記2値化手段は、前記項目に前記用途に応じて複数の前記2値化パラメータが選定された場合、前記2値化パラメータごとに、前記2値化パラメータと前記しきい値を用いて前記項目領域の画像情報の2値化処理を行なうことを特徴とする付記2記載の画像処理装置。
【0070】
(付記6) 前記しきい値選定手段は、前記定義体情報によって規定される前記項目領域の画像情報のヒストグラム情報を作成し、前記ヒストグラム情報に基づいて前記しきい値を選定することを特徴とする付記1記載の画像処理装置。
【0071】
(付記7) 光学的に読み取られた帳票の画像情報を所定のしきい値で2値化する画像処理のための画像処理プログラムにおいて、
コンピュータに、
前記帳票を構成する項目ごとに定義される前記帳票における前記項目の位置、範囲を含む定義体情報を所定の記憶手段に格納するステップと、
前記画像情報から前記帳票を識別するための帳票識別情報を読み取るステップと、
前記帳票識別情報に基づいて、前記定義体情報が格納された前記所定の記憶手段を検索し、前記帳票に対応する前記定義体情報を抽出するステップと、
前記定義体情報に基づいて前記項目ごとに定義される項目領域の画像情報の濃度レベルに応じたしきい値を選定するステップと、
前記項目ごとに、前記しきい値を用いて前記項目領域の画像情報の2値化処理を行なうステップと、
を実行させることを特徴とする画像処理プログラム。
【0072】
(付記8) 光学的に読み取られた帳票の画像情報を所定のしきい値で2値化する画像処理方法において、
前記帳票を構成する項目ごとに定義される前記帳票における前記項目の位置、範囲を含む定義体情報を所定の記憶手段に格納するステップと、
前記画像情報から前記帳票を識別するための帳票識別情報を読み取るステップと、
前記帳票識別情報に基づいて、前記定義体情報が格納された前記所定の記憶手段を検索し、前記帳票に対応する前記定義体情報を抽出するステップと、
前記定義体情報に基づいて前記項目ごとに定義される項目領域の画像情報の濃度レベルに応じたしきい値を選定するステップと、
前記項目ごとに、前記しきい値を用いて前記項目領域の画像情報の2値化処理を行なうステップと、
を具備することを特徴とする画像処理方法。
【0073】
【発明の効果】
以上説明したように本発明では、帳票を識別し、識別された情報に基づいて帳票を構成する項目について定義される定義体情報を取得する。そして、定義体情報に基づいて、項目ごとに最適化されたしきい値を選定し、しきい値を用いて該当する項目領域の画像情報に2値化処理を施す。
【0074】
このように、項目ごとに最適化されたしきい値を用いて2値化処理が行なわれるため、情報の欠落を最小限にすることができる。この結果、項目が文字認識領域であれば、文字認識の精度を向上させることができる。
【0075】
さらに、定義体情報に基づいて、項目の用途に応じて規定される2値化パラメータを選定し、2値化パラメータを用いて2値化処理を行なうことにより、情報の欠落をさらに少なくすることが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態に適用される発明の概念図である。
【図2】本発明の実施の形態である画像読み取り装置とイメージスキャナのハードウェア構成図である。
【図3】本発明の実施の形態の画像処理装置で読み取り処理を行なう帳票を示した図である。
【図4】本発明の実施の形態の画像処理装置における帳票レコード取得の処理手順を示した図である。
【図5】本発明の実施の形態の2値化レコード情報ファイルの構成図である。
【図6】本発明の実施の形態の画像処理装置における画像データ切り出しの処理手順を示した図である。
【図7】本発明の実施の形態の画像処理装置におけるしきい値算出の処理手順を示した図である。
【図8】本発明の実施の形態の画像処理装置における2値化の処理手順を示した図である。
【図9】本発明の実施の形態の画像処理を示したフローチャートである。
【図10】本発明の実施の形態の画像データ入力、帳票ID読み取り処理の処理手順を示したフローチャートである。
【図11】本発明の実施の形態の定義体情報取得処理の処理手順を示したフローチャートである。
【図12】本発明の実施の形態のしきい値算出処理の処理手順を示したフローチャートである。
【図13】本発明の実施の形態の2値化処理の処理手順を示したフローチャートである。
【図14】本発明の実施の形態の指定フィールド2値化処理の処理手順を示したフローチャートである。
【図15】帳票の一例を示す図である。
【符号の説明】
1 イメージスキャナ
2 画像処理装置
3 識別情報読み取り手段
4 定義体情報記憶部
5 定義体情報検索手段
6 2値化情報記憶部
7 しきい値選定手段
8 2値化処理手段
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an image processing apparatus and an image processing program, and more particularly to an image processing apparatus and an image processing program for performing image processing for binarizing image information of a form optically read using a predetermined threshold value.
[0002]
[Prior art]
Conventionally, in order to improve the efficiency of form reading operations, form reading devices that read optical image information of a form placed on a table and process the image information to perform character recognition etc. have been provided to financial institutions, etc. Has been introduced.
[0003]
The form reading device includes a non-contact image scanner that captures a two-dimensional area including a form to obtain an entire image (image information), and an image processing device that performs image processing of the image information.
[0004]
The operation of the form reading device will be described. FIG. 15 is a diagram illustrating an example of a form. The figure is an example of a form (slip) used in a bank. The form 90 in the example of the figure includes guide letters 91 indicating a plurality of items such as “bank name”, “branch name”, “payee”, “client”, “account number”, “amount”, and the like. A frame 92 for entering data corresponding to the item and a seal column 93 for pressing a seal are printed in advance. For example, the customer fills in the corresponding numbers and characters in each frame 92 of the form 90 and seals the seal column 93. The entire image (image information) of the form 90 placed on the table by the operator is read by a non-contact type image scanner and transferred to the image processing apparatus.
[0005]
The image processing device binarizes the acquired image information using a predetermined threshold to generate image data (display data) of the entire form for display, and performs character recognition of the data in each frame 92. Do. The threshold value used for binarization is dynamically selected for each form according to the density level of the acquired image information of the entire form (for example, see Non-Patent Document 1).
[0006]
[Non-patent document 1]
Nobuyuki Otsu, "Automatic Threshold Selection Method Based on Discrimination and Least Square Criterion", IEICE Transactions, J63-D, vol. 4, 1980, p. 349-356
[0007]
[Problems to be solved by the invention]
However, in the conventional image processing apparatus, since the threshold value is selected from the density level of the entire form, there is a problem that the selected threshold value may not be suitable for a target location.
[0008]
As described above, when binarizing image information, a threshold value is selected from the density level of the entire form, but the form includes guide characters 91 and a frame 92 printed in advance, and the like. Information data having different density levels, such as handwritten characters such as numbers and characters entered in the frame 92, are mixed. For this reason, the threshold value suitable for the handwritten characters to be originally output is not affected by the density level of the guide character 91, the black print frame, or the dropout color removed at the time of character recognition in the form. Case occurs. If the threshold value does not match the density level of the handwritten character, for example, a thin portion of the character is not output during binarization, and the character after binarization is blurred, and character recognition is difficult. Problem arises. Further, in generating an image for display, a problem that a part to be converted into information such as a guide character may be lost may occur.
[0009]
In general, when binarizing areas for different uses, such as a recognition area for character recognition, a display area for display, and a seal area for acquiring seal information, binarization processing is performed in accordance with each area. It is desirable to make a fine adjustment of. However, conventionally, since uniform processing has been performed as a whole, adjustment according to the characteristics of each region has not been performed.
[0010]
As described above, by automatically selecting the threshold value based on the density level of the entire form, the threshold value is determined by the color composition of the form (headings and guide characters) and the ratio of the black form to the entire form. There was a problem that would be done. Also, it has been difficult to finely adjust the binarization processing according to the purpose of character recognition or display. As described above, the binarization parameters referred to at the time of binarization including the threshold value are not optimized for each area, and as a result, there arises a problem that handwritten characters are blurred or display information is lost. Was.
[0011]
The present invention has been made in view of such a point, and an object of the present invention is to provide an image processing apparatus and an image processing program capable of selecting a binarization parameter suitable for a target portion.
[0012]
[Means for Solving the Problems]
In the present invention, an image processing apparatus as shown in FIG. 1 is provided in order to solve the above problems. An image processing apparatus 2 according to the present invention is connected to an image scanner 1 that reads optical image information of a form, and performs image processing of image data generated by the image scanner 1.
[0013]
In the form to be read, in addition to the form identification information for identifying the form, each item information is described at a predetermined position. Definition body information that defines the position and range of each item is stored in the definition body information storage unit 4 for each form.
[0014]
In the image processing apparatus 2, when image data of a form read by the image scanner 1 is input, the identification information reading means 3 reads form identification information for identifying the form from the image data of the form. The definition body information search unit 5 searches the definition body information storage unit 4 based on the form identification information acquired by the identification information reading unit 3, and extracts the definition body information of the corresponding form. The extracted definition body information is transmitted to the threshold value selecting unit 7 by being stored in the binarized information storage unit 6 or the like. The threshold value selecting unit 7 extracts image data of the item area for each item based on the obtained definition body information, and selects a threshold value according to the density level of the image data of the item area. The binarization processing means 8 binarizes the item area for each item using a threshold value set for each item area, and generates binarized data.
[0015]
As described above, in the image processing apparatus 2 according to the present invention, the optimum threshold value is selected for each item based on the definition body information, and the binarization process is performed for each item region using the threshold value. Image data is output.
[0016]
Further, in order to solve the above-described problem, the computer stores, in a predetermined storage unit, definition body information including a position and a range of the item in the form defined for each item configuring the form in a predetermined storage unit, Reading form identification information for identifying the form, searching predetermined storage means storing the definition form information based on the form identification information, and extracting definition form information corresponding to the form; Selecting a threshold value according to the density level of the image information of the item area defined for each item based on body information; and, for each item, the image information of the item area using the threshold value. And v. Performing a value conversion process.
[0017]
By causing the computer to execute such an image processing program, the computer functions as the image processing device 2. The computer stores definition body information defining each item constituting the form in the definition body information storage unit 4, and when image data read by the image scanner 1 is input, a form for identifying the form from the image data. The identification information is read, and the definition body information of the corresponding form is extracted based on the form identification information. Then, a threshold value for binarization is selected based on the definition body information extracted for each item, and the image data of each item region is subjected to a binarization process using the selected threshold value.
[0018]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, the concept of the invention applied to the embodiments will be described, and then the specific contents of the embodiments will be described.
[0019]
FIG. 1 is a conceptual diagram of the invention applied to the embodiment of the present invention.
An image processing apparatus 2 according to the present invention is connected to an image scanner 1 for reading optical image information of a form and outputting the image data, and includes identification information reading means 3 for reading form identification information from the image data; A definition body information storage unit 4 for storing the definition body information defining each item, a definition body information search unit 5 for searching for the corresponding definition body information based on the form identification information, and binarization including the definition body information Binarization information storage unit 6 for storing binarization information, threshold selection means 7 for selecting a threshold for binarization, and each item area based on the threshold and the binarization information And a binarization processing means 8 for performing the binarization processing.
[0020]
The image scanner 1 reads optical image information of a form placed on a table, generates image data thereof, and delivers the image data to the image processing apparatus 2.
The identification information reading means 3 reads form identification information for identifying the form, which is recorded at a predetermined position on the form, from the image data read by the image scanner 1. The read form identification information is sent to the definition body information search means 5.
[0021]
The definition body information storage unit 4 stores definition body information that defines each item constituting a form to be processed by the image processing apparatus 2. The definition body information includes, for example, coordinates indicating the position of each item constituting the form, a range such as a width and a height of an area, a use purpose of each item (for display / character recognition, and the like), and a type of a written character. Definitions such as (handwriting / printing / printing / printing) are informationized. The definition body information is prepared for each form.
[0022]
The definition body information search means 5 searches the definition body information stored in the definition body information storage section 4 using the form identification information read by the identification information reading means 3 and extracts the definition body information of the corresponding form. . The extracted definition body information of the target form is transferred to the threshold value selecting means 7 by storing it in the binarized information storage unit 6, for example.
[0023]
The binarization information storage unit 6 stores information necessary for executing binarization processing. The binarization information includes a threshold value used for the binarization processing and a binarization parameter for adjusting the binarization processing. The threshold value is a value selected for each area of each item according to the density level of the area. The binarization parameter is a parameter for adjusting the binarization processing according to a use such as display or character recognition. In addition, for example, the definition body information of the target form extracted by the definition body information searching means 5 is stored.
[0024]
The threshold value selecting means 7 sets a threshold value used in the binarization process and a binarization parameter based on the definition body information, and stores them in the binarization information storage unit 6. Is transferred to the binarization processing means 8. As the threshold value, for example, histogram information of image data of each item area defined by the definition information is created, and an optimal threshold value is selected based on the histogram information. Since a method of selecting a threshold from the histogram information is known, the description thereof is omitted here. The binarization parameter is selected based on the definition body information, depending on whether the use of the information in the item area is for display, for character recognition, or both. Is a parameter for The binarization parameter is, for example, a parameter for adjusting the density of image data at the time of the binarization processing, and this value is defined according to the application. Therefore, when data of a certain item is used for two kinds of uses for display and recognition, two kinds of binarization parameters are prepared for each use.
[0025]
The binarization processing unit 8 performs a binarization process on the image data of the item area using the threshold value and the binarization parameter selected by the threshold value selection unit 7. When a plurality of binarization parameters are set by the threshold value selecting means 7, the binarization processing is performed using the respective binarization parameters.
[0026]
The operation of the image processing apparatus having such a configuration will be described.
The definition body information storage unit 4 stores, in advance, definition body information that defines the position, range, use, and the like of the items constituting the form for the form to be processed.
[0027]
When image data of a predetermined form is input from the image scanner 1 to the image processing apparatus 2, the identification information reading means 3 reads the form identification information described at a predetermined position on the form, and searches for the definition body information. Send to 5. The definition body information searching means 5 searches the definition body information storage unit 4 based on the form identification information, extracts the definition body information corresponding to the target form, stores it in the binarized information storage unit 6, and Deliver to value selection means 7. The threshold value selecting means 7 extracts image data of the item area for each item of the form based on the definition body information, creates histogram information, and selects an optimum threshold value. Further, a binarization parameter is set based on the definition body information. The threshold value and the binarization parameter are stored in the binarization information storage unit 6 and passed to the binarization processing unit 8. The binarization processing unit 8 performs binarization processing of the image data of the item area for each item based on the binarization information stored in the binarization information storage unit 6. When a plurality of binarization parameters are set, the binarization processing is performed using the respective binarization parameters.
[0028]
Next, an embodiment to which the present invention is applied will be described. FIG. 2 is a hardware configuration diagram of the image reading device and the image scanner according to the embodiment of the present invention. The same components as those in FIG. 1 are denoted by the same reference numerals, and description thereof is omitted.
[0029]
The entire image processing apparatus is controlled by a CPU (Central Processing Unit) 12. The memory 13, the image memory 14, the auxiliary storage device 15, and the capture board 11 are connected to the CPU 12 via the bus 16.
[0030]
The capture board 11 is connected to the image scanner 1, captures image data read by the image scanner 1, and stores the image data in the image memory 14. The memory 13 temporarily stores at least a part of a program executed by the CPU 12 and various data necessary for processing by the CPU 12. The image memory 14 stores image data input via the capture board 11. The auxiliary storage device 15 stores an OS (Operating System) and application programs.
[0031]
With the above hardware configuration, the processing functions of the embodiment can be realized.
Hereinafter, the embodiment will be described with reference to a form used in a bank as an example. FIG. 3 is a diagram illustrating a form on which a reading process is performed by the image processing apparatus according to the embodiment of the present invention.
[0032]
The form 100 to be read in the embodiment includes a form ID 110 for identifying the form, a guide character string 120 indicating an item, a recognition field 130 for character recognition, a display field 140 for display data generation, And a seal field 150 on which the seal is stamped.
[0033]
The form ID 110 is a code for identifying a form printed at a predetermined position on the form, and is located at the upper left of the form 100 in the example of FIG. IDs are assigned such as “0101” for the deposit form and “0102” for the withdrawal form.
[0034]
The guide character string 120 is a character that is printed in advance to indicate the content of the item, and in the example of the figure, “bank name”, “branch name”, “recipient”, “address”, “client”, “Address”, “Account number”, and “Amount” are printed.
[0035]
The recognition field 130 is a field in which a character string entered by a customer with handwritten characters with reference to the guide character string 120 is set, and is a target of character recognition. In the example of the figure, a field in which characters corresponding to “bank name”, “branch name”, “payee”, “client”, “account number”, and “amount” are entered is the recognition field 130.
[0036]
The display field 140 is a field for generating image data to be displayed on the display screen for the purpose of confirmation by the operator. In the example of the figure, the guide character string 120 and the entry character of the "address" of the recipient, the "address" of the client, the "account number", and the guide character string 120 and the entry character of the "amount" are displayed in the display field 140. included.
[0037]
The seal field 150 is a field where the seal is pressed.
The processing procedure executed by the image processing apparatus according to the present invention for such a form 100 will be sequentially described.
[0038]
Image data of the form 100 read by the image scanner 1 is input to the image processing apparatus, and a form record acquisition process as definition information is started.
FIG. 4 is a diagram showing a processing procedure for obtaining a form record in the image processing apparatus according to the embodiment of the present invention. The same components as those in FIG. 3 are denoted by the same reference numerals, and description thereof is omitted.
[0039]
When the image data of the form 100 is input, a recognition process of a form ID 110 which is information for identifying the form is performed (step S1). In the recognition process of the form ID 110, the image data of the form ID 110 printed at a predetermined position is extracted, binarized, and then subjected to character recognition to read the form ID.
[0040]
Subsequently, using the form ID obtained in the form ID recognition process (step S1), a process of acquiring a form record as definition body information of the form is performed (step S2). In the form record acquisition process, a form record (definition body information) stored in the form record storage unit 41 is searched using the form ID as a key, and a corresponding form record is extracted. The information of the extracted form record is transferred to the binarized record information file 200.
[0041]
Here, the binarized record information file 200 will be described. FIG. 5 is a configuration diagram of the binarized record information file according to the embodiment of this invention.
The binarized record information file 200 includes, for each item (field name), an information item relating to a range of a field of coordinates 201, a field width 202, and a field height 203 of the item area (hereinafter, referred to as a field) on a form. And information items indicating the use of the fields of the recognition field 204, the display field 205, and the seal field 206 are extracted from the form record and transcribed. Further, the binarized record information file 200 includes information items of a binarization threshold 207 and a binarization parameter 208 for binarization generated in a process described later.
[0042]
In the example of FIG. 3, each of the recognition field 130, the display field 140, and the seal field 150 is rectangular. The range of the field is specified by the coordinates of one point of the rectangle (two-dimensional with X in the horizontal direction and Y in the vertical direction) and the field width in the horizontal direction and the field height in the vertical direction based on these coordinates. These values are described in portions corresponding to each field of the coordinate 201 column, the field width 202 column, and the field height 203 column. In the example of the figure, the fields are classified into any of the recognition field 130 for character recognition, the display field 140 for display, and the seal field 150 for seal. In the recognition field 204 column, display field 205 column, and seal field 206 column provided corresponding to each field, a mark (○) is set when applicable.
[0043]
For example, the field "bank name" exists in a range of 750 dots wide and 75 dots high from the position of the coordinates (X = 200, Y = 180). The usage is a recognition field. In some cases, the field may serve as both a recognition field and a display field. In the example shown in the figure, the fields of “account number” and “money” are recognition / display fields for recognition and display. The column 204 and the display field column 205 are marked.
[0044]
With the above processing procedure, the form record information of the target form is set as the binarized record information, and the image data cutout processing of the field is started based on the binarized record information. FIG. 6 is a diagram illustrating a processing procedure for extracting image data in the image processing apparatus according to the embodiment of the present invention. 3 and 5 are denoted by the same reference numerals, and description thereof is omitted.
[0045]
After the form record information is set in the binarized record information file 200, the image data of the form 100 is obtained by referring to the cutout information of the coordinates 201, the field width 202 and the field height 203 for specifying the field range on the form. The image data in the field range is cut out (step S3). The extracted image data is stored in the work image memory 300.
[0046]
In the example of the figure, cutout information (coordinates, field width, field height) corresponding to the field of “bank name” is extracted from the binarized record information, and the image of the “bank name” field is extracted based on the cutout information. The data, “Fujitsu Ginkgo”, is cut out to the work image memory 300.
[0047]
Next, a threshold value of the field is calculated from the extracted image data. FIG. 7 is a diagram illustrating a processing procedure for calculating a threshold value in the image processing apparatus according to the embodiment of the present invention.
[0048]
In the threshold value calculation processing, first, histogram information representing the distribution of the density levels of the cut-out image data read out to the work image memory 300 is generated (step S4). Next, referring to the information in the recognition field 204, the display field 205, and the seal field 206 representing the field usage of the binarized record information file 200, the usage of the field is determined (step S5). Next, the histogram information created in step S4 is automatically determined, and a threshold value is calculated (step S6). The calculated threshold value is registered in the binarization threshold value 207 column of the corresponding field of the binarization record information file 200. Further, based on the field information determination in step S5, a binarization parameter registered in advance according to the use of the field is selected (step S7). The binarization parameters are set in advance for each application and stored in the memory. In step S7, the corresponding binarized parameter value is read based on the field usage, and registered in the binarized parameter value 208 column of the corresponding field of the binarized record information file 200.
[0049]
In the example of the figure, the threshold value 155 calculated from the image data corresponding to the “bank name” field is set to the binarized threshold value 207 corresponding to the “bank name” field. Further, since there is a mark in the recognition field 204a corresponding to the "bank name" field, it is determined that this field is a recognition field, and the corresponding binarization parameter 0.99 corresponds to the corresponding binarization parameter 0.99. This is set in the column 208a. In the case where the field serves as both a recognition field and a display field, such as the “account number” field in the example of the figure, binarized parameter fields 209a and 209b corresponding to each field use are provided. A binarization parameter is selected and registered for each.
[0050]
By the above procedure, the threshold value and the binarization parameter for each field are calculated based on the form record, and stored in the binarization record information file.
Next, field binarization processing is performed based on the set binarized record information file. FIG. 8 is a diagram showing a binarization processing procedure in the image processing apparatus according to the embodiment of the present invention.
[0051]
In the binarization processing, the image data of the form is sequentially scanned using the coordinates, and the binarization processing is performed for each field.
The current coordinate being scanned is compared with the value in the coordinate 201 column of the binarized record information file 200 to detect a field (step S9). If a field is detected, the field usage is determined with reference to the recognition field 204 column, display field 205 column, and seal field 206 column of the binarized record information file 200 (step S10). Next, the binarization threshold and the binarization parameter of the corresponding field are read from the binarization threshold 207 column and the binarization parameter 208 column of the binarization record information file 200, and the binarization process is performed. A threshold and a binarization parameter are acquired (step S11). Then, a binarization process is performed using the obtained threshold value and the binarization parameter (step S12). As described above, when the field is detected, the threshold value and the binarization parameter are switched to the values set in accordance with the field, and the binarization process is performed.
[0052]
As described above, the image processing apparatus of the present invention calculates the threshold value of the limited area in the field based on the form record information, and performs the binarization processing of this field. The processing is performed by switching to the calculated threshold value. Further, the binarization parameter is switched according to the use of the field.
[0053]
As described above, since the calculation is performed in a limited area in the field, the threshold value can be obtained without being affected by the ratio of the form color / guide character / black printing. Since the binarization of the field is performed by switching to the threshold value calculated in this way, loss of information in the field can be minimized. Further, by recognizing the use of the field and selecting a binarization parameter, it is possible to perform a binarization process according to each use. As a result, clearer display is possible in the case of a display field, and the recognition rate of characters is improved in the case of a recognition field.
[0054]
Next, image processing executed by a computer using the image processing program according to the present invention will be described. By causing the computer to execute the image processing program, the computer functions as the image processing device according to the present invention.
[0055]
FIG. 9 is a flowchart showing image processing according to the embodiment of the present invention.
The image processing according to the present invention starts after a form is read by the image scanner 1.
[Step S21] Image data read by the image scanner is input and signal-processed, and a process of reading a form ID from the signal-processed image data is performed.
[Step S22] A process of acquiring definition body information based on the form ID is performed.
[Step S23] Based on the acquired definition body information, a process of calculating a threshold value (and a binarization parameter) for each field is performed.
[Step S24] The form is binarized by switching to the threshold value (and binarization parameter) calculated for each field.
[0056]
Each process will be described in order.
The image data input and form ID reading processing (step S21) will be described. FIG. 10 is a flowchart showing a processing procedure of image data input and form ID reading processing according to the embodiment of the present invention. The image scanner 1 inputs image data obtained by capturing the form, and the processing is started.
[Step S211] Optical image data acquired by the CCD element of the image scanner is read by the image scanner.
[Step S212] Shading correction (shadow correction) is performed on image data read by the image scanner to remove shadows.
[Step S213] The image data signal is divided into R, G, and B, and a luminance component Y signal is generated.
[Step S214] Using the luminance component Y signal, the image data of the form ID of the form is cut out and binarized.
[Step S215] Image data of the binarized form ID is subjected to character recognition (OCR recognition), and a form ID is acquired.
[0057]
Through the above processing procedure, the image data and the form ID are obtained.
Next, the definition body information acquisition processing (step S22) will be described. FIG. 11 is a flowchart illustrating a processing procedure of the definition body information acquisition processing according to the embodiment of this invention. After the form ID is obtained, the process is started.
[Step S221] A form ID recognition result is acquired, and the form record information storage unit is searched based on the acquired form ID, and a form record (definition body) of the corresponding form is extracted.
[Step S222] Binarized record information for binarization is created.
[Step S223] The form record extracted in step S221 is copied to a corresponding column of the binarized record information. By the copy, the coordinates indicating the range of the field, the width and height of the field, and information indicating whether the use of the field corresponds to the recognition field, the display field, or the seal field are set in the binary record information file.
[0058]
According to the above processing procedure, information on the range of the field and information on the use of the field are set in the binarized record information file.
Next, the threshold value calculation processing (step S23) will be described. FIG. 12 is a flowchart illustrating a processing procedure of the threshold value calculation processing according to the embodiment of this invention. After the field range information (coordinates, width, height) and application information (recognition, display, and seal) are set in the binarized record information file, the process starts.
[Step S231] With reference to field range information (coordinates, field width and height) of the binarized record information file, image data (image) of the field is cut out.
[Step S232] Histogram information of the extracted image data (image) is created, and a threshold value is obtained based on the histogram information.
[Step S233] The calculated threshold is reflected in the binarized record information. The calculated threshold value is registered in the binarization threshold value column corresponding to the target field.
[Step S234] A binarization parameter is selected according to the field usage of the binarized record information file, and set in a corresponding column of the binarized record information file. When there are a plurality of field uses, a binarization parameter corresponding to each use is selected and set.
[Step S235] It is determined whether or not there is information on the next field in the binarized record information file. If there is no field, the process ends. If the next field exists, the process returns to step S231 to repeat the process for the next field.
[0059]
By the above processing, the binarization threshold value and the binarization parameter corresponding to each field are calculated and set in the binarization record information file.
Next, the binarization process (Step S24) will be described. FIG. 13 is a flowchart showing a processing procedure of the binarization processing according to the embodiment of the present invention. After the thresholds and the binarization parameters of all the fields are set in the binarization record information file, the process starts.
[Step S241] An image pointer indicating coordinates for performing the binarization process is set at the upper left of the form. The binarization process scans a form according to an image pointer and is sequentially executed.
[Step S242] The field range information of the binarized record information file is compared with the image pointer, and it is determined whether the location pointed to by the image pointer is a recognition / display field. A combination of the recognition field and the display field is referred to as a recognition / display field. If not, the process advances to step S244.
[Step S243] If the instruction of the image pointer is a recognition / display field, a binarized record information file corresponding to this field is specified, and the recognition / display field is specified and the designated field binarization processing is executed. After performing the binarization process, the process proceeds to step S251.
[Step S244] If it is not a recognition / display field, it is determined whether the location pointed to by the image pointer is a recognition field. If it is in the recognition field, the process proceeds to step S246.
[Step S245] If the instruction of the image pointer is a recognition field, a binarized record information file corresponding to this field is specified, a recognition field is specified, and a designated field binarization process is executed. After performing the binarization process, the process proceeds to step S251.
[Step S246] If it is not a recognition field, it is determined whether the location pointed to by the image pointer is a display field. If it is not a display field, the process proceeds to step S248.
[Step S247] If the indication of the image pointer is a display field, a binarized record information file corresponding to this field is indicated, a display field is designated, and a designated field binarization process is executed. After performing the binarization process, the process proceeds to step S251.
[Step S248] If it is not a display field, it is determined whether the location pointed to by the image pointer is a seal field. If not, the process advances to step S250.
[Step S249] If the instruction of the image pointer is a seal field, a binarized record information file corresponding to this field is specified, and the seal field is specified to execute the designated field binarization processing. After performing the binarization process, the process proceeds to step S251.
[Step S250] If the field is not the field specified in the binarized record information, the binarizing process is performed using the threshold value of the entire form.
[Step S251] The image pointer is moved. When the processing of the field is completed, the image pointer moves to the last end of the field. For example, when scanning is sequentially performed in the horizontal direction from the upper left, the image pointer moves from the upper left to the upper right of the field.
[Step S252] It is determined whether the location pointed to by the image pointer is the end of the image data (image). If it is the last point of the image data, the process ends. If it is not the last point, the process returns to step S242 to perform the process.
[0060]
Here, the binarization processing of the designated field will be described.
FIG. 14 is a flowchart illustrating a processing procedure of the designated field binarization processing according to the embodiment of this invention. The binarization information file corresponding to the field is specified, and the process starts.
[Step S261] A threshold value is obtained from the corresponding binarized record information.
[Step S262] A binarization parameter is obtained from the corresponding binarization record information.
[Step S263] The acquired threshold value and binarization parameter are set.
[Step S264] Binarization processing of the designated field is performed using the set threshold value and the binarization parameter.
[Step S265] It is determined whether the designated field is a recognition / display field. If it is not a recognition / display field, the process ends.
[Step S266] If the designated field is a recognition / display field, since there are two types of binarization parameters, it is determined whether or not processing using all binarization parameters has been completed. If all the parameters have been completed, the process ends. If all the parameters have not been completed, the process returns to step S263, and the procedure of performing the binarization process using another binarization parameter is repeated.
[0061]
As described above, according to the image processing method of the present invention, the optimum threshold value and the binarization parameter are set for each field, and the binarization processing is performed for each field based on the threshold value and the binarization parameter. Is performed, the loss of information can be minimized.
[0062]
Note that the above processing functions can be realized by a computer. In that case, a program is provided that describes the processing contents of the functions that the image processing apparatus should have. By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing content can be recorded on a computer-readable recording medium. Computer-readable recording media include magnetic recording devices, optical disks, magneto-optical recording media, and semiconductor memories. The magnetic recording device includes a hard disk device (HDD), a flexible disk (FD), a magnetic tape, and the like. Examples of the optical disc include a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only Memory), and a CD-R (Recordable) / RW (ReWritable). The magneto-optical recording medium includes an MO (Magneto-Optical disk) and the like.
[0063]
When distributing the program, for example, portable recording media such as DVDs and CD-ROMs on which the program is recorded are sold. Alternatively, the program may be stored in a storage device of a server computer, and the program may be transferred from the server computer to another computer via a network.
[0064]
The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. Further, the computer may execute the processing according to the received program each time the program is transferred from the server computer.
[0065]
(Supplementary Note 1) In an image processing apparatus that performs image processing for binarizing image information of a form optically read using a predetermined threshold value,
Identification information reading means for reading form identification information for identifying the form from the image information,
Definition body information storage means for storing definition body information including a position and a range of the item in the form defined for each item constituting the form,
A definition body information search unit that searches the definition body information storage unit based on the form identification information and extracts the definition body information corresponding to the form;
A threshold value selecting unit that selects a threshold value according to the density level of the image information of the item area defined for each item based on the definition body information;
Binarizing means for performing binarization processing of image information of the item area using the threshold value for each of the items;
An image processing apparatus comprising:
[0066]
(Supplementary Note 2) The threshold value selecting means further includes:
2. The image processing apparatus according to claim 1, wherein a use of the item is extracted from the definition body information, and a binarization parameter for adjusting the binarization process defined according to the use is selected.
[0067]
(Supplementary Note 3) The item area may be set according to the use.
A display field for using the image information of the item area for display,
A recognition field for performing character recognition of the image information of the item area;
3. The image processing apparatus according to claim 2, wherein the image processing apparatus is classified into:
[0068]
(Supplementary Note 4) The image processing apparatus according to Supplementary Note 2, wherein the threshold value selecting unit selects the binarization parameter for each of the uses when the item is used for a plurality of uses.
[0069]
(Supplementary Note 5) When the plurality of binarization parameters are selected in accordance with the application for the item, the binarization unit includes, for each of the binarization parameters, the binarization parameter and the threshold value. 3. The image processing apparatus according to claim 2, wherein a binarization process of the image information of the item area is performed using the image data.
[0070]
(Supplementary Note 6) The threshold value selecting unit creates histogram information of the image information of the item area defined by the definition body information, and selects the threshold value based on the histogram information. 2. The image processing apparatus according to claim 1, wherein
[0071]
(Supplementary Note 7) In an image processing program for image processing for binarizing image information of a form read optically with a predetermined threshold value,
On the computer,
Storing in a predetermined storage means definition body information including a position and a range of the item in the form defined for each item constituting the form;
Reading form identification information for identifying the form from the image information,
Based on the form identification information, searching the predetermined storage means in which the definition body information is stored, extracting the definition body information corresponding to the form,
Selecting a threshold value according to the density level of the image information of the item area defined for each item based on the definition body information;
Performing binarization processing of image information of the item area using the threshold value for each of the items;
An image processing program characterized by executing
[0072]
(Supplementary Note 8) In an image processing method for binarizing image information of a form read optically with a predetermined threshold value,
Storing in a predetermined storage means definition body information including a position and a range of the item in the form defined for each item constituting the form;
Reading form identification information for identifying the form from the image information,
Based on the form identification information, searching the predetermined storage means in which the definition body information is stored, extracting the definition body information corresponding to the form,
Selecting a threshold value according to the density level of the image information of the item area defined for each item based on the definition body information;
Performing binarization processing of image information of the item area using the threshold value for each of the items;
An image processing method comprising:
[0073]
【The invention's effect】
As described above, in the present invention, a form is identified, and based on the identified information, definition body information that is defined for the items constituting the form is obtained. Then, a threshold value optimized for each item is selected based on the definition body information, and binarization processing is performed on the image information of the corresponding item region using the threshold value.
[0074]
As described above, since the binarization process is performed using the threshold value optimized for each item, loss of information can be minimized. As a result, if the item is a character recognition area, the accuracy of character recognition can be improved.
[0075]
Further, by selecting a binarization parameter defined in accordance with the use of the item based on the definition body information and performing binarization processing using the binarization parameter, the loss of information is further reduced. Becomes possible.
[Brief description of the drawings]
FIG. 1 is a conceptual diagram of the invention applied to an embodiment of the present invention.
FIG. 2 is a hardware configuration diagram of an image reading apparatus and an image scanner according to an embodiment of the present invention.
FIG. 3 is a diagram illustrating a form on which a reading process is performed by the image processing apparatus according to the embodiment of the present invention;
FIG. 4 is a diagram illustrating a processing procedure for acquiring a form record in the image processing apparatus according to the embodiment of the present invention.
FIG. 5 is a configuration diagram of a binarized record information file according to the embodiment of this invention.
FIG. 6 is a diagram illustrating a processing procedure for extracting image data in the image processing apparatus according to the embodiment of the present invention.
FIG. 7 is a diagram illustrating a processing procedure for calculating a threshold value in the image processing apparatus according to the embodiment of the present invention.
FIG. 8 is a diagram illustrating a binarization processing procedure in the image processing apparatus according to the embodiment of the present invention.
FIG. 9 is a flowchart illustrating image processing according to the embodiment of the present invention.
FIG. 10 is a flowchart showing a processing procedure of image data input and form ID reading processing according to the embodiment of the present invention.
FIG. 11 is a flowchart illustrating a processing procedure of a definition body information acquisition processing according to the embodiment of this invention.
FIG. 12 is a flowchart showing a processing procedure of a threshold value calculation processing according to the embodiment of the present invention.
FIG. 13 is a flowchart showing a processing procedure of a binarization process according to the embodiment of the present invention.
FIG. 14 is a flowchart illustrating a processing procedure of a designated field binarization processing according to the embodiment of this invention.
FIG. 15 is a diagram illustrating an example of a form.
[Explanation of symbols]
1 Image scanner
2 Image processing device
3 identification information reading means
4 Definition body information storage
5 Definition body information search means
6 Binary information storage unit
7 Threshold value selection means
8 Binarization processing means

Claims (5)

光学的に読み取られた帳票の画像情報を所定のしきい値を用いて2値化する画像処理を行なう画像処理装置において、
前記画像情報から前記帳票を識別するための帳票識別情報を読み取る識別情報読み取り手段と、
前記帳票を構成する項目ごとに定義される前記帳票における前記項目の位置、範囲を含む定義体情報を記憶する定義体情報記憶手段と、
前記帳票識別情報に基づいて前記定義体情報記憶手段を検索し、前記帳票に対応する前記定義体情報を抽出する定義体情報検索手段と、
前記定義体情報に基づいて、前記項目ごとに定義される項目領域の画像情報の濃度レベルに応じたしきい値を選定するしきい値選定手段と、
前記項目ごとに、前記しきい値を用いて前記項目領域の画像情報の2値化処理を行なう2値化手段と、
を具備することを特徴とする画像処理装置。
An image processing apparatus for performing image processing for binarizing image information of a form optically read using a predetermined threshold value,
Identification information reading means for reading form identification information for identifying the form from the image information,
Definition body information storage means for storing definition body information including a position and a range of the item in the form defined for each item constituting the form,
A definition body information search unit that searches the definition body information storage unit based on the form identification information and extracts the definition body information corresponding to the form;
A threshold value selecting unit that selects a threshold value according to the density level of the image information of the item area defined for each item based on the definition body information;
Binarizing means for performing binarization processing of image information of the item area using the threshold value for each of the items;
An image processing apparatus comprising:
前記しきい値選定手段は、さらに、
前記定義体情報から前記項目の用途を抽出し、前記用途に応じて規定される前記2値化処理を調整する2値化パラメータを選定することを特徴とする請求項1記載の画像処理装置。
The threshold value selecting means further comprises:
2. The image processing apparatus according to claim 1, wherein a use of the item is extracted from the definition body information, and a binarization parameter for adjusting the binarization process defined according to the use is selected.
前記しきい値選定手段は、前記項目が複数の用途に用いられる場合、前記用途ごとに前記2値化パラメータを選定することを特徴とする請求項2記載の画像処理装置。The image processing apparatus according to claim 2, wherein when the item is used for a plurality of uses, the threshold value selecting unit selects the binarization parameter for each use. 前記2値化手段は、前記項目に前記用途に応じて複数の前記2値化パラメータが選定された場合、前記2値化パラメータごとに、前記2値化パラメータと前記しきい値を用いて前記項目領域の画像情報の2値化処理を行なうことを特徴とする請求項2記載の画像処理装置。The binarization unit, when a plurality of the binarization parameters are selected for the item according to the application, uses the binarization parameter and the threshold value for each of the binarization parameters. 3. The image processing apparatus according to claim 2, wherein the image information of the item area is binarized. 光学的に読み取られた帳票の画像情報を所定のしきい値で2値化する画像処理のための画像処理プログラムにおいて、
コンピュータに、
前記帳票を構成する項目ごとに定義される前記帳票における前記項目の位置、範囲を含む定義体情報を所定の記憶手段に格納するステップと、
前記画像情報から前記帳票を識別するための帳票識別情報を読み取るステップと、
前記帳票識別情報に基づいて、前記定義体情報が格納された前記所定の記憶手段を検索し、前記帳票に対応する前記定義体情報を抽出するステップと、
前記定義体情報に基づいて前記項目ごとに定義される項目領域の画像情報の濃度レベルに応じたしきい値を選定するステップと、
前記項目ごとに、前記しきい値を用いて前記項目領域の画像情報の2値化処理を行なうステップと、
を実行させることを特徴とする画像処理プログラム。
An image processing program for image processing for binarizing image information of a form optically read at a predetermined threshold value,
On the computer,
Storing in a predetermined storage means definition body information including a position and a range of the item in the form defined for each item constituting the form;
Reading form identification information for identifying the form from the image information,
Based on the form identification information, searching the predetermined storage means in which the definition body information is stored, extracting the definition body information corresponding to the form,
Selecting a threshold value according to the density level of the image information of the item area defined for each item based on the definition body information;
Performing binarization processing of image information of the item area using the threshold value for each of the items;
An image processing program characterized by executing
JP2003135219A 2003-05-14 2003-05-14 Image processor and image processing program Pending JP2004341656A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003135219A JP2004341656A (en) 2003-05-14 2003-05-14 Image processor and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003135219A JP2004341656A (en) 2003-05-14 2003-05-14 Image processor and image processing program

Publications (1)

Publication Number Publication Date
JP2004341656A true JP2004341656A (en) 2004-12-02

Family

ID=33525539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003135219A Pending JP2004341656A (en) 2003-05-14 2003-05-14 Image processor and image processing program

Country Status (1)

Country Link
JP (1) JP2004341656A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100430957C (en) * 2005-11-22 2008-11-05 富士施乐株式会社 Image processing device, image processing method, and storage medium storing image processing program
US7725056B2 (en) 2006-01-10 2010-05-25 Ricoh Co., Ltd. Triboelectric charging device and field assisted toner transporter
JP2019212950A (en) * 2018-05-31 2019-12-12 富士ゼロックス株式会社 Information processing unit and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100430957C (en) * 2005-11-22 2008-11-05 富士施乐株式会社 Image processing device, image processing method, and storage medium storing image processing program
US7725056B2 (en) 2006-01-10 2010-05-25 Ricoh Co., Ltd. Triboelectric charging device and field assisted toner transporter
JP2019212950A (en) * 2018-05-31 2019-12-12 富士ゼロックス株式会社 Information processing unit and program
JP7063121B2 (en) 2018-05-31 2022-05-09 富士フイルムビジネスイノベーション株式会社 Information processing equipment and programs

Similar Documents

Publication Publication Date Title
JP3904840B2 (en) Ruled line extraction device for extracting ruled lines from multi-valued images
JP4208918B2 (en) Method and apparatus for extracting text from document image, computer program and storage medium thereof
US6408105B1 (en) Method for detecting slope of image data utilizing hough-transform
US7298900B2 (en) Image processing method, image processing apparatus and image processing program
US20030161523A1 (en) MICR-based optical character recognition system and method
JP4100885B2 (en) Form recognition apparatus, method, program, and storage medium
US20090185752A1 (en) Method and apparatus for cropping images
JP3335009B2 (en) Image processing method and image processing apparatus
KR20090109047A (en) Image processor and image processing method and recording medium
JP3733310B2 (en) Document format identification device and identification method
JP2001043313A (en) Character segmenting method
JP6780271B2 (en) Image processing equipment and image processing program
JP2004341656A (en) Image processor and image processing program
JP5742367B2 (en) Image processing apparatus and image processing program
JP4063685B2 (en) Form reading apparatus and form reading method
JP2007066286A6 (en) Image search apparatus, image processing apparatus, and methods thereof
JPH10232926A (en) Image processor and its method
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JP2993007B2 (en) Image area identification device
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JPH08237404A (en) Selection of optical character recognition mode
US20220319218A1 (en) Image processing apparatus, image processing system, control method thereof, and storage medium
JPS5949671A (en) Optical character reader
JP4738645B2 (en) SHADED AREA DETECTING DEVICE, SHATTERED AREA DETECTING METHOD, PROGRAM, AND STORAGE MEDIUM
JP4930288B2 (en) Image processing apparatus and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090309

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090414