JP2012150691A - 記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム - Google Patents

記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム Download PDF

Info

Publication number
JP2012150691A
JP2012150691A JP2011009487A JP2011009487A JP2012150691A JP 2012150691 A JP2012150691 A JP 2012150691A JP 2011009487 A JP2011009487 A JP 2011009487A JP 2011009487 A JP2011009487 A JP 2011009487A JP 2012150691 A JP2012150691 A JP 2012150691A
Authority
JP
Japan
Prior art keywords
character
pixel
pixels
candidate
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011009487A
Other languages
English (en)
Inventor
Keiichiro Kadono
啓一郎 門野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2011009487A priority Critical patent/JP2012150691A/ja
Publication of JP2012150691A publication Critical patent/JP2012150691A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】CMC−7文字などの磁気インク文字を光学的に安定して認識できる記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラムを提供する。
【解決手段】記録媒体処理装置は、バーコードからなる磁気インク文字を光学的に検出する光学読取部(表面側コンタクトイメージスキャナー52)と、検出した文字パターンを所定の比較パターンと比較する光学文字認識部80とを備え、光学文字認識部80は、マトリクス状に配列された画素を、文字画素である可能性のある文字候補画素とそれ以外の背景画素とに区分し、列毎の文字候補画素の計数結果に基づいて、文字候補画素が文字画素であるか否か判定する。文字画素ではないと判定された文字候補画素をノイズとして除去した後に所定の比較パターンと比較する。この方法によれば、バーコード文字の特質を反映して、有効なノイズ処理を行うことができる。
【選択図】図3

Description

本発明は、記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラムに関する。
磁気インク文字認識(MICR:Magnetic Ink Character Recognition)は、磁性物質を含んだインクを用いて小切手などの記録媒体に記録された文字や記号を、磁気ヘッドなどで読み取る技術である。MICR文字のひとつのフォントであるCMC−7文字は、磁気バーコードでありながら文字として視認可能であり、磁気ヘッドによる読み取りに失敗した場合であっても、光学的に読み取ることが可能である。例えば、特許文献1には、このCMC−7文字を、光学文字認識(OCR:Optical Character Recognition)により認識する方法および装置が提案されている。
特開平5−250515号公報
しかしながら、特許文献1に記載の方法では、CMC−7文字の印刷が低品質な場合や、印刷部分に汚れ、かすれなどがある場合には、CMC−7文字の読み取りができないことや、誤認識してしまうことがある。そのため、何度も認識処理や読み取りを繰り返して実行する必要がある。つまりCMC−7文字を正確に認識するまでに時間がかかるという課題がある。
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の形態または適用例として実現することが可能である。
[適用例1]本適用例にかかる記録媒体処理装置は、間隔を有して互いに略平行に延在する複数のバーからなる磁気インク文字を含む画像を光学的に取得する光学読取部と、光学読取部で取得した画像に含まれる1文字相当毎の文字枠を検出し、文字枠内の検出文字パターンを所定の比較パターンと比較する光学文字認識部と、を備え、光学文字認識部は、文字枠内にバーの延在方向に沿った列とバーの延在方向と交差する方向に沿った行とで構成されるマトリクス状に配列された画素を、検出文字パターンの文字に対応する文字画素である可能性のある文字候補画素と文字候補画素以外の背景画素とに区分し、列毎に文字候補画素を計数した数に基づいて、列の文字候補画素が文字画素であるか否かの判定を行い、判定において文字画素であると判定された文字候補画素を文字画素とするとともに、文字画素ではないと判定された文字候補画素を背景画素に変換するノイズ除去処理を行い、ノイズ除去処理後の文字枠内に配列された画素を検出文字パターンとして所定の比較パターンと比較することを特徴とする。
本適用例によれば、バーコード文字の各バーを構成する画素列の文字候補画素を計数した結果に基づいて、列の文字候補画素が文字画素であるか否かの判定を行う。判定において文字画素であると判定された文字候補画素を文字画素とするとともに、文字画素ではないと判定された文字候補画素を背景画素に変換するノイズ除去処理を行う。そのため、バーコード文字の特質を反映して、より有効なノイズ処理を行うことができる。詳しくは、バーコードの隣り合う各バーの間隙部分の列には、本来文字画素が検出されることはなく、ゴミや汚れにより文字候補画素が検出された場合であっても、バーを構成する列部分の文字画素の数とは大きく異なる場合が多い。従って、画素列の文字候補画素を計数した数に基づいて、列の文字候補画素が文字画素であるか否かの判定を行うことにより、より有効なノイズ除去が可能となる。このノイズ除去処理を行った検出文字パターンと所定の比較パターンとを比較することで、CMC−7文字などの磁気インク文字の読み取りができないことや、誤認識してしまうことが軽減される。そのため、何度も認識処理や読み取りを繰り返して実行することが少なくなる。つまりCMC−7文字を正確に認識するまでの時間が短縮された記録媒体処理装置を提供することができる。
[適用例2]上記適用例にかかる記録媒体処理装置において、判定は、文字候補画素が連続して配置されていない場合であっても、ひとつの列を構成する画素の総数に対するひとつの列にある文字候補画素の数の割合が所定の閾値を越えている場合に、文字候補画素は文字画素であると判定し、ひとつの列にある文字候補画素の数の割合が所定の閾値以下である場合に、文字候補画素は文字画素ではないと判定することを特徴とする。
本適用例によれば、文字候補画素が連続して配置されていない場合であっても、ひとつの列を構成する画素の総数に対する文字候補画素の数の割合が所定の閾値を越えている場合には、文字候補画素は文字画素であると判定する。また、ひとつの列にある文字候補画素の数の割合が所定の閾値以下である場合にのみ、文字候補画素は文字画素ではないと判定する。従って、誤ってバーの情報を削除してしまうリスクが低減され、バーコード文字の特質を反映して、より有効なノイズ処理を行うことができる。詳しくは、CMC−7文字などの磁気インク文字の印刷品質が悪い場合や、かすれなどにより、本来ある程度の長さを有するバーが、短い長さに分断されて認識されてしまった場合などは、ゴミなどによるノイズとの識別が難しいことがある。これに対し、画素列の文字候補画素を計数した数が所定の割合を上回っている場合に、列の文字候補画素が文字画素であると判定することは、列全体に亘るバーの情報を含んで判定されることになり、誤ってノイズ情報と判断され除去されてしまうことが少なくなる。そのため、何度も認識処理や読み取りを繰り返して実行することが少なくなる。つまりCMC−7文字を正確に認識するまでの時間が短縮された記録媒体処理装置を提供することができる。
[適用例3]上記適用例にかかる記録媒体処理装置において、磁気インク文字は、CMC−7文字であることを特徴とする。
本適用例によれば、CMC−7文字の各バーを構成する画素列の文字候補画素を計数した結果に基づいて、列の文字候補画素が文字画素であるか否かの判定を行う。そのため、CMC−7文字の特質を反映して、より有効なノイズ処理を行うことができる。その結果、上記に記載の効果を有する記録媒体処理装置を提供することができる。
[適用例4]本適用例にかかる複合処理装置は、上記に記載の記録媒体処理装置を備えることを特徴とする。
本適用例によれば、複合処理装置として上記の記録媒体処理装置を用いることにより、複合処理装置としての優れた特性をより効果的なものとして提供することができる。
[適用例5]本適用例にかかる記録媒体処理装置の制御方法は、間隔を有して互いに略平行に延在する複数のバーからなる磁気インク文字を含む画像を光学的に取得するステップと、取得した画像に含まれる1文字相当毎の文字枠を検出するステップと、文字枠内にバーの延在方向に沿った列とバーの延在方向と交差する方向に沿った行とで構成されるマトリクス状に配列された画素を、検出文字パターンの文字に対応する文字画素である可能性のある文字候補画素と文字候補画素以外の背景画素とに区分するステップと、列毎に文字候補画素を計数した数に基づいて、列の文字候補画素が文字画素であるか否かの判定を行うステップと、判定において文字画素であると判定された文字候補画素を文字画素とするとともに、文字画素ではないと判定された文字候補画素を背景画素に変換するノイズ除去処理を行うステップと、ノイズ除去処理後の文字枠内に配列された画素を検出文字パターンとして所定の比較パターンと比較するステップと、を含むことを特徴とする。
本適用例によれば、バーコード文字の各バーを構成する画素列の文字候補画素を計数した結果に基づいて、列の文字候補画素が文字画素であるか否かの判定を行う。判定において文字画素であると判定された文字候補画素を文字画素とするとともに、文字画素ではないと判定された文字候補画素を背景画素に変換するノイズ除去処理を行う。そのため、バーコード文字の特質を反映して、より有効なノイズ処理を行うことができる。詳しくは、バーコードの隣り合う各バーの間隙部分の列には、本来文字画素が検出されることはなく、ゴミや汚れにより文字候補画素が検出された場合であっても、バーを構成する列部分の文字画素の数とは大きく異なる場合が多い。従って、画素列の文字候補画素を計数した数に基づいて、列の文字候補画素が文字画素であるか否かの判定を行うことにより、より有効なノイズ除去が可能となる。このノイズ除去処理を行った検出文字パターンと所定の比較パターンとを比較することで、CMC−7文字などの磁気インク文字の読み取りができないことや、誤認識してしまうことが軽減される。そのため、何度も認識処理や読み取りを繰り返して実行することが少なくなる。つまりCMC−7文字を正確に認識するまでの時間が短縮された記録媒体処理装置の制御方法を提供することができる。
[適用例6]上記適用例にかかる記録媒体処理装置の制御方法において、判定を行うステップは、文字候補画素が連続して配置されていない場合であっても、ひとつの列を構成する画素の総数に対する、ひとつの列にある文字候補画素の数の割合が所定の閾値を越えている場合に、文字候補画素は文字画素であると判定し、ひとつの列にある文字候補画素の数の割合が所定の閾値以下である場合に、文字候補画素は文字画素ではないと判定するステップからなることを特徴とする。
本適用例によれば、文字候補画素が連続して配置されていない場合であっても、ひとつの列を構成する画素の総数に対する文字候補画素の数の割合が所定の閾値を越えている場合には、文字候補画素は文字画素であると判定する。また、ひとつの列にある文字候補画素の数の割合が所定の閾値以下である場合にのみ、文字候補画素は文字画素ではないと判定する。従って、誤ってバーの情報を削除してしまうリスクが低減され、バーコード文字の特質を反映して、より有効なノイズ処理を行うことができる。詳しくは、CMC−7文字などの磁気インク文字の印刷品質が悪い場合や、かすれなどにより、本来ある程度の長さを有するバーが、短い長さに分断されて認識されてしまった場合などには、誤って、ノイズとして除去されてしまうことがある。これに対し、画素列の文字候補画素を計数した数が所定の割合を上回っている場合に、列の文字候補画素が文字画素であると判定することは、列全体に亘るバーの情報を含んで判定されることになり、誤ってバーの情報が除去されてしまうことが少なくなる。そのため、何度も認識処理や読み取りを繰り返して実行することが少なくなる。つまりCMC−7文字を正確に認識するまでの時間が短縮された記録媒体処理装置の制御方法を提供することができる。
[適用例7]上記適用例にかかる記録媒体処理装置の制御方法において、磁気インク文字は、CMC−7文字であることを特徴とする。
本適用例によれば、CMC−7文字の各バーを構成する画素列の文字候補画素を計数した結果に基づいて、列の文字候補画素が文字画素であるか否かの判定を行う。そのため、CMC−7文字の特質を反映して、より有効なノイズ処理を行うことができる。その結果、上記に記載の効果を有する記録媒体処理装置の制御方法を提供することができる。
[適用例8]本適用例にかかるプログラムは、上記に記載の記録媒体処理装置を機能させることを特徴とする。
本適用例によれば、上記に記載の制御方法を含み機能させるプログラムを用いることで、CMC−7文字などの磁気インク文字の読み取りができないことや、誤認識してしまうことが軽減される。そのため、何度も認識処理や読み取りを繰り返して実行することが少なくなる。つまりCMC−7文字を正確に認識するまでの時間が短縮された記録媒体処理装置を提供することができる。
実施形態1に係る小切手読取装置を示す外観斜視図。 実施形態1に係る小切手読取装置の内部構造を示す平面図。 実施形態1に係る小切手読取装置の制御系を示すブロック図。 実施形態1の光学文字認識部の動作を示すフローチャート。 2値化した文字列対応領域画像データの一例を示す模式図。 ラベリング処理における光学文字認識部の動作を示すフローチャート。 バンド幅検出処理における光学文字認識部の動作を示すフローチャート。 文字列対応領域画像データ上に確定文字枠を表示した様子を示す模式図。 生成された文字列画像データを示す模式図。 (a);CMC−7文字の一例を示す模式図。(b);検出された確定文字枠DMに取り込んだCMC−7文字「1」を示す概略図。 (a);確定文字枠DMに取り込んだノイズ情報を含むCMC−7文字「1」を示す概略図。(b);連続する黒画素が2個以下の部分をノイズとして消去した場合を示す概略図。 (a)、(b);実施形態1に係るノイズ除去処理を説明する概略図。 (a)、(b);閾値に対する消去対象の分布を表すグラフ。 (a);光学文字認識処理における光学文字認識部の動作を示すフローチャート。(b);実施形態1に係るノイズ除去処理における光学文字認識部の動作を示すフローチャート。
以下、本発明を具体化した実施形態について、図面を参照して説明する。なお、以下の各図においては、説明を分かりやすくするため、実際とは異なる尺度で記載している場合がある。
(実施形態1)
図1は、本実施形態の小切手読取装置1を示す外観斜視図である。
小切手読取装置1は、シート状の記録媒体である小切手4に対し、小切手4に記録された磁気インク文字(MICR文字)の読み取りや、小切手4の両面の画像の読み取り、小切手4に対する裏書きに係る所定の画像の記録等の処理を行う装置である。
小切手読取装置1は、本体ケース2と、この上側に被せた蓋ケース3とを備えており、この内部に各部品が組み込まれた構成となっている。
蓋ケース3には、上から見た場合にU形状をした細幅の垂直溝からなる小切手4の搬送路5が形成されており、この搬送路5の一方の端は広幅の垂直溝からなる小切手供給部6に連通しており、搬送路5の他方の端は左右に分岐して、それぞれ広幅の垂直溝からなる第1小切手排出部7および第2小切手排出部8に繋がっている。
小切手4の表面4aには、所定の模様が形成された背景に、金額、振出人、番号、サインなどが記載されており、その下端部分には、図1に示すように、長辺方向に延びる磁気インク文字列4Aが記録されている。磁気インク文字列4Aは、複数の磁気インク文字が横方向に並んで形成されている。
また、小切手4の裏面4bには、裏書き欄が形成されている。この裏書き欄には、裏書きに係る所定の画像が記録される。
小切手4は、上端4eが上方に位置し下端4fが下方に位置するように上下方向が揃えられ、かつ、表面4aがU形状の搬送路5の外側を向くように表裏が揃えられた状態(図1に示す状態)で、小切手供給部6に挿入される。小切手供給部6に挿入された小切手4は、後端4dを先頭として搬送路5に送り出される。
小切手供給部6から送り出された小切手4は、搬送路5に沿って搬送されながら、表面4aの画像である表面画像、および裏面4bの画像である裏面画像が読み取られ、さらに、表面4aに記録されている磁気インク文字列4Aが読み取られる。そして、磁気インク文字列4Aの読み取りが成功した小切手4については、裏書きに係る所定の画像の記録が行われた後に、第1小切手排出部7に排出される。一方、読み取りが失敗した小切手4については、裏書きに係る所定の画像が記録されることなく、第2小切手排出部8に排出される。第2小切手排出部8に排出された小切手4は、読み取りが失敗した原因の究明や、再読み取り等の処理が行われる。
図2は、小切手読取装置1の内部構造を示す平面図である。
小切手供給部6には、小切手4を搬送路5に送り出すための小切手送り出し機構10が配置されている。小切手送り出し機構10は、繰り出しローラー11、送り出しローラー12、この送り出しローラー12に押し付けられているリタードローラー13、送り出し用モーター14、および小切手押し付け用のホッパー15を備えている。搬送路5は上述したようにU形状をしており、小切手供給部6に繋がっている直線状の上流側搬送路部分21と、第1、第2小切手排出部7、8に繋がっており、僅かに折れ曲がった状態で延びている下流側搬送路部分23と、これらの間を繋ぐ湾曲搬送路部分22とを備えている。
送り出し用モーター14が駆動すると、小切手供給部6に入れた小切手4がホッパー15によって繰り出しローラー11の側に押し付けられ、この状態で、繰り出しローラー11および送り出しローラー12が同期回転する。
繰り出しローラー11によって小切手4は送り出しローラー12とリタードローラー13の間に送り込まれる。リタードローラー13には所定の回転負荷が与えられており、送り出しローラー12に直接に接触している一枚の小切手4のみが他の小切手4から分離されて搬送路5に送り出される。
小切手供給部6から搬送路5に送り出された小切手4を当該搬送路5に沿って搬送する小切手搬送機構30は、第1搬送ローラー31〜第6搬送ローラー36と、これらに押し付けられて連れ回りする第1押圧ローラー41〜第6押圧ローラー46と、第1搬送ローラー31〜第6搬送ローラー36を回転駆動するための搬送用モーター37とを備えている。第1搬送ローラー31〜第6搬送ローラー36は同期して回転するようになっている。搬送用モーター37として、例えばステッピングモーターが用いられている。このため、ステッピングモーターを駆動するステップ数により、小切手4の搬送量を知ることができる。
第1搬送ローラー31〜第3搬送ローラー33は、上流側搬送路部分21における上流端、その中程の位置、および湾曲搬送路部分22との境界位置にそれぞれ配置されている。第4搬送ローラー34は湾曲搬送路部分22における下流側の位置に配置されている。第5搬送ローラー35および第6搬送ローラー36は、下流側搬送路部分23における中程の位置および下流端にそれぞれ配置されている。
上流側搬送路部分21における第1搬送ローラー31および第2搬送ローラー32の間には、その上流側から磁気インク文字着磁用の磁石51、光学読取部としての表面側コンタクトイメージスキャナー52、および裏面側コンタクトイメージスキャナー53が配置されている。表面側コンタクトイメージスキャナー52は、搬送路5を搬送される小切手4の表面4aに対向し、表面4aの画像である表面画像を読み取る。裏面側コンタクトイメージスキャナー53は、搬送路5を搬送される小切手4の裏面4bに対向し、裏面4bの画像である裏面画像を読み取る。
また、第2搬送ローラー32および第3搬送ローラー33の間には、磁気インク文字の読み取り用の磁気ヘッド54が配置されており、磁気ヘッド54には、当該ヘッドに小切手4を押し付けるための押圧ローラー55が対峙している。
下流側搬送路部分23における第5搬送ローラー35および第6搬送ローラー36の間には、裏書きに係る所定の画像の記録用の記録装置56が配置されている。記録装置56は、搬送路5を搬送される小切手4の裏面4bの適切な位置に、適切な方向で所定の画像を記録可能な、印刷ヘッドやスタンプなどを備えている。
搬送路5には、小切手搬送制御のための各種センサーが配置されている。磁石51の手前側の位置には、送り出される小切手4の長さを検出するための用紙長検出器61が配置されている。裏面側コンタクトイメージスキャナー53と第2搬送ローラー32の間には、小切手4が重なった状態で搬送されていることを検出するための重送検出器62が配置されている。第4搬送ローラー34の手前側の位置にはジャム検出器63が配置されており、この検出器によって所定時間以上に亘って継続して小切手4が検出されている場合には、搬送路5に小切手4が詰まった紙詰まり状態になったことが分かる。第5搬送ローラー35の手前側の位置には、記録装置56によって裏書きされる小切手4の有無を検出するための印刷検出器64が配置されている。さらに、第6搬送ローラー36の下流側の位置、すなわち、搬送路5から第1小切手排出部7、第2小切手排出部8に分岐している分岐路9の位置には、これらに排出される小切手4を検出するための排出検出器65が配置されている。
分岐路9には、駆動モーター67(図3)によって切り替え操作される切り替え板66が配置されている。切り替え板66は、第1小切手排出部7、第2小切手排出部8に対して、搬送路5の下流端を選択的に切り替え、小切手4を選択された排出部に導くための部材である。
図3は、小切手読取装置1の制御系を示すブロック図である。
制御部71は、通信ケーブル72を介してホストコンピューター70に接続されており、ホストコンピューター70の制御の下、制御部71に繋がれた各部を中枢的に制御する。
ホストコンピューター70は、CPUや、ROM、RAM、その他の周辺回路等を備えて構成されたホスト側制御部73を備えている。また、制御部71は、CPUや、ROM、RAM、その他の周辺回路等を備えている。
ホスト側制御部73は、そのCPUがROMに記憶されたプログラムを実行して、制御部71を制御するための制御データを生成し、生成した制御データを制御部71に対して出力することにより、制御部71に繋がれた各部を制御する。つまり、ホストコンピューター70と制御部71とが協働し、小切手読取装置1を記録媒体処理装置として機能させている。
ホスト側制御部73には、各種情報を表示可能な表示器76と、キーボード、マウス等の入力デバイスが接続された操作部77と、EEPROMやハードディスク等の書き換え可能に各種データを記憶する記憶部78と、が接続されている。また、ホスト側制御部73は、光学文字認識部80を備えている。
記憶部78は、制御部71から入力された小切手4の表面画像や、裏面画像を示すデータや、検出信号を示すデータを記憶する。
制御部71は、送り出し用モーター14、搬送用モーター37を駆動して小切手4(図1)を一枚ずつ搬送路5に送り出させ、送り出された小切手4を搬送路5に沿って搬送させる。制御部71による小切手4の搬送制御は、搬送路5に配置されている用紙長検出器61、重送検出器62、ジャム検出器63、印刷検出器64および排出検出器65からの検出信号に基づいて行われる。
小切手4の搬送に伴って、表面側コンタクトイメージスキャナー52、および裏面側コンタクトイメージスキャナー53は、搬送路5を搬送される小切手4の表面の画像、裏面の画像をそれぞれ読み取り、読み取った画像を示す画像データを制御部71に出力する。制御部71は、これら画像データを、ホスト側制御部73に出力する。
また、磁気ヘッド54は、制御部71の制御の下、通過する磁気インク文字列4A(図1)によって形成される磁界の変化によって発生する起電力を検出し、検出信号として信号処理回路74に出力する。信号処理回路74は、増幅器や、ノイズ除去用のフィルター回路、A/D変換器等を備え、磁気ヘッド54から入力された検出信号を、増幅し、波形整形し、データとして制御部71に出力する。制御部71は、信号処理回路74から入力された検出信号を示すデータを、ホスト側制御部73に送信する。
操作部75は、本体ケース2(図1)に形成された電源スイッチや、操作スイッチ等の各種スイッチを備え、これらスイッチに対するユーザーの操作を検出し、制御部71に出力する。
このように、本実施形態に係る小切手読取装置1には、磁気インク文字列4Aを磁気的に読み取る磁気ヘッド54のほか、小切手4の表面を光学的に読み取る表面側コンタクトイメージスキャナー52を備えている。そして、ホストコンピューター70のホスト側制御部73が備える光学文字認識部80は、表面側コンタクトイメージスキャナー52の読み取り結果に基づいて、磁気インク文字列4Aを構成する磁気インク文字のそれぞれについて、光学的な認識を行う。
磁気インク文字とは、所定のフォント、例えばCMC−7に準拠して、小切手4に磁気印刷された文字のことであり、1つの磁気インク文字は、予め定められた複数の文字種類のうちのいずれか1つの文字種類に対応している。そして、磁気インク文字の認識とは、読み取った磁気インク文字のそれぞれについて、各磁気インク文字の文字種類を確定し、または、当該磁気インク文字の文字種類を確定できないことを検出することである。
光学文字認識部80による光学文字認識は、磁気インク文字認識と併せて必ず行うようにしてもよく、また、磁気インク文字認識が失敗した場合に行うようにしてもよい。
以下、光学文字認識部80の動作について詳述する。
図4は、光学文字認識部80の動作を示すフローチャートである。
この光学文字認識部80の機能は、ホスト側制御部73のCPUがROMに記憶されたプログラムを実行する等、ハードウェアとソフトウェアとの協働により実現される。
以下の説明では、ある1つの小切手4について、当該小切手4に記録された磁気インク文字列4Aの認識を実行する際の光学文字認識部80の動作を示している。また、表面側コンタクトイメージスキャナー52により、当該小切手4の表面の画像が読み取られ、表面画像データとして制御部71からホスト側制御部73に出力されている。
小切手4に記録された磁気インク文字のフォントは、CMC−7とする。CMC−7では、磁気インク文字の形状として、数字10個、英大文字26個、および特殊記号5個の合計41個の文字の文字種類に対応する形状が用意されている。
まず、光学文字認識部80は、小切手4の表面に係る表面画像データを取得する(ステップSA1)。
次に、光学文字認識部80は、表面画像データから、文字列対応領域に対応する領域を切り出して、文字列対応領域画像データを生成する(ステップSA2)。ここで、文字列対応領域とは、小切手4において、規格により磁気インク文字列4Aが印刷される領域と規定された領域のことである。従って、磁気インク文字列4Aを示す画像は、文字列対応領域画像データに必ず含まれているものの、磁気インク文字列4Aを高い精度で認識するためには、文字列対応領域画像データにおける磁気インク文字列4Aが示す画像の領域をある程度厳密に特定する必要がある。
次に、光学文字認識部80は、文字列対応領域画像データを、2値化する(ステップSA3)。詳しくは、文字列対応領域画像データを、文字に対応した文字画素である可能性がある文字候補画素(黒色を示す値を保持する画素。以下黒画素)と文字候補画素以外の背景画素(白色を示す値を保持する画素。以下白画素)とに分類した画素情報として2値化する。これにより、文字列対応領域画像データにおいて、ドットマトリクス状に配置された各画素は、黒画素、または白画素のいずれかを保持した状態となる。文字列対応領域画像データは、各画素がドットマトリクス状に配置されたデータであるため、これら画像データを座標系に展開することにより、各画素の座標は、座標系において原点として定義された位置からの相対的な位置によって一意に定義される。
図5は、2値化した文字列対応領域画像データを所定の座標系に展開した状態の一例を示す模式図である。図5を参照し、2値化した文字列対応領域画像データを説明する。
文字列対応領域画像データが示す画像には、磁気インク文字列4Aを示す画像P1が含まれている。磁気インク文字列4Aに係る画像P1は、複数の磁気インク文字を示す画像P2が磁気インク文字列4Aの長手方向(Y軸方向)に並んで構成されている。また、文字列対応領域画像データが示す画像には、磁気インク文字列4Aを示す画像P1のほか、サインに係る画像P3、汚れに係る画像P4等が含まれている。
なお、本実施形態では、所定の座標系におけるX軸、およびY軸と、文字列対応領域画像データとの位置関係は、図5に示す状態であるものとする。すなわち、文字列対応領域画像データは、座標系の第1象限において、磁気インク文字列4Aの長手方向が、Y軸が延びる方向と一致し、また、磁気インク文字列4Aの幅方向が、X軸が延びる方向と一致するように、座標系に展開されるものとする。
文字列対応領域画像データを2値化した後、光学文字認識部80は、ラベリング処理を行う(図4;ステップSA4)。
図6は、ステップSA4のラベリング処理の実行時における光学文字認識部80の動作を示すフローチャートである。図6を参照し、ラベリング処理について説明する。
まず、光学文字認識部80は、文字列対応領域画像データから、当該画像データに含まれているブロックを検出する(ステップSB1)。
詳述すると、まず、光学文字認識部80は、文字列対応領域画像データを構成する各画素を走査し、黒画素を検出する。黒画素を検出した場合、光学文字認識部80は、当該黒画素に連続している全ての黒画素を検出する。当該黒画素に連続している全ての黒画素とは、白画素によって断絶されることなく、連鎖的に隣接する全ての黒画素のことを言い、例えば、図5において符号Aで示される黒画素のかたまりのことである。このようにして検出される連続した黒画素のかたまりが1つの「ブロック」に該当する。光学文字認識部80は、文字列対応領域画像データを構成する各画素を走査し、文字列対応領域画像データが示す画像に含まれるブロックの全てを検出する。
ここで、各文字種類に対応する磁気インク文字のそれぞれの画像は、1つの連続する黒画素のかたまりから構成されている。そして、磁気インク文字の画像となり得、また、磁気インク文字の画像の一部となり得る黒画素のかたまりについて、かたまりを構成する画素の数の最小値と、最大値とは、一意に定められる。
これを踏まえ、光学文字認識部80は、文字列対応領域画像データが示す画像に含まれる連続する黒画素のかたまりのうち、かたまりを構成する画素の数が、上記最小値を下回るか、または上記最大値を上回る場合は、該当するかたまりについては、「ブロック」としない。これにより、例えば、図5を参照して、画素の数が上記最小値を下回るかたまりA1や、画素の数が上記最大値を上回るかたまりA2は、「ブロック」として検出されない。
このようにしてブロックを検出(特定)することにより、検出(特定)されるブロックから、磁気インク文字を示す画像を構成する可能性がない黒画素のかたまりに係るものを除外することができる(ステップSB2)。
文字列対応領域画像データに含まれるブロック(かたまりA)を検出した後、光学文字認識部80は、複数のブロックのうちから、以下のステップSB3〜ステップSB7の処理を実行する対象となるブロックを特定する。以下の説明では、ステップSB2で特定されたブロックを「処理対象ブロック」という。以下のステップSB3〜ステップSB7の処理は、検出したブロックのそれぞれについて、1回ずつ実行されることとなる。
検出したブロックから処理対象ブロックを特定した後、光学文字認識部80は、処理対象ブロックのブロック枠を検出する(ステップSB3)。
詳述すると、ブロック枠とは、処理対象ブロックを囲う矩形の枠のことであり、X軸方向に延びる2辺と、Y軸方向に延びる2辺とで構成される。ブロック枠のX軸方向に延びる2辺の長さは、ブロックのX軸方向の長さに対応して規定され、また、ブロック枠のY軸方向に延びる2辺の長さは、ブロックのY軸方向の長さに対応して規定される。例えば、符号BWで示す枠が、対応するブロックのブロック枠に該当する。
なお、ブロック枠を検出するとは、座標系におけるブロック枠の位置を示す情報(例えば、ブロック枠の四隅のそれぞれの座標)を検出することである。
次に、光学文字認識部80は、検出したブロック枠が、1つの磁気インク文字の文字枠である可能性があるか否かを判別する(ステップSB4)。
詳述すると、1つの磁気インク文字の文字枠とは、文字列対応領域画像データの磁気インク文字を示す画像を、上記のブロック枠と同様にして囲う枠のことである。
ここで、上述したように、CMC−7には、41種類の文字種類が用意されているが、41種類の文字種類のそれぞれの画像の文字枠について、文字枠のX軸方向に延びる辺の縦辺長、Y軸方向に延びる辺の横辺長、およびX軸方向に延びる辺の縦辺長とY軸方向に延びる辺の横辺長との比(以下、「縦横比」という)は、それぞれ定まる。従って、ブロック枠が磁気インク文字の文字枠である場合に、当該ブロック枠が取り得るX軸方向に延びる辺の縦辺長の範囲、Y軸方向に延びる辺の横辺長の範囲、および縦横比の範囲は、定まる。これを踏まえ、ステップSB4では、処理対象ブロックのブロック枠の、X軸方向に延びる辺の縦辺長、Y軸方向に延びる辺の横辺長、および縦横比を検出し、これらが、上記の各範囲内に収まっているか否かが判別される。
ステップSB4において、ブロック枠が文字枠に該当する可能性があると判別した場合(ステップSB4:YES)、光学文字認識部80は、このブロック枠を候補文字枠KM(KM1、KM2、図5)として特定し(ステップSB5)、処理手順をステップSB8に移行する。
ステップSB8では、ステップSB1で検出した全てのブロックが処理対象ブロックとなったか否かが判別され、全てのブロックが処理対象ブロックとなっていない場合(ステップSB8:NO)、光学文字認識部80は、処理手順をステップSB2へ移行し、全てのブロックが処理対象ブロックとなった場合(ステップSB8:YES)、ラベリング処理(ステップSA4)を終了する。
一方、ステップSB4において、ブロック枠が文字枠に該当する可能性がないと判別した場合(ステップSB4:NO)、処理対象ブロックに隣接して周囲に存在するブロックの中に、処理対象ブロックと統合可能なブロックがあるか否かを判別する(ステップSB6)。
詳述すると、処理対象ブロックのブロック枠が、文字枠に該当する可能性がない場合、処理対象ブロックは、単独で、1つの磁気インク文字に対応するブロックではないものの、制御文字を構成する複数の部位のいずれかに対応するブロックである可能性がある。そして、処理対象ブロックが、制御文字を構成する複数の部位のいずれかに対応するブロックである場合、この処理対象ブロックの周囲に、この処理対象ブロックに隣接して、当該制御文字を構成する他のブロックが存在していることとなる。そして、処理対象ブロックと統合可能なブロックとは、1つの制御文字を構成可能な程度に、処理対象ブロックに対して近接した他のブロックのことであり、ステップSB6では、処理対象ブロックと統合可能なブロックが存在するか否かを判別している。
なお、以下の説明では、1つの制御文字を構成する1つの部位に対応するブロックと、他の部位に対応するブロックとを対応づけることを、「統合」と表現するものとする。
ステップSB6において、処理対象ブロックと統合可能なブロックがない場合(ステップSB6:NO)、光学文字認識部80は、処理対象ブロックのブロック枠を候補文字枠KMとして特定することなく、処理手順をステップSB8へ移行する。これは、処理対象ブロックは、磁気インク文字に係るブロックではなく、また、制御文字に係る磁気インク文字を構成する部位に係るブロックでもないためである。
一方ステップSB6において、処理対象ブロックと統合可能なブロックがある場合(ステップSB6:YES)、光学文字認識部80は、統合処理を実行する(ステップSB7)。
ステップSB7の統合処理により、処理対象ブロックを含む、1つの制御文字に対応するブロック群(統合ブロック)を検出した後、光学文字認識部80は、この統合ブロック全体のブロック枠を候補文字枠として特定し(ステップSB5)、処理手順を上述したステップSB8へ移行する。
図5では、ラベリング処理(ステップSA4)を実行することによって、検出された候補文字枠を符号KMで示している。図5に示すように、候補文字枠KMは、制御文字に関しては、制御文字を構成する各部位に対応するブロックを囲む適切なものとなる。
一方で、ラベリング処理では、1つのブロックのブロック枠が、辺の長さや、縦横比の関係上、磁気インク文字の文字枠となる可能性がある限りにおいて、例えば、候補文字枠KM2に示すように、1つの磁気インク文字に正常に対応していないブロック枠であっても、候補文字枠として特定される。
図4に示したラベリング処理(ステップSA4)において、候補文字枠を検出した後、光学文字認識部80は、バンド幅検出処理を行う(ステップSA5)。
図7は、バンド幅検出処理の実行時における光学文字認識部80の動作を示すフローチャートである。図7を参照し、バンド幅検出処理について説明する。
バンド幅検出処理(ステップSA5)において、まず、光学文字認識部80は、ラベリング処理(ステップSA4)で検出した候補文字枠の中から、ステップSC2以下の所定の処理を実行する対象となる候補文字枠を特定する(ステップSC1)。すなわち、ステップSC2以下の所定の処理は、候補文字枠のそれぞれについて、1回ずつ行われることとなる。以下の説明では、ステップSC1で特定した候補文字枠を「処理対象候補文字枠」というものとする。
次に、光学文字認識部80は、処理対象候補文字枠に対応するブロック(処理対象候補文字枠で囲まれたブロック)について、光学文字認識を行う(ステップSC2)。
光学文字認識は、ブロックが示す画像の文字種類を確定し、またはブロックが示す画像の文字種類を確定できないことを判別する処理であり、例えば、41種類の文字種類のそれぞれに対応するビットマップパターンと、処理対象候補文字枠によって切り出される画像データとを比較することにより行われる。
次いで、光学文字認識部80は、処理対象候補文字枠に対応するブロックの光学文字認識が成功(ブロックが示す画像の文字種類が確定)したか否かを判別する(ステップSC3)。成功した場合(ステップSC3:YES)、光学文字認識部80は、処理対象候補文字枠を確定文字枠として特定し(ステップSC4)、処理手順をステップSC5へ移行する。すなわち、確定文字枠とは、光学文字認識が成功した磁気インク文字に係る画像の文字枠のことである。一方で、光学文字認識が失敗した場合(ステップSC3:NO)、光学文字認識部80は、処理対象候補文字枠を確定文字枠として特定することなく、処理手順をステップSC5へ移行する。
ステップSC5では、ラベリング処理で検出された候補文字枠の全てが処理対象候補文字枠となったか否かが判別され、全てが処理対象候補文字枠となっていない場合(ステップSC5:NO)、光学文字認識部80は、処理手順をステップSC1へ移行し、一方、候補文字枠の全てが処理対象候補文字枠となった場合(ステップSC5:YES)、処理手順をステップSC6へ移行する。
図8は、文字列対応領域画像データ上に確定文字枠を表示した様子を示す模式図である。
図8において、符号DMで示す枠が、確定文字枠に該当する。
図8に示すように、磁気インク文字列4Aの磁気インク文字に係る画像P2のそれぞれについて、確定文字枠DMが検出される。一方で、画像P4に示すように、磁気インク文字と汚れとが連続一体的に結合して形成されたブロックについては、ステップSC2における光学文字認識の結果、認識が失敗するため(ステップSC3:NO)、対応する確定文字枠DMが検出されない。
ステップSC6において、光学文字認識部80は、ステップSC3において文字認識に成功したと判別されたものが、所定の個数以上あるか否かを判別する。
所定の個数以上存在する場合(ステップSC6:YES)、光学文字認識部80は、バンド下端値を検出する(ステップSC7)。
以下の説明では、説明の便宜のため、確定文字枠DMの4辺のうち、Y軸方向に延びる2辺について、Y軸に近い辺を「確定文字枠DMの下端」と、また、Y軸から遠い辺を「確定文字枠DMの上端」と、表現するものとする。
ステップSC7において、光学文字認識部80は、確定文字枠DMのうち、その下端4fが、最もY軸に近い位置に位置している確定文字枠DMを特定する。
そして、光学文字認識部80は、特定した確定文字枠DMの下端4fのX軸方向の値を検出し、検出した値をバンド下端値とする。
次いで、光学文字認識部80は、バンド上端値を検出する(ステップSC8)。
詳述すると、光学文字認識部80は、確定文字枠DMのうち、最もY軸との離間距離が大きい上端4eを有する確定文字枠DMを特定する。
そして、光学文字認識部80は、特定した確定文字枠DMの上端4eのX軸方向の値を検出し、検出した値をバンド上端値とする。
次いで、光学文字認識部80は、ステップSC7で検出したバンド下端値と、ステップSC8で検出したバンド上端値との間に論理的な矛盾があるか否かを判別する(ステップSC9)。
論理的な矛盾とは、例えば、バンド上端値よりも、バンド下端値が大きいことや、また、バンド上端値とバンド下端値との差が想定される値よりも著しく小さく、または大きいことである。
矛盾がない場合(ステップSC9:NO)、光学文字認識部80は、所定の座標系のX軸において、バンド下端値と、バンド上端値とで挟まれる範囲に多少のマージンを付けた範囲を、バンド幅として検出し(ステップSC10)、検出したバンド幅で文字列対応領域画像データを切り出して、文字列画像データを生成する(ステップSC11)。
図9は、ステップSC11で生成された文字列画像データを示す図である。
図9に示すように、上述した手法によりバンド幅を検出すると共に、検出したバンド幅に基づいて文字列対応領域画像データを切り出して文字列画像データを生成することにより、図9に示すように、文字列画像データは、磁気インク文字列4Aが配置された領域について、磁気インク文字列4Aの幅の大きさ相当に切り出されたデータとなる。これにより、文字列画像データから磁気インク文字列4Aの周囲に存在していた汚れに係る画像等を極力排除でき、特に、図8と図9とにおける画像P4の比較において明らかなように、磁気インク文字に係る画像と連続一体的に形成された汚れに係る画像も文字列画像データから除外された状態となる。
検出した確定文字枠を利用して、バンド上端値、およびバンド下端値を算出し、これらの値に基づいてバンド幅を検出する場合、検出したバンド幅の値の信頼性を確保するためには、ハンド幅検出の前提となる確定文字枠がある程度の個数存在することが求められる。これを踏まえ、ステップSC6(図7)において、文字認識に成功したブロックの個数(=検出された確定文字枠の個数)が、バンド幅の信頼性を確保できるような所定の個数以上あるか否かを判別し、所定の個数を下回る場合は、光学文字認識部80は、他の手法でバンド幅を検出する予備バンド幅検出処理(ステップSC12)を実行する。
また、検出したバンド上端値と、バンド下端値に論理的な矛盾がある場合(ステップSC9)、バンド幅を検出することが不可能なため、光学文字認識部80は、予備バンド幅検出処理(ステップSC12)を実行する。
予備バンド幅検出処理(ステップSC12)により、バンド幅を検出した後、光学文字認識部80は、検出したバンド幅で文字列対応領域画像データを切り出して、文字列画像データを生成する(ステップSC11)。
このように、本実施形態では、ステップSC6において、認識に成功したブロックの個数が所定の個数を下回ったと判別されたり、算出したバンド上端値、およびバンド下端値に論理的な矛盾があったりした場合であっても、予備バンド幅検出処理により、バンド幅が検出される構成となっている。
ステップSA5のバンド幅検出処理(図4)によりバンド幅を検出し、文字列画像データ(図9)を生成した後、光学文字認識部80は、光学文字認識処理を実行する(ステップSA6)。
この光学文字認識処理では、光学文字認識部80は、文字列画像データに基づいて、磁気インク文字の画像の可能性があるブロックの検出、ブロックごとのパターンマッチングによる文字認識等、光学文字認識に係る一連の処理が実行され、改めて、磁気インク文字列4Aに含まれる磁気インク文字の光学的な認識が実行される。
次に、ブロックごとのパターンマッチングによる光学文字認識に係る処理を、メッシュ特徴量を用いた例として図面を参照して説明する。
図10(a)は、CMC−7文字の一例(文字「1」)を示す模式図である。
磁気インク文字(MICR文字)のフォントの一つであるCMC−7は、数字10個(「0」〜「9」)、英大文字26個(「A」〜「Z」)、および特殊記号5個の合計41個の文字を有する。そして、CMC−7文字は、記録媒体に印刷されて記録され、磁気的に判別し得るものである。CMC−7文字は、7本の縦のバーRn(nは、1から7の自然数)を複数種類の間隔で互いに略平行に配列している。図10(a)では、縦のバーRnを、便宜上、図右から順にバーR1、R2、R3、R4、R5、R6、R7と例示する。
図10(b)は、検出された確定文字枠DMに取り込んだCMC−7文字「1」を示す概略図である。
CMC−7文字は、確定文字枠DM内に2値化された情報として取り込まれる。確定文字枠DMは、メッシュMS(1,1)からメッシュMS(16,16)までの256個(16行×16列)のメッシュMS(x、y)に分割され、各メッシュMSは、9個(3行×3列)の画素PSで構成されている。つまり、CMC−7文字は、確定文字枠DM内に配列された2304個(9×256個)の画素PSで、黒画素と白画素との2値の情報として取り込まれている。図10(b)において、CMC−7文字を構成する縦のバーRnは、黒画素(図の黒く塗りつぶした部分)で表示される。
パターンマッチングによる認識とは、検出した文字パターンと所定の比較パターンとの類似度を、閾値をもって判定することである。パターンマッチングの一手法としてのメッシュ特徴量を用いたパターンマッチングでは、検出した文字パターンのメッシュ特徴ベクトルと、比較パターンのメッシュ特徴ベクトルとの距離が閾値以下であることを判定する。
しかしながら、読み取りを行う磁気インク文字の付近に汚れやゴミの付着がある場合や、磁気インク文字がかすれている場合などがあり、このような場合には、認識が正常に行われないことがある。光学文字認識では、汚れ、ゴミ、印刷のかすれなどは、確定文字枠DM内にノイズ情報として取り込まれる。パターンマッチングによる文字認識の場合は、これらのノイズ情報により、文字を誤認識することや、文字として認識ができないことがある。そこで、確定文字枠DM内に取り込んだノイズ情報を含む文字候補画素(黒画素)と文字候補画素以外の背景画素(白画素)との2値化情報から、ノイズ情報を除去する処理が必要となる。次に、良好な文字認識を可能とするためのノイズ除去処理について説明する。
図11(a)は、確定文字枠DMに取り込んだノイズ情報を含むCMC−7文字「1」の一例を示す概略図である。図11(b)は、連続する黒画素が2個以下の部分をノイズとして消去した場合の例を示す概略図である。
図11(a)には、汚れによるノイズPGと、かすれによるノイズPKの例を示している。ノイズPGは、バーR6とバーR7との間隙部分の白画素であるべき部分が、汚れなどにより黒画素となっている部分である。また、ノイズPKは、バーR3とバーR4の2本のバーを、かすれなどによって、それぞれ4つのバーと5つのバーとに分割してしまう白画素の部分である。
なお、ここでは、説明を簡単にするため、各メッシュMSは1画素で構成され、各バーRnの幅が1画素に対応している例で説明する。
一般的なノイズ除去方法のひとつとして、読み込む対象パターンの大きさに比べて明らかに小さなパターン情報は、ノイズとして消去するという方法が用いられている。この方法で、ノイズPGを消去する場合には、バーRnの有効性判定の閾値として、連続する黒画素数が2個以下の部分は、文字候補画素から消去するという設定が有効である。しかし、この設定の場合には、ノイズPKによって分割されたバーR3とバーR4の中央部の黒画素部分も、2個以下の黒画素であるために、ノイズとして消去されてしまう(図11(b))。この場合、ノイズを消去したにもかかわらず、バーとして有効な情報(図のPY部)をも消去してしまっているために、逆にCMC−7文字「1」としての認識が難しくなってしまう。
そこで、本実施形態では、以下に説明するノイズ除去処理方法により、安定した光学文字認識処理を実現している。
図12(a)、(b)は、本実施形態に係るノイズ除去処理を説明する概略図である。
CMC−7文字は、7本の縦のバーRnにより構成されているため、確定文字枠DM内で縦方向(図12(a)、(b)のX軸方向)に並ぶ黒画素は、バーRnを構成する有効情報である可能性が高い。従って、同一の列(X軸方向)にある黒画素の数をカウントして、所定の数よりも多い黒画素の列は、バーRnを構成する有効情報と判定して残すこと、つまり、文字候補画素を黒画素のまま文字画素として認識することが有効である。
図12(a)は、図11(a)と同一のノイズを含むCMC−7文字「1」を示している。また、それぞれの列の文字候補画素(黒画素)の数を図中に付記している。この例の場合では、列毎の黒画素の数は、黒画素が無い列の0から、バーR3がある列の11までがカウントされている。ここで、ノイズPGを含む列の黒画素が消去される場合の閾値を考える。この例の場合には、該当する列の黒画素の数は1と2であるため、少なくとも、黒画素数が2個以下の列の黒画素をすべて白画素に変換することで、ノイズPGの消去が可能である。図12(b)は、閾値をカウント2として、黒画素数が2個以下の列の黒画素をすべて白画素に変換した様子(図では斜線網掛けにしている)を表している。この図からもわかるように、図11(b)で消去されてしまったバーとして有効な情報(図11(b)PY部)は消去されずに残っている。
次に、本実施形態のノイズ除去処理方法における、消去対象画素を判定するための閾値について説明する。
図13(a)、(b)は、閾値に対する消去対象の分布を表すグラフである。
図13(a)のグラフは、図12(a)に示すパターンで、連続する個々の黒画素パターンを構成する黒画素の個数の分布を示している。最低1個から、バーR1、R2を構成する6個までが分布している。先の一般的なノイズ除去方法の例で、連続する黒画素数が2個以下の部分をすべて消去する場合を示したが、この方法をとった場合に、図11(b)のように、2箇所のノイズ以外に、5つの有効情報も同時に消去される。
これに対し、図13(b)のグラフは、同じパターンにおいて、列毎の黒画素総数の分布を示すものである。前述のように、黒画素が無い列の0個から、バーR3がある列の11個までが分布している。このグラフからも明らかなように、列毎の黒画素の総数で分布を見た場合には、ノイズ部分と有効なバーRnの部分とが明確に分離される。従って、本実施形態では、少なくとも黒画素数が2個以下の列の黒画素をすべて白画素に変換することで、ノイズPGの消去が可能であり、この場合、ノイズ部分のみが消去され、有効情報は消去されないことがわかる。
なお、この分布を見た場合には、より多くのノイズを消去するために、閾値として、黒画素数が4個以下の列の黒画素をすべて白画素に変換する、という設定が有効である。
またなお、ノイズ除去処理の説明において、各メッシュMSは1画素で構成しており、各バーRnの幅は1画素で示しているとして説明したが、これに限るものではなく、例えば、前述した図10(b)に示す構成であっても良い。
また本実施形態では、具体的なノイズ除去処理の閾値として、各列にある黒画素の合計値が、各列を構成する画素数の4分の1以下の場合には、その列の黒画素をすべて白画素に変換する設定としている。なお、閾値は、これに限るものではなく、実際のノイズの発生状況や、磁気インク文字の仕様によって適宜適正値を設定することが望ましい。
図14(a)は、ステップSA6(図4)の光学文字認識処理の実行時における光学文字認識部80の動作を示すフローチャートである。
次に、本図を参照し、具体的な光学文字認識処理のフローについて説明する。
まず、光学文字認識部80は、ステップSC11(図7)で生成した文字列画像データに基づいて、磁気インク文字の画像の可能性がある1文字相当分のブロックを検出する(ステップSD1)。次に、ブロック内の検出文字パターンからノイズ除去処理をする(ステップSD2。詳細後述)。次に、ノイズ除去処理された検出文字パターンを比較用に用意した所定の比較パターンと、パターンマッチングにより比較する(ステップSD3)。パターンマッチとして判定された比較パターンを認識結果の文字として特定し(ステップSD4)、アンマッチとして判定された場合は、文字として特定せず、次の1文字相当分のブロックを検出する。すべての文字列画像データに認識されるブロックについて同様の処理を行い、光学文字認識処理を終了する(ステップSD5)。
図14(b)は、ステップSD2のノイズ除去処理における光学文字認識部80の動作を示すフローチャートである。
具体的なノイズ除去処理は、図10(b)において、確定文字枠DM内の各画素を走査しながら行う。画素の走査は、メッシュMS(1、1)からメッシュMS(1、16)に向かう方向に、X軸方向の縦の画素列毎に行っていく。
まず、最初の画素列を走査し、X軸方向の同一画素列に含まれる黒画素をカウントする(ステップSE1)。
次に、カウントした黒画素数が所定の数(各列を構成する画素数の4分の1)を超えるか否かを判定する(ステップSE2)。カウントした黒画素数が所定の数を上回った場合には、バーRnを構成する有効な黒画素であると判断し(NO)、次の処理に進む。カウントした黒画素数が所定の数以下であった場合には、ノイズによるものと判定して(YES)該当する列の黒画素をすべて白画素に変換する(ステップSE3)。
次に、すべての画素列について処理が終了したか判定(ステップSE4)し、終了していない場合には、次の列の同様の処理(ステップSE1)に移る。すべての列について終了したことを確認してノイズ除去処理を終了する。
以上述べたように、本実施形態による記録媒体処理装置、記録媒体処理装置の制御方法、およびプログラムによれば、以下の効果を得ることができる。
光学文字認識部80は、バーコード文字の各バーRnを構成する画素列の文字候補画素を計数した結果に基づいて、列の文字候補画素が文字画素であるか否かの判定を行う。特に、文字候補画素が連続して配置されていない場合であっても、ひとつの列を構成する画素の総数に対する文字候補画素の数の割合が所定の閾値を上回っている場合には、文字候補画素は文字画素であると判定する。また、ひとつの列にある文字候補画素の数の割合が所定の閾値と同じか、または下回っている場合にのみ、文字候補画素は文字画素ではないと判定する。従って、誤ってバーRnの情報を削除してしまうことがなく、バーコード文字の特質を反映して、より有効なノイズ処理を行うことができる。
具体的には、CMC−7文字などの磁気インク文字の印刷品質が悪い場合や、かすれなどにより、本来ある程度の長さを有するバーRnが、短い長さに分断されて認識されてしまった場合などは、ゴミなどによるノイズと識別が難しいことがある。これに対し、同じ列に並ぶ黒画素の数が所定の割合を上回っている場合に、該当する列の黒画素は、バーRnの情報として有効であると判定することは、列全体に亘るバーRnの情報を含んで判定できるということであり、誤ってノイズ情報と判断され除去されてしまうことが少なくなる。
このノイズ除去処理を行った検出文字パターンと所定の比較パターンとを比較することで、CMC−7文字などの磁気インク文字の読み取りができないことや、誤認識してしまうことが軽減される。そのため、何度も認識処理や読み取りを繰り返して実行することが少なくなる。つまりCMC−7文字を正確に認識するまでの時間が短縮された記録媒体処理装置を提供することができる。
(複合処理装置)
小切手読取装置などの記録媒体処理装置に限らず、前述した記録媒体処理装置あるいは記録媒体処理装置の制御方法あるいはプログラムを用いることにより、複数のバーからなる磁気インク文字の読み取りを光学的にも安定しておこなうことができる様々な複合処理装置を提供することができる。
1…小切手読取装置、4…小切手、4A…磁気インク文字列、52…表面側コンタクトイメージスキャナー、54…磁気ヘッド、70…ホストコンピューター、71…制御部、73…ホスト側制御部、78…記憶部、80…光学文字認識部。

Claims (8)

  1. 間隔を有して互いに略平行に延在する複数のバーからなる磁気インク文字を含む画像を光学的に取得する光学読取部と、
    前記光学読取部で取得した前記画像に含まれる1文字相当毎の文字枠を検出し、前記文字枠内の検出文字パターンを所定の比較パターンと比較する光学文字認識部と、を備え、
    前記光学文字認識部は、
    前記文字枠内に前記バーの延在方向に沿った列と前記バーの延在方向と交差する方向に沿った行とで構成されるマトリクス状に配列された画素を、前記検出文字パターンの文字に対応する文字画素である可能性のある文字候補画素と前記文字候補画素以外の背景画素とに区分し、
    前記列毎に前記文字候補画素を計数した数に基づいて、前記列の前記文字候補画素が前記文字画素であるか否かの判定を行い、
    前記判定において前記文字画素であると判定された前記文字候補画素を前記文字画素とするとともに、前記文字画素ではないと判定された前記文字候補画素を前記背景画素に変換するノイズ除去処理を行い、
    前記ノイズ除去処理後の前記文字枠内に配列された画素を前記検出文字パターンとして前記所定の比較パターンと比較することを特徴とする記録媒体処理装置。
  2. 前記判定は、
    前記文字候補画素が連続して配置されていない場合であっても、ひとつの前記列を構成する画素の総数に対する前記ひとつの列にある前記文字候補画素の数の割合が所定の閾値を越えている場合に、前記文字候補画素は前記文字画素であると判定し、
    前記ひとつの列にある前記文字候補画素の数の割合が前記所定の閾値以下である場合に、前記文字候補画素は前記文字画素ではないと判定することを特徴とする請求項1に記載の記録媒体処理装置。
  3. 前記磁気インク文字は、CMC−7文字であることを特徴とする請求項1または請求項2に記載の記録媒体処理装置。
  4. 請求項1乃至請求項3のいずれか一項に記載の記録媒体処理装置を用いたことを特徴とする複合処理装置。
  5. 間隔を有して互いに略平行に延在する複数のバーからなる磁気インク文字を含む画像を光学的に取得するステップと、
    取得した前記画像に含まれる1文字相当毎の文字枠を検出するステップと、
    前記文字枠内に前記バーの延在方向に沿った列と前記バーの延在方向と交差する方向に沿った行とで構成されるマトリクス状に配列された画素を、検出文字パターンの文字に対応する文字画素である可能性のある文字候補画素と前記文字候補画素以外の背景画素とに区分するステップと、
    前記列毎に前記文字候補画素を計数した数に基づいて、前記列の前記文字候補画素が前記文字画素であるか否かの判定を行うステップと、
    前記判定において前記文字画素であると判定された前記文字候補画素を前記文字画素とするとともに、前記文字画素ではないと判定された前記文字候補画素を前記背景画素に変換するノイズ除去処理を行うステップと、
    前記ノイズ除去処理後の前記文字枠内に配列された画素を前記検出文字パターンとして所定の比較パターンと比較するステップと、を含むことを特徴とする記録媒体処理装置の制御方法。
  6. 前記判定を行うステップは、
    前記文字候補画素が連続して配置されていない場合であっても、ひとつの前記列を構成する画素の総数に対する、前記ひとつの列にある前記文字候補画素の数の割合が所定の閾値を越えている場合に、前記文字候補画素は前記文字画素であると判定し、
    前記ひとつの列にある前記文字候補画素の数の割合が前記所定の閾値以下である場合に、前記文字候補画素は前記文字画素ではないと判定するステップからなることを特徴とする請求項5に記載の記録媒体処理装置の制御方法。
  7. 前記磁気インク文字は、CMC−7文字であることを特徴とする請求項5または請求項6に記載の記録媒体処理装置の制御方法。
  8. 記録媒体処理装置を、請求項5乃至請求項7のいずれか一項に記載の制御方法を含み機能させることを特徴とするプログラム。
JP2011009487A 2011-01-20 2011-01-20 記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム Withdrawn JP2012150691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011009487A JP2012150691A (ja) 2011-01-20 2011-01-20 記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011009487A JP2012150691A (ja) 2011-01-20 2011-01-20 記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2012150691A true JP2012150691A (ja) 2012-08-09

Family

ID=46792873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011009487A Withdrawn JP2012150691A (ja) 2011-01-20 2011-01-20 記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2012150691A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110329604A (zh) * 2019-07-10 2019-10-15 合肥友高物联网标识设备有限公司 一种基于八工位包装机的赋码、检测、剔除的控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110329604A (zh) * 2019-07-10 2019-10-15 合肥友高物联网标识设备有限公司 一种基于八工位包装机的赋码、检测、剔除的控制方法
CN110329604B (zh) * 2019-07-10 2022-02-08 合肥友高物联网标识设备有限公司 一种基于八工位包装机的赋码、检测、剔除的控制方法

Similar Documents

Publication Publication Date Title
JP5591578B2 (ja) 文字列認識装置および文字列認識方法
JP2004259254A (ja) 磁気インク文字読取装置及びその読取処理方法
JP5300598B2 (ja) バーコード処理装置及びバーコード処理方法
JP2009282691A (ja) 画像処理装置、バーコード処理装置、及び画像処理方法
US20070246542A1 (en) Document element repair
US9100518B2 (en) Information processing apparatus, information processing method, and computer-readable medium
US8358827B2 (en) Optical waveform generation and use based on print characteristics for MICR data of paper documents
US8783570B2 (en) Reader with optical character recognition
JP2012221337A (ja) 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
JP2012226633A (ja) 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
JP2012159912A (ja) 画像処理装置、および画像処理装置の制御方法
JP2012150691A (ja) 記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム
JP2012063993A (ja) 画像処理装置及びその制御方法ならびにプログラム
JP2012185763A (ja) 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
JP2012150692A (ja) 記録媒体処理装置、複合処理装置、記録媒体処理装置の制御方法、およびプログラム
US8625877B2 (en) Methods of operating an image-based check processing system to detect a double feed condition of carrier envelopes and an apparatus therefor
JP2012168837A (ja) 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
US8761487B2 (en) Methods of operating an image-based check processing system to detect a double feed condition of checks and an apparatus therefor
JP2012198852A (ja) 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
KR20010044743A (ko) 2차원 바코드 정보 인식방법
US20120105917A1 (en) Image processing apparatus and computer readable medium
JP2012252560A (ja) 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
JP2012185762A (ja) 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
JP2012160043A (ja) 画像処理装置、および画像処理装置の制御方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140401