JP2019139551A - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP2019139551A
JP2019139551A JP2018022937A JP2018022937A JP2019139551A JP 2019139551 A JP2019139551 A JP 2019139551A JP 2018022937 A JP2018022937 A JP 2018022937A JP 2018022937 A JP2018022937 A JP 2018022937A JP 2019139551 A JP2019139551 A JP 2019139551A
Authority
JP
Japan
Prior art keywords
character
recognition
magnetic
conversion
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018022937A
Other languages
English (en)
Inventor
友則 三村
Tomonori Mimura
友則 三村
陽平 小林
Yohei Kobayashi
陽平 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2018022937A priority Critical patent/JP2019139551A/ja
Publication of JP2019139551A publication Critical patent/JP2019139551A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】磁気インク文字から読み取られた磁気読取データにノイズが入った場合であっても、高効率かつ高精度な文字認識が可能である文字認識装置を提供する。【解決手段】媒体処理装置100は、媒体に印字された磁気インク文字列から読み取られた磁気波形に対して、1又は複数の方式でフィルタリングをしてノイズ除去を行って得られた1又は複数のフィルタ後磁気波形を出力するフィルタ部と、1又は複数のフィルタ後磁気波形に対して複数の方式で文字の切り出しを行って、磁気インク文字列の1文字毎の領域である文字領域毎に区分けされた磁気波形である複数の切り出し後磁気波形を出力する文字切り出し部と、複数の切り出し後磁気波形の各々に対して、1又は複数の方式で文字領域毎に文字への変換を行うことで得られた複数の文字変換結果を出力する文字変換部と、複数の文字変換結果に基づいて、磁気インク文字列を認識する文字列認識部と、を有する。【選択図】図2

Description

本発明は、文字認識装置に関し、特に、磁気インク文字列が印字された媒体から文字を認識することが可能である文字認識装置に関する。
磁気インクによって印字された文字の磁気情報を読み取って文字を認識するMICR(Magnetic Ink Character Reader)装置が知られている。
例えば、特許文献1には、磁気インクを用いて印字された磁気インク文字1文字ごとの磁気波形を基準波形として記憶する基準波形記憶部と、前記磁気インク文字からなる文字列から再生波形を読み取る磁気ヘッドと、前記磁気ヘッドから読み取られた前記再生波形を記憶する再生波形記憶部と、前記再生波形記憶部に記憶された前記再生波形から前記磁気インク文字の1文字ごとの文字波形の切り出しを行う文字切り出し部と、前記基準波形記憶部に記憶された前記基準波形と、前記文字切り出し部によって切り出された前記文字波形とを比較する文字認識部と、を備える磁気文字認識装置が開示されている。
特開2008−第129868号公報
例えば、小切手等の媒体に印刷された磁気インク文字(MICR文字)には、文字の掠れ、文字付近若しくは文字列間のインク汚れが伴う場合がある。上記のような磁気文字認識装置において、文字の掠れ等の影響で磁気読取データにノイズが入ると、MICR文字の認識に失敗することが多いことが課題の一例として挙げられる。
本発明は、上述の点に鑑みてなされたものであり、磁気インク文字から読み取られた磁気読取データにノイズが入った場合であっても、高効率かつ高精度な文字認識が可能である文字認識装置を提供することを目的とする。
本発明の文字認識装置は、媒体に印字された磁気インク文字列から読み取られた磁気波形に対して、1又は複数の方式でフィルタリングをしてノイズ除去を行って得られた磁気波形である1又は複数のフィルタ後磁気波形を出力するフィルタ部と、前記1又は複数のフィルタ後磁気波形に対して複数の方式で文字の切り出しを行って、前記磁気インク文字列の1文字毎の領域である文字領域毎に区分けされた磁気波形である複数の切り出し後磁気波形を出力する文字切り出し部と、前記複数の切り出し後磁気波形の各々に対して、1又は複数の方式で前記文字領域毎に文字への変換を行うことで得られた複数の文字変換結果を出力する文字変換部と、前記複数の文字変換結果に基づいて、前記磁気インク文字列を認識する文字列認識部と、を有する。
実施例1の認識装置の概略断面図である。 実施例1の認識装置の機能的構成を示すブロック図である。 実施例1の認識ルーチンの一例を示すフローチャートである。 実施例1の認識ルーチンにおいて生成される情報を模式的に示す図である。 実施例1のフィルタ後磁気波形の例を示す図である。 実施例1の切り出し後磁気波形の例を示す図である。 実施例1の切り出し後磁気波形の例を示す図である。 実施例1の文字変換結果の例を示す図である。 実施例1の文字認識結果の例を示す図である。 実施例2の文字認識結果の表示の例を示す図である。
図1及び図2を参照しつつ、本発明の実施例1に係る文字認識装置としての媒体処理装置100の構成及び機能について説明する。図1は、媒体処理装置100において処理される媒体の一例である小切手Cが搬送される搬送方向に沿った媒体処理装置100の断面の概略を示している。
図1に示すように、媒体処理装置100は、上側搬送ガイド11A及び下側搬送ガイド11Bを含んでいる。上側搬送ガイド11Aと下側搬送ガイド11Bとが対向するように配されて搬送路11Rが形成されている。
また、媒体処理装置100は、搬送ローラー13を含んでいる。搬送ローラー13は、1対のローラーが互いに圧接して対向するように配置されて構成されている。搬送ローラー13は、電動モーター(図示せず)によって回転駆動される。小切手Cは搬送路11Rに沿って、搬送ローラー13によって搬送される。
画像取得部15は、受光素子、光源及びレンズを含むイメージセンサ等の素子である。画像取得部15は、例えば一対の素子であり、搬送路11Rに面して互いに対向するように配置されている。画像取得部15は、小切手Cが搬送路11Rを通って画像取得部15を通過する際に、小切手Cの表面の画像を取得する。
また、搬送路11Rに面して、固定磁石17及び磁気ヘッド19が設けられている。固定磁石17は、小切手Cが搬送されて搬送路11Rを通り固定磁石17を通過する際に、小切手Cの表面に印字された磁気インク文字(以下、MICR文字とも称する)を着磁させる。磁気ヘッド19は、搬送路11Rに面して、搬送ローラー19Aと対向するように設けられている。
磁気ヘッド19は、搬送ローラー19Aに対向するように配置されている。磁気ヘッド19は、小切手Cが搬送路11Rを通って磁気ヘッド19を通過する際に、小切手Cの表面に印字された磁気インク文字列から磁気を検出して磁気波形データを取得する。
図2は、媒体処理装置100の機能的構成を示している。媒体処理装置100の動作は、制御部21によって制御される。制御部21は、例えばCPU(Central Processing Unit)であり、演算処理を行う。例えば、制御部21は、電動モーター(図示せず)を制御して搬送ローラー13を回転駆動させる制御を行う。また、制御部21は、画像取得部15における画像取得及び磁気ヘッド19による磁気波形の読み取りを制御する。
また、制御部21は、磁気ヘッド19によって取得された磁気波形データに基づいて、小切手Cの表面に印字された磁気インク文字の認識を行う。
制御部21は、フィルタ部21A、文字切り出し部21B及び文字変換部21Cを含んでいる。フィルタ部21Aは、磁気波形データのフィルタリングによってノイズを除去して得られたフィルタ後磁気波形を出力する。フィルタ部21Aは、複数の方式でフィルタリングを行ってノイズを除去することが可能である。従って、複数の方式でフィルタリングを行った場合には、複数のフィルタ後磁気波形を出力する。
例えば、フィルタ部21Aは、移動平均法によって磁気波形全体の平滑化を行う。また、例えば、フィルタ部21Aは、ローパスフィルタを用いて、特定の閾値よりも高い周波数信号を減衰させて遮断し、低域周波数の信号のみを使用する。また、フィルタ部21Aは、外れ値を除去する方式でフィルタリングを行う。さらに、フィルタ部21Aは、上記したようなフィルタリングの方式を適宜組み合わせた方式でノイズを除去することが可能である。
文字切り出し部21Bは、フィルタ部21Aによってフィルタリングされてノイズ除去されて得られた磁気波形であるフィルタ後磁気波形に対して、1文字毎の領域である文字領域に区分けして文字の切り出しを行う。そして、文字切り出し部21Bは、当該文字領域に区分けされた切り出し後磁気波形を出力する。
文字切り出し部21Bは、複数の方式で文字の切り出しを行うことが可能である。文字切り出し部21Bは、複数の方式で文字の切り出しを行って、複数の切り出し後磁気波形を出力する。
例えば、文字切り出し部21Bは、フィルタ後磁気波形を一定の間隔で区分けする。また、例えば、文字切り出し部21Bは、波形の途切れる箇所で当該フィルタ後磁気波形を区分けする。
文字変換部21Cは、文字切り出し部21Bによる複数の切り出し後磁気波形の各々に対して、磁気波形から文字への変換、すなわち、磁気波形のデータから磁気インク文字を示す文字情報への変換を行う。従って、文字変換部21Cは、複数の文字変換結果を出力する。例えば、文字変換部21Cは、文字領域毎に磁気波形を基準データと比較して一致した場合に、当該基準データに対応する文字情報を当該磁気波形に対応する文字情報として採用し、当該磁気波形を当該文字情報に変換する。
文字変換部21Cは、複数の方式で磁気波形から文字への変換を行うことが可能である。例えば、文字変換部21Cは、磁気波形におけるピークの強弱の相関関係に基づく方式で、基準波形との比較を行う。また、例えば、文字変換部21Cは、磁気波形におけるピーク間の距離に基づく方式で、基準波形との比較を行う。また、例えば、磁気波形の正方向のピークの間隔又は負方向のピークの間隔の特徴に基づく方式で、基準波形との比較を行う。
文字変換部21Cは、磁気インク文字の規格に適した方式で当該文字への変換を行っても良い。例えば、文字変換部21Cは、E−13Bの規格のMICR文字の磁気波形に対しては、磁気波形におけるピークの強弱の相関関係に基づく方式又は磁気波形におけるピーク間の距離に基づく方式で基準波形との比較を行っても良い。
また、例えば、文字変換部21Cは、CMC−7の規格のMICR文字の磁気波形に対しては、磁気波形の正方向のピークの間隔又は負方向のピークの間隔の特徴を含む特徴に基づく方式で基準波形との比較を行っても良い。
文字列認識部21Dは、文字変換部21Cによって出力された複数の文字変換結果に基づいて、小切手Cに印字されている磁気インク文字列によって示される文字列を認識する。例えば、文字列認識部21Dは、複数の文字変換結果の各々の文字領域毎に文字の変換精度を判定し、当該変換精度に基づいて磁気インク文字列によって示される文字列を判定する。
また、例えば、文字列認識部21Dは、複数の文字変換結果の各々の文字領域の位置を判定し、複数の文字変換結果の各々の間で文字領域の各々の位置が一致するか否かを判定する一致判定を行い、一致判定に基づいて磁気インク文字列を判定する。
記憶部23は、ハードディスク、フラッシュメモリ、SSD(Solid State Drive)、RAM(Random Access Memory)等の記憶装置である。記憶部23は、制御部21の処理に必要なデータを予め記憶し、又、制御部21の処理において発生するデータを適宜記憶する。例えば、記憶部23は、制御部21のフィルタ部21Aによるフィルタリングに必要なプログラムを記憶している。
また、記憶部23には、基準波形データベース(以下、基準波形DBとも称する)23Aが記憶されている。基準波形データベース23Aには、文字の種類毎に予め取得された磁気波形が基準波形として保存されている。例えば、文字変換部21Cは、基準波形を基準波形DB23Aから読み出して、磁気波形との比較を行う。
また、記憶部23には、媒体フォーマット23Bが記憶されている。媒体フォーマット23Bは、小切手Cを含む媒体の発行元又は流通地域等の種類毎に予め定められた条件に関する情報を含んでいる。例えば、媒体フォーマット23Bには、磁気インク文字列に印字される文字数又は文字の種類等の磁気インク文字列に記載される形式に関する情報が含まれる。
操作表示部25は、媒体処理装置100の表面(図示せず)に、又は媒体処理装置100とは別体で設けられている。操作表示部25は、ディスプレイ25A及びタッチパッド25Bが組み合わされたタッチパネルディスプレイである。ディスプレイ25Aは、例えば液晶表示装置等の表示器である。ディスプレイ25Aは、制御部21の指示に応じて、媒体処理装置100の操作画面等の情報を含む画面を表示する。
タッチパッド25Bは、例えば、ディスプレイ25Aの表示面を覆う感圧式又は静電式のタッチパッドである。タッチパッド25Bは、媒体処理装置100の使用者がディスプレイ25Aに表示された内容に対応した領域に触れると、当該表示された内容に対応する信号を制御部21に供給して当該使用者の選択又は入力を受け付ける。なお、タッチパッド25Bはタッチパッドではなく操作ボタンであっても良く、媒体処理装置100の表面に、又は媒体処理装置100とは別体で設けられていても良い。
図3A及び図3Bを参照しつつ、媒体処理装置100の制御部21によって実行される文字認識のフロー及び文字認識の過程で生成される情報について説明する。図3Aは、媒体処理装置100において実行される文字認識のフローの一例である文字認識ルーチンR1を示している。文字認識ルーチンR1は、媒体処理装置100に小切手C等の媒体が投入されて搬送され、例えば、磁気ヘッド近傍のセンサ(図示せず)が当該媒体を検知した際に開始される。
フィルタ部21Aは、文字認識ルーチンを開始すると、文字列磁気波形を磁気ヘッド19から取得する(ステップS11)。フィルタ部21Aは、ステップS11の実行後、文字列磁気波形に対してフィルタリングを実行する(ステップS12)。
ステップS12において、フィルタ部21Aは、複数の方式でフィルタリングを実行して、各々の方式によってフィルタリングがなされてノイズが除去された複数のフィルタ後磁気波形を出力する。例えば、ステップS12において、3つの方式でフィルタリングがなされる場合には、3つのフィルタ後磁気波形が生成される。
ステップS12の実行後、文字切り出し部21Bは、複数の磁気波形の各々に対して文字の切り出しを実行する(ステップS13)。ステップS13において、文字切り出し部21Bは、複数の方式で文字の切り出しを実行して、複数のフィルタ後磁気波形の各々について、各々の方式で文字領域毎に区分けされて文字の切り出しが行われた複数の切り出し後磁気波形を出力する。
ステップS13の実行後、文字変換部21Cは、複数の切り出し後磁気波形の各々に対して、磁気波形から文字への変換を実行する(ステップS14)。ステップS14において、文字変換部21Cは、複数の切り出し後磁気波形の各々に対して、複数の方式で文字への変換を行って、複数の文字変換結果を出力する。ここで、文字変換結果の各々は文字列を示す情報である。
ステップS14において、文字変換部21Cは、基準波形DB23Aに保存されている基準波形と、ステップS13において出力された切り出し後磁気波形とを比較することで、磁気波形から文字への変換を実行する。ステップS14の実行後、文字列認識部21Dは、文字変換部21Cによって出力された複数の文字変換結果に基づいて磁気インク文字列によって示される文字列を認識する(ステップS15)。
ステップS15において、文字列認識部21Dは、ステップS14において出力された複数の文字変換結果の各々の文字領域毎に、磁気波形と基準波形との一致度を示す変換精度を判定する。文字列認識部21Dは、ステップS15において、当該変換精度に基づいて、磁気インク文字列の認識結果を生成する。当該認識結果は、1つのみ生成されても良く、複数の認識結果が生成されても良い。
例えば、ステップS15において、当該文字の変換精度は、文字変換結果毎に比較される。例えば、文字変換結果に含まれる各々の文字領域の変換精度を合計した値が、複数の文字変換結果間で比較される。例えば、ステップS15において、当該文字領域の変換精度を合計した値が最大の文字変換結果を選択して、当該文字変換結果を認識結果としてもよい。
また、ステップS15において、文字列認識部21Dは、文字領域の位置に基づいて、磁気インク文字列の認識結果の候補を抽出する。ステップS15において、文字列認識部21Dは、複数の文字変換結果の各々の文字領域の位置を判定し、複数の文字変換結果の各々の間で文字領域の各々の位置が一致するか否かを判定する一致判定を行う。そして、当該一致判定に基づいて、認識結果の候補を抽出する。
例えば、ステップS15において、文字列認識部21Dは、当該一致判定において、文字領域の各々の位置が互いに一致すると判定された文字変換結果を含む複数の文字変換結果群が存在する場合に、当該文字変換結果群に含まれる文字変換結果の数に基づいて文字変換結果を抽出する。例えば、文字列認識部21Dは、最も多くの文字変換結果を含む文字変換結果群に属する文字変換結果を抽出し、当該抽出された文字変換結果に基づいて、認識結果を生成する。
例えば、当該抽出された文字変換結果に含まれる各々の文字領域の変換精度を合計した値又は平均値の最も大きいものが選択されて、認識結果とされてもよい。
また、例えば、ステップS15において、上記一致判定に基づいて文字変換結果が抽出される場合に、1の文字変換結果を選択して認識結果とせず、複数の文字変換結果を組み合わせて認識結果としてもよい。例えば、1の文字領域は1の文字変換結果に基づいて決定し、他の1の文字領域は他の1の文字変換結果に基づいて決定してもよい。すなわち、各文字領域において異なった文字変換結果に基づいて認識結果を生成してもよい。
文字列認識部21Dは、ステップS15において、認識結果の候補が複数抽出された場合には、当該抽出された認識結果の候補の中から、磁気インク文字列によって示される文字列を選択することで認識結果とする。
例えば、文字列認識部21Dは、文字の変換精度又は文字領域の位置に基づいて、文字列を選択する。例えば、文字列認識部21Dは、文字の変換精度が最も高い文字変換結果に含まれる文字を磁気インク文字列によって示される文字列として選択する。
また、例えば、文字領域の位置によって画定される文字数が、予め定められた文字数に一致するか否かに基づいて、文字列が認識されても良い。ステップS15の終了後、文字認識ルーチンR1は終了される。
図3Bは、文字認識ルーチンR1の各ステップにおいて生成するデータの種類及び数を模式的に示している。図3Bは、フィルタ部21AがステップS12におけるフィルタリングを3つの方式で実行し、文字切り出し部21BがステップS13における文字の切り出しを3つの方式で実行し、文字変換部21CがステップS14における文字への変換を3つの方式で実行した場合について示している。
ステップS11において、磁気ヘッド19から文字列磁気波形D1が取得される。続いてステップS12において、1の文字列磁気波形D1に対して、フィルタ部21Aによって3つの方式でフィルタリングが実行されると、3つのフィルタ後磁気波形であるフィルタ後磁気波形D2が生成される。
例えば、フィルタ後磁気波形D2には、「フィルタ後磁気波形1」、「フィルタ後磁気波形2」及び「フィルタ後磁気波形3」が含まれる。すなわち、磁気ヘッド19による磁気波形の再取得をする必要無しに、1の文字列磁気波形D1から、異なる方式でフィルタリングされた3つのフィルタ後磁気波形が生成される。
これらの3つのフィルタ後磁気波形の各々に対して、ステップS13において、文字切り出し部21Cによって、3つの方式で文字の切り出しが実行されると、切り出し後磁気波形D3が生成される。図3Bに示すように、切り出し後磁気波形D3には、「切り出し後磁気波形1−1」、「切り出し後磁気波形1−2」・・・「切り出し後磁気波形3−3」の9つの切り出し後磁気波形が含まれる。
さらに、これらの9つのフィルタ後磁気波形に対して、ステップS14において、文字変換部21Cによって、3つの方式で文字への変換が行われると、文字変換結果D4が生成される。文字変換結D4には、「文字変換結果1−1−1」、「文字変換結果1−1−2」、「文字変換結果1−1−3」、「文字変換結果1−2−1」、「文字変換結果1−2−2」・・・・「文字変換結果3−3−3」の27個の文字変換結果が含まれる。
これらの27個の文字変換結果の中から、ステップS15において、文字列認識部21Dによって認識結果D5が生成される。認識結果D5には、1の認識結果又は複数の認識結果の候補が含まれる。認識結果の候補は、文字変換結果毎に抽出されても良く、文字領域毎に抽出された文字の組み合わせからなる文字列として抽出されても良い。
図4は、フィルタ後磁気波形D2に含まれる複数のフィルタ後磁気波形の例を示している。図4の(a)は、E−13Bの規格のMICR文字を示している。図4の(b)、(c)及び(d)は、互いに異なる方式で、文字列磁気波形がフィルタリングされて得られたフィルタ後磁気波形である。
図5Aは、E−13Bの規格のMICR文字について、切り出し後磁気波形D3に含まれる切り出し後磁気波形の例を示している。図5Aの(a)及び(b)は、互いに異なる方式で文字の切り出しが行われた際の切り出し後磁気波形である。図中の破線で囲まれた部分は、文字領域毎に区分けされた際の文字領域を示している。
図中の「N」は、磁気波形中のノイズを指している。当該ノイズNは、文字列の開始前に現れた文字列に起因しないノイズである可能性がある。図5A(a)において、ノイズNを含まない磁気波形が文字領域毎に区分けされている。一方、図5A(b)においては、ノイズNを含めた磁気波形が文字領域毎に区分けされている。
図5Bは、CMC−7の規格のMICR文字について、切り出し後磁気波形D3に含まれる切り出し後磁気波形の例を示している。図中の破線で囲まれた部分は、文字領域毎に区分けされた際の文字領域を示している。例えば、磁気波形中のピーク同士の間隔に基づいて磁気波形が文字領域毎に区分けされた場合に、図5Bに示すような区分けがなされる。
図6を参照しつつ、文字列認識部21Dによって行われる文字変換結果からの認識結果の候補の抽出及び選択について説明する。図6は、文字変換部21Cによって生成される複数の文字変換結果について、各々の文字変換結果に含まれる文字領域毎の文字及び当該文字に対応する変換精度の一覧を示している。図6において変換精度は、基準波形との一致度として算出された10段階の数値として表されている。
また、図6は、文字変換結果及び変換精度とともに、文字領域の位置を示している。例えば、文字領域の位置は、文字列の開始から終了に向かう方向の軸をx軸とした場合の、磁気波形データにおける座標として表される。図6において、当該文字領域の位置は、磁気波形データにおけるx座標1から10までのx軸が文字領域毎に区分けされた際の座標位置として示されている。
また、図6は、フィルタ部21AがステップS12(図3A参照)におけるフィルタリングを2つの方式で実行し、文字切り出し部21BがステップS13における文字の切り出しを2つの方式で実行し、文字変換部21CがステップS14における文字への変換を2つの方式で実行した場合の8つの文字変換結果について示している。
例えば、文字列認識部21Dは、同じ文字変換結果内の文字領域毎の変換精度の平均値に基づいて、認識結果を生成する。例えば、文字列認識部21Dは、変換精度の平均値が最も高いものを認識結果とする。図6において、文字変換結果1−2−1の各文字領域の変換精度の平均値は8.6であり、8つの文字変換結果の中で最も高い。この場合、文字変換結果1−2−1が認識結果として選択されても良い。
また、例えば、文字列認識部21Dは、変換精度の平均値が所定の閾値以上の文字変換結果を認識結果の候補として抽出しても良い。例えば、図6において、閾値を8.0とした場合に、文字変換結果1−1−1、文字変換結果1−1−2、文字変換結果1−2−1及び文字変換結果2−1−2を認識結果の候補として抽出しても良い。当該抽出された認識結果の候補から、さらに文字領域の位置等に基づいて認識結果が選択されても良い。
また、例えば、文字列認識部21Dは、文字領域の位置に基づいて、磁気インク文字列の認識結果の候補を抽出する。図6において、文字変換結果1−1−1、文字変換結果1−1−2、文字変換結果2−1−1及び文字変換結果2−1−2の4つの文字変換結果は、文字領域の位置が一致している。また、文字変換結果1−2−1及び文字変換結果1−2−2は2つの文字変換結果の間で文字領域の位置が一致している。
従って、上記の文字変換結果1−1−1を含む4つの文字変換結果は、文字領域の各々の位置が互いに一致していると判定された最も多い文字変換結果を含む文字変換結果群であるといえる。この場合、文字列認識部21Dは、文字変換結果1−1−1、文字変換結果1−1−2、文字変換結果2−1−1及び文字変換結果2−1−2を認識結果の候補として抽出しても良い。
文字列認識部21Dは、各文字領域において異なった文字変換結果に基づいて認識結果を生成してもよい。例えば、文字領域毎に、変換精度が最も高い文字を選択して認識結果としても良い。また、例えば、同じ文字領域について複数の文字変換結果の間で共通する文字に変換されている場合に、当該共通の文字の変換精度を合計して比較しても良い。
例えば、文字変換結果1−1−1と文字領域の位置が一致する上記の文字変換結果において、1文字目が「1」である場合の変換精度の合計は29であり、1文字目が「7」である場合の変換精度の合計は9である。この場合、変換精度の合計がより大きい「1」を1文字目の認識結果としても良い。同様に、各々の文字領域の同じ結果同士の変換精度の合計が最も大きい文字を選択することで、認識結果として「12345」の文字列が得られる。
図7は、文字領域の位置が一致する文字変換結果において共通の文字の変換精度を合計して比較した例を示している。図7には、共通の文字の変換精度の合計が大きい順に組み合わせた抽出結果の上位2位までが示されている。図7の「抽出結果」中の「変換精度合計」は、同じ文字領域に含まれる同じ文字を示す文字同士の変換精度を文字領域毎に合計した結果を示している。当該変換精度の文字領域毎の合計の値が最も大きい結果が「抽出結果1位」、2番目に大きい結果を「抽出結果2位」として示されている。
また、図7中の「認識結果」は、「抽出結果1位」となった文字が磁気インク文字列によって示される文字列であると判定された結果を示している。このように、文字列認識部21Dは、多数通りの文字変換結果から、変換精度及び文字領域の位置に基づいて、より確からしい認識結果を、磁気インク文字列の認識の精度である認識精度の高い結果として抽出又は選択することが可能である。なお、図7においては文字領域の位置が一致する文字変換結果について説明したが、これに限らず、複数の文字変換結果の各々の間で対応する位置の文字領域の文字が同じ文字を示す場合に、同じ文字を示す文字同士の変換精度を合計した結果を用いても良い。
さらに、文字列認識部21Dは、複数の文字変換結果のいずれにおいても文字領域の位置が一致しない又は同じ認識結果が所定の数以上存在しない等の所定の基準を満たさない場合に、最終的な認識結果を生成しない、すなわち、磁気インク文字列を認識しないこととしても良い。これによって、精度の低い認識結果が生成されることを防止することができる。
なお、複数の文字変換結果から認識結果が選択される際に、媒体フォーマット23Bに記憶された情報に基づいて選択されても良い。例えば、小切手Cの種類毎に既に明らかとなっている発行元の国名又は金融機関名等の情報から、磁気インク文字列の形式に関する文字数又は特定の文字等の情報が特定され、これに合致する文字変換結果が抽出又は選択されても良い。このように、予め定められた条件を満たさない文字変換結果を除外することによって、多数通りの文字変換結果を効率良く絞り込むことができ、かつ、既に特定されている文字数等の情報を用いることで認識の精度を向上させることができる。
以上、詳細に説明したように、実施例1の媒体処理装置100によれば、小切手等の媒体に印字された磁気インク文字列から読み取られた1の磁気波形に対して、複数の方式によるフィルタリング、複数の方式による文字の切り出し、及び複数の方式による磁気波形から文字への変換を行うことができる。従って、フィルタリング、文字の切り出し及び文字への変換の各々の異なる方式の多数通りの組み合わせによる多数通りの文字変換結果を出力することができる。磁気波形を複数回取得すること無しに、多数通りの文字変換結果を効率良く出力することができる。
さらに、当該多数通りの文字変換結果の中から、文字領域の位置及び文字変換の変換精度に基づいて、磁気インク文字列によって示される文字列を選択して認識することができ、より精度の高い認識結果を得ることができる。従って、磁気インク文字列から読み取られた磁気読取データにノイズが入った場合であっても、高効率かつ高精度な文字認識が可能である文字認識装置を提供することができる。
図1、図2及び図8を参照しつつ、実施例2の文字認識装置について説明する。実施例2の文字認識装置としての媒体処理装置は、図1及び図2に示す実施例1の媒体処理装置100と同様に構成されている。図8は、媒体処理装置100において操作表示部25のディスプレイ25Aに表示される小切手Cの認識結果を示している。
実施例2において、制御部21は、文字列認識部21Dによる認識結果を画像取得部15が取得した小切手Cの画像とともにディスプレイ25Aに表示させる。すなわち、制御部21及びディスプレイ25Aは、認識結果をユーザに告知する認識結果告知部として機能する。
図8において、小切手Cの表面の画像201には、小切手Cの表面に印字された磁気インク文字列(MICR文字列)の画像201Aが含まれている。また、図8において、小切手Cの表面の画像201の下方に認識結果の画像202が表示されている。認識結果の画像202には、認識結果としての文字及び文字領域の位置が表示されている。
図8において、複数の認識結果として認識結果1、認識結果2及び認識結果3が、認識精度が高い順に表示されている例について示している。図8の例において、文字領域の各々の変換精度の文字変換結果毎の平均値を認識精度とし、当該認識精度が高い順に選択された3つの文字変換結果が認識結果として示されている。制御部21は、文字列認識部21Dによる認識の際に生成された認識結果の候補を認識精度が高い順にディスプレイ25Aに表示させる。
また、操作表示部25のタッチパッド25Bは、ユーザによって認識結果1、認識結果2及び認識結果3のうち正しい結果が選択された際の選択の入力を受け付ける。認識結果の画像202には、入力欄203が設けられている。入力欄203は、媒体処理装置100のユーザによる文字の入力を受け付ける。
例えば、認識結果が磁気インク文字列の画像201Aと一致しない場合に、ユーザは、磁気インク文字列の画像201Aに表示されている正しい文字を入力欄203に入力することができる。当該入力は、例えば入力用のテンキー(図示せず)によって行われても良い。
また、操作表示部25は、ユーザによる修正の入力を文字領域毎に受付けても良い。この場合、ユーザは、認識結果中の誤った文字が表示された部分を選択して正しい文字を入力することができる。
例えば、図8において、ユーザは、「認識結果2」のうちの1つの文字領域に含まれる1文字を修正した上で、「認識結果2」を正しい結果として選択することができる。制御部21及びタッチパッド25Bは、ユーザによる選択又は修正の入力の際に、選択の入力を受け付ける選択入力受付部又は修正の入力を受け付ける修正入力受付部として機能する。
文字列認識部21Dは、認識結果の選択又は入力欄203若しくは認識結果中の文字領域への文字の入力が受け付けられると、当該入力された文字を小切手Cの認識結果とする。すなわち、選択又は修正の入力に基づいて、磁気インク文字列の認識結果が再度生成される。例えば、制御部21は、小切手Cの認識結果を記憶部23に記憶させる。
なお、ユーザによる修正を受付けた場合には、制御部21は、修正された結果を磁気波形データと共に記憶部23に記憶させても良い。例えば、当該修正された結果は、基準波形DB23Aに追加されても良い。
また、例えば、文字変換部21Cは、当該ユーザの修正によって追加された情報を用いて磁気波形から文字への変換を行っても良い。これによって、例えば、磁気インク文字列の磁気波形にノイズが入った場合の、基準波形とは異なる波形に関する認識結果を記憶部23に蓄積することができる。このように、媒体処理装置100は、ユーザによる修正の結果をフィードバックして蓄積することで、より精度の高い認識を行うことができる。
なお、本実施例において、認識結果をディスプレイ25Aに表示させることによってユーザに告知する例について説明したが、この限りではない。例えば、認識結果は、音声によって告知されても良い。例えば、認識結果が複数ある場合には、認識精度の高い順に読み上げられた音声によって、認識結果が告知されても良い。すなわち、ユーザが認識結果を知ることが可能な態様で告知されれば良い。
また、本実施例において、認識結果告知部が認識結果を告知する際に、認識精度が高い順に告知する例について説明したが、認識精度の高い順に限らない。例えば、認識結果は、文字列の1文字目の文字の変換精度の高い順、文字数が多い順など、他の順序に従って告知されても良い。すなわち、複数の認識結果は、ユーザに対して所定の順に告知されれば良い。
以上、説明したように、実施例2の媒体処理装置100によれば、磁気インク文字列によって示される文字列の認識の際に、多数通りの文字変換結果を複数の認識結果として所定の順にユーザに告知することができる。従って、高精度の認識結果から順に、表示画面に表示することでユーザに提示して、修正を受けることができる。当該修正後の認識結果を採用することで、より認識の精度を高めることができる。従って、磁気インク文字列から読み取られた磁気読取データにノイズが入った場合であっても、高効率かつ高精度な文字認識が可能である文字認識装置を提供することができる。
なお、本発明に係る複数の方式によるフィルタリング、複数の方式による文字の切り出し、及び複数の方式による文字変換を行う文字認識は、磁気波形以外の波形を用いた文字認識にも応用できる。例えばラインセンサ等を用いて取得された可視光の波形に応用することで、可視光を用いた文字認識にも応用可能である。
また、実施例1及び実施例2において、媒体処理装置100によって、小切手Cに印字された磁気インク文字列の認識を行う例について説明したが、これに限らない。媒体処理装置100は、小切手に限らず、手形又は他の有価証券等の媒体に印字された磁気インク文字列の認識に用いることができる。
以上、説明したように、本発明の文字認識装置によれば、小切手等の媒体に印字された磁気インク文字列から読み取られた1の磁気波形に対して、フィルタリング、文字の切り出し及び文字への変換の各々を複数の方式で行って、多数通りの文字変換結果を効率良く出力することができる。そして、当該多数通りの文字変換結果の中から、文字領域の位置及び文字への変換精度に基づいて、磁気インク文字列の認識結果となる文字変換結果を選択することができ、高精度な認識結果を得ることができる。
従って、磁気インク文字列から読み取られた磁気波形にノイズが入った場合であっても、高効率かつ高精度な文字認識が可能である文字認識装置を提供することができる。
100 媒体処理装置
11A 上側搬送ガイド
11B 下側搬送ガイド
11R 搬送路
13 搬送ローラー
15 画像取得部
17 固定磁石
19 磁気ヘッド
19A 搬送ローラー
21 制御部
21A フィルタ部
21B 文字切り出し部
21C 文字変換部
21D 文字列認識部
23 記憶部
23A 基準波形DB
23B 媒体フォーマット
25 操作表示部
25A ディスプレイ
25B タッチパッド

Claims (16)

  1. 媒体に印字された磁気インク文字列から読み取られた磁気波形に対して、1又は複数の方式でフィルタリングをしてノイズ除去を行って得られた磁気波形である1又は複数のフィルタ後磁気波形を出力するフィルタ部と、
    前記1又は複数のフィルタ後磁気波形に対して複数の方式で文字の切り出しを行って、前記磁気インク文字列の1文字毎の領域である文字領域毎に区分けされた磁気波形である複数の切り出し後磁気波形を出力する文字切り出し部と、
    前記複数の切り出し後磁気波形の各々に対して、1又は複数の方式で前記文字領域毎に文字への変換を行うことで得られた複数の文字変換結果を出力する文字変換部と、
    前記複数の文字変換結果に基づいて、前記磁気インク文字列を認識する文字列認識部と、を有する文字認識装置。
  2. 前記フィルタ部は、前記磁気インク文字列から読み取られた磁気波形に対して、複数の方式でフィルタリングをしてノイズ除去を行って得られた磁気波形である複数のフィルタ後磁気波形を出力することを特徴とする請求項1に記載の文字認識装置。
  3. 前記文字変換部は、前記複数の切り出し後磁気波形の各々に対して、複数の方式で前記文字への変換を行うことで得られた複数の文字変換結果を出力することを特徴とする請求項1又は2に記載の文字認識装置。
  4. 前記文字列認識部は、前記複数の文字変換結果の各々の文字領域毎に前記文字の変換精度を判定し、当該変換精度に基づいて前記磁気インク文字列を認識することを特徴とする請求項1乃至3のいずれか1つに記載の文字認識装置。
  5. 前記文字列認識部は、前記複数の文字変換結果の各々の文字領域の位置を判定し、前記複数の文字変換結果の各々の間で前記文字領域の各々の位置が一致するか否かを判定する一致判定を行い、前記一致判定に基づいて前記磁気インク文字列を認識することを特徴とする請求項1乃至4のいずれか1つに記載の文字認識装置。
  6. 前記文字列認識部は、前記複数の文字変換結果の各々の間で、各々の文字変換結果における前記文字領域毎の前記文字の変換精度の合計が最も大きい文字変換結果を前記磁気インク文字列の認識結果とすることを特徴とする請求項4又は5に記載の文字認識装置。
  7. 前記文字列認識部は、前記複数の文字変換結果の各々の間で一致する位置の前記文字領域の前記文字の変換精度が最も高い文字を選択して前記磁気インク文字列を認識することを特徴とする請求項5又は6に記載の文字認識装置。
  8. 前記文字列認識部は、前記複数の文字変換結果の各々の間で対応する位置の前記文字領域の文字が同じ文字を示す場合に、当該同じ文字を示す文字同士の前記文字の変換精度を合計し、当該変換精度の合計が最も大きい文字を選択して前記磁気インク文字列を認識することを特徴とする請求項5乃至7のいずれか1項に記載の文字認識装置。
  9. 前記文字列認識部は、前記一致判定において、前記文字領域の各々の位置が互いに一致すると判定された文字変換結果を含む複数の文字変換結果群が存在する場合に、最も多くの文字変換結果を含む前記文字変換結果群に属する文字変換結果を抽出し、当該抽出された前記文字変換結果に基づいて、前記磁気インク文字列を認識することを特徴とする請求項5乃至8のいずれか1項に記載の文字認識装置。
  10. 前記文字列認識部は、前記磁気インク文字列を認識する際に、前記複数の文字変換結果のいずれにおいても所定の基準を満たさない場合には、前記磁気インク文字列を認識しないことを特徴とする請求項1乃至9のいずれか1項に記載の文字認識装置。
  11. 前記文字列認識部は、前記磁気インク文字列を認識する際に、前記媒体の種類毎に予め定められた条件に基づいて、前記複数の文字変換結果の各々のうち前記条件を満たさない文字変換結果を除外することを特徴とする請求項1乃至10のいずれか1項に記載の文字認識装置。
  12. 前記文字列認識部による認識によって生成される認識結果を告知する認識結果告知部をさらに有することを特徴とする請求項1乃至11のいずれか1項に記載の文字認識装置。
  13. 前記認識結果告知部によって告知された認識結果に対するユーザによる修正の入力を受け付ける修正入力受付部を有し、前記文字列認識部は、前記修正入力受付部によって受け付けられた前記修正の入力に基づいて、前記認識結果を再度生成することを特徴とする請求項12に記載の文字認識装置。
  14. 前記文字列認識部は、前記磁気インク文字列の複数の認識結果を生成し、
    前記認識結果告知部は、前記複数の認識結果を告知することを特徴とする請求項12又は13に記載の文字認識装置。
  15. 前記認識結果告知部は、前記複数の認識結果を前記磁気インク文字列の認識の精度である認識精度が高い順に告知することを特徴とする請求項14に記載の文字認識装置。
  16. 前記認識結果告知部によって告知された認識結果に対するユーザによる選択の入力を受け付ける選択入力受付部を有し、前記文字列認識部は、前記選択入力受付部によって受け付けられた前記選択の入力に基づいて、前記認識結果を再度生成することを特徴とする請求項14又は15に記載の文字認識装置。
JP2018022937A 2018-02-13 2018-02-13 文字認識装置 Pending JP2019139551A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018022937A JP2019139551A (ja) 2018-02-13 2018-02-13 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018022937A JP2019139551A (ja) 2018-02-13 2018-02-13 文字認識装置

Publications (1)

Publication Number Publication Date
JP2019139551A true JP2019139551A (ja) 2019-08-22

Family

ID=67694104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018022937A Pending JP2019139551A (ja) 2018-02-13 2018-02-13 文字認識装置

Country Status (1)

Country Link
JP (1) JP2019139551A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021020378A1 (ja) 2019-07-30 2021-02-04 キヤノン株式会社 発光素子及び発光素子の製造方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021020378A1 (ja) 2019-07-30 2021-02-04 キヤノン株式会社 発光素子及び発光素子の製造方法

Similar Documents

Publication Publication Date Title
CA2797363C (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
JP6528147B2 (ja) 会計データ入力支援システム、方法およびプログラム
KR102208683B1 (ko) 문자 인식 방법 및 그 장치
US20110280481A1 (en) User correction of errors arising in a textual document undergoing optical character recognition (ocr) process
US7970213B1 (en) Method and system for improving the recognition of text in an image
CN104166474A (zh) 信息处理装置和字符识别方法
US20180089835A1 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
US11438467B2 (en) Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters
JP5600723B2 (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
US11341739B2 (en) Image processing device, image processing method, and program recording medium
US8750571B2 (en) Methods of object search and recognition
US20180053045A1 (en) Automated Processing of Receipts and Invoices
JP4087421B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
JP2019139551A (ja) 文字認識装置
CN114419636A (zh) 文本识别方法、装置、设备以及存储介质
JP5357711B2 (ja) 文書処理装置
JP2015135576A (ja) 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム
US20220392107A1 (en) Image processing apparatus, image processing method, image capturing apparatus, and non-transitory computer-readable storage medium
JP2020095374A (ja) 文字認識システム、文字認識装置、プログラム及び文字認識方法
US11972208B2 (en) Information processing device and information processing method
JP6075158B2 (ja) 文字入力支援プログラムおよび文字入力支援装置
WO2015160988A1 (en) Smart optical input/output (i/o) extension for context-dependent workflows
RU2707320C1 (ru) Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
CN106326727A (zh) 一种密码识别方法与设备
JP2003115028A (ja) 帳票識別辞書自動生成方法及び帳票処理システム