JP5624671B2 - 文字列切出方法及び文字列切出装置 - Google Patents
文字列切出方法及び文字列切出装置 Download PDFInfo
- Publication number
- JP5624671B2 JP5624671B2 JP2013503242A JP2013503242A JP5624671B2 JP 5624671 B2 JP5624671 B2 JP 5624671B2 JP 2013503242 A JP2013503242 A JP 2013503242A JP 2013503242 A JP2013503242 A JP 2013503242A JP 5624671 B2 JP5624671 B2 JP 5624671B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- frame
- evaluation value
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
この発明は、紙葉類を撮像した紙葉類画像から文字列を切り出して文字認識を行う際の文字列切出方法及び文字列切出装置に関する。
紙幣、小切手、手形や商品券等の紙葉類には該紙葉類を特定する文字列が識別番号として印刷されている。紙幣の場合には、この識別番号が記番号と呼ばれている。例えば偽造紙幣が発見された場合に、その偽造紙幣が自行で取引された紙幣であるか否かを、この記番号を利用して確認することができる。そのため金融機関等では、この記番号を自動的に文字認識してデータベースに登録し、取引する紙幣を管理したいという要求がある。
紙幣の記番号を利用してデータベースを構築するためには、データとして登録する記番号を正確に文字認識する必要があるが、この文字認識は紙幣を撮像した紙幣画像から記番号画像を切り出して行われる。そのため記番号である文字列の位置を特定して画像を正確に切り出す必要がある。画像上の文字列を切り出すための技術として、例えば特許文献1には、色情報に基づいて背景と文字列を区別して、文字列の画像のみを切り出す方法が開示されている。具体的には、カラーの紙幣画像を利用して、文字列を含む領域の画像から背景の色を示す画素を取り除くことによって文字列の画像のみを切り出す方法である。
また、特許文献2には、文字と背景で濃度が異なることを利用して文字列の画像を切り出す方法が開示されている。具体的には、文字列を含む領域で画像の濃度を投影したヒストグラムを生成し、濃度投影値が所定しきい値を超える領域を文字列画像として切り出す方法である。切り出した領域の幅が、予め設定された文字列画像の幅と許容範囲内で一致するようにしきい値を調整することによって、記番号画像を背景や汚れから分離して切り出すことができる。
また、特許文献3には、文字切出ウィンドウによって文字列上を走査して各文字の位置を検出することにより、文字列を形成する各文字を一文字ずつ切り出す方法が開示されている。具体的には、文字列を形成する文字のうち大きさが最小の文字に合わせて設けた中心領域と、中心領域の外側で最大の文字に合わせて設けた帯状の外接領域と、外接領域の外側で各文字間のスペースに基づいて設けた帯状の背景領域とからなる文字切出ウィンドウを利用する。2値化した文字列画像上で文字切出ウィンドウを移動させて、背景領域及び外接領域では領域内の文字を形成する画素の合計面積が所定条件を満たし、かつ中心領域では文字の投影長が所定値を満たした場合に、その位置を文字位置として検出して文字画像を切り出す方法である。
しかしながら、色情報を利用する特許文献1の方法では、印刷された文字列と背景とが同色系である場合に背景と文字列とを区別できないことがある。紙幣は、発行国や金種によって様々な大きさ、色、模様等を有しているが、記番号が背景と同色系で印刷されることもあり、このような場合に対応できない。
また、文字列の濃度を表したヒストグラムを利用する特許文献2の方法では、文字列近傍に文字認識対象外の文字が印刷されていたり文字列の背景に絵柄や模様があると、文字列を正確に切り出すことができない場合がある。紙幣上には、記番号以外に発行国に関する情報や金額等の情報が印刷されている場合がある。また記番号の背景に絵柄や模様が描かれている場合もある。記番号以外の文字や背景の模様が存在すると、ヒストグラムの値が変化するため記番号の切出処理に影響を及ぼす。
具体的には、例えば図20(A)に示すように、記番号領域101のY方向の濃度分布を示すヒストグラムにおいて、図示したしきい値hを超える領域を切り出すと、記番号102の上部に印刷された切出対象外の文字列103の画像のみを切り出すことになる。また記番号102が含まれるようにしきい値を低くしても、対象外文字列103と記番号102の両方が含まれる画像領域を切り出すことになり、記番号102のみが含まれる画像を切り出すことはできない。その結果、切り出した領域で文字認識を行っても記番号102を正確に文字認識することができない場合がある。なお対象外の文字列103が領域101内に含まれないように、記番号領域101とする領域のY方向の高さを縮小する方法もあるが、記番号102の印刷位置に誤差があるため縮小できない場合がある。また図20(B)に示すように、記番号102の背景に模様が描かれている場合には、背景の影響を受ける。記番号領域101のX方向の濃度分布を示すヒストグラムにおいて、図示したしきい値hを超える領域を切り出しても、記番号102を形成する各文字の位置を正確に特定することはできない。
また、一文字分に相当する大きさの文字切出ウィンドウを利用する特許文献3の方法でも、図20(B)に示したような場合には、文字と背景との濃度差が小さいために各文字の位置を正確に検出できず、各文字を切り出すことができない。
本発明は、上記従来技術による課題を解決するためになされたものであって、文字列の近傍に処理対象外の文字列が印刷されている場合や、文字列の背景に絵柄や模様がある場合でも、文字列を形成する各文字の位置を特定して、その画像を正確に切り出すことができる文字列切出方法及び文字列切出装置を提供することにある。
上述した課題を解決し、目的を達成するため、文字列が印刷又は印字された紙葉類を撮像した紙葉類画像に文字枠を施して文字列の画像を切り出す文字列切出方法であって、文字列を形成する各文字を含む領域を文字部、この文字部の周囲に接する環状領域を外周部、文字部とその外周部とを合わせたものを文字枠とし、全ての文字枠を含む領域を文字列枠として設定する文字列枠設定工程と、各文字枠を対象として文字部内及び外周部内の各画像の特徴量を算出する特徴量算出工程と、文字列枠を対象として先に算出した特徴量に基づく文字列枠評価値を算出する評価値算出工程と、紙葉類画像上で文字列枠の位置を移動させる文字列枠移動工程と、文字列枠評価値が最大となる位置での文字列枠を用いて文字部内の画像を切り出す画像切出工程とを含むことを特徴とする。
また、本発明は、上記発明において、文字列枠が、紙葉類の種類に応じて設定されることを特徴とする。
また、本発明は、上記発明において、特徴量が、領域内全画素の濃度平均値であることを特徴とする。
また、本発明は、上記発明において、文字列枠設定工程では、文字列を形成する文字に加えて、文字列に隣接する余白部分にも文字部及び外周部を設定し、評価値算出工程では、余白部分に設定された文字部及び外周部の特徴量に基づく値を文字列枠評価値から減算した値を文字列枠評価値とすることを特徴とする。
また、本発明は、上記発明において、文字列枠設定工程では、文字列を形成する文字に加えて、紙葉類に印刷された切り出し対象外の文字にも文字部及び外周部を設定し、評価値算出工程では、切り出し対象外の文字に設定された文字部及び外周部の特徴量に基づく値を文字列枠評価値から減算した値を文字列枠評価値とすることを特徴とする。
また、本発明は、上記発明において、文字列枠設定工程では、文字列を形成する文字に加えて、文字列と所定の位置関係で紙葉類に印刷された切り出し対象外の文字又は模様にも文字部及び外周部を設定し、評価値算出工程では、切り出し対象外の文字又は模様に設定された文字部及び外周部の特徴量に基づく値を文字列枠評価値に加算した値を文字列枠評価値とすることを特徴とする。
また、本発明は、上記発明において、画像切出工程では、余白部分、切り出し対象外の文字又は模様に設定された文字部内の画像は切り出さないことを特徴とする。
また、本発明は、上記発明において、紙葉類画像上に設定された文字列枠の位置を固定したまま、文字部及び外周部を、文字列枠に対して所定方向に所定画素分移動させて特徴量を算出する工程、をさらに含み、評価値算出工程では、文字列枠が固定された位置で、文字部及び外周部の移動後の文字列枠評価値が、移動前の文字列枠評価値より大きいときは、文字列枠評価値を移動後の値とするとともに、画像切出工程では、移動後の文字部内の画像を切り出し対象とすることを特徴とする。
また、本発明は、文字列枠に含まれる複数の文字枠のうちの一部を対象として、画像切出工程を除く各工程を実行して特徴量及び文字列枠評価値を算出する第1部分評価工程、をさらに含み、第1部分評価工程によって算出した前記文字列枠評価値が最大値から所定順位以内となった文字列枠の位置でのみ、文字枠の全てを対象とした特徴量算出工程、評価値算出工程、及び画像切出工程を実行することを特徴とする。
また、本発明は、文字列枠に含まれる複数の文字枠のうちの一部を対象として、特徴量及び文字列枠評価値を算出する第2部分評価工程、をさらに含み、第2部分評価工程によって算出した文字列枠評価値が所定しきい値を超えた文字列枠の位置でのみ、文字枠の全てを対象とした特徴量算出工程、評価値算出工程、及び画像切出工程を実行することを特徴とする。
また、本発明は、文字列が印刷又は印字された紙葉類を撮像した紙葉類画像を受信して文字列枠を施すことにより文字列の画像を切り出す文字列切出装置であって、紙葉類画像が傾いている場合にはこの傾きを補正する斜行補正部と、紙葉類画像又は斜行補正部によって補正された紙葉類画像から文字列を含む領域を抽出する部分領域抽出部と、文字列を形成する文字を含む領域を文字部、文字部の周囲に接する環状領域を外周部、文字部とその外周部とを合わせたものを文字枠、全ての文字枠を含む領域を文字列枠として設定して、文字列枠の位置を移動させながら文字部及び外周部の画像の特徴量を算出するとともに、各位置で算出した外周部及び文字部の特徴量に基づく文字列枠評価値を算出する評価値算出部と、文字列枠評価値が最大となる文字列枠の位置における文字部を、画像を切り出す領域に決定する文字位置決定部とを備えることを特徴とする。
本発明によれば、紙葉類に印刷された文字列を形成する各文字に対して文字部及び外周部を設定して、文字部及び外周部を含む文字列枠の位置を変更しながら、文字列枠に含まれる全ての文字部及び外周部から算出した文字列枠評価値を相対的に評価して文字列枠の位置を決定し、文字部に含まれる各文字の画像を切り出すこととしたので、切出対象外の文字列や背景の模様等の影響を抑制し、文字列を形成する各文字の画像を正確に切り出すことができる。
また、本発明によれば、処理対象となる紙葉類の種類に応じて文字部、外周部、文字列枠を設定するので、紙葉類毎に適切な文字列枠を設定して、文字列を形成する各文字の画像を正確に切り出すことができる。
また、本発明によれば、文字部及び外周部の各々に含まれる全画素の濃度平均値によって文字列枠評価値を算出することとしたので、グレースケールの紙葉類画像を利用して文字列の位置を正確に特定することができる。
また、本発明によれば、文字列に加えて文字列に隣接する余白部分にも文字部及び外周部を設定し、文字列の位置を誤認識した場合には評価値が低下するように評価式を設定したので、桁ずれした位置を正しい位置と誤認識することなく、文字列の位置を正確に特定することができる。
また、本発明によれば、切出対象外の文字列に合わせて文字部及び外周部を設定し、切出対象外文字列を切出対象文字列と誤認識する可能性のある位置では評価値が低下するように評価式を設定したので、切出対象外文字列を切出対象文字列と誤認識することなく、文字列の位置を正確に特定することができる。
また、本発明によれば、文字列に加えて文字列の位置を特定する手掛かりとなる特徴部に文字部及び外周部を設定し、文字列の位置を正確に特定した場合には評価値が向上するように評価式を設定したので、文字列の位置を正確に特定することができる。
また、本発明によれば、文字部毎に、文字部内の画像を切り出し対象とするか否かを設定することができるので、利用目的に応じた様々な種類の文字部や外周部を設定して利用することができる。
また、本発明によれば、文字列枠を固定した状態で、文字列枠に対して文字部及び外周部の位置を画素単位で移動させて評価することとしたので、各文字の印刷位置がずれていたり画像が歪んでいるために紙葉類画像上で文字列を形成する各文字の画像が水平かつ等間隔な状態にないような場合でも、各文字の位置を正確に特定することができる。
また、本発明によれば、文字列枠を形成する文字部及び外周部の一部のみを利用して文字列枠評価値を求めて、評価すべき文字列枠の画像上での位置を絞り込んだ後に、その位置でのみ文字列枠に含まれる全ての文字部及び外周部を利用して詳細に評価することとしたので、全体の処理量を低減して処理を高速化することができる。
また、本発明によれば、文字列枠を形成する文字部及び外周部の一部のみを利用して文字列枠評価値を求めて、この値が所定しきい値を満たす場合にのみ、文字列枠に含まれる全ての文字部及び外周部を利用して詳細に評価することとしたので、全体の処理量を低減して処理を高速化することができる。
また、本発明によれば、文字列切出装置を利用して、切出対象外の文字列や背景の模様等の影響を抑制し、文字列を形成する各文字の画像を正確に切り出すことができる。この文字列切出装置を紙葉類画像を生成するスキャナや紙葉類処理装置と接続して利用したり、紙葉類処理装置に内蔵した状態で利用したり、記憶装置に記憶された紙葉類画像を処理するために利用することができる。
以下、添付図面を参照しながら、本発明に係る文字列切出方法及び文字列切出装置の好適な実施例について詳細に説明する。
本発明は、紙葉類の表面に印字又は印刷された文字の大きさ及び間隔が規定されていれば、商品券、小切手、手形、紙幣及び帳票等の様々な紙葉類に適用することができるが、以下の実施例では、紙幣を処理対象とする。紙幣上には、識別子として、文字列である記番号が印刷されている。紙幣を撮像した紙幣画像から、当該記番号を形成する各文字の画像を切り出す場合について説明する。具体的には、文字列切出装置は、記番号が印刷された紙幣画像を処理対象とし、本発明に係る文字列切出方法を利用して紙幣画像上で記番号を形成する各文字の位置を特定し、記番号画像、又は記番号を形成する各文字の画像を切り出す処理を行う。なお以下では、説明を簡単にするため、記番号、文字列、又は文字を切り出すと記載する場合があるが、これらは、周囲の文字、模様及び絵柄等を含まず、かつ記番号である文字列、又は当該文字列を形成する各文字のみが含まれるように、紙幣画像から部分画像を切り出すことを意味している。
図1は、本実施の形態に係る文字列切出装置10の構成概略を示すブロック図と、文字列切出装置10が利用される際に接続される構成部の例とを示している。
まず、文字列切出装置10が利用される際に接続される構成部について説明する。文字列切出装置10は、スキャナ1、金種識別部2、及び文字認識部5と接続して利用される。文字列切出装置10は、スキャナ1によって生成された紙幣画像を受信し、金種識別部2から受信した金種情報に基づいて紙幣画像から記番号又は記番号を形成する各文字を切り出して、文字認識部5へ送信する。
具体的には、文字列切出装置10は、紙幣をスキャンして取得した紙幣画像をスキャナ1から受信し、この紙幣画像から記番号又は記番号を形成する各文字が含まれる領域の部分画像を切り出す処理を行う。ただし、処理対象となる記番号が含まれる紙幣画像を取得できれば、その方法は特に限定されず、例えば、紙幣画像がCCDカメラ等の他の撮像装置から入力されるものであってもよいし、メモリやハードディスク等の記憶装置又は記憶媒体に保存された紙幣画像を読み出して利用してもよい。
文字列切出装置10は、記番号が含まれる紙幣画像から記番号が含まれる部分領域の画像を切り出す際に、記番号が印刷された位置、記番号を形成する文字数や各文字の文字サイズ等に関する情報を利用する。紙幣上に印刷される記番号は、その印刷位置、文字数、文字サイズ等が紙幣の金種毎に決まっているため、文字列切出装置10は、処理対象となる紙幣画像に係る金種情報を金種識別部2から受信する。例えば、処理対象となる紙幣画像が、紙幣処理装置内で処理中の紙幣であって、スキャナ1によって紙幣画像が生成され、生成された紙幣画像を利用して金種識別部2によって金種識別がなされるような場合に、文字列切出装置10は、スキャナ1からは紙幣画像を、金種識別部2からは金種情報を受信して利用する。なお文字列切出装置10が、メモリ等の記憶装置に保存された紙幣画像を対象に処理を行う場合には、紙幣画像に関連付けて保存された金種情報を利用することもできるし、保存された紙幣画像を金種識別部2によって識別して金種情報を取得することもできる。
文字列切出装置10は、切り出した記番号又は記番号を形成する各文字の画像を文字認識部5に送信する。文字認識部5は、受信した画像をOCR等の技術を利用して文字認識し、テキストデータに変換する。こうして紙幣画像から抽出されてテキストデータとなった記番号は、例えば紙幣処理装置で処理された紙幣に関する情報を管理するために利用される。
なお、紙幣画像を取得するためのスキャナ1、金種識別部2、文字認識部5が、文字列切出装置10に内蔵される構成であってもよいし、各構成部(1、2及び5)及び文字列切出装置10が構成部として紙幣処理装置等に内蔵される構成であってもよい。
次に、文字列切出装置10の構成について説明する。文字列切出装置10は、制御部3及びメモリ4を有している。
制御部3は、紙幣画像の斜行を補正する斜行補正部3Aと、補正後の紙幣画像から記番号を含む部分領域を抽出する部分領域抽出部3Bと、抽出した部分領域内で記番号の位置を特定するための文字枠を設定して評価する文字列枠評価値算出部3Cと、文字枠を評価した評価値に基づいて記番号を形成する各文字の位置を決定する文字位置決定部3Dとを有している。
またメモリ4内には、文字枠の高さや幅等の情報を含む文字枠情報4Aと、記番号の高さや幅等の情報を含む文字列情報4Bとが記憶されている。なおメモリ4内には、記番号が印刷された領域近傍又は記番号の背景に設定される余白枠や背景枠に関する背景枠情報4Cが含まれている場合もあるが、これについての詳細は後述する。
次に、文字列切出装置10の各構成部の詳細について説明する。斜行補正部3Aは、スキャナ1から受信した紙幣画像の傾きを補正する機能を有する。紙幣画像を生成する方法として、フィーダを備える単体のスキャナ1によって紙幣をスキャンする方法や、紙幣処理装置内部に備えられたスキャナ1によって紙幣処理装置内部の搬送路上を搬送される紙幣をスキャンする方法がある。このように固定されたスキャナ1に対して紙幣を移動させながらスキャンを行った場合に、図2(A)に示すように、矩形形状の画像200に対して紙幣画像100が傾いて撮像される場合がある。スキャナ1に対して移動する紙幣が斜行していることが原因である。斜行補正部3Aは、スキャナ1から入力された画像200において図2(A)のように紙幣画像100が傾いている場合には、図2(B)に示すように、画像200の各辺と対応する紙幣画像100の各辺とが平行な画像となるように、画像200を回転する。即ち図2(A)のように記番号102が傾いた状態から、図2(B)に示すように、記番号102が画像200の底辺に平行な状態となるように斜行による画像の傾斜を補正する。
部分領域抽出部3Bは、斜行補正がなされた紙幣画像200から、記番号102を含む部分領域101を部分画像として抽出する機能を有する。記番号102が紙幣上で印刷される位置や、記番号102を形成する文字列の高さ及び幅は、紙幣の金種によって決まっている。そのため、制御部3は、紙幣画像100の金種情報を金種識別部2から受信する。部分領域抽出部3Bは、この金種情報に基づいて紙幣画像100から部分領域101を抽出する。抽出される部分領域101は、図2(C)に示すように、記番号102を含む矩形画像である。なお抽出する部分領域101の紙幣画像100上での位置、幅及び高さ等の情報は、文字列情報4Bとしてメモリ4内に記憶されている。文字列情報4Bは金種情報と関連付けて保存されているので、金種識別部2から受信した金種情報に基づいて文字列情報4Bを読み出すことができる。
なお、斜行補正部3Aによって紙幣画像100の傾きを補正した後に、記番号102を含む部分領域101の画像を抽出する例を示したが、本発明がこれに限定されるものではない。図2(C)に示すように、記番号102を含む部分領域101の画像を得ることができれば、例えば傾斜紙幣画像100から記番号102を含む部分領域101の画像を抽出した後に、この部分領域101の画像の傾きを補正してもよい。
文字列枠評価値算出部3Cは、部分領域抽出部3Bによって紙幣画像100から抽出された部分領域101内に文字列枠を設定し、部分領域101の画像上で文字列枠を移動させながら、文字列枠を評価するための評価値を算出する機能を有する。そして、文字位置決定部3Dは、文字列枠評価値算出部3Cによって算出された評価値に基づいて文字列枠の基点を特定し、記番号102を形成する各文字の位置を決定する。
文字列枠評価値算出部3C及び文字位置決定部3Dの行う処理の詳細については後述することとし、まず、図3から図6を参照しながら文字枠20について説明する。
図3に示すように、文字枠20は、文字部21と、文字部21の外周に接する四角環状の外周部22とによって形成されている。文字部21の大きさは、記番号102を形成する各桁の位置に印刷される文字のうち最も大きな文字に合わせて設定される。具体的には、例えば「1」と「8」で文字幅等の大きさが異なる場合には、サイズの大きい「8」に合わせて文字部21が設定される。即ち、その桁位置に現れる文字のうち最も大きな文字が内部に収まるように文字部21が設定される。
具体的には、例えば図4(A)に示すように、英字が使用される文字位置で、使用される文字のうち文字「B」のサイズが最も大きい場合には、これに合わせて文字部21が設定される。これにより、各文字位置における文字部21のサイズが固定され、例えば「I」のように文字幅の狭い文字に対しても同じ大きさの文字部21が利用される。同様に、同図(B)に示すように、数字が使用される文字位置で、数字「3」のサイズが最も大きい場合には、これに合わせて文字部21が設定され、例えば「1」のように文字幅が狭い場合でも同じサイズの文字枠20が使用される。
文字部21のサイズが決定されると、図3に示したように、その外周に接する所定幅の環状の外周部22が設定される。外周部22は、記番号102を形成する文字の周囲、即ち文字の背景を含むように数画素の幅で設定される。
なお、文字部21の形状は矩形に限定されず、その文字位置で文字を含み、かつ隣接する文字を領域内に含まないように設定されれば、例えば円形状や楕円形状等の領域であってもよい。同様に、外周部22についても、文字部21に接する形で隣接する文字を含まないように設定されれば、環状ではなく一部が切れた帯状の領域であっても構わない。
図5は、図3及び図4を参照して説明した方法で設定された文字枠20の例を示している。図5(A)に示すように、記番号102を形成する各文字の位置で、使用される可能性がある全ての文字が含まれるように設定された文字部21と、その外周で環状に設定された外周部22とによって文字枠20が形成される。外周部22は、文字部21の外周で、隣接する文字位置の文字部21と重複する領域が生じないように設けられれば、その幅は限定されないが、上述の通り数画素幅に設定することが好ましい。このとき図5(A)に示すように、隣接する外周部22の間に、文字枠20に含まれない隙間領域23ができてもよい。文字列枠24は、全ての文字枠20が内部に含まれるように外周部22の外側に設定され、隙間領域23がある場合には隙間領域23及び文字枠20が内部に含まれるように設定される。
なお、記番号102を形成する各文字の大きさが文字位置によって異なる場合には、図5(B)や図5(C)のように、文字列枠24内に、異なる大きさの文字枠20が設定されることもある。文字列枠24は、記番号102を形成する文字列の最も左側にある文字枠20、最も右側にある文字枠、及び最もサイズが大きい文字枠20の全てが含まれる矩形領域として設定される。また各文字の間隔が一定でない場合には、図5(D)のように一部の隙間領域23のみが他に比べて大きい場合もある。また各文字の位置や文字の間隔が使用される文字によって変化するような記番号の場合には、図5(E)のように複数の文字位置に一つの文字枠が設定されることもある。このように、文字枠20及び文字列枠24の位置や大きさは特に限定されず、記番号102の構成に合わせて適宜設定される。
文字部21、外周部22及び文字枠20と、文字列枠24とを設定するための情報は、予めメモリ4内に、文字枠情報4Aとして記憶されている。具体的には、図6に示すように、例えば、記番号102を形成する各文字について、文字列枠24の左上端の基点30に対する文字枠20左上端部31及び文字部21左上端部32の相対座標と、文字枠20の幅Wf及び高さHfと、文字部21の幅Wc及び高さHcとが文字枠情報4Aに含まれている。即ち、メモリ4内には、基点30を設定すれば、図6に示すように、各文字位置における文字部21及び外周部22から成る文字枠20と、全ての文字枠20を含む文字列枠24とを設定できるように、必要な情報が文字枠情報4Aとして記憶されている。文字枠20及び文字列枠24は、基点30を紙幣画像上の適切な位置に設定すれば、記番号102を形成する各文字が、対応する各文字部21の領域内部に含まれるように設定されている。
次に、図7を参照しながら、文字列枠評価値算出部3Cによる処理内容の概要について説明する。斜行補正部3A及び部分領域抽出部3Bによる処理によって、図7(A)に示すように、記番号102が含まれる部分領域101の画像が抽出されると、文字列枠評価値算出部3Cは、まず図7(B)に示すように、文字部21(m)及び外周部22(m)から成る文字枠20(m)と、隙間領域23とを含む文字列枠24を設定する。ここで「m」は、文字列枠24に含まれる文字数に対応し、左端の文字枠が20(1)、この文字枠20(1)を形成する文字部及び外周部が、各々21(1)及び22(1)と表される。
文字列枠24を設定すると、次に、図7(C)に示すように、部分領域101の左上端30aを始点とし、設定した文字列枠24の右下端と部分領域101の右下端とが一致するときの文字列枠24の基点30の位置を終点30bとして、始点30a及び終点30bを頂点とする基点走査領域40を設定する。この基点走査領域40に含まれる各画素の位置が、基点30の取り得る座標となる。文字列枠評価値算出部3Cは、各座標において、文字列枠24が配置された位置を評価するための評価値を算出する。この評価値に関し、図7(D)に示すように、記番号102を形成する各文字が対応する文字部21(m)内に含まれる位置にあるときに、最大値を示すように設定されている。
即ち、文字列枠評価値算出部3Cは、部分領域101の画像内部で、文字列枠24が存在し得る範囲を設定し、その範囲内で文字列枠24を移動させながら各位置で評価値を算出する。このとき算出される評価値に関しては、設定した文字列枠24が図7(D)に示すように記番号102を形成する各文字を切り出すのに最適な位置で最大値を示すようにその算出方法が設定されている。このことにより、各位置で算出された評価値を比較して最大値を示す基点30を探すことで、記番号102を形成する各文字が各文字部21(m)に含まれるときの文字列枠24の位置を決定することができる。
以下に、この文字列枠評価値算出部3Cの行う処理の詳細を、図8のフローチャートを参照しながら説明する。
まず、記番号102を含む部分領域101上に文字枠20(m)を含む文字列枠24を設定するために、メモリ4内に記憶されている文字枠情報4Aが読み出される(図8ステップS1)。文字枠情報4Aは、金種情報と関連付けて保存されており、金種識別部2から受信した金種情報に基づいて読み出される。文字枠20及び文字列枠24の設定方法は、図3乃至図7を参照しながら上述した通りである。
文字枠20(m)及び文字列枠24に関する各評価値を算出する前に、総評価値(文字列枠評価値)の最大値が0(ゼロ)に初期化される(ステップS2)。その後、基点30の位置が図7(C)に示す基点走査領域40内部の座標(i,k)にあるときの総評価値Sc(i,k)が算出される(以下、座標(i,k)を「基点評価座標」と記載する)。この総評価値Sc(i,k)は、設定した文字列枠24が、例えば図7(D)に示すように、記番号102を形成する各文字を切り出すのに最適な位置で最大値を示すように設定された評価値である。この総評価値Sc(i,k)の算出方法の詳細については後述する。
基点評価座標(i,k)における総評価値Sc(i,k)が算出されると、次に、算出された総評価値と総評価値の最大値として保存された最大評価値とが比較される(図8ステップS4)。
そして、算出した総評価値Sc(i,k)が、それ以前に算出された総評価値の最大値よりも大きい場合には(ステップS4;Yes)、その値を最大評価値としてメモリ4内に保存するとともに、その値が算出された基点評価座標(i,k)を記番号102の位置を特定するための文字列枠24の基点30の位置としてメモリ4内に保存する(ステップS5)。
その後、図7(C)に示した基点走査領域40内の基点評価座標(i,k)について、評価すべき座標が残っていれば(図8ステップS6;No)、上記工程(ステップS3からS5)を繰り返し、全ての評価座標の評価が終了すれば(ステップS6;Yes)、文字列枠評価値算出部3Cによる処理を終了する。これらの処理によって、図7に示す例では、同図(D)に示す基点30の位置を基点評価座標(i,k)としたときの総評価値Sc(i,k)が最大値となり、この基点評価座標(i,k)がメモリ4内に記憶された状態となる。
文字位置決定部3Dでは、文字列枠評価値算出部3Cによる評価結果に基づいて、図7(D)に示すように、総評価値Sc(i,k)が最大値となったときの基点評価座標(i,k)を基点30として文字列枠24を設定する。そして、このとき文字部21(m)が設定される領域を、記番号102を形成する各文字が含まれる領域に決定する(図8ステップS7)。文字位置決定部3Dは、部分領域101の画像から、文字部21(m)として設定された領域の画像を切り出して文字認識部5に送信する。文字認識部5では文字位置決定部3Dから受信した画像を、OCR等の技術を利用して文字認識し、この画像に含まれる文字をテキストデータに変換する。文字認識部5では、図10(B)のように、余白や背景等の余計な領域を分離して、記番号102を形成する一文字のみが全体に渡って大きく描かれた画像を受信して処理するため、正確に文字認識を行うことができる。なお文字位置決定部3Dは、文字部21(m)に基づいて画像を切り出す他、文字枠20(m)に基づいて外周部22(m)を含む領域の画像を切り出してもよいし、文字列枠24に基づいて記番号102全体が含まれる画像を切り出してもよい。ここで、mは、m番目の文字枠に関するものであることを示す。
次に、図9のフローチャートを参照しながら、総評価値Sc(i,k)を算出する処理の詳細について説明する。総評価値Sc(i,k)とは、基点評価座標(i,k)を基点30とする文字列枠24に含まれる全ての文字枠20(m)の評価値の合計値である。まず総評価値を0(ゼロ)にする初期化が行われ(図9ステップS11)、その後、各文字枠20(m)の評価値を算出する処理が開始される。
各文字部21(m)の特徴量として濃度平均値C(m)が算出される(ステップS12)。例えば文字列枠24に11個の文字枠20(1)から20(11)が含まれる場合、即ち記番号102が11文字の文字から形成される場合には、C(1)からC(11)の濃度平均値が算出される。
濃度平均値とは、領域内に含まれる画素値の平均値である。例えばグレースケールの画像が、黒を0(ゼロ)とし白を255とする256段階の濃淡で表されている場合には、この画像を形成する各画素は画像の濃淡に応じて0から255のいずれかの画素値を有する。各文字部21(m)に含まれる画素値の平均が文字部21(m)の1文字分の濃度平均値C(m)である。
図10(A)に示すように文字枠20(m)が設定された場合を例に、具体的な濃度平均値C(m)の算出方法を説明する。図10(B)のように文字部21(m)の幅方向の画素数がWc(m)、高さ方向の画素数がHc(m)である場合に、文字部21(m)に含まれる全画素の画素値を、濃度値として合算して濃度合計値Vc(m)を求める。この濃度合計値Vc(m)を、文字部21(m)に含まれる画素数(Wc(m)×Hc(m))で割った値が、文字部21(m)の濃度平均値C(m)である。即ち濃度平均値C(m)は、C(m)=Vc(m)/(Wc(m)×Hc(m))として算出される。
次に、外周部22(m)の特徴量として濃度平均値F(m)が算出される(図9ステップS13)。部分領域101上に設定された環状の外周部22(m)に含まれる画素値の平均が外周部22(m)の濃度平均値F(m)である。具体的な濃度平均値F(m)の算出方法を、図10を参照しながら説明する。同図(C)に示すように、幅方向画素数がWf(m)、高さ方向の画素数がHf(m)の領域である文字枠20(m)に含まれる全画素の画素値を、濃度値として合算して濃度合計値Va(m)を求める。外周部22(m)の濃度平均値F(m)は、環状の領域に含まれる画素の濃度平均値であるから、文字枠20(m)全体の濃度合計値Va(m)と、上述した文字部21(m)の濃度合計値Vc(m)とを用いて、F(m)=(Va(m)−Vc(m))/{(Wf(m)×Hf(m))−(Wc(m)×Hc(m))}として算出される。
次に、文字枠20(m)の評価値Ec(m)が算出される(図9ステップS14)。文字枠評価値はEc(m)は、Ec(m)=F(m)−C(m)として算出される。この文字枠評価値Ec(m)によって、文字枠20(m)が記番号102を形成する文字に対して適正な位置に、即ち文字部21(m)によって文字画像を切り出すことができる位置に設定されたことを評価することができる。
部分領域画像101において、通常、記番号102を形成する各文字は、背景に比べて濃い(暗い)画素によって形成される。そのため、文字部21(m)の濃度平均値C(m)及び外周部22(m)の濃度平均値F(m)は、その領域内に文字を構成する画素が多く存在するほど値が小さくなる。例えば、図10(D)に示すように文字の一部のみが文字部21(m)に含まれる場合には、文字「A」が文字部21(m)から外れていくほど、濃度平均値C(m)の値が大きくなる。逆に、図10(A)に示すように、文字全体が文字部21(m)内に含まれるときに濃度平均値C(m)が最小値をとる。これに対し外周部濃度平均値F(m)は、図10(D)に示すように、文字が文字部21(m)から外れて、その一部が外周部22(m)にあると値が小さくなり、同図(A)に示すように文字全体が文字部21(m)内に含まれたときに最大値をとる。
このように、文字枠20が、記番号102を形成する文字に対して適切な位置にある場合に、文字部21(m)の濃度平均値C(m)は最小値となり、外周部22(m)の濃度平均値F(m)が最大値となるように各々の評価式が設定されている。
なお、文字が背景に比べて濃い(暗い)画素によって形成される場合を例に説明したが、本発明がこれに限定されるものではない。例えば、文字が背景に比べて薄い(明るい)場合には、上記説明とは逆に、文字全体が文字部21(m)内に含まれた状態で濃度平均値C(m)は最大値をとりF(m)は最小値をとる。この場合には、文字枠評価値Ec(m)を、Ec(m)=C(m)−F(m)として算出すればよい。また上記図9及び図10で説明で示した画像を、その階調を反転したネガ画像を利用して処理する場合にも、文字枠評価値Ec(m)をEc(m)=C(m)−F(m)として算出すればよい。即ち、印刷された文字画像の特性に合わせて、文字部21(m)内に文字が含まれた状態で最大値をとるように設定されれば、文字枠評価値Ec(m)を算出する評価式の内容は特に限定されない。
文字枠評価値Ec(m)を、文字列枠24に含まれる各文字枠20(m)の全てについて算出する(図9ステップS15;No)。そして、全ての文字枠20(m)で文字枠評価値Ec(m)を算出すると(ステップS15;Yes)、文字枠評価値Ec(m)を合算して総評価値Sc(i,k)を算出する(ステップS16)。
なお、文字部21(m)及び外周部22(m)の特徴量として濃度平均値を利用する例を示したが、利用する特徴量はこれに限定されず、文字を表す画素と文字以外の背景を表す画素との間で値が異なり、かつ領域内に含まれる文字を形成する画素の数に応じて値が変化する特徴量であれば、例えば、カラーの紙幣画像のRGBの輝度値等を利用してもよい。また、評価値についても、文字部21(m)に含まれる文字を形成する画素数に応じて値が変化し、かつ文字全体が文字部21(m)内に含まれたときに最大値をとるように設定すれば、領域内の画素の平均値に限定されず、画素の合計値等を利用してもよい。
以上の方法によれば、記番号102を形成する各文字が文字部21(m)に完全に含まれるときに、文字枠評価値Ec(m)が最大値をとる。そして、文字列枠24内の全ての文字枠20(m)で、記番号102を形成する各文字が文字部21(m)に完全に含まれるときに、総評価値Sc(i,k)が最大値をとる。これを利用して、部分領域101内で基点30を移動させながら総評価値Sc(i,k)を算出し、最大値をとる基点30の位置を検出することにより、図7(D)に示したような文字列枠24の位置を特定することができる。
このように、金種によって設定された複数の文字枠20(m)を含む文字列枠24を、部分領域101内を走査するように移動させ、各位置での評価値を相対的に比較して、最大値をとる位置を決定することとしたので、記番号102の背景に絵柄や模様がある場合でも正確に文字の位置を特定することができる。
また、記番号102を形成する文字に合わせて文字部21(m)及び外周部22(m)から成る文字枠20(m)を設定して各文字位置で評価を行うとともに、複数の文字枠20(m)から成る文字列枠24を設定して評価を行うこととしたので、一部の文字について、その近傍に記番号以外の文字が存在する場合や文字の背景に絵柄や模様がある場合でも、正確に記番号102の位置を特定することができる。
上記実施例1では、記番号102を含む部分領域101の画像上で文字列枠24を移動させ、評価値が最大となる位置を記番号102を切り出すための位置として特定して、画像を切り出す方法を示した。文字列枠24に含まれる各文字枠20(m)の位置は、文字列枠24に対して固定された状態で評価値の算出を行ったが、本発明がこれに限定されるものではない。本実施例2では、各評価座標において、文字列枠24に対して各文字枠20(m)を個別に移動させながら評価を行う方法について説明する。
本実施例2では、文字部21(m)及び外周部22(m)から成る文字枠20(m)の設定方法、複数の文字枠20(m)を含む文字列枠24の設定方法、濃度平均値を利用した各評価値の算出方法、評価値が最大値となる評価位置を記番号102の位置として画像を切り出す方法は上記実施例1と同様であるため説明を省略する。
本実施例2では、基点30の座標である基点評価座標(i,k)において、文字列枠24の総評価値Sc(i、k)を算出する際の、各文字枠20(m)の評価方法のみが、上記実施例1と異なっているため、この点について詳細を以下に説明する。
文字列切出装置10は、紙幣画像100から記番号102を含む部分領域101を抽出して利用する。このとき、撮像した際の紙幣の撓みや、搬送される紙幣の搬送バラツキ等を原因とするサンプリング間隔の変動等があると、紙幣画像100上で記番号102の画像が歪んでいる場合がある。その結果、等間隔かつ水平な位置にあるはずの文字が、画像上では異なる間隔を有していたり傾いている場合がある。また斜行補正部3Aによる補正が完全ではないために、画像上で記番号102が傾く場合もある。さらに、紙幣画像100が正常に撮像された場合でも、例えばちぢみ券と呼ばれる紙幣のように紙幣自体の品質が悪く、紙幣上に印刷された記番号102の位置がずれていたり傾いている場合がある。
本実施例2の方法によれば、このような場合でも記番号102を形成する文字の位置を正確に特定することができる。図8及び図9を参照しながら説明した文字枠評価値Ec(m)を算出する工程で、文字列枠24に対する各文字枠20の位置を相対的に移動させて、文字枠評価値Ec(m)が最大となる位置を検出することにより、これを実現する。
図11及び図12を参照しながら具体的な方法について説明する。まず図11に示すように設定された複数の文字部21(m)、複数の外周部22(m)及び複数の隙間領域23から成る文字列枠24を利用して、上記実施例1と同様に各文字枠20(m)の文字枠評価値Ec(m)を算出する。ここで同図の場合、mは1から5の値をとる。その後、さらに文字列枠24、即ち基点30、を固定した状態で、文字枠20(1)を除く4つの文字枠20(2)から20(5)を上下左右に所定画素分だけずらして文字枠評価値Ec(2)からEc(5)を再度算出する。例えば、文字枠20(2)から20(5)の各々を、各文字枠左上端の座標31Aから31Dを中心に上下左右に1画素ずつずらして、各位置で評価を行う。或いは座標31Aから31Dを中心とする1辺が数画素の矩形領域を設定し、その矩形領域内で文字枠20(2)から20(5)を移動させながら、各位置で文字枠評価値Ec(m)を得てもよい。なお上記に加えて文字枠20(1)を移動させてもよい。
例えば、図12(A)に示すように、設定された文字列枠24によって、文字部21(1)及び21(2)内に文字が収まるべきところ、上述した画像の歪み等の影響によって画像上の2文字目「B」が図12(B)に示すようにずれている場合がある。本実施例2では、図12(C)のように、左上端が基点30の座標と一致する1文字目「A」の文字枠20(1)の位置は固定した状態で、他の文字枠20(2)を上下左右の所定方向に所定画素数分ずらした位置で評価を行う。文字枠評価値Ec(2)の値は、文字部21(m)内に文字全体が含まれた状態で最大値をとるため、図12(B)よりも同図(C)の方が評価値が大きくなる。そこで、図12(C)の状態にあるときの座標41Aの情報を基点30と関連付けてメモリ4内に保存するとともに、この基点評価座標(i,k)における総評価値Sc(i,k)の値を図12(B)ではなく、同図(C)の状態で算出した値として処理を進める。その結果、図12(C)の状態にあるときの総評価値Sc(i,k)が最大値であった場合には、文字位置決定部3Dは、2文字目「B」に対応する文字部21(2)の位置を、図12(B)に示す文字部21(2)ではなく、メモリ4に記憶された座標41Aに基づき同図(C)に示す文字部21(2)に決定する。上記説明では2文字目のみを用いて説明したが、このような処理を文字列枠24に含まれる各文字について行うことができる。
このように、文字列枠24に含まれる各文字枠20(m)を所定領域内でずらして評価することによって、記番号102が、紙幣上でずれて印刷されている場合や紙幣画像上でずれているような場合でも、各文字の位置を正確に特定し、各文字が含まれる領域の画像を切り出すことができる。
各文字枠20(m)を移動させる方向や移動させる量については、例えば1画素ピッチで5画素分上下左右に移動させるというように初期設定しておき、この初期設定に基づいて処理を行えばよい。
ただし、本発明がこれに限定されるものではなく、例えば、m番目の文字位置で文字枠20をずらしたときに文字枠評価値Ec(m)の値が大きくなった場合には、その後の文字位置では移動させる量や方向を限定するように設定を動的に変更しながら処理を行ってもよい。
具体的には、例えば、図11に示す2文字目の文字枠20(2)では、上下左右に1画素ピッチで5画素分文字枠20(2)を移動させて評価しても文字枠評価値Ec(2)は変化せず、3文字目の文字枠20(3)では右方向に3画素分だけ文字枠20(3)を移動した際に文字枠評価値Ec(3)が大きくなったとする。この場合は、次の4文字目の文字枠20(4)では、左方向へ移動する処理は行わず、上下方向へ1画素ピッチで5画素分移動させる処理と、右方向へ移動する処理のみを行うように、文字枠20(4)の移動方向及び移動量に係る設定を変更する。このとき右方向へ移動する際の移動量についても、初期設定の通り1画素から5画素とはせず、3画素から5画素、或いは3画素から5画素分というように動的に設定を変更してもよい。
印刷のずれや画像の歪みによって、記番号102を形成する各文字の位置が途中からずれる場合には、その後に文字位置がずれの無い位置に戻ることは少なく、ずれた状態が続くか、或いはずれ量が大きくなることが多い。そのため設定を動的に変更することによって、全体の処理量を低減しながら、固定された初期設定に基づいて処理を行った場合と同様の効果を得ることができる。
文字位置のずれが、一方向に拡大した場合の具体的な例を図13に示す。図13(A)では、同図上段に示したように、左から3文字目の位置にある文字から右方向へずれが生じているため、上記実施例1で示したように文字枠20を固定した場合には、右方向へ行くほど各文字枠20(m)と文字とのずれが大きくなっている。このような状態では正確な文字枠評価値Ec(m)を算出することができず、その結果、文字の位置を正確に特定することができない。これに対し、本実施例2で説明した方法に従って、図13(A)下段に示したように、3文字目から5文字目を1画素分、6文字目から8文字目を2画素分、9文字目から11文字目を3画素分、各文字枠20(m)を移動させる処理を行って文字枠評価値Ec(m)を算出することにより、各文字の位置を正確に特定することができる。なお図13(B)は、同様に、下方向への文字位置のずれが拡大した場合の例を示している。
文字列枠24に対して各文字枠20(m)の位置を移動させて評価する上記処理は、全ての場合において行ってもよいし、上記実施例1の方法で求めた最大評価値が所定値よりも小さい場合にのみ再評価として行ってもよい。記番号102の位置を特定できた場合の総評価値Sc(i,k)は、記番号102を形成する各文字の種類等によって変化する。しかし、図12や図13で示したように、文字にずれが生じている場合には、総評価値Sc(i,k)の値が、文字種の違いを原因とする場合に比べて大きく低下する。これを利用してしきい値を設定し、最大値を示した総評価値Sc(i,k)の値がしきい値よりも低い場合にのみ、文字がずれているために値が低くなっていると判定し、各文字枠20(m)を移動させる上記処理を行うようにしてもよい。
このように、文字列枠24に対する各文字枠20(m)の位置を固定せず、基点30に対して各文字枠20(m)を移動させて評価を行うことによって、記番号102を形成する各文字の位置が、実際の紙幣上でずれている場合や、画像に歪みが生じたことによってずれている場合でも、各文字の位置を正確に特定することができる。
また、記番号102を形成する各文字の位置ずれが生ずる実情を考慮して、ある文字位置に生じたずれを検出した場合に、その後の文字位置では、ずれが検出された方向と反対方向への各文字枠20(m)の移動は行わず、かつ検出されたずれ量を初期値として処理を行うように文字枠20の移動方向や移動量に係る設定を動的に変更すれば、全体の処理量を減らし、処理を高速化することができる。
また、各文字枠20(m)を固定して得られた総評価値Sc(i,k)の最大値が所定値よりも小さい場合にのみ各文字枠20(m)の位置を移動させる処理を行えば、同様の効果を得ながら全体の処理量を低減し、処理を高速化することができる。
上記実施例1及び実施例2では、記番号102を形成する各文字に対して文字枠20を設定する方法を示したが、本発明はこれに限定されるものではない。本実施例3では、記番号102を形成する文字を利用して評価するための文字枠20に加えて、記番号102の背景にある余白、文字列、模様等を利用して評価するための背景枠を利用する方法について説明する。
本実施例3では、文字部21(m)及び外周部22(m)から成る文字枠20(m)の設定方法、複数の文字枠20(m)を含む文字列枠24の設定方法、濃度平均値を利用した各評価値の算出方法、評価値が最大値となる評価位置を記番号102の位置として画像を切り出す方法、各文字枠20(m)を移動させて印刷ずれや画像の歪みに対応する方法は、上記実施例1及び実施例2と同様であるため説明を省略する。
本実施例3では、評価値を算出するために利用する文字列枠24が、記番号102を形成する各文字を含む文字枠20(m)だけではなく、記番号102の背景を評価する背景枠を含む点のみが上記実施例1及び実施例2と異なっている。以下では、この点について詳細に説明する。
図14(A)に示すように、上記実施例1及び実施例2で説明した方法によって記番号102の位置を特定することができる。しかし、記番号102の右端の文字のさらに右側に汚れがある場合等に、同図(B)に示すように文字位置がずれた状態を記番号102の位置として特定してしまう場合がある。このように文字単位でずれた状態で文字位置を認識することを桁ずれと言い、記番号102の近傍に模様があるような場合にも、同様に、桁ずれして認識される場合がある。
本実施例3では、図14(C)に示すように、記番号102の位置に合わせて設定した文字枠20(m)に加えて、記番号102左右の余白部分に、余白であることを評価するための余白枠50(n)を設ける。余白枠50(n)は、文字枠20(m)と同様に文字部51(n)及び外周部52(n)から形成される。ここで「n」は、文字列枠24に含まれる余白枠の数に対応し、同図の例では、左端の余白枠が50(1)、右端の余白枠が50(2)と表される。そして左端の背景枠50(1)を形成する文字部及び外周部が、各々51(1)及び52(1)、右端の背景枠50(2)を形成する文字部及び外周部が51(2)及び52(2)と表される。
文字枠20(m)と余白枠50(n)との違いは、文字枠20(m)は記番号102を形成する各文字が文字部21(m)の領域内に含まれるように設定されるのに対し、余白枠50(n)は、文字部51(n)の領域内に文字や模様等が含まれないように設定される点にある。
文字枠20(m)の評価値Ec(m)は、文字部21(m)の濃度平均値C(m)と、外周部22(m)の濃度平均値F(m)との差分(Ec(m)=F(m)−C(m))として算出される。これに対し、余白枠50(n)の評価値Eb(n)は、文字部51(n)の濃度平均値C(n)と、外周部52(n)の濃度平均値F(n)との差分(F(n)−C(n))の絶対値に−1を乗算した負の値とする。そして、総評価値Sc(i,k)は、全ての文字枠評価値Ec(m)及び余白枠評価値Eb(n)の合計値として算出される。即ち文字枠20(m)及び余白枠50(n)の各枠について、文字部と外周部(21(m)及び22(m)と、51(n)及び52(n))の濃度平均値差分を算出し、文字枠20(m)の全てについて差分値を合計した値と、余白枠50(n)の全てについて差分値の絶対値を合計した値に−1を乗算した値を加算することによって、総評価値Sc(i,k)を算出する。
余白枠50(n)は、文字や模様が存在しない余白部分に設定されることから、本来は文字部51(n)と外周部52(n)の濃度平均値に差が生ずることはなく、濃度平均値の差分である評価値Eb(n)は0(ゼロ)になる。しかし、桁ずれすることによって、余白枠50(n)に文字や背景の模様等が含まれると、文字部51(n)と外周部52(n)の濃度平均値に差分が生じ0(ゼロ)ではなくなる。そこで、この差分値の絶対値に−1を乗算した負の値を余白枠50(n)の評価値Eb(n)とすることによって、この評価値Eb(n)を、桁ずれした状態にあるときの総評価値Sc(i,k)の値を下げる方向に作用させる。
すなわち、文字枠20(m)の評価値Ec(m)は、文字列枠24が適正な位置に設定されたことの指針となるものであるから、この評価値Ec(m)は、適正な位置で総評価値Sc(i,k)を向上させるように作用する。これに対し、余白枠50(n)の評価値Eb(n)は、文字列枠24が桁ずれしていることを示す指針となるものであるから、この評価値Eb(n)は、桁ずれした位置で総評価値Sc(i,k)を低下させるように作用する。その結果、総評価値Sc(i,k)によって文字列枠24の位置をより正確に評価することができる。なお、このように設定する限り、本発明に係る各評価値の算出方法は、上記方法に限定されず他の演算式によって算出されてもよい。
具体的な評価値の算出方法について図14を参照しながら説明する。桁ずれした図14(D)に示す状態では、文字列枠24内の左端にある余白枠50(1)に記番号102先頭の文字「A」が位置するため、余白枠50(n)が無い場合に比べて総評価値Sc(i,k)が低下する。また文字列枠24の右端にある余白枠50(2)にも背景の模様が位置するために、同様に、総評価値Sc(i,k)が低下する。その結果、図14(D)に示す位置よりも、図14(E)に示すように、文字列枠24が適正な位置にある場合の方が総評価値Sc(i,k)の値が大きくなる。そのため、総評価値Sc(i,k)の値に基づいて、記番号102の位置を正確に特定することができる。
このように、記番号102を形成する文字を評価する文字枠20(m)に加えて、記番号102に隣接する余白を評価する余白枠50(n)を設けることによって、より正確に記番号102の位置を特定することができる。背景を評価するための背景枠として、上記余白枠50(n)の他に、例えば図15(A)から(C)に示す背景枠を利用することができる。
図15(A)は、図14(A)に示した文字列枠24の構成に加えて、複数の文字に重なるように背景枠(複数桁枠)60を設けた例である。また図15(B)は、図14(A)に示した文字列枠24の構成に加えて、各文字位置で、文字部21(m)を2つの領域に分割して上側に外周部72が下側に文字部71が位置するように背景枠(上下枠)70を設けた例である。
なお余白枠50や、背景枠60及び70は、単体で評価に利用されることはなく、文字枠20(m)による評価をさらに正確に行うために補助的に利用される。図15においても、文字枠20(m)に加えて背景枠60、70及び80が設けられているが、背景枠60、70及び80の形状及び位置を理解しやすいように、文字枠20(m)及び文字列枠24を破線で示している。また、説明を簡単にするため「各背景枠60、70及び80」のように記載するが、これは一つの文字列枠24が、常に全ての種類の背景枠(60、70及び80)を含むことを意図するものではなく、一つの文字列枠24が、複数種類の背景枠を含む他、いずれか1つの背景枠のみを含むものであってもよい。
図14(A)に示した文字列枠24の構成に加えて、図15(A)及び(B)に示すような背景枠60及び70を設けた文字列枠24は、図16(A)から(D)に示すように部分領域101内に記番号102以外の文字列103(以下「切出対象外文字列103」と記載する)が含まれるような場合に利用する。このような切出対象外文字列103を含む位置に文字列枠24があるときに、背景枠60及び70によって評価値を低下させれば、切出対象外文字列103が記番号102と誤認識されることを回避することができる。
具体的には、図16(A)から(D)に示すように文字列枠24内に切出対象外文字列103がある場合は、各文字枠20(m)に記番号102ではなく切出対象外文字列103が含まれる位置で、各文字枠20(m)の評価値Ec(m)が高くなる可能性がある。そのため、図15(A)に示す背景枠60は図16(B)に示す位置で、図15(B)に示す背景枠70は、図16(D)に示す位置で、各々、切出対象外文字列103の一部が枠内に含まれるように設定されている。そして、この位置で、上記余白枠50(n)の場合と同様に、評価値が負の値を示すように、背景枠60及び70の評価値Eb(n)の算出方法が設定される。即ち、背景枠60及び70は、切出対象外文字列103によって記番号102の位置を誤認識する可能性のある同図に示した位置において、総評価値Sc(i,k)の値を低下させるために利用される。このように、背景枠60及び70を利用して、文字列枠24内に記番号102が含まれる適正な位置にある場合に比べて、文字列枠24内に切出対象外文字列103が含まれる位置での総評価値Sc(i,k)を低下させることによって、記番号102の位置が誤認識されることを回避することができる。
図17(c)及び(d)に示すように、背景枠60及び70の評価値Eb(n)は、文字部(61及び71)の濃度平均値Cと外周部(62及び72)の濃度平均値Fとの差分の絶対値に−1を乗算して算出される。図16(B)及び(D)に示す位置では、同図(A)及び(C)に示す位置に比べて、文字部(61及び71)の濃度平均値Cと外周部(62及び72)の濃度平均値Fとの差分の絶対値が大きくなる。そのため、この絶対値に−1を乗算した評価値Eb(n)が加算されると、図16(A)の位置に比べて同図(B)の位置の方が、同図(C)の位置に比べて同図(D)の位置の方が、総評価値Sc(i,k)が低下することになる。
図16(A)及び(C)に示すように、文字列枠24が記番号102に対して適正な位置にある場合は、同図(B)及び(D)に示す位置にある場合に比べて、背景枠60及び70の評価値Eb(n)の絶対値が小さくなる。これは、同図(B)及び(D)に示す位置にある場合の方が、背景枠60及び70を形成する文字部61及び71に含まれる画素の濃度平均値Cと、外周部62及び72に含まれる画素の濃度平均値Fとの差分が大きくなるように背景枠60及び70が設定されていることによる。
即ち、背景枠60及び70は、文字部21(m)内に記番号102を含む適正な位置にあるときには、これらの背景枠60及び70の存在が文字列枠24の総評価値Sc(i,k)に大きく影響しないように設定される。かつ、背景枠60及び70は、背景にある切出対象外文字列103や模様を記番号102の位置と誤認識する可能性がある位置では、総評価値Sc(i,k)を低下させるように設定される。文字列枠24を、文字枠20(m)に加えて背景枠60及び70を含む構成とすることによって、記番号102の位置を誤認識することを回避し、記番号102の位置を正確に特定することができる。
背景枠60及び70の利用は、上述したように総評価値Sc(i,k)を低下させる場合に限らず、文字部21(m)が記番号102を含む適正な位置にあるときの文字列枠24の総評価値Sc(i,k)が向上するように設定することもできる。
具体的には、例えば図15(C)に示すように、文字枠20(m)に加えて、記番号102の位置特定の手掛かりとなる位置に背景枠80を設けて、記番号102の位置の特定を補助させることもできる。
上記背景枠60及び70では、余白枠50(n)の場合と同様に、背景枠評価値Ebを文字部61及び71の濃度平均値Cと、外周部62及び72の濃度平均値Fとの差分(F−C)の絶対値に−1を乗算した値とし、背景枠60及び70の内部に文字や模様が含まれる場合には総評価値Sc(i,k)を低下させる方向に作用させる。しかし、図15(C)に示す背景枠80では、評価値Ebを文字部81の濃度平均値Cと外周部82の濃度平均値Fとの差分(F−C)として、−1の乗算は行わない。そして、各文字枠20(m)の評価値Ec(m)の合計値に、背景枠80の評価値Ebの合計値を加算した値を、総評価値Sc(i,k)とする。
図15(C)に示した背景枠(模様枠)80は、図16(E)に示すような記番号102を認識する際に利用する。同図に示した紙幣では、記番号102の左側に略L字形の模様105が印刷されている。図16(E)に示すように、部分領域101の画像にもこの模様105の画像が含まれており、この模様105の位置を、記番号102の位置を特定する手掛かりとして利用することができる。図15(C)に示す背景枠80は、図16(E)に示すように記番号102を形成する各文字が各文字部21(m)の内部に含まれる適正な位置にあるときに、背景枠80の文字部81内に上記模様105が含まれるように設定されている。そして背景枠80の文字部81に模様105が完全に含まれた状態で、外周部82の濃度平均値Fから文字部81の濃度平均値Cを減算した値、即ち背景枠80の評価値Ebが、最大値をとるように設定されている(図17(e)参照)。よって、背景枠80の評価値Ebは、文字列枠24が記番号102に対して適正な位置にあるときに、総評価値Sc(i,k)を向上させる方向に作用する。そのため、背景枠80を利用することによって、記番号102の位置をより正確に特定することが容易になる。
なお、上記背景枠60、70及び80に関しては、上述した通り、1つの背景枠のみを利用して文字列枠24を特定してもよいし、複数の背景枠を設けてもよい。複数の背景枠を設ける場合には、余白枠50(n)の評価値と同様に、背景枠評価値をEb(n)として表す。以下では、評価値を背景枠評価値Eb(n)として記載する。
背景枠評価値Eb(n)を、総評価値Sc(i,k)を向上する方向へ作用させるか、或いは低減する方向へ作用させるかは、評価式の設定によって変更することができる。背景枠評価値Eb(n)は、文字枠評価値Ec(m)と同様に、外周部(52(n)、62、72及び82)の濃度平均値Fと、文字部(51(n)、61、71及び81)の濃度平均値Cとの差分として算出することができる。ただし、算出方法がこれに限定されるものではなく、濃度平均値の差分を定数倍したり、定数を加算する評価式を設定して利用することもできる。評価式は、余白枠50(n)、複数桁枠60、上下枠70及び模様枠80等の背景枠を設定する位置及び大きさと、目的とに応じて適宜設定される。
余白枠50(n)や、背景枠60、70及び80を設定して背景枠評価値Eb(n)を求めるために必要な情報は、図1に示すように、メモリ4内に背景枠情報4Cとして保存されており、文字列枠評価値算出部3Cによって利用される。メモリ4内に記憶される文字枠情報4A及び背景枠情報4Cには、文字枠20(m)と、文字列枠24と、余白枠50(n)や背景枠60、70及び80とを設定して利用するために必要な情報が含まれている。これらの情報は、紙幣の金種に関連付けて記憶されており、処理対象となる紙幣画像100の金種に基づいてメモリ4から読み出されて利用される。図17は、文字枠情報4A及び背景枠情報4Cの一例を示している。このように、メモリ4には、例えば、文字枠20(m)、余白枠50(n)、背景枠(60、70及び80)、及び文字列枠24に関する情報と、評価値を算出するための評価式等の情報が含まれている。
以上のように、記番号102の位置を特定するために、余白枠50(n)や背景枠60、70及び80を利用すれば、記番号102の位置を誤認識する可能性のある文字や模様の影響を抑制したり、記番号102の位置を認識する手掛かりとなる文字や模様を利用したりすることができる。実施例1及び2で上述した文字列枠24の構成に加えて、記番号102近傍又は背景にある文字列や模様等の特徴部を評価するための文字部(51(n)、61、71及び81)及び外周部(52(n)、62、72及び82)から成る余白枠50(n)や背景枠60、70及び80と、これらを評価するための評価式とを適切に設定し、背景枠評価値Eb(n)を利用して総評価値Sc(i,k)を算出することにより、記番号102の位置をより正確に特定することができる。
上記実施例1乃至実施例3では、複数の文字枠20(m)のみから形成される文字列枠24、又は文字枠20(m)と余白枠50(n)及び背景枠(60、70及び80)のいずれかを含む文字列枠24において、最初から、文字列枠24に含まれる全ての枠を利用して、各枠の評価値Ec(m)及びEb(n)と、総評価値Sc(i,k)とを算出する方法を示した。しかし、本発明はこれに限定されるものではない。本実施例4では、文字列枠24を形成する文字枠20(m)、余白枠50(n)、及び背景枠(60、70及び80)の一部のみを利用して評価を行う方法について説明する。
本実施例4では、文字部21(m)及び外周部22(m)から成る文字枠20(m)の設定方法、複数の文字枠20(m)を含む文字列枠24の設定方法、濃度平均値を利用した各評価値の算出方法、評価値が最大値となる評価位置を記番号102の位置として画像を切り出す方法、文字列枠24を移動させて印刷ずれや画像の歪みに対応する方法、余白枠50(n)や背景枠60、70及び80を利用する方法は、上記実施例1乃至実施例3と同様であるため説明を省略する。
本実施例4では、文字列枠24に含まれる文字枠20(m)等の全ての枠について評価値を算出する前に、一部の枠のみを利用して評価値を算出し、その結果に基づいて記番号102が含まれる可能性が高い文字列枠24を選択する点が、上記実施例1乃至実施例3と異なる。処理対象とする文字列枠24を絞り込んだ後は、上記実施例1乃至実施例3と同様に、文字列枠24内に含まれる文字枠20(m)、余白枠50(n)、背景枠60、70及び80等の全ての枠を利用して評価する。以下では、上記実施例1乃至実施例3と異なる点について詳細を説明する。
図18に、本実施例4で追加される処理のフローチャートを示す。図18に示す処理を行って、処理対象となる文字列枠24の候補を選択した後は、上記実施例1乃至実施例3と同様に図8及び図9に示した処理を行う。
まず、メモリ4から文字枠情報4Aを読み出して、処理対象となる金種に応じて文字枠20(m)を含む文字列枠24を設定する(図18ステップS21)。このとき、その金種について、余白枠50(n)や背景枠60、70及び80が設定されている場合には、同様にメモリ4から背景枠情報4Cを読み出して、設定した文字列枠24に追加する。そして評価値算出に係る処理を開始する前に評価値を0(ゼロ)にする初期化を行う(ステップS22)。ここまでの処理は上記実施例1乃至実施例3と同様である。
次に、部分領域101の画像上で基点評価座標(i,k)に文字列枠24の基点30が配置されたときの、部分評価値Sp(i,k)を算出する(ステップS23)。部分評価値Sp(i,k)とは、文字列枠24に含まれる文字枠20(m)、余白枠50(n)、背景枠60、70及び80等の複数の枠のうち、一部の枠のみを利用して算出する評価値である。具体的には、例えば、図17(b)に示した文字枠20(m)及び余白枠50(n)を含む文字列枠24で、右側から2つの文字枠20(m)のみや、或いは右端の文字枠20(m)及び余白枠50(n)のみというように、文字列枠24に含まれる複数の枠の中から、部分評価値Sp(i,k)を算出するために利用する枠を選択する。利用する枠の選択は、記番号102の位置を特定する際に、記番号102以外の切出対象外文字列103や背景の模様等の影響を受けにくい枠を優先して選択すればよい。選択した枠の各々について評価値Ec(m)及びEb(n)を求め、この評価値に基づいて部分評価値Sp(i,k)を算出する。このとき文字列枠24に含まれる文字枠20(m)、背景枠50(n)、背景枠60、70及び80等の全ての枠ではなく、一部の枠のみを利用した処理を行うため、全体の処理量を低減し、処理を高速化することができる。
次に、算出した部分評価値Sp(i,k)が、過去に算出した全ての部分評価値Sp(i,k)のうち、値の高い方から所定順位、例えば上位N位以内に入るか否かを判定する(図18ステップS24)。そして部分評価値Sp(i,k)が上位N位以内に入った場合には(ステップS24;Yes)、その評価値が算出された基点評価座標(i,k)をメモリ4内に保存する。部分評価値Sp(i,k)が上位N位以内に入っていない場合には、基点評価座標(i,k)を保存せず、次の処理へ進む(ステップS24;No)。
次に、全ての基点評価座標(i,k)の評価が終了したか否かを判定し(ステップS26)、全ての評価座標の評価を終了した場合には(ステップS26;Yes)処理を終了し、評価すべき評価座標が残っている場合には(ステップS26;No)、上記工程(ステップS23からS26)を繰り返して行う。
以上の処理によって、部分評価値Sp(i,k)の値が高いものから上位N位以内に入る基点評価座標(i,k)を選択してメモリ4に記憶することができる。これらの基点評価座標(i,k)は、その位置を基点30として文字列枠24を設定した際に、記番号102を形成する各文字が各文字部21(m)内に含まれる可能性が高い座標を示している。候補となる基点評価座標(i,k)を選択した後は、これらの基点評価座標(i,k)のみを評価対象として、図8及び図9に示した実施例1乃至実施例3と同様の処理を行う。
このように、文字列枠24に含まれる文字枠20(m)、余白枠50(n)、背景枠60、70及び80等の全ての枠ではなく、一部の枠のみを利用して、候補となる基点評価座標(i,k)を選択した後、選択した評価座標についてのみ、全ての枠を利用した評価値を算出するため、全体の処理量を低減し、処理を高速化することができる。
また、文字列枠24に含まれる文字枠20(m)、余白枠50(n)、背景枠60、70及び80等の枠のうち、記番号102以外の切出対象外文字列103や背景の模様等の影響を受けにくい枠を選択して評価することによって、候補となる基点評価座標(i,k)を効率よく絞り込むことができる。
なお、処理量を低減することによって全体の処理を高速化する方法として、評価値の高い方から上位N位以内となる基点評価座標(i,k)を選択する上記方法の他、部分評価値Sp(i,k)が所定値を超える場合にのみ総評価値Sc(i,k)を算出するようにしてもよい。
具体的な処理例を、図19のフローチャートに示す。まず、メモリ4から文字枠情報4Aや背景枠情報4Cを読み出して、処理対象となる金種に応じて、文字枠20(m)、余白枠50(n)、背景枠60、70及び80等を含む文字列枠24を設定する(ステップS31)。そして評価値算出に係る処理を開始する前に最大評価値を0(ゼロ)にする初期化を行う(ステップS32)。
部分評価値Sp(i,k)を算出した後(ステップS33)、この評価値が所定のしきい値を超えるか否かを判定し(ステップS34)、しきい値を超える場合にのみ(ステップS34;Yes)、総評価値Sc(i,k)を算出する処理を行う(ステップS35)。部分評価値Sp(i,k)がしきい値以下である場合には(ステップS34;No)、次の基点評価座標の処理へ進む(ステップS38;No)。各処理については、上記実施例1乃至実施例3、又は本実施例4で上述した処理と同様であるため詳細な説明を省略する。
このように、文字列枠24に含まれる文字枠20(m)、余白枠50(n)、背景枠60、70及び80等の枠のうち、一部の枠のみを利用して評価を行った後、その評価値が所定値を超える場合にのみ、全ての枠を利用して評価値を算出するため、全体の処理量を低減し、処理を高速化することができる。また文字列枠24に含まれる文字枠20(m)等の枠のうち、記番号102以外の文字列や背景の模様等の影響を受けにくい枠を選択して評価することで、候補となる評価座標を効率よく絞り込むことができる。
以上のように、上記実施例1乃至実施例4によれば、記番号102の各文字が含まれるように複数の文字枠20(m)を設定するとともに、各文字枠20(m)に記番号102が含まれることを評価する評価値を利用して、紙幣画像上で文字枠20(m)を移動しながら評価値を相対的に比較して記番号102の位置を特定することとしたので、記番号102近傍に文字が印刷されていたり、記番号102の背景に模様や絵柄がある場合にも、記番号102の位置を正確に特定し、該記番号102又は該記番号102を形成する各文字が含まれる画像を正確に切り出すことができる。このとき、文字枠20(m)を、文字が含まれる文字部21(m)と、文字部21(m)周囲の外周部22(m)とに分けて、文字と文字周囲で異なる画素値等の特徴量を利用して文字部21(m)に文字が含まれたときに評価値が高くなるように評価式を設定したので、各文字の位置を正確に特定できる。さらに複数の文字枠20(m)を含む文字列枠24によって記番号102の位置を特定することとしたので、記番号102を形成する一部の文字の近傍に記番号以外の文字列があったり背景に模様があるような場合にも、正確に記番号102に文字枠20(m)を当てる位置を特定することができる。
また、各文字枠20(m)を、文字列枠24として設定された位置から画素単位で移動させて評価することとしたので、印刷ずれや紙幣画像の歪みによって画像上の記番号102を形成する各文字の位置がずれている場合にも、記番号102を形成する各文字の位置を正確に特定することができる。
また、記番号102だけではなく、記番号102周囲の特徴や記番号以外の文字列を評価するための余白枠50(n)や背景枠60、70及び80を設定し、これらの枠によって、記番号102の位置として誤認識される可能性がある位置で評価値を下げたり、記番号102の位置を正しく認識した位置で評価値を上げるように評価式を設定したので、記番号以外の文字列がある場合や背景に絵柄や模様があるような場合でも、これらの影響を抑制し、記番号102に文字枠20(m)を当てる位置を正確に特定することができる。
また、文字列枠24に含まれる文字枠20(m)、余白枠50(n)、背景枠60、70及び80の複数の枠のうち一部の枠のみを利用した評価によって評価対象とする評価位置を絞り込んだ後に、文字枠20(m)を含む全ての枠を利用して評価することとしたので、記番号102の位置を正確に特定するという効果を維持しながら、全体の処理量を低減して高速な処理を実現することができる。また文字枠20(m)を含む複数の枠のうち一部の枠のみを利用した評価を行って、評価値が所定のしきい値を超えた場合にのみ文字枠20(m)を含む全ての枠を利用した評価を行うこととしたので、同様に全体の処理を低減し高速な処理を実現することができる。
なお、上記実施例1乃至実施例4の各々で説明した処理は、各処理を単独で行ってもよいし、選択した処理又は全ての処理を組み合わせて行ってもよい。また上述した処理は、紙幣に限らず、小切手、手形、商品券等の紙葉類に印刷された識別番号全般に適用することができ、この場合にも同様の効果を得ることができる。
以上のように、本発明に係る文字列切出方法及び文字列切出装置は、紙葉類上に印刷された識別番号を文字認識する際に、紙葉類を撮像した画像を利用して、文字列を形成する各各文字の文字位置を正確に特定する場合に有用である。
1 スキャナ1
2 金種識別部
3 制御部
3A 斜行補正部
3B 部分領域抽出部
3C 文字枠評価値算出部
3D 文字位置決定部
4 メモリ
4A 文字枠情報
4B 文字列情報
4C 背景枠情報
5 文字認識部
10 文字列切出装置
20(m) 文字枠
21(m)、51(n)、61、71、81 文字部
22(m)、52(n)、62、72、82 外周部
23 隙間領域
24 文字列枠
30 基点
50(n) 余白枠
60、70、80 背景枠
100 紙幣画像
101 部分領域
102 記番号
103 文字列
2 金種識別部
3 制御部
3A 斜行補正部
3B 部分領域抽出部
3C 文字枠評価値算出部
3D 文字位置決定部
4 メモリ
4A 文字枠情報
4B 文字列情報
4C 背景枠情報
5 文字認識部
10 文字列切出装置
20(m) 文字枠
21(m)、51(n)、61、71、81 文字部
22(m)、52(n)、62、72、82 外周部
23 隙間領域
24 文字列枠
30 基点
50(n) 余白枠
60、70、80 背景枠
100 紙幣画像
101 部分領域
102 記番号
103 文字列
Claims (11)
- 文字列が印刷又は印字された紙葉類を撮像した紙葉類画像に文字枠を施して文字列の画像を切り出す文字列切出方法であって、
前記文字列を形成する各文字を含む領域を文字部、前記文字部の周囲に接する環状領域を外周部、前記文字部とその外周部とを合わせたものを文字枠とし、全ての前記文字枠を含む領域を文字列枠として設定する文字列枠設定工程と、
前記各文字枠を対象として前記文字部内及び前記外周部内の各画像の特徴量を算出する特徴量算出工程と、
前記文字列枠を対象として前記特徴量に基づく文字列枠評価値を算出する評価値算出工程と、
前記紙葉類画像上で前記文字列枠の位置を移動させる文字列枠移動工程と、
前記文字列枠評価値が最大となる位置での前記文字列枠を用いて前記文字部内の画像を切り出す画像切出工程と
を含むことを特徴とする文字列切出方法。 - 前記文字列枠は、前記紙葉類の種類に応じて設定されることを特徴とする請求項1に記載の文字列切出方法。
- 前記特徴量は、領域内全画素の濃度平均値であることを特徴とする請求項1又は請求項2に記載の文字列切出方法。
- 前記文字列枠設定工程では、前記文字列を形成する文字に加えて、前記文字列に隣接する余白部分にも文字部及び外周部を設定し、
前記評価値算出工程では、前記余白部分に設定された前記文字部及び前記外周部の特徴量に基づく値を前記文字列枠評価値から減算した値を文字列枠評価値とする
ことを特徴とする請求項1又は請求項3に記載の文字列切出方法。 - 前記文字列枠設定工程では、前記文字列を形成する文字に加えて、前記紙葉類に印刷された切り出し対象外の文字にも文字部及び外周部を設定し、
前記評価値算出工程では、切り出し対象外の文字に設定された前記文字部及び前記外周部の特徴量に基づく値を前記文字列枠評価値から減算した値を文字列枠評価値とする
ことを特徴とする請求項1から請求項4のいずれか1項に記載の文字列切出方法。 - 前記文字列枠設定工程では、前記文字列を形成する文字に加えて、前記文字列と所定の位置関係で前記紙葉類に印刷された切り出し対象外の文字又は模様にも前記文字部及び前記外周部を設定し、
前記評価値算出工程では、切り出し対象外の文字又は模様に設定された前記文字部及び前記外周部の特徴量に基づく値を前記文字列枠評価値に加算した値を文字列枠評価値とする
ことを特徴とする請求項1から請求項5のいずれか1項に記載の文字列切出方法。 - 前記画像切出工程では、余白部分、切り出し対象外の文字又は模様に設定された前記文字部内の画像は切り出さない
ことを特徴とする請求項4から請求項6のいずれか1項に記載の文字列切出方法。 - 前記紙葉類画像上に設定された前記文字列枠の位置を固定したまま、前記文字部及び前記外周部を、前記文字列枠に対して所定方向に所定画素分移動させて前記特徴量を算出する工程、
をさらに含み、
前記評価値算出工程では、前記文字列枠が固定された位置で、前記文字部及び前記外周部の移動後の前記文字列枠評価値が、移動前の前記文字列枠評価値より大きいときは、前記文字列枠評価値を移動後の値とするとともに、
前記画像切出工程では、移動後の前記文字部内の画像を切り出し対象とする
ことを特徴とする請求項1から請求項7のいずれか1項に記載の文字列切出方法。 - 前記文字列枠に含まれる複数の前記文字枠のうちの一部を対象として、前記画像切出工程を除く前記各工程を実行して前記特徴量及び前記文字列枠評価値を算出する第1部分評価工程、
をさらに含み、
前記第1部分評価工程によって算出した前記文字列枠評価値が最大値から所定順位以内となった前記文字列枠の位置でのみ、前記文字枠の全てを対象とした前記特徴量算出工程、前記評価値算出工程、及び前記画像切出工程を実行する
ことを特徴とする請求項1から請求項8のいずれか1項に記載の文字列切出方法。 - 前記文字列枠に含まれる複数の前記文字枠のうちの一部を対象として前記特徴量及び前記文字列枠評価値を算出する第2部分評価工程、
をさらに含み、
前記第2部分評価工程によって算出した前記文字列枠評価値が所定しきい値を超えた前記文字列枠の位置でのみ、前記文字枠の全てを対象とした前記特徴量算出工程、前記評価値算出工程、及び前記画像切出工程を実行する
ことを特徴とする請求項1から請求項8のいずれか1項に記載の文字列切出方法。 - 文字列が印刷又は印字された紙葉類を撮像した紙葉類画像を受信して文字列枠を施すことにより文字列の画像を切り出す文字列切出装置であって、
前記紙葉類画像が傾いている場合にはこの傾きを補正する斜行補正部と、
前記紙葉類画像又は前記斜行補正部によって補正された紙葉類画像から前記文字列を含む領域を抽出する部分領域抽出部と、
前記文字列を形成する文字を含む領域を文字部、前記文字部の周囲に接する環状領域を外周部、前記文字部とその外周部とを合わせたものを文字枠、全ての前記文字枠を含む領域を文字列枠として設定して、前記文字列枠の位置を移動させながら前記文字部及び前記外周部の画像の特徴量を算出するとともに、各位置で算出した前記外周部及び前記文字部の特徴量に基づく文字列枠評価値を算出する評価値算出部と、
前記文字列枠評価値が最大となる前記文字列枠の位置における前記文字部を、画像を切り出す領域に決定する文字位置決定部と
を備えることを特徴とする文字列切出装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/055042 WO2012120587A1 (ja) | 2011-03-04 | 2011-03-04 | 文字列切出方法及び文字列切出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012120587A1 JPWO2012120587A1 (ja) | 2014-07-07 |
JP5624671B2 true JP5624671B2 (ja) | 2014-11-12 |
Family
ID=46797599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013503242A Active JP5624671B2 (ja) | 2011-03-04 | 2011-03-04 | 文字列切出方法及び文字列切出装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9008431B2 (ja) |
EP (1) | EP2682901A4 (ja) |
JP (1) | JP5624671B2 (ja) |
CN (1) | CN103460222B (ja) |
RU (1) | RU2557461C2 (ja) |
WO (1) | WO2012120587A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130156288A1 (en) * | 2011-12-19 | 2013-06-20 | De La Rue North America Inc. | Systems And Methods For Locating Characters On A Document |
ITTO20121174A1 (it) * | 2012-12-31 | 2014-07-01 | Cts Electronics S P A | Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili |
US20160189464A1 (en) * | 2013-07-31 | 2016-06-30 | Glory Ltd. | Bill handling system, bill handling apparatus, and bill handling method |
WO2015015534A1 (ja) * | 2013-07-31 | 2015-02-05 | グローリー株式会社 | 紙幣処理装置 |
US9472037B2 (en) * | 2014-01-31 | 2016-10-18 | Ncr Corporation | Media item re-orientation |
JP2015148987A (ja) * | 2014-02-07 | 2015-08-20 | 沖電気工業株式会社 | 情報処理装置、文字位置補正方法、プログラムおよび情報処理システム |
JP6335012B2 (ja) | 2014-04-30 | 2018-05-30 | グローリー株式会社 | 文字有無判定システム及び文字有無判定方法 |
CN103996239B (zh) * | 2014-06-13 | 2016-08-24 | 广州广电运通金融电子股份有限公司 | 一种基于多线索融合的票据定位识别方法及系统 |
JP6342739B2 (ja) * | 2014-07-28 | 2018-06-13 | 日立オムロンターミナルソリューションズ株式会社 | 紙葉類識別装置、紙葉類処理装置、および紙葉類識別方法 |
US9910566B2 (en) * | 2015-04-22 | 2018-03-06 | Xerox Corporation | Copy and paste operation using OCR with integrated correction application |
RU2613846C2 (ru) * | 2015-09-07 | 2017-03-21 | Общество с ограниченной ответственностью "Аби Девелопмент" | Метод и система извлечения данных из изображений слабоструктурированных документов |
KR101792690B1 (ko) | 2015-12-30 | 2017-11-03 | 기산전자(주) | 지폐 처리 장치 |
CN105761351A (zh) * | 2016-01-08 | 2016-07-13 | 东方通信股份有限公司 | 基于结构特征的字符识别方法 |
JP6934707B2 (ja) * | 2016-07-13 | 2021-09-15 | グローリー株式会社 | 有価証券の文字/番号検査装置及び文字/番号検査方法 |
RU2628266C1 (ru) * | 2016-07-15 | 2017-08-15 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и система подготовки содержащих текст изображений к оптическому распознаванию символов |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
WO2019090506A1 (en) * | 2017-11-08 | 2019-05-16 | Intel Corporation | Scene text detector for unconstrained environments |
JP6922690B2 (ja) * | 2017-11-22 | 2021-08-18 | 富士通株式会社 | 文字領域抽出プログラム、文字領域抽出装置及び文字領域抽出方法 |
KR102585645B1 (ko) * | 2018-02-20 | 2023-10-10 | 삼성전자주식회사 | 문자를 인식하기 위한 전자 장치 및 방법 |
US11003937B2 (en) * | 2019-06-26 | 2021-05-11 | Infrrd Inc | System for extracting text from images |
JP7337572B2 (ja) | 2019-07-08 | 2023-09-04 | グローリー株式会社 | 記番号読取装置、紙葉類処理装置、及び記番号読取方法 |
CN110378328B (zh) * | 2019-09-16 | 2019-12-13 | 图谱未来(南京)人工智能研究院有限公司 | 一种证件图像处理方法及装置 |
CN111695540B (zh) * | 2020-06-17 | 2023-05-30 | 北京字节跳动网络技术有限公司 | 视频边框识别方法及裁剪方法、装置、电子设备及介质 |
JP7390492B2 (ja) * | 2020-08-31 | 2023-12-01 | 富士通フロンテック株式会社 | 記番号認識パラメータ決定装置、記番号認識パラメータ決定プログラム及び紙葉類取扱システム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04104385A (ja) * | 1990-08-23 | 1992-04-06 | N T T Data Tsushin Kk | 帳票識別処理装置 |
JPH0799532B2 (ja) * | 1986-11-28 | 1995-10-25 | 富士電機株式会社 | 文字切出し装置 |
JPH09259219A (ja) * | 1996-03-26 | 1997-10-03 | Sharp Corp | 文字認識方法 |
JP2010225013A (ja) * | 2009-03-25 | 2010-10-07 | Hitachi Omron Terminal Solutions Corp | 記番号認識装置、紙葉類処理装置、自動取引処理装置、及び記番号認識方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06301814A (ja) | 1993-04-14 | 1994-10-28 | Kawasaki Steel Corp | 文字読取装置 |
US5915039A (en) * | 1996-11-12 | 1999-06-22 | International Business Machines Corporation | Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition |
GB0106817D0 (en) * | 2001-03-19 | 2001-05-09 | Rue De Int Ltd | Monitoring method |
ES2262035T3 (es) | 2003-01-08 | 2006-11-16 | Glory Ltd. | Dispositivo para la lectura de los numeros de serie de billetes de banco y metodo correspondiente. |
CN100514355C (zh) * | 2005-09-05 | 2009-07-15 | 富士通株式会社 | 指定文本行提取方法和装置 |
JP4774390B2 (ja) * | 2006-09-13 | 2011-09-14 | 株式会社キーエンス | 文字切り出し装置、方法およびプログラム |
CN101419661B (zh) * | 2007-10-26 | 2011-08-24 | 国际商业机器公司 | 基于图像中的文本进行图像显示的方法和系统 |
JP4739309B2 (ja) * | 2007-11-09 | 2011-08-03 | 株式会社リコー | 情報処理装置、及び情報処理方法 |
CN101689328B (zh) * | 2008-06-11 | 2014-05-14 | 松下电器产业株式会社 | 图像处理设备以及图像处理方法 |
JP5337194B2 (ja) * | 2011-04-25 | 2013-11-06 | シャープ株式会社 | 画像処理装置 |
JP6061502B2 (ja) * | 2012-06-04 | 2017-01-18 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
-
2011
- 2011-03-04 WO PCT/JP2011/055042 patent/WO2012120587A1/ja active Application Filing
- 2011-03-04 RU RU2013144590/08A patent/RU2557461C2/ru active
- 2011-03-04 JP JP2013503242A patent/JP5624671B2/ja active Active
- 2011-03-04 US US14/002,933 patent/US9008431B2/en active Active
- 2011-03-04 CN CN201180069000.1A patent/CN103460222B/zh active Active
- 2011-03-04 EP EP11860608.6A patent/EP2682901A4/en not_active Ceased
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0799532B2 (ja) * | 1986-11-28 | 1995-10-25 | 富士電機株式会社 | 文字切出し装置 |
JPH04104385A (ja) * | 1990-08-23 | 1992-04-06 | N T T Data Tsushin Kk | 帳票識別処理装置 |
JPH09259219A (ja) * | 1996-03-26 | 1997-10-03 | Sharp Corp | 文字認識方法 |
JP2010225013A (ja) * | 2009-03-25 | 2010-10-07 | Hitachi Omron Terminal Solutions Corp | 記番号認識装置、紙葉類処理装置、自動取引処理装置、及び記番号認識方法 |
Also Published As
Publication number | Publication date |
---|---|
RU2557461C2 (ru) | 2015-07-20 |
US9008431B2 (en) | 2015-04-14 |
WO2012120587A1 (ja) | 2012-09-13 |
RU2013144590A (ru) | 2015-04-10 |
CN103460222B (zh) | 2017-07-07 |
EP2682901A4 (en) | 2014-09-03 |
JPWO2012120587A1 (ja) | 2014-07-07 |
US20130343652A1 (en) | 2013-12-26 |
EP2682901A1 (en) | 2014-01-08 |
CN103460222A (zh) | 2013-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5624671B2 (ja) | 文字列切出方法及び文字列切出装置 | |
JP6139658B2 (ja) | 文字認識方法及び文字認識システム | |
JP4801551B2 (ja) | 画像領域検出方法、該プログラム、及び該装置 | |
JP5591578B2 (ja) | 文字列認識装置および文字列認識方法 | |
JP5214330B2 (ja) | 画像処理装置、バーコード処理装置、及び画像処理方法 | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
EP1628240A2 (en) | Outlier detection during scanning | |
JP5830338B2 (ja) | 帳票認識方法および帳票認識装置 | |
JP6555751B2 (ja) | 紙幣処理装置及び紙幣処理方法 | |
JP6665595B2 (ja) | 文字認識装置、方法およびプログラム | |
JP4945739B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6342739B2 (ja) | 紙葉類識別装置、紙葉類処理装置、および紙葉類識別方法 | |
JP6030917B2 (ja) | 文字切出装置及び文字切出方法並びに文字認識装置 | |
JP2016038821A (ja) | 画像処理装置 | |
JP2017174031A (ja) | 画像処理装置及び画像処理プログラム | |
JP2017116974A (ja) | 画像処理装置および画像処理プログラム | |
JP4696239B2 (ja) | 文字列の傾斜補正方法及び装置 | |
US11328425B2 (en) | Image processing apparatus and non-transitory computer readable medium | |
JP5054472B2 (ja) | 文字認識装置及び文字認識装置における文字認識方法 | |
JP6497138B2 (ja) | 原稿読取装置、表示制御方法および表示制御プログラム | |
JP7183820B2 (ja) | 画像処理装置および画像処理プログラム | |
JP6039944B2 (ja) | 帳票種類判別装置および帳票種類判別方法 | |
JP7310151B2 (ja) | マーク選定装置および画像処理装置 | |
JP3334369B2 (ja) | 選択項目認識装置 | |
JP2021128365A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140916 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5624671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |