JP2008276458A - 文字列認識方法及び文字列認識装置 - Google Patents

文字列認識方法及び文字列認識装置 Download PDF

Info

Publication number
JP2008276458A
JP2008276458A JP2007118454A JP2007118454A JP2008276458A JP 2008276458 A JP2008276458 A JP 2008276458A JP 2007118454 A JP2007118454 A JP 2007118454A JP 2007118454 A JP2007118454 A JP 2007118454A JP 2008276458 A JP2008276458 A JP 2008276458A
Authority
JP
Japan
Prior art keywords
character string
character
image data
boundary determination
recognition method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007118454A
Other languages
English (en)
Other versions
JP5011508B2 (ja
Inventor
Hiroshi Nakamura
宏 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nidec Instruments Corp
Original Assignee
Nidec Sankyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nidec Sankyo Corp filed Critical Nidec Sankyo Corp
Priority to JP2007118454A priority Critical patent/JP5011508B2/ja
Priority to US12/110,524 priority patent/US8200016B2/en
Publication of JP2008276458A publication Critical patent/JP2008276458A/ja
Application granted granted Critical
Publication of JP5011508B2 publication Critical patent/JP5011508B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】文字認識の迅速性を確保しつつ、認識精度を向上させることが可能な文字列認識方法及び文字列認識装置を提供する。
【解決手段】文字列認識方法において、画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工し、2値画像データを文字列の方向にシフトさせながら、文字列の方向と直交する垂直方向への2値画像データの垂直射影を計算し、垂直射影データが所定の境界判定閾値を超えた箇所を、文字列を構成する文字の区切り位置として検出し、検出された文字の区切り位置に基づいて、文字列から文字を切り出し、切り出した各文字の特徴を判定する各ステップを含み、特徴判定のステップより前に、文字列を構成する文字の個数に基づいて、境界判定閾値の有効性を判定するステップが含まれる。
【選択図】図2

Description

本発明は、紙やプラスチックなどの媒体上にある文字列を光学的に読み取る文字列認識方法及び文字列認識装置に関する。
従来から、例えば小切手などの媒体表面に印刷された文字列を認識するための装置がある。例えば、2値化された画像データから文字部分を検出して、その文字部分を外接矩形枠に沿って切り出し、得られた文字パターンから特徴量を抽出し、入力パターンの特徴ベクトルと特徴辞書中の文字ごとの基準ベクトルとの類似度を求め、その類似度の大きさにより候補文字を選択する、といった文字認識装置などが数多く知られている。
このような文字認識装置の中には、認識精度を向上させるために、認識結果に基づいて2値化をやり直したり、読み取りに失敗した場合に再度媒体読取を行ったりするなどの様々な工夫を施したものが存在する(例えば特許文献1〜3参照)。
より具体的に説明すると、特許文献1に開示された技術では、正常な文字認識の結果が得られなかった場合には、更に、異なる閾値で2値化したイメージデータに基づいて、再度文字認識を行うようにしている。また、特許文献2に開示された技術では、文字認識の結果と黒点数の計数結果によって、多値画像を2値化しなおす必要があるか否かを判定し、必要があれば、当初の閾値とは異なる閾値を設定し、その新たな閾値を用いて多値画像を2値化するようにしている。さらに、特許文献3に開示された技術では、認識精度が所定の値より低い場合に、再度文書画像を読み取らせるとともに、2値化閾値を変更して2値化を行わせるようにしている。
特開2001−022884号公報 特開平09−016715号公報 特開平07−129713号公報
しかしながら、特許文献1に開示された技術は、文字認識結果が得られるまで2値化の妥当性が判明しないため、時間ロスが生じてしまう。また、最初の2値化が不適当だった場合、想定外の結果を生じる可能性がある。特許文献2に開示された技術も、特許文献1に開示された技術と同様に、文字認識結果を利用するものであるため、処理の最終段まで実行しなければ2値化の妥当性が判明せず、結果的に時間ロスに繋がる。さらに、特許文献3に開示された技術は、文字画像の再読取を行うものであるため、やはり処理に時間が掛かる。このように、上述した各技術では、文字列認識の迅速性を更に向上させることが困難である。
本発明は、このような点に鑑みてなされたものであり、その目的は、文字認識の認識精度を向上させるとともに、その迅速性を確保することが可能な文字列認識方法及び文字列認識装置を提供することにある。
以上のような課題を解決するために、本発明は、以下のものを提供する。
(1) 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列を認識する文字列認識方法において、前記画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工する第1ステップと、前記2値画像データを前記文字列の方向にシフトさせながら、前記文字列の方向と直交する垂直方向への前記2値画像データの垂直射影を計算する第2ステップと、前記第2ステップにより得られた垂直射影データが所定の境界判定閾値を超えた箇所を、前記文字列を構成する文字の区切り位置として検出する第3ステップと、前記第3ステップで検出された文字の区切り位置に基づいて、前記文字列から文字を切り出し、切り出した各文字の特徴を判定する第4ステップと、を少なくとも含み、前記第4ステップより前に、前記文字列を構成する文字の個数に基づいて、前記境界判定閾値の有効性を判定する第5ステップが含まれることを特徴とする文字列認識方法。
本発明によれば、媒体上の文字列を撮像して得られた画像データを白黒の2値画像データに加工し、2値画像データの垂直射影を計算し、垂直射影データが所定の境界判定閾値を超えた箇所を文字の区切り位置として検出し、各文字の特徴を判定する文字列認識方法で、各文字の特徴を判定する前に、文字列を構成する文字の個数に基づいて境界判定閾値の有効性を判定することとしたので、精度良く迅速な文字認識が可能になる。
すなわち、文字列を構成する文字の個数に基づいて境界判定閾値の有効性を判定することによって、文字認識の精度を向上させることができるとともに、この判定ステップを各文字の特徴を判定する前に行うことによって、文字認識の迅速性を確保することができる(各文字の特徴を判定する処理は、パターンマッチング等の処理が必要になるなど、処理時間が多く掛かる場合がある)。
ここで、「文字列を構成する文字の個数に基づいて境界判定閾値の有効性を判定する」とは、文字列を構成する文字の個数情報を用いて、境界判定閾値が有効か否かを判定するものであれば如何なるものであってもよく、例えば、文字列を構成する文字の個数情報を用いて境界判定閾値を算出し、これと予め妥当性を確認しておいた境界判定閾値とを比較し、前者が後者を上回っていれば、境界判定閾値が有効であると判定し、前者が後者を上回っていなければ、境界判定閾値が有効でないと判定することもできる。
なお、本明細書における「文字」は、一般的なアルファベットだけなく、記号文字や絵文字、バーコード、更には数字なども含むものとし、媒体上で視認できることを条件に如何なる形態・大きさであってもよい。
(2) 前記第5ステップにより、前記境界判定閾値が有効でないと判定されたときに、前記2値化基準閾値を変更して、再び前記画像データを2値画像データに加工して、前記第1ステップから前記第5ステップを実行することを特徴とする文字列認識方法。
本発明によれば、上述した第5ステップによって、境界判定閾値が有効でないと判定されたときには、上述した2値化基準閾値を変更して、再び画像データを2値画像データに加工して、第2ステップから第5ステップを実行することとしたので、文字認識の迅速性と精度向上とを同時に図ることができる。
(3) 前記第5ステップにより、前記境界判定閾値が有効でないと判定されたときに、前記2値化基準閾値を当初よりも低い値に変更することを特徴とする文字列認識方法。
本発明によれば、上述した第5ステップによって、境界判定閾値が有効でないと判定されたときに、2値化基準閾値を当初よりも低い値に変更することとしたので、文字認識の迅速性と精度向上とを同時に図ることができる。
特に、手動搬送による文字(列)認識装置を考えた場合に、媒体のスワイプ速度が速い、あるいは媒体の背景が暗い場合、2値化閾値が相対的に高くなる結果、各文字の線が太くなるとともに、文字と文字との間のスペースが狭くなり、文字境界部分の射影レベル値が低下する。そのため、文字境界の検出ミスが起こりやすくなり、文字列を撮像した際の光量が低下する。その結果、各文字の線が細くなるとともに分解能が低くなり、読み取りエラーが生じる確率が高くなる。しかし、本発明は、境界判定閾値が有効でないと判定されれば、自動的に2値化基準閾値が当初よりも低い値に変更されるものであるため、各文字の線が細くなっても、読み取りエラーが生じる確率を下げることができる。更に、本発明は、従来の技術のような文字認識結果(文字の特徴判定結果)を利用するものではないため、文字認識の迅速性向上に資することもできる。
(4) 前記所定の境界判定閾値は、前記垂直射影データに含まれる正のピーク値を大きい方から順に並べたとき、最も大きなピーク値から数えて、前記文字列を構成する文字の個数に1を加えた個数番目に相当するピーク値であることを特徴とする文字列認識方法。
本発明によれば、上述した所定の境界判定閾値は、垂直射影データに含まれる正のピーク値を大きい方から順に並べたとき、最も大きなピーク値から数えて、文字列を構成する文字の個数に1を加えた個数番目に相当するピーク値であることとしたので、境界判定閾値の計算をより簡易に行うことができる。
(5) (1)から(4)のいずれか記載の文字列認識方法を用いて、媒体上の文字列を認識する文字列認識手段を備えたことを特徴とする文字列認識装置。
本発明によれば、上述した文字列認識方法を用いて、媒体上の文字列を認識する文字列認識手段を備えた文字列認識装置を提供することができる。
本発明に係る文字列認識方法及び文字列認識装置によれば、各文字の特徴判定の前に、境界判定閾値の有効性を判定することで、認識精度を向上させることができ、加えて、文字認識の迅速性を確保することができる。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
[文字列認識装置]
図1は、本発明の実施の形態に係る文字列認識装置1の電気的構成を示すブロック図である。
図1において、文字列認識装置1は、密着型の(1次元)撮像素子11と、画像メモリ12と、データ処理部13と、文字出力部14(例えばモニタ等)と、を有している。また、データ処理部13は、2値化部13aと、行切り出し部13bと、射影生成部13cと、閾値計算部13dと、閾値評価部13eと、境界決定部13fと、特徴抽出部13gと、特徴比較部13hと、特徴辞書格納部13iと、を有している。なお、これらの各部は、記録担体2上の文字列を認識する文字列認識手段の一例として機能する。また、これらの各部は、CPU又はMPUなどの電気要素によって、ハードウェア的に実現することができる。
撮像素子11は、記録担体2上のOCR文字列を撮像し、そのOCR文字列の光電変換を行う。そして、それによって得られた画像データは、一旦画像メモリ12に取り込まれる。その後、データ処理部13は、画像メモリ12から画像データを読み出して、上述した各部において様々な処理を施し、最終的に、記録担体2上のOCR文字列を認識するようにしている。
一方で、記録担体2は、JISに準拠している一般的なカードであってもよく、例えば、幅86mm,高さ54mm,厚み0.76mmというサイズのプラスチックカードでもよく、IDカードやパスポートブック、或いは運転免許証などでもよい。
[文字列認識方法]
図2は、本発明の実施の形態に係る文字列認識方法を示すフローチャートである。
図2に示すように、本実施形態に係る文字列認識方法では、まず、2値化閾値計算が行われる(ステップS1)。より具体的には、データ処理部13の2値化部13aは、画像メモリ12から画像データを読み出して、適当な方法によって閾値(2値化基準閾値)を求める。なお、閾値の求め方については如何なる方法を採用してもよい。また、このステップS1で求めた2値化基準閾値は、次のステップS2の処理において用いられる。
次に、2値化処理が行われる(ステップS2)。より具体的には、データ処理部13の2値化部13aは、画像メモリ12から画像データを読み出して、その画像データが多諧調の濃淡画像である場合には、白黒2値の画像(2値画像データ)に変換を行う。なお、この画像メモリ12は、RAM,SDRAM,DDRSDRAM,RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。また、このステップS2は、画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工する「第1ステップ」の一例に相当する。
次いで、行切り出しが行われる(ステップS3)。より具体的には、データ処理部13の行切り出し部13bは、2値化した文字列を水平方向に射影して、文字列の上下エッジを検出する。そして、上下エッジの中心位置を、文字列の中心ラインと識別して行切り出しを行う。
次いで、射影計算が行われる(ステップS4)。より具体的には、データ処理部13の射影生成部13cは、ステップS3で検出された文字列ごとの画像データ(2値画像データ)について、文字列の垂直方向に射影計算(濃度投影)を行う。これは、文字列ごとに水平方向の文字の区切り位置を検索するために必要な処理である。
なお、このステップS4は、2値画像データを文字列の方向にシフトさせながら、文字列の方向と直交する方向への2値画像データの垂直射影を計算する「第2ステップ」の一例に相当する。また、濃度投影とは、いわばヒストグラム(濃度分布図)の一種であり、2値化によって「1」または「0」の濃度に変換された画素を、濃度別に合計したものであり、白または黒のどちらを合計値として計算してもよい。また、水平軸(X軸)に対する垂直方向の画素の加算は、ステップS2の行切り出しにおいて求めた文字列(文字ライン)上下エッジ(+α)を両端点とする範囲で行うように設定する。
このステップS4に関して具体例を示す。図3は、記録担体2のOCR文字記憶領域(図1参照)に印刷された文字を撮像したときの画像データを示す図である。また、図4は、図3に示す画像データを垂直射影した結果(一例)を示す図である。
図4に示すように、文字ライン長(文字列の両端間の画素数)は、垂直射影データにおいてPs地点からPe地点までの画素数となる。このPs地点からPe地点までの画素数は、記録担体2をスワイプさせる速度と密接な関係がある。すなわち、スワイプ速度が低速の場合には、この画素数は多くなる(十分な分解能が得られる)一方で、スワイプ速度が高速の場合には、この画素数は少なくなる。
ここで、図5は、文字列を構成する文字「KO<BC」に着目したときの画像データである。また、図6は、図5に示す画像データを垂直射影することによって得られた垂直射影データ(一例)である。なお、図5は、図3中の「K」から「C」までの画像データを示している。
次に、文字境界判定のための閾値を計算する(ステップS5)。より具体的には、データ処理部13の閾値演算部13dは、垂直射影データに含まれる全ての正のピークを検出し、その正ピーク値に関するヒストグラムを作成する(メモリ上で仮想的に考える)。そして、この正ピーク値ヒストグラムにおいて、最大値から最小値の方向への累積度数を求め、その累積度数が、想定される文字の個数を超えるポイントを検出し、そのポイントにおけるピーク値を閾値に設定する。
このステップS5について、図7〜図9を用いて具体例を説明する。図7は、図3に示す画像データを垂直射影した結果(一例)を示す図である。図8は、図7に示す垂直射影データにおいて、正のピーク値のヒストグラムを示す図である。図9は、図8のヒストグラムについて、最大値から最小値の方向への累積度数を求めた図である。なお、図8では、横軸をピーク値、縦軸を度数としており、図9では、横軸をピーク値、縦軸を累積度数としている。
図8によれば、例えばピーク値が220前後となっているものが全部で5個存在している一方で、大半のピーク値は、255付近に密集していることが分かる。そして、図9によれば(図9に示す折れ線を右端から左方へ辿っていくと)、255付近で正のピーク値の累積度数が急激に増え、その後、ピーク値が小さくなるにつれて、なだらかに増加している。
ここで、仮に認識すべき文字の個数が44個であったとすると、図9において累積度数が44を超える時点におけるピーク値、すなわち累積度数が45(認識すべき文字の個数+1)となる時点におけるピーク値225が、境界判定閾値(図7でいうSLEV)となる。このように、本実施形態では、境界判定閾値は、垂直射影データに含まれる正のピーク値を大きい方から順に並べたとき、最も大きなピーク値から数えて、文字列を構成する文字の個数に1を加えた個数番目に相当するピーク値となっている。
次に、この境界判定閾値の妥当性が判断される(ステップS6)。より具体的には、データ処理部13の閾値評価部13eは、ステップS5で求めた境界判定閾値が妥当か否かを判断する。図7〜図9に示す具体例のように、境界判定閾値が相対的に低い場合は、記録担体2の移動速度が速いことが主原因である。移動速度が比較的遅い場合は、文字と文字との間の空白部分が長くなるために、この部分の垂直射影データ(射影プロファイル)も、図6に示すように幅広ピークとなり、十分な出力値をもつ。一方で、移動速度が速くなると、文字と文字の空白部分が短くなり、図10に示すようになる。図10は、図5に示す画像データを垂直射影することによって得られた垂直射影データ(一例)である。
図10によれば、垂直射影データのピーク形状が尖鋭化するとともに、そのレベル値も低下してくる。その結果、境界ピークの検出精度が低下するため、正確な文字切り出しが保証されなくなる。例えば、図7に示す具体例でいえば、図中の矢印で示したピークが境界判定閾値を下回っており、これは境界として認識されない可能性がある。
しかし、垂直射影データのピーク値が低すぎることが分かれば、画像2値化の閾値再調整(ステップS7に示す「2値化閾値更新処理」)によって適正化することができる場合がある。すなわち、境界判定閾値が有効でないと判定されたときに、2値化基準閾値を当初よりも低い値に変更すれば、全体に白画素が増加することにより、境界ピーク値が増大し、安定的な文字境界検出が可能になる。
2値化再実行をする様子として、図11〜図13を用いて説明する。妥当な境界判定閾値は、実験によって235以上が適当であることが分かっているものとする。なお、図11は、図3に示す画像データを垂直射影した結果(一例)を示す図である。図12は、図11に示す垂直射影データにおいて、正のピーク値のヒストグラムを示す図である。図13は、図12のヒストグラムについて、最大値から最小値の方向への累積度数を求めた図である。
図7に示す具体例では、境界判定閾値がSLEV=225となり、SLEV≧235を満たさないので(ステップS6:NO)、ステップS7の処理を経た上で、2値化処理ステップ(ステップS2)に戻り、再度2値化を実行する。具体的には、初期の2値化閾値はSLEV=80であったので、例えば新しい2値化閾値をSLEV'=SLEV−10=70として(ステップS7の処理の一例)、もとの画像の2値化をやり直す(ステップS2)。そして、図7〜図9に示す具体例と同様に、垂直射影データ(射影プロファイル)を求め(図11)、垂直射影データの全ての正ピークを求めて作成したヒストグラム(図12)によって、再び境界判定閾値を計算すると、図11及び図13に示すようにSLEV'=243となる。このSLEV'は、SLEV'≧235を満たすものであるから、この結果を受け入れることができる(ステップS6:YES)。
このように、ステップS6では、境界判定閾値が適正なレベルかどうかによって、2値化をやり直すかどうかを決定している。したがって、ステップS6は、文字列における文字の個数に基づいて、境界判定閾値の有効性を判定する「第5ステップ」の一例に相当する。なお、従来例では、後述する文字認識ステップ(ステップS9〜ステップS11)で初めて信頼度の評価を行い、不十分な場合に、スキャンをやり直すか、新たな2値化閾値を設定して2値化をやり直すようにしていた。しかし、本実施形態に係る文字列認識方法では、文字境界判定閾値の妥当性検討(ステップS6)を、境界決定処理(ステップS8)や特徴抽出(ステップS9)に先行して行いフィードバックしている。その結果、より短い処理時間で済むという利点がある。
このようにして、境界判定閾値が妥当であると判定された場合には(ステップS6:YES)、境界決定処理が行われる(ステップS8)。より具体的には、データ処理部13の境界決定部13fは、射影プロファイルのレベル値を、ステップS6において妥当と判定された境界判定閾値と比較して、境界判定閾値を超えている区間を文字と文字との間のスペースと判定する(文字境界を決定する)。なお、例えばこのスペースの中点を境界位置とするようにしてもよい。また、このステップS8は、ステップS4において得られた垂直射影データが所定の境界判定閾値(ステップS6において妥当と判定されたもの)を超えた箇所を、文字列を構成する文字の区切り位置として検出する「第3ステップ」の一例に相当する。
このようにして、ステップS8の処理によって、各文字の左右境界位置が暫定的に決定されると、図14に示すように外周矩形領域内における文字が求められる。図14は、文字列を構成する文字「<」の画像データを示す図である。
図14において、この「<」の文字の位置を正確に特定するために、垂直射影PX及び水平射影PYを計算する。そして、求められたPXに沿って、文字の左右境界位置の検出を行い、矩形領域の左端点を起点としてPXを右方向にスキャンして、そのレベル値(画素の検出)が連続して一定回数(例えば3回)閾値を下回ったら、その最初の地点を文字の左エッジとする。そして、同様に矩形領域の右端点を起点としてPXを左方向にスキャンして、連続して一定回数、閾値を下回ったらその最初の地点を文字の右エッジとする。
次に、水平射影PYについても同様に、境界決定処理にて得られている左エッジ位置と右エッジ位置とで区切られた範囲を定義域として行い、矩形領域の上下両端を外側からスキャンして、各レベル値が連続して一定回数、閾値を下回ったら、その最初の地点を文字の上下エッジとする。このようにして、文字列内の文字位置を特定することができる。
次に、特徴抽出が行われる(ステップS9)。より具体的には、データ処理部13の特徴抽出部13gは、上述した外接矩形領域を任意のサブ領域に分割(例えば1個の外接矩形領域を5×5の領域に分割し、そのうち1個の領域をサブ領域とする)し、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合を求め、それらを要素とする特徴ベクトルを生成する。なお、このステップS9は、ステップS8において検出された文字の区切り位置に基づいて、文字列から文字を切り出し、切り出した各文字の特徴を判定する「第4ステップ」の一例に相当する。
次に、特徴比較が行われる(ステップS10)。より具体的には、データ処理部13の特徴比較部13hは、ステップS9で求めた特徴ベクトルを、予め記録担体2で使用される全文字について求めておいた基準特徴ベクトルと比較して、類似度(例えば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定する。
なお、基準特徴ベクトルは、予め特徴辞書格納部13iに格納されているものであって、特徴比較が行われる際に、特徴辞書格納部13iから類似度が高い文字のデータが読み出され、特徴比較が行われる。
最後に、文字判定が行われる(ステップS11)。より具体的には、ステップS10の特徴比較によって設定された候補文字を、記録担体2に用いられた文字として認識する。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別を行う。
例えば、任意に分割したサブ領域を左側半分と右側半分との2領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との2領域の上下線対称に分けて、類似性を調べたりしてもよい。また、左右線対称や上下線対象と同様に点対称で類似性を調べてもよい。
さらには、ひとつの文字について3種類の形状特徴量が得られたので、それらの値の相互関係から、該当する文字を対応付けてもよい。また、これでも分離できない場合もあり得る。例えば、記録担体2に用いられる文字タイプによっては、'O'と'0'の判別が難しい場合がある。この場合、例えば、文字の高さの違いや、四隅の曲率の違いを調べるなどにより、判別することができる。
[実施形態の効果]
以上説明したように本実施形態に係る文字列認識方法は、媒体上の既知の位置に印刷された既知の文字数からなる文字列を、1次元撮像素子で主走査を行い、手動若しくは機械駆動による媒体移動で副走査を行うようにして、2次元の画像情報に変換し、この画像データを適切に処理することによって文字列の認識を行うようにした文字列認識装置において使用される。特に、媒体をスキャンした多値画像を2値化する2値化処理ステップ(図2のステップS2参照)と、媒体移動方向に沿った文字列における文字の区切り位置を検出するために、文字の存在する画像領域に関して主走査方向の射影プロファイルを生成する射影生成ステップと(図2のステップS4参照)、射影に基づいて文字の境界を決定するために必要な境界判定閾値を算出するステップと(図2のステップS5参照)、この境界判定閾値が有効であるか否かを判定する閾値評価ステップと(図2のステップS6参照)、を有し、さらに、境界判定閾値が有効でないと判定されたときには、再度多値媒体画像の2値化を実行する再実行パスを有することにより(図2のステップS7参照)、文字判定処理(図2のステップS11参照)の結果によらず、中間段階で自動的に2値化の妥当性が判断できるため、文字認識を正確かつ短時間に行うことができる。
また、文字境界判定のための閾値を決定するに当たって、垂直射影データに含まれる全てのピークを検出し、それらのうちの正ピーク値ヒストグラムに基づいて決定するようにしたため、境界判定の閾値をより正確に設定することができる。
さらに、上述したピーク値ヒストグラムにおける最大値から最小値方向への累積度数を求め、その値が想定される文字の個数を越えた地点のピーク値を、境界判定閾値として設定するようにしたため、境界決定処理をより簡易にすることができる。
なお、本実施形態では、1次元撮像素子11,リニア搬送機構を用いることとしたが、本発明はこれらに限定されるものではない。例えば、2次元CCDやCMOSイメージャなどのエリアセンサと被写体支持機構との組み合わせでもよい。また、認識対象としては、活字文字だけでなく、手書き文字にも適用できる。また、文字認識に止まらず、1次元及び2次元バーコードの復号などにも適用できる。
本発明に係る文字列認識方法及び文字列認識装置は、文字列認識の精度低下を防ぐとともに、認識速度の向上を図ることが可能なものとして有用である。
本発明の実施の形態に係る文字列認識装置の電気的構成を示すブロック図である。 本発明の実施の形態に係る文字列認識方法を示すフローチャートである。 記録担体のOCR文字記憶領域(図1参照)に印刷された文字を撮像したときの画像データを示す図である。 図3に示す画像データを垂直射影した結果(一例)を示す図である。 文字列を構成する文字「KO<BC」に着目したときの画像データである。 図5に示す画像データを垂直射影することによって得られた垂直射影データ(一例)である。 図3に示す画像データを垂直射影した結果(一例)を示す図である。 図7に示す垂直射影データにおいて、正のピーク値のヒストグラムを示す図である。 図8のヒストグラムについて、最大値から最小値の方向への累積度数を求めた図である。 図5に示す画像データを垂直射影することによって得られた垂直射影データ(一例)である。 図3に示す画像データを垂直射影した結果(一例)を示す図である。 図11に示す垂直射影データにおいて、正のピーク値のヒストグラムを示す図である。 図12のヒストグラムについて、最大値から最小値の方向への累積度数を求めた図である。 文字列を構成する文字「<」の画像データを示す図である。
符号の説明
1 文字列認識装置
2 記録担体
11 撮像素子
12 画像メモリ
13 データ処理部
13a 2値化部
13b 行切り出し部
13c 射影生成部
13d 閾値演算部
13e 閾値評価部
13f 境界決定部
13g 特徴抽出部
13h 特徴比較部
13i 特徴辞書格納部
14 文字出力部

Claims (5)

  1. 媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列を認識する文字列認識方法において、
    前記画像データを所定の2値化基準閾値を用いて白黒の2値画像データに加工する第1ステップと、
    前記2値画像データを前記文字列の方向にシフトさせながら、前記文字列の方向と直交する垂直方向への前記2値画像データの垂直射影を計算する第2ステップと、
    前記第2ステップにより得られた垂直射影データが所定の境界判定閾値を超えた箇所を、前記文字列を構成する文字の区切り位置として検出する第3ステップと、
    前記第3ステップで検出された文字の区切り位置に基づいて、前記文字列から文字を切り出し、切り出した各文字の特徴を判定する第4ステップと、を少なくとも含み、
    前記第4ステップより前に、前記文字列を構成する文字の個数に基づいて、前記境界判定閾値の有効性を判定する第5ステップが含まれることを特徴とする文字列認識方法。
  2. 前記第5ステップにより、前記境界判定閾値が有効でないと判定されたときに、前記2値化基準閾値を変更して、再び前記画像データを2値画像データに加工して、前記第1ステップから前記第5ステップを実行することを特徴とする請求項1記載の文字列認識方法。
  3. 前記第5ステップにより、前記境界判定閾値が有効でないと判定されたときに、前記2値化基準閾値を当初よりも低い値に変更することを特徴とする請求項2記載の文字列認識方法。
  4. 前記所定の境界判定閾値は、前記垂直射影データに含まれる正のピーク値を大きい方から順に並べたとき、最も大きなピーク値から数えて、前記文字列を構成する文字の個数に1を加えた個数番目に相当するピーク値であることを特徴とする請求項1から3のいずれか記載の文字列認識方法。
  5. 請求項1から4のいずれか記載の文字列認識方法を用いて、媒体上の文字列を認識する文字列認識手段を備えたことを特徴とする文字列認識装置。
JP2007118454A 2007-04-27 2007-04-27 文字列認識方法及び文字列認識装置 Expired - Fee Related JP5011508B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007118454A JP5011508B2 (ja) 2007-04-27 2007-04-27 文字列認識方法及び文字列認識装置
US12/110,524 US8200016B2 (en) 2007-04-27 2008-04-28 Method and apparatus for character string recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007118454A JP5011508B2 (ja) 2007-04-27 2007-04-27 文字列認識方法及び文字列認識装置

Publications (2)

Publication Number Publication Date
JP2008276458A true JP2008276458A (ja) 2008-11-13
JP5011508B2 JP5011508B2 (ja) 2012-08-29

Family

ID=40054345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007118454A Expired - Fee Related JP5011508B2 (ja) 2007-04-27 2007-04-27 文字列認識方法及び文字列認識装置

Country Status (2)

Country Link
US (1) US8200016B2 (ja)
JP (1) JP5011508B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014238829A (ja) * 2013-06-06 2014-12-18 ゼロックス コーポレイションXerox Corporation ナンバープレート自動認識のための適応的文字切り出し方法及びシステム
JP2021009539A (ja) * 2019-07-01 2021-01-28 パナソニックIpマネジメント株式会社 文字領域決定方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4626777B2 (ja) * 2008-03-14 2011-02-09 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN101984426B (zh) * 2010-10-21 2013-04-10 优视科技有限公司 用于对网页图片进行字符切分的方法及装置
EP2645305A3 (en) * 2012-03-26 2014-05-14 Tata Consultancy Services Limited A system and method for processing image for identifying alphanumeric characters present in a series
US10402704B1 (en) * 2015-06-30 2019-09-03 Amazon Technologies, Inc. Object recognition with attribute-based cells

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307640A (ja) * 1992-04-30 1993-11-19 Toshiba Corp 文字読取装置
JPH07325882A (ja) * 1994-05-30 1995-12-12 Nippon Steel Corp 文字認識装置及び文字認識方法
JPH087031A (ja) * 1994-06-22 1996-01-12 Nec Corp 文字枠検出装置
JPH08305795A (ja) * 1995-04-28 1996-11-22 Nippon Steel Corp 文字認識方法
JP2002157552A (ja) * 2000-11-22 2002-05-31 Oki Electric Ind Co Ltd 光学式文字読取装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
US5825920A (en) * 1991-01-28 1998-10-20 Hitachi, Ltd. Method and unit for binary processing in image processing unit and method and unit for recognizing characters
US5253304A (en) * 1991-11-27 1993-10-12 At&T Bell Laboratories Method and apparatus for image segmentation
JPH07129713A (ja) 1993-11-01 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置
JP3335009B2 (ja) * 1994-09-08 2002-10-15 キヤノン株式会社 画像処理方法及び画像処理装置
US5889884A (en) * 1995-05-23 1999-03-30 Minolta Co., Ltd. Image forming apparatus capable of recognizing top and bottom of document image
JP2812256B2 (ja) 1995-06-30 1998-10-22 日本電気株式会社 文字認識装置および方法
JP2974061B2 (ja) * 1996-11-13 1999-11-08 日本電気株式会社 パタン抽出装置
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
JP2001022884A (ja) 1999-07-07 2001-01-26 Oki Electric Ind Co Ltd 文字認識装置
US6473517B1 (en) * 1999-09-15 2002-10-29 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
US20060013511A1 (en) * 2004-07-16 2006-01-19 Brian De Champlain Method and apparatus for identifying optical media
US7302098B2 (en) * 2004-12-03 2007-11-27 Motorola, Inc. Character segmentation method and apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307640A (ja) * 1992-04-30 1993-11-19 Toshiba Corp 文字読取装置
JPH07325882A (ja) * 1994-05-30 1995-12-12 Nippon Steel Corp 文字認識装置及び文字認識方法
JPH087031A (ja) * 1994-06-22 1996-01-12 Nec Corp 文字枠検出装置
JPH08305795A (ja) * 1995-04-28 1996-11-22 Nippon Steel Corp 文字認識方法
JP2002157552A (ja) * 2000-11-22 2002-05-31 Oki Electric Ind Co Ltd 光学式文字読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014238829A (ja) * 2013-06-06 2014-12-18 ゼロックス コーポレイションXerox Corporation ナンバープレート自動認識のための適応的文字切り出し方法及びシステム
JP2021009539A (ja) * 2019-07-01 2021-01-28 パナソニックIpマネジメント株式会社 文字領域決定方法

Also Published As

Publication number Publication date
US20080304746A1 (en) 2008-12-11
US8200016B2 (en) 2012-06-12
JP5011508B2 (ja) 2012-08-29

Similar Documents

Publication Publication Date Title
JP5334042B2 (ja) 文字列認識方法及び文字列認識装置
US7636483B2 (en) Code type determining method and code boundary detecting method
US7949187B2 (en) Character string recognition method and device
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
JP5591578B2 (ja) 文字列認識装置および文字列認識方法
JP4911340B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
US8462394B2 (en) Document type classification for scanned bitmaps
JP6171167B2 (ja) 文字認識装置、文字認識方法、及び文字認識プログラム
US5915039A (en) Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP6039413B2 (ja) 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム
JP5011508B2 (ja) 文字列認識方法及び文字列認識装置
JP6487255B2 (ja) 文字切り出し装置、文字認識装置、および文字切り出し方法
JP4945739B2 (ja) 文字列認識方法及び文字列認識装置
JP6599672B2 (ja) 文字切り出し装置、文字認識装置、および文字切り出し方法
JP5630689B2 (ja) 文字認識方法及び文字認識装置
CN116469090A (zh) 喷码图案的检测方法、装置、电子设备和存储介质
JP2008084105A (ja) 文字切出方法及び文字認識装置
JP6144892B2 (ja) 画像処理装置、画像処理方法及びプログラム
Tkachenko et al. Robustness of character recognition techniques to double print-and-scan process
KR101070051B1 (ko) 도트 패턴에서 불변 영역을 인식하는 방법
JP2022186250A (ja) 画像処理装置、画像処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120413

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120507

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5011508

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees