JP6268023B2 - 文字認識装置およびその文字切り出し方法 - Google Patents

文字認識装置およびその文字切り出し方法 Download PDF

Info

Publication number
JP6268023B2
JP6268023B2 JP2014073451A JP2014073451A JP6268023B2 JP 6268023 B2 JP6268023 B2 JP 6268023B2 JP 2014073451 A JP2014073451 A JP 2014073451A JP 2014073451 A JP2014073451 A JP 2014073451A JP 6268023 B2 JP6268023 B2 JP 6268023B2
Authority
JP
Japan
Prior art keywords
character
boundary
search range
character string
boundary position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014073451A
Other languages
English (en)
Other versions
JP2015197681A (ja
Inventor
中村 宏
宏 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nidec Sankyo Corp
Original Assignee
Nidec Sankyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nidec Sankyo Corp filed Critical Nidec Sankyo Corp
Priority to JP2014073451A priority Critical patent/JP6268023B2/ja
Priority to US14/674,480 priority patent/US9324001B2/en
Publication of JP2015197681A publication Critical patent/JP2015197681A/ja
Application granted granted Critical
Publication of JP6268023B2 publication Critical patent/JP6268023B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

本発明は、文字列を撮像して得られた画像データを処理することによって文字列から各文字を切り出す文字認識技術に関するものである。
文字認識技術においては、一般に行(文字列)区切り位置の特定を行い、位置決定された文字行(文字列)において、文字間の区切り位置を特定する、という構成をとることが多い(たとえば、特許文献1参照)。
図12は、従来の文字切り出しの処理フローを示すフローチャートである。この文字切り出し処理(ステップST1〜ST3)では、まずひとつの文字ライン(文字列)について水平軸への射影を計算する。この射影の計算では垂直方向の画素の加算(または算術平均)を行うが、その加算範囲は、たとえば、文字ライン(文字列)切り出し部において求めた文字ライン(文字列)の上下エッジを両端点とする範囲に設定する。このようにして得られた射影プロファイルに対し、あらかじめ定めておいた閾値SLEV(SLEVの設定方法はたとえば特許文献1参照に開示されている方法を用いることができる)とこの射影プロファイルのレベル値を比較し、閾値SLEVを超えている区間を文字と文字の間のスペースと判定する。境界位置は、たとえばスペースの両端点の中点に設定する。
特開2008-250754号公報
ところが、このように閾値との大小関係で境界位置を求める方法では、画像のノイズによって射影曲線に局所的なノイズが生じた場合、このノイズのピーク位置を境界位置と誤判定してしまうおそれがある。
特許文献1に示す文字切り出し処理では、文字の境界を検出する処理として、認識対象の文字列に対してその射影(文字列が形成されている方向に対して直交する方向に)をとり、一定の閾値を設ける。射影のプロファイルと閾値との比較により、文字と文字の境界を求めるようにしている。
このような閾値との大小関係を利用する方式では、閾値をどのように設定するかが問題となることが多い。文字が正常な場合はよいが、文字のつぶれやノイズなどによって結合したような場合や、媒体の移動速度変動による画像解像度の低下(モジュレーションの劣化)の場合は、閾値のレベルによって文字境界の見逃しやノイズによる文字の境界位置の誤検出といった問題が生じやすく、結果的に安定的な認識性能が阻害されることになる。
本発明は、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも文字の区切りを可能とする文字認識装置を提供する。また、本発明は、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも確実に文字の切り出しを行うことが可能な文字認識装置の文字切り出し方法を提供する。
本発明の第1の観点は、画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、媒体上の文字列を撮像して画像データとして読み取る画像読取部と、前記画像読取部による読み取り画像を格納する画像メモリと、前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、前記データ処理部は、前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し部を備え、前記文字切り出し部は、前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定部と、設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を設定する境界位置設定部と、を含む。これにより、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも文字の区切りが可能となる。
好適には、前記文字切り出し部は、前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する射影曲線作成部を含み、前記境界検索範囲設定部は、前記射影曲線に関連付けて前記境界検索範囲を設定する。これにより、文字区間と空白区間が明確に分離され、正確な文字区切り位置の決定が可能となる。また、文字認識の性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能であり、ひいては文字認識性能の向上を図ることが可能となる。
好適には、前記境界位置設定部は、前記境界検索範囲内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定する。これにより、射影曲線のレベル値に基づく閾値を設定することなく、文字の境界位置を決定できるため、煩雑な閾値処理を行うことなく、境界があいまいなものについて境界線を設定することができる。
好適には、前記境界検索範囲設定部は、前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、前記境界位置設定部は、順次設定される前記境界検索範囲ごとに境界位置を設定する。これにより、各列ごとのように局所的な判別情報を一文字ずつ高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。
本発明の第2の観点は、媒体上の文字列を撮像して得られた画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置において、前記画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し工程と、前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定工程と、設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得工程と、を有する。これにより、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも確実に文字の切り出しを行うことが可能となる。
本発明は、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも文字の区切りを可能とする文字認識装置を提供する。また、本発明は、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも確実に文字の切り出しを行うことが可能な文字認識装置の文字切り出し方法を提供する。
本発明の実施形態に係る文字認識装置の構成例を示す図である。 本実施形態に係る文字切り出し部の構成例を示すブロック図である。 図2の境界検索範囲設定部の構成例を示すブロック図である。 本実施形態に係る文字認識対象の画像の一例を示す図である。 図4の画像の一文字列とこの文字列に対応する射影曲線の例を示す図である。 本実施形態の文字端検出部における文字端の検出処理を示すフローチャートである。 本実施形態の文字端検出部における文字端の検出処理を説明するための図である。 本実施形態に係る文字切り出し部における処理の概要を示すフローチャートである。 本実施形態に係る文字切り出し部における境界位置設定部の処理フローを示すフローチャートである。 本実施形態に係る文字切り出し部における境界位置設定部により文字列全体の文字境界点を検出した結果を示す図である。 本実施形態に係る文字認識装置の動作を説明するためのフローチャートである。 従来の文字切り出しの処理フローを示すフローチャートである。
以下、本発明の実施形態を図面に関連付けて説明する。
(文字認識装置の構成)
図1は、本発明の実施形態に係る文字認識装置の構成例を示す図である。
本実施形態に係る文字認識装置10は、紙やプラスチック等の媒体上の文字列を撮像して得られた、たとえば多階調の多値画像データを処理することによって、画像データから切り出した文字列から各文字を切り出して認識する機能を有する。
文字認識装置10は、画像認識技術に基づいて、撮像された画像内の文字列の区切り位置を検出(検索)する方法において、その文字列に関して計算される輝度投影(射影)について、境界検出処理対象となる2文字を含む処理区間を設定する。そして、文字認識装置10は、その処理区間内において射影(X軸への投影)を作成し、その射影に関してこれを左右に任意の位置で2分割したときに、その各分割要素において要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を最適分割点として選び、その点を2文字の分割点(境界位置)とする。文字認識装置10は、基本的に、文字切り出し処理における射影生成に際し、文字が第1方向である横方向すなわちX軸方向に並んでいるときはX軸への射影を生成し、文字が第1方向に直交する第2方向である縦方向すなわちY軸方向に並んでいるときはY軸への射影を生成する。以下では、一例として、X軸への射影として説明する。なお、本実施形態において、射影の次元は画素値であり、nビット濃淡画像である場合には0〜(2n−1)階調の多値をとる。
そして、本実施形態に係る文字認識装置10は、画像認識技術に基づいて、撮像された画像データ内の文字列の区切り位置を検索(検出)する際において、より具体的には、次のような特徴的な処理を行う。すなわち、文字認識装置10は、文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し処理と、文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定処理と、設定した検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得処理と、を行い、画像データから切り出された文字列から各文字を切り出して文字を認識する。
文字認識装置10は、画像データにおいて文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、画像データの文字が並んでいる方向の射影曲線を作成し、この射影曲線により境界検索範囲を設定する。文字認識装置10は、境界検索範囲設定処理において、文字列の一端側(基本的に文字の書き出し側である左端側)から境界検索範囲を設定し、設定した境界検索範囲において境界位置設定処理により境界位置を設定し、境界位置が設定されると、この設定された境界位置から次の境界検索範囲を一文字ずつ順次に設定していく。
文字認識装置10は、境界位置設定処理において、文字の区切り位置を設定する際に、判別分析法を用いて文字の区切り位置を求める。具体的には、文字認識装置10は、射影曲線に関連付けて設定された境界検索範囲“S”内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々の計算し、求めた分散比に基づき文字の区切り位置を設定する。
以下に、本文字認識装置10の具体的な構成および撮像画像の文字認識処理機能について説明する。
文字認識装置10は、データ入力部としての密着型の(1次元)撮像素子(画像読取部)11、画像メモリ12、およびデータ処理部13を有している。すなわち、本実施形態に係る文字認識装置10は、図1に示すように、媒体としてのIDカード(身分証明書)20上の文字記録領域21を撮像して得られた画像データを処理することにより、文字記録領域21内に印字されている文字列を認識する装置であって、データ入力部11と、データ格納部としての画像メモリ12と、データ処理部13とを有している。また、データ処理部13は、文字列切り出し部131、文字切り出し部132、特徴抽出部133、特徴比較部134、特徴辞書格納部135、および類似文字認識部136を有している。なお、これらの各部は、紙やプラスチック等からなるカードなどの媒体20上の文字列を認識する文字認識装置の一例として機能する。
画像読取部としての撮像素子11は、媒体20上の文字記録領域21に印刷された文字列を撮像し、その文字列の光電変換を行う。データ入力部においては、カードなどの媒体20の文字記録領域21に印刷された文字列は、媒体搬送機構の搬送ガイドに沿ってカードを動かすと1次元撮像素子11によってその文字パターンが撮像されて光電変換され、たとえばその多階調の多値画像データが画像メモリ12に取り込まれる。画像メモリ12は、撮像素子11で撮像された文字列等の画像データを記憶(格納)する。画像メモリ12は、撮像して得られた多値画像データを有限個の画素からなる行列とみなし、各画素の画素値である輝度値を読み出し自在に記憶する機能を備えている。この輝度値は一定の範囲の数で表される。具体的には、8ビットの256階調の多値画像データは、その輝度値は0から255までの整数値として表される。また、この実施の形態1では、M×N個の画素をマトリクス状に配列して構成し、M×N個の領域に文字記録領域21全体の多値画像データが記憶されている。なお、この画像メモリ12は、RAM,SDRAM,DDRSDRAM,RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。さらに、本実施形態では、画像メモリ12は、データ処理部13内で撮像して得られた多値画像データを二値化処理され、白黒二値画像データを記憶する機能も有する。
その後、データ処理部13が、画像メモリ12に格納された(多値または二値)画像データを読み出して、上述した各部において様々な処理を施し、最終的に、媒体20上の文字列から各文字を切り出して認識するように構成されている。
データ入力部は、媒体20上の文字記録領域21を撮像し、多値画像データに変換して画像メモリ12に記憶するようにしている。実施の形態1では、図1に示すように、媒体20を搬送する媒体搬送機構と、媒体20上の文字記録領域21を撮像して読み取る密着型の1次元撮像素子11とを備えている。なお、媒体20は、図示しない搬送手段によって所定の搬送方向T(図1では左から右)に搬送するようになっている。本実施形態では、媒体20は、その一端(図1においては下端)が搬送ガイドに接して搬送されるようになっている。ここでは、撮像素子11として密着型1次元撮像素子を採用して装置の小型化等を図っているが、撮像素子11としては、読み取り対象の媒体20の文字列を読み取り対象とする2次元のエリアセンサ等を採用することも可能である。撮像素子11は、たとえばCCDやCMOSセンサにより形成される。撮像素子11は、CCD等からなるラインセンサであり、搬送方向Tとほぼ直交する方向(媒体20の短手方向)に一列に配置され、かつ、図1に示すように、媒体20上に形成された文字記録領域21の短手方向の幅よりも長く形成されている。なお、本実施形態では、撮像素子11から出力されたアナログ画像データは、図示しないアナログ/ディジタル変換回路が接続され、このアナログ画像データをディジタル画像データに変換される。より具体的には、アナログ画像データは、例えば8ビットの256階調の多値画像データに変換されて画像メモリ12に出力される。なお、このようなアナログ/ディジタル変換回路自体は、既に公知であるので、ここでの詳細な説明は省略する。
一方で、媒体20は、JISに準拠している一般的なカードであってもよく、たとえば、幅86mm,高さ54mm,厚み0.76mmというサイズのプラスチックカードでもよく、IDカードやパスポートブック、あるいは運転免許証などでもよい。
[データ処理部13の各部の構成および機能]
次に、データ処理部13の各部の基本的な構成および機能について説明する。データ処理部13は、画像メモリ12から画像データを読み出して、たとえばその画像データが多階調の濃淡画像(多値画像)である場合には、白黒2値の画像への変換を行う。また、本実施形態では、データ処理部13は、画像メモリ12に記憶されている多値画像データを二値画像データに変換するようになっている。なお、二値化処理については、既に公知となっている適当な方法によって二値化閾値を求め、多値画像データの輝度値が相対的に大きな値を示す画素を白エレメントとし、輝度値が相対的に小さな値になる画素を黒エレメントとして白黒の二値画像データに変換を行うようにしている。そして、M×N個の画素をマトリクス状に配列したM×N個の領域に文字記録領域21全体の二値画像データが生成される。
文字列切り出し部131は、この画像メモリ12から読み出した多階調の多値画像データに対する2値化処理を行う機能を有する。文字列切り出し部131は、適当な方法によって閾値を求め、元の多階調の多値画像を白黒2値の画像に変換する。ここで、データ処理部13における以降の処理は、この白黒2値画像を用いて行われることとする。
文字列切り出し部131は、たとえば必要に応じて白黒に2値化された文字列を水平方向に射影して、文字列の上下エッジを検出する。そして、文字列切り出し部131は、上下エッジの中心位置を、文字列の中心ラインと識別して文字列(行)切り出しを行う。ここで、水平方向とは、文字が横方向に並んでいる第1方向、すなわちX軸方向である。
基本的に、文字列切り出し部131において媒体内の各文字列の垂直位置を検出する。次に文字切り出し部132では文字列ごとに水平方向(X軸方向)に形成されている文字の区切り位置を検索する。
本実施形態の文字切り出し部132は、文字列切り出し部131で切り出された行の文字列から文字列の文字が並んでいる方向、本例では水平方向の文字間の区切り位置を検出して、文字の切り出し処理を行う。より具体的には、本実施形態の文字切り出し部132は、撮像された画像内の文字列の区切り位置を検出(検索)する際に、その文字列に関して計算される輝度投影(射影)について、境界検出処理対象となる2文字を含む処理区間を設定する。そして、文字切り出し部132は、その処理区間内において射影(X軸への投影)を作成し、その射影に関してこれを左右に任意の位置で2分割したときに、その各分割要素において要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を最適分割点として選び、その点を2文字の分割点(境界位置)とする。ここでは、文字切り出し部132は、射影生成に際し、文字が横方向すなわちX軸方向に並んでいるときはX軸への射影を生成する。
具体的には、文字切り出し部132は、文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し処理と、文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定処理と、設定した検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得処理と、を行う。
文字切り出し部132は、画像データにおいて文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、画像データの文字が並んでいる方向の射影曲線を作成し、この射影曲線に関連付けて境界検索範囲“S”を設定する。文字切り出し部132は、文字列の一端側(本実施形態では左端側)から境界検索範囲“S”を設定し、設定した境界検索範囲“S”において境界位置を設定し、境界位置が設定されると、この設定された境界位置から次の境界検索範囲“S”を一文字ずつ順次に設定していく。
文字切り出し部132は、文字の区切り位置を設定する際に、後で詳述する判別分析法を用いて文字の区切り位置を求める。具体的には、文字切り出し部132は、射影曲線に関連付けて設定される境界検索範囲“S”内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する。文字切り出し部132は、その射影に関してその射影を左右に2分割したときに、その各分割要素において、要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を2文字の境界位置(分割位置)として検出する。より具体的には、文字切り出し部132は、射影に関してその射影を2分割したときに、その各分割要素において、分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような分割点を選び、その選択した分割点を2文字の境界位置として検出する。また、文字切り出し部132は、設定される検索範囲内の文字の並び方向の各位置における所定幅の射影を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、分散比が最大となる位置を求める。
なお、この文字切り出し部132における文字切り出し処理については、後でさらに詳述する。
データ処理部13において、文字切り出し部132の文字切り出し処理が終了すると、認識対象となっている文字の外接矩形領域(上下左右の座標値)が求められる。
特徴抽出部133は、外接矩形領域を任意のサブ領域に分割、たとえば1個の外接矩形領域を5×5の領域に分割し、そのうち1個の領域をサブ領域とし、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合を求め、それらを要素とする特徴ベクトルを生成する。
特徴比較部134は、特徴抽出部133で求められた特徴ベクトルを、あらかじめこの媒体で使用される全文字について求めておいた基準特徴ベクトルと比較して、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定する。
なお、基準特徴ベクトルは、あらかじめ特徴辞書格納部135に格納されているものであって、特徴比較が行われる際に、特徴辞書格納部135から類似度が高い文字のデータが読み出され、特徴比較部134において特徴比較が行われる。
類似文字認識部136は、基本的に、特徴比較部134の特徴比較によって設定された候補文字を、媒体に用いられた文字として認識する。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部136は、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別を行う。
たとえば、類似文字認識部136は、任意に分割したサブ領域を左側半分と右側半分との2領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との2領域の上下線対称に分けて、類似性を調べたりするように構成してもよい。また、類似文字認識部136は、左右線対称や上下線対象と同様に点対称で類似性を調べるように構成してもよい。
[文字と文字との境界位置(文字の区切り位置)の検出]
次に、本実施形態に係る文字認識装置10における特徴的な機能を有する文字切り出し部132における文字の区切り位置の検出処理(文字切り出し処理)について詳細に説明する。
[文字切り出し部132のブロック構成]
図2は、本実施形態に係る文字切り出し部の構成例を示すブロック図である。図3は、図2の境界検索範囲設定部の構成例を示すブロック図である。図4は、本実施形態に係る文字認識対象の画像の一例を示す図である。図4は、3行の文字列の例を示している。この文字列は、文字と文字との間に空白領域を持った文字列として形成されている。図5は、図4の画像の一文字列とこの文字列に対応する射影曲線の例を示す図である。図5(A)が図4の最上段の文字列を拡大して示し、図5(B)が射影曲線PRCを示している。
ちなみに、図4の最上段の文字列は、左端側から「IDJPN3219876543321987654<<<<<<」となっている。
本実施形態に係る文字切り出し部132は、図2に示すように、領域設定部1321、境界検索範囲設定部1322、および境界位置設定部1323を含んで構成されている。
領域設定部1321は、文字列切り出し部131で切り出された行の文字列について、認識処理対象となる文字列によって占有される画像上の領域を検出し、文字列が複数ある場合は、各文字列の位置を特定し、文字列ごとに文字列によって占有される領域を設定する。なお、本実施形態では、一例として図4に示すように、3行の文字列を構成していることから領域設定部1321は、たとえば上段の文字列を選択する文字列選択機能を備えている。
境界検索範囲設定部1322は、文字列の中で隣接する文字と文字との境界位置を検索する境界検索範囲“S”を設定する。境界検索範囲設定部1322は、その文字列領域内において文字列の全長に関して射影を作成する。上述したように、文字が横方向すなわちX軸方向に並んでいるときはX軸への射影、文字が縦方向に並んでいるときはY軸への射影する。ここでは上述したようにX軸への射影として説明を行う。また、境界位置を検出したい隣接する2文字を含む対象区間を境界検索範囲“S”として設定する。
境界検索範囲設定部1322は、図3に示すように、射影曲線作成部13221および文字端検出部13222を備えている。
射影曲線作成部13221は、図5(A)および(B)に示すように、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値を検出し、各画素列の最小輝度値に基づいて画像データにおける射影曲線である最小輝度曲線を作成する。射影曲線作成部13221は、撮像された文字列の画像データにおける文字画像領域について、画素列を文字列と垂直な方向にスキャンして最小輝度値を求める操作を文字画像領域の左端側の輝度列から右端側の輝度列まで繰り返すことによって最小輝度曲線を求める。
このように、射影曲線作成部13221は、X軸に垂直な方向の画素の最小値を用いている。なお、射影は一般的にはX軸に垂直な方向の画素群の平均値を用いることが多いが、便宜上、これも射影と定義している。このように、最小値をとることにより、文字高さの差異によるプロファイルの変動を抑えることができる。またここでの射影の次元は画素値であり、8ビット濃淡画像であるので0〜255階調の多値をとる。たとえば、図4に示す文字列のうちの、図5(A)に示す上段の文字列射影曲線(最小輝度曲線)PRCは、図5(B)に示すような曲線となる。この最小輝度曲線(射影曲線)PRCは、さらに、曲線の山MCの区間が文字(黒=濃)を表し、曲線の谷VCの部分が文字と文字の間の空白(画像上は白=薄)を表している。
文字端検出部13222は、最小輝度曲線(射影曲線)PRCにより各文字の端部の画素位置を検出する。なお、本実施形態では、文字端は、文字の前端位置を検出するようにしている。図6は、本実施形態の文字端検出部における文字端の検出処理を示すフローチャートである。図7は、本実施形態の文字端検出部における文字端の検出処理を説明するための図である。図7(A)は図6(B)に示す射影曲線PRCのうち、文字列の左端の3文字分を表示したものである。図7(B)は射影曲線に境界検索範囲“S”を2つに分割した場合の領域(クラス)内分散と領域(クラス)間分散の分散比特性曲線Rs(t)を示す図である。図7(A)において、横軸は画像のX軸方向(水平方向)の画素位置情報(座標)を、縦軸は同じく輝度値を、それぞれ表している。本実施形態の文字端検出部13222における文字端の検出処理は、具体的には、下記のステップによる(図6の各ステップ))。
ステップST11:
最小輝度曲線(射影曲線)PRCの全体にわたる画素値の平均値を求める。
ステップST12:
その結果、図7(A)に示すように、X軸に水平な直線Tが得られる。
ステップST13:
最小輝度曲線(射影曲線)PRCを左からスキャンして、直線Tを下から上に横切る(交差する)画素位置を所定の個数、本実施形態では最初の3箇所E(1)、E(2)、E(3)を求める。
ステップST14:
この画素位置が文字の前端位置となる。その座標位置をE(1:Ne)とする。ここで、Neは直線Tを下から上に横切る画素位置の個数を表す。すなわち、この画素位置を文字の前端位置としていることから、全体の数Neは文字の個数に等しくなっている。
また、文字端検出部13222は、境界位置を検出したい隣接する2文字を含む境界検索範囲“S”を設定する。この境界検索範囲“S”を設定することにより、最小輝度曲線(射影曲線)PRCを左からスキャンして、直線Tを下から上に横切る画素位置をすべて求めなくても、算出した境界位置に加算することで、境界検索範囲“S”を設定することが可能となる。文字端検出部13222は、算出した境界位置C(n−1)に、境界検索範囲“S”を加算しながら、次の文字の境界位置C〈n〉を算出する境界検索範囲を設定する。
ここで、本実施形態における境界位置の検出を図7に関連付けて説明する。前述したように、図7は図5(B)に示す射影曲線(最小輝度曲線)PRCのうち、文字列の左端の3文字分を表示したものである。図5(A)に示すように、本例の文字列の左端の3文字は、“IDJ”である。はじめに1番目の文字(本例ではI)と2番目の文字(本例ではD)の間に存在する境界位置C(1)を検出する。
文字端検出部13222は、最小輝度曲線(射影曲線)PRCで境界検索に用いる境界検索範囲“S”を次のようにして決定する。図7(A)においては、前述の文字端位置(本実施形態では文字の前端位置)は3個ある。そのうち1番目の文字の(文字)前端位置Aと3番目の文字の(文字)前端位置Bを境界検索範囲“S”の始点と終点と設定している。境界検索範囲“S”の終点としては、図中BよりもB´(直線Tを上から下に横切る点)のほうが、求める最小輝度曲線(射影曲線)PRCの「谷底」が検索範囲のほぼ中央に位置する意味で望ましいといえるが、検索処理にはあまり影響しないため、点Bを用いている。実際に図7(A)では、X軸方向における画素位置(A,B)=(39,155)となっている。
図2の説明に戻る。境界位置設定部(境界位置算出部)1323は、境界検索範囲“S”を設定した領域内の射影に関して射影を任意の位置で左右に2つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点を最適な境界点として選択する。すなわち、この境界点が、隣接する2文字の境界位置となる。
文字切り出し部132は、上述したような処理を行い、各文字の境界位置を算出して、文字列を構成する文字全てを切り出す。
文字の切り出しにおいて、境界位置取得処理として、境界位置設定部1323は、設定した境界検索範囲“S”内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得処理を行い、画像データから切り出された文字列から各文字を切り出して文字を認識する。
境界位置設定部1323は、設定された境界検索範囲“S”内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する。境界位置設定部1323は、その射影に関してその射影を左右に2分割したときに、その各分割要素において、要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を2文字の境界位置(分割位置)として検出する。そして、境界位置設定部1323は、求めた分散比が最大となる位置を求める。換言すれば、境界位置設定部1323は、生成された射影に関してその射影を左右に2分割したときに、各分割要素(分割領域)において分割要素(分割領域)内の射影値の分散が最も小さく、分割要素間(分割領域間)の射影値の分散が最も大きくなるような分割点を選択し、その選択した点を2文字の境界位置(分割位置)として検出する。境界位置設定部1323は、分割点算出処理においては、境界検索範囲“S”内の文字の並び方向の各位置における所定幅の射影を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、分散比が最大となる位置を求める。
[本実施形態の文字切り出し処理の具体的な例]
以下に、本実施形態に係る文字切り出し部132の具体的な処理例について、図4から図10に関連付けて説明する。以下の説明では境界位置設定部1323の具体的な処理について説明する。
なお、図8は、本実施形態に係る文字切り出し部における処理の概要を示すフローチャートである。図9は、本実施形態に係る文字切り出し部における境界位置設定部の処理フローを示すフローチャートである。図10は、本実施形態に係る文字切り出し部における境界位置設定部により文字列全体の文字境界点を検出した結果を示す図である。
文字認識を行おうとする画像が図4のように与えられているとする。文字切り出し部132において、はじめに領域設定が行われる。領域設定処理では、認識対象とする文字列全体を含むような矩形領域が設定される。これは図1の文字記録領域21に相当する。あらかじめ文字記録領域21はその媒体の面情報に関する規格によって定義されている。しかし文字領域の位置がわかっていない場合は、適切な方法によって文字列の垂直方向の位置を決定し、その情報に基づいて矩形領域の上辺と下辺の位置を決めればよい。矩形領域の幅は、その文字列の位置が一定の場合はその標準的な位置情報に基づいて決めることができる。文字列の横方向の位置が一定でない場合は、適切な方法によって文字列の水平方向の位置を決定し、その情報に基づいて矩形領域の左辺と右辺の位置を決めればよい。文字位置の誤差を考慮して、実際の文字の縁位置から適当な余白を設けることがよい。
次に、文字列切り出し処理において、文字列の切り出しが行われる。なお、処理の手順として、全体的な文字領域を設定することなく、直接各文字列の位置を検出するようにしてもよい。図4の一番上の文字列を切り出したものが図5(A)に示されている。
次に、文字切り出し処理は、図8に示すフローチャートに従って行われる。基本的に、文字切り出し部132は、文字列ラインごとに水平方向の文字の区切り位置を検出(検索)する。
[本実施形態の文字の区切り位置の検出]
図1の文字切り出し部132では、まず、ステップST21において、領域設定部1321により、文字列切り出し部131で切り出された行の文字列について、認識処理対象となる文字列によって占有される画像上の領域が検出され、文字列が複数ある場合は、各文字列の位置を特定し、文字列ごとに文字列によって占有される領域が設定される。次に、ステップST22において、境界検索範囲設定部1322の射影曲線作成部13221により、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値が検出され、各画素列の最小輝度値に基づいて画像データにおける射影曲線である最小輝度曲線が作成される。次に、ステップST23において、文字端検出部13222により、境界位置を検出したい隣接する2文字を含む境界検索範囲“S”が設定され、この境界検索範囲“S”を設定することにより、最小輝度曲線(射影曲線)PRCを左からスキャンして、各文字の部の画素位置が検出される。そして、ステップST24において、境界位置設定部1323により、境界検索範囲“S”を設定した領域内の射影に関して射影を任意の位置で左右に2つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点が最適な境界点として選択される。すなわち、この境界点が、隣接する2文字の境界位置とされる。
この文字切り出し部132を採用したことにより、本実施形態によれば、閾値のレベルに左右されず、局所的な文字のつぶれにより閾値が求められない場合でも文字の区切りが可能となる。これにより、局所的に文字のつぶれ等があっても、確実に境界位置を検出することができる。換言すると、この文字切り出し部132を採用したことにより、性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能で、ひいては文字認識性能の向上を図ることが可能となっている。
次に、境界位置設定部1323における具体的な処理について説明する。本実施形態では、前述したように、閾値を用いずに文字の境界位置を検出できることに特徴がある。その具体的な方法(境界位置設定部の処理)について説明する。ここで説明する方法では、境界検索範囲“S”の最小輝度曲線(射影曲線)V=P(A:B)を用いて、文字と文字の間の空白(画像上は白=薄)を表している「谷点」を検出する。以下に示す処理は、図9のステップST31〜ST35に処理に相当する。
いま、射影をp(i)で表すことにする。ここで、i=1:Nである。Nは境界検索範囲“S”の幅を表し、i=1:Nはiが1(すなわち図7(A)のA点)からN(B地点)まで変化することを意味する。ここで、変数t(1<t<N)を導入し、i=tにおいて射影p(i)をp1=p(1:t)とp2=p(t+1:N)の2つの要素(領域)、クラスCLS1およびクラスCLS2に分割する。クラスCLS1内およびクラスCLS2内の平均値m1およびm2は次式で求められる。
Figure 0006268023
また、全体の平均値mtは次式で求められる。
Figure 0006268023
したがって、クラス内分散Swは次式で与えられる。
Figure 0006268023
また、クラス間分散Sbは次式で与えられる。
Figure 0006268023
そして、その分散比Rs(t)は次のように求められる。
Figure 0006268023
そのうえで、最大の分散比Rs(t)を与える位置パラメータtの値を求める。すなわち、i=tの各位置における射影p(i)を2つの領域に分割し、各射影における分割領域内分散と分割領域間分散とをtの値を変えながら求め、各tにおける分散比を求め、分散比が最大となるtの値を求める。
図7(B)は、図7(A)の境界検索範囲“S”にRs(t)曲線を示す図である。図7(B)において、t=52で分散比Rs(t)は最大となるので、求める境界位置C(1)は次のように与えられる。
[数6]
C(1)=A+t−1=39+52−1=90
この2クラスの分散比を用いる方式は判別分析法と呼ぶことができる。本実施形態においては、判別分析法を適用するが、一般的な判別分析法とは用いるデータの取り方が異なる。すなわち、本実施形態の分析判別処理においては、設定された境界検索範囲“S”内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する。すなわち、境界検索範囲“S”内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算し、求めた分散比が最大となる位置を求めている。この分散比が最大となる位置を含む領域は、射影のY方向に配列された画素値全体の平均画素値分布において、列の平均画素値が最も低い領域を含む領域に対応して存在している。
このように、本実施形態における分析判別処理では、各列ごとのように局所的な判別情報を一文字ずつ高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。すなわち、本実施形態に係る分析判別法を境界位置設定処理(検索処理)に適用することにより、煩雑な閾値処理を行うことなく、境界があいまいなもの、明確なものに限らず、文字の境界位置を高い精度で的確に決定することが可能となる。この本実施形態に係る分析判別法は、濃淡画像を2値化する閾値とはまったく無関係の領域での応用といえる。
2番目以降の境界位置C(2:Ne−1)については(図9のステップST36〜ST41の処理に相当)、たとえばk番目の境界位置C(k)を検出する場合、その境界検索範囲“S”を次のようにする。
[数7]
A(k)=C(k−1)、
B(k)=A(k)+E(k+1)−E(k−1)
そして、部分射影V(k)=P(A(k):B(k))を境界点検出ルーチンに(ステップST40)入力すれば、境界位置C(k)が得られる。この処理をkをインクリメントしながら反復し、kがNe−1を超えたところで処理は完了する。
図10には、このようにして、文字列全体の文字境界点を検出した結果が示されている。
[文字認識装置の全体の動作]
次に、本実施形態に係る文字認識装置10の全体的な動作について図11に関連付けて説明する。図11は、本実施形態に係る文字認識装置10の全体の動作を説明するためのフローチャートである。
カードなどの媒体20の文字記録領域21に印刷された文字列は、媒体搬送機構の搬送ガイドに沿ってカードを動かすと1次元撮像素子11によってその文字パターンが読み取られて光電変換され(ステップST101)、多階調、たとえば256階調の多値画像データが画像メモリ12に取り込まれる(ステップST102)。
次いで、文字列切り出し部131において、文字列切り出しが行われる(ステップST103)。より具体的には、文字列切り出し部131において、たとえば必要に応じて2値化した文字列が水平方向に射影されて、文字列の上下エッジが検出される。そして、文字列切り出し部131においては、上下エッジの中心位置が、文字列の中心ラインと識別され行切り出しが行われる。
なお、文字列切り出し部131においては、画像メモリ12に格納された多値画像に対して、必要に応じて白黒が画像への2値化が行われる。より具体的には、データ処理部13においては、画像メモリ12から画像データを読み出して、その画像データが多階調の濃淡画像である場合には、濃淡画像が白黒2値の画像に変換される。
次いで、文字切り出し部132において、文字切り出しが行われる(ステップST104)。より具体的には、文字切り出し部132において、文字列切り出し部131で切り出された行の文字列について、認識処理対象となる文字列によって占有される画像上の領域が検出され、文字列が複数ある場合は、各文字列の位置を特定し、文字列ごとに文字列によって占有される領域が設定される。
次に、文字切り出し部132では、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値が検出され、各画素列の最小輝度値に基づいて記画像データにおける射影曲線である最小輝度曲線が作成される。次いでに、文字切り出し部132において、境界位置を検出したい隣接する2文字を含む境界検索範囲“S”が設定され、この境界検索範囲“S”を設定することにより、最小輝度曲線(射影曲線)PRCを左からスキャンして、各文字の部の画素位置が検出される。そして、文字切り出し部132において、境界検索範囲“S”を設定した領域内の射影に関して射影を任意の位置で左右に2つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点が最適な境界点として選択される。これにより、この境界点が、隣接する2文字の境界位置とされる。
ステップST104の処理が終了すると、認識対象となっている文字の外接矩形領域(上下左右の座標値)が求められる。
次いで、特徴抽出部133において特徴抽出が行われる(ステップST105)。より具体的には、特徴抽出部133においては、上述した外接矩形領域が任意のサブ領域に分割(たとえば1個の外接矩形領域を5×5の領域に分割され、そのうち1個の領域がサブ領域とされる)され、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。
次いで、特徴比較部134において、特徴比較が行われる(ステップST106)。より具体的には、特徴比較部134においては、ステップST105で求めた特徴ベクトルが、あらかじめこの媒体で使用される全文字について求められてあらかじめ特徴辞書格納部135に格納されている基準特徴ベクトルと比較されて、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定される。
最後に、文字認識が行われる(ステップST107)。より具体的には、ステップST106の特徴比較によって設定された候補文字が、媒体に用いられた文字として認識される。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部136において、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別が行われる。
たとえば、任意に分割したサブ領域を左側半分と右側半分との2領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との2領域の上下線対称に分けて、類似性を調べたりしてもよい。また、左右線対称や上下線対象と同様に点対称で類似性を調べてもよい。
[実施形態の主な効果]
以上のように、本実施形態によれば、画像認識技術に基づいて、撮像された画像内の文字列の区切り位置を検出(検索)する方法において、その文字列に関して計算される輝度投影(射影)について、境界検出処理対象となる2文字を含む処理区間を設定する。そして、その処理区間内において射影(X軸への投影)を作成し、その射影に関してこれを左右に任意の位置で2分割したときに、その各分割要素において要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を最適分割点として選び、その点を2文字の分割点(境界位置)とする。その結果、本実施形態によれば、閾値のレベルに左右されず、局所的な文字のつぶれにより閾値が求められない場合でも文字の区切りを可能とする文字認識装置を提供でき、閾値が求められない場合でも確実に文字の切り出しを行うことが可能な文字認識装置の文字切り出し方法を提供することができる。すなわち、本実施形態によれば、射影曲線のレベル値に基づく閾値を設定することなく、文字の境界位置を決定できるため、煩雑な閾値処理を行うことなく、境界があいまいなものについて境界線を設定することができる。
また、画像の局所ノイズに起因する射影曲線の局所的な変動がある場合でも安定的に文字の境界位置を決定することができる。
また、本実施形態によれば、最小輝度曲線により形成される射影曲線を適用していることから、文字区間と空白区間が明確に分離され、正確な文字区切り位置の決定が可能となる。また、本実施形態によれば、文字認識の性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能であり、ひいては文字認識性能の向上を図ることが可能となる。
換言すると、本実施形態によれば、性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく、局所的な判別情報を高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。その結果、煩雑な閾値処理を行うことなく、各列ごとのように局所的な判別情報を一文字ずつ高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。
また、本実施形態によれば、文字の境界が明確なケースに本方式を適用しても同様の結果を得ることができる。
本発明は、磁気ストライプの再生出力波形に基づくデータ復調などに適用可能である。また、本実施形態の文字認識装置10は、カードのみならず、パスポート、運転免許証など、あらゆる媒体への適用が可能である。
なお、以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、CPU等のコンピュータで実行するように構成することも可能である。また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
10・・・文字認識装置、11・・・撮像素子(画像読取部)、12・・・画像メモリ、13・・・データ処理部、131・・・文字列切り出し部、132・・・文字切り出し部、1321・・・領域設定部、1322・・・境界検索範囲設定部、13221・・・射影曲線作成部、13222・・・文字端検出部、1323・・・境界位置設定部、133・・・特徴抽出部、134・・・特徴比較部、135・・・特徴辞書格納部、136・・・類似文字認識部、PRC・・・射影曲線(最小輝度曲線)。

Claims (8)

  1. 画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、
    媒体上の文字列を撮像して画像データとして読み取る画像読取部と、
    前記画像読取部による読み取り画像を格納する画像メモリと、
    前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、
    前記データ処理部は、
    前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し部を備え、
    前記文字切り出し部は、
    前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定部と、
    設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を設定する境界位置設定部と、を含むことを特徴とする文字認識装置。
  2. 前記文字切り出し部は、
    前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する射影曲線作成部を含み、
    前記境界検索範囲設定部は、
    前記射影曲線に関連付けて前記境界検索範囲を設定することを特徴とする請求項1記載の文字認識装置。
  3. 前記境界位置設定部は、
    前記境界検索範囲内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定することを特徴とする請求項1または2記載の文字認識装置。
  4. 前記境界検索範囲設定部は、
    前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、
    前記境界位置設定部は、
    順次設定される前記境界検索範囲ごとに境界位置を設定することを特徴とする請求項1から3のいずれか一に記載の文字認識装置。
  5. 媒体上の文字列を撮像して得られた画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置において、
    前記画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、
    前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し工程と、
    前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定工程と、
    設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得工程と、
    を有することを特徴とする文字認識装置の文字切り出し方法。
  6. 前記文字切り出し工程においては、
    前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値を検出し、各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する工程を含み、
    前記境界検索範囲設定工程においては、
    前記射影曲線に関連付けて前記境界検索範囲を設定することを特徴とする請求項5記載の文字認識装置の文字切り出し方法。
  7. 前記境界位置取得工程においては、
    前記境界検索範囲内の射影を所定の幅で2つの領域に分割し、分割した2つの領域ごとに、各領域内分散と、2つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定することを特徴とする請求項5または6記載の文字認識装置の文字切り出し方法。
  8. 前記境界検索範囲設定工程においては、
    前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、
    前記境界位置設定工程においては、
    順次設定される前記境界検索範囲に応じて一文字ずつ境界位置を設定することを特徴とする請求項5から7のいずれか一に記載の文字認識装置の文字切り出し方法。
JP2014073451A 2014-03-31 2014-03-31 文字認識装置およびその文字切り出し方法 Expired - Fee Related JP6268023B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014073451A JP6268023B2 (ja) 2014-03-31 2014-03-31 文字認識装置およびその文字切り出し方法
US14/674,480 US9324001B2 (en) 2014-03-31 2015-03-31 Character recognition device and character segmentation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014073451A JP6268023B2 (ja) 2014-03-31 2014-03-31 文字認識装置およびその文字切り出し方法

Publications (2)

Publication Number Publication Date
JP2015197681A JP2015197681A (ja) 2015-11-09
JP6268023B2 true JP6268023B2 (ja) 2018-01-24

Family

ID=54190842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014073451A Expired - Fee Related JP6268023B2 (ja) 2014-03-31 2014-03-31 文字認識装置およびその文字切り出し方法

Country Status (2)

Country Link
US (1) US9324001B2 (ja)
JP (1) JP6268023B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6804292B2 (ja) * 2016-12-28 2020-12-23 オムロンヘルスケア株式会社 端末装置
JP7247472B2 (ja) * 2018-04-19 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021009539A (ja) * 2019-07-01 2021-01-28 パナソニックIpマネジメント株式会社 文字領域決定方法
CN110533030B (zh) * 2019-08-19 2023-07-14 三峡大学 基于深度学习的太阳胶片图像时间戳信息提取方法
CN111563495B (zh) * 2020-05-09 2023-10-27 北京奇艺世纪科技有限公司 一种图像中字符的识别方法、装置及电子设备
US11887222B2 (en) 2021-11-12 2024-01-30 Rockwell Collins, Inc. Conversion of filled areas to run length encoded vectors
US12002369B2 (en) 2021-11-12 2024-06-04 Rockwell Collins, Inc. Graphical user interface (GUI) for selection and display of enroute charts in an avionics chart display system
US11842429B2 (en) 2021-11-12 2023-12-12 Rockwell Collins, Inc. System and method for machine code subroutine creation and execution with indeterminate addresses
US11748923B2 (en) 2021-11-12 2023-09-05 Rockwell Collins, Inc. System and method for providing more readable font characters in size adjusting avionics charts
US11954770B2 (en) 2021-11-12 2024-04-09 Rockwell Collins, Inc. System and method for recreating graphical image using character recognition to reduce storage space
US11915389B2 (en) 2021-11-12 2024-02-27 Rockwell Collins, Inc. System and method for recreating image with repeating patterns of graphical image file to reduce storage space
CN115984859A (zh) * 2022-12-14 2023-04-18 广州市保伦电子有限公司 一种图像文字识别的方法、装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61269779A (ja) * 1985-05-24 1986-11-29 Agency Of Ind Science & Technol 文書画像解析方式
JPH04167084A (ja) * 1990-10-31 1992-06-15 Toshiba Corp 文字読取装置
JP4945739B2 (ja) 2007-03-30 2012-06-06 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
JP5334042B2 (ja) * 2008-11-23 2013-11-06 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
JP6039413B2 (ja) * 2012-12-27 2016-12-07 日本電産サンキョー株式会社 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム

Also Published As

Publication number Publication date
JP2015197681A (ja) 2015-11-09
US9324001B2 (en) 2016-04-26
US20150278626A1 (en) 2015-10-01

Similar Documents

Publication Publication Date Title
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
JP6039413B2 (ja) 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム
CN109543501B (zh) 图像处理装置、图像处理方法和存储介质
JP4658848B2 (ja) 文字列認識方法及び文字列認識装置
JP5334042B2 (ja) 文字列認識方法及び文字列認識装置
JP6171167B2 (ja) 文字認識装置、文字認識方法、及び文字認識プログラム
JP6487255B2 (ja) 文字切り出し装置、文字認識装置、および文字切り出し方法
Fujinaga Staff detection and removal
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN101122953A (zh) 一种图片文字分割的方法
JP6599672B2 (ja) 文字切り出し装置、文字認識装置、および文字切り出し方法
JP2014153820A (ja) 文字切り出し装置及び文字切り出し方法
CN109389115B (zh) 文本识别方法、装置、存储介质和计算机设备
RU2581786C1 (ru) Определение преобразований изображения для повышения качества оптического распознавания символов
US20120082372A1 (en) Automatic document image extraction and comparison
JP4945739B2 (ja) 文字列認識方法及び文字列認識装置
JP5011508B2 (ja) 文字列認識方法及び文字列認識装置
US20130050765A1 (en) Method and apparatus for document authentication using image comparison on a block-by-block basis
JP5630689B2 (ja) 文字認識方法及び文字認識装置
KR20010015025A (ko) 문자인식장치의 문자추출방법 및 장치
JP6144892B2 (ja) 画像処理装置、画像処理方法及びプログラム
Chanda et al. Font identification—In context of an Indic script
JP6493559B2 (ja) 文字認識装置及び文字認識方法
JP4594765B2 (ja) 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170208

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20171121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171212

R150 Certificate of patent or registration of utility model

Ref document number: 6268023

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees