JP6268023B2

JP6268023B2 - 文字認識装置およびその文字切り出し方法

Info

Publication number: JP6268023B2
Application number: JP2014073451A
Authority: JP
Inventors: 中村　宏; 宏中村
Original assignee: Nidec Sankyo Corp
Current assignee: Nidec Sankyo Corp
Priority date: 2014-03-31
Filing date: 2014-03-31
Publication date: 2018-01-24
Anticipated expiration: 2034-03-31
Also published as: JP2015197681A; US9324001B2; US20150278626A1

Description

本発明は、文字列を撮像して得られた画像データを処理することによって文字列から各文字を切り出す文字認識技術に関するものである。

文字認識技術においては、一般に行（文字列）区切り位置の特定を行い、位置決定された文字行（文字列）において、文字間の区切り位置を特定する、という構成をとることが多い（たとえば、特許文献１参照）。

図１２は、従来の文字切り出しの処理フローを示すフローチャートである。この文字切り出し処理（ステップＳＴ１〜ＳＴ３）では、まずひとつの文字ライン（文字列）について水平軸への射影を計算する。この射影の計算では垂直方向の画素の加算（または算術平均）を行うが、その加算範囲は、たとえば、文字ライン（文字列）切り出し部において求めた文字ライン（文字列）の上下エッジを両端点とする範囲に設定する。このようにして得られた射影プロファイルに対し、あらかじめ定めておいた閾値ＳＬＥＶ（ＳＬＥＶの設定方法はたとえば特許文献１参照に開示されている方法を用いることができる）とこの射影プロファイルのレベル値を比較し、閾値ＳＬＥＶを超えている区間を文字と文字の間のスペースと判定する。境界位置は、たとえばスペースの両端点の中点に設定する。

特開２００８-２５０７５４号公報

ところが、このように閾値との大小関係で境界位置を求める方法では、画像のノイズによって射影曲線に局所的なノイズが生じた場合、このノイズのピーク位置を境界位置と誤判定してしまうおそれがある。

特許文献１に示す文字切り出し処理では、文字の境界を検出する処理として、認識対象の文字列に対してその射影（文字列が形成されている方向に対して直交する方向に）をとり、一定の閾値を設ける。射影のプロファイルと閾値との比較により、文字と文字の境界を求めるようにしている。

このような閾値との大小関係を利用する方式では、閾値をどのように設定するかが問題となることが多い。文字が正常な場合はよいが、文字のつぶれやノイズなどによって結合したような場合や、媒体の移動速度変動による画像解像度の低下（モジュレーションの劣化）の場合は、閾値のレベルによって文字境界の見逃しやノイズによる文字の境界位置の誤検出といった問題が生じやすく、結果的に安定的な認識性能が阻害されることになる。

本発明は、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも文字の区切りを可能とする文字認識装置を提供する。また、本発明は、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも確実に文字の切り出しを行うことが可能な文字認識装置の文字切り出し方法を提供する。

本発明の第１の観点は、画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、媒体上の文字列を撮像して画像データとして読み取る画像読取部と、前記画像読取部による読み取り画像を格納する画像メモリと、前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、前記データ処理部は、前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し部を備え、前記文字切り出し部は、前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定部と、設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を設定する境界位置設定部と、を含む。これにより、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも文字の区切りが可能となる。

好適には、前記文字切り出し部は、前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する射影曲線作成部を含み、前記境界検索範囲設定部は、前記射影曲線に関連付けて前記境界検索範囲を設定する。これにより、文字区間と空白区間が明確に分離され、正確な文字区切り位置の決定が可能となる。また、文字認識の性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能であり、ひいては文字認識性能の向上を図ることが可能となる。

好適には、前記境界位置設定部は、前記境界検索範囲内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定する。これにより、射影曲線のレベル値に基づく閾値を設定することなく、文字の境界位置を決定できるため、煩雑な閾値処理を行うことなく、境界があいまいなものについて境界線を設定することができる。

好適には、前記境界検索範囲設定部は、前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、前記境界位置設定部は、順次設定される前記境界検索範囲ごとに境界位置を設定する。これにより、各列ごとのように局所的な判別情報を一文字ずつ高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。

本発明の第２の観点は、媒体上の文字列を撮像して得られた画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置において、前記画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し工程と、前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定工程と、設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得工程と、を有する。これにより、局所的な文字のつぶれやノイズ等が生じ、閾値が求められない場合でも確実に文字の切り出しを行うことが可能となる。

本発明の実施形態に係る文字認識装置の構成例を示す図である。本実施形態に係る文字切り出し部の構成例を示すブロック図である。図２の境界検索範囲設定部の構成例を示すブロック図である。本実施形態に係る文字認識対象の画像の一例を示す図である。図４の画像の一文字列とこの文字列に対応する射影曲線の例を示す図である。本実施形態の文字端検出部における文字端の検出処理を示すフローチャートである。本実施形態の文字端検出部における文字端の検出処理を説明するための図である。本実施形態に係る文字切り出し部における処理の概要を示すフローチャートである。本実施形態に係る文字切り出し部における境界位置設定部の処理フローを示すフローチャートである。本実施形態に係る文字切り出し部における境界位置設定部により文字列全体の文字境界点を検出した結果を示す図である。本実施形態に係る文字認識装置の動作を説明するためのフローチャートである。従来の文字切り出しの処理フローを示すフローチャートである。

以下、本発明の実施形態を図面に関連付けて説明する。

（文字認識装置の構成）
図１は、本発明の実施形態に係る文字認識装置の構成例を示す図である。

本実施形態に係る文字認識装置１０は、紙やプラスチック等の媒体上の文字列を撮像して得られた、たとえば多階調の多値画像データを処理することによって、画像データから切り出した文字列から各文字を切り出して認識する機能を有する。

文字認識装置１０は、画像認識技術に基づいて、撮像された画像内の文字列の区切り位置を検出（検索）する方法において、その文字列に関して計算される輝度投影（射影）について、境界検出処理対象となる２文字を含む処理区間を設定する。そして、文字認識装置１０は、その処理区間内において射影（Ｘ軸への投影）を作成し、その射影に関してこれを左右に任意の位置で２分割したときに、その各分割要素において要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を最適分割点として選び、その点を２文字の分割点（境界位置）とする。文字認識装置１０は、基本的に、文字切り出し処理における射影生成に際し、文字が第１方向である横方向すなわちＸ軸方向に並んでいるときはＸ軸への射影を生成し、文字が第１方向に直交する第２方向である縦方向すなわちＹ軸方向に並んでいるときはＹ軸への射影を生成する。以下では、一例として、Ｘ軸への射影として説明する。なお、本実施形態において、射影の次元は画素値であり、ｎビット濃淡画像である場合には０〜（２ｎ−１）階調の多値をとる。

そして、本実施形態に係る文字認識装置１０は、画像認識技術に基づいて、撮像された画像データ内の文字列の区切り位置を検索（検出）する際において、より具体的には、次のような特徴的な処理を行う。すなわち、文字認識装置１０は、文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し処理と、文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定処理と、設定した検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得処理と、を行い、画像データから切り出された文字列から各文字を切り出して文字を認識する。

文字認識装置１０は、画像データにおいて文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、画像データの文字が並んでいる方向の射影曲線を作成し、この射影曲線により境界検索範囲を設定する。文字認識装置１０は、境界検索範囲設定処理において、文字列の一端側（基本的に文字の書き出し側である左端側）から境界検索範囲を設定し、設定した境界検索範囲において境界位置設定処理により境界位置を設定し、境界位置が設定されると、この設定された境界位置から次の境界検索範囲を一文字ずつ順次に設定していく。

文字認識装置１０は、境界位置設定処理において、文字の区切り位置を設定する際に、判別分析法を用いて文字の区切り位置を求める。具体的には、文字認識装置１０は、射影曲線に関連付けて設定された境界検索範囲“Ｓ”内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々の計算し、求めた分散比に基づき文字の区切り位置を設定する。

以下に、本文字認識装置１０の具体的な構成および撮像画像の文字認識処理機能について説明する。

文字認識装置１０は、データ入力部としての密着型の（１次元）撮像素子（画像読取部）１１、画像メモリ１２、およびデータ処理部１３を有している。すなわち、本実施形態に係る文字認識装置１０は、図１に示すように、媒体としてのＩＤカード（身分証明書）２０上の文字記録領域２１を撮像して得られた画像データを処理することにより、文字記録領域２１内に印字されている文字列を認識する装置であって、データ入力部１１と、データ格納部としての画像メモリ１２と、データ処理部１３とを有している。また、データ処理部１３は、文字列切り出し部１３１、文字切り出し部１３２、特徴抽出部１３３、特徴比較部１３４、特徴辞書格納部１３５、および類似文字認識部１３６を有している。なお、これらの各部は、紙やプラスチック等からなるカードなどの媒体２０上の文字列を認識する文字認識装置の一例として機能する。

画像読取部としての撮像素子１１は、媒体２０上の文字記録領域２１に印刷された文字列を撮像し、その文字列の光電変換を行う。データ入力部においては、カードなどの媒体２０の文字記録領域２１に印刷された文字列は、媒体搬送機構の搬送ガイドに沿ってカードを動かすと１次元撮像素子１１によってその文字パターンが撮像されて光電変換され、たとえばその多階調の多値画像データが画像メモリ１２に取り込まれる。画像メモリ１２は、撮像素子１１で撮像された文字列等の画像データを記憶（格納）する。画像メモリ１２は、撮像して得られた多値画像データを有限個の画素からなる行列とみなし、各画素の画素値である輝度値を読み出し自在に記憶する機能を備えている。この輝度値は一定の範囲の数で表される。具体的には、８ビットの２５６階調の多値画像データは、その輝度値は０から２５５までの整数値として表される。また、この実施の形態１では、Ｍ×Ｎ個の画素をマトリクス状に配列して構成し、Ｍ×Ｎ個の領域に文字記録領域２１全体の多値画像データが記憶されている。なお、この画像メモリ１２は、ＲＡＭ，ＳＤＲＡＭ，ＤＤＲＳＤＲＡＭ，ＲＤＲＡＭなど、画像データを記憶しうるものであれば如何なるものであってもよい。さらに、本実施形態では、画像メモリ１２は、データ処理部１３内で撮像して得られた多値画像データを二値化処理され、白黒二値画像データを記憶する機能も有する。

その後、データ処理部１３が、画像メモリ１２に格納された（多値または二値）画像データを読み出して、上述した各部において様々な処理を施し、最終的に、媒体２０上の文字列から各文字を切り出して認識するように構成されている。

データ入力部は、媒体２０上の文字記録領域２１を撮像し、多値画像データに変換して画像メモリ１２に記憶するようにしている。実施の形態１では、図１に示すように、媒体２０を搬送する媒体搬送機構と、媒体２０上の文字記録領域２１を撮像して読み取る密着型の１次元撮像素子１１とを備えている。なお、媒体２０は、図示しない搬送手段によって所定の搬送方向Ｔ（図１では左から右）に搬送するようになっている。本実施形態では、媒体２０は、その一端（図１においては下端）が搬送ガイドに接して搬送されるようになっている。ここでは、撮像素子１１として密着型１次元撮像素子を採用して装置の小型化等を図っているが、撮像素子１１としては、読み取り対象の媒体２０の文字列を読み取り対象とする２次元のエリアセンサ等を採用することも可能である。撮像素子１１は、たとえばＣＣＤやＣＭＯＳセンサにより形成される。撮像素子１１は、ＣＣＤ等からなるラインセンサであり、搬送方向Ｔとほぼ直交する方向（媒体２０の短手方向）に一列に配置され、かつ、図１に示すように、媒体２０上に形成された文字記録領域２１の短手方向の幅よりも長く形成されている。なお、本実施形態では、撮像素子１１から出力されたアナログ画像データは、図示しないアナログ／ディジタル変換回路が接続され、このアナログ画像データをディジタル画像データに変換される。より具体的には、アナログ画像データは、例えば８ビットの２５６階調の多値画像データに変換されて画像メモリ１２に出力される。なお、このようなアナログ／ディジタル変換回路自体は、既に公知であるので、ここでの詳細な説明は省略する。

一方で、媒体２０は、ＪＩＳに準拠している一般的なカードであってもよく、たとえば、幅８６ｍｍ，高さ５４ｍｍ，厚み０．７６ｍｍというサイズのプラスチックカードでもよく、ＩＤカードやパスポートブック、あるいは運転免許証などでもよい。

［データ処理部１３の各部の構成および機能］
次に、データ処理部１３の各部の基本的な構成および機能について説明する。データ処理部１３は、画像メモリ１２から画像データを読み出して、たとえばその画像データが多階調の濃淡画像（多値画像）である場合には、白黒２値の画像への変換を行う。また、本実施形態では、データ処理部１３は、画像メモリ１２に記憶されている多値画像データを二値画像データに変換するようになっている。なお、二値化処理については、既に公知となっている適当な方法によって二値化閾値を求め、多値画像データの輝度値が相対的に大きな値を示す画素を白エレメントとし、輝度値が相対的に小さな値になる画素を黒エレメントとして白黒の二値画像データに変換を行うようにしている。そして、Ｍ×Ｎ個の画素をマトリクス状に配列したＭ×Ｎ個の領域に文字記録領域２１全体の二値画像データが生成される。

文字列切り出し部１３１は、この画像メモリ１２から読み出した多階調の多値画像データに対する２値化処理を行う機能を有する。文字列切り出し部１３１は、適当な方法によって閾値を求め、元の多階調の多値画像を白黒２値の画像に変換する。ここで、データ処理部１３における以降の処理は、この白黒２値画像を用いて行われることとする。

文字列切り出し部１３１は、たとえば必要に応じて白黒に２値化された文字列を水平方向に射影して、文字列の上下エッジを検出する。そして、文字列切り出し部１３１は、上下エッジの中心位置を、文字列の中心ラインと識別して文字列（行）切り出しを行う。ここで、水平方向とは、文字が横方向に並んでいる第１方向、すなわちＸ軸方向である。

基本的に、文字列切り出し部１３１において媒体内の各文字列の垂直位置を検出する。次に文字切り出し部１３２では文字列ごとに水平方向（Ｘ軸方向）に形成されている文字の区切り位置を検索する。

本実施形態の文字切り出し部１３２は、文字列切り出し部１３１で切り出された行の文字列から文字列の文字が並んでいる方向、本例では水平方向の文字間の区切り位置を検出して、文字の切り出し処理を行う。より具体的には、本実施形態の文字切り出し部１３２は、撮像された画像内の文字列の区切り位置を検出（検索）する際に、その文字列に関して計算される輝度投影（射影）について、境界検出処理対象となる２文字を含む処理区間を設定する。そして、文字切り出し部１３２は、その処理区間内において射影（Ｘ軸への投影）を作成し、その射影に関してこれを左右に任意の位置で２分割したときに、その各分割要素において要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を最適分割点として選び、その点を２文字の分割点（境界位置）とする。ここでは、文字切り出し部１３２は、射影生成に際し、文字が横方向すなわちＸ軸方向に並んでいるときはＸ軸への射影を生成する。

具体的には、文字切り出し部１３２は、文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し処理と、文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定処理と、設定した検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得処理と、を行う。

文字切り出し部１３２は、画像データにおいて文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、画像データの文字が並んでいる方向の射影曲線を作成し、この射影曲線に関連付けて境界検索範囲“Ｓ”を設定する。文字切り出し部１３２は、文字列の一端側（本実施形態では左端側）から境界検索範囲“Ｓ”を設定し、設定した境界検索範囲“Ｓ”において境界位置を設定し、境界位置が設定されると、この設定された境界位置から次の境界検索範囲“Ｓ”を一文字ずつ順次に設定していく。

文字切り出し部１３２は、文字の区切り位置を設定する際に、後で詳述する判別分析法を用いて文字の区切り位置を求める。具体的には、文字切り出し部１３２は、射影曲線に関連付けて設定される境界検索範囲“Ｓ”内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する。文字切り出し部１３２は、その射影に関してその射影を左右に２分割したときに、その各分割要素において、要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を２文字の境界位置（分割位置）として検出する。より具体的には、文字切り出し部１３２は、射影に関してその射影を２分割したときに、その各分割要素において、分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような分割点を選び、その選択した分割点を２文字の境界位置として検出する。また、文字切り出し部１３２は、設定される検索範囲内の文字の並び方向の各位置における所定幅の射影を２つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、分散比が最大となる位置を求める。

なお、この文字切り出し部１３２における文字切り出し処理については、後でさらに詳述する。

データ処理部１３において、文字切り出し部１３２の文字切り出し処理が終了すると、認識対象となっている文字の外接矩形領域（上下左右の座標値）が求められる。

特徴抽出部１３３は、外接矩形領域を任意のサブ領域に分割、たとえば１個の外接矩形領域を５×５の領域に分割し、そのうち１個の領域をサブ領域とし、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合を求め、それらを要素とする特徴ベクトルを生成する。

特徴比較部１３４は、特徴抽出部１３３で求められた特徴ベクトルを、あらかじめこの媒体で使用される全文字について求めておいた基準特徴ベクトルと比較して、類似度（たとえば正規化相関係数）が最も高いものをその文字が該当する候補文字に設定する。

なお、基準特徴ベクトルは、あらかじめ特徴辞書格納部１３５に格納されているものであって、特徴比較が行われる際に、特徴辞書格納部１３５から類似度が高い文字のデータが読み出され、特徴比較部１３４において特徴比較が行われる。

類似文字認識部１３６は、基本的に、特徴比較部１３４の特徴比較によって設定された候補文字を、媒体に用いられた文字として認識する。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部１３６は、特徴ベクトルから導き出せる２次的な特徴量を利用して、類似文字の判別を行う。

たとえば、類似文字認識部１３６は、任意に分割したサブ領域を左側半分と右側半分との２領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との２領域の上下線対称に分けて、類似性を調べたりするように構成してもよい。また、類似文字認識部１３６は、左右線対称や上下線対象と同様に点対称で類似性を調べるように構成してもよい。

［文字と文字との境界位置（文字の区切り位置）の検出］
次に、本実施形態に係る文字認識装置１０における特徴的な機能を有する文字切り出し部１３２における文字の区切り位置の検出処理（文字切り出し処理）について詳細に説明する。

［文字切り出し部１３２のブロック構成］
図２は、本実施形態に係る文字切り出し部の構成例を示すブロック図である。図３は、図２の境界検索範囲設定部の構成例を示すブロック図である。図４は、本実施形態に係る文字認識対象の画像の一例を示す図である。図４は、３行の文字列の例を示している。この文字列は、文字と文字との間に空白領域を持った文字列として形成されている。図５は、図４の画像の一文字列とこの文字列に対応する射影曲線の例を示す図である。図５（Ａ）が図４の最上段の文字列を拡大して示し、図５（Ｂ）が射影曲線ＰＲＣを示している。
ちなみに、図４の最上段の文字列は、左端側から「ＩＤＪＰＮ３２１９８７６５４３３２１９８７６５４＜＜＜＜＜＜」となっている。

本実施形態に係る文字切り出し部１３２は、図２に示すように、領域設定部１３２１、境界検索範囲設定部１３２２、および境界位置設定部１３２３を含んで構成されている。

領域設定部１３２１は、文字列切り出し部１３１で切り出された行の文字列について、認識処理対象となる文字列によって占有される画像上の領域を検出し、文字列が複数ある場合は、各文字列の位置を特定し、文字列ごとに文字列によって占有される領域を設定する。なお、本実施形態では、一例として図４に示すように、３行の文字列を構成していることから領域設定部１３２１は、たとえば上段の文字列を選択する文字列選択機能を備えている。

境界検索範囲設定部１３２２は、文字列の中で隣接する文字と文字との境界位置を検索する境界検索範囲“Ｓ”を設定する。境界検索範囲設定部１３２２は、その文字列領域内において文字列の全長に関して射影を作成する。上述したように、文字が横方向すなわちＸ軸方向に並んでいるときはＸ軸への射影、文字が縦方向に並んでいるときはＹ軸への射影する。ここでは上述したようにＸ軸への射影として説明を行う。また、境界位置を検出したい隣接する２文字を含む対象区間を境界検索範囲“Ｓ”として設定する。

境界検索範囲設定部１３２２は、図３に示すように、射影曲線作成部１３２２１および文字端検出部１３２２２を備えている。

射影曲線作成部１３２２１は、図５（Ａ）および（Ｂ）に示すように、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値を検出し、各画素列の最小輝度値に基づいて画像データにおける射影曲線である最小輝度曲線を作成する。射影曲線作成部１３２２１は、撮像された文字列の画像データにおける文字画像領域について、画素列を文字列と垂直な方向にスキャンして最小輝度値を求める操作を文字画像領域の左端側の輝度列から右端側の輝度列まで繰り返すことによって最小輝度曲線を求める。

このように、射影曲線作成部１３２２１は、Ｘ軸に垂直な方向の画素の最小値を用いている。なお、射影は一般的にはＸ軸に垂直な方向の画素群の平均値を用いることが多いが、便宜上、これも射影と定義している。このように、最小値をとることにより、文字高さの差異によるプロファイルの変動を抑えることができる。またここでの射影の次元は画素値であり、８ビット濃淡画像であるので０〜２５５階調の多値をとる。たとえば、図４に示す文字列のうちの、図５（Ａ）に示す上段の文字列射影曲線（最小輝度曲線）ＰＲＣは、図５（Ｂ）に示すような曲線となる。この最小輝度曲線（射影曲線）ＰＲＣは、さらに、曲線の山ＭＣの区間が文字（黒＝濃）を表し、曲線の谷ＶＣの部分が文字と文字の間の空白（画像上は白=薄）を表している。

文字端検出部１３２２２は、最小輝度曲線（射影曲線）ＰＲＣにより各文字の端部の画素位置を検出する。なお、本実施形態では、文字端は、文字の前端位置を検出するようにしている。図６は、本実施形態の文字端検出部における文字端の検出処理を示すフローチャートである。図７は、本実施形態の文字端検出部における文字端の検出処理を説明するための図である。図７（Ａ）は図６（Ｂ）に示す射影曲線ＰＲＣのうち、文字列の左端の３文字分を表示したものである。図７（Ｂ）は射影曲線に境界検索範囲“Ｓ”を２つに分割した場合の領域（クラス）内分散と領域（クラス）間分散の分散比特性曲線Ｒｓ（ｔ）を示す図である。図７（Ａ）において、横軸は画像のＸ軸方向（水平方向）の画素位置情報（座標）を、縦軸は同じく輝度値を、それぞれ表している。本実施形態の文字端検出部１３２２２における文字端の検出処理は、具体的には、下記のステップによる（図６の各ステップ））。

ステップＳＴ１１：
最小輝度曲線（射影曲線）ＰＲＣの全体にわたる画素値の平均値を求める。
ステップＳＴ１２：
その結果、図７（Ａ）に示すように、Ｘ軸に水平な直線Ｔが得られる。

ステップＳＴ１３：
最小輝度曲線（射影曲線）ＰＲＣを左からスキャンして、直線Ｔを下から上に横切る（交差する）画素位置を所定の個数、本実施形態では最初の３箇所Ｅ（１）、Ｅ（２）、Ｅ（３）を求める。
ステップＳＴ１４：
この画素位置が文字の前端位置となる。その座標位置をＥ(１：Ｎe)とする。ここで、Ｎｅは直線Ｔを下から上に横切る画素位置の個数を表す。すなわち、この画素位置を文字の前端位置としていることから、全体の数Ｎｅは文字の個数に等しくなっている。

また、文字端検出部１３２２２は、境界位置を検出したい隣接する２文字を含む境界検索範囲“Ｓ”を設定する。この境界検索範囲“Ｓ”を設定することにより、最小輝度曲線（射影曲線）ＰＲＣを左からスキャンして、直線Ｔを下から上に横切る画素位置をすべて求めなくても、算出した境界位置に加算することで、境界検索範囲“Ｓ”を設定することが可能となる。文字端検出部１３２２２は、算出した境界位置Ｃ（ｎ−１）に、境界検索範囲“Ｓ”を加算しながら、次の文字の境界位置Ｃ〈ｎ〉を算出する境界検索範囲を設定する。

ここで、本実施形態における境界位置の検出を図７に関連付けて説明する。前述したように、図７は図５（Ｂ）に示す射影曲線（最小輝度曲線）ＰＲＣのうち、文字列の左端の３文字分を表示したものである。図５（Ａ）に示すように、本例の文字列の左端の３文字は、“ＩＤＪ”である。はじめに１番目の文字（本例ではＩ）と２番目の文字（本例ではＤ）の間に存在する境界位置Ｃ（１）を検出する。

文字端検出部１３２２２は、最小輝度曲線（射影曲線）ＰＲＣで境界検索に用いる境界検索範囲“Ｓ”を次のようにして決定する。図７（Ａ）においては、前述の文字端位置（本実施形態では文字の前端位置）は３個ある。そのうち１番目の文字の（文字）前端位置Ａと３番目の文字の（文字）前端位置Ｂを境界検索範囲“Ｓ”の始点と終点と設定している。境界検索範囲“Ｓ”の終点としては、図中ＢよりもＢ´（直線Ｔを上から下に横切る点）のほうが、求める最小輝度曲線（射影曲線）ＰＲＣの「谷底」が検索範囲のほぼ中央に位置する意味で望ましいといえるが、検索処理にはあまり影響しないため、点Ｂを用いている。実際に図７（Ａ）では、Ｘ軸方向における画素位置（Ａ，Ｂ）＝（３９，１５５）となっている。

図２の説明に戻る。境界位置設定部（境界位置算出部）１３２３は、境界検索範囲“Ｓ”を設定した領域内の射影に関して射影を任意の位置で左右に２つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点を最適な境界点として選択する。すなわち、この境界点が、隣接する２文字の境界位置となる。

文字切り出し部１３２は、上述したような処理を行い、各文字の境界位置を算出して、文字列を構成する文字全てを切り出す。

文字の切り出しにおいて、境界位置取得処理として、境界位置設定部１３２３は、設定した境界検索範囲“Ｓ”内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得処理を行い、画像データから切り出された文字列から各文字を切り出して文字を認識する。

境界位置設定部１３２３は、設定された境界検索範囲“Ｓ”内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する。境界位置設定部１３２３は、その射影に関してその射影を左右に２分割したときに、その各分割要素において、要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を選び、その選択した点を２文字の境界位置（分割位置）として検出する。そして、境界位置設定部１３２３は、求めた分散比が最大となる位置を求める。換言すれば、境界位置設定部１３２３は、生成された射影に関してその射影を左右に２分割したときに、各分割要素（分割領域）において分割要素（分割領域）内の射影値の分散が最も小さく、分割要素間（分割領域間）の射影値の分散が最も大きくなるような分割点を選択し、その選択した点を２文字の境界位置（分割位置）として検出する。境界位置設定部１３２３は、分割点算出処理においては、境界検索範囲“Ｓ”内の文字の並び方向の各位置における所定幅の射影を２つの領域に分割し、各射影における分割領域内分散と分割領域間分散とを求め、その分散比を位置ごとに求め、分散比が最大となる位置を求める。

［本実施形態の文字切り出し処理の具体的な例］
以下に、本実施形態に係る文字切り出し部１３２の具体的な処理例について、図４から図１０に関連付けて説明する。以下の説明では境界位置設定部１３２３の具体的な処理について説明する。

なお、図８は、本実施形態に係る文字切り出し部における処理の概要を示すフローチャートである。図９は、本実施形態に係る文字切り出し部における境界位置設定部の処理フローを示すフローチャートである。図１０は、本実施形態に係る文字切り出し部における境界位置設定部により文字列全体の文字境界点を検出した結果を示す図である。

文字認識を行おうとする画像が図４のように与えられているとする。文字切り出し部１３２において、はじめに領域設定が行われる。領域設定処理では、認識対象とする文字列全体を含むような矩形領域が設定される。これは図１の文字記録領域２１に相当する。あらかじめ文字記録領域２１はその媒体の面情報に関する規格によって定義されている。しかし文字領域の位置がわかっていない場合は、適切な方法によって文字列の垂直方向の位置を決定し、その情報に基づいて矩形領域の上辺と下辺の位置を決めればよい。矩形領域の幅は、その文字列の位置が一定の場合はその標準的な位置情報に基づいて決めることができる。文字列の横方向の位置が一定でない場合は、適切な方法によって文字列の水平方向の位置を決定し、その情報に基づいて矩形領域の左辺と右辺の位置を決めればよい。文字位置の誤差を考慮して、実際の文字の縁位置から適当な余白を設けることがよい。

次に、文字列切り出し処理において、文字列の切り出しが行われる。なお、処理の手順として、全体的な文字領域を設定することなく、直接各文字列の位置を検出するようにしてもよい。図４の一番上の文字列を切り出したものが図５（Ａ）に示されている。

次に、文字切り出し処理は、図８に示すフローチャートに従って行われる。基本的に、文字切り出し部１３２は、文字列ラインごとに水平方向の文字の区切り位置を検出（検索）する。

［本実施形態の文字の区切り位置の検出］
図１の文字切り出し部１３２では、まず、ステップＳＴ２１において、領域設定部１３２１により、文字列切り出し部１３１で切り出された行の文字列について、認識処理対象となる文字列によって占有される画像上の領域が検出され、文字列が複数ある場合は、各文字列の位置を特定し、文字列ごとに文字列によって占有される領域が設定される。次に、ステップＳＴ２２において、境界検索範囲設定部１３２２の射影曲線作成部１３２２１により、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値が検出され、各画素列の最小輝度値に基づいて画像データにおける射影曲線である最小輝度曲線が作成される。次に、ステップＳＴ２３において、文字端検出部１３２２２により、境界位置を検出したい隣接する２文字を含む境界検索範囲“Ｓ”が設定され、この境界検索範囲“Ｓ”を設定することにより、最小輝度曲線（射影曲線）ＰＲＣを左からスキャンして、各文字の部の画素位置が検出される。そして、ステップＳＴ２４において、境界位置設定部１３２３により、境界検索範囲“Ｓ”を設定した領域内の射影に関して射影を任意の位置で左右に２つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点が最適な境界点として選択される。すなわち、この境界点が、隣接する２文字の境界位置とされる。

この文字切り出し部１３２を採用したことにより、本実施形態によれば、閾値のレベルに左右されず、局所的な文字のつぶれにより閾値が求められない場合でも文字の区切りが可能となる。これにより、局所的に文字のつぶれ等があっても、確実に境界位置を検出することができる。換言すると、この文字切り出し部１３２を採用したことにより、性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能で、ひいては文字認識性能の向上を図ることが可能となっている。

次に、境界位置設定部１３２３における具体的な処理について説明する。本実施形態では、前述したように、閾値を用いずに文字の境界位置を検出できることに特徴がある。その具体的な方法（境界位置設定部の処理）について説明する。ここで説明する方法では、境界検索範囲“Ｓ”の最小輝度曲線（射影曲線）Ｖ＝Ｐ（Ａ：Ｂ）を用いて、文字と文字の間の空白（画像上は白=薄）を表している「谷点」を検出する。以下に示す処理は、図９のステップＳＴ３１〜ＳＴ３５に処理に相当する。

いま、射影をｐ（ｉ）で表すことにする。ここで、ｉ＝１：Ｎである。Ｎは境界検索範囲“Ｓ”の幅を表し、ｉ＝１：Ｎはｉが１（すなわち図７（Ａ）のＡ点）からＮ（Ｂ地点）まで変化することを意味する。ここで、変数ｔ（１＜ｔ＜Ｎ）を導入し、ｉ＝ｔにおいて射影ｐ（ｉ）をｐ１＝ｐ（１：ｔ）とｐ２＝ｐ（ｔ＋１：Ｎ）の２つの要素（領域）、クラスＣＬＳ１およびクラスＣＬＳ２に分割する。クラスＣＬＳ１内およびクラスＣＬＳ２内の平均値ｍ１およびｍ２は次式で求められる。

また、全体の平均値ｍｔは次式で求められる。

したがって、クラス内分散Ｓｗは次式で与えられる。

また、クラス間分散Ｓｂは次式で与えられる。

そして、その分散比Ｒｓ（ｔ）は次のように求められる。

そのうえで、最大の分散比Ｒｓ（ｔ）を与える位置パラメータｔの値を求める。すなわち、ｉ＝ｔの各位置における射影ｐ（ｉ）を２つの領域に分割し、各射影における分割領域内分散と分割領域間分散とをｔの値を変えながら求め、各ｔにおける分散比を求め、分散比が最大となるｔの値を求める。

図７（Ｂ）は、図７（Ａ）の境界検索範囲“Ｓ”にＲｓ（ｔ）曲線を示す図である。図７（Ｂ）において、ｔ＝５２で分散比Ｒｓ（ｔ）は最大となるので、求める境界位置Ｃ（１）は次のように与えられる。

［数６］
Ｃ（１）＝Ａ＋ｔ−１＝３９＋５２−１＝９０

この２クラスの分散比を用いる方式は判別分析法と呼ぶことができる。本実施形態においては、判別分析法を適用するが、一般的な判別分析法とは用いるデータの取り方が異なる。すなわち、本実施形態の分析判別処理においては、設定された境界検索範囲“Ｓ”内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算する。すなわち、境界検索範囲“Ｓ”内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を各々計算し、求めた分散比が最大となる位置を求めている。この分散比が最大となる位置を含む領域は、射影のＹ方向に配列された画素値全体の平均画素値分布において、列の平均画素値が最も低い領域を含む領域に対応して存在している。

このように、本実施形態における分析判別処理では、各列ごとのように局所的な判別情報を一文字ずつ高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。すなわち、本実施形態に係る分析判別法を境界位置設定処理（検索処理）に適用することにより、煩雑な閾値処理を行うことなく、境界があいまいなもの、明確なものに限らず、文字の境界位置を高い精度で的確に決定することが可能となる。この本実施形態に係る分析判別法は、濃淡画像を２値化する閾値とはまったく無関係の領域での応用といえる。

２番目以降の境界位置Ｃ（２：Ｎe−１）については（図９のステップＳＴ３６〜ＳＴ４１の処理に相当）、たとえばｋ番目の境界位置Ｃ（ｋ）を検出する場合、その境界検索範囲“Ｓ”を次のようにする。

［数７］
Ａ（ｋ）＝Ｃ（ｋ−１）、
Ｂ（ｋ）＝Ａ（ｋ）＋Ｅ（ｋ＋１）−Ｅ（ｋ−１）

そして、部分射影Ｖ（ｋ）＝Ｐ（Ａ（ｋ）：Ｂ（ｋ））を境界点検出ルーチンに（ステップＳＴ４０）入力すれば、境界位置Ｃ（ｋ）が得られる。この処理をｋをインクリメントしながら反復し、ｋがＮe−１を超えたところで処理は完了する。

図１０には、このようにして、文字列全体の文字境界点を検出した結果が示されている。

［文字認識装置の全体の動作］
次に、本実施形態に係る文字認識装置１０の全体的な動作について図１１に関連付けて説明する。図１１は、本実施形態に係る文字認識装置１０の全体の動作を説明するためのフローチャートである。

カードなどの媒体２０の文字記録領域２１に印刷された文字列は、媒体搬送機構の搬送ガイドに沿ってカードを動かすと１次元撮像素子１１によってその文字パターンが読み取られて光電変換され（ステップＳＴ１０１）、多階調、たとえば２５６階調の多値画像データが画像メモリ１２に取り込まれる（ステップＳＴ１０２）。

次いで、文字列切り出し部１３１において、文字列切り出しが行われる（ステップＳＴ１０３）。より具体的には、文字列切り出し部１３１において、たとえば必要に応じて２値化した文字列が水平方向に射影されて、文字列の上下エッジが検出される。そして、文字列切り出し部１３１においては、上下エッジの中心位置が、文字列の中心ラインと識別され行切り出しが行われる。

なお、文字列切り出し部１３１においては、画像メモリ１２に格納された多値画像に対して、必要に応じて白黒が画像への２値化が行われる。より具体的には、データ処理部１３においては、画像メモリ１２から画像データを読み出して、その画像データが多階調の濃淡画像である場合には、濃淡画像が白黒２値の画像に変換される。

次いで、文字切り出し部１３２において、文字切り出しが行われる（ステップＳＴ１０４）。より具体的には、文字切り出し部１３２において、文字列切り出し部１３１で切り出された行の文字列について、認識処理対象となる文字列によって占有される画像上の領域が検出され、文字列が複数ある場合は、各文字列の位置を特定し、文字列ごとに文字列によって占有される領域が設定される。
次に、文字切り出し部１３２では、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値が検出され、各画素列の最小輝度値に基づいて記画像データにおける射影曲線である最小輝度曲線が作成される。次いでに、文字切り出し部１３２において、境界位置を検出したい隣接する２文字を含む境界検索範囲“Ｓ”が設定され、この境界検索範囲“Ｓ”を設定することにより、最小輝度曲線（射影曲線）ＰＲＣを左からスキャンして、各文字の部の画素位置が検出される。そして、文字切り出し部１３２において、境界検索範囲“Ｓ”を設定した領域内の射影に関して射影を任意の位置で左右に２つのクラスに分割したときに、各クラスの分割要素において分割要素内の射影値の分散が最も小さく、分割要素間の射影値の分散が最も大きくなるような境界点が最適な境界点として選択される。これにより、この境界点が、隣接する２文字の境界位置とされる。

ステップＳＴ１０４の処理が終了すると、認識対象となっている文字の外接矩形領域（上下左右の座標値）が求められる。

次いで、特徴抽出部１３３において特徴抽出が行われる（ステップＳＴ１０５）。より具体的には、特徴抽出部１３３においては、上述した外接矩形領域が任意のサブ領域に分割（たとえば１個の外接矩形領域を５×５の領域に分割され、そのうち１個の領域がサブ領域とされる）され、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。

次いで、特徴比較部１３４において、特徴比較が行われる（ステップＳＴ１０６）。より具体的には、特徴比較部１３４においては、ステップＳＴ１０５で求めた特徴ベクトルが、あらかじめこの媒体で使用される全文字について求められてあらかじめ特徴辞書格納部１３５に格納されている基準特徴ベクトルと比較されて、類似度（たとえば正規化相関係数）が最も高いものをその文字が該当する候補文字に設定される。

最後に、文字認識が行われる（ステップＳＴ１０７）。より具体的には、ステップＳＴ１０６の特徴比較によって設定された候補文字が、媒体に用いられた文字として認識される。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部１３６において、特徴ベクトルから導き出せる２次的な特徴量を利用して、類似文字の判別が行われる。

たとえば、任意に分割したサブ領域を左側半分と右側半分との２領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との２領域の上下線対称に分けて、類似性を調べたりしてもよい。また、左右線対称や上下線対象と同様に点対称で類似性を調べてもよい。

［実施形態の主な効果］
以上のように、本実施形態によれば、画像認識技術に基づいて、撮像された画像内の文字列の区切り位置を検出（検索）する方法において、その文字列に関して計算される輝度投影（射影）について、境界検出処理対象となる２文字を含む処理区間を設定する。そして、その処理区間内において射影（Ｘ軸への投影）を作成し、その射影に関してこれを左右に任意の位置で２分割したときに、その各分割要素において要素内の分散が最も小さく、要素間の分散が最も大きくなるような分割点を最適分割点として選び、その点を２文字の分割点（境界位置）とする。その結果、本実施形態によれば、閾値のレベルに左右されず、局所的な文字のつぶれにより閾値が求められない場合でも文字の区切りを可能とする文字認識装置を提供でき、閾値が求められない場合でも確実に文字の切り出しを行うことが可能な文字認識装置の文字切り出し方法を提供することができる。すなわち、本実施形態によれば、射影曲線のレベル値に基づく閾値を設定することなく、文字の境界位置を決定できるため、煩雑な閾値処理を行うことなく、境界があいまいなものについて境界線を設定することができる。
また、画像の局所ノイズに起因する射影曲線の局所的な変動がある場合でも安定的に文字の境界位置を決定することができる。
また、本実施形態によれば、最小輝度曲線により形成される射影曲線を適用していることから、文字区間と空白区間が明確に分離され、正確な文字区切り位置の決定が可能となる。また、本実施形態によれば、文字認識の性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能であり、ひいては文字認識性能の向上を図ることが可能となる。

換言すると、本実施形態によれば、性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく、局所的な判別情報を高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。その結果、煩雑な閾値処理を行うことなく、各列ごとのように局所的な判別情報を一文字ずつ高い精度で得ることができ、文字の境界位置を高い精度で的確に決定することが可能となる。
また、本実施形態によれば、文字の境界が明確なケースに本方式を適用しても同様の結果を得ることができる。

本発明は、磁気ストライプの再生出力波形に基づくデータ復調などに適用可能である。また、本実施形態の文字認識装置１０は、カードのみならず、パスポート、運転免許証など、あらゆる媒体への適用が可能である。

なお、以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、ＣＰＵ等のコンピュータで実行するように構成することも可能である。また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー（登録商標）ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。

１０・・・文字認識装置、１１・・・撮像素子（画像読取部）、１２・・・画像メモリ、１３・・・データ処理部、１３１・・・文字列切り出し部、１３２・・・文字切り出し部、１３２１・・・領域設定部、１３２２・・・境界検索範囲設定部、１３２２１・・・射影曲線作成部、１３２２２・・・文字端検出部、１３２３・・・境界位置設定部、１３３・・・特徴抽出部、１３４・・・特徴比較部、１３５・・・特徴辞書格納部、１３６・・・類似文字認識部、ＰＲＣ・・・射影曲線（最小輝度曲線）。

Claims

画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、
媒体上の文字列を撮像して画像データとして読み取る画像読取部と、
前記画像読取部による読み取り画像を格納する画像メモリと、
前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、
前記データ処理部は、
前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し部を備え、
前記文字切り出し部は、
前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定部と、
設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を設定する境界位置設定部と、を含むことを特徴とする文字認識装置。
前記文字切り出し部は、
前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する射影曲線作成部を含み、
前記境界検索範囲設定部は、
前記射影曲線に関連付けて前記境界検索範囲を設定することを特徴とする請求項１記載の文字認識装置。
前記境界位置設定部は、
前記境界検索範囲内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定することを特徴とする請求項１または２記載の文字認識装置。
前記境界検索範囲設定部は、
前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、
前記境界位置設定部は、
順次設定される前記境界検索範囲ごとに境界位置を設定することを特徴とする請求項１から３のいずれか一に記載の文字認識装置。
媒体上の文字列を撮像して得られた画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置において、
前記画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、
前記文字列の中で隣接する文字と文字との境界位置を検出するとともに各文字を切り出す文字切り出し工程と、
前記文字列の中で隣接する文字と文字との境界位置を検索する範囲を設定する境界検索範囲設定工程と、
設定した前記検索範囲内で判別分析法を用いて、文字と文字との境界位置を求める境界位置取得工程と、
を有することを特徴とする文字認識装置の文字切り出し方法。
前記文字切り出し工程においては、
前記画像データにおいて前記文字列の方向と直交する方向に配列された各画素列の最小輝度値を検出し、各画素列の最小輝度値に基づいて、前記画像データにおける射影曲線を作成する工程を含み、
前記境界検索範囲設定工程においては、
前記射影曲線に関連付けて前記境界検索範囲を設定することを特徴とする請求項５記載の文字認識装置の文字切り出し方法。
前記境界位置取得工程においては、
前記境界検索範囲内の射影を所定の幅で２つの領域に分割し、分割した２つの領域ごとに、各領域内分散と、２つの領域間分散と、これら各領域内分散と領域間分散との分散比を求め、求めた前記分散比に基づき文字の区切り位置を設定することを特徴とする請求項５または６記載の文字認識装置の文字切り出し方法。
前記境界検索範囲設定工程においては、
前記文字列の一端側から前記境界検索範囲を設定し、当該設定した境界検索範囲において前記境界位置設定部により境界位置が設定されると、当該設定された境界位置から次の前記境界検索範囲を設定し、
前記境界位置設定工程においては、
順次設定される前記境界検索範囲に応じて一文字ずつ境界位置を設定することを特徴とする請求項５から７のいずれか一に記載の文字認識装置の文字切り出し方法。