JPH0896078A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0896078A
JPH0896078A JP6226972A JP22697294A JPH0896078A JP H0896078 A JPH0896078 A JP H0896078A JP 6226972 A JP6226972 A JP 6226972A JP 22697294 A JP22697294 A JP 22697294A JP H0896078 A JPH0896078 A JP H0896078A
Authority
JP
Japan
Prior art keywords
character
pixel
memory
image data
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6226972A
Other languages
English (en)
Inventor
Tsutomu Kuramochi
勉 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP6226972A priority Critical patent/JPH0896078A/ja
Publication of JPH0896078A publication Critical patent/JPH0896078A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字を精度良くかつ高速に認識することを可
能にする文字認識装置を提供すること。 【構成】 画像入力装置1で認識対象である文書を2値
画像データとして読み込み、該画像データは入力画像用
メモリ2に格納される。処理装置3で入力画像用メモリ
2に格納された入力画像データから文字画像データを1
文字ずつ切り出し、文字画像データの幅と高さが予め定
めた大きさとなるように拡大または縮小して作業用メモ
リ5に格納し、作業用メモリ5に格納した文字画像デー
タから特徴量を抽出した後、まず、辞書メモリ4の大分
類辞書を用いて大分類候補文字を決定し、次に、辞書メ
モリ4の詳細認識辞書を用いて大分類候補文字を認識対
象として詳細認識処理を行い、最終的な認識結果を出力
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字画像を正確にかつ
高速に認識する文字認識装置に関する。
【0002】
【従来の技術】文字認識装置においては、認識処理時間
の短縮を目的として、まず文字画像から比較的高速に抽
出可能な特徴量に基づいて1文字以上の大分類候補文字
を求め、次に該大分類候補文字だけを認識対象として詳
細な認識処理を実行して認識結果を出力する手法が多く
提案されている。
【0003】このような手法の従来技術としては、例え
ば特開平3−180989号公報に記載のように、まず
文字画像から文字線の対称性を表す特徴量に基づいて大
分類候補文字を求め、次に該大分類候補文字を認識対象
として詳細な認識処理を実行して認識結果を出力する文
字認識装置が提案されている。
【0004】
【発明が解決しようとする課題】前記の従来技術で大分
類候補文字を求める場合には、文字線の対称性を表す特
徴量に基づいて判定するために、文字画像が僅かに傾い
ていたり、文字画像にノイズが入っていると、該大分類
候補文字に正解の文字が含まれないことがあり、このよ
うな場合は誤認が発生する。
【0005】本発明の目的は、前記の問題点を解決し、
文字を精度良くかつ高速に認識することを可能にする文
字認識装置を提供することにある。
【0006】
【課題を解決するための手段】前記の目的を達成するた
めに、本発明の文字認識装置は、詳細認識処理の前処理
として、詳細認識処理で入力文字画像と照合する対象文
字を絞り込む大分類処理において入力文字画像の文字の
背景部の各画素を中心とした所定の形状と大きさをもつ
領域中の文字部の画素数を計数する文字部画素計数処理
部と、該画素数と所定の閾値との大小を比較した結果に
より前記の中心とした文字の背景部の画素が画素特徴点
であるか否かを判定する特徴点抽出処理部と、入力文字
画像中の予め設定した少なくとも1つの部分領域に対
し、該部分領域中に含まれる前記特徴点数を計数した結
果を特徴量とする特徴量抽出処理部と、該特徴量に基づ
き入力文字画像と類似した文字を大分類候補文字とする
識別処理部とを備えることを特徴とする。
【0007】
【作用】文字部画素計数処理部と特徴点抽出処理部は、
入力文字画像中の大きい背景部を抽出する。特徴量抽出
処理部は、大きい背景部のおおよその位置と大きさを特
徴量として数値表現する。該特徴量は、文字のおおよそ
の形状と複雑さを反映していると考えられる。識別処理
部は、該特徴量により大分類候補文字を特定する。
【0008】本発明によれば、文字画像の大きい背景部
のおおよその位置と大きさに基づく特徴により大分類候
補文字を特定するので、大分類候補文字を特定するため
の特徴抽出と識別処理を精度良くかつ高速に行うことが
できる。したがって、文字を精度良くかつ高速に認識す
ることができる。
【0009】
【実施例】図1は、本発明の一実施例による文字認識装
置の構成を示すブロック構成図である。
【0010】辞書用メモリ4には大分類辞書と詳細認識
辞書が格納されている。画像入力装置1で認識対象であ
る文書を2値画像データとして読み込み、該画像データ
は入力画像用メモリ2に格納される。処理装置3で入力
画像用メモリ2に格納された入力画像データから文字画
像データを1文字ずつ切り出し、文字画像データの幅と
高さが予め定めた大きさとなるように拡大または縮小し
て作業用メモリ5に格納し、作業用メモリ5に格納した
文字画像データから特徴量を抽出した後、まず、辞書メ
モリ4の大分類辞書を用いて大分類候補文字を決定し、
次に、辞書メモリ4の詳細認識辞書を用いて大分類候補
文字を認識対象として詳細認識.処理を行い、最終的な
認識結果を出力する。
【0011】図2は、文字画像から大分類処理で使用す
る特徴量を抽出する処理の流れを示し、たフローチャー
トである。図3(a)は、作業用メモリ5に格納した文
字画像の一例である。文字部を黒画素、背景部を白画素
で表し、縦15画素、横15画素の大きさに正規化し、
左上端の画素を原点に2次元座標(x,y)で各画素を
指定できるものとする。以下、処理装置3で図3(a)
に示した文字画像から大分類処理で使用する特徴量を抽
出する処理を図2のフローチャートに沿って詳述する。
【0012】フラグの確保と初期化(処理ステップ20
1);正規化した文字画像の画素数と同じ数のフラグを
確保し、全フラグをoffに設定する。各フラグも文字
画像の各画素と同様に2次元座標(x,y)で指定でき
るものとする。
【0013】着目する座標の初期化(処理ステップ20
2);文字画像中の1つの画素を指し示すための変数x
とyを用意して、xとyに0を設定する。
【0014】背景部か否かの判定(処理ステップ20
3);(x,y)の着目画素が白画素であるか、すなわ
ち、文字の背景部であるか否かを判定する。白画素であ
れば処理ステップ204へ進み、黒と画素であれば次の
画素を着目すべく処理ステップ206へ進む。
【0015】特徴点か否かの判定(処理ステップ20
4);着目している(x,y)の画素を中心とした予め
設定した形状と大きさをもつ領域内の黒画素数が、予め
設定した値より小さいか否かを判定する。該黒画素数が
予め設定した値より小さい場合には処理ステップ205
へ、他の場合には 次の画素を着目すべく処理ステップ
206へ進む。
【0016】本実施例では、着目した画素を中心に縦5
画素、横5画素の正方領域内を対象に黒画素数が4個以
内か杏かを判定する場合について説明する。
【0017】図3(b)に、着目した画素を中心に縦5
画素、横5画素の正方領域内を対象に黒画素数を計数す
る場合の説明図を示す。斜線の丸が着目画素を、実線お
よび破線が黒画素数を計数する範囲を表す。同図の中央
の着目画素を中心とした正方領域内には4個の黒画素が
含まれる。
【0018】左上端の画素を中心として正方領域を取っ
た場合等は、正方領域の一部分が文字画像からはみ出す
が、はみ出した部分には黒画素がないものとする。同図
の左上端の着目画素を中心とした正方領域内には黒画素
は含まれない。したがって、どちらの場合も予め設定し
た形状と大ささをもつ領域内の黒画素数が4個以下なの
で、処理ステップ205に進む。
【0019】特徴点の登録(処理ステップ205);処
理ステップ204で抽出した(x,y)の白画素を特徴
点として、処理ステップ201で確保したフラグの
(x,y)に登録する。すなわち、(x,y)のフラグ
をonに設定する。
【0020】右隣の画素の座標の設定(処理ステップ2
06);右隣の画素に対して、処理ステップ203ない
し処理ステップ205を実行すぺく、変数xに1を加算
する。
【0021】右隣の画素の有無の判定(処理ステップ2
07);処理ステップ206で着目しようとしている画
素が存在するか否かを判定する。存在する場合は処理ス
テツプ203へ移り、存在しない場合には次の行の画素
に着目すべく処理ステップ208へ進む。
【0022】次の行の左端の画素の座標の設定(処理ス
テップ208);次の行の左端の画素に対して、処理ス
テップ203ないし処理ステップ205を実行すべく、
変数yに1を加算し、変数xに0を設定する。
【0023】次の行の画素の有無の判定(処理ステップ
209):処理ステップ208で着目しようとしている
画素が存在するか否かを判定する。存在する場合は処理
ステップ203へ移り、存在しない場合は処理ステップ
210へ進む。
【0024】図3(c)は、図3(a)の文字画像に対
して処理ステップ209まで実行した時の処理ステップ
201で確保したフラグの説明図である。斜線入りの丸
はonに設定されているフラグ、すなわち、処理ステッ
プ203および処理ステップ204の両方の判定条件を
満たした画素を表し、黒丸と白丸はoffに設定されて
いるフラグ、すなわち、該判定条件の少なくとも一方を
満たさなかった画素を表す。
【0025】特徴量の抽出(処理ステップ210);文
字画像中の予め設定した1つ以上の各部分領域中で、特
徽点を計数して出力する。すなわち、処理ステツプ20
1で確保したフラグの予め設定した範囲で、onに設定
されているフラグの数を出力する。
【0026】一例として、図4(a),(b)に、文字
画像を縦方向に3等分、横方向に3等分してできる9個
の部分領域から特徴量を抽出する説明図を示す。図4
(a)は、図3(c)に示したフラグの説明図に部分領
域の境界を加筆した説明図である。特徴点、すわなち、
同図の斜線入りの丸の数を、各部分領域で計数する。そ
の結果を、図4(b)に示す。この例では、(24,
6,24,13,3,13,12,15,12)という
9次元の特徴量を抽出できる。
【0027】上記の処理ステップ201ないし処理ステ
ップ210のようにして、認識対象とする全ての文字種
の文字画像からn次元(上記の実施例では9次元)の特
徴量を各々抽出し、予め大分類辞書に登録しておく。そ
して、同様にして入力文字画像から抽出したn次元の特
徴量と予め大分類辞書に登録しておいた各文字のn次元
の特徴との距離または類似度を計算する。その計算式
は、例えば、「パターン認識」森健一監修 電子情報通
信学会4頁に記載されている。この距離または頬似度の
うち、予め定めた条件を満たす文字を大分類候補文字と
する。
【0028】判定条件の一例としては、距離が予め定め
た閾値以下となった文字を大分類候補文字とする。
【0029】このようにして、大分類候補文字を出力す
る。
【0030】上記の実施例中では、正規化サイズとして
15×15画素、背景部の着目画素として5×5画素の
正方領域、該領域内の黒画素の閾値を4としたが、これ
らの値や形状に限定されるものではなく、例えば、白画
素の方を教えてももちろんよい。また、n次元特徴量の
各次元の特徴量の抽出範囲の設定も均等分割に限定する
ものではなく、不均等分割、抽出範囲の一部重複や、全
体ではなく部分領域のみに設定することなども考えられ
る。
【0031】
【発明の効果】本発明によれば、文字画像の大きい背景
部のおおよその位置と大きさに基づく特徴により大分類
候捕文字を特定するので、大分類候補文字を特定するた
めの特徴抽出と識別処理を精度良くかつ高速に行うこと
がでさる。したがって、文字を精度良くかつ高速に認識
することができる。
【図面の簡単な説明】
【図1】 本発明が適用される文字認識装置の一実施例
のブロック構成図である。
【図2】 実施例に示した大分類処理のフローチャート
である。
【図3】 実施例に示した大分類処理における文字画
像,フラグの状態等の説明図である。
【図4】 実施例に示した大分類処理におけるフラグの
状態,特徴量抽出の説明図である。
【符号の説明】
1…画像入力装置、2…画像用メモリ、3…処理装置、
4…辞書用メモリ、5…作業用メモリ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 詳細認識処理の前処理として詳細認識処
    理で入力文字画像と照合する対象文字を絞り込む大分類
    処理において入力文字画像の文字の背景部の各画素を中
    心とした所定の形状と大きさをもつ領域中の文字部の画
    素数を計数する文字部画素計数処理部と、 該画素数と所定の閾値との大小を比較した結果により前
    記の中心とした文字の背景部の画素が画素特徴点である
    か否かを判定する特徴点抽出処理部と、 入力文字画像中の予め設定した少なくとも1つの部分領
    域に対し、該部分領域中に含まれる前記特徴点数を計数
    した結果を特徴量とする特徴量抽出処理部と、 該特徴量に基づき入力文字画像と類似した文字を大分類
    候補文字とする識別処理部とを備えることを特徴とする
    文字認識装置。
JP6226972A 1994-09-21 1994-09-21 文字認識装置 Pending JPH0896078A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6226972A JPH0896078A (ja) 1994-09-21 1994-09-21 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6226972A JPH0896078A (ja) 1994-09-21 1994-09-21 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0896078A true JPH0896078A (ja) 1996-04-12

Family

ID=16853508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6226972A Pending JPH0896078A (ja) 1994-09-21 1994-09-21 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0896078A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167329A (ja) * 2016-03-16 2017-09-21 アイラボ株式会社 プログラム、情報記憶媒体及び筆順判定装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167329A (ja) * 2016-03-16 2017-09-21 アイラボ株式会社 プログラム、情報記憶媒体及び筆順判定装置

Similar Documents

Publication Publication Date Title
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
JPH05233873A (ja) 領域分割方法
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
JPH0896078A (ja) 文字認識装置
JP2868134B2 (ja) 画像処理方法及び装置
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JP3517518B2 (ja) 物体検出装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JP3095470B2 (ja) 文字認識装置
JP2832928B2 (ja) 文字認識方法
KR100533209B1 (ko) 영상검출방법
JP3077929B2 (ja) 文字切出し方式
JPH1021332A (ja) 非線形正規化方法
JP2974167B2 (ja) 文字の大分類認識方法
JPH11306282A (ja) 文字列領域抽出方法及び装置
JP3411795B2 (ja) 文字認識装置
JP2797523B2 (ja) 図面続取装置
CN115700824A (zh) 文字分割方法、电子设备及存储介质
JPH03219384A (ja) 文字認識装置
CN115965572A (zh) 一种基于模板比对的三级管外观缺陷检测方法
CN112183531A (zh) 一种文字定位框的确定方法、装置、介质及电子设备
JPH05274472A (ja) 画像認識装置
JPS63131287A (ja) 文字認識方式