JP3391223B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3391223B2 JP3391223B2 JP19106997A JP19106997A JP3391223B2 JP 3391223 B2 JP3391223 B2 JP 3391223B2 JP 19106997 A JP19106997 A JP 19106997A JP 19106997 A JP19106997 A JP 19106997A JP 3391223 B2 JP3391223 B2 JP 3391223B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- line segment
- pattern
- recognition device
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
置(OCR)に関する。手書き文字を認識する文字認識
装置においては、誤読文字を減じると共に帳票記入の制
限を減らすことが要求される。
構成概念図である。文字認識装置1の各部は以下のよう
に動作する。まず観測部2は、帳票A上に記入された文
字(および文字枠)をスキャナ等で読み取り、光電変換
後に2値の画像データに変換する。文字切りだし部3
は、帳票画像から各文字を1文字づつに分離する。前処
理部4は、切り出した文字に対して雑音除去、大きさの
正規化等を行う。特徴抽出部5は、文字認識用の特徴値
を抽出する。辞書部6には、各文字種に対する特徴値の
辞書が格納されている。辞書照合部7は、抽出した文字
の特徴値と辞書との照合を行ない、最も特徴値が近い文
字種を候補とし、結果出力部8はそれに従って認識結果
Bを出力する。
図10に一例を示す。この例は、図10(1)に示すよ
うに、文字の画素パターンの輪郭部の画素を抽出し、そ
れぞれ輪郭の方向を示す方向コードを付ける方式であ
る。この例では横、右上がり斜め、縦、左上がり斜めの
4つの方向に分けている。そして、各方向ごとに画素を
計数し、その並びを特徴ベクトルとして扱う(図10
(2 )参照)。辞書部6にも同じようにして文字種ごと
のベクトル値が記録してある。入力された文字のベクト
ルと、辞書のベクトルとの距離(特徴距離)を計算し近
い順に候補とする。このとき、候補文字との距離が遠い
場合や、1位候補と2位候補との差が少ない場合には認
識不能とする場合もある。
文字列に対しては文字列を貫通する線分(消し線)を記
入することにより、それらを読み取らないというリジェ
クト機能が搭載されたものがある(特開昭61−368
74)。しかしこれは、1文字の幅と比較して「充分に
長い線分」という条件のもとで有効な手法であり、消し
線長が文字幅程度の1文字のみを訂正した消し線には有
効ではない。
例えば、文字枠内を塗りつぶす、または文字枠を横断す
る長い水平線分を引くというルールが使われる。このル
ールが守られれば、本来の文字との特徴距離の差が明確
であるため区別できるが、このルールは記入者にとって
負担になるので、守られないことが多い。図11に手書
き文字を入力した帳票の例を示す。従って、記入者が消
し線を付けたつもりの文字がリジェクトされずに誤読さ
れてしまうケースがかなりの割合で発生する可能性があ
る。例えば、「0」に短い横棒による消し線をつけたも
のを「8」と誤る。これは「消し線付きの0」と「8」
との特徴距離が近いため区別することが容易でないため
である。
文字のどれに相当するかを判定する他に、消し線付文字
との区別を判定する必要があり、特徴距離を大きくする
ために数多くの特徴を抽出する必要がある。特徴辞書も
大掛かりなものになる。
態は、横方向、縦方向、斜め方向の線分によることが最
も頻度が高いことに着目して、文字が記入された帳票の
画像から1文字毎に切りだされた文字パターンを対象と
して、消し線がついているか否かを判定し、ついている
と判定したときはリジェクトすることにより、文字認識
の精度を高めることを目的とする。
装置の原理構成図を示す。観測部2、文字切り出し部
3、前処理部4、特徴抽出部5、辞書部6、辞書照合部
7、結果出力部8は従来と同じでよい。なお、これらの
部分はこの図と異なる構成であってもよい。
定方向の線分のパターンを抽出する線分パターン生成部
91と、生成された線分パターンから特徴データを抽出す
る線分抽出部92と、線分パターンの特徴データを解析し
て消し線であるか否かを判定する消し線判定部93とを有
するように構成する。線分パターン生成部91は、文字パ
ターンから、所定方向の、例えば横方向の線分に対応す
るパターンを抜き出して、線分パターンを生成する。こ
の生成は、例えば次の請求項2、3のように行う。
から特徴データを抽出する。特徴データを抽出するには
請求項3のようにヒストグラム方式でもよいし、文字パ
ターンから特徴データを抽出する方式、その他でもよ
い。消し線判定部93は、特徴データを解析し、入力され
た文字パターンの特徴データから認識された文字種に対
応して設定された判定基準を用いて、文字パターンの一
部ではない線分が存在するか否かを判断する。例えば、
「0」や「8」のパターンは横方向の走査によるヒスト
グラムには閾値を越えるピークをもたないが、図3
(2)に示すように、「4」の標準的パターンは閾値を
越えるピークを中央付近に1つもつ。従って、「0」や
「8」と認識されたパターンの中央付近にヒストグラム
のピークが存在する場合は消し線が付けられている可能
性が高いが、「4」と認識されたパターンの中央付近に
ヒストグラムのピークがあっても、消し線が付けられて
いる可能性は低い。よって、消し線の存在の判定は、文
字種ごとに変えるほうが精度が高くなる。そのような線
分があれば、それは消し線とみなしてその文字を結果出
力部により削除処理を行うことになる。
は、抽出対象方向に長い長方形の抽出窓を用い、文字パ
ターン上で移動させ、抽出窓の中の黒画素数が所定値以
下の場合は抽出窓の全画素を白画素とし、所定値より多
ければ全画素を黒画素として変換することにより線分パ
ターンを生成するように構成する。
出窓の中で黒画素が多ければ、その部分はその方向の線
分である可能性が高い。また、黒画素が少ないならその
部分はその方向の線分ではない可能性が高い。従って、
図2(a)に示すように、それぞれ黒画素、白画素に置
き換えたパターンを生成することにより、図2(b)の
ように抽出窓方向の線分を構成する画素が抽出されるこ
とになる。
パターンを抽出対象方向に走査して画素数ヒストグラム
を特徴データとして生成し、消し線判定部93は、生成さ
れたヒストグラムの所定の領域にあるピークの幅と高さ
とから入力された文字パターンの特徴データから認識さ
れた文字種に対応して設定された判定基準を用いて、消
し線であるか否かを判定するように構成する。
示す。線分パターンに存在する画素はすべて消し線由来
のものとは限らないので、消し線である可能性が高いも
のを取り出す。例えば、上下の境界に近い水平線分をも
つ文字(図3(2)参照)が多いので、また、消し線が
上下の境界付近に存在することは少ないので、横方向の
ヒストグラムを判断する場合に上下境界に近いピークを
除いたほうが精度が高くなる。
は抽出対象方向毎に線分パターンを生成し、線分抽出部
92は、線分パターンごとに線分の特徴データを抽出し、
消し線判定部93は、いずれかの方向の消し線の有無を検
出するように構成する。
左上がり斜め方向の場合も同様にすればよい。なお、消
し線は横線にするというようなルールを決めることがで
きれば横方向のみを検出することで高速にすることもで
きる。
は、必要があれば、文字パターンを所定の角度だけ回転
させてから、線分パターンを生成するように構成する。
例えば、45度ずつ回転させて4回行えば、斜め、縦、
の処理もその後の処理は同じことをくりかえすだけでよ
い。
て、文字パターンから所定方向の線分のパターンを抽出
し、抽出された線分パターンの特徴データを抽出し、線
分パターンの特徴データを解析し、入力された文字パタ
ーンの特徴データから認識された文字種に対応して設定
された判定基準を用いて、消し線であるか否かを判定す
る処理をコンピュータに行わせることを特徴とする文字
認識プログラムをコンピュータ読み取り可能な記録媒体
に記録しておく。
が記入を誤ったことを示すために記入した消し線を適切
に判断してその文字を除去することができる。従って消
したはずの文字が別の文字に誤認識されることが少なく
なり、精度を高くすることができる。
装置(OCR)の例を説明する。図4は、主に手書き数
字を対象とし文字幅程度の線分による消し線をつけるこ
とを許容する文字認識装置の構成ブロック図である。
示す。 s1〜s6: 文字認識装置1は、帳票上に記入された文字
(および文字枠)をスキャナ等で読み取って、光電変換
後に二値の画像データに変換する観測部2、帳票画像か
ら各文字を従来方式により1文字づつに分離する文字切
りだし部3、切り出した文字に対して雑音除去、大きさ
の正規化等を行う前処理部4、文字認用特徴値を抽出す
る特徴抽出部5、各文字種に対する特徴値の辞書が格納
されている辞書部6、抽出した文字認識用特徴値と辞書
との照合を行い中間認識結果を出力する辞書照合部7を
備える。ここまでは従来方式と同じである。
した正規化された文字パターンとは、消し線処理を行う
ため、線分パターン生成部91と消し線判定部93とに送ら
れる。消し線判定は、正規化文字パターンに対して、横
方向、縦方向、右上がり斜め方向、左上がり斜め方向の
線分を検出することにより行う。また、文字種ごとにま
た、方向ごとに判定のための閾値を設定してある閾値フ
ァイル94を用意してあり、中間認識結果で第一候補とさ
れた文字種に対応した閾値セットをとりだし、それに基
づいて、消し線があるか否かを判定する。
文字種コードをリジェクトコードに付け替え、最終認識
結果として出力する。消し線の無い通常文字として判定
した場合は、中間認識結果をそのまま最終認識結果とし
て出力する。
る。消し線処理は、図4に示す、線分パターン生成部9
1、線分抽出部92、消し線判定部93、閾値ファイル94、
および、 線分パターン回転部(図示していない)より行
われる。
ーンに対し、以下のようにして、線分パターンを抽出す
る。消し線処理の流れ図を図6に示す。
方向線分の抽出 判定対象とする消し線は縦、横、斜め方向の線分による
消し線とする。ここで、斜め方向とは、文字外接長方形
の対角線方向とする。図7に、文字外接長方形と抽出線
分の方向を示す。図7(1)(2)の細枠が文字の外接長方
形、図7(1) の1の線が横方向、2が左上がり斜め方
向、3が縦方向、4が右上がり斜め方向である。
明する。他の方向を抽出するには、外接長方形の対角線
方向の角度を算出し、その角度だけ文字パターンの座標
変換を行ってから、その角度だけ回転させて(図7(2)
参照)、同じことを行えばよい。または、順次固定角度
で45度、90度、135度回転させるようにしてもよ
い。
mの横長の長方形(n<m)の窓を考える。この領域内
の黒画素数をカウントし、長方形内全画素数(n×m
個)に対する黒画素数の比Bを求める。
1の場合、長方形領域内部の画素を、全て黒画素で置き
換える。B≦TH1の場合、長方形領域内部の画素を、
全て白画素で置き換える。窓を、文字外接長方形内でく
まなく移動させ、水平線分パターンを抽出する。図2
(a)に、n×m=3×8、TH1=0.7とした例を
示す。
生成し、所定領域内の線分数を数える。同様に、横方向
の線分を例にあげて説明する。
て黒画素を数えた、黒画素数ヒストグラムを作成する。
ただし、図3(3) に示すように『5』や『2』のよう
に、最上部または最下部の文字線が横線分として検出さ
れる場合が数字では多いので、文字の最上部および最下
部から、幅LE=LH×TH2の領域を除外してヒスト
グラムを作成する。TH2は外接長方形の高さに対す
る、除外領域の幅である。なお、ヒストグラムは全体に
わたって作成して、判定のときに除外するようにしても
よい。または、 線分パターンを生成するときに除外する
ようにしてもよい。図6ではその例を示している。
したとき、LC=LW×TH3を満たす位置LCでヒス
トグラムを切断する。TH3は外接長方形幅LWに対す
る切断部分幅の比である。
市松模様部分)の切断個所からの高さをH、切断個所の
幅をWとしたとき、H/W>TH4を満たすものを水平
方向の線分と判断する。
上のものを、水平方向の線分による消し線付き文字と判
定する。すなわち、LHをパターンの外接長方形の高さ
としたとき、 (H/W>TH4) & (LH−LE≧y≧LEに存
在) であれば、横方向の線分の消し線候補である。
であれば、横方向の線分による消し線付文字であると判
定する。 (3) ここで、TH1〜TH5の各閾値は、抽出対象線分
方向毎及び文字種毎に最適な値に設定しておき、閾値フ
ァイルとして用意しておく。判定対象文字の一次認識結
果文字種に対応して、使用する閾値のセットを決定す
る。縦、右上がり斜め、左上がり斜め線分も同様に行
う。消し線候補の探索領域は、横、縦方向は外接長方形
内であるが、斜め方向の場合は外接長方形の対角線を含
む長方形内とすればよい。
図8にあげる。
し線をつけた文字を適切に判定することができ、一定方
向の線分による消し線の記入された文字の誤読を減ず
る。
Claims (6)
- 【請求項1】 入力された文字パターンの特徴データを
抽出し辞書データと比較して、文字を認識する文字認識
装置であって、 文字パターンから、所定方向の線分のパターンを抽出す
る線分パターン生成部と、 生成された線分パターンから特徴データを抽出する線分
抽出部と、抽出された 線分パターンの特徴データを解析し、入力さ
れた文字パターンの特徴データから認識された文字種に
対応して設定された判定基準を用いて、消し線であるか
否かを判定する消し線判定部とを有することを特徴とす
る文字認識装置。 - 【請求項2】 請求項1に記載の文字認識装置であっ
て、 線分パターン生成部は、抽出対象方向に長い長方形の抽
出窓を用い、文字パターン上で移動させ、抽出窓の中の
黒画素数が所定値以下の場合は抽出窓の全画素を白画素
とし、所定値より多ければ全画素を黒画素として変換す
ることにより線分パターンを生成することを特徴とする
文字認識装置。 - 【請求項3】 請求項1または請求項2に記載の文字認
識装置であって、 線分抽出部は、線分パターンを抽出対象方向に走査して
画素数ヒストグラムを特徴データとして生成し、 消し線判定部は、生成されたヒストグラムの所定の領域
にあるピークの幅と高さとから入力された文字パターン
の特徴データから認識された文字種に対応して設定され
た判定基準を用いて、消し線であるか否かを判定するこ
とを特徴とする文字認識装置。 - 【請求項4】 請求項1ないし請求項3に記載の文字認
識装置であって、 線分パターン生成部は抽出対象方向毎に線分パターンを
生成し、 線分抽出部は、線分パターンごとに線分の特徴データを
抽出し、 消し線判定部は、いずれかの方向の消し線の有無を検出
する ことを特徴とする文字認識装置。 - 【請求項5】 請求項1ないし請求項4に記載の文字認
識装置であって、線分パターン生成部は、文字パターンを所定の角度だけ
回転させてから、線分パターンを抽出することを特徴と
する文字認識装置。 - 【請求項6】 入力された文字パターンの特徴データを
抽出し、辞書データと比較して、文字を認識する文字認
識装置であって、 文字パターンから、所定方向の線分のパターンを抽出す
る線分パターン生成部と、 抽出された線分パターンの特徴データを抽出する線分抽
出部と、 抽出された線分パターンの特徴データを解析し、入力さ
れた文字パターンの特徴データから認識された文字種に
対応して設定された判定基準を用いて、消し線であるか
否かを判定する消し線判定部とを有することを特徴とす
る文字認識プログラムを記録したコンピュータ読み取り
可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19106997A JP3391223B2 (ja) | 1997-07-16 | 1997-07-16 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19106997A JP3391223B2 (ja) | 1997-07-16 | 1997-07-16 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1139429A JPH1139429A (ja) | 1999-02-12 |
JP3391223B2 true JP3391223B2 (ja) | 2003-03-31 |
Family
ID=16268363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19106997A Expired - Fee Related JP3391223B2 (ja) | 1997-07-16 | 1997-07-16 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3391223B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346631A (zh) * | 2013-07-30 | 2015-02-11 | 夏普株式会社 | 图像判别方法、图像处理装置以及图像输出装置 |
-
1997
- 1997-07-16 JP JP19106997A patent/JP3391223B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1139429A (ja) | 1999-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cao et al. | Text/graphics separation in maps | |
Kim et al. | An architecture for handwritten text recognition systems | |
JP5907593B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
CN107563380A (zh) | 一种基于mser和swt相结合的车辆车牌检测识别方法 | |
Ali et al. | An efficient character segmentation algorithm for recognition of Arabic handwritten script | |
Zhan et al. | A robust split-and-merge text segmentation approach for images | |
Roy et al. | A novel approach to skew detection and character segmentation for handwritten Bangla words | |
Shaikh et al. | Character segmentation of Sindhi, an Arabic style scripting language, using height profile vector | |
Sas et al. | Three-stage method of text region extraction from diagram raster images | |
Bag et al. | Character segmentation of handwritten Bangla text by vertex characterization of isothetic covers | |
JP3391223B2 (ja) | 文字認識装置 | |
Nguyen et al. | Robust car license plate localization using a novel texture descriptor | |
Liu et al. | A prototype system of courtesy amount recognition for Chinese Bank checks | |
KR20090111202A (ko) | 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치 | |
Patel | An introduction to the process of optical character recognition | |
Basil et al. | Comparative analysis of MSER and DTW for offline signature recognition | |
JP3344062B2 (ja) | カタカナ手書き文字切り出し回路 | |
Humied | Segmentation accuracy for offline Arabic handwritten recognition based on bounding box algorithm | |
Gajjar et al. | Top down hierarchical histogram based approach for printed devnagri script charecter isolation | |
Yadav et al. | Offline Handwritten Character Recognition using Neural Networks | |
JP2832035B2 (ja) | 文字認識装置 | |
Leedham et al. | Isolating individual handwritten characters | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
JP2564276B2 (ja) | パタ−ン認識方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20021224 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080124 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090124 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100124 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110124 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110124 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120124 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130124 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130124 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140124 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |