JPH02249085A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02249085A
JPH02249085A JP1070837A JP7083789A JPH02249085A JP H02249085 A JPH02249085 A JP H02249085A JP 1070837 A JP1070837 A JP 1070837A JP 7083789 A JP7083789 A JP 7083789A JP H02249085 A JPH02249085 A JP H02249085A
Authority
JP
Japan
Prior art keywords
character
pixel
center
boundary
picture element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1070837A
Other languages
English (en)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1070837A priority Critical patent/JPH02249085A/ja
Publication of JPH02249085A publication Critical patent/JPH02249085A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞、雑誌等の活字、ドツト文字および手書
き文字を読み取り、入力された文字パターンをJISコ
ード等のコード情報に変換する文字認識装置に関するも
のである。
従来の技術 近年、文字認識装置が簡便な文字入力装置として利用さ
れるようになってきた。従来の文字認識装置は、たとえ
ば矩形状に切り出された認識対象文字パターンを、MX
Nのメツシュ状に分割し、文字パターンの4辺から向か
い合った辺の向きに走査するときに、文字部分に出会う
までの背景部分の面積を計数し、これを全体の面積で正
規化し、これを特徴量としていたく梅田、有野=「粗い
ペリフェラルパターンによるマルチフォント印刷漢字の
分類」、電子通信学会技術研究報告、PRL78−4)
。 しかしながら上記の従来の技術では、文字パターン
の周辺部分の形状を背景部分の面積で表現していたため
に、線幅の変動によって背景部分の面積も変動し、書体
や字体によって背景部分の面積が変化する、即ちマルチ
フォント対応の文字認識装置にとって適した特徴量でな
い、という間層点を有していた。上記問題点を解決する
ために、入力された画像から矩形で切り出された認識対
象文字パターンを、上記矩形の辺から向かい合う辺に向
かって走査し、まず背景部分から文字部分に変化する境
界画素、次に文字部分から背景部分に変化する境界画素
を検出したときに、上記境界画素の中心に位置する画素
を求め、当該画素において所定の複数の方向に連続して
存在する黒画素の数を計数し、当該黒画素の数が最大で
ある方向の方向コードを特徴量とすることで文字の識別
を行なう文字認識装置である。
発明が解決しようとする課題 この装置は明朝体、ゴシック体等のマルチフォント文字
認識に遺しているが「囲」や「園」等の「(にがまえ」
のように特徴量が等しくなる文字が存在するために識別
できないという課題を有していた。
課題を解決するための手段 本発明では上記課題を解決するために入力された画像か
ら矩形で切り出された認識対象文字パターンを、上記矩
形の辺から向かい合う辺に向かって走査し、まず背景部
分から文字部分に変化する境界画素、次に文字部分から
背景部分に変化する境界画素、さらに背景部分から文字
部分に変化する境界画素、最後に文字部分から背景部分
に変化する境界画素を検出したときに、はじめ2つの境
界画素の中心に位置する画素とあとの2つの境界画素の
中心に位置する画素を求め、当該両中心画素において所
定の複数の方向に連続して存在する黒画素の数を計数し
、当該黒画素の数が最大である方向の方向コードを特徴
量として認識を行なう。
作用 本発明は上記した構成により、文字パターンの特徴を方
向コードによって表現し、この方向コードによって文字
を識別する。
実施例 第1図は本発明の一実施例における文字認識装置の機能
ブロック図を示すものである。第1図において1は画像
データを読み取るスキャナ等で構成された画像入力部、
2は画像入力部1で読み取られた画像を切り出す文字切
り出し部、3は文字切り出し部2で切り出された各文字
の各々における文字パターンから第1中心画素の座標を
計算する第1中心画素計算部、4は文字切り出し部2て
切り出された各文字の各々における文字パターンから第
2中心画素の座標を計算する第2中心画素計算部、5は
第1中心画素計算部3と第2中心画素計算部4で求めた
画素を基準に方向コードを検出する方向コード抽出部、
6は方向コード抽出部5で抽出された方向コードに対応
する文字コードを検索する文字認識部、7は方向コード
の組み合わせと対応する文字コードとを対に記憶した辞
書、8は表示部である。
第2図は本実施例の文字認識装置の構成を示すブロック
図ある。ここで21は文字パターンを読み取るスキャナ
で、読み取った文字パターンをビットデータにして出力
する。22はRAMで、スキャナ21からのビットデー
タを記憶する文字パターン領域23、この文字パターン
領域23内の文字パターンを解析して得られる方向コー
ド領域24、及び方向コード領域24に記憶された方向
コードから決定される文字コード領域25を有している
。26はROMで、方向コードとこれに対応する文字コ
ードを記憶した辞書、及び第3図(a)、第3図(b)
、第3図(C)、第3図(d)、第3図(e)に示すフ
ローチャートに従った制御プログラムを記憶したプログ
ラム記憶領域28を有する。29はプログラム記憶領域
28に記憶された制御プログラムに従って処理を行う処
理回路である。30はデータを入力するキーボードであ
り、6は文字コード領域25に記憶された文字コードに
対応する文字を表示する表示部である。
以上のように構成された本実施例の文字認識装置につい
て、第3図のフローチャートに従って説明する。
まず、ステップS1において認識対象文字パターンをサ
ブ文字パターンに分割する。ステップS2ではiに1を
代入してステップs3に移行する。
ステップs3では文字パターン領域23に記憶された文
字パターンの画素(Wx(2xi−1)/(2xN)、
O)から下に向かって走査する。ステップs4では文字
パターンの画素値がOから1へ変化する境界点が存在す
るかどうかを判別し、存在すれば更に走査を進め、ステ
ップs5で次に1からOに変化する境界点があるかどう
かを調べる。ステップS4とステップS5で境界点が存
在する場合はステップs6で第1中心画素を計算し、ス
テップs7に進む。ステップs7では第1中心画素にお
いて連続する黒画素数を4方向について計数し、ステッ
プs8で黒画素数が最大である方向の方向コードを方向
コード領域24に格納する。
ステップS4とステップS5で境界点が存在しないと判
別された場合はステップsllにおいて境界点が存在し
ないことを示すコードを第1次特微量として方向コード
領域24に格納してステップs9に移行する。ステップ
s9ではステップs5で検出された境界点を起点に更に
下辺方向へ走査し、画素値がOから1へ変化する境界点
が存在するかどうかを調べ、存在する場合はステップs
10で1からOへの境界点を調べる。ステップs9とス
テップsloで境界点が存在する場合はステップs12
で第2中心画素を計算し、ステップS13で第2中心画
素における4方向の黒画素数を計数する。ステップs1
4では黒画素数が最大の方向コードを第2次特微量とし
方向コード領域24に格納後、ステップs15に進む。
ステップS9およびステップsloで境界点が検出され
ない場合はステップs22で境界点が存在しないことを
示すコードを第2次特微量として方向コード鎖域24に
格納する。ステップs15では画素(WX (2Xi−
1)/ (2XN)、H)から上に向かって走査する。
そしてステップs16とステップs17において境界点
が存在するかどうかを判別し存在すればステップs18
で第1中心画素を計算し、ステップs19において第1
中心画素から連続黒画素数を4方向について計数し、ス
テップs20において黒画素数が最大である方向の方向
コードを第1次特微量として方向コード領域24に格納
しステップs21に進む。ステップ616とステップs
17で境界点が存在しない場合はステップs23におい
て境界点が存在しないことを示すコードを格納する。ス
テップs21ではステップs17で検出された境界点よ
り上辺に向かって走査した場合に画素値が0から1へ変
化する境界点が、ステップs24では1からOへ変化す
る境界点がそれぞれ存在するか否か調べる。存在すれば
ステップs25に進む。存在しないときはステップs3
4で境界点が存在しないことを示すコードを第2次特微
量として方向コード領域24に格納する。ステップs2
5では第2中心画素を計算し、第2中心画素において4
方向に連続する黒画素数をステップs26で計数する。
ステップS27で黒画素数が最大の方向の方向コードを
第2次特微量として格納する。そしてステップS28で
iがN未満か否かを判別しN未満の場合はステップs3
5においてiをインクリメントしてステップs3に戻る
がiがN以上のときはステップs29に移行してiに1
を代入する。ステップS30では画素(0,HX (2
X i −1) / (2XM))から右に向かって走
査する。ステップs31とステップs32で境界点が存
在するかどうかを判別し境界点が存在する場合はステッ
プs33で第1中心画素を求め、ステップs37で第1
中心画素から連続する黒画素の数を計数する。ステップ
s38では黒画素数が最大である方向の方向コードを第
1次特微量として方向コード領域24に格納しステップ
s39に進む。ステップs31とステップs32で境界
点が存在しない場合はステップs36において境界点が
存在しないことを示すコードを特徴量として方向コード
領域24に格納する。ステップs39とステップs40
てそれぞれ境界点を検出した場合にはステップs41に
進む。境界点が検出されない場合はステップS47で境
界点が存在しないという意味のコードを第2次特微量と
して方向コード領域24に格納する。ステップs41で
計算した第2中心画素において4方向に連続する黒画素
数をステップs42で計数し、黒画素数が最大の方向コ
ードをステップs43で第2次特微量として格納する。
次にステップs44において画素(W、HX(2xi1
)/ (2xM))から左に向かって走査し、ステップ
s45とステップS46で境界点が存在するかどうか判
別し境界点が存在する場合はステップs48、ステップ
S49、ステップs50と処理を進めて第1次特微量を
得る。境界点が存在しない場合はステップs57へ進む
。更に走査を行いステップs51及びステップs52で
境界点が検出された場合にはステップS53、ステップ
S54、ステップs55と移行してステップs56にお
いてiがM未満かどうかを判別する。境界点が存在しな
い場合にはステップs58に進む。iがM未満の場合は
ステップs59でjに1を加えてステップs30に戻る
がM以上の場合は処理を終了する。
認識例題文字「囲」を例に、以下その動作を説明する。
まず、画像入力部1て、認識対象文字パターンを含む画
像を2値画像として入力して文字パターン領域23に記
憶する。
次に、文字切り出し部2で、入力され文字パターン領域
23に記憶された画像から認識対象文字パターンを切り
出す。入力した文字パターンの文字部分、背景部分の画
素値はそれぞれ1、Oである。また、文字部分、背景部
分を構成する画素をそれぞれ黒画素、白画素とよぶ。認
識例題文字パターン「囲」を第4図に示す。
次に、第1中心画素計算部3て、認識対象文字パターン
の文字部分の第1中心画素を計算する。
文字パターンに外接する矩形の高さ、幅をそれぞれH,
Wとするとき、H,WをそれぞれMXN個に等分割し、
MXN個に分割された文字パターンの各ブロックをサブ
文字パターンとよぶことにする。ここで、等分割したの
は説明を簡潔にするためであって、本発明の本質ではな
い。等分割できない場合は1からM−1番目までの幅を
1nt(H/M)、M番目の幅をH−i n t (H
/Mx(M−1)とする。但し1nt(H/M)は整数
の除算演算を表しH/Mの剰余がO以外のとき商の小数
部は四捨五入される。Wについても同様である。文字パ
ターンに外接する矩形の上辺から下辺に向かって走査す
るが、このとき走査は、上辺上に存在する全ての画素か
ら開始するのではなく、画素(Wx(2xi  1)/
(2xN)。
O)から開始する。ここで、i=1.2.・・・、Nで
あり、小数部分は小数第1位を四捨五入、整数化される
。上記走査によって、白画素から黒画素に変化する境界
点、次に黒画素から白画素に変化する境界点を検出し、
当該両境界点の中心に位置する第1中心画素を計算する
。更に、第2中心画素計算部4で第2中心画素を計算す
る。すなわち第1中心画素計算部で検出された黒画素か
ら白画素に変化する境界点を起点に更に下辺に向かって
走査を行い白画素から黒画素、および黒画素から白画素
への境界点をそれぞれ検出し、当該両境界点の中心に位
置する画素を計算して第2次中心画素とする。
次に、方向コード抽出部5で、第1中心画素計算部3及
び第2中心画素計算部4で求めた第1中心画素及び第2
中心画素において第6図に示した4方向に走査して、白
画素に出会うまでの黒画素数を計数し、黒画素数が最大
である方向の方向コードをそれぞれ第1次特微量および
第2次特微量とする。境界点が存在しない場合には、こ
のことを示すコード、たとえば01を特徴量とする。同
様にして下辺から上辺、左辺から右辺、右辺から左辺に
ついて、合計2X (M+N)個の第1次特微量と第2
次特微量を抽出する。第4図、第5図の文字パターンは
H=49、W=46であるから、M=N=4に分割した
場合にはサブ文字パタ−ンの高さは1番目から3番目ま
では12.4番目は13であり、幅は1番目から3番目
までは12.4番目は10である。よってサブ文字パタ
ーンが左上を原点(1,1)とする直交座標系上にある
とき、文字パターンに外接する矩形の上辺から下辺に向
かって走査する場合、画素(6,1)。
画素(18,1)、画素(30,1)、画素(42,1
)のそれぞれから文字部分にぶつかるまで下方向に向か
って走査する。画素(6,1)の場合、第1中心画素、
第2中心画素はそれぞれ(6゜3)、(6,15)であ
り、それぞれの中心画素において4方向に連続する黒画
素の数を求めると、第1中心画素では方向コード1の黒
画素の数が45であり最も大きく、第2中心画素では方
向コード1の34が最長であるので、最大の黒画素の数
をもつ方向コード、即ち1を第1次特微量、■を第2次
特微量とする。第4図及び第5図の認識例題文字パター
ン「囲」と「園」をM=4、N=4に分割した場合、特
徴量として抽出される方向コード記憶領域24内のデー
タはそれぞれ第7図、第8図に示すように異なるために
両文字パターンの識別が可能である。
最後に、文字認識部6で、抽出された認識対象文字パタ
ーンの特徴量と辞書7に格納された特徴量を照合して、
候補文字を決定し、結果を表示部8に表示する。
発明の効果 以上のように本発明は、文字パターンから第2次特微量
として方向コードを抽出し文字の識別に利用することに
より「(にがまえ」等の第1次特徴が等しい文字パター
ンでも精度良く識別することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識装置の機能
ブロック図、第2図は本実施例の構成を示すブロック図
、第3図(a)、第3図(b)、第3図(C)、第3図
(d)、第3図(e)は本実施例における制御手順を示
すフローチャート、第4図は認識例題文字「囲」のパタ
ーン図、第5図は認識例題文字「園」のパターン図、第
6図は方向と方向コードとの対応図、第7図は本実施例
によって抽出された認識例題文字「囲」の場合の方向コ
ード領域内の構成図、第8図は認識例題文字「園」の特
徴量を示す図である。 1・・・画像入力部、 2・・・文字切り出し部 3・・・第1中心画素計算部、 4・・・第2中心画素計算部 5・・・方向コード抽出部 6・・・文字認識部 7・・・辞書 8・・・表示部

Claims (1)

  1. 【特許請求の範囲】 入力された画像から認識対象文字パターンを矩形に切り
    出す文字切り出し部と、 前記文字切り出し部で切り出された矩形の辺から向かい
    合う辺に向かって走査し、認識対象文字パターンの背景
    部分から文字部分に変化する画素を検出し、次に文字部
    分から背景部分に変化する境界画素を検出して、当該両
    境界画素の中心に位置する画素を計算する第1中心画素
    計算部と、上記境界画素を起点としてさらに走査を継続
    した場合に認識対象文字パターンの背景部分から文字部
    分に変化する画素を検出し、次に文字部分から背景部分
    に変化する境界画素を検出したときに、当該両境界画素
    の中心に位置する画素を計算する第2中心画素計算部と
    、 前記第1中心画素計算部と前記第2中心画素計算部とに
    よって算出された各画素から所定の複数の方向の各々に
    連続して存在する黒画素の数を計数し、当該黒画素の数
    が最大である方向の方向コードを抽出する方向コード抽
    出部と、 前記方向コード抽出部によって抽出された方向コードと
    辞書に格納されている方向コードを照合することにより
    、認識候補文字を決定する文字認識部と、 を有することを特徴とする文字認識装置。
JP1070837A 1989-03-23 1989-03-23 文字認識装置 Pending JPH02249085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1070837A JPH02249085A (ja) 1989-03-23 1989-03-23 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1070837A JPH02249085A (ja) 1989-03-23 1989-03-23 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02249085A true JPH02249085A (ja) 1990-10-04

Family

ID=13443078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1070837A Pending JPH02249085A (ja) 1989-03-23 1989-03-23 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02249085A (ja)

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US4813078A (en) Character recognition apparatus
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JP3618796B2 (ja) パターン認識方法および装置
EP0385009A1 (en) Apparatus and method for use in image processing
US4556985A (en) Pattern recognition apparatus
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
US5119441A (en) Optical character recognition apparatus and method using masks operation
US5369715A (en) Optical character recognition system
JPH02249085A (ja) 文字認識装置
JPH02214992A (ja) 文字認識装置
JPH07160810A (ja) 文字認識装置
JPH02187884A (ja) 文字認識装置
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법
KR910005385B1 (ko) 스트로크 근사 직선 추출에 의한 문자인식방법
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2578768B2 (ja) 画像処理方法
JP2578767B2 (ja) 画像処理方法
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JPS63271588A (ja) 文字認識装置
JPH01124082A (ja) 文字認識装置
JPH0576671B2 (ja)