JPS63229587A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS63229587A
JPS63229587A JP62064535A JP6453587A JPS63229587A JP S63229587 A JPS63229587 A JP S63229587A JP 62064535 A JP62064535 A JP 62064535A JP 6453587 A JP6453587 A JP 6453587A JP S63229587 A JPS63229587 A JP S63229587A
Authority
JP
Japan
Prior art keywords
recognition
character
characters
small
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62064535A
Other languages
English (en)
Inventor
Mariko Takenouchi
磨理子 竹之内
Masahiro Shimizu
正博 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62064535A priority Critical patent/JPS63229587A/ja
Publication of JPS63229587A publication Critical patent/JPS63229587A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞、雑誌等の活字及び手書き文字を認識し
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では、一定幅のイメージを2値化し
て画像メモリに読み込み、1文字ずつ用紙のタイミング
マークを基準にして切り出し、文字の特徴貴を求め、あ
らかじめ記憶しである標準パターンとマツチング処理を
行い、10個の候補文字を認識結果メモリに記憶し、さ
らに外部に出力する。(例えば、松村博「卓上型手書き
漢字OCRの開発」、昭和60年度電子通信学会総合全
国大会、 1S4O) 発明が解決しようとする問題点 しかしながら、上記のような文字認識装置では、認識対
象領域内の全認識対象文字について複数個の認識候補文
字を抽出し認識結果メモリに記憶するため多大なメモリ
を必要とする。また、全認識対象文字について認識候補
文字を抽出してから認識訂正を行うため、もう一度最初
の認識対象文字から認識結果を確認し認識誤シをおこし
た場合認識候補文字の中から正しい文字を選択するとい
う煩雑な処理を要した。
本発明はかかる点に鑑みてなされたものであり、認識候
補文字のための多大なメモリを必要とせず、認識誤りを
おこした文字を簡易な処理で訂正することができる文字
認識装置を提供することを目的としている。
問題点を解決するだめの手段 本発明は前記問題点を解決するため、入力画像内の認識
対象領域を小領域に区切る小領域分割部と、文字情報を
記憶している辞書と、小領域分割部で区切った小領域単
位で認識対象文字を切り出し、辞書と照合することによ
り認識候補文字を抽出する認識部と、認識部で抽出した
小領域単位の認識候補文字を正しい文字に訂正する認識
訂正部を備えた文字認識装置である。
作用 本発明は前記した技術的手段により、入力画像内の認識
対象領域を小領域に区切り小領域単位に認識及び訂正処
理を行うだめ、認識候補文字のための多大なメモリを必
要とせず、認識誤りをおこした文字を簡易な処理で訂正
することができる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査し2値信号で画像メモリ2に格納し表示部9
に表示する。3は領域設定部であり、オペレータが表示
部9に表示された入力画像よシ認識対象領域を設定する
。4は小領域分割部であり、領域設定部3で設定した認
識対象領域を小領域に分割する。5は認識部であり、小
領域分割部4で分割した小領域単位で認識対象文字を切
り出し特徴量を求め、あらかじめ辞書6に登録されてい
る文字の特徴量と照合し最も似た文字6個を認識候補文
字群とする。7は認識訂正部であシ、認識部5で抽出し
た小領域単位の認識候補文字群を表示部9に表示し、オ
ペレータが正しい文字に訂正し文章メモリ8に格納し、
訂正結果に従って辞書6を更新し、さらに認識部6の次
の小領域単位の処理を起動する。
以上のように構成された文字認識装置について、第2図
に示す入力画像Pを例に説明する。
画像入力部1から入力した画像Pは文字部1、白部0の
2値データで画像メモリ2に蓄え表示部9に表示する。
領域設定部3では、表示部9に表示した入力画像からオ
ペレータが認識対象領域Qと文字列方向横を設定する。
小領域分割部4では、認識対象領域Qの文字部を形成す
る画素の縦方向のヒストグラムH4を求め、ヒストグラ
ムHpO値が1画素以上で連続する文字部の開始、終了
座標を小領域の座標L’ (1g 1 e l e t
 ) 、L 2 (1m 21162 ) ’ L3(
gas”65)とする。
認識部5では、小領域分割部4で分割した小領域単位に
処理する。第3図に小領域L1を示す。
小領域L1を射影して文字部を形成する画素のヒストグ
ラムHaを求め、ヒストグラムHaの値が1画素以上で
連続する文字部の開始、終了座標を認識対象文字の座標
C1(C,、、C,、)・・・・・・C4(Cs4.C
64)とし矩形で切り出す。
第4図aに切り出した認識対象文字1文」の画像を示す
。次に、切り出した「文」の各画素について、第4図す
の矢印が示す方向に着目画素を含んでM個以上(Mはあ
らかじめ設定)連っているか否かを調べ着目画素に方向
コードを付与する。
方向コード毎に各画素の連結性を調べてストロークを抽
出し、ストロークの数1位置、長さ等のに次元の特徴量
fRk(k=1 、2・・・・・・K)を抽出する。第
4図&に認識対象文字「文」のストローク抽出結果を示
す。抽出した特徴量f8kを辞書6に登録されているD
個の文字の特徴量Fdkと弐〇)により照合し、評価値
Vdが最も小さい順に5文字「文」「大」「交」「支」
「夫」を認識候補文字群とする。
第6図aに小領域L1の全ての認識対象文字について認
識候補文字群を抽出した結果を示す。
認識訂正部7には、認識部5で抽出した小領域単位の全
認識対象文字の認識候補文字群が入力される。第5図へ
に示す小領域L1の全ての認識対象文字の認識候補文字
群について、認識訂正部7では、第5図すに示すように
第1位認識候補文字「文」「学」「認」「識」に格納文
字フラグマを付与し表示部9に表示する。オペレータが
第1位認識候補文字の内で認識誤りをおこした「学」を
指示すると、第2位から第5位の認識候補文字「字」「
宝」「安」「宇」を表示部9に表示し、オペレータが正
解文字「字」を選択すると第6図Cに示すように第1位
認識候補文字「学」に付与している格納文字フラグマを
正解文字「字」に変更する。同時に辞書6に登録されて
いる「字」の特徴量Fc1kを式@)により更新する。
Fak’ = (y、に+ fRk) 72     
・・・・・・に))ここで’dk’は更新後の特徴量で
、fRkは認識対象文字1字」の特徴量である。また、
オペレータが訂正処理完了を指示すると、格納文字フラ
グマが付与されている文字だけを文章メモリ8に格納す
る。
次に、認識部6と認識訂正部7の処理の制御状態を第6
図に従って説明する。
小領域分割部4で認識対象領域がA個の小領域に分割さ
れ認識部5に起動がかかると、10で第1番目の小領域
に着目し変数&に1を代入する。
11で全小領域の処理が完了したか否かを調べるため変
数aと小領域数ムを比較し、a〉人ならば終了し、a≦
Aならば12へ進む。12で変数aが示す着目小領域か
ら認識対象文字を切り出し辞書6と照合することにより
認識候補文字群を抽出する。13で第1位認識候補文字
に格納文字フラグを付与し表示部9に表示する。14.
15でオペレータの指示に従って、訂正処理の場合は1
6へ進み、訂正処理完了の場合は17へ進む。16では
オペレータが指示した正解文字に格納文字フラグを変更
し、辞書6を更新し、再び14へ戻る。
17で格納文字フラグが付与された文字を文章メモリ8
に格納する。18で次の小領域に着目するため変数aに
1加算し、再び11へ戻る。
以上のような文字認識装置では、入力画像内の認識対象
領域を小領域に区切り、小領域単位に認識及び訂正を行
い、その都度辞書を更新するため辞書の学習効果が直ち
に認識に反映され、さらに訂正処理の完了が次の小領域
の認識処理を起動するため操作性も向上する。
尚、本実施例では、文字列方向と垂直方向の文字部を形
成する画素のヒストグラムを用いて認識対象領域を文字
列単位で小領域としたが、認識対象領域の分割方法はこ
の方法だけに限るものではない。
発明の効果 本発明によれば、入力画像内の認識対象領域を小領域に
区切り小領域単位に認識及び訂正処理を行うため、認識
候補文字のための多大なメモリを必要とせず、認識誤り
をおこした文字を簡易な処理で訂正することができ、そ
の実用的効果は大きい。
【図面の簡単な説明】
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像及び認識対象領域を小領域に
分割する方法の説明図、第3図は認識対象文字切り出し
方法の説明図、第4図は文字認識方法の説明図、第6図
は認識候補文字群と訂正方法の説明図、第6図は認識部
と認識訂正部の処理の制御概略図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
、3・・・・・・ 、領域設定部、4・・・・・・小領
域分割部、6・・・・・・認識部、6・・・・・・辞書
、7・・・・・・認識訂正部、8・・・・・・文章メモ
リ。 代理人の氏名 弁理士 中 尾 敏 男 #1か1名第
2図 第3図 乙I Cer Ce;:  Ce3Ce4 cI  Cz C3C4 第4図 C,yt      (:er M5図

Claims (3)

    【特許請求の範囲】
  1. (1)認識対象文字を含む画像を入力する画像入力部と
    、前記画像入力部で入力した画像内の認識対象領域を小
    領域に区切る小領域分割部と、文字情報を記憶している
    辞書と、前記小領域分割部で区切った小領域単位で認識
    対象文字を切り出し前記辞書と照合することにより認識
    候補文字を抽出する認識部と、前記認識部で抽出した小
    領域単位の認識候補文字を正しい文字に訂正する認識訂
    正部を有することを特徴とする文字認識装置。
  2. (2)認識訂正部が認識部で抽出した小領域単位の認識
    候補文字を正して文字に訂正し辞書を訂正結果に従って
    更新することを特徴とする特許請求の範囲第1項記載の
    文字認識装置。
  3. (3)認識訂正部の小領域単位の処理完了が認識部の小
    領域単位の処理の起動制御となることを特徴とする特許
    請求の範囲第1項記載の文字認識装置。
JP62064535A 1987-03-19 1987-03-19 文字認識装置 Pending JPS63229587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62064535A JPS63229587A (ja) 1987-03-19 1987-03-19 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62064535A JPS63229587A (ja) 1987-03-19 1987-03-19 文字認識装置

Publications (1)

Publication Number Publication Date
JPS63229587A true JPS63229587A (ja) 1988-09-26

Family

ID=13261013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62064535A Pending JPS63229587A (ja) 1987-03-19 1987-03-19 文字認識装置

Country Status (1)

Country Link
JP (1) JPS63229587A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098759B2 (en) 2012-05-15 2015-08-04 Fuji Xerox Co., Ltd. Image processing apparatus, method, and medium for character recognition

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57162081A (en) * 1981-03-31 1982-10-05 Toshiba Corp Optical character reader
JPS57212586A (en) * 1981-06-25 1982-12-27 Fujitsu Ltd Character recognizing system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57162081A (en) * 1981-03-31 1982-10-05 Toshiba Corp Optical character reader
JPS57212586A (en) * 1981-06-25 1982-12-27 Fujitsu Ltd Character recognizing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098759B2 (en) 2012-05-15 2015-08-04 Fuji Xerox Co., Ltd. Image processing apparatus, method, and medium for character recognition

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
JPS63229587A (ja) 文字認識装置
JP2661898B2 (ja) 文字認識装置
JPH0452509B2 (ja)
JPS63221495A (ja) 文字認識装置
JPS63229586A (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JP2537973B2 (ja) 文字認識装置
JPH0452783A (ja) 図面読取装置
JPS6330991A (ja) 文字認識装置
JP2812391B2 (ja) パターン処理方法
JPH0363882A (ja) 画像処理装置
JPH07107700B2 (ja) 文字認識装置
JP2677271B2 (ja) 文字認識装置
JPH11120294A (ja) 文字認識装置および媒体
JPS62251888A (ja) 文字認識装置
JPS63229584A (ja) 文字認識装置
KR940009749B1 (ko) 글자 분할 방법
KR930007554B1 (ko) 자음과 붙은 하치모음의 분리방법
KR930007553B1 (ko) 초성과 붙은 우치모음의 분리방법
JPS6077276A (ja) 文字認識装置
JPH07117995B2 (ja) 文字認識装置
JPS63239569A (ja) 文字認識装置
JPH06131503A (ja) 文字認識処理装置
JPS63229591A (ja) 文字認識装置