JP2661898B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2661898B2
JP2661898B2 JP61182162A JP18216286A JP2661898B2 JP 2661898 B2 JP2661898 B2 JP 2661898B2 JP 61182162 A JP61182162 A JP 61182162A JP 18216286 A JP18216286 A JP 18216286A JP 2661898 B2 JP2661898 B2 JP 2661898B2
Authority
JP
Japan
Prior art keywords
recognition target
target area
character
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61182162A
Other languages
English (en)
Other versions
JPS6337487A (ja
Inventor
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61182162A priority Critical patent/JP2661898B2/ja
Publication of JPS6337487A publication Critical patent/JPS6337487A/ja
Application granted granted Critical
Publication of JP2661898B2 publication Critical patent/JP2661898B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字および手書き文字を認
識し、たとえばJISコード等の情報量に変換する文字認
識装置に関するものである。 従来の技術 従来の文字認識装置では、入力された画像を表示し、
オペレータがマウス等を用いて認識対象領域全域あるい
は周囲を指示することにより、認識を行っていた。ま
た、他の文字認識装置では、入力する原画像自体にカラ
ーペン等を用いて認識対象領域全域あるいは周囲を示す
マークを付し、マークを認識して認識対象領域を決定す
ることにより、認識を行っていた。(例えば、長谷他
“マークを用いた印刷文書画像の領域抽出法”信学技報
vol.83No.308 PRL83−78) 発明が解決しようとする問題点 しかしながら、オペレータやマークにより認識対象領
域全域あるいは周囲を指示する従来の技術では、例えば
帳票のような既に枠等で認識対象領域の候補領域が示さ
れている文書に関しても、認識対象領域全域あるいは周
囲を指示するという煩雑な作業を必要とした。 本発明はかかる点に鑑みてなされたものであり、既に
枠等で認識対象領域の候補領域が示されている文書に関
して、簡易な方法で認識対象領域を指定し、自動的に認
識対象領域を決定する文字認識装置を提供することを目
的としている。 問題点を解決するための手段 本発明は前記問題点を解決するため、入力画像の認識
対象領域を認識対象領域内の1点で指定する認識対象領
域指定部と、指定された1点を起点として上下左右方向
に走査して罫線位置を抽出して罫線に囲まれた領域を認
識対象領域に決定する認識対象領域決定部を備えてい
る。 作用 本発明は前記した技術的手段により、簡易な方法で認
識対象領域を指定し、自動的に認識対象領域を決定する
ことが可能となる。 実 施 例 以下、本発明の実施例について図面を参照しながら説
明する。 第1図は、本発明による文字認識装置の一実施例の構
成図である。1は画像入力部であり、認識対象文字を含
む画像を走査し2値信号で画像メモリ2に格納し、表示
部3に表示する。4は認識対象領域指定部であり、オペ
レータが表示部3に表示された入力画像内の認識対象領
域内の1点を指定する。5は認識対象領域決定部であ
り、認識対象領域指定部4で指定された1点を含む認識
対象領域を決定する。6は文字切り出し部であり、認識
対象領域決定部5で決定された認識対象領域から認識対
象文字を1字ずつ切り出す。7は認識部であり、文字切
り出し部6で切り出された認識対象文字の特徴量を求
め、あらかじめ辞書8に登録されている文字の特徴量と
照合し、最も似た文字を認識候補文字とし表示部3に表
示する。 以上のように構成された文字認識装置について、第2
図に示す入力画像Pを例に説明する。第2図中のQは、
罫線で囲まれた認識対象領域を示す。 画像入力部1から入力された画像Pは文字部(線分も
含む)の黒画素を1、背景部の白画素を0の2値データ
で画像メモリ2に蓄えられ、表示部3に表示される。認
識対象領域指定部4では、オペレータが表示部3に表示
された入力画像Pの認識対象領域Q内の1点qをマウス で指定し、x・y座標系における点qの座標(X,Y)を
得る。 次に認識対象領域決定部5では、認識対象領域指定部
4で得た認識対象領域Q内の1点qの座標(X,Y)を用
いて、認識対象領域Qの座標を決定する。第3図(a)
に示す様に、点qの座標値Xを中心に左右n画素つまり
(X−n)から(X+n)までの2n画素幅を横方向に点
qから上へ走査して、画像メモリの値が初めて(X−
n)から(X+n)まで全て1になるy座標ysを認識対
象領域Qの縦方向の開始位置とし、さらに(X−n)か
ら(X+n)までの2n画素幅を横方向に点qから下へ走
査して、画像メモリの値が初めて(X−n)から(X+
n)まで全て1になるy座標yeを認識対象領域Qの縦方
向の終了位置として決定する。同様に、第3図(b)に
示す様に、点qの座標値Yを中心に上下n画素つまり
(Y−n)から(Y+n)までの2n画素幅を縦方向に点
qから左右へ走査して、画像メモリの値が初めて(Y−
n)から(Y+n)まで全て1になるx座標xsとxeを認
識対象領域Qの横方向の開始位置と終了位置として決定
する。 第4図(a)に決定された認識対象領域Qを示す。文
字切り出し部6では、オペレータが設定した文字列方向
(認識対象領域Qの場合は横)を用いて認識対象領域Q
の文字部を形成する画素の縦方向のヒストグラムHlを求
め、ヒストグラムHlの値が1画素以上である文字部の開
始座標ls1・ls2と終了座標le1・le2から文字列座標(l
s1,le1)・(ls2,le2)を求め、文字列画像Lを切り出
す。第4図(b)に文字列画像Lを示す。次に、文字列
画像Lを射影して文字部を形成する画素のヒストグラム
Hcを求め、ヒストグラムHcの値が1画素以上である文字
部の開始・終了座標から1字1字の横方向の座標(Cs1,
Ce1)…(Csi,Cei)…を求め、文字列座標と組合せて認
識対象文字画像を1字ずつ切り出す。 認識部7には切り出された認識対象文字の矩形Rが順
次入力される。第5図(a)に切り出された認識対象文
字『文』を示す。切り出した『文』の各画素について、
第5図(b)の矢印が示す方向に着目画素を含んでM個
以上(Mはあらかじめ設定)連っているか否かを調べ方
向コードを設定する。方向コード毎に各画素の連結性を
調べてストロークを抽出し、ストロークの数・位置・長
さ等の特徴量を抽出する。第5図(a)に認識対象文字
『文』のストローク抽出結果を示す。抽出した特徴量を
辞書8に登録されている文字の特徴量と照合し、最も似
た文字「文」を認識候補文字として表示部3に表示す
る。 発明の効果 本発明によれば、入力画像の認識対象領域を認識対象
領域内の1点を起点として上下左右方向に走査して罫線
位置を抽出して罫線に囲まれた領域を認識対象領域に決
定することにより、帳票のように既に枠等で認識対象領
域の候補領域が示されている文書に関して、簡易な方法
で認識対象領域を指定し、自動的に認識対象領域を決定
することが可能となる。
【図面の簡単な説明】 第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像及び認識対象領域指定方法の
説明図、第3図は認識対象領域決定方法の説明図、第4
図は文字切り出し方法の説明図、第5図は文字認識方法
の説明図である。 1……画像入力部、2……画像メモリ、3……表示部、
4……認識対象領域指定部、5……認識対象領域決定
部、6……文字切り出し部、7……認識部、8……辞
書。

Claims (1)

  1. (57)【特許請求の範囲】 1.認識対象文字を含む画像を入力する画像入力部と、
    前記画像入力部で入力された画像の認識対象領域を認識
    対象領域内の1点で指定する認識対象領域指定部と、前
    記認識対象領域指定部で指定された1点を起点として上
    下左右方向に走査して罫線位置を抽出して罫線に囲まれ
    た領域を認識対象領域に決定する認識対象領域決定部
    と、前記認識対象領域決定部で決定された認識対象領域
    から認識対象文字を切り出す文字切り出し部と、前記文
    字切り出し部で切り出された認識対象文字を辞書と照合
    することにより認識候補文字を抽出する認識部を有する
    ことを特徴とする文字認識装置。
JP61182162A 1986-08-01 1986-08-01 文字認識装置 Expired - Fee Related JP2661898B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61182162A JP2661898B2 (ja) 1986-08-01 1986-08-01 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61182162A JP2661898B2 (ja) 1986-08-01 1986-08-01 文字認識装置

Publications (2)

Publication Number Publication Date
JPS6337487A JPS6337487A (ja) 1988-02-18
JP2661898B2 true JP2661898B2 (ja) 1997-10-08

Family

ID=16113436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61182162A Expired - Fee Related JP2661898B2 (ja) 1986-08-01 1986-08-01 文字認識装置

Country Status (1)

Country Link
JP (1) JP2661898B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2701350B2 (ja) * 1988-08-25 1998-01-21 日本電気株式会社 文書読取装置
JP2579356B2 (ja) * 1989-01-13 1997-02-05 三菱電機株式会社 文書読取装置
JPH0748443B2 (ja) * 1990-03-28 1995-05-24 ニチコン株式会社 電力用高圧コンデンサ
JP3895892B2 (ja) * 1999-09-22 2007-03-22 株式会社東芝 マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体
JP2002288178A (ja) * 2001-03-23 2002-10-04 Toshiba Corp マルチメディア情報収集管理装置およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57137970A (en) * 1981-02-18 1982-08-25 Ricoh Co Ltd Picture area designating method

Also Published As

Publication number Publication date
JPS6337487A (ja) 1988-02-18

Similar Documents

Publication Publication Date Title
KR900007009B1 (ko) 문자인식장치
JPH03122773A (ja) 画像形成装置
JP2661898B2 (ja) 文字認識装置
JP2537973B2 (ja) 文字認識装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0797390B2 (ja) 文字認識装置
JPH083829B2 (ja) 文字認識方法
JPH0576671B2 (ja)
JPH01137385A (ja) 文字認識装置
JP3100825B2 (ja) 線認識方法
JPS6269383A (ja) 文字認識装置
KR910005390B1 (ko) 자동문서처리 및 영문자 인식방법
JPH08297718A (ja) 文字切り出し装置及び文字認識装置
JPH058670U (ja) 光学的文字読取装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPS63229586A (ja) 文字認識装置
JPH0664628B2 (ja) 文字認識装置
JPH0632079B2 (ja) 文字認識装置
JPH0350689A (ja) 文字認識装置
JPS63221495A (ja) 文字認識装置
JPH02187883A (ja) 文書読取装置
JPH05274472A (ja) 画像認識装置
JPS63225883A (ja) 文字認識装置
JPH01181176A (ja) 文字認識装置
JPH07107700B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees