JPS6337487A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6337487A
JPS6337487A JP61182162A JP18216286A JPS6337487A JP S6337487 A JPS6337487 A JP S6337487A JP 61182162 A JP61182162 A JP 61182162A JP 18216286 A JP18216286 A JP 18216286A JP S6337487 A JPS6337487 A JP S6337487A
Authority
JP
Japan
Prior art keywords
recognition target
area
target area
character
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61182162A
Other languages
English (en)
Other versions
JP2661898B2 (ja
Inventor
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61182162A priority Critical patent/JP2661898B2/ja
Publication of JPS6337487A publication Critical patent/JPS6337487A/ja
Application granted granted Critical
Publication of JP2661898B2 publication Critical patent/JP2661898B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字および手書き文字を認識
し、たとえばJISコード等の清報量に変換する文字認
識装置に関するものである。
従来の技術 従来の文字認識装置では、入力された画像を表示シ、オ
ペレータがマウス等を用いて認識対象領域全域あるいは
周囲を指示することにより、認識を行っていた。また、
他の文字認識装置では、入力する原画像自体にカラーペ
ン等を用いて認識対象領域全域あるいは周囲を示すマー
クを付し、マークを認識して認識対象領域全決定するこ
とにより、認識を行っていた。(例えば、長谷他゛マー
クを用いた印刷文書画像の領域抽出法”信学技報vo1
.83 &30B  PRL83−78 )発明が解決
しようとする問題点 しかしながら、オペレータやマークにより認識対象領域
全域あるいは周囲を指示する従来の技術では、例えば帳
票のような既に枠等で認識対象領域の候補領域が示され
ている文書に関しても、認識対象領域全域あるいは周囲
を指定するという煩雑な作業を必要とした。
本発明はかかる点に鑑みてなされたものであり、既に枠
等で認識対象領域の候補領域が示されている文書に関し
て、簡易な方法で認識対象領域を指定し、自動的に認識
対象領域全決定する文字認識装置を提供することを目的
としている。
問題点を解決するための手段 本発明は前記問題点を解決するため、入力画像の認識対
象領域全認識対象領域内の1点で指定する認識対象領域
指定部と、指定された1点を含む認識対象領域を決定す
る認識対象領域指定部全備えている。
作   用 本発明は前記した技術的手段により、簡易な方法で認識
対象領域を指定し、自動的に認識対象領域を決定するこ
とが可能となる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査し2値信号で画像メモリ2に格納し、表示部
3に表示する。4は認識対象領域指定部であり、オペレ
ータが表示部3に表示された入力画像内の認識対象領域
内の1点を指定する。5は認識対象領域決定部であり、
認識対象領域指定部4で指定された1点を含む認識対象
領域を決定する。6は文字切り出し部であり、認識対象
領域決定部5で決定された認識対象領域から認識対象文
字を1字ずつ切り出す。7は認識部であシ、文字切り出
し部6で切り出された認識対象文字の特徴量を求め、あ
らかじめ辞書8に登録されている文字の特徴量と照合し
、最も似た文字を認識候補文字とし表示部3に表示する
以上のように構成された文字認識装置について、第2図
に示す入力画像Pを例に説明する。第2図中のQは、罫
線で囲まれた認識対象領域を示す。
画像入力部1から入力された画像Pは文字部(線分も含
む)の黒画素を1、背景部の白画素全0の2値デーメで
画像メモリ2に蓄えられ、表示部3に表示される。認識
対象領域指定部4では、オペレータが表示部3に表示さ
れた入力画像Pの認識対象領域Q内の1点qをマウス゛
\”で指定し、x−y座標系における点qの座標(x、
y)を得る。
次に認識対象領域決定部5では、認識対象領域指定部4
で得た認識対象領域Q内の1点qの座標(X、Y)k用
いて、認識対象領域Qの座標を決定する。第3図(、)
に示す様に、点qの座標値Xを中心に左右n画素つまり
(X −n )から(X+n)までの2n画素幅を横方
向に点qから上へ走査して、画像メモリの値が初めて(
X−n)d−ら(X+n)まで全て1になるy座標ys
を認識対象領域Qの縦方向の開始位置とし、さらに(X
−n)から(X + n )までの2n画素@を横方向
に点qから下へ走査して、画像メモリの値が初めて(X
−n)から(X + n )まで全て1になるy座標y
。を認識対象領域Qの縦方向の終了位置として決定する
同様に、第3図(ロ)に示す様に、点qの座標値Yを中
心に上下n画素つま!+(Y−n)から(Y+n)まで
の2n画素幅を縦方向に点qから左右へ走査して、if
象メモリの1直が初めて(Y−n)から(Y十n)まで
全て1になるX座標Xsとxeを認識対象領域Qの横方
向の開始位置と終了位置として決定する。
第4図(a)に決定された認識対象領域Qk示す。
文字切り出し部6では、オペレータが設定した文字列方
向(認識対象領域Qの場合は横)を用いて認識対象領域
Qの文字部を形成する画素の縦方向のヒストグラムH,
2求め、ヒストグラムH,11の値が1画素以上である
文字部の開始座標131・’s2と終了座標l。1・’
e2 から文字列座標(lsl。
181)・(182,1o2)を求め、文字列画像Li
切り出す。第4図(b)に文字列画像りを示す。次に、
文字列画像Li射影して文字部を形成する画素のヒスト
グラムH8を求め、ヒストグラムHCの値カ1画素以上
である文字部の開始・終了座標から1字1字の横方向の
座i (C,1,C,1) ・(Csi、C,、)−・
を求め、文字列座標と組合せて認識対象文字画像全1字
ずつ切り出す。
認識部7には切り出された認識対象文字の矩形Rが頑次
入力される。第5図(a) K切り出された認識対象文
字「文」全示す。切り出したr文」の各画素について、
第5図中)の矢印が示す方向に着目画素を含んでM個以
上(Mはあらかじめ設定)連っているか否かを調べ方向
コードを設定する。方向コード毎に各画素の連結性を調
べてストロークを抽出し、ストロークの数・位置・長さ
等の特徴量を抽出する。第6図(a)に認識対象文字「
文」のストローク抽出結果を示す。抽出した特徴量全辞
書8に登録されている文字の特徴量と照合し、最も似た
文字「文」を認識候補文字として表示部3に表示する。
発明の効果 本発明によれば、入力画像の認識対象領域を認識対象領
域内の1点で指定し、指定された1点を含む認識対象領
域を決定することにより、帳票のように既に枠等で認識
対象領域の候補領域が示されている文書に関して、簡易
な方法で認識対象領域を指定し、自動的に認識対象領域
全決定することが可能となる。
【図面の簡単な説明】
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像及び認識対象領域指定方法の
説明図、第3図は認識対象領域決定方法の説明図、第4
図は文字切り出し方法の説明図、第5図は文字認識方法
の説明図である。 1・・・・・・画像入力部、2・・・・・画像メモリ、
3・・・・表示部、4・・・・・認識対象領域指定部、
5・・・・・認識対象領域決定部、6・・・・文字切り
出し部、7・・・・・認識部、8・・・・・・辞書。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第 4 図 見S          エe (σ)(b) 第5図 Cs+    Cer tb)

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力部で入力された画像の認識対象領域を認識対象
    領域内の1点で指定する認識対象領域指定部と、前記認
    識対象領域指定部で指定された1点を含む認識対象領域
    を決定する認識対象領域決定部と、前記認識対象領域決
    定部で決定された認識対象領域から認識対象文字を切り
    出す文字切り出し部と、前記文字切り出し部で切り出さ
    れた認識対象文字を辞書と照合することにより認識候補
    文字を抽出する認識部を有することを特徴とする文字認
    識装置。
JP61182162A 1986-08-01 1986-08-01 文字認識装置 Expired - Fee Related JP2661898B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61182162A JP2661898B2 (ja) 1986-08-01 1986-08-01 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61182162A JP2661898B2 (ja) 1986-08-01 1986-08-01 文字認識装置

Publications (2)

Publication Number Publication Date
JPS6337487A true JPS6337487A (ja) 1988-02-18
JP2661898B2 JP2661898B2 (ja) 1997-10-08

Family

ID=16113436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61182162A Expired - Fee Related JP2661898B2 (ja) 1986-08-01 1986-08-01 文字認識装置

Country Status (1)

Country Link
JP (1) JP2661898B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0259880A (ja) * 1988-08-25 1990-02-28 Nec Corp 文書読取装置
JPH02187883A (ja) * 1989-01-13 1990-07-24 Mitsubishi Electric Corp 文書読取装置
JPH03280410A (ja) * 1990-03-28 1991-12-11 Nichicon Corp 電力用高圧コンデンサ
JP2001092838A (ja) * 1999-09-22 2001-04-06 Toshiba Corp マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体
JP2002288178A (ja) * 2001-03-23 2002-10-04 Toshiba Corp マルチメディア情報収集管理装置およびプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57137970A (en) * 1981-02-18 1982-08-25 Ricoh Co Ltd Picture area designating method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57137970A (en) * 1981-02-18 1982-08-25 Ricoh Co Ltd Picture area designating method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0259880A (ja) * 1988-08-25 1990-02-28 Nec Corp 文書読取装置
JPH02187883A (ja) * 1989-01-13 1990-07-24 Mitsubishi Electric Corp 文書読取装置
JPH03280410A (ja) * 1990-03-28 1991-12-11 Nichicon Corp 電力用高圧コンデンサ
JP2001092838A (ja) * 1999-09-22 2001-04-06 Toshiba Corp マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体
JP2002288178A (ja) * 2001-03-23 2002-10-04 Toshiba Corp マルチメディア情報収集管理装置およびプログラム

Also Published As

Publication number Publication date
JP2661898B2 (ja) 1997-10-08

Similar Documents

Publication Publication Date Title
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
KR900007009B1 (ko) 문자인식장치
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JPH02264386A (ja) 表認識方法
JPS6337487A (ja) 文字認識装置
US5563964A (en) Method and apparatus for processing a plurality of designated areas of an image
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP4164976B2 (ja) 文字認識装置
JP2537973B2 (ja) 文字認識装置
JPH06162106A (ja) 電子ファイリングシステム
JPH0363882A (ja) 画像処理装置
JP2004213215A (ja) 画像入力方法及び画像入力装置
JPH083829B2 (ja) 文字認識方法
JPS63229586A (ja) 文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JPH07160814A (ja) 光学式文字認識方法
JPH05128302A (ja) 文字認識方法及びその装置
KR940009749B1 (ko) 글자 분할 방법
JPH08137987A (ja) 光学式文字読取装置
JPS6269383A (ja) 文字認識装置
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPH02187883A (ja) 文書読取装置
JPH0927008A (ja) 文字認識装置及び方法
JPH0927007A (ja) 文字認識装置及び方法
JPS63221495A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees