JPS6269383A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6269383A
JPS6269383A JP60209178A JP20917885A JPS6269383A JP S6269383 A JPS6269383 A JP S6269383A JP 60209178 A JP60209178 A JP 60209178A JP 20917885 A JP20917885 A JP 20917885A JP S6269383 A JPS6269383 A JP S6269383A
Authority
JP
Japan
Prior art keywords
image
character
recognition target
recognition
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60209178A
Other languages
English (en)
Inventor
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60209178A priority Critical patent/JPS6269383A/ja
Publication of JPS6269383A publication Critical patent/JPS6269383A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字および手書き文字を認識
し、たとえばJISコード等の情報量に変換する文字認
識装置に関するものである。
従来の技術 従来の文字認識装置では、入力された画像を表示し、オ
ペレータがマウス等を用いて設定した認識対象領域につ
いて認識を行っていた。また、他の文字認識装置では、
画像入力部から入力する原画像自体にカラーペン等を用
いてマークを付し、マークを認識することにより、自動
的に認識対象領域を抽出していた。(例えば、長谷他′
マークを用いた印刷文書画像の領域抽出法“信学技報V
O1,83&308  PRL83−78)発明が解決
しようとする問題点 しかしながら、オペレータが認識対象領域を設定したシ
、原画像にマークを付して認識対象領域を抽出する従来
の技術では、例えば帳票のような定形文書の特定部分を
何枚も認識する場合、オペレータが帳票1枚毎に認識対
象領域を指定するという煩雑な作業を必要とした。
本発明はかかる点に鑑みてなされたものであり、定形文
書の特定部分を何枚も認識する場合、簡易な方法で入力
画像の位置ずれを検出し自動的に認識対象領域を抽出す
ることができる文字認識装置を提供することを目的とし
ている。
問題点を解決するための手段 本発明は前記問題点を解決するため、入力画像を縦方向
・横方向に走査して文字部を形成する画素のヒストグラ
ムを求め、ヒストグラムから入力画像の2次元基準座標
系を求める手段と、あらかじめ設定されている認識対象
領域の相対位置と入力画像の2次元基準座標系から、自
動的に入力画像の認識対象領域を抽出する手段を備えて
いる。
作用 本発明は前記した技術的手段によシ、入力画像の位置ず
れを検出して高速かつ自動的に入力画像の認識対象領域
を抽出することが可能となる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は5本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査し2値信号で画像メモリ2に格納する。3は
画像位置検出部であり1画像メモリ2を走査して入力画
像の2次元基準座標系を求める。4は領域設定部でオシ
、オペレータが入力画像内の認識対象領域を指定し、画
像位置検出部3で求めた入力画像の2次元基準座標系に
おける認識対象領域の相対位置を抽出し記憶する。
Bは領域切り出し部であシ、画像位置検出部3で求めた
入力画像の2次元基準座標系と領域設定部4で設定し記
憶している認識対象領域の相対位置を用いて画像メモリ
2から認識対象領域を切り出す。6は文字切り出し部で
あシ、オペレータが設定した文字列方向を用いて領域切
り出し部6で切り出した認識対象領域から文字列さらに
1字ずつ認識対象文字を切り出す。7は認識部であり、
文字切り呂し部6で切り出した認識対象文字のストロー
ク等の特徴量を求め、あらかじめ辞書8に登録されてい
る文字の特徴量と照合し最も似た文字を認識候補文字と
し、表示部9に表示する。
以上のように構成された文字認識装置について、第2図
に示す入力画像Pを例に説明する。
画像入力部1から入力された画像Pは文字部1、白部0
の2値データで画像メモリ2に蓄えられる。
まず画像位置検出部3で画像メモリ2に蓄えられている
入力画像Pを走査して、入力画像全体における文字部を
形成する画素の縦方向のヒストグラムH,と横方向のヒ
ストグラムHhを求めると第2図に示す様になる。第2
図中のX−Y座標系は絶対座標系である。ヒストグラム
HvO値が初めて1画素以上になるY座標値YOとヒス
トグラムHhの値が初めて1画素以上になるX座標値x
を求め入力画像Pの基準点とし、(Xo、Yo)を原点
とした入力画像Pの2次元基準座標系x −yを設定す
る。
領域設定部4では、第3図に示す様に、新しい形体の文
書が入力された場合、オペレータが認識対象文字を含む
認識対象領域Qを矩形で指定する。
指定された認識対象領域qのX−Y絶対座標糸における
開始・終了座標値(Xis 、 Yis )・(X工e
Yie )を求め、画像位置検出部3で求めた入力画像
Pの基準点xOr YOから2次元基準座標系X−yに
おける認識対象領域Qの相対開始・終了座標値(Xis
 、 Yis )・(X工e 、 7ie )を算出し
記憶する。(Xis + yis )・(Xis 、 
Yie )は次式により求まる。
Xis = Xis −Xo           (
1)Yis = Yis −Yo          
 (2)Xie = Xie   Xo       
    (3)yia = Yie −Yo     
      (4)領域切り出し部6では、画像位置検
出部3で求めた入力画像Pの基準点xo−Yoと領域設
定部4に記憶されている2次元基準座標糸x−yにおけ
る認識対象領域Qの相対開始・終了座標値(Xis 。
7is ) ・(Xie 、 yie )を用いて、認
識対象領域Qの絶対座標糸X−Yにおける開始・終了座
標(Xis 、 Yis ) ・(Xis 、 Yie
 )を求め、認識対象領域Qを切り出す。(Xis +
 Yis ) ・(Xie 。
Yie )は次式によシ求まる。
Xis = Xo + Xis          (
5)Yis = Yo + ViS(6) Xis = Xo + Xie          (
力Yie = Ya + Tie          
(8)同様にして、入力画像Pと同一形体で同一部分を
認識する画像P′が入力された場合、ヒストグラムHv
/及びHh’から入力画像P′の基準点xo′・Yo′
を求め、あらかじめ画像領域設定部4に記憶されている
認識対象領域Qの相対座標値()Cis 、 yis)
・(Xis + Tie )を用いて式(5) 、 (
6) 、 (7) 、 (8)より入力画像P′の認識
対象領域Q′の絶対座標系X−Yにおける開始・終了座
標(X’=s * Y’is ) ・(X’ie 。
y /iθ)を求め、認識対象領域Q′を切り出す。
第4図(&)に切り出された認識対象領域Qを示す。
文字切り出し部6では、オペレータが設定した文字列方
向(認識対象領域Qの場合は横)を用いて認識対象領域
Qの文字部を形成する画素の縦方向のヒストグラムHg
を求め、ヒストグラムH7Iの値が1画素以上である文
字部の開始アドレスls+・652と終了アドレスA6
1・7!e2がら文字列アドレス(ls+、Ile+ 
) ・(lsz、Aez)を求め、文字列画像りを切り
出す。第4図中)に文字列画像りを示す。次に、文字列
画像りを射影して文字部を形成する画素のヒストグラム
Hcを求め、ヒス11”ラムHcO値が1画素以上であ
る文字部の開始・終了アドレスから1字1字の横方向の
アドレス(Cs+ + 0e1) −・” (Csi 
、 Cei )・−・・を求め、文字列アドレスと組合
せて認識対象文字画像を1字ずつ切り出す。
認識部7には切り出された認識対象文字の矩形Rが順次
入力される。第6図(IL)に切り出された認識対象文
字「松」を示す。切り出した「松」の各画素について、
第6図(b)の矢印が示す方向に着目画素を含んでM個
以上(Mはあらかじめ設定)連っているか否かを調べ方
向コードを設定する。方向コード毎に各画素の連結性を
調べてストロークを抽出し、ストロークの数・位置・長
さ等の特徴量を抽出する。第5図(1L)に認識対象文
字「松」のストローク抽出結果を示す。抽出した特徴量
を辞書8に登録されている文字の特徴量と照合し、最も
似た文字「松」を認識対象文字として表示部9に表示す
る。
以上のような文字認識装置では、新しい形体の文書が入
力された時だけオペレータが認識対象領域を指定するこ
とにより、以降同一形体の文書が入力されれば、その都
度認識対象領域を設定することなく簡易な方法で自動的
に入力画像の位置ずれを検出して認識対象領域を抽出し
、認識を行う。
発明の効果 本発明によれば、入力画像を縦方向・横方向に走査して
文字部を形成する画素のヒストグラムを求め、ヒストグ
ラムから入力画像の2次元基準座標系を求める手段と、
あらかじめ設定されている認識対象領域の相対位置と入
力画像の2次元基準座標系から、自動的に入力画像の認
識対象領域を抽出する手段を備えることによシ、入力画
像の位置ずれを検出して高速かつ自動的に認識対象領域
を抽出することが可能となる。
【図面の簡単な説明】
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像及び入力画像における2次元
基準座標系の抽出方法の説明図。 第3図は認識対象領域の相対位置抽出方法の説明図、第
4図は文字切り出し方法の説明図、第5図は文字認識方
法の説明図である。 1・・・・・・画像入力部、2・川・・画像メモリ、3
・・・・・・画像位置検出部、4・・・・・・領域設定
部、5・曲・領域切り出し部、6曲り文字切り出し部、
7・・・・・・認識部、8・・・・・・辞書、9・曲・
表示部。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
図 第2図 第3図 Yび 第4図 第5図

Claims (1)

    【特許請求の範囲】
  1.  認識対象文字を含む画像を入力する画像入力部と、前
    記画像入力部で入力された画像を縦方向及び横方向に走
    査して文字部(線も含む)を形成する画素のヒストグラ
    ムを求め、ヒストグラムの値が最初にN画素以上になる
    位置を基準として入力画像の2次元基準座標系を求める
    画像位置検出部と、入力画像の2次元基準座標系におけ
    る認識対象領域の相対位置を設定し記憶する領域設定部
    と、前記画像位置検出部で求めた2次元基準座標系と前
    記領域設定部に記憶している認識対象領域の相対位置を
    用いて認識対象領域を切り出す領域切り出し部と、切り
    出された認識対象領域から認識対象文字を切り出す文字
    切り出し部と、切り出された認識対象文字を辞書と照合
    することにより認識候補文字を抽出する認識部を有する
    ことを特徴とする文字認識装置。
JP60209178A 1985-09-20 1985-09-20 文字認識装置 Pending JPS6269383A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60209178A JPS6269383A (ja) 1985-09-20 1985-09-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60209178A JPS6269383A (ja) 1985-09-20 1985-09-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6269383A true JPS6269383A (ja) 1987-03-30

Family

ID=16568624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60209178A Pending JPS6269383A (ja) 1985-09-20 1985-09-20 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6269383A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4966031A (ja) * 1972-10-28 1974-06-26

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4966031A (ja) * 1972-10-28 1974-06-26

Similar Documents

Publication Publication Date Title
EP0739521B1 (en) Method of splitting handwritten input
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
JP2713622B2 (ja) 表形式文書読取装置
KR970017047A (ko) 문서 화상으로부터의 타이틀 추출 장치 및 방법
JPH02264386A (ja) 表認識方法
JPS61188681A (ja) 文字認識装置
JP3728224B2 (ja) 文書処理装置及び方法
JP2661898B2 (ja) 文字認識装置
JPS6269383A (ja) 文字認識装置
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JPH083829B2 (ja) 文字認識方法
JP2537973B2 (ja) 文字認識装置
JPH0797390B2 (ja) 文字認識装置
JP3095470B2 (ja) 文字認識装置
JPH01137385A (ja) 文字認識装置
JPH0564396B2 (ja)
JP2734628B2 (ja) 文字認識装置
JPH0388085A (ja) 光学的文字読取装置
JPH0632079B2 (ja) 文字認識装置
JPH01181176A (ja) 文字認識装置
JPH02187883A (ja) 文書読取装置
JPH05274472A (ja) 画像認識装置
JPH0576671B2 (ja)
JPS61235990A (ja) 文字認識装置