JPS6337488A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS6337488A
JPS6337488A JP61182161A JP18216186A JPS6337488A JP S6337488 A JPS6337488 A JP S6337488A JP 61182161 A JP61182161 A JP 61182161A JP 18216186 A JP18216186 A JP 18216186A JP S6337488 A JPS6337488 A JP S6337488A
Authority
JP
Japan
Prior art keywords
image
area
picture
input
recognition target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61182161A
Other languages
English (en)
Other versions
JPH083829B2 (ja
Inventor
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61182161A priority Critical patent/JPH083829B2/ja
Publication of JPS6337488A publication Critical patent/JPS6337488A/ja
Publication of JPH083829B2 publication Critical patent/JPH083829B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字および手書き文字を認識
し、たとえばJISコード等の情報lに変換する文字認
識装置に関するものである。
従来の技術 従来の文字認識装置では、入力された画像を表示し、オ
ペレータがマウス等を用いて設定した認識対象領域につ
いて認識を行っていた。また、他の文字認識装置では、
画像入力部から入力する原画像自体にカラーペン等を用
いてマークを付し、マークを認識することにより、自動
的に認識対象領域を抽出していた。(例えば、長谷他”
マークを用いた印刷文書画像の領域抽出法”信学技報V
o1.83 j1M308 PRL8378 )発明が
解決しようとする問題点 しかしながら、オペレータが認識対象領域を設定したり
、原画像にマークを付して認識対象領域を抽出する従来
の技術では、例えば帳票のような定形文書の特定部分を
何枚も認識する場合、オペレータが帳票1枚毎に認識対
象領域を指定するという煩雑な作業を必要とした。
本発明はかかる点に鑑みてなされたものであり、定形文
書の特定部分を何枚も認識する場合、簡易な方法で入力
画像の位置ずれを検出し自動的に認識対象領域を抽出す
ることができる文字認識装置を提供することを目的とし
ている。
問題点を解決するだめの手段 本発明は前記問題点を解決するために、入力画像を縦に
M画素幅のブロックに区切り、各ブロックから抽出した
縦方向の画像開始位置と、入力画像を横にN画素幅のブ
ロックに区切り、各ブロックから抽出した横方向の画像
開始位置を用いて入力画像の2次元基準座標系を求める
画像位置検出部と、前記画像位置検出部で求めた入力画
像の2次元基準座標系における認識対象領域の相対位置
を設定し記憶する領域設定部と、前記画像位置検出部で
求めた入力画像の2次元基準座標系と前記領域設定部に
記憶している認識対象領域の相対位置を用いて認識対象
領域を切り出す領域切り出し部を備えた文字認識装置で
ある。
作  用 本発明は前記した技術的手段により、入力画像の位置ず
れを検出して高速かつ自動的に入力画像の認識対象領域
を抽出することが可能となる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査し2値信号で画像メモリ2に格納する。3は
画像位置検出部であわ、画像メモリ2を走査して入力画
像の2次元基準座標系を求める。4は領域設定部であり
、オペレータが入力画像内の認識対象領域を指定し、画
像位置検出部3で求めた入力画像の2次元基準座標系に
おける認識対象領域の相対位置を抽出し記憶する。
5は領域切り出し部であり、画像位置検出部3で求めた
入力画像の2次元基準座標系と領域設定部4で設定し記
憶している認識対象領域の相対位置を用いて画像メモリ
2から認識対象領域を切り出す。6は文字切り出し部で
あり、オペレータが設定した文字列方向を用いて領域切
り出し部6で切り出した認識対象領域から文字列さらに
1字ずつ認識対象文字を切り出す。7は認識部であり、
文字切り出し部6で切り出した認識対象文字のストロー
ク等の特徴量を求め、あらかじめ辞書8に登録されてい
る文字の特徴量と照合し最も似た文字を認識候補文字と
し、表示部9に表示する。
以上のように構成された文字認識装置について、第2図
に示す入力画像Pと第5図に示す入力画像Pを例に説明
する。
画像入力部1から入力された画像Pは文字部1、白部0
の2値データで画像メモリ2に蓄えられる。
画像位置検出部3で、画像メモリ2に蓄えられている入
力画像Pを縦にm画素幅のブロックBv1゜Bv2・・
・Bvi・・・に区切り、各ブロックBvi(i=1.
2.・・・)を横方向に走査してヒストグラムHvi 
(i=1 、礼・・・)を求め、ヒストグラムHvi(
i=1.2.・・・)の値が初めて1画素以上になるY
座標値で示される各ブロックの画像開始位置Yi(i=
1.2.・・・)を求める。第2図にブロックBv2畢
ヒストグラムHv2・ブロックBY2  の画像開始位
置Y2及び全ブロックの画像開始位置の抽出結果Y2.
Y3.Y4.ys、Ye、Y7を示す。
ここでYlはブロックBv1に文字部が存在しないため
値をもたない。第2図中のX−Y座標系は絶対座標系で
ある。同様にして入力画像Pを横にn画素幅のブロック
Bh1.Bh2・・・Bhj・・・に区切り、各ブロッ
クBhj(j=1,2.・・・)を縦方向に走査してヒ
ストグラムHh] (]=’−21・・・)を求め、ヒ
ストグラムHhj (j=1 、2.・・・)の値が初
めて1画素以上になるX座標値で示される各ブロックの
画像開始位置Xi (j=1 、2.・・・)を求める
。第3図にブロックBh2・ヒストグラムHh2・ブロ
ックBh2の画像開始位置x2及び全ブロックの画像開
始位置の抽出結果X1.X2.X3.Xa、Xs。
Xe、X7を示す。ここでxaはプClツクBh8に文
字部が存在しないため値をもたない。第3図中のX−Y
座標系は絶対座標系である。このようにして抽出した各
ブロックの画像開始位置Yi(i==1λ・・・)。
xj(j=1,2.・・・)及びブロック幅m、nを用
いて、次式により絶対座標系X−Yにおける入力画像P
の位置(ΔX、ΔY、ΔO)を求め、入力画像Pの2次
元基準座標系x−7を求める。(ΔX、ΔY)は入力画
像Pの2次元基準座標系X −7の原点の絶対座標で、
A0は座標軸の絶対座標軸に対する回転角である。
ΔY==tano−ΔX十(Yi−tanO−m)  
・=(2)j−1 ΔX==−tano−JY+(Xj+tanO・−n)
  ・・(3)ここで、式(1)におけるYi+1 、
 Yiの組は両方共値を持つ場合に成立し、ki は成
立した個数である。
Xj+1. XjO組及びJ  についても同様である
また、式(2)(3)におけるYi、Xj は、値を持
つブロック開始位置の中から選んだものである。
第4図に入力画像Pの位置及び2次元基準座標系X −
7の抽出結果を示す。
第4図に示す様に、領域設定部4で文書Pが入力された
場合は、新しい形体のオペレータが認識対象文字を含む
認識対象領域Qを矩形で指定する。
指定された認識対象領域QのX−Y絶対座標系における
位置A1(xal、Yal)、A2(Ya2.Ya2)
A3(Ya3.Ya3)、A4(Ya4.Ya4)と、
画像位置検出部3で求めた入力画像Pの位置(ΔX、Δ
Y。
A0)から、2次元基準座標系X −7における認識対
象領域Qの相対位置a 1 (xal、 yal)、 
a 2(”A2. ya2L A3(”A3. ya3
L ”(”A4. Ya4)を次式によシ算出し記憶す
る。
xa=coaΔo−(xa−ΔX)+sinΔO・(Y
a−ΔY)  (4)ya=−sinΔo−(xa−Δ
X)+cosΔo、(ya−ΔY)  (5)次に、入
力画像Pと同一形体で同一部分を認識する画像P′が入
力された場合、画像位置検出部3で入力画像Pの位置(
Δf、ΔY′、Δd)及び2次元基準座標系X−7を求
める。
第5図に入力画像Pの位置及び2次元基準座標系x −
yの抽出結果を示す。
領域切シ出し部5では、画像位置検出部3で求めた入力
画像P′の位置(Δf、Δf、Δ0′)と領域設定部4
に記憶されている2次元基準座標系X −7における認
識対象領域Qの相対位置” ’ (”al、 yal 
)ta2(”A2. Ya2)・ A3(”A3. Y
a3)・a’(”A4. Ya4)を用いて、認識対象
領域Qの絶対座標系X−Yにおける位置A 1’ (f
、1.Y’a1) 、 A 2’(f、、 y’、、)
 。
A3′(ya3.Y′a3)、A4′(xa4Y−4)
を次式によυ求め、認識対象領域Qを切り出す。
X””GoltΔO−x  −5inΔo、y  +Δ
x・・・(6)a             a   
          aY==sinΔO−x  +c
otaΔO−7−ΔY   −(7)a       
      a             a第6図a
に切り出された認識対象領域dを示す。
文字切り出し部6では、オペレータが設定した文字列方
向(認識対象領域dの場合は横)を用いて認識対象領域
Qの文字部を形成する画素の縦方向のヒストグラムHl
 を求め、ヒストグラムHzの値が1画素以上である文
字部の開始アドレス’81・l と終了アドレスe。1
・Ya2  から文字列アドレス(’81. lel 
) ” (”82.1e2)を求め、文字列画像りを切
り出す。第6図すに文字列画像りを示す。
次に、文字列画像りを射影して文字部を形成する画素の
ヒストグラムH6を求め、ヒストグラムH6の値が1画
素以上である文字部の開始・終了アドレスから1字1字
の横方向のアドレス(Cs1 、 Ce1 )・・・(
Csi、Ce1)・・・を求め、文字列アドレスと組合
せて認識対象文字画像を1字ずつ切り出す。
認識部7には切り出された認識対象文字の矩形Rが順次
入力される。第7図aに切り出された認識対象文字「文
」を示す。切り出した「文」の各画素について、第7図
すの矢印が示す方向に着目画素を含んでM個以上(Mは
あらかじめ設定)連っているか否かを調べ方向コードを
設定する。方向コード毎に各画素の連結性を調べてスト
ロークを抽出し、ストロークの数・位置・長さ等の特徴
量を抽出する。第7図aに認識対象文字「文」のストロ
ーク抽出結果を示す。抽出した特徴量を辞書8に登録さ
れている文字の特徴量と照合し、最も似た文字「文」を
認識候補文字として表示部9に表示する。
以上のような文字認識装置では、新しい形体の文書が入
力された時だけオペレータが認識対象領域を指定するこ
とにより、以降同一形体の文書が入力されれば、その都
度認識対象領域を設定することなく簡易な方法で自動的
に入力画像の位置ずれを検出して認識対象領域を抽出し
、認識を行う。
発明の効果 本発明によれば、入力画像を縦にM画素幅のブロックに
区切り、各ブロックから抽出した縦方向の画1象開始位
置と、入力画像を横にN画素幅のブロックに区切り、各
ブロックから抽出した横方向の画像開始位置を用いて入
力画像の2次元基準座標系を求め、入力画像の2次元基
準座標系における認識対象領域の相対位置を設定し記憶
する手段を備えることにより、入力画像の位置ずれを検
出して高速かつ自動的に認識対象領域を抽出することが
可能となる。
【図面の簡単な説明】
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像P及び入力画像Pの縦方向の
画像開始位置抽出方法の説明図、第3図は入力画像Pの
横方向の画像開始位置抽出方法の説明図、第4図は入力
画像Pの位置と2次元基準座標系の抽出結果及び認識対
象領域の相対位置抽出方法の説明図、第5図は入力画像
P及び入力画像P′の位置と2次元基準座標系の抽出結
果と認識対象領域抽出方法の説明図、第6図は文字切り
出し方法の説明図、第7図は文字認識方法の説明図であ
る。 1・・・・・・画像入力部、2・・・・・・画像メモリ
、3・・・・・・画像位置検出部、4・・・・・・領域
設定部、5・・・・・・領域切り出し部、6・・・・・
・文字切り出し部、7・・・・・・認識部、8・・・・
・・辞書、9・・・・・・表示部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 Elv2  Hv2 第3図 ↑ 第6図 (b)            1 区    工 第7図 」 ; csl        Ce1 1.5t 2e+

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力部で入力された画像を縦にM画素幅のブロック
    に区切り、各ブロックから抽出した縦方向の画像開始位
    置と、前記画像入力部で入力された画像を横にN画素幅
    のブロックに区切り、各ブロックから抽出した横方向の
    画像開始位置を用いて入力画像の2次元基準座標系を求
    める画像位置検出部と、前記画像位置検出部で求めた入
    力画像の2次元基準座標系における認識対象領域の相対
    位置を設定し記憶する領域設定部と、前記画像位置検出
    部で求めた入力画像の2次元基準座標系と前記領域設定
    部に記憶している認識対象領域の相対位置を用いて認識
    対象領域を切り出す領域切り出し部と、前記領域切り出
    し部で切り出された認識対象領域から認識対象文字を切
    り出す文字切り出し部と、前記文字切り出し部で切り出
    された認識対象文字を辞書と照合することにより認識候
    補文字を抽出する認識部を有することを特徴とする文字
    認識装置。
JP61182161A 1986-08-01 1986-08-01 文字認識方法 Expired - Lifetime JPH083829B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61182161A JPH083829B2 (ja) 1986-08-01 1986-08-01 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61182161A JPH083829B2 (ja) 1986-08-01 1986-08-01 文字認識方法

Publications (2)

Publication Number Publication Date
JPS6337488A true JPS6337488A (ja) 1988-02-18
JPH083829B2 JPH083829B2 (ja) 1996-01-17

Family

ID=16113419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61182161A Expired - Lifetime JPH083829B2 (ja) 1986-08-01 1986-08-01 文字認識方法

Country Status (1)

Country Link
JP (1) JPH083829B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997005561A1 (fr) * 1995-07-31 1997-02-13 Fujitsu Limited Processeur de supports et procede de traitement de supports
CN100367288C (zh) * 1995-07-31 2008-02-06 富士通株式会社 数据媒体处理装置及数据媒体处理方法
CN107622233A (zh) * 2017-09-11 2018-01-23 畅捷通信息技术股份有限公司 一种表格识别方法、识别系统及计算机装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60220479A (ja) * 1984-04-17 1985-11-05 Fujitsu Ltd 文字位置検出回路

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60220479A (ja) * 1984-04-17 1985-11-05 Fujitsu Ltd 文字位置検出回路

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997005561A1 (fr) * 1995-07-31 1997-02-13 Fujitsu Limited Processeur de supports et procede de traitement de supports
US6501864B1 (en) 1995-07-31 2002-12-31 Fujitsu Limited Data medium handling apparatus and data medium handling method
US6567546B1 (en) 1995-07-31 2003-05-20 Fujitsu Limited Data medium handling apparatus medium handling method
CN100367288C (zh) * 1995-07-31 2008-02-06 富士通株式会社 数据媒体处理装置及数据媒体处理方法
CN107622233A (zh) * 2017-09-11 2018-01-23 畅捷通信息技术股份有限公司 一种表格识别方法、识别系统及计算机装置

Also Published As

Publication number Publication date
JPH083829B2 (ja) 1996-01-17

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH07141463A (ja) 2値画像内の機械印刷された金額の検出方法
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
KR970017047A (ko) 문서 화상으로부터의 타이틀 추출 장치 및 방법
JP2002324236A5 (ja)
JPH05233873A (ja) 領域分割方法
JPS6337488A (ja) 文字認識方法
JP3600380B2 (ja) 画像処理方法及びファクス文字認識装置
JPH0991453A (ja) 画像処理方法およびその装置
JP2661898B2 (ja) 文字認識装置
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JPH0728935A (ja) 文書画像処理装置
JP7532124B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2007249580A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
JP2537973B2 (ja) 文字認識装置
JP3133797B2 (ja) 文字認識方法及びその装置
JPH01137385A (ja) 文字認識装置
JPH05274472A (ja) 画像認識装置
JPH07160814A (ja) 光学式文字認識方法
KR20160122033A (ko) 픽셀 방향정보를 사용한 영상정보 내 패턴정보영역 검출방법
JPH0573718A (ja) 領域属性識別方式
JPH0644406A (ja) 画像処理方法及び装置
JPH04156694A (ja) 文字認識方式
JPS63253488A (ja) 文字切出し方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term