JPH083829B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH083829B2
JPH083829B2 JP61182161A JP18216186A JPH083829B2 JP H083829 B2 JPH083829 B2 JP H083829B2 JP 61182161 A JP61182161 A JP 61182161A JP 18216186 A JP18216186 A JP 18216186A JP H083829 B2 JPH083829 B2 JP H083829B2
Authority
JP
Japan
Prior art keywords
image
unit
recognition target
character
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61182161A
Other languages
English (en)
Other versions
JPS6337488A (ja
Inventor
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61182161A priority Critical patent/JPH083829B2/ja
Publication of JPS6337488A publication Critical patent/JPS6337488A/ja
Publication of JPH083829B2 publication Critical patent/JPH083829B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字および手書き文字を認
識し、たとえばJISコード等の情報量に変換する文字認
識方法に関するものである。
従来の技術 従来の文字認識装置では、入力された画像を表示し、
オペレータがマウス等を用いて設定した認識対象領域に
ついて認識を行っていた。また、他の文字認識装置で
は、画像入力部から入力する原画像自体にカラーペン等
を用いてマークを付し、マークを認識することにより、
自動的に認識対象領域を抽出していた。(例えば、長谷
他“マークを用いた印刷文書画像の領域抽出法”信学技
報Vol.83 No.308 PRL83−78) 発明が解決しようとする問題点 しかしながら、オペレータか認識対象領域を設定した
り、原画像にマークを付して認識対象領域を抽出する従
来の技術では、例えば帳票のような定形文書の特定部分
を何枚も認識する場合、オペレータが帳票1枚毎に認識
対象領域を指定するという煩雑な作業を必要とした。
本発明はかかる点に鑑みてなされたものであり、定形
文書の特定部分を何枚も認識する場合、簡易な方法で入
力画像の位置ずれを検出し自動的に認識対象領域を抽出
することができる文字認識方法を提供することを目的と
している。
問題点を解決するための手段 本発明は前記問題点を解決するために、入力画像を縦
にM画素幅のブロックに区切り、各ブロックから抽出し
た縦方向の画像開始位置と、入力画像を横にN画素幅の
ブロックに区切り、各ブロックから抽出した横方向の画
像開始位置を用いて入力画像の2次元基準座標系を求め
る画像位置検出部と、前記画像位置検出部で求めた入力
画像の2次元基準座標系における認識対象領域の相対位
置を設定し記憶する領域設定部と、前記画像位置検出部
で求めた入力画像の2次元基準座標系と前記領域設定部
に記憶している認識対象領域の相対位置を用いて認識対
象領域を切り出す領域切り出し部を備えた文字認識方法
である。
作用 本発明は前記した技術的手段により、入力画像の位置
ずれを検出して高速かつ自動的に入力画像の認識対象領
域を抽出することが可能となる。
実施例 以下、本発明の実施例について図面を参照しながら説
明する。
第1図は、本発明による文字認識方法を実現するため
の文字認識装置の一実施例の構成図である。1は画像入
力部であり、認識対象文字を含む画像を走査し2値信号
で画像メモリ2に格納する。3は画像位置検出部であ
り、画像メモリ2を走査して入力画像の2次元基準座標
系を求める。4は領域設定部であり、オペレータが入力
画像内の認識対象領域を指定し、画像位置検出部3で求
めた入力画像の2次元基準座標系における認識対象領域
の相対位置を抽出し記憶する。5は領域切り出し部であ
り、画像位置検出部3で求めた入力画像の2次元基準座
標系と領域設定部4で設定し記憶している認識対象領域
の相対位置を用いて画像メモリ2から認識対象領域を切
り出す。6は文字切り出し部であり、オペレータが設定
した文字列方向を用いて領域切り出し部5で切り出した
認識対象領域から文字列さらに1字ずつ認識対象文字を
切り出す。7は認識部であり、文字切り出し部6で切り
出した認識対象文字のストローク等の特徴量を求め、あ
らかじめ辞書8に登録されている文字の特徴量と照合し
最も似た文字を認識候補文字とし、表示部9に表示す
る。
以上のように構成された文字認識装置における文字認
識方法について、第2図に示す入力画像Pと第5図に示
す入力画像P′を例に説明する。
画像入力部1から入力された画像Pは文字部1、白部
0の2値データで画像メモリ2に蓄えられる。画像位置
検出部3で、画像メモリ2に蓄えられている入力画像P
を縦にm画素幅のブロックBv1,Bv2…Bvi…に区切り、
各ブロックBvi(i=1,2,…)を横方向に走査してヒス
トグラムHvi(i=1,2,…)を求め、ヒストグラムHvi
(i=1,2,…)の値が初めて1画素以上になるY座標値
で示される各ブロックの画像開始位置Yi(i=1,2,…)
を求める。第2図にブロックBv2・ヒストグラムHv2・ブ
ロックBv2の画像開始位置にY2及び全ブロックの画像開
始位置の抽出結果Y2,Y3,Y4,Y5,Y6,Y7を示す。ここでY1
はブロックBv1に文字部が存在しないため値をもたな
い。第2図中のX−Y座標系は絶対座標系である。同様
にして入力画像Pを横にn画素幅のブロックBh1,Bh2…
Bhj…に区切り、各ブロックBhj(j=1,2,…)を縦方向
に走査してヒストグラムHhj(j=1,2,…)を求め、ヒ
ストグラムHhj(j=1,2,…)の値が初めて1画素以上
になるX座標値で示される各ブロックの画像開始位置Xj
(j=1,2,…)を求める。第3図にブロックBh2・ヒス
トグラムHh2・ブロックBh2の画像開始位置にX2及び全ブ
ロックの画像開始位置の抽出結果X1,X2,X3,X4,X5,X6,X7
を示す。ここでX8はブロックBh8に文字部が存在しない
ため値をもたない。第3図中のX−Y座標系は絶対座標
系である。このようにして抽出した各ブロックの画像開
始位置Yi(i=1,2,…),Xj(j=1,2,…)及びブロッ
ク幅m,nを用いて、次式により絶対座標系X−Yにおけ
る入力画像Pの位置(ΔX,ΔY,Δθ)を求め、入力画像
Pの2次元基準座標系x−yを求める。(ΔX,ΔY)は
入力画像Pの2次元基準座標系x−yの原点の絶対座標
で、Δθは座標軸の絶対座標軸に対する回転角である。
ここで、式(1)におけるYi+1,Yiの組は両方共値を持
つ場合に成立し、kiは成立した個数である。Xj+1,Xjの
組及びkjについても同様である。また、式(2)(3)
におけるYi,Xjは、値を持つブロック開始位置の中から
選んだものである。
第4図に入力画像Pの位置及び2次元基準座標系x−
yの抽出結果を示す。
第4図に示す様に、領域設定部4で新しい形体の文書
Pが入力された場合は、オペレータが認識対象文字を含
む認識対象領域Qを矩形で指定する。指定された認識対
象領域QのX−Y絶対座標系における位置A1(Xa1
Ya1),A2(Xa2,Ya2),A3(Xa3,Ya3),A4(Xa4,Ya4
と、画像位置検出部3で求めた入力画像Pの位置(ΔX,
ΔY,Δθ)から、2次元基準座標系x−yにおける認識
対象領域Qの相対位置a1(xa1,ya1),a2(xa2,ya2),
a3(xa3,ya3),a4(xa4,ya4)を次式により算出し記
憶する。
xa=cosΔθ・(Xa−ΔX)+sinΔθ・(Ya−ΔY)
(4) ya=−sinΔθ・(Xa−ΔX)+cosΔθ・(Ya−Δ
Y) (5) 次に、入力画像Pと同一形体で同一部分を認識する画
像P′が入力された場合、画像位置検出部3で入力画像
P′の位置(ΔX′,ΔY′,Δθ′)及び2次元基準
座標系x−yを求める。
第5図に入力画像P′の位置及び2次元基準座標系x
−yの抽出結果を示す。
領域切り出し部5では、画像位置検出部3で求めた入
力画像P′の位置(ΔX′,ΔY′,Δθ′)と領域設
定部4に記憶されている2次元基準座標系x−yにおけ
る認識対象領域Qの相対位置a1(xa1,ya1),a2(xa2
ya2),a3(xa3,ya3),a4(xa4,ya4)を用いて、認識
対象領域Q′の絶対座標系X−Yにおける位置A1′
(X′a1,Y′a1),A2′(X′a2,Y′a2),A3′
(X′a3,Y′a3),A4′(X′a4,Y′a4)を次式により
求め、認識対象領域Q′を切り出す。
X′=cosΔθ′・xa−sinΔθ′・ya+ΔX′ …
(6) Y′=sinΔθ′・xa+cosΔθ′・ya−ΔY′ …
(7) 第6図aに切り出された認識対象領域Q′を示す。文
字切り出し部6では、オペレータが設定した文字列方向
(認識対象領域Q′の場合は横)を用いて認識対象領域
Q′の文字部を形成する画素の縦方向のヒストグラムHl
を求め、ヒストグラムHlの値が1画素以上である文字部
の開始アドレスls1・ls2と終了アドレスle1・le2から文
字列アドレス(ls1,le1)・(ls2,le2)を求め、文字
列画像Lを切り出す。第6図bに文字列画像Lを示す。
次に、文字列画像Lを射影して文字部を形成する画素の
ヒストグラムHcを求め、ヒストグラムHcの値が1画素以
上である文字部の開始・終了アドレスから1字1字の横
方向のアドレス(Cs1,Ce1)…(Csi,Cei)…を求め、
文字列アドレスと組合せて認識対象文字画像を1字ずつ
切り出す。
認識部7には切り出された認識対象文字の矩形Rが順
次入力される。第7図aに切り出された認識対象文字
『文』を示す。切り出した『文』の各画素について、第
7図bの矢印が示す方向に着目画素を含んでM個以上
(Mはあらかじめ設定)連っているか否かを調べ方向コ
ードを設定する。方向コード毎に各画素の連結性を調べ
てストロークを抽出し、ストロークの数・位置・長さ等
の特徴量を抽出する。第7図aに認識対象文字『文』の
ストローク抽出結果を示す。抽出した特徴量を辞書8に
登録されている文字の特徴量と照合し、最も似た文字
「文」を認識候補文字として表示部9に表示する。
発明の効果 本発明によれば、画像入力部で入力された画像を縦に
M画素幅のブロックに区切り、各ブロックから抽出した
縦方向の画像開始位置と、画像入力部で入力された画像
を横にN画素幅のブロックに区切り、各ブロックから抽
出した横方向の画像開始位置を用いて入力画像の2次元
基準座標系を求める画像位置検出部と、画像位置検出部
で求めた入力画像の2次元基準座標系における認識対象
領域の相対位置を設定し記憶する領域設定部と、画像位
置検出部で求めた入力画像の2次元基準座標系と領域設
定部に記憶している認識対象領域の相対位置を用いて認
識対象領域を切り出す領域切り出し部とを備えることに
より、新規形体の文書が入力された時だけオペレータが
認識対象領域を指定することにより、以降、既存形体の
文書が入力されれば、その都度認識対象領域を設定する
ことなく簡易な方法で入力画像の位置ずれを検出して自
動的に認識対象領域を算出し、認識を行うことが可能と
なる。
【図面の簡単な説明】
第1図は本発明にによる文字認識方法を実現するための
文字認識装置の一実施例の構成図、第2図は入力画像P
及び入力画像Pの縦方向の画像開始位置抽出方法の説明
図、第3図は入力画像Pの横方向の画像開始位置抽出方
法の説明図、第4図は入力画像Pの位置と2次元基準座
標系の抽出結果及び認識対象領域の相対位置抽出方法の
説明図、第5図は入力画像P′及び入力画像P′の位置
と2次元基準座標系の抽出結果と認識対象領域抽出方法
の説明図、第6図は文字切り出し方法の説明図、第7図
は文字認識方法の説明図である。 1……画像入力部、2……画像メモリ、3……画像位置
検出部、4……領域設定部、5……領域切り出し部、6
……文字切り出し部、7……認識部、8……辞書、9…
…表示部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象文字を含む画像を入力する画像入
    力部と、 前記画像入力部で入力された画像を縦にM画素幅のブロ
    ックに区切り、各ブロックから抽出した縦方向の画像開
    始位置と、前記画像入力部で入力された画像を横にN画
    素幅のブロックに区切り、各ブロックから抽出した横方
    向の画像開始位置を用いて入力画像の2次元基準座標系
    を求める画像位置検出部と、 前記画像位置検出部で求めた入力画像の2次元基準座標
    系における認識対象領域の相対位置を設定し記憶する領
    域設定部と、 前記画像位置検出部で求めた入力画像の2次元基準座標
    系と前記領域設定部に記憶している認識対象領域の相対
    位置を用いて認識対象領域を切り出す領域切り出し部
    と、 前記領域切り出し部で切り出された認識対象領域から認
    識対象文字を切り出す文字切り出し部と、 前記文字切り出し部で切り出された認識対象文字を辞書
    と照合することにより認識候補文字を抽出する認識部と
    を用い、 新規形体の文書の場合に、前記画像入力部で、新規形体
    の文書を入力するステップと、前記画像位置検出部で、
    新規形体の文書の2次元基準座標系を求めるステップ
    と、前記領域設定部で、新規形体の文書の2次元基準座
    標系における認識対象領域の相対位置を設定し記憶する
    ステップとを有し、 前記新規形体の文書と同一形体で同一認識対象領域を認
    識する既存形体の文書の場合に、前記画像入力部で、既
    存形体の文書を入力するステップと、前記画像位置検出
    部で、既存形体の文書の2次元基準座標系を求めるステ
    ップと、前記領域切り出し部で、既存形体の文書の認識
    対象領域を切り出すステップと、前記文字切り出し部
    で、既存形体の文書の認識対象領域から認識対象文字を
    切り出すステップと、前記認識部で、既存形体の文書の
    認識対象文字の認識候補文字を抽出するステップとを有
    することを特徴とする文字認識方法。
JP61182161A 1986-08-01 1986-08-01 文字認識方法 Expired - Lifetime JPH083829B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61182161A JPH083829B2 (ja) 1986-08-01 1986-08-01 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61182161A JPH083829B2 (ja) 1986-08-01 1986-08-01 文字認識方法

Publications (2)

Publication Number Publication Date
JPS6337488A JPS6337488A (ja) 1988-02-18
JPH083829B2 true JPH083829B2 (ja) 1996-01-17

Family

ID=16113419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61182161A Expired - Lifetime JPH083829B2 (ja) 1986-08-01 1986-08-01 文字認識方法

Country Status (1)

Country Link
JP (1) JPH083829B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69638207D1 (de) 1995-07-31 2010-08-05 Fujitsu Ltd Prozessor und Verarbeitungsverfahren für Dokumente
CN100538724C (zh) * 1995-07-31 2009-09-09 富士通株式会社 数据媒体处理装置及数据媒体处理方法
CN107622233A (zh) * 2017-09-11 2018-01-23 畅捷通信息技术股份有限公司 一种表格识别方法、识别系统及计算机装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0648501B2 (ja) * 1984-04-17 1994-06-22 富士通株式会社 文字位置検出回路

Also Published As

Publication number Publication date
JPS6337488A (ja) 1988-02-18

Similar Documents

Publication Publication Date Title
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP2713622B2 (ja) 表形式文書読取装置
JPH083829B2 (ja) 文字認識方法
JP3600380B2 (ja) 画像処理方法及びファクス文字認識装置
JP2007041832A (ja) 差分画像抽出装置
JP2661898B2 (ja) 文字認識装置
JP2537973B2 (ja) 文字認識装置
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
JPS6269383A (ja) 文字認識装置
JPH0797390B2 (ja) 文字認識装置
JPH09259222A (ja) フォーマット認識装置及び文字読取り装置
JPH01137385A (ja) 文字認識装置
KR101901413B1 (ko) 필기 문서의 문자 인식 장치 및 방법
JPH05274472A (ja) 画像認識装置
JPH0664628B2 (ja) 文字認識装置
JPH0772903B2 (ja) 文字認識装置
JPH07160814A (ja) 光学式文字認識方法
JPH0576671B2 (ja)
JPS6219990A (ja) 文字認識装置
JPH07141462A (ja) 文書システム
JPH058670U (ja) 光学的文字読取装置
JPH0632079B2 (ja) 文字認識装置
JP2823350B2 (ja) マルチメディア入力装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term