JPS63271588A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS63271588A
JPS63271588A JP62105165A JP10516587A JPS63271588A JP S63271588 A JPS63271588 A JP S63271588A JP 62105165 A JP62105165 A JP 62105165A JP 10516587 A JP10516587 A JP 10516587A JP S63271588 A JPS63271588 A JP S63271588A
Authority
JP
Japan
Prior art keywords
recognition
character
character pattern
unit
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62105165A
Other languages
English (en)
Other versions
JPH07107700B2 (ja
Inventor
Yasushi Waki
康 脇
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62105165A priority Critical patent/JPH07107700B2/ja
Publication of JPS63271588A publication Critical patent/JPS63271588A/ja
Publication of JPH07107700B2 publication Critical patent/JPH07107700B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字及び手書き文字を認識し
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置(昭和61年度電子通信学会総合全
国大会予稿集1515)では文字切り出し部で文字を切
り出した後、文字認識部で認識対象文字パターンを認識
辞書と照合することにより認識候補文字を抽出し、認識
結果として出力していた。
発明が解決しようとする問題点 しかしながら上記のような構成では、文字切り出し結果
が誤っていた場合、誤った認識候補文字に対応する認識
対象文字パターンをオペレータが入力画像中で指定して
、再認識させなければならないという問題点を有してい
た。
本発明はかかる点に鑑み、認識部で認識候補文字を抽出
した後、再認識制御部において、サブ文字パターン抽出
部で得られたサブ文字パターンの組み合わせを変化させ
て新たに再認識対象文字パターンを決定し、再認識対象
文字パターンを認識部へ転送することにより再認識を行
なう文字認識装置を提供することを目的とする。
問題点を解決するための手段 本発明による文字認識装置は前記問題点を解決するため
、認識対象文字を含む画像を入力する画像入力部と、前
記画像入力部で入力された画像から認識対象となる文字
の集合である文字列を抽出する文字列抽出部部と、前記
文字列抽出部において抽出された文字列について文字の
構成要素であるサブ文字パターンを抽出するサブ文字パ
ターン抽出部と、前記サブ文字パターン抽出部において
得られたサブ文字パターンから認識対象文字パターンを
決定する認識対象文字パターン決定部と、前記認識対象
文字パターン決定部により得られた認識対象文字パター
ンの特徴を計算し前記特徴と予め辞書に格納されている
標準文字の特徴とを照合することにより認識候補文字を
決定する認識部と、前記認識部で得られた認識候補文字
を表示する表示部と、前記認識部で得られた認識候補文
字の中で選択された連続する認識候補文字に対応する認
識対象文字パターンを構成するサブ文字パターンの組み
合わせを変化させて再認識対象文字パターンを決定し前
記認識部に転送する再認識制御部で構成されている。
作用 本発明は前記の技術的手段により、認識部で得られた認
識候補文字が誤っていた場合、再認識を行うためサブ文
字パターンの組み合わせを変化させ再認識制御部で再認
識する対象を抽出するため、認識候補文字に対応する認
識対象文字パターンをオペレータが指示する必要がなく
なり、操作を敏速かつ正確に行うことができる。
実施例 本発明の実施例について図面を参照しながら説明する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字領域を
含む画像を走査して2値信号で画像を入力し画像メモリ
2に格納する。3は文字列抽出部であり、画像メモリ2
を走査して文字列を矩形で切り出す。4はサブ文字パタ
ーン抽出部であり、文字列切り出し部3で切り出した文
字列を列方向と垂直に走査して文字部のヒストグラムを
求め文字パターンの構成要素であるサブ文字パターンを
抽出する。5は認識対象文字パターン決定部であり、サ
ブ文字パターン抽出部4で抽出したサブ文字パターンに
ついて、サブ文字パターンの文字列に垂直な方向の幅、
位置、及びそのサブ文字パターンと隣接するサブ文字パ
ターンとの距離を考慮して独立した認識対象文字パター
ンを決定する。6は認識部であり、認識対象文字パター
ン決定部5で得られた各認識対象文字パターンのストロ
ーク等の特徴量を求め、予め辞書7に登録されている文
字の特徴量と照合し、最も似た文字を認識候補文字とす
る。8は表示部であり、認識部6で得られた認識候補文
字を表示する。9は再認識制御部であり、認識部6で得
られた認識候補文字の中で選択された連続する認識候補
文字に対応する認識対象文字パターンに含まれるサブ文
字パターンのすべての組み合わせを認識部6に転送する
以上のように構成された文字認識装置の動作について、
まず第2図に示すような画像を入力した場合を例に説明
する。
画像入力部1から入力された第2図に示すような画像は
2値化されて画像メモリ2に格納される。文字列切り出
し部3は画像メモリ2に蓄えられている入力画像から予
め絶対的な位置が決められている文字列を第3図(a)
に示すように幅W、高さHの矩形Rで切り出す。
次にサブ文字パターン抽出部4では、矩形Rで切りださ
れた文字列に対し、文字列方向に対し垂直に走査して文
字列のヒストグラムを第3図(b)に示すように求め、
連続する文字部により構成される文字パターンを切り出
し、各サブ文字パターンの幅wi(i=1.2.・・・
8)を求める。第3図(C)に切り出されたサブ文字パ
ターンp ml、 pm2.・・・、P$8を示す。
認識対象文字パターン決定部5では、サブ文字パターン
抽出部で抽出された各サブ文字パターンの中からサブ文
字パターンの幅WIと矩形Rで切り出した文字列の高さ
Hとを比較し、その最大値を基準値Aとする。例えば、
第3図(b)ではHが最大であり、基準値AはHとなる
。さらに隣接するサブ文字パターンを組み合わせ、サブ
文字パターン幅wiとサブ文字パターン間隔biが1Σ
wi+Σbi−A I≦α(α:定数)の条件を満たす
場合、隣接するサブ文字パターンを組み合わせて1つの
認識対象文字パターンとし、認識対象文字パターンP’
mP2*  ・・・、P6を第4図に示すように決定す
る。
認識部6では、認識対象文字パターン決定部で得られた
認識対象文字パターンPiについて、第5図(b)の矢
印が示す方向に着目画素を含んでM個以上連なっている
か否かを調べて着目画素に方向コードを付与し、方向コ
ード毎に画素の連結性を調べてストロークを抽出し、ス
トロークの数・位置・長さ等をn次元の特徴量fij(
J−1゜・・・、n)として抽出する。第5図(a)に
認識対象文字パターン「文」のストローク抽出結果を示
す。さらに、得られた認識対象文字パターンP1の特徴
量fijと予め貯えられている認識用辞M6の各文字C
kの特徴量ckjとの距離[)ikを[)ih=Σ1f
ij  ckjl により求め、Dikが小さいものを認識候補文字とする
表示部8は、画像メモリ2に格納されている2値画像と
認識対象文字パターン決定部5で得られた認識対象文字
パターンPiを含む矩形を第6図上段のように、認識部
6で得られた認識候補文字を第6図下段のように表示す
る。
ここで、第7図上段に示されるように認識対象文字パタ
ーン決定部5において切り出し誤りが生じた場合は、オ
ペレータが、切り出し誤りの生じた1言」、「た」、「
哉」という連続した認識候補文字を選択する。
再認識制御部9では、認識候補文字「言」。
「たJ+’哉」に対応する認識対象文字パターン中に含
まれるサブ文字パターンを抽出する。抽出されたサブ文
字パターンは、第8図におけるQS。
Q4.QS、QBである。次に、この4つのサブ文字パ
ターンのすべての組み合わせを再認識対象文字パターン
として認識部6に出力する。再認識制御部9で求められ
た再認識対象文字パターンを第9図に示す。
認識部6では、再認識制御部9で求められた再認識対象
文字パターンに対して認識処理を行ない認識候補文字を
表示部8へ転送し、表示部8では第10図のように表示
する。オペレータは、第10図の中から正しい認識候補
文字を選択することにより文字切り出しの訂正を行う。
発明の効果 本発明では、認識対象文字パターン決定部で文字の切り
出し誤りが生じた場合、再認識制御部においてサブ文字
パターンの組み合わせを変えることにより再認識対象文
字パターンを決定するので、オペレータが認識候補文字
に対応する認識対象文字パターンを探し出して指示する
必要がな(なり、文字切り出しの訂正を敏速に行える。
また、オペレータが誤って認識候補文字に対応しない認
識対象文字パターンを指定することもなくなるので、訂
正を正確に行える。したがって、本発明における文字認
識装置は、極めて産業上価値の高いものである。
【図面の簡単な説明】
第1図は本発明の一実施例に於ける文字認識装置の構成
図、第2図は入力画像の一例を示す説明図、第3図は本
発明の一実施例に於ける文字の切り出し方法を示す説明
図、第4図は本発明の一実施例に於ける文字切り出し方
法による文字切り出し結果の説明図、第5図は本発明の
一実施例に於ける特徴量の抽出方法を示す説明図、第6
図は本発明の一実施例に於いて表示部で表示された認識
候補文字の説明図、第7図は本発明の一実施例に於いて
誤切り出しを生じた場合の画像と切り出し結果と認識候
補文字の説明図、第8図は本発明の一実施例に於いて誤
切り出しを生じた場合のサブ文字パターンの説明図、第
9図は本発明の一実施例に於ける再認識制御部で得られ
た再認識対象文字パターンの説明図、第10図は本発明
の一実施例に於いて再認識を行って抽出された認識候補
文字の説明図である。 1・・・画像入力部、2・・・画像メモリ部、3・・・
文字列抽出部、4・・・サブ文字パターン抽出部、5・
・・認識対象文字パターン決定部、6・・・認識′部、
7・・・辞書、8・・・表示部、9・・・再認識制御部
。 代理人の氏名 弁理士 中尾敏男 ほか1名;s1図 第2図 第3図 (の        R (6〕 (C) Pal        Ps2.    AaPst 
  Fa、fPst      n’y     Ps
J第4図 第5図 ((IJ ←e〕 ■ 第6図 第7図 第8図 Q+   Qz  03  Q40. Q&Q7Qa第
9図 ケース5:  ロ] 園 ケース7 :  耳 同 ケース8 :  同【1口 第1θ図

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力部で入力された画像から認識対象となる文字の
    集合である文字列を抽出する文字列抽出部と、前記文字
    列抽出部において得られた文字列について文字の構成要
    素であるサブ文字パターンを抽出するサブ文字パターン
    抽出部と、前記サブ文字パターン抽出部において得られ
    たサブ文字パターンから認識対象文字パターンを決定す
    る認識対象文字パターン決定部と、前記認識対象文字パ
    ターン決定部により得られた認識対象文字パターンの特
    徴を計算し前記特徴と予め辞書に格納されている標準文
    字の特徴とを照合することにより認識候補文字を決定す
    る認識部と、前記認識部で得られた認識候補文字を表示
    する表示部と、前記認識部で得られた認識候補文字の中
    で選択された連続する認識候補文字に対応する認識対象
    文字パターンを構成するサブ文字パターンの組み合わせ
    を変化させて再認識対象文字パターンを決定し前記認識
    部に転送する再認識制御部を有することを特徴とする文
    字認識装置。
JP62105165A 1987-04-28 1987-04-28 文字認識装置 Expired - Fee Related JPH07107700B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62105165A JPH07107700B2 (ja) 1987-04-28 1987-04-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62105165A JPH07107700B2 (ja) 1987-04-28 1987-04-28 文字認識装置

Publications (2)

Publication Number Publication Date
JPS63271588A true JPS63271588A (ja) 1988-11-09
JPH07107700B2 JPH07107700B2 (ja) 1995-11-15

Family

ID=14400075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62105165A Expired - Fee Related JPH07107700B2 (ja) 1987-04-28 1987-04-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07107700B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02278392A (ja) * 1989-04-20 1990-11-14 Fuji Electric Co Ltd 文字認識装置
US11348331B2 (en) * 2020-03-10 2022-05-31 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59197971A (ja) * 1983-04-23 1984-11-09 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置
JPS59216285A (ja) * 1983-05-25 1984-12-06 Toshiba Corp 文字認識装置
JPS6111886A (ja) * 1984-06-28 1986-01-20 Mitsubishi Electric Corp 文字認識方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59197971A (ja) * 1983-04-23 1984-11-09 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置
JPS59216285A (ja) * 1983-05-25 1984-12-06 Toshiba Corp 文字認識装置
JPS6111886A (ja) * 1984-06-28 1986-01-20 Mitsubishi Electric Corp 文字認識方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02278392A (ja) * 1989-04-20 1990-11-14 Fuji Electric Co Ltd 文字認識装置
US11348331B2 (en) * 2020-03-10 2022-05-31 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
JPH07107700B2 (ja) 1995-11-15

Similar Documents

Publication Publication Date Title
US4813078A (en) Character recognition apparatus
US4903311A (en) Character region extracting method and apparatus capable of implementing the method
JPH05346970A (ja) 文書認識装置
JP2926066B2 (ja) 表認識装置
JPS63271588A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
KR950001061B1 (ko) 문서인식 수정장치
JPS6337487A (ja) 文字認識装置
JP2697790B2 (ja) 文字タイプ決定方法
JP2687902B2 (ja) 文書画像認識装置
JPS63229586A (ja) 文字認識装置
JPS63239569A (ja) 文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPS6219990A (ja) 文字認識装置
JPH04280393A (ja) 文字図形認識装置
JP3113712B2 (ja) 文字認識方法及びその装置
JPS6337490A (ja) 文字認識装置
JPH0514952B2 (ja)
JP3077580B2 (ja) 文字読取装置
JPH10143606A (ja) 文字認識装置および文字認識方法
JPH01201789A (ja) 文字読取装置
JPS63221495A (ja) 文字認識装置
JPH06119491A (ja) 帳票理解システム
JPS63229587A (ja) 文字認識装置
JPS63225883A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees