JPH07302303A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07302303A
JPH07302303A JP6094827A JP9482794A JPH07302303A JP H07302303 A JPH07302303 A JP H07302303A JP 6094827 A JP6094827 A JP 6094827A JP 9482794 A JP9482794 A JP 9482794A JP H07302303 A JPH07302303 A JP H07302303A
Authority
JP
Japan
Prior art keywords
character
shaping
unit
pattern
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6094827A
Other languages
English (en)
Inventor
Makoto Kushima
真 久島
Koichi Higuchi
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6094827A priority Critical patent/JPH07302303A/ja
Publication of JPH07302303A publication Critical patent/JPH07302303A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字パタンがかすれたりつぶれたりしていて
も、他の文字との識別のために有効な特徴をあらわして
いる部位のみをその文字に適した方法で局所的に整形す
ることにより高精度な識別を行うことができる文字認識
装置を提供する。 【構成】 文字識別部3における識別部33から出力さ
れる候補文字のうち、必要なものについては整形部34
においてその特定部位のパタンをその文字に適した方法
で整形を行なった後、入力画像切り替え部31で入力画
像を切り替え整形後の画像データから再度特徴抽出を行
なうので特徴抽出の精度が向上し、文字認識の精度も向
上する。このとき光電変換の特性或は紙質または筆記の
状態等に応じて整形するための整形情報を指定可能な入
力部344を設けたことにより文字パタンの品質に柔軟
に対応したより高精度の文字認識が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は被読取り物に記載された
文書等の画像データに基づいて文字を認識する文字認識
装置に関するものである。
【0002】
【従来の技術】従来、OCR等の文字認識装置は例えば
特公昭60−38756号公報に記載されているよう
に、被読取り物に記載された文書等を光学的に読み取っ
て文字部分を2値化したものをパタンレジスタに格納
し、例えば各方向のストローク成分等から文字線長をあ
らわす特徴を抽出しこの特徴量を文字の大きさで正規化
して特徴マトリクスを作成し、あらかじめ作成された辞
書と照合して識別を行い、結果を出力するという方法が
採られていた。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな文字認識装置では文字パタンのかすれやつぶれが原
因で、文字パタンの正確な特徴を得ることができなくな
り認識率が下がってしまうことがある。従来からこのよ
うな場合の対策として、読取り部で得た画像データに対
する一様な雑音除去や特徴抽出前の文字パタンに対する
一様な整形等の処理の他、かすれやつぶれの影響をあら
かじめ想定して詳細な特徴を求めるアルゴリズムを設計
して対応する等の様々な対策が採られて来た。しかし、
これらの対策法はいずれも、光電変換の特性、紙質、印
刷または筆記の状態に応じて不規則に変化するパタンの
かすれやつぶれに柔軟に対応できなかったり、識別アル
ゴリズムが冗長になってしまうという問題点があった。
【0004】よって本発明の目的は、文字パタンがかす
れたりつぶれたりしていても、他の文字との識別のため
に有効な特徴をあらわしている部位のみをその文字に適
した方法で局所的に整形することにより高精度な識別を
行うことができる文字認識装置を提供することにある。
【0005】
【課題を解決するための手段】この発明は、前記課題を
解決するために、被読取り物の画像データを得るための
読取り部と、該画像データから文字パタンの特徴を抽出
して識別する文字識別部からなる文字認識装置におい
て、前記文字識別部は、画像データの切り換えを行う入
力画像切り換え部と、前記画像データから文字識別に有
効な特徴を抽出する特徴抽出部と、抽出した特徴に基づ
き文字を識別して1つまたは複数の候補文字を出力する
識別部と、前記候補文字に応じてその特定部位のパタン
をその文字に適した方法で整形する整形部とを備え、整
形を行なった文字パタンについては前記入力画像切り替
え部により入力画像を整形後の画像データに切り替え、
該整形後の画像データから特徴抽出を行なうことを特徴
とする。
【0006】
【作用】この発明によれば、文字識別部に於ける識別部
から出力される候補文字のうち、必要なものについては
整形部においてその特定部位のパタンをその文字に適し
た方法で整形を行なった後、入力画像切り替え部で入力
画像を切り換えて、整形後の画像データから再度特徴抽
出を行なうので特徴抽出の精度が向上し、文字認識の精
度も向上する。従って、前記課題を解決できるのであ
る。尚、このとき光電変換の特性或は紙質または筆記の
状態等に応じて整形するための整形情報を指定可能な入
力手段を設けることにより文字パタンの品質に柔軟に対
応したより高精度の文字認識が可能となる。
【0007】
【実施例】以下に、本発明の文字認識装置の実施例を図
に基づいて説明する。尚図面はこの発明が理解できる程
度に概略的に示されているにすぎず、従って各構成成分
の形状、配置および接続関係を図示例に限定するもので
はない。図1は、本発明の文字認識装置の構成を示す機
能ブロック図である。この文字認識装置1は例えばOC
Rから成るものであり、被読取り物に記載された文字を
読み取って認識し、コンピュータ等への入力作業を迅速
に行うためのものである。
【0008】この文字認識装置1は、被読取り物から画
像データを得るための読取り部2と、得られた画像デー
タから文字の特徴を抽出して識別する文字識別部3とか
ら構成されている。読取り部2は、文字の反射光を取り
込んでそれを電気信号に変換し例えば2値化された画像
データを得る光電変換部21と、その2値化された画像
データを格納する画像メモリ22とから成る。文字識別
部3は、入力する文字画像データの切り換えを行う入力
画像切り換え部31と、画像データから識別に必要な特
徴を抽出する特徴抽出部32と、得られた特徴から例え
ば類似度を求めて候補文字を出力する識別部33と、そ
の候補文字に応じて特定の部位のパタンを整形する整形
部34とから成る。また、整形部34は、識別のために
有効な部位のパタンを候補文字に応じて例えば膨張、収
縮させる局所整形部342と、整形処理を施す部位およ
び方法に関する情報を文字種別に保持している整形情報
テーブル343と、その整形部位および方法を指定する
入力部344と、整形された文字パタンを格納する整形
画像メモリ345と、パタンを整形する必要があるか否
かを候補文字および整形情報テーブル343から決定す
る判断部341とから成る。
【0009】この文字認識装置1を用いて被読取り物に
記載された文字の認識を行うには、光電変換部21によ
り被読取り物に記載された文字の反射光を電気信号に変
換し、2値化された画像データを画像メモリ22内に格
納する。続いて入力画像切り換え部31がこの画像メモ
リ22のデータを特徴抽出部32へ送る。ここで例えば
入力画像切り換え部31は画像メモリ22のデータを入
力するように初期設定されているものとする。特徴抽出
部32は文字パタンから識別に有効な特徴を抽出し、識
別部33は例えばパタンマッチングやストローク解析等
により類似度を求めて1つまたは複数個の候補文字を決
定する。次に整形部34内の判断部341は第1位候補
文字の類似度が所定の域値を超えていれば処理を終了
し、超えていなければ以下の処理へ移る。
【0010】図2は識別部33で得られた候補文字に応
じてパタンを整形する様子を説明する図であり、候補文
字と整形情報テーブル343のフォーマットを示したも
のである。整形情報テーブル343のフォーマットは文
字種別に記載された整形情報レコード51からなり、各
レコード内には文字コード52と、整形するか否かを示
す整形フラグ53と、整形する部位を示す部位情報54
と、例えば膨張、収縮等の整形方法を示す方法情報55
から成り、整形フラグ53には例えば整形する必要があ
れば1を、その必要が無ければ0を設定しておく。ま
た、候補文字は例えば類似度の大きなものから順番に並
べられて識別部33から出力される。
【0011】判断部341は候補文字の文字コードをキ
ー項目として整形情報テーブル343内の整形情報レコ
ード51を検索し、該当するレコード内の整形フラグ5
3の値を調べる。ここで、このように検索した全ての文
字に対応する整形フラグ53が0である場合、つまりパ
タンを整形する必要が無い場合はそのまま処理を終え
る。一方、整形フラグ53が1のものが存在する場合、
つまりパタンを整形する必要がある場合は、局所整形部
342が部位情報54の示す特定部位を方法情報55が
示す膨張、収縮等の方法で画像メモリ22内のパタンを
整形して、整形画像メモリ345へ格納する。
【0012】図3(a)は整形処理を必要とする文字パ
タン[e]の例を示しており、整形前の文字パタン61
と整形部位62と、水平および垂直方向の座標をx,y
としたときの整形部位の左上の点(x1,y1)63
と、右下の点(x2,y2)64と、整形後のパタン6
5とから成る。図3(b)は例えば図3(a)のような
[e」のパタン整形をする場合の整形情報レコードの例
であり、文字コード71と、整形フラグ72と、整形部
位の左上の点の座標73と、右下の点の座標74と、膨
張処理を示すコード75と、膨張処理の回数76と、収
縮処理を示すコード77と、収縮処理を示す回数78と
から成る。
【0013】例えば何らかの原因でパタン61のような
かすれが多く存在する場合は、整形情報テーブル内の
[e」に関する情報を格納する整形情報レコードに整形
したい部位の例えば左上の点の座標73および右下の店
の座標74と、例えば膨張処理を示すコード75および
その回数76と、収縮処理を示すコード77およびその
回数78を入力部344より指定する。局所整形部34
2はこの整形情報レコードに基づいて処理を行いパタン
65を生成する。ここで膨張処理とは、例えば文字部分
を1背景部分を0の二値で表現し、処理対象領域を左上
から順に走査して注目画素が1である場合は例えばその
8近傍点を全て1とするような処理であり、収縮処理と
は注目画素が0の場合にその8近傍点を全て0にするよ
うな処理である。また膨張、収縮処理の回数とは、対象
領域をぞれぞれの処理を施しながら走査する回数のこと
である。
【0014】ここで、上述したような整形情報テーブル
の検索処理は全候補文字に対して実行されてもよいし、
また候補文字の1部についてのみ実行されてもよい。例
えば、類似度が所定の閾値より大きな文字を1つまたは
複数個選んで整形情報テーブル343を検索してもよい
し、類似度の上位のものから所定の個数の文字について
検索してもよい。また、候補文字の中に「c]と「e」
のように誤って識別してしまう可能性のある文字のペア
が存在する場合に限り、これらの文字について整形情報
テーブルを検索してもよい。また、整形部位の指定は、
左上点および右下点の座標による指定以外の方法であっ
てもよい。また、局所整形部342はパタン内のある特
定の方向のみに膨張、収縮等の整形を行ってもよい。こ
の場合は方法情報55に処理方向に関する情報を持たせ
る必要がある。また、局所整形部342は上述した方法
以外のパタン整形を行ってもよい。
【0015】整形されたパタンは一旦整形画像メモリ3
45に格納され、整形画像メモリ345のデータを入力
するように設定された入力画像切り換え部31によって
特徴抽出部32へ送られる。そして特徴抽出部32、識
別部33、および整形部34は前述と同様の処理を繰り
返す。ここで整形画像メモリ345は独立して設けても
よいし、また十分な容量を持たせた画像メモリ22内に
設けてもよい。
【0016】また、以上の特徴抽出部32、識別部3
3、および整形部34のそれぞれの処理の繰り返し回数
に制限を設けてもよい。例えば、繰り返し回数の限度を
1回とした場合は、2回目の判断部341の処理では整
形情報テーブル343を検索せず、直ちに処理を終了す
る。また、繰り返し回数の限度を2回とした場合は1回
目と2回目の判断部341の処理は同様に行い、3回目
の判断部341の処理では整形情報テーブル343を検
索せず、直ちに処理を終了する。
【0017】入力部344は光電変換部21の特性、紙
質、印刷または筆記の状態等に応じて、整形情報テーブ
ル343内の整形フラグ53、部位情報54、及び方法
情報55の内容を指定することができる。例えば文字パ
タンのかすれやつぶれの程度によって膨張、収縮の回数
を増減したり、整形する部位を変更してもよい。
【0018】
【発明の効果】以上説明したように本発明の文字認識装
置によれば、被読取り物の画像データを得るための読取
り部と、該画像データから文字パタンの特徴を抽出して
識別する文字識別部からなる文字認識装置において、前
記文字識別部は、画像データの切り換えを行う入力画像
切り換え部と、前記画像データから文字識別に有効な特
徴を抽出する特徴抽出部と、抽出した特徴に基づき文字
を識別して1つまたは複数の候補文字を出力する識別部
と、前記候補文字に応じてその特定部位のパタンをその
文字に適した方法で整形する整形部とを備え、整形を行
なった文字パタンについては前記入力画像切り替え部に
より入力画像を整形後の画像データに切り替え、該整形
後の画像データから特徴抽出を行なうように構成したの
で、識別しようとするパタンにかすれやつぶれが存在し
ていても、文字種毎に適した方法で局所的なパタン整形
をしてから識別することができ、高精度の文字認識が可
能となる。また、前記整形部に、候補文字の文字パタン
を整形するか否かを判断する判断部と、文字種別に整形
部位および整形方法に関する整形情報レコードを保持す
る整形情報テーブルと、該整形情報テーブルを参照する
ことにより候補文字に応じて決められた方法により文字
パタンを局所的に整形する局所整形部と、前記整形情報
レコードの内容を指定可能な入力部と、整形後の文字パ
タンを格納する整形画像メモリを備えることにより、光
電変換の特性、紙質、印刷または筆記の状態等に応じ
て、文字種毎に整形する部位および方法を入力部から自
由に指定でき、色々な状況により柔軟に対応できる。従
って、文字パタンの品質に柔軟に対応しながら認識精度
を高めることができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置の構成を示す機能ブロッ
ク図である。
【図2】整形情報テーブルの説明図である。
【図3】パタンの局所整形を説明する図である。
【符号の説明】
1 文字認識装置 2 読取り部 3 文字識別部 21 光電変換部 22 画像メモリ 31 入力画像切り替え部 32 特徴抽出部 33 識別部 34 整形部 341 判断部 342 局所整形部 343 整形情報テーブル 344 入力部 345 整形画像メモリ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 被読取り物の画像データを得るための読
    取り部と、該画像データから文字パタンの特徴を抽出し
    て識別する文字識別部からなる文字認識装置において、 前記文字識別部は、画像データの切り換えを行う入力画
    像切り換え部と、前記画像データから文字識別に有効な
    特徴を抽出する特徴抽出部と、抽出した特徴に基づき文
    字を識別して1つまたは複数の候補文字を出力する識別
    部と、前記候補文字に応じてその特定部位のパタンをそ
    の文字に適した方法で整形する整形部とを備え、 整形を行なった文字パタンについては前記入力画像切り
    替え部により入力画像を整形後の画像データに切り替
    え、該整形後の画像データから特徴抽出を行なうことを
    特徴とする文字認識装置。
  2. 【請求項2】 前記整形部は、候補文字の文字パタンを
    整形するか否かを判断する判断部と、文字種別に整形部
    位および整形方法に関する整形情報レコードを保持する
    整形情報テーブルと、該整形情報テーブルを参照するこ
    とにより候補文字に応じて決められた方法により文字パ
    タンを局所的に整形する局所整形部と、前記整形情報レ
    コードの内容を指定可能な入力部と、整形後の文字パタ
    ンを格納する整形画像メモリを備えたことを特徴とする
    請求項1記載の文字認識装置。
JP6094827A 1994-05-09 1994-05-09 文字認識装置 Pending JPH07302303A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6094827A JPH07302303A (ja) 1994-05-09 1994-05-09 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6094827A JPH07302303A (ja) 1994-05-09 1994-05-09 文字認識装置

Publications (1)

Publication Number Publication Date
JPH07302303A true JPH07302303A (ja) 1995-11-14

Family

ID=14120891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6094827A Pending JPH07302303A (ja) 1994-05-09 1994-05-09 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07302303A (ja)

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
US4903312A (en) Character recognition with variable subdivisions of a character region
JPH08235341A (ja) ドキュメントファイリング装置および方法
JP3335009B2 (ja) 画像処理方法及び画像処理装置
JP3078318B2 (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPH07302303A (ja) 文字認識装置
US5894525A (en) Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
JPH07282194A (ja) 文字認識装置
CA2091998A1 (en) Character recognition methods including separating and extracting particular portions from extracted data
JPH07160824A (ja) 文字認識装置
JPH10105647A (ja) コンテナ番号読取り装置及びコンテナ番号読取り方法
JPS59103177A (ja) 名刺読取装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JP2917396B2 (ja) 文字認識方式
JPH07104940B2 (ja) 図形認識装置
JP3006294B2 (ja) 光学的文字読取装置
JP3763966B2 (ja) 画像認識方法、装置および記録媒体
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPH11120291A (ja) パタン認識システム
JP2004280530A (ja) 帳票処理システム及び帳票処理方法
JP2001075984A (ja) ファイリング装置
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JPH01201789A (ja) 文字読取装置