JPH03180989A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03180989A
JPH03180989A JP1318827A JP31882789A JPH03180989A JP H03180989 A JPH03180989 A JP H03180989A JP 1318827 A JP1318827 A JP 1318827A JP 31882789 A JP31882789 A JP 31882789A JP H03180989 A JPH03180989 A JP H03180989A
Authority
JP
Japan
Prior art keywords
character
character pattern
pattern
symmetry
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1318827A
Other languages
English (en)
Inventor
Tsutomu Kuramochi
倉持 勉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP1318827A priority Critical patent/JPH03180989A/ja
Publication of JPH03180989A publication Critical patent/JPH03180989A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字パターンを高速に認識する文字認識装置
に関する。
〔従来の技術〕
文字パターンを認識する従来の方式には、認識する対象
となる文字パターンを予め辞書に登録しておき、認識す
べき文字の入カバターンと予め辞書に登録されている各
辞書パターンとを重ね合わせ、最も良く一致した辞書パ
ターンを認識結果とする方法がある。たとえば、「パタ
ーン認識」森健−監修 電子情報通信学会 47〜49
頁に1己載されている。
〔発明が解決しようとする課題〕
しかし、上記方法で漢字を含む日本語の文字パターンを
認識する場合には、辞書に登録するパターンが多くなる
ため、認識すべき文字パターンと辞書に登録した登録文
字パターンとを重ね合わせるための処理時間が長くなる
本発明は、上記問題点を解決し、文字パターンを高速に
認識することを可能にする文字認識装置を提供すること
を目的とする。
〔課題を解決するための手段〕
本発明は、前記目的を達成するために、認識すべき文字
パターンの対称性に基づく特徴を求める対象性特徴抽出
部と、抽出された対象性に基づく特徴により文字パター
ンを分類する文字パターン分類処理部と、文字パターン
分類処理部による分類の結果に応じて文字パターンを認
識する文字認識処理部と、を備えている。
〔作  用) 対象性特徴抽出部は、認識すべき文字パターンから、文
字パターンの対称性に基づく特徴(対象性の度合など)
を抽出する。文字パターン分類処理部は、抽出した特徴
を予め定めた基準に照らして認識すべき文字パターンを
分類する。文字認識処理部は分類の結果に応じて文字ば
ターンを認識する。
本発明によれば、文字の対象性に基づく特徴により文字
を分類するので、分類のための特徴抽出処理と分類処理
を、比較的簡単にかつ高速に行うことができる。また、
この分類によって、認識処理で使用する辞書パターンを
限定できるので、認識にかかる処理時間を短縮できる。
従って、分類処理の高速化と認識処理の高速化とが相俟
って、全体として高速に文字パターンの認識を行うこと
ができる。
〔実 施 例〕
第1図は本発明の一実施例による文字認識装置の構成を
示すブロック構成図である。この文字認識装置は、文書
を2値画像として読み込む画像入力装置1と、画像入力
装@1で入力した画像および処理途中の画像等を記憶す
る画像メモリ2と、文字認識装置全体の制御を行う制御
装@3と、コマンド等を入力する入力装置4と、入力し
た文書画像中に存在する各文字パターンの位置と大きさ
を検出する文字切り出し処理部5と、文字パターンの対
称性の度合いを算出する対称性特徴抽出処理部6および
その対称性の度合いにより文字パターンを分類する対称
性特徴分類処理部7とからなる文字パターン大分類処理
部8と、分類゛した結果に応じて文字パターンを認識す
る文字認識処理部9とから構成される。
文字切り出し処理部5は、入力された文書が横書きの場
合、その文書1iiii像の横方向の射影を求め、縦書
きの場合、縦方向の射影を求め、その結果、影のできた
部分に文字列が存在すると判定する。
次に、検出されたその文字列ごとに、横書きの場合、縦
方向の射影を求め、#書きの場合、横方向の射影を求め
、その結果、影のできた部分に文字パターンが存在する
と判定する。このようにして、文字切り出し処理部5は
各文字パターンの位1nと大きさを検出し、文字を切り
出す。
第3図は対象性特徴抽出処理部6の動作を示すフロー図
であり、第5図(a)ないしくC)は文字パターンの対
称性に基づく特徴を説明するための図である。
第5図において、■はたとえば、「画」、「意」「速」
のごとき認識すべき文字パターンである。
■は文字パターン■の横方向鏡像、■は文字パターン■
の縦方向鏡像、■は文字パターン■の180度回転像で
、本実施例ではこの3種類の対称性を使用している。
対象性特徴抽出処理部6は、第3図に示すように、文字
切り出し処理部5で切り出した文字パターン■の対象性
の特徴を求めるために、まず、切り出し文字パターン■
から、その横方向の鏡像パターン■、縦方向の鏡像パタ
ーン■、180” 回転像パターン■をそれぞれ作成す
る(ステップ31〜33)。次に、切り出し文字パター
ン■と横方向鏡像パターン■との論理積、切り出し文字
パターン■と縦方向鏡像パターン■との論理積、および
切り出し文字パターンのと180’ 回転像パターン■
との論理積の各演算をそれぞれ実行し、論理積パターン
■、■および■をそれぞれ作成する(ステップ34〜3
6)。そして、これらの対象性に関するパターン■■■
に基づき対象性の度合を表す特徴a、b、cをそれぞれ
算出する(ステップ37〜39)。すなわち次の演算を
行う。
a=(論理積パターン■の黒画素数)/(切り出し文字
パターン■の黒画素数) b=(論理積パターン■の黒画素数)/(切り出し文字
パターン■の黒画素数) C=(論理積パターン■の黒画素数)/(切り出し文字
パターン■の黒画素数) 第4図は、対称性特徴分類処理部7の動作を説明する動
作フロー図である。
対称性特徴分類処理部7は、上記の特徴a+ b+Cの
値が予め設定したしきい値(本実施例の場合0.5)よ
りも大きく従って対象性のある特徴がどれであるかによ
り5つのグループに分類する。
すなわち、第4図に示すように、特徴aのみが0.5以
上であるか否かを調べ(ステップ40)、特1tffl
aのみが0.5以上であるときは、切り出し文字パター
ンのがグループIに属すると判定する。
同様にして、特徴すのみが0.5以上であるか否かを調
べ(ステップ41)、特徴すのみが0.5以上であると
きは、切り出し文字パターン■がグループHに属すると
判定し、特徴Cのみが0.5以上であるか否かを調べ(
ステップ42)、特徴Cのみが0.5以上であるときは
、切り出し文字パターン■がグループ■に属すると判定
する。
上記の判定の結果、1つの特徴のみがしきい値0.5以
上の場合以外のときは、さらに2つ以上の特徴が0.5
以上であるかを調べ(ステップ43)、そうであればグ
ループ■に属すると判定する。特mat b、cのすべ
てが0.5未満のときは(ステップ44)、グループV
に属すると判定する。
第5図(a)の「画」という文字パターンの場合、認識
すべき文字パターン■の黒画素数に対する各論理積パタ
ーン■■■の黒画素数の割合a1b、cは、図示のごと
く、少なくとも2つ以上が0.5を越えているので、グ
ループ■に属する。
第5図(b)の「意」という文字パターンの場合、認識
すべき文字パターン■の黒画素数に対する各論理積パタ
ーン■■■の黒画素数の割合a1b、cは、図示のごと
く、aのみが0.5を越えているので、グループIに属
する。
第5図(C)の「速」という文字パターンの場合、特徴
as bz Cは、図示のごとく、全てのパターンが0
.5未満であるから、グループVに属する。
文字認識処理部9では、切り出し文字パターン■を辞書
に登録されている各文字パターンと比較し、最もよく一
致した辞書の文字パターンを認識結果とする。本実施例
では、辞書の文字パターンも上記の5つのグループに予
め分類して登録しておく。そして、切り出し文字パター
ンと照合する辞書の分類された5つの辞書グループは、
認識時に文字パターン分類処理部7の分類判定出力によ
り選択される。従って、入力文字パターンと辞書パター
ンとを比較する回数が減少し、処理時間を節約できる。
なお、実施例では、特徴量の閾値を0.5にしたが、こ
の閾値は他の値を用いてもよい。また、実施例では、5
つのグループに分類したが、グループの数は適宜に変更
することが可能である。さらに、対称性の取り方を変え
るようにしてもよい。
また、実施例では、分類をI特徴ごとに(1次元で)行
ったが、複数の特徴を同時に用いて(多次元空間で)行
ってもよい。
〔発明の効果〕
本発明によれば、文字の対象性に基づく特徴により文字
を分類するので、分類のための特徴抽出処理と分類処理
を、比較的簡単にかつ高速に行うことができる。また、
この分類によって、認識処理で使用する辞書パターンを
限定できるので、認識にかかる処理時間を短縮できる。
従って、分類処理の高速化と認識処理の高速化とが相俟
つで、全体として高速に文字パターンの認識を行うこと
ができる。
【図面の簡単な説明】
第1図は本発明の文字認識装置の構成を示すブロック構
成図である。 第2図は文字の射影による文字切り出し処理の説明をす
るための図である。 第3図は対象性特徴抽出部の動作を示す動作フロー図で
ある。 第4図は対象性特徴分類処理部の動作を示す動作フロー
図である。 第5図(a)ないしくC)は文字パターンの種々の対称
性の例を示す図である。 1・・・画像入力装置 2・・・画像メモリ 3・・・制御装置 4・・・入力装置 5・・・文字切り出し処理部 6・・・対称性特徴抽出処理部 7・・・対称性特徴分類処理部 8・・・文字パターン大分類処理部 9・・・文字認識処理部

Claims (1)

  1. 【特許請求の範囲】  認識すべき文字パターンの対称性に基づく特徴を求め
    る対象性特徴抽出部と、 抽出された対象性に基づく特徴により文字パターンを分
    類する文字パターン分類処理部と、文字パターン分類処
    理部による分類の結果に応じて文字パターンを認識する
    文字認識処理部と、を備えたことを特徴とする文字認識
    装置。
JP1318827A 1989-12-11 1989-12-11 文字認識装置 Pending JPH03180989A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1318827A JPH03180989A (ja) 1989-12-11 1989-12-11 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1318827A JPH03180989A (ja) 1989-12-11 1989-12-11 文字認識装置

Publications (1)

Publication Number Publication Date
JPH03180989A true JPH03180989A (ja) 1991-08-06

Family

ID=18103398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1318827A Pending JPH03180989A (ja) 1989-12-11 1989-12-11 文字認識装置

Country Status (1)

Country Link
JP (1) JPH03180989A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146373A (ja) * 2006-12-11 2008-06-26 Sharp Corp パターン認識方法、パターン認識プログラムおよびパターン認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146373A (ja) * 2006-12-11 2008-06-26 Sharp Corp パターン認識方法、パターン認識プログラムおよびパターン認識装置

Similar Documents

Publication Publication Date Title
US5621818A (en) Document recognition apparatus
EP0432937B1 (en) Hand-written character recognition apparatus
Chi et al. Separation of single-and double-touching handwritten numeral strings
Chi et al. A two-stage binarization approach for document images
JPH07160822A (ja) パターン認識方法
JPH03180989A (ja) 文字認識装置
Chen et al. Chinese license plate recognition based on human vision attention mechanism
Kimpan et al. Fine classification of printed Thai character recognition using the Karhunen-Loeve expansion
Wang et al. Document segmentation and classification with top-down approach
JP2766205B2 (ja) 文字認識装置
Wiwatcharakoses et al. MSER based text localization for multi-language using double-threshold scheme
JPH0795336B2 (ja) 文字認識方式
JPS63780A (ja) パターン認識方法
JPS5960574A (ja) 文字認識方式
JPS63269267A (ja) 文字認識方法
Kim et al. Segmentation of touching characters in printed Korean/English document recognition
Li et al. Face detection in complex background based on Gaussian models and neural networks
JPH04286087A (ja) 文字認識装置
JPH01125683A (ja) 文字認識装置
JPH06119497A (ja) 文字認識方法
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JPH09161005A (ja) 文字認識装置及び方法並びにそれを用いたスキャナ
JPH09128484A (ja) パターンマッチングの照合方法
JP2972443B2 (ja) 文字認識装置
JPS63779A (ja) パターン認識方法