JPS63118993A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS63118993A
JPS63118993A JP61265127A JP26512786A JPS63118993A JP S63118993 A JPS63118993 A JP S63118993A JP 61265127 A JP61265127 A JP 61265127A JP 26512786 A JP26512786 A JP 26512786A JP S63118993 A JPS63118993 A JP S63118993A
Authority
JP
Japan
Prior art keywords
feature amount
character
histogram
dictionary
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61265127A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61265127A priority Critical patent/JPS63118993A/ja
Publication of JPS63118993A publication Critical patent/JPS63118993A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、光学文字読取装置(○CAR)などにおける
文字認識方法に関する。
〔従来技術〕
OCRなどにおける文字認識方法の一つに、読取った文
字の輪郭部に方向コードをつけると−もに、該文字を複
数のブロックに分割し、各ブロック毎に方向コード別の
ヒストグラムをとり、このヒストグラムを特徴量として
認識する方法がある。
しかしながら、例えばブロックの数を16ブロツク、方
向コードを8方向とすると、特徴量は16X8=128
次元となり、この特徴量について全ての辞書と距離演算
を行うと、膨大な処理量となり、認識に多大の時間がか
\る。
〔目 的〕
本発明の目的は、被認識文字を複数のブロックに分割し
、各ブロック毎に方向コード別のヒストグラムをとり、
このヒストグラムを特徴量として認識する文字認識方法
における処理の高速化及び認識精度の向上を図ることに
ある。
〔構 成〕
本発明は、読取った文字を複数のブロックに分割し、例
えば各ブロックについて構造的特徴を抽出し、この抽出
した構造的特徴により文字を大分類して検索する辞書を
絞り込む。そして、この絞り込んだ辞書を用い、各ブロ
ック毎に方向コード別のヒストグラムをとった特徴量に
ついて認識処理を行う。
以下、本発明の一実施例について図面により説明する。
第1図は本発明による全体の処理フロー例を示し、第2
図は該処理を実現するシステム構成例を示す。
スキャナ201は、原稿上の文字を光学的に読み取り、
白画素は0、黒画素は1の2値パターンデータに変換す
る(ステップ101)。パソコン202では、入力され
た2値パターンデータを1文字単位に切り出した後、ま
ず、その入力文字パターンの輪郭部に方向コードをつけ
るとNもに、該パターン領域を複数のブロックに分割す
る(ステップ102)。次に、この分割したブロック毎
に方向コードのヒストグラムをとり、特徴量を抽出する
(ステップ103)。この特徴量をヒストグラム特微量
と呼ぶことにする。次に、分割したブロック毎に、構造
的特徴を抽出する(ステップ104)。この抽出した構
造的特徴の配列を構造的特徴量と呼ぶことにする。なお
、ステップ103と104の処理は逆でもよい。
パソコン202では1次に構造的特徴量を用いて辞書フ
ァイル203t&検索し、辞書にあらかしる用意された
同構造的特徴量と比較し、入力文字パターンを大分類し
て辞書を絞り込む(ステップ105)。次に、構造的特
徴量で一致のとれた辞書について、入力文字パターンの
ヒストグラム特微量と辞書にあらかじめ用意された同時
微量との距離演算を行い、候補文字を決定する(ステッ
プ107)。そして、認識結果を表示装置204あるい
はプリンタ205等に出力する。
以下、本発明の中心をなす構造的特徴量の抽出、構造的
特徴量による大分類処理について詳述する。
なお、入力文字パターンの領域分割、ヒストグラム特微
量の抽出、ヒストグラム特微量による認識処理は従来と
基本的に同じである。
第3図は文字“H11の2値化パターンについて、その
領域を4×4の16ブロツクに分割した図であり、第4
図は各ブロックに付けた番号である。
この分割した各ブロックについて構造的特徴を抽出する
に \では、構造的特徴として、各ブロックについて、水平
および垂直方向のストロークの有無。
水平および垂直方向の空洞の有無を用いるとする。
ストローク有りとは、ブロックの水平あるいは垂直方向
に連続する黒画素があることをいへ、空洞有りとは、ブ
ロックの水平あるいは垂直方向に白画素が少なくとも2
ドツト以上あることをいう。
今、水平方向のストローク特微量をSH1垂直方向のス
トローク特微量をSv、水平方向の空洞特徴量をCH1
垂直方向の空洞特徴量をCvとすると、これらは次式 で表わされる。こ−で、IはブロックNαで、1〜N 
(Nは最終ブロックNα)の値をとる。Fは該当ブロッ
クにストローク又は空洞があるかどうかを示し、ある場
合は“1″、ない場合は(# Oj+の値をとる。
第5図に水平方向のストローク特微量SHの処理フロー
を示す。これを第3図の例について説明すると、水平方
向のストロークはブロックNαが1゜3.4,6,7,
15.16にあるので。
5H=2”+2”+2’+2’+2”+2”+2° (
2)となる。 これを2進数で表わすと、5H=110
0000001101101となる。即ち、2進数の各
桁(ビット)は各ブロックと1対1に対応し、ストロー
ク有の場合は1″′、ストローク無の場合はII OI
Iを示す。(2)式を16進数で表わすと、S、、=C
D6Dとなる。
同様にして、第3図の例についてSv、 CH,C9を
求めると、5v=9999.CI+=0666゜Cv=
2F92となる。
このようにして得られたs、、、sv、C,、、Cvを
構造的精微量として、これをあらがしめ辞書に登録しで
ある同時微量とを比較して大分類し、辞書の絞り込みを
行う。第6図はその処理フローを示したものである。
まず、抽出した水平方向のストローク特微量S□と辞書
の同特特微量[)soとの論理積をとり、その結果がS
Hと一致しないと、たゾちに次の辞書へ進む。そして、
Sllと一致するものについて、次に抽出した垂直方向
のストローク特微量Svと辞書の同時微量り、vとの論
理積をとり、その結果がSvと一致しないと、やはり次
の辞書へ進む。
そして、Svと一致するものについて1次に抽出した水
平方向の空洞特徴量CMと辞書の同時微量DCHとの論
理積をとる。この場合も、結果がC□と一致しないと、
次の辞書へ進み、一致するものについて、次に抽出した
垂直方向の空洞特徴量C9と辞書の同時微量り。Vとの
論理積をとる。そして、結果がCvと一致しないと、次
の辞書へ進み、一致するものについて、入力文字パター
ンのヒストグラム特微量と辞書にあらかじめ登録されて
いる同時微量との距離演算を行う。
上記実施例では1分割した各ブロック全てに構造的特徴
を抽出するとしたが、ストローク、空洞それぞれに関し
てブロックを選択し、より少ないブロックについて構造
的特徴を抽出して大分類を行うことも可能である。さら
に、このブロックを選択して構造的特徴を抽出し大分類
を行った後、選択されなかったブロックに関してのみヒ
ストグラムを収集し、距離演算を行って候補文字を決定
するようにしてもよい。これはヒストグラム演算の次元
数を減らす上で極めて有効である。また、距離演算で候
補が絞れない入力文字パターンについて、さらに該特定
領域のヒストグラムにより距離演算を行うことにより、
認識精度が維持される。
また、実施例では構造的特徴としてストローク、空洞を
とり上げたが、交差点、屈曲点等の特徴を用いてもよい
ことは云うまでもない。
〔効 果〕
以上説明したように、本発明によれば、被認識文字を複
数のブロックに分割し、各ブロック毎に方向コード別の
ヒストグラムをとり、このヒストグラムを特徴量として
認識処理を行う際、構造的特徴により大分類することに
より、ヒストグラム演算を行う辞書の数を減らすことが
でき、処理の高速化が期待できる。さらに、ヒストグラ
ムだけでは明確化できない構造的特徴を抽出することに
より、認識精度の向上が期待できる。
【図面の簡単な説明】
第1図は本発明による一実施例の認識処理の全体のフロ
ーチャート、第2図は本発明による認識処理を実現する
システム構成例を示す図、第3図及び第4図は被認識文
字とブロック分割の一例を示す図、第5図は構造的精微
量の抽出処理の一例を示すフローチャート、第6図は構
造的精微量による大分類処理の一例を示すフローチャー
j−である。 101・・・文字読取、  102・・・領域分割。 103・・・ヒストグラム特微量抽出。 104・・・構造的特徴量抽出、 105・・・構造的精微量による大分類、106・・・
ヒストグラム特微量による文字認識、107・・・認識
結果出力。 第2図 第3図    第4図 第5図 第6図

Claims (2)

    【特許請求の範囲】
  1. (1)被認識文字を複数のブロックに分割し、各ブロッ
    ク毎に方向コード別のヒストグラムをとり、該ヒストグ
    ラムを特徴として認識処理を行う文字認識方法において
    、前記分割したブロックの一部又は全部について構造的
    特徴を抽出し、該抽出した構造的特徴を用いて大分類を
    行った後、前記ヒストグラムによる認識処理を行うこと
    を特徴とする文字認識方法。
  2. (2)分割した各ブロックの一部について構造的特徴を
    抽出して大分類を行う場合、残りのブロックによるヒス
    トグラムを用いて認識処理を行うことを特徴とする特許
    請求の範囲第1項記載の文字認識方法。
JP61265127A 1986-11-07 1986-11-07 文字認識方法 Pending JPS63118993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61265127A JPS63118993A (ja) 1986-11-07 1986-11-07 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61265127A JPS63118993A (ja) 1986-11-07 1986-11-07 文字認識方法

Publications (1)

Publication Number Publication Date
JPS63118993A true JPS63118993A (ja) 1988-05-23

Family

ID=17412993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61265127A Pending JPS63118993A (ja) 1986-11-07 1986-11-07 文字認識方法

Country Status (1)

Country Link
JP (1) JPS63118993A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02125391A (ja) * 1988-08-20 1990-05-14 Fujitsu Ltd 連想整合認識方式
JPH02125390A (ja) * 1988-08-20 1990-05-14 Fujitsu Ltd パターン認識方式
JP2010015508A (ja) * 2008-07-07 2010-01-21 Mitsubishi Electric Corp 路線映像管理システムおよび映像管理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02125391A (ja) * 1988-08-20 1990-05-14 Fujitsu Ltd 連想整合認識方式
JPH02125390A (ja) * 1988-08-20 1990-05-14 Fujitsu Ltd パターン認識方式
JP2010015508A (ja) * 2008-07-07 2010-01-21 Mitsubishi Electric Corp 路線映像管理システムおよび映像管理方法

Similar Documents

Publication Publication Date Title
US5579408A (en) Character recognition method and apparatus
JPH05108883A (ja) 文字認識方法及び装置
JPS63118993A (ja) 文字認識方法
JPS60153574A (ja) 文字読取方法
Brodic et al. Analysis of the south Slavic scripts by run-length features of the image texture
JPS60153575A (ja) 文字読取方法
JPS62192886A (ja) 文字認識装置における特徴量生成方法
CN106778775A (zh) 一种基于sift特征软匹配的图像分类方法
JPS62271190A (ja) セグメント数字認識方式
JP2984315B2 (ja) 認識装置
JP2868770B2 (ja) パターン辞書の構成方式
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
JPS6327991A (ja) 入力情報認識装置用ヒストグラム作成方法
JP2728117B2 (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JP2923295B2 (ja) パターン同定処理方式
JPH0281189A (ja) 文字認識方法
JPH051514B2 (ja)
JPS63142487A (ja) 特定文字列高速抽出方法
JPS63136286A (ja) オンライン文字認識方式
JPS63178380A (ja) 文字列認識装置
JPS6022793B2 (ja) 文字識別装置
Maruyama et al. Cursive handwritten word recognition by integrating multiple classifiers
JPH10334190A (ja) 文字認識方法、装置および記録媒体
JPS608990A (ja) 文字認識方式