JPS62192886A - 文字認識装置における特徴量生成方法 - Google Patents

文字認識装置における特徴量生成方法

Info

Publication number
JPS62192886A
JPS62192886A JP61036055A JP3605586A JPS62192886A JP S62192886 A JPS62192886 A JP S62192886A JP 61036055 A JP61036055 A JP 61036055A JP 3605586 A JP3605586 A JP 3605586A JP S62192886 A JPS62192886 A JP S62192886A
Authority
JP
Japan
Prior art keywords
dictionary
histogram
integrated
character
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61036055A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61036055A priority Critical patent/JPS62192886A/ja
Publication of JPS62192886A publication Critical patent/JPS62192886A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明はOCR等の文字認識装置における特徴量生成方
法に関する。
〔従来技術〕
OCR等における文字認識方法の一つに、入力パターン
をその輪郭部に方向コードを付けて複数ブロックに分割
し、この分割したブロック毎にその方向コード別のヒス
トグラムをとり、この各ヒストグラムを特徴量として文
字認識を行う方法がある。この場合、例えば入力パター
ンを4X4に分割し、8方向の方向コードを用いるとす
ると。
4X4X8=128次元の特徴量が抽出される。
ところで、この特徴量の中には文字の識別能力の高いも
のもあれば低いものもある。しかしながら、従来はこれ
らの特徴量をいずれも同じように扱って距離演算を行っ
ており、このため、認識率及び認識速度の低下を招く一
因となっていた。
〔目 的〕
本発明の目的は、入力パターンをその輪郭部に付けられ
た方向コードに基づいて複数ブロックに分割し、この分
割したブロック毎にその方向コード別のヒストグラムを
とり、この各ヒストグラムを特徴量として文字認識を行
う文字認識装置において、認識率及び認識速度の向上を
図ることにある。
〔構 成〕
本発明は、入力パターンの分割したブロック毎にその方
向コード別のヒストグラムをとる際、辞書の識別能力に
より、分割したブロックの一部を統合してヒストグラム
を生成するようにして、特徴量を削減し、それによって
認識率及び認識速度の向上を実現するものである。以下
、図面によって本発明の一実施例を説明する。
はじめ、第2図により入力パターンの領域分割について
説明する。まず、入力パターンの輪郭部について方向コ
ードを付ける(ステップ21)。
次に、この入力パターンの輪郭部についた方向コードを
カウントし、その総数を求める(ステップ22)。次に
、方向コードの総数に基づいてX方向、Y方向への分割
座標を求める。例えば、領域をnXmに分割するとして
、方向コードの総数をn       n そこで、入力パターンをX方向にスキャンし、方向コー
ド数が各分割点となるX座標を求めるCステップ25)
。同様に、Y方向の分割点は□。
m          m 6.27)。そこで、入力パターンをY方向にスキャン
し、方向コード数が各分割点となるY座標を求める(ス
テップ28)。
第1図は本発明による特徴量生成を説明するためのフロ
ーチャートである。
まず、各分割したブロック毎に、方向別の方向コード数
をカウントしてヒストグラムを作成する(ステップ11
)。次に、あらかじめ辞書に用意しておいた統合ブロッ
クデータの値によりブロックを統合し、当該ブロックの
ヒストグラムを加算する(ステップ12)。こうして求
めたヒストグラムを特徴量として辞書検索を行い、候補
文字を決定する。
第3図は入力パターンを4×4の16ブロツクに分割す
る例を示しているにの場合の統合ブロックデータの値の
一例を第4図に示す。第4図は。
例えばデータOは統合ブロックなしを意味し、データ1
は第3図のブロック6と7を統合することを意味する。
データ2〜5についても同様である。
即ち、第4図は中央の4ブロツクを任意に統合する例で
ある。
第5図は本発明の方法を実現するハードウェア構成の概
略ブロック図である。第5図において、OCRプロセッ
サ52は原稿51を読み取り、その2値化パターンを画
像メモリ53に格納する。
このOCRプロセッサ52には辞書メモリ54が具備さ
れている。
辞書メモリ54の構成例を第6図に示す。辞書はアドレ
スが上位、下位に分かれていて、各下位の0番地に文字
コード、1番地にその文字の辞書(テンプレート)数、
2番地にその文字の先頭辞書(テンプレート)の下位番
地が格納されている。
さらに3番地に統合するブロックのデータがはっている
。4番地以後は辞書(テンプレート)の各・特徴量が格
納されている。
第6図では、統合ブロックデータは各文字毎に設定して
いるが、各テンプレート毎に設定すればより効果が期待
でき、また、文字間、テンプレート間に大きな差異がな
いようであれば、文字種単位またはフォント単位に設定
する事により辞書容量の増加が防止できる。
OCRプロセッサ52は1画像メモリ53の入力パター
ン情報について、第2図のフローにしたがって輪郭部の
方向コード付は及び領域分割を行う。そして、第1図の
フローにしたがって、まず。
領域分割して得られた各ブロック毎にヒストグラムを作
成する。次に、辞書メモリ54の統合ブロックデータを
読み取り、その値により1例えば4×4の領域分割では
第4図の規則に従ってブロックの統合を行い、ヒストグ
ラムを作成し直す。
〔効 果〕
本発明によれば、入力パターンをその輪郭部に方向コー
ドを付けて複数ブロックに分割し、該分割したブロック
毎にその方向コード別のヒストグラムをとり、この各ヒ
ストグラムを特徴量として文字認識を行う際、ブロック
を統合して特徴量を作成することにより、特徴量が削減
できるため、認識速度の向上が期待できる。また、統合
する特徴量は辞書識別能力の低いものであることから、
認識率の向上が期待でき、かつ、辞書容量が削減できる
【図面の簡単な説明】
第1図は本発明方法を説明するためのフローチャート、
第2図は入力パターンの領域分割を説明するためのフロ
ーチャート、第3図は領域分割の一例を示す図、第4図
は統合ブロックデータと統合ブロックの一例を示す図、
第5図は本発明の方法を実現するハードウェア構成のブ
ロック図、第6図は辞書メモリの構成例を示す図である
。 51・・・原稿、 52・・・OCRプロセッサ、53
、・画像メモリ、  54由辞書メモリ。

Claims (2)

    【特許請求の範囲】
  1. (1)輪郭部に方向コードの付された入力パターンを複
    数ブロックに分割して、各ブロック毎に方向コード別の
    ヒストグラムをとり、各ヒストグラムを特徴量としてあ
    らかじめ用意した辞書を検索して文字認識を行う文字認
    識装置において、前記辞書に統合ブロックデータを設定
    しておき、前記分割したブロックの一部を前記統合ブロ
    ックデータにしたがって統合してヒストグラムを生成す
    ることを特徴とする文字認識装置における特徴量生成方
    法。
  2. (2)前記統合するブロックデータは、辞書の1テンプ
    レート毎、1文字毎、文字種毎あるいはフォント毎に設
    定することを特徴する特許請求の範囲第1項記載の文字
    認識装置における特徴量生成方法。
JP61036055A 1986-02-20 1986-02-20 文字認識装置における特徴量生成方法 Pending JPS62192886A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61036055A JPS62192886A (ja) 1986-02-20 1986-02-20 文字認識装置における特徴量生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61036055A JPS62192886A (ja) 1986-02-20 1986-02-20 文字認識装置における特徴量生成方法

Publications (1)

Publication Number Publication Date
JPS62192886A true JPS62192886A (ja) 1987-08-24

Family

ID=12459029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61036055A Pending JPS62192886A (ja) 1986-02-20 1986-02-20 文字認識装置における特徴量生成方法

Country Status (1)

Country Link
JP (1) JPS62192886A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01255986A (ja) * 1988-04-05 1989-10-12 Fujitsu Ltd マルチフオント辞書の作成法
JPH01266691A (ja) * 1988-04-19 1989-10-24 Canon Inc 文字画像データの特徴抽出方式
JPH0428982U (ja) * 1990-06-27 1992-03-09
JPH07129720A (ja) * 1993-11-04 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01255986A (ja) * 1988-04-05 1989-10-12 Fujitsu Ltd マルチフオント辞書の作成法
JPH01266691A (ja) * 1988-04-19 1989-10-24 Canon Inc 文字画像データの特徴抽出方式
JPH0428982U (ja) * 1990-06-27 1992-03-09
JPH07129720A (ja) * 1993-11-04 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置

Similar Documents

Publication Publication Date Title
EP0325233B1 (en) Character string recognition system
JP3400151B2 (ja) 文字列領域抽出装置および方法
JPS62192886A (ja) 文字認識装置における特徴量生成方法
JPS62192887A (ja) 文字認識装置における特徴量生成方法
JP2605807B2 (ja) 特徴抽出方式
JPH0210472B2 (ja)
JP3157530B2 (ja) 文字切り出し方法
JPS6327991A (ja) 入力情報認識装置用ヒストグラム作成方法
JPS63118993A (ja) 文字認識方法
JP2582611B2 (ja) マルチフオント辞書の作成法
JP2991750B2 (ja) 辞書作成方法
JPS60153578A (ja) 文字認識装置
JP2940974B2 (ja) マッチング方法
JP2954218B2 (ja) 画像処理方法及び装置
JPS62271190A (ja) セグメント数字認識方式
JP3238776B2 (ja) 大分類辞書作成方法及び文字認識装置
JPH0746363B2 (ja) 図面読取装置
JPS60110089A (ja) 文字認識装置
JPH0233689A (ja) 文字認識装置及び文字認識手段
JPS63195783A (ja) 文字切出し方式
JPH06236454A (ja) 文字認識装置
JPS61251984A (ja) マルチフオント活字文字認識装置
JPH03240184A (ja) 属性判定装置
JPH02242391A (ja) 文字認識方式
JPS63121991A (ja) 文字認識装置の辞書作成方法