JPH05334493A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05334493A
JPH05334493A JP4140596A JP14059692A JPH05334493A JP H05334493 A JPH05334493 A JP H05334493A JP 4140596 A JP4140596 A JP 4140596A JP 14059692 A JP14059692 A JP 14059692A JP H05334493 A JPH05334493 A JP H05334493A
Authority
JP
Japan
Prior art keywords
character
dictionary
feature
recognition
character data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4140596A
Other languages
English (en)
Inventor
Shigeru Kafuku
滋 加福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP4140596A priority Critical patent/JPH05334493A/ja
Publication of JPH05334493A publication Critical patent/JPH05334493A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】本発明は、辞書の参照範囲を必要最小限に絞り
込んだ状態で文字認識が行われる。 【構成】入力部1より入力される文字データを大分類特
徴抽出部3に与え、ここで文字データを外接枠で囲うと
ともに4方向について外接枠から文字線に出会うまでの
間の面積を数値化し特徴値として求め、この特徴値に応
じて認識部4によりクラス分けを行うとともに、これら
クラスに基づいて辞書5の参照範囲を設定し、この参照
範囲に対して特徴抽出部6より抽出された入力文字デー
タの文字特徴のマッチングを調べ、その認識結果を出力
するようにしている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷文字の認識に用い
られる文字認識装置に関するものである。
【0002】
【従来の技術】最近の文字認識技術の進歩は目覚ましい
ものがあり、各分野において広く用いられるようになっ
ている。
【0003】ところで、文字認識には、印刷文字に対す
る認識を行うものがあるが、このような印刷文字の認識
では、インクの濃さ、汚れ、染み、文字の片打ちなどに
よる文字線幅の変動などが原因で誤認識を生じることが
知られている。
【0004】そこで、従来では文字認識を実行するまで
の前処理として、ベリフェラル特徴などの方法を利用し
て予め文字の特徴を抽出し、これにより求められた特徴
パラメータを用いて辞書の内容を参照することにより、
誤認識の少ない文字認識を実現するようにしている。
【0005】
【発明が解決しようとする課題】ところが、このような
従来の文字認識装置にあっては、文字認識実行までの前
処理として事前に文字の特徴を抽出し、これを用いて辞
書の内容を参照しているものの、この場合の辞書の内容
に対する参照は、辞書に納められたすべての内容を参照
対象としているので、辞書に対する参照範囲が著しく広
くなると、認識結果が出るまでに時間がかかるだけでな
く、認識結果の正確さに欠けるという問題点があった。
本発明は、上記事情に鑑みてなされたもので、印刷文字
の認識処理を高速に、しかも正確に行うことができる文
字認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は、文字データを
入力する入力手段、この入力手段より入力される文字デ
ータを外接枠で囲い少なくとも2方向について外接枠か
ら文字線に出会うまでの間の面積を数値化し特徴値とし
て求める手段、この手段により求められた特徴値に応じ
て決定されるクラスに基づいて参照範囲が設定される辞
書、前記入力される文字データの文字特徴を抽出する手
段、前記辞書の参照範囲と前記抽出された文字特徴とを
マッチングしてその認識結果を出力する手段により構成
されている。
【0007】
【作用】この結果、本発明によれば、入力手段より入力
される文字データについて文字データを外接枠で囲い少
なくとも2方向について外接枠から文字線に出会うまで
の間の面積を数値化し、これを特徴値として求め、この
特徴値に応じて決定されるクラスに基づいて辞書の参照
範囲を設定し、この設定された辞書の参照範囲と入力文
字データの文字特徴とをマッチングしその認識結果を出
力するようにしている。従って、文字認識に使用される
辞書の参照範囲を最小限に制限することができるので、
認識結果が出るまでの時間を短縮できるだけでなく、認
識結果の正確さを高めることができる。
【0008】
【実施例】以下、本発明の一実施例を図面に従い説明す
る。
【0009】図1は同実施例の概略構成を示している。
図において、1は入力部で、この入力部1は、図示しな
い光学式の文字読取り手段などにより読み取られた印刷
文字のイメージデータを1文字単位づつメモリ2に与え
るようにしている。メモリ2は入力部1から与えられる
文字データを記憶し、また、この1文字単位の文字デー
タを大分類特徴抽出部3に出力するようにしている。
【0010】大分類特徴抽出部3は、メモリ2から与え
られる1文字単位の文字データに対し、ペリフェラル特
徴抽出の方法を用いて大分類の特徴抽出を行うようにし
ている。この場合、例えば、図2に示すような文字
「上」が与えられると、この文字を外接枠で囲った後、
まず、a方向について外接枠から文字線に出会うまでの
間の面積を数値化して特徴値として求め、以下、b、
c、dの各方向についても同様にして外接枠から文字線
に出会うまでの間の面積を数値化して特徴値として求め
るようにしている。そして、この大分類特徴抽出部3で
求めた特徴値は、認識部4に送られる。
【0011】認識部4は、図3に示すように大分類特徴
抽出部3で求められた特徴値の範囲とクラスの関係をテ
ーブルとして記憶している。図3では、特徴値0〜10
0までがクラスA、100〜200までがクラスB、2
00〜300までがクラスCのように設定されている。
そして、このテーブルを利用して大分類特徴抽出部3か
ら与えられるa、b、c、dの各方向の特徴値に応じた
クラスを決定し、これら決定されたクラスに基づいて辞
書5の参照範囲を設定するようにしている。この場合、
辞書5の参照範囲の設定は、参照対象となる部分にイン
デックスなどを付けるようにしている。一方、同じ文字
であってもフォントが異なると、a、b、c、dの各方
向の特徴値が異なりクラス分けに違いが出てくることが
ある。従って、ここでは、このことを考慮して決定され
たクラス近傍の他のクラスについても辞書5の参照範囲
を設定するようにしている。
【0012】一方、メモリ2に記憶された1文字単位の
文字データは、特徴抽出部6に送られる。特徴抽出部6
は、この文字データに対し、ペリフェラル特徴抽出とメ
ッシュ特徴抽出を用いて文字特徴を抽出するようにして
いる。ここでのペリフェラル特徴抽出とメッシュ特徴抽
出は、周知の技術なので、詳細な説明は省略する。
【0013】そして、特徴抽出部6で抽出された文字特
徴は、認識部4に送られる。認識部4では、上述したク
ラス分けに基づいて設定した辞書5の参照範囲を使用し
て特徴抽出部6で抽出された文字特徴とのマッチングを
調べ、その認識結果を出力部7より出力するようにして
いる。この場合、認識部4での認識処理は、まずa方向
のクラスにより設定された辞書5の参照範囲を使用して
マッチングを調べ、次いで、b方向のクラスにより設定
された辞書5の参照範囲を使用してマッチングを調べ、
以下、同様にしてc、d方向のそれぞれのクラスにより
設定された辞書5の参照範囲を使用してマッチングを調
べて、これらの結果の論理値を求めることで認識候補文
字を絞るようにしている。
【0014】なお、8は予め所定のプログラムを格納し
た制御部で、この制御部8は、入力部1、メモリ2、大
分類特徴抽出部3、認識部4、特徴抽出部6、出力部7
に対しプログラムにしたがって所定の制御指令を出力す
るようになっている。次に、以上のように構成した実施
例の動作を説明する。いま、制御部8の指令により入力
部1に1文字単位の文字データが取り込まれると、この
文字データはメモリ2に送られ記憶される。
【0015】そして、メモリ2の1文字単位の文字デー
タは、制御部8からの指令により、大分類特徴抽出部3
に送られる。大分類特徴抽出部3では、文字データに対
してペリフェラル特徴抽出の方法を用いて大分類の特徴
抽出を行う。この場合、図2に示すような文字「上」が
与えられると、この文字を外接枠で囲った後、a、b、
c、dの各方向について外接枠から文字線に出会うまで
の間の面積を数値化して特徴値として求めるようにな
る。
【0016】そして、この大分類特徴抽出部3で求めら
れたa、b、c、d各方向の特徴値は、認識部4に送ら
れる。認識部4では、図3に示すテーブルを用いてa、
b、c、dの各方向の特徴値に応じたクラスが決定され
る。この場合、仮に、図2に示す文字「上」について、
a方向の特徴値が「450」、b方向の特徴値が「25
0」、c方向の特徴値が「0」、d方向の特徴値が「1
00」であったとすると、a=E、b=C、c=A、d
=Bのクラスが決定されるようになる。
【0017】そして、これら決定されたクラスに基づい
て辞書5の参照範囲が設定される。この場合、図4
(a)(b)に示すように同じ文字「上」であってもフ
ォントが異なると、a、b、c、d各方向の特徴値が異
なりクラス分けに違いが出てくることがあるので、ここ
では、a方向についてはD〜F、b方向についてはB〜
D、c方向についてはA〜C、d方向についてはA〜C
の各クラスについて辞書5の参照範囲が設定されるよう
になる。
【0018】一方、制御部8の指令によりメモリ2の1
文字単位の文字データは、特徴抽出部6に送られる。特
徴抽出部6では、この文字データに対しペリフェラル特
徴抽出とメッシュ特徴抽出を用いて文字特徴抽出が行わ
れ、この抽出された文字特徴が認識部4に送られる。
【0019】認識部4では、上述した要領で設定された
辞書5の参照範囲を使用して特徴抽出部6より抽出され
た文字特徴とのマッチングを調べる。この場合、まずa
方向のクラスにより設定された辞書5の参照範囲を使用
してマッチングが調べられ、次いで、b方向のクラスに
より設定された辞書5の参照範囲を使用してマッチング
が調べられ、以下、同様にしてc、d方向のそれぞれの
クラスにより設定された辞書5の参照範囲を使用してマ
ッチングが調べられ、これらの結果の論理値から認識候
補文字が絞られる。そして、この認識部4での認識結果
は出力部7より出力される。
【0020】従って、このようにすれば大分類特徴抽出
部3でのペリフェラル特徴抽出で求められるa、b、
c、d各方向の特徴値よりクラス分けを行い、これら決
定されるクラスに基づいて辞書5の参照範囲を設定する
ようにしたので、従来、辞書に納められたすべての内容
を参照対象としていたものに比べ、辞書5の参照範囲を
必要最小限に絞り込むことができ、これにより文字認識
処理を高速に、しかも正確に行うことができる。
【0021】また、大分類特徴抽出部3で求められた特
徴値に応じて決定されるクラスの近傍の他のクラスにつ
いても辞書の参照範囲を設定するようにしたので、同じ
文字であってもフォントが異なり、a、b、c、dの各
方向の特徴値に応じたクラス分けに違いが出ることがあ
っても、正確に同じ文字として認識することが可能とな
り、認識精度を高めることもできる。なお、本発明は上
記実施例にのみ限定されず、要旨を変更しない範囲で適
宜変形して実施できる。
【0022】
【発明の効果】本発明によれば、文字認識に使用される
辞書の参照範囲を必要最小限に絞り込むことができ、印
刷文字に対する認識処理を高速に、しかも正確に行うこ
とができるようになる。
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成を示す図。
【図2】実施例の大分類特徴抽出部を説明するための
図。
【図3】実施例の大分類特徴抽出部に用いられる特徴値
の範囲とクラスの関係を示す図。
【図4】実施例を説明するための図。
【符号の説明】
1…入力部、2…メモリ、3…大分類特徴抽出部、4…
認識部、5…辞書、6…特徴抽出部、7…出力部、8…
制御部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文字データを入力する入力手段と、 この入力手段より入力される文字データを外接枠で囲い
    少なくとも2方向について外接枠から文字線に出会うま
    での間の面積を数値化し特徴値として求める手段と、 この手段により求められた特徴値に応じて決定されるク
    ラスに基づいて参照範囲が設定される辞書と、 前記入力される文字データの文字特徴を抽出する手段
    と、 前記辞書の参照範囲と前記抽出された文字特徴とをマッ
    チングしその認識結果を出力する手段とを具備したこと
    を特徴とする文字認識装置。
  2. 【請求項2】 特徴値に応じて決定されたクラスの近傍
    の他のクラスについても辞書の参照範囲を設定すること
    を特徴とする請求項1記載の文字認識装置。
JP4140596A 1992-06-01 1992-06-01 文字認識装置 Pending JPH05334493A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4140596A JPH05334493A (ja) 1992-06-01 1992-06-01 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4140596A JPH05334493A (ja) 1992-06-01 1992-06-01 文字認識装置

Publications (1)

Publication Number Publication Date
JPH05334493A true JPH05334493A (ja) 1993-12-17

Family

ID=15272379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4140596A Pending JPH05334493A (ja) 1992-06-01 1992-06-01 文字認識装置

Country Status (1)

Country Link
JP (1) JPH05334493A (ja)

Similar Documents

Publication Publication Date Title
EP0163377B1 (en) Pattern recognition system
US6950555B2 (en) Holistic-analytical recognition of handwritten text
TWI435276B (zh) 用以辨識手寫符號之方法及設備
US5621818A (en) Document recognition apparatus
Vellingiriraj et al. Recognition of ancient tamil handwritten characters in palm manuscripts using genetic algorithm
Ramteke et al. Tesseract OCR Recognition Based on Arabic Machine-Printed Document
JPH05334493A (ja) 文字認識装置
JP2675303B2 (ja) 文字認識方法
JP2867531B2 (ja) 文字サイズ認識装置
JPH028348B2 (ja)
JPH03150690A (ja) 文字認識装置
JP3725944B2 (ja) 文字認識装置
JP2995825B2 (ja) 日本語文字認識装置
JPS62281082A (ja) 文字認識装置
JPS6120180A (ja) 光学的文字認識装置
JPS63147287A (ja) 光学的文字認識装置
JPH0660227A (ja) 文字認識用辞書の作成方法とその辞書を用いた文字認識方法
JPS6318483A (ja) 光学的情報入力装置用文字認識方法
Scholar OPTICAL CHARACTER RECOGNITION FOR MULTI-FONT ENGLISH LANGUAGE FROM PRINTED DOCUMENTS
JPH03228195A (ja) 光学的文字認識装置
JPH06195508A (ja) 文字切り出し方法
JPS62103784A (ja) 文字読取装置
KV et al. Efficient Recognition of Telugu Characters Based on Critical Points Generated Using Morphological Methods
JPS5851390A (ja) 活字文字認識装置
JPS60217488A (ja) 文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050207

A131 Notification of reasons for refusal

Effective date: 20050315

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050614

A61 First payment of annual fees (during grant procedure)

Effective date: 20050614

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090624

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100624

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 5

Free format text: PAYMENT UNTIL: 20100624

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160624

Year of fee payment: 11