JP3245415B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP3245415B2
JP3245415B2 JP17343590A JP17343590A JP3245415B2 JP 3245415 B2 JP3245415 B2 JP 3245415B2 JP 17343590 A JP17343590 A JP 17343590A JP 17343590 A JP17343590 A JP 17343590A JP 3245415 B2 JP3245415 B2 JP 3245415B2
Authority
JP
Japan
Prior art keywords
character
character string
word
string
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP17343590A
Other languages
English (en)
Other versions
JPH0462692A (ja
Inventor
亜由美 橘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP17343590A priority Critical patent/JP3245415B2/ja
Publication of JPH0462692A publication Critical patent/JPH0462692A/ja
Application granted granted Critical
Publication of JP3245415B2 publication Critical patent/JP3245415B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字認識装置において、パターンマッチン
グのような認識処理を行った結果に対し、文字の属性情
報及び単語知識を利用することにより、正確にかつ効率
良く文字の認識を行う文字認識方法に関するものであ
る。
[従来の技術] 従来の文字認識装置において、「0(数字)」と「O
(アルファベット)」、「1(数字)」と「l(アルフ
ァベット)」、「2(数字)」と「Z(アルファベッ
ト)」など、形状が全く同じ文字(同形文字)や、形状
が類似している文字(類似文字)を正確に識別するのは
非常に困難である。そこで、このような文字を認識する
ために、形状による認識結果に対し、言語知識などを利
用した後処理を施している。例えば、N文字からなる入
力単語の各文字を認識する場合、従来は、各候補文字の
N文字分の組合せによって文字列を生成し、単語辞書と
の照合に成功した文字列を認識単語と決定していた。
[発明が解決しようとする課題] しかしながら、この方法では認識部で得られる候補文
字の数が多い場合、その組合せが膨大になるため、単語
辞書との照合に多大な時間を要し、処理速度遅延の大き
な要因となっていた。
[課題を解決するための手段] 本発明は、読み取った画像データ中の文字列を構成す
る各文字パターンと辞書との照合を行い、各文字パター
ンの候補文字及び該文字の属性を抽出し、抽出された各
文字パターンの候補文字の全ての組み合わせに対し、前
記組み合わせた文字列が単語としての適性を有するか否
かを属性情報に基づいて判断し、単語としての適性を有
する文字列の組み合わせに対して単語辞書と照合し、一
致するものを認識結果とする構成とした。
作用 このようにすることによって、各文字の候補として適
切でない属性の候補が省かれるので、候補文字列の数が
少なくなる。
[実施例] 第1図は、本発明の一実施例における文字認識方法を
用いた文字認識装置の全体構成図である。1はN文字か
らなる入力単語の各文字の認識を行う認識部である。2
は認識部で得られる候補文字及び文字の属性情報を格納
する文字情報格納部である。3は文字情報格納部2に記
憶された各候補文字をN文字分組み合わせて、複数の文
字列を生成する文字列生成部である。4は文字情報格納
部2に記憶された文字列内の各文字の属性情報によっ
て、文字列が単語となりうる文字列属性を持つか否か判
定を行う文字列属性判定部である。5はアルファベット
等の組み合せで構成される単語を多数記憶した単語辞書
である。6は文字列属性判定部3で選択された文字列
と、単語辞書5との照合を行う単語照合部である。
以上のように構成された本実施例の文字認識方法につ
いて、第2図に示すフローチャートに従って、以下その
動作を説明する。
まず、step1において、認識部1で、入力文字パター
ンの認識処理を行い、複数の候補文字を求める。step2
において、候補文字及び文字の属性情報を文字情報格納
部2に格納する。文字の属性情報とは、例えば、その文
字が英小文字、英大文字、数字、その他のいずれである
かを表わすものである。次に、step3において、空白が
あるかどうか判断し、空白がなければ、step1に戻り、
次の入力文字パターンを認識する。空白があれば、step
4に移行する。step4において、文字列を生成するため
に、文字情報格納部2に格納された候補文字の組合せが
残っているならば、step5に移行し、残っていないなら
ば、step8に移行する。step5において、文字列生成部3
で、候補文字を組み合わせて文字列を生成し、組み合わ
された各文字の属性情報によって、文字列の属性情報を
求める。例として、「leave」という入力単語に対し、
認識部1で、第3図に示すような候補文字が得られたと
する。すると、各候補文字の組合せによって第4図に示
すような文字列が生成される。文字列の属性情報とは、
文字列が、英小文字列、英大文字列、数字列、混合文字
列のいずれであるかを表わすものであり、文字情報格納
部2で格納された文字の属性情報から求められる。すな
わち、文字列内の各文字の属性が、 1)英小文字、その他のいずれかである場合(ただし、
先頭文字は、英大文字でも良い)、英小文字列である。
2)英大文字、その他のいずれかである場合、英大文字
列である。
3)数字、その他のいずれかである場合、数字列であ
る。
4)上記1)2)3)以外である場合、混合文字列であ
る。
例えば、入力単語「leave」に対する候補文字から生
成された文字列の文字列属性は第4図のようになる。st
ep6において、文字列属性判定部4で、生成された文字
列が、単語となりうる適性な文字列属性を持つか否か、
すなわち、文字列が、英小文字列、英大文字列、数字列
のいずれかであれば、単語として適性な文字列属性を持
つと判定され、混合文字列であれば、単語として不適な
文字列属性を持つと判定される。例えば、第4図で示さ
れる文字列のうち、単語として適性であると判定される
文字列は、文字列属性情報より、「Ieave」、「leave」
である。単語として適性であると判定されれば、step7
に移行し、そうでなければ、step4に戻り、次の文字列
を生成できるかどうかチェックする。
step7において、単語照合部6で、文字列と単語辞書
5との照合を行い、単語として登録されていれば、step
9において、その文字列を認識単語として出力し、処理
を終了する。単語辞書5との照合に失敗した場合、step
4に戻り、次の文字列を生成できるかどうかチェックす
る。例えば、「leave」は、単語辞書に存在するが、「I
eave」は、単語辞書には存在しないため、「leave」を
認識単語として決定する。
全ての文字列が、文字列属性判定及び単語照合で失敗
した場合は、step8において、文字情報格納部2で格納
された第1候補文字を組み合わせて文字列を生成し、st
ep9に移行する。( [発明の効果] 本発明は、各文字パターンの候補文字の全ての組み合
わせに対し、前記組み合わせた文字列が単語としての適
性を有するか否かを属性情報に基づいて判断し、単語と
しての適性を有する文字列の組み合わせに対して単語辞
書と照合するので、候補文字を組み合わせた文字列が単
語としての適性を有するか否かという点から候補文字列
を絞り込むことができると共に、単語としての適性をも
たないものは単語辞書を参照する前に排除されるので、
文字認識の速度及び精度が向上する。
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識方法を用い
た文字認識装置の全体構成図、第2図は本実施例の制御
手順を示すフローチャート、第3図は入力単語「leav
e」に対する候補文字例の例を示す図、第4図は文字列
生成例及び文字列属性を示す図である。 1……認識部、2……文字情報格納部、3……文字列生
成部、4……文字列属性判定部、5……単語辞書、6…
…単語照合部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】候補文字列を単語辞書と照合して認識単語
    として出力する文字認識方法であって、 読み取った画像データ中の文字列を構成する各文字パタ
    ーンと辞書との照合を行い、 各文字パターンの候補文字及び各候補文字の属性を抽出
    し、 抽出された各文字パターンの候補文字の全ての組み合わ
    せに対し、前記各候補文字の属性情報に基づいて前記組
    み合わせた文字列が単語となりうる文字列属性を有する
    か否かを判断し、 単語としての適性を有する文字列の組み合わせに対して
    単語辞書と照合する、ことを特徴とする文字認識方法。
JP17343590A 1990-06-29 1990-06-29 文字認識方法 Expired - Lifetime JP3245415B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17343590A JP3245415B2 (ja) 1990-06-29 1990-06-29 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17343590A JP3245415B2 (ja) 1990-06-29 1990-06-29 文字認識方法

Publications (2)

Publication Number Publication Date
JPH0462692A JPH0462692A (ja) 1992-02-27
JP3245415B2 true JP3245415B2 (ja) 2002-01-15

Family

ID=15960414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17343590A Expired - Lifetime JP3245415B2 (ja) 1990-06-29 1990-06-29 文字認識方法

Country Status (1)

Country Link
JP (1) JP3245415B2 (ja)

Also Published As

Publication number Publication date
JPH0462692A (ja) 1992-02-27

Similar Documents

Publication Publication Date Title
US5029223A (en) Constraint driven-on line recognition of handwritten characters and symbols
JP4568774B2 (ja) 手書き文字認識で使用されるテンプレートを生成する方法
JPH05108883A (ja) 文字認識方法及び装置
JPH0684006A (ja) オンライン手書き文字認識方法
Khirbat OCR post-processing text correction using simulated annealing (OPTeCA)
JP3245415B2 (ja) 文字認識方法
JPH0256086A (ja) 文字認識の後処理方法
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH0475552B2 (ja)
JP2839515B2 (ja) 文字読取システム
KR100356503B1 (ko) 학습형문자인식장치
JP3151866B2 (ja) 英文字認識方法
JPS61107486A (ja) 文字認識後処理方式
JP2637762B2 (ja) パターン詳細同定方式
Marukawa et al. A post-processing method for handwritten Kanji name recognition using Furigana information
JPH08137668A (ja) 類似単語検索のための有限オートマトン作成方法
JPH11120294A (ja) 文字認識装置および媒体
JP3007697B2 (ja) 単語照合装置及び単語照合方法
JP2639314B2 (ja) 文字認識方式
JPS63138479A (ja) 文字認識装置
JPH0546806A (ja) 文字認識方法
JPS62285189A (ja) 文字認識後処理方式
JPH05298489A (ja) 文字認識方式
JPH0458381A (ja) 光学的文字読取装置
JPS63268082A (ja) パタ−ン認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081026

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091026

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091026

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101026

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101026

Year of fee payment: 9