JPH0254386A - 光学的文字読取装置の文字認識装置 - Google Patents

光学的文字読取装置の文字認識装置

Info

Publication number
JPH0254386A
JPH0254386A JP63206087A JP20608788A JPH0254386A JP H0254386 A JPH0254386 A JP H0254386A JP 63206087 A JP63206087 A JP 63206087A JP 20608788 A JP20608788 A JP 20608788A JP H0254386 A JPH0254386 A JP H0254386A
Authority
JP
Japan
Prior art keywords
dictionary
character
matching
dictionaries
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63206087A
Other languages
English (en)
Inventor
Toyoshi Sato
佐藤 豊志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63206087A priority Critical patent/JPH0254386A/ja
Publication of JPH0254386A publication Critical patent/JPH0254386A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、光学的文字読取装置において文字パターンの
文字認識処理を行なう光学的文字読取装置の文字認識装
置に関する。
(従来の技術) 光学的文字読取装置は、読取対象の帳票から光学的に走
査することによって得られた帳票イメージから1文字毎
の文字パターンを検出し、この文字パターンについて辞
書とのマツチングを行なうことによって文字を認識して
いる。光学的文字読取装置において漢字認識を行なう場
合、漢字は複雑で文字数が多いことから2段階のマツチ
ングを行なうことによって認識処理の高速化を計ってい
る。まず、第1段階において文字の大まかな特徴に基づ
いた大分類用の辞書とのマツチングを行なう。この第1
段階の分類によって、候補文字を例えば1710〜1/
6程度に絞る。つぎに、第2段階において、第1段階の
マツチングによって残った候補文字について、認識用の
辞書との詳細な識別マツチングを行なう。こうして、認
識対象の文字パターンに対する最終認識結果を導くとい
う方法をとっている。
従って、例えば3000文字を読取対象とする光学的文
字読取装置では、第1段階の認識で300〜500の候
補文字に絞られる。次に、第1段階で残った候補文字に
ついて、それぞれの文字認識用辞書と認識対象の文字パ
ターンとの詳細なマツチングが行なわれ最終的な答えが
導がれる。
(発明が解決しようとする課題) このように、漢字認識を行なう場合、認識の対象となる
文字数は例えば2000〜3000文字と多く、第1段
階で候補文字を絞っても第2段階で200文字以上を対
象に詳細なマツチングを行なう必要があった。このため
、認識処理に要する時間が膨大なものとなっていた。
本発明は上記のような点に鑑みてなされたもので、文字
の認識処理を高速に行なうことが可能な光学的文字読取
装置の文字認識装置を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、文字パターンを格納する格納手段と、読取対
象文字群の分割による各集合を示す辞書を構成し、この
上位段の辞書に含まれる各集合のそれぞれの分割による
各集合を示す辞書を、分割による集合が単一の文字を示
すまで多段階に構成したツリー構造辞書とを備え、格納
手段に格納された文字パターンについてツリー構造辞書
の上位段の辞書とのマツチングを行ない、その結果、類
似性の高い上位段の辞書に含まれる下位段の辞書との識
別マツチングを順次最下位段まで行なうことによって文
字を認識するものである。
(作用) このようにして構成される光学的文字読取装置の文字認
識装置においては、文字パターンとの識別マツチングを
行なう辞書を、上位段の集合を示す辞書が下位段の文字
を全て含む辞書で構成されているツリー構造辞書とする
ことにより、認識マツチングを行なう回数を大2幅に減
少させる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる光学的文字読取装置の文字認識
装置の構成を示すブロック図である。第1図において、
文字パターンメモリ11は、読取対象の帳票を光学的に
走査することにより得られた帳票イメージから、1文字
毎に切出された文字パターンを格納する。ツリー構造辞
書12は、文字パターンメモリ11に格納された文字パ
ターンとのマツチングを行なうためのものである。この
ツリー構造辞書12は、高速に文字認識処理を行なうた
め、特別構造を有したものである。このツリー構造辞書
12については後で詳述する。マツチング回路13は、
文字パターンメモリ11に格納された文字パターンにつ
いて、ツリー構造辞書12との識別マツチングを行なう
ことにより文字を認識し、その認識結果を出力する。
次に、同実施例の動作を説明する。
まず、識別マツチングに用いられるツリー構造辞書12
について説明する。このツリー構造辞書12の構成を第
2図に示している。第1段目の辞書は、全読取対象文字
をある特徴に基づいて2つの集合に分類し、それぞれの
集合について辞書を構成する。第2段目辞書は、第1段
目辞書により分類されたそれぞれの集合を、さらに2つ
の集合に分類するある特徴に基づいて分類しく全体がら
すれば1/4)、それぞれについて辞書を構成する。し
たがって、下位レベルの辞書に含まれる文字は上位の辞
書に全て含まれる形で構成されている。同様にして、最
後の1文字辞書となる第0段目まで分類し辞書を構成す
る。また、Q段目を除く各段の辞書には、下位段の辞書
を示すアドレスを有している。したがって、識別マツチ
ングを行なう際、上位の辞書から、この辞書が含む下位
の辞書を最終レベルの第0段目まで順次呼出すことがで
きる。
このように構成されるツリー構造辞書12を用いた文字
認識処理を説明する。はじめに、文字パターンメモリ1
1に1文字分の文字パターンが格納されると、マツチン
グ回路13は、ツリー構造辞書の第1段目辞書の2つの
辞書とのマツチングをそれぞれ行なう。この結果、類似
性の高い方の辞書を選択する。つぎに、選択した辞書に
含まれる第2段目辞書の2つの辞書と文字パターンとの
マツチングを行なう。このように、2つに分類された辞
書とのマツチングをそれぞれ行ない、類似性の高い辞書
を選択し、その辞書の下位段の2つの辞書とのマツチン
グを行なう。この処理をツリー構造辞書12の1文字辞
書となるQ段目まで繰返す。これによって、最終的な文
字認識結果である答えを得ることができる。
このように、マツチングを行なう際の辞書の構造をツリ
ー構造とすることでマツチング回数を少なくしている。
すなわち、読取対象文字数がLの場合、総辞書数MはM
−2(L−1)となり、識別マツチングを行なう回数N
はN−2N−21oとなる。例えば、文字数L−409
6の場合では、0g2L−12となるためマツチング回
数Nは24となり従来方式と比較して大幅な高速化を計
ることができる。
このようにして、光学的文字読取装置の文字認識装置に
おいて、識別マツチングを行なう際に用いる辞書をツリ
ー・構造辞書12とすることにより、マツチング回数を
少なくすることができる。すなわち、ツリー構造辞書1
2は、全体の読取対象文字を2分割し、これを繰返すこ
とによって最後に唯一の文字に到達する構成となってい
る。したがって、総読取対象文字数がLの場合、辞書は
log 2 L段まで構成され、マツチング回数NはN
−2XQとして求められる。このように、マツチング回
数を大幅に減少させて、文字認識処理速度を著しく向上
させることができる。
、なお、ツリー構造辞書12の読取対象文字の集合分類
の際に基づくものは、唯一のものではなく文字群の組合
わせは複数の方法が考えられる。
[発明の効果] 以上のように本発明によれば、識別マツチングを行なう
際に用いる辞書の構造をツリー構造とすることにより、
マツチング回数を減少させることが可能となるので、文
字認識処理の処理速度を著しく向上させることが可能と
なるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の文字認識装置の構成を示すプロ・ツク図、第2図は同
実施例に用いられるツリー構造辞書の構造モデルを示す
図である。 11・・・文字パターンメモリ、12・・・ツリー構造
辞書、13・・・マツチング回路。 第1図 出願人代理人 弁理士 鈴 江 武 彦第2図

Claims (1)

  1. 【特許請求の範囲】 文字パターンを格納する格納手段と、 読取対象文字群の分割による各集合を示す辞書を構成し
    、この上位段の辞書に含まれる上記各集合のそれぞれの
    分割による各集合を示す辞書を、分割による集合が単一
    の文字を示すまで多段階に構成したツリー構造辞書と、 上記格納手段に格納された文字パターンについて上記ツ
    リー構造辞書の上位段の辞書とのマッチングを行ない、
    その結果、類似性の高い上記上位段の辞書に含まれる下
    位段の辞書との識別マッチングを順次最下位段まで行な
    うことによって文字を認識する文字認識手段とを具備し
    たことを特徴とする光学的文字読取装置の文字認識装置
JP63206087A 1988-08-19 1988-08-19 光学的文字読取装置の文字認識装置 Pending JPH0254386A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63206087A JPH0254386A (ja) 1988-08-19 1988-08-19 光学的文字読取装置の文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63206087A JPH0254386A (ja) 1988-08-19 1988-08-19 光学的文字読取装置の文字認識装置

Publications (1)

Publication Number Publication Date
JPH0254386A true JPH0254386A (ja) 1990-02-23

Family

ID=16517599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63206087A Pending JPH0254386A (ja) 1988-08-19 1988-08-19 光学的文字読取装置の文字認識装置

Country Status (1)

Country Link
JP (1) JPH0254386A (ja)

Similar Documents

Publication Publication Date Title
JPH0664631B2 (ja) 文字認識装置
JPH06187497A (ja) 文字認識方法
JPS58103075A (ja) 文字読取装置
JPH0254386A (ja) 光学的文字読取装置の文字認識装置
JPS60153574A (ja) 文字読取方法
JPS61272887A (ja) 文字認識方式
Wasalthilake et al. Improved Handwritten Character Recognition for Sinhala Language based on Convolutional Neural Networks
JPS59158482A (ja) 文字認識装置
JPS6146573A (ja) 文字認識装置
JPS61114388A (ja) 文字入力装置
JPS60254388A (ja) 光学的文字読取装置
JPS6095689A (ja) 光学的文字読取装置
JPH0262682A (ja) 文字認識方法
JPS6160189A (ja) 光学的文字読取装置
JPS61148585A (ja) 文字認識装置
JPH11126216A (ja) 図面自動入力装置
JPS59188783A (ja) 文字判定処理方式
JPS5960685A (ja) 光学的文字読取装置
JPH03189890A (ja) 複合語照合方法
JPH0326879B2 (ja)
JPS6191780A (ja) 文字認識装置
JPS5852267B2 (ja) 文字解析方式
JPH051514B2 (ja)
JPS61153781A (ja) 光学的文字読取装置
JPH04153788A (ja) 文字認識装置