JPH08263594A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH08263594A
JPH08263594A JP7060925A JP6092595A JPH08263594A JP H08263594 A JPH08263594 A JP H08263594A JP 7060925 A JP7060925 A JP 7060925A JP 6092595 A JP6092595 A JP 6092595A JP H08263594 A JPH08263594 A JP H08263594A
Authority
JP
Japan
Prior art keywords
character
category
feature
pattern
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7060925A
Other languages
English (en)
Inventor
Naoto Aoki
直人 青木
Shizuko Kawada
志津子 川田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7060925A priority Critical patent/JPH08263594A/ja
Publication of JPH08263594A publication Critical patent/JPH08263594A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 不読文字の少ない光学式文字読取装置を提供
する。 【構成】 キャラクタセット11を、読み取るべき文字
を特定する変形パタ−ンの形状の特徴で構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は帳票上の文字等を読み取
る光学式文字読取装置に関する。
【0002】
【従来の技術】従来の光学式文字読取装置の構造につい
て図面を参照しながら説明する。図12は従来例の辞書
の構成を示す説明図、図13は従来例の辞書の一部の構
成を示す説明図、図14は従来例のキャラクタセットを
示す説明図である。なお、図13は図12に示す辞書と
同様の辞書の具体例である。
【0003】図12において、光学式文字読取装置内に
設けられた辞書2は、カテゴリ「C」とサブカテゴリ
「sC」と変形パタ−ン「P」と特徴部「T」とから構
成されている。カテゴリ「C」は「C1」から「CN」
までN個設けられており、読み取る文字の文字コ−ドを
示すものである。サブカテゴリ「sC」はカテゴリ
「C」の示す文字コ−ドが示す文字の変形毎に設けられ
た各変形パタ−ン「P」に付けられた名称であり、各カ
テゴリ「C」に対して変形パタ−ン「P」とサブカテゴ
リ「sC」とは同じ数だけ複数(N個)設けられてい
る。
【0004】なお、サブカテゴリ「C1−1」はカテゴ
リ「C1」の1つの変形パタ−ン「P]を示し、サブカ
テゴリ「C1−2」はサブカテゴリ「C1−1」以外の
カテゴリ「C1」の変形パタ−ン「P」を示している。
そして、このサブカテゴリ「sC」と変形パタ−ン
「P」の数は、カテゴリ「C」によって異なる。
【0005】特徴部「T」を構成している複数の特徴
「t(t1からtnまで)」は、変形パタ−ン「P」の
特徴を表すデ−タであり、読み取るべき文字の文字パタ
−ンの特徴抽出結果と照合するものである。なお、特徴
「t」により、変形パタ−ン「P」の形状が特定され
る。
【0006】そして、図示せぬ認識部により、あるサブ
カテゴリ「sC」の特徴部「T」に格納されている特徴
「t」(この特徴「t」はサブカテゴリ「sC」毎に異
なる)と、読み取るべき文字の文字パタ−ンから抽出さ
れた特徴抽出結果とが照合され、その特徴部「t」に格
納されている全ての特徴「t」が、前記特徴抽出結果と
一致すると、読み取るべき文字はそのサブカテゴリ「s
C」と一致すると判断される。なお、それぞれのサブカ
テゴリ「sC」において、特徴部「T」に格納されてい
る特徴「t」は、そのサブカテゴリ「sC」の変形パタ
−ン「P」を特定するのに必要な最小限の数だけしか格
納されていない。また、特徴部「T」に格納されている
特徴「t」のみが、文字パタ−ンの特徴抽出結果と特徴
部「T」とを照合する際に照合される。そして、格納さ
れていない特徴「t」は、照合対象とはならない。
【0007】例えば、図13に示すサブカテゴリ「1−
1」において、この変形パタ−ン「P」の特徴「t」は
「B、E、G、Y」である。特徴部「T」には、特徴
「t」として「B、E、G、Y」が格納されているの
で、認識部10は、ある文字パタ−ンとサブカテゴリ
「1−1」の特徴「t」とを照合する際に、特徴「B、
E、G、Y」の全てとその文字パタ−ンの特徴抽出結果
とが一致するか否かを判断する。全ての特徴「t」がそ
の文字パタ−ンの特徴抽出結果と一致すると、図示せぬ
認識部は、その文字パタ−ンはサブカテゴリ「1−1」
と一致したと判断する。一方、特徴「B、E、G、Y」
の中で、1つでも一致しない特徴「t」があれば、認識
部10は、その文字パタ−ンは、サブカテゴリ「1−
1」とは一致しないと判断する。
【0008】図14に示すキャラクタセット5は、読取
対象を示す情報から成るものであり、本従来例では、読
取る文字のカテゴリ「C」を限定するものである。そし
て、このキャラクタセット5は、光学式文字読取装置内
に設けられた認識部に記憶されている。キャラクタセッ
ト5にはカテゴリ「C1」から「CN」の中から選ばれ
たM個が集められている。なお、このキャラクタセット
5内に入っていないカテゴリ「C」の文字を読み取るこ
とは不可能である。従って、辞書2の中から読取りに必
要な文字だけキャラクタセット5に集めておけば、辞書
2の全ての文字の中から、読み取ろうとする文字を選択
するよりも、読取精度が向上し、読み間違いが少なくな
る。
【0009】このキャラクタセット5へのカテゴリ
「C」の設定方法は、オペレ−タがキャラクタセット5
内に集めたいカテゴリ「C」を選択して、上記認識部と
回線で接続されているホストに入力する。すると、ホス
トから認識部に、選択されたカテゴリ「C」が送信され
てきて、キャラクタセット5に集められる。
【0010】次に図12に示す辞書2と図14に示すキ
ャラクタセット5を用いて、ある帳票上の文字を読み取
る光学式文字読取装置の読取動作について説明する。
【0011】ある帳票上の文字を読み取る際、帳票上の
文字列はセンサにより画像として光電変換され、図示せ
ぬイメ−ジメモリへ取り込まれる。すると、図示せぬ制
御部によりイメ−ジメモリの文字画像が1文字ずつ切り
出され、1文字パタ−ンとして認識部に送信される。そ
して、図12に示す辞書2のカテゴリ「C」の先頭iす
なわちCi(この場合「C1」)を参照する設定が行わ
れ、認識部により、カテゴリ「C1」のサブカテゴリ
「C1−1」から「C1−N」までの各変形パタ−ン
「P」と、送信されてきた文字パタ−ンとが照合され
る。
【0012】そして、文字パタ−ンの特徴抽出結果と、
各変形パタ−ン「P」の特徴部「T」の全ての特徴
「t」が一致したサブカテゴリ「sC」があるか否かが
判断され、一致したサブカテゴリ「sC」がある場合に
は、認識部10によって、当該サブカテゴリ「sC」の
カテゴリ「C1」が図14に示すキャラクタセット5に
あるか否かが判断される。そして、該カテゴリ「C1」
がキャラクタセット5にあれば、次に、以前にカテゴリ
が採用されていれるか否か判断されて、以前に採用され
ていなければ(なお、この場合、先頭のカテゴリ「C
1」なので、以前に採用されていることはない)、該カ
テゴリ「C1」が採用される。
【0013】そして、辞書2を全カテゴリ「C」に渡っ
て照合したならば、処理は終了となり、処理終了の時点
で、採用されたカテゴリ「C」がある場合(この場合、
カテゴリ「C1」)、該カテゴリ「C1」の文字コ−ド
の文字が、送信された文字パタ−ンの読取結果となる。
【0014】一方、以前にカテゴリ「C」が採用されて
いるか否かが判断された際に、以前に、他のカテゴリ
「C」が採用されていれば、採用されたカテゴリ「C」
の採用取消が行われ、処理が終了となる。なお、この場
合、読取結果は、不読となる。
【0015】
【発明が解決しようとする課題】上記従来の光学式文字
読取装置においては、図15に示すような帳票上の文字
(a)を読取る際に以下に述べるような問題点があっ
た。この図15に示す文字(a)を図13に示す辞書
と、図16に示すキャラクタセット5で読取ることとす
る。なお、図16は図14に示すキャラクタセット5の
具体例である。なお、図17は従来例の特徴照合状態を
示す説明図である。
【0016】なお、以下に示す特徴「A」は、A点から
見た3点の距離が、A点からどのような関係になってい
るかを示しており、特徴「B」、「G」、「V」はB、
G、V方向から見た文字の形状を示しており、また、特
徴「X」は文字の太さが太いことを示している。
【0017】サブカテゴリ「1−2」の特徴「t」は、
「A、B、G、X」なので、図17に示すように、帳票
上の文字(a)をサブカテゴリ「1−2」の特徴「A、
B、G、X」と照合させる。すると、帳票上の文字
(a)の特徴抽出結果は、特徴「A、B、G、X」の全
てに照合することになる。一方、帳票上の文字(a)の
特徴抽出結果をサブカテゴリ「7−3」の特徴「A、
B、G、V」と照合させると、この特徴「A、B、G、
V」の全てにも照合することになる。
【0018】従って、読取を行うと、帳票上の文字
(a)は、図13に示すサブカテゴリ「1−2」とサブ
カテゴリ「7−3」と一致する読取となってしまう。
【0019】すなわち、サブカテゴリ「sC」の特徴部
「T」に格納されている特徴「t」の全てが帳票上の文
字(a)から抽出された特徴抽出結果と一致すると、帳
票上の文字(a)はそのサブカテゴリ「sC」と一致す
ると判断されてしまう。
【0020】その結果、読み取らせようとしても、カテ
ゴリ「1」と「7」の両方に一致してしまい、その結
果、カテゴリ「7」と一致した際に、以前採用された他
のカテゴリ「5」があるので、カテゴリ「5」は不採用
となり、読取結果が「なし」となる「?」となり、不読
となってしまうという問題点があった。
【0021】一方、読み取る文字の形状毎、例えば明朝
体、ゴシック体毎に異なる辞書2を設け、読み取るべき
文字の形状に合わせて辞書を変えれば、上記問題は解決
されるが、辞書2の数が増えてしまうという問題点があ
った。
【0022】
【課題を解決するための手段】上記課題を解決するため
に本発明で設けた解決手段は、所定の文字を示すカテゴ
リと、該カテゴリによって示される文字と対応して設け
られ、該文字と類似する変形パタ−ンと、該変形パタ−
ンの形状を特定する特徴から構成された特徴部と、各変
形パタ−ン毎に付せられたサブカテゴリとで辞書を構成
し、読取対象を示す情報から成るキャラクタセットを記
憶しておき、文字画像から切り出された文字パタ−ンと
前記辞書に格納された変形パタ−ンの形状を特定する特
徴とを照合し、その照合により一致し、かつ該変形パタ
−ンに対応する情報が前記キャラクタセットに設定され
ていた場合、該変形パタ−ンに対応する文字を採用する
認識部を備えた光学式文字読取装置において、上記キャ
ラクタセットを、読み取るべき文字を特定する変形パタ
−ンの形状の特徴から構成したものである。
【0023】
【作用】キャラクタセットを、読み取るべき文字を特定
する変形パタ−ンの形状の特徴から構成しておく。そし
て、ある文字を読み取る場合、読み取られた文字画像か
ら切り出された文字パタ−ンと辞書に格納されたサブカ
テゴリが示す変形パタ−ンの特徴とを照合する。
【0024】ここで、一致があれば、一致した変形パタ
−ンの特徴部に集められた特徴が、キャラクタセットに
含まれているか否かを判断し、キャラクタセットに集め
られている特徴と一致すれば、その特徴を含むカテゴリ
が採用され、そのカテゴリの文字コ−ドの文字が読取結
果となる。
【0025】一方、一致があっても、その一致した変形
パタ−ンの特徴部に集められた特徴が、キャラクタセッ
トに集められている特徴と一致しなければ、その特徴を
含むカテゴリは採用されない。
【0026】従って、異なるカテゴリに渡って特徴部の
全ての特徴と一致する文字であっても、読み取ることが
できる。
【0027】
【実施例】本発明の実施例について図面を参照しながら
説明する。なお、各図面に共通な要素には同一の符号を
付す。
【0028】第1実施例 図1は本発明に係る第1実施例のキャラクタセットを示
す説明図、図2は第1実施例の光学式文字読取装置の構
成を示す説明図、図3は第1実施例の表示部を示す説明
図、図4は第1実施例のキャラクタセットの一例を示す
説明図、図5、図6は第1実施例の変形パタ−ンと特徴
を示す説明図である。なお、従来例と同様の図面の説明
は省略する。
【0029】図2において、帳票7上の文字等を読み取
る光学式文字読取装置1は、帳票7上の文字等を光電変
換するセンサ6を有しており、このセンサ6は、光電変
換された文字画像を取り込むイメ−ジメモリ8に接続さ
れている。このイメ−ジメモリ8は制御部9に接続され
ており、この制御部9により光学式文字読取装置1が制
御されている。制御部9にはまた、認識部10が接続さ
れており、制御部9により、イメ−ジメモリ8に取り込
まれた文字画像が1文字ずつ切出され、認識部10に送
信される。認識部10には辞書2が接続されており、認
識部10は送信された文字パタ−ンから特徴を抽出し
て、その特徴抽出結果と辞書2とを照合し、所定の計算
を行って、文字のカテゴリを決定し、回線15を介して
ホスト16に読取結果を送信する。ホスト16には、ホ
スト16を制御する制御部17が設けられており、この
制御部17には、表示部18と入力部19とが接続され
ている。なお、辞書2の構成は図12に示す従来例と同
様なので説明は省略する。
【0030】図1に示すキャラクタセット11は認識部
10に記憶されており、このキャラクタセット11は図
12に示す辞書2のカテゴリ「C」の特徴「t」に対す
るキャラクタセットである。このキャラクタセット11
に特徴「t」を設定するには、まず、ホスト16を扱う
オペレ−タが光学式文字読取装置1で読み取るべき文字
の形状(例えば、明朝体、ゴシック体等)を図3に示す
表示部18を見て選択、この場合(ア)、(イ)、
(ウ)の中から1つ選択し、入力部19から選択した
(ア)、(イ)、(ウ)のうちの1つを入力する。
【0031】すると、制御部17が、入力部19からの
入力情報の処理を行い、その選択された文字の形状を特
定する変形パタ−ン「P」の特徴「t」、すなわち異な
るカテゴリ「C」において特徴部「T」に集められた全
ての特徴「t」と一致する文字パタ−ンであって、読み
取るべき文字のカテゴリ「C」に含まれ、該カテゴリ
「C」とは異なるカテゴリ「C」には含まれない特徴
「t」を、キャラクタセット11に集める特徴「t」と
して、認識部10に送信する。このとき、キャラクタセ
ット11は空白にして送信されてくるデ−タを待ってい
る。このようにして、キャラクタセット11に、選択さ
れた特徴「t」が集められることになる。
【0032】なお、図13に示す辞書2の特徴部「T」
に集められた特徴「t」において、図5、図6に示すよ
うに、特徴「E」は、E点から見た3点の距離が、E点
からどのような関係になっているかを示している。特徴
「F」、「W」はF、W方向から見た文字の形状を示し
ており、特徴「D」は文字の底部の長さを示している。
また、特徴「Y」は文字の底部と文字の側部の長さの比
を示している。更に、特徴「Z」は文字の上部の一方の
端部と下部の一方の端部とが、文字の縦方向で、同じ地
点にあることを示している。なお、以前に説明した特徴
「T」と同じ特徴「T」の説明は省略してある。
【0033】これらの特徴「t」が、図13に示す辞書
2のサブカテゴリ「1−1」、「1−2」、「1−
3」、「7−1」、「7−2」、「7−3」の形状を特
定する特徴「t」として辞書2の特徴部「T」にそれぞ
れ集められており、文字のカテゴリ「C」を決定する際
に、読み取るべき文字の特徴抽出結果と、あるサブカテ
ゴリ「sC」の特徴部「T」に集められた特徴「t」と
を照合して、読み取るべき文字に、そのサブカテゴリ
「sC」に含まれる特徴「t」が全てあるか否かが認識
部10によって判断される。そして、全ての特徴「t」
が読み取るべき文字と一致すると、読み取るべき文字
は、その特徴部「T」のサブカテゴリ「sC」を含むカ
テゴリ「C」であると判断される。
【0034】そして、図1に示すキャラクタセット11
においては、特徴「T」を、「t1」と「t4」、そし
て、「t4」から「tM」までに限定している。なお、
キャラクタセット11は、認識部10の外部に記憶され
ていてもよい。
【0035】以上のように、キャラクタセット11内で
特徴「t」を限定することにより、異なるカテゴリ
「C」に渡って、特徴部「T」に集められた全ての特徴
「t」と一致する文字であっても、読み取ることができ
るようになる。
【0036】このキャラクタセット11を図4に示す具
体例で説明する。図4に示すキャラクタセット11で
は、特徴「t」を「X」のみに限定している。以上のよ
うな構成にすることにより、特徴「X」を含むカテゴリ
「C」のみが採用されることになり、異なるカテゴリ
「C」で、特徴部に集められた全ての特徴「t」が一致
する文字であっても、特徴「X」を含まないカテゴリ
「C」は、読み取ることができないようになる。
【0037】なお、上記図4に示すキャラクタセット1
1の設定には、オペレ−タが、図3に示す表示部18か
ら(イ)の文字の形状を選択して入力部19から入力す
る。すると、図2に示す制御部17が、その選択された
文字を特定する変形パタ−ン「P」の特徴「X」を、キ
ャラクタセット11に集める特徴「X」として、認識部
10に送信する。すると、このとき、キャラクタセット
11は空白にして送信されてくるデ−タを待っているの
で、このキャラクタセット11に、選択された特徴
「X」が集められ、キャラクタセット11が作成される
ことになる。
【0038】次に上記構成における光学式文字読取装置
1の処理手順について、図7に示す帳票7上の文字列を
図13に示す辞書と、図4に示すキャラクタセット11
で、図8のフロ−チャ−トに従って読み取ることとす
る。図7は第1実施例の読取文字例を示す説明図、図8
は第1実施例の処理手順を示すフロ−チャ−トである。
図7に示す帳票上7の文字列がセンサ6により画像とし
て光電変換されると、イメ−ジメモリ8へ取り込まれ
る。すると、ステップS1で、制御部9がイメ−ジメモ
リ8の文字画像を1文字ずつ切り出し、ここでは帳票7
上の文字(a)を、1文字パタ−ンとして認識部10に
送信する。ステップS2で、辞書2のカテゴリ「C」の
先頭iすなわちこの場合「1」を参照する設定を行う。
ステップS3で、認識部10がカテゴリ「1」のサブカ
テゴリ「1−1」から「1−3」までのそれぞれのサブ
カテゴリ「sC」の変形パタ−ン「P」の特徴部「T」
の特徴「t」と、送信されてきた文字パタ−ンとを照合
する。ステップS4で、文字パタ−ンの特徴抽出結果
と、特徴部「T」の全ての特徴「t」が一致したサブカ
テゴリ「sC」があるか否か判断して、「否」なので、
ステップS8に進む。ステップS8で、辞書2を全カテ
ゴリ「C」に渡って照合したか否かを判断する。「否」
なので、ステップS9に進む。ステップS9で次のカテ
ゴリ「7」を参照するように設定し、ステップS3に戻
る。
【0039】ステップS3で、認識部10がカテゴリ
「7」のサブカテゴリ「7−1」から「7−3」までの
それぞれのサブカテゴリ「sC」の変形パタ−ン「P」
の特徴部「T」の特徴「t」と、送信されてきた文字パ
タ−ンとを照合する。ステップS4で、文字パタ−ンの
特徴抽出結果と、特徴部「T」の全ての特徴「t」が一
致したサブカテゴリ「sC」があるか否か判断して、一
致したサブカテゴリ「7−2」があるのでステップS5
に進む。
【0040】ステップS5で、認識部10は、サブカテ
ゴリ「7−2」の特徴「A、B、F、X」の中で、キャ
ラクタセット11内の特徴「X」と一致するものがある
か否か判断する。サブカテゴリ「7−2」の特徴「A、
B、F、X」の中で特徴「X」が、キャラクタセット1
1内の特徴「X」と一致するので、ステップS6に進
む。ステップS6で、以前にカテゴリ「C」が採用され
ているか否か判断して、以前に採用されていないのでス
テップS7に進む。ステップS7で、サブカテゴリ「7
−2」のあるカテゴリ「7」を採用する。ステップS8
で、辞書2を全カテゴリ「C」に渡って照合したか否か
を判断する。「否」なので、ステップS9に進む。ステ
ップS9で次のカテゴリ「C」を参照するように設定
し、ステップS3に戻る。
【0041】上記ステップS3からステップS9までの
処理を繰り返し行い、ステップS8で辞書2を全カテゴ
リ「C」に渡って照合したのならば、処理を終了とし、
採用されたカテゴリ「7」の文字コ−ドの文字が、入力
された文字パタ−ンの読取結果となる。そして、認識部
10は、カテゴリ「7」の文字コ−ドを図2に示すホス
ト16に送信する。すると、制御部17が文字コ−ドを
解析して、表示部18に文字「7」を表示する。
【0042】続いて帳票上7の文字(b)を読み取る場
合、ステップS1で、イメ−ジメモリ8に文字画像とし
て取り込まれている帳票上7の文字(b)を、制御部9
が切り出し、文字パタ−ンとして認識部10に送信す
る。ステップS2で、辞書2のカテゴリ「C」の先頭i
すなわちこの場合「1」を参照する設定を行う。ステッ
プS3で、認識部10がカテゴリ「1」のサブカテゴリ
「1−1」から「1−3」までのそれぞれのサブカテゴ
リ「sC」の変形パタ−ン「P」の特徴部「T」の特徴
「t」と、送信されてきた文字パタ−ンとを照合する。
【0043】ステップS4で、文字パタ−ンの特徴抽出
結果と、特徴部「T」の全ての特徴「t」が一致したサ
ブカテゴリ「sC」があるか否か判断して、「1−2」
と一致すると、ステップS5で、認識部10は、サブカ
テゴリ「1−2」の特徴「A、B、G、X」の中で、キ
ャラクタセット11内の特徴「X」と一致するものがあ
るか否か判断する。サブカテゴリ「1−2」の特徴
「A、B、G、X」の中で特徴「X」が、キャラクタセ
ット11内の特徴「X」と一致するので、ステップS6
に進む。ステップS6で、以前にカテゴリ「C」が採用
されているか否か判断して、以前に採用されていないの
でステップS7に進む。ステップS7で、サブカテゴリ
「1−2」のあるカテゴリ「1」を採用する。ステップ
S8で、辞書2を全カテゴリ「C」に渡って照合したか
否かを判断する。「否」なので、ステップS9に進む。
ステップS9で次のカテゴリ「7」を参照するように設
定し、ステップS3に戻る。
【0044】ステップS3で、認識部10がカテゴリ
「7」のサブカテゴリ「7−1」から「7−3」までの
それぞれのサブカテゴリ「sC」の変形パタ−ン「P」
の特徴部「T」の特徴「t」と、送信されてきた文字パ
タ−ンとを照合する。ステップS4で、文字パタ−ンの
特徴抽出結果と、特徴部「T」の全ての特徴「t」が一
致したサブカテゴリ「sC」があるか否か判断して、一
致したサブカテゴリ「7−3」があるのでステップS5
に進む。なお、該文字パタ−ンの特徴抽出結果と、サブ
カテゴリ「7−3」の全ての特徴「A、B、G、V」が
一致するとは、図17(b)に示す理由による。
【0045】ステップS5で、認識部10は、サブカテ
ゴリ「7−3」の特徴「A、B、G、V」の中で、キャ
ラクタセット11内の特徴「X」と一致するものがある
か否か判断する。サブカテゴリ「7−3」の特徴「A、
B、G、V」の中では、キャラクタセット11内の特徴
「X」と一致する特徴「t」がないので、ステップS8
に進む。従って、サブカテゴリ「7−3」のあるカテゴ
リ「7」は採用されないことになる。
【0046】上記ステップS3からステップS9までの
処理を繰り返し行い、ステップS8で辞書2を全カテゴ
リ「C」に渡って照合したのならば、処理を終了とし、
採用されたカテゴリ「1」の文字コ−ドの文字が、送信
された文字パタ−ンの読取結果となる。そして、認識部
10は、カテゴリ「1」の文字コ−ドを図2に示すホス
ト16に送信する。すると、制御部17が文字コ−ドを
解析して、表示部18に文字「1」を表示する。
【0047】以上第1実施例においては、読み取るべき
文字を特定する変形パタ−ン「P」の形状の特徴
「t」、すなわち異なるカテゴリ「C」において特徴部
「T」に集められた全ての特徴「t」と一致する文字パ
タ−ンであって、読み取るべき文字のカテゴリ「C」に
含まれ、該カテゴリ「C」とは異なるカテゴリ「C」に
は含まれない特徴「t」でキャラクタセット5を作成し
たので、特定の特徴「t」を備えた文字の読取のみが可
能となる。従って、異なるカテゴリ「C」において、特
徴部「T」の全ての特徴「t」と一致してしまう文字で
あっても、読み取ることが可能となり、不読文字の発生
が少なくなる。
【0048】また、辞書2には、複数種類の文字の形状
を示す変形パタ−ン「P」が備えられているので、辞書
2を、読取るべき文字の形状毎に複数設ける必要がな
い。その結果、辞書の数を増やさなくて済む。
【0049】第2実施例 次に本発明の第2実施例について図面を参照しながら説
明する。なお、上記第1実施例と同様な部分には同一符
号を付してその説明は省略する。図9は第2実施例のキ
ャラクタセットを示す説明図、図10は第2実施例のキ
ャラクタセットの一例を示す説明図、図11は第2実施
例の読取文字例を示す説明図である。なお、図10は図
9に示すキャラクタセットと同様のキャラクタセットの
具体例である。この第2実施例において、上記第1実施
例と異なる点は、キャラクタセット12の特徴「t」
を、カテゴリ「C」毎に構成している点である。
【0050】詳しくは、図9において、キャラクタセッ
ト12では、カテゴリ「C1」においては、特徴「t」
を「t1」、「t2」に限定し、また、カテゴリ「C
2」においては特徴「t」を「t3」に限定している。
カテゴリ「1」とカテゴリ「7」を一例として挙げる
と、図10に示すように、カテゴリ「1」においては、
特徴「t」を「X」に限定し、また、カテゴリ「7」に
おいては特徴「t」を「W」に限定している。すなわ
ち、キャラクタセット12の特徴「t」を、カテゴリ
「C」毎に構成している。
【0051】なお、このキャラクタセット12に特徴
「t」を設定するには、まず、ホスト16を扱うオペレ
−タが光学式文字読取装置1で読み取るべき文字の形状
を図2に示す表示部18を見て選択する。本実施例の場
合、オペレ−タは文字「1」については太い形状を選択
し、文字「7」については文字「7」の上部の左端が、
下方に向いている形状を選択して入力する。すると、制
御部17が、入力部19からの入力情報の処理を行い、
その選択された文字を特定する変形パタ−ン「P」の特
徴「t」、すなわち異なるカテゴリ「C」において特徴
部「T」に集められた全ての特徴「T」と一致する文字
パタ−ンであって、読み取るべき文字のカテゴリ「C」
に含まれ、該カテゴリ「C」とは異なるカテゴリ「C」
には含まれない特徴「t」をキャラクタセット11に集
める特徴「T」として、認識部10に送信する。このと
き、キャラクタセット11は空白にして送信されてくる
デ−タを待っている。
【0052】このようにして、キャラクタセット11
に、カテゴリ「1」、「7」毎に選択された特徴
「t」、この場合、カテゴリ「1」には特徴「X」が、
また、カテゴリ「7」には特徴「W」が集められること
になる。なお、図10に示すキャラクタセット12は図
2に示す認識部10に記憶されている。
【0053】次に上記構成における光学式文字読取装置
1の処理手順について、図11に示す帳票7上の文字列
を図13に示す辞書と、図10に示すキャラクタセット
12で、図8のフロ−チャ−トに従って読み取ることと
する。なお、図8に示すフロ−チャ−トにおいて、ステ
ップS1からステップS4までの処理と、ステップS6
からステップS10までの処理は上記第1実施例と同様
なので説明は省略する。 図10に示す帳票上7の文字
(a)と、帳票上7の文字(b)は、図8のフロ−チャ
−トに従って読み取ると、読取結果はそれぞれ帳票上7
の文字(a)は「1」、帳票上7の文字(b)は「7」
となる。
【0054】帳票7上の文字(a)を読取る際に、ステ
ップS4からステップS5に進んだ場合、ステップS5
で、認識部10は、キャラクタセット12内のカテゴリ
「1」においては、キャラクタセット12内の特徴
「t」は、「X」なので、サブカテゴリ「1−2」の特
徴「A、B、G、X」の中で、キャラクタセット11内
の特徴「X」と一致するものがあるか否か判断する。サ
ブカテゴリ「1−2」の特徴「A、B、G、X」の中で
特徴「X」が、キャラクタセット12内の特徴「X」と
一致するので、ステップS6に進む。
【0055】次に、帳票上の文字(b)を読取る際に、
ステップS5で、認識部10は、キャラクタセット12
内のカテゴリ「7」においては、サブカテゴリ「7−
1」の特徴「A、B、F、W」の中で、キャラクタセッ
ト12内の特徴「W」と一致するものがあるか否か判断
する。サブカテゴリ「7−1」の特徴「A、B、F、
W」の中で特徴「W」が、キャラクタセット12内の特
徴「W」と一致するので、ステップS6に進む。
【0056】以上第2実施例においては、上記第1実施
例と同様の効果が得られると共に、カテゴリ「C」別に
特徴「t」を指定したことにより、カテゴリ「C」毎に
読取るべき文字の形状を変えることができるので、汎用
性が向上する。
【0057】上記第1、第2実施例においては、光学式
文字読取装置、特に、認識の過程で、カテゴリを特定す
る際に、各カテゴリのサブカテゴリで構成し、サブカテ
ゴリは変形パタ−ンの特徴で構成される辞書を使用する
ものに対して本発明を適用したが、標準パタ−ンを変形
パタ−ンで構成した他の認識システム、例えば音声、指
紋、画像といった認識処理を持ったシステムにも適用す
ることができる。
【0058】
【発明の効果】本発明は、以上説明したように構成され
ているので以下に記載される効果を奏する。キャラクタ
セットを、読み取るべき文字を特定する変形パタ−ンの
形状の特徴から構成したことにより、異なるカテゴリ
で、特徴部に集められた全ての特徴と一致する文字があ
っても、読み取ることができるようになる。
【0059】従って、不読文字が少なくなり、その結
果、技術的に満足できる装置を提供することができる。
【図面の簡単な説明】
【図1】本発明に係る第1実施例のキャラクタセットを
示す説明図である。
【図2】第1実施例の光学式文字読取装置の構成を示す
説明図である。
【図3】第1実施例の表示部を示す説明図である。
【図4】第1実施例のキャラクタセットの一例を示す説
明図である。
【図5】第1実施例の変形パタ−ンと特徴を示す説明図
である。
【図6】第1実施例の変形パタ−ンと特徴を示す説明図
である。
【図7】第1実施例の読取文字例を示す説明図である。
【図8】第1実施例の処理手順を示すフロ−チャ−トで
ある。
【図9】第2実施例のキャラクタセットを示す説明図で
ある。
【図10】第2実施例のキャラクタセットの一例を示す
説明図である。
【図11】第2実施例の読取文字例を示す説明図であ
る。
【図12】従来例の辞書の構成を示す説明図である。
【図13】従来例の辞書の一部の構成を示す説明図であ
る。
【図14】従来例のキャラクタセットを示す説明図であ
る。
【図15】従来例の読取文字例を示す説明図である。
【図16】従来例のキャラクタセットの一例を示す説明
図である。
【図17】従来例の特徴照合状態を示す説明図である。
【符号の説明】
1 光学式文字読取装置 2 辞書 11、12 キャラクタセット

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 所定の文字を示すカテゴリと、該カテゴ
    リによって示される文字と対応して設けられ、該文字と
    類似する変形パタ−ンと、該変形パタ−ンの形状を特定
    する特徴から構成された特徴部と、各変形パタ−ン毎に
    付せられたサブカテゴリとで辞書を構成し、読取対象を
    示す情報から成るキャラクタセットを記憶しておき、文
    字画像から切り出された文字パタ−ンと前記辞書に格納
    された変形パタ−ンの形状を特定する特徴とを照合し、
    その照合により一致し、かつ該変形パタ−ンに対応する
    情報が前記キャラクタセットに設定されていた場合、該
    変形パタ−ンに対応する文字を採用する認識部を備えた
    光学式文字読取装置において、 上記キャラクタセットを、読み取るべき文字を特定する
    変形パタ−ンの形状の特徴から構成したことを特徴とす
    る光学式文字読取装置。
  2. 【請求項2】 上記キャラクタセットを、カテゴリ別に
    構成した請求項1記載の光学式文字読取装置。
  3. 【請求項3】 上記特徴は、異なるカテゴリにおいて特
    徴部に集められた全ての特徴と一致する文字パタ−ンで
    あって、読み取るべき文字のカテゴリに含まれ、該カテ
    ゴリとは異なるカテゴリには含まれない特徴である請求
    項1または2記載の光学式文字読取装置。
JP7060925A 1995-03-20 1995-03-20 光学式文字読取装置 Pending JPH08263594A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7060925A JPH08263594A (ja) 1995-03-20 1995-03-20 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7060925A JPH08263594A (ja) 1995-03-20 1995-03-20 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH08263594A true JPH08263594A (ja) 1996-10-11

Family

ID=13156460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7060925A Pending JPH08263594A (ja) 1995-03-20 1995-03-20 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH08263594A (ja)

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
JPS63155386A (ja) 帳票デ−タ読取装置
JPH06274680A (ja) 文書認識方法およびシステム
JPH08263594A (ja) 光学式文字読取装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPS62281082A (ja) 文字認識装置
JPH08212307A (ja) 光学式文字読取装置
JP3037727B2 (ja) Ocrシステム
JP2004164376A (ja) 識別コード添付帳票、帳票読取プログラム、及び帳票作成プログラム
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH0651900A (ja) オンライン文字入力装置
JPH10269311A (ja) 帳票処理単位指定方法
JPH03150690A (ja) 文字認識装置
JP2878772B2 (ja) 光学的文字読取装置
JPH06266889A (ja) 文書認識装置
JPH0944593A (ja) 文字認識制御装置
JP3077580B2 (ja) 文字読取装置
JP3045086B2 (ja) 光学式文字読取方法および装置
JPH0475186A (ja) 文字読取装置
JPH01259476A (ja) 文字読取装置
JPH08263591A (ja) 文字認識装置及び方法
JPH07113871B2 (ja) 情報処理装置
JPS63136292A (ja) 情報認識方式
JP2005114951A (ja) 図形ocr