JPH01277989A - 文字列パターン読み取り装置 - Google Patents
文字列パターン読み取り装置Info
- Publication number
- JPH01277989A JPH01277989A JP63107096A JP10709688A JPH01277989A JP H01277989 A JPH01277989 A JP H01277989A JP 63107096 A JP63107096 A JP 63107096A JP 10709688 A JP10709688 A JP 10709688A JP H01277989 A JPH01277989 A JP H01277989A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- candidate
- rectangle
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010354 integration Effects 0.000 claims description 22
- 238000005520 cutting process Methods 0.000 claims description 15
- 238000000926 separation method Methods 0.000 abstract description 8
- 230000011218 segmentation Effects 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 19
- 238000000034 method Methods 0.000 description 16
- 238000000605 extraction Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000011295 pitch Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、帳表等に記入された文字列パターンを読み取
る文字読み取り装置にIII L、、より詳細には、個
々の文字の記入間隔が不定な文字列パターンを読み取る
文字列パターン読み取り装置に関する。
る文字読み取り装置にIII L、、より詳細には、個
々の文字の記入間隔が不定な文字列パターンを読み取る
文字列パターン読み取り装置に関する。
近年、オフィスオートメーション化の発達に伴い、帳表
等に記入された文字をコンピュータ等を含む文字読み取
り装置で読み取って、文字を認識することが行われてい
る。
等に記入された文字をコンピュータ等を含む文字読み取
り装置で読み取って、文字を認識することが行われてい
る。
一般に、文字読み取り装置では、装置が個々の文字を切
り出して認識するために、文字を用紙に設定された文字
枠内に1文字ずつ正しく記入する必要があり、利用者に
対する大きな負担となっている。
り出して認識するために、文字を用紙に設定された文字
枠内に1文字ずつ正しく記入する必要があり、利用者に
対する大きな負担となっている。
このような負担を軽減するため、不定ピッチ(文字の記
入間隔が不定)で記入された文字列から文字を正しく切
り出して認識する方式が広く研究されている。従来、こ
の種の方式としては、(1)複数の切り出し仮説に対し
て文字認識を行い、その結果、最も高い得点を得た仮説
を選択する方式、■文字列パターンにおいて生じ得る文
字の接触分離の全ての組み合わせをパターン辞書(分離
接触パターン辞書)として用意しておく方式が知られて
いる。上記(1)は例えば、依田、松浦、前田、南部、
「手書き日本語文書からの文字切り出し方式」、電子通
信学会技術報告P RU 86−28、pD、63−7
2に記載されており、上記■は例えば特開昭61−95
481に記載されている。
入間隔が不定)で記入された文字列から文字を正しく切
り出して認識する方式が広く研究されている。従来、こ
の種の方式としては、(1)複数の切り出し仮説に対し
て文字認識を行い、その結果、最も高い得点を得た仮説
を選択する方式、■文字列パターンにおいて生じ得る文
字の接触分離の全ての組み合わせをパターン辞書(分離
接触パターン辞書)として用意しておく方式が知られて
いる。上記(1)は例えば、依田、松浦、前田、南部、
「手書き日本語文書からの文字切り出し方式」、電子通
信学会技術報告P RU 86−28、pD、63−7
2に記載されており、上記■は例えば特開昭61−95
481に記載されている。
第9図は、上記0)の従来技術を説明するための図であ
る。白/黒画素の集合として表現される入力文字列パタ
ーンは、黒画素の文字列と垂直方向への投影、及び黒画
素の連結性(連続性)に基づいて、第9図(A)に示す
ような文字パターン矩形(以下、単にパターン矩形とい
う)11〜14に分割される。次に、これらのパターン
矩形を第9図(B)の(a)〜(h)に示すように組み
合わせて文字切り出しの仮説を立て、これらに対して文
字認識を行う。各仮説を構成する各パターン矩形と標準
文字パターンとの間の照合に応じて各パターン矩形に得
点が与えられ、各パターン矩形の(す点の合計が、これ
らのパターン矩形で構成される仮説の得点となる。
る。白/黒画素の集合として表現される入力文字列パタ
ーンは、黒画素の文字列と垂直方向への投影、及び黒画
素の連結性(連続性)に基づいて、第9図(A)に示す
ような文字パターン矩形(以下、単にパターン矩形とい
う)11〜14に分割される。次に、これらのパターン
矩形を第9図(B)の(a)〜(h)に示すように組み
合わせて文字切り出しの仮説を立て、これらに対して文
字認識を行う。各仮説を構成する各パターン矩形と標準
文字パターンとの間の照合に応じて各パターン矩形に得
点が与えられ、各パターン矩形の(す点の合計が、これ
らのパターン矩形で構成される仮説の得点となる。
このようにして、各仮説ごとに得られる得点のうち、最
も高くなる仮説を読み取り結果として選択する。図示の
例では、第9図(B)の(a)に示す仮説以外のものは
、読み取り不可能なパターン矩形を含むため得点が低く
なる。この結果、第9図(B)の(a)に示す仮説が正
しい認識結果として選択される。
も高くなる仮説を読み取り結果として選択する。図示の
例では、第9図(B)の(a)に示す仮説以外のものは
、読み取り不可能なパターン矩形を含むため得点が低く
なる。この結果、第9図(B)の(a)に示す仮説が正
しい認識結果として選択される。
第10図は、上記[F]の従来技術を説明するための図
である。文字認識部21はパターン辞書として、通常の
1文字パターン以外に、文字列において生じ得る文字の
接触分離を全て考慮したパターン辞書(分離接触パター
ン辞書)を登録している。
である。文字認識部21はパターン辞書として、通常の
1文字パターン以外に、文字列において生じ得る文字の
接触分離を全て考慮したパターン辞書(分離接触パター
ン辞書)を登録している。
図示する例は「検出コに対するパターン辞書の要部を示
している。パターン辞書2i−iは正しく切り出された
場合のものである。また、パターン辞書21−2は「検
」の幅部分と労部分とが誤って切り出された場合のもの
である。更に、パターン辞書21−3は「検」の労部分
と「出」とが接触した場合のものである。
している。パターン辞書2i−iは正しく切り出された
場合のものである。また、パターン辞書21−2は「検
」の幅部分と労部分とが誤って切り出された場合のもの
である。更に、パターン辞書21−3は「検」の労部分
と「出」とが接触した場合のものである。
いま、「検」を第1文字とし、1゛出」を第2文字とし
て、第10図に示すように第1文字の幅部分22と、第
1文字の労部分と第2文字が接触した部分23とに誤っ
て切り出された文字パターン列が、文字認識部21に与
えられるとする。この場合、第1文字の幅部分22はパ
ターン辞書21−2の中に、部分23LLハターンil
;vIJ21−3(7)中に、それぞれ一致するパター
ンがみつかる。従って、この切り出しは誤りであること
がわかり、パターン辞fi21−1と一致するまで、切
り出し及び認識処理が行われる。
て、第10図に示すように第1文字の幅部分22と、第
1文字の労部分と第2文字が接触した部分23とに誤っ
て切り出された文字パターン列が、文字認識部21に与
えられるとする。この場合、第1文字の幅部分22はパ
ターン辞書21−2の中に、部分23LLハターンil
;vIJ21−3(7)中に、それぞれ一致するパター
ンがみつかる。従って、この切り出しは誤りであること
がわかり、パターン辞fi21−1と一致するまで、切
り出し及び認識処理が行われる。
しかしながら、上記従来技術には以下に述べる問題点が
ある。
ある。
上記(1)の従来技術では、第9図(B)に示した全て
のパターン矩形の組み合わせに対して文字;X識処理を
行うため、文字認識処理時間が大幅に増大する。第9図
(B)に示した例の場合では、パターン矩形の組み合わ
せ(11)、(12)。
のパターン矩形の組み合わせに対して文字;X識処理を
行うため、文字認識処理時間が大幅に増大する。第9図
(B)に示した例の場合では、パターン矩形の組み合わ
せ(11)、(12)。
(13)、(14)、(11−12)、(12−13)
、(13−14)、Ml−12−13)。
、(13−14)、Ml−12−13)。
(12−13−14)、(11−12−13−14)の
10個の矩形について文字認識を行う必要がある。
10個の矩形について文字認識を行う必要がある。
一方、上記■の従来技術では、認識対象とする全ての中
詰文字列について、分離接触の全ての場合を一尽したパ
ターン辞書を持たなくてはならず、辞書の規模が莫大に
なるとともに、辞書内の全てのパターンとの比較照合を
行うため、文字認識処理時間も同じく大幅に増大すると
いう問題点がある。
詰文字列について、分離接触の全ての場合を一尽したパ
ターン辞書を持たなくてはならず、辞書の規模が莫大に
なるとともに、辞書内の全てのパターンとの比較照合を
行うため、文字認識処理時間も同じく大幅に増大すると
いう問題点がある。
従って、本発明は上記問題点を解決し、不定ピッチで記
入された文字列パターンを、大幅な文字認識処理時間の
増加を招くことなく正しく読み取ることができる文字列
パターン読み取り装置を提供することを目的としている
。
入された文字列パターンを、大幅な文字認識処理時間の
増加を招くことなく正しく読み取ることができる文字列
パターン読み取り装置を提供することを目的としている
。
第1図は、本発明の原理ブロック図である。上記目的を
達成するため、本発明の文字列パターン読み取り装置は
第1図に示すように、次の構成要素を備えて構成される
。
達成するため、本発明の文字列パターン読み取り装置は
第1図に示すように、次の構成要素を備えて構成される
。
パターン切出し部31は、文字列パターンからパターン
矩形を切り出す。文字認識部32は、パターン矩形を予
め登録された標準文字パターンと比較して候補文字を出
力する。文字部分判定部33は、文字認識部32が出力
する候補文字を予め登録された文字部分(例えば、文字
の偏や労)と比較して、この候補文字が文字部分に相当
する可能性があるか否かを判定する。パターン統合部3
4は、文字部分判定部33の判定結果に基づぎ、該文字
部分に相当すると判定されたパターン矩形を、それに先
行するあるいは後続する一定範囲のパターン矩形と統合
して前記文字認識部32に送る。候補文字列選択部35
は、文字認識部32から出力される候補文字を組み合わ
せて候補文字列を生成し、最も確からしい候補文字列を
選択する。
矩形を切り出す。文字認識部32は、パターン矩形を予
め登録された標準文字パターンと比較して候補文字を出
力する。文字部分判定部33は、文字認識部32が出力
する候補文字を予め登録された文字部分(例えば、文字
の偏や労)と比較して、この候補文字が文字部分に相当
する可能性があるか否かを判定する。パターン統合部3
4は、文字部分判定部33の判定結果に基づぎ、該文字
部分に相当すると判定されたパターン矩形を、それに先
行するあるいは後続する一定範囲のパターン矩形と統合
して前記文字認識部32に送る。候補文字列選択部35
は、文字認識部32から出力される候補文字を組み合わ
せて候補文字列を生成し、最も確からしい候補文字列を
選択する。
イメージセンサ等から出力された文字列パターンは、パ
ターン切出し部31によりパターン矩形に切り出される
。切り出された各パターン矩形は、文字認識部32で、
予め登録された標準文、字パターンと比較され、各パタ
ーン矩形に対する候補文字が得られる。各候補文字は文
字部分判定部33に送られ、予め登録された文字部分、
例えば文字の偏や労と比較される。そして、比較結果に
より、候補文字が文字部分に相当する可能性があるか否
かが判定される。文字部分判定部33で得られた判定結
果は、パターン統合部34に送られる。パターン統合部
34では、この判定結果に基づき、この文字部分に相当
すると判定されたパターン矩形と、それに先行する(文
字部分が労の場合)あるいは後続する(文字部分が偏の
場合)一定範囲のパターン矩形とを統合する。統合され
たパターン矩形は文字認識部32に送られ、標準文字パ
ターンと比較される。そして、統合されたパターン矩形
の候補文字が得られる。以上のようにして、文字認識部
32から出力される候補文字は候補文字列選択部35に
送られ、候補文字を組み合わせて候補文字列を生成し、
最も確がらしい候補文字列を選択する。
ターン切出し部31によりパターン矩形に切り出される
。切り出された各パターン矩形は、文字認識部32で、
予め登録された標準文、字パターンと比較され、各パタ
ーン矩形に対する候補文字が得られる。各候補文字は文
字部分判定部33に送られ、予め登録された文字部分、
例えば文字の偏や労と比較される。そして、比較結果に
より、候補文字が文字部分に相当する可能性があるか否
かが判定される。文字部分判定部33で得られた判定結
果は、パターン統合部34に送られる。パターン統合部
34では、この判定結果に基づき、この文字部分に相当
すると判定されたパターン矩形と、それに先行する(文
字部分が労の場合)あるいは後続する(文字部分が偏の
場合)一定範囲のパターン矩形とを統合する。統合され
たパターン矩形は文字認識部32に送られ、標準文字パ
ターンと比較される。そして、統合されたパターン矩形
の候補文字が得られる。以上のようにして、文字認識部
32から出力される候補文字は候補文字列選択部35に
送られ、候補文字を組み合わせて候補文字列を生成し、
最も確がらしい候補文字列を選択する。
このように、本発明は文字列パターンにおいて、文字の
偏や労の分離が多く発生することに着目し、初期(1回
目)の切り出し処理で偏や労のみ分離して切り出された
場合、初期の切り出しで得られるパターン矩形の候補文
字を文字部分と比較することで文字の分離を検出し、前
後のパターン矩形と合わせて再度文字認識処理をして最
終的な候補文字列を17でいる。
偏や労の分離が多く発生することに着目し、初期(1回
目)の切り出し処理で偏や労のみ分離して切り出された
場合、初期の切り出しで得られるパターン矩形の候補文
字を文字部分と比較することで文字の分離を検出し、前
後のパターン矩形と合わせて再度文字認識処理をして最
終的な候補文字列を17でいる。
以下、本発明の一実施例を図面を参照して詳細に説明す
る。
る。
第2図は、本発明の一実施例のブロック構成図である。
第2図中、第1図と同一構成要素には同一の参照番号を
付しである。光電変換部3oは入力帳表を走査して、文
字列パターンを白/黒画素の集合として出力する。光電
変換部30は、例えばラインセンサで構成される。パタ
ーン切出し部31は白/黒画素の集合として得られる文
字列パターンから、個々のパターンを囲む矩形の並びを
抽出する。パターン切り出しは種々の方式が提案されて
おり、本実施例のパターン切出し部31は任意の方式を
用いることができる。例えば、白/黒画素の集合の主走
査方向(ラスクスキャン方向)の射影をとり、副走査方
向に黒画素が連続する範囲を1ラインとして切り出す。
付しである。光電変換部3oは入力帳表を走査して、文
字列パターンを白/黒画素の集合として出力する。光電
変換部30は、例えばラインセンサで構成される。パタ
ーン切出し部31は白/黒画素の集合として得られる文
字列パターンから、個々のパターンを囲む矩形の並びを
抽出する。パターン切り出しは種々の方式が提案されて
おり、本実施例のパターン切出し部31は任意の方式を
用いることができる。例えば、白/黒画素の集合の主走
査方向(ラスクスキャン方向)の射影をとり、副走査方
向に黒画素が連続する範囲を1ラインとして切り出す。
次に、切り出した1ラインの副走査方向の射影をとり、
主走査方向に黒画素が連続する範囲を1文字のパターン
矩形(パターン部分)として切り出す。尚、白画素のみ
の部分はパターン間部分となる。切り出された各文字の
パターン矩形は文字認識部32、及びパターン統合部3
4からの要求によりパターン統合部34に出力される。
主走査方向に黒画素が連続する範囲を1文字のパターン
矩形(パターン部分)として切り出す。尚、白画素のみ
の部分はパターン間部分となる。切り出された各文字の
パターン矩形は文字認識部32、及びパターン統合部3
4からの要求によりパターン統合部34に出力される。
文字認識部32は文字認識実行部32−1及び標準文字
パターン辞1J32−2を具備している。
パターン辞1J32−2を具備している。
標準文字パターン辞132−2は、予め決められている
標準文字のパターンを格納している。文字認識実行部3
2−1は、パターン切出し部31からのパターン矩形と
標準文字パターン辞書32−2に格納されている標準文
字パターンとを比較照合し、入力されたパターン矩形の
候補文字を文字部分判定部33及び候補文字列選択部3
5に出力する。この比較照合処理自体は従来からの種々
提案されており、任意のものを用いることができる。
標準文字のパターンを格納している。文字認識実行部3
2−1は、パターン切出し部31からのパターン矩形と
標準文字パターン辞書32−2に格納されている標準文
字パターンとを比較照合し、入力されたパターン矩形の
候補文字を文字部分判定部33及び候補文字列選択部3
5に出力する。この比較照合処理自体は従来からの種々
提案されており、任意のものを用いることができる。
文字認識実行部32−1はまた、パターン統合部34か
ら出力されるパターン矩形と標準文字パターンとを比較
し、候補文字を候補文字列選択部35に出力する。
ら出力されるパターン矩形と標準文字パターンとを比較
し、候補文字を候補文字列選択部35に出力する。
文字部分判定部33は、比較部33−1及び文字部分辞
書33 ・−2とを具備する。文字部分辞書33−2は
、漢字の偏として出現しうるパターンのコードを格納し
ている。第3図は文字部分辞書33−2の構成を示す図
で、図示する例では、さんずいに相当する「シ」、大幅
に相当する「イ」水幅に相当する「木」、手編に相当す
る1才」等が登録されている。比較部33−1は、文字
認識実行部32−1からの候補文字と福のコードとを比
較し、この候補文字が漢字の偏部分が分離して切り出さ
れたものか否かを判定する。判定結果はパターン統合部
34に出力される。
書33 ・−2とを具備する。文字部分辞書33−2は
、漢字の偏として出現しうるパターンのコードを格納し
ている。第3図は文字部分辞書33−2の構成を示す図
で、図示する例では、さんずいに相当する「シ」、大幅
に相当する「イ」水幅に相当する「木」、手編に相当す
る1才」等が登録されている。比較部33−1は、文字
認識実行部32−1からの候補文字と福のコードとを比
較し、この候補文字が漢字の偏部分が分離して切り出さ
れたものか否かを判定する。判定結果はパターン統合部
34に出力される。
パターン統合部34は読出し部34−1.判定部34−
2及びパターン統合演算部34−3とを具備する。読出
し部34−1は、文字部分判定部33の比較部33−1
からパターン矩形の候補文字が漢字の偏部分に相当する
旨の判定結果を受は取ると、パターン切出し部31から
このパターン矩形と、これに後続するパターン矩形とを
読み出し、これらを判定部34−2に出力する。判定部
34−2は、読み出したパターン矩形とこれに後続する
パターン矩形とを統合すべきか否かを判定する。ここで
、統合とは、パターン矩形の後端と、後続のパターン矩
形の先端とを結合して、1つのパターン矩形を形成する
ことを意味している。また、統合すべきか否かの条件は
、例えば2つのパターン矩形を統合したと仮定して得ら
れるパターン矩形の縦の長さhと横の長さWの比w/h
が一定のしきい値以内にあるか否かである。例えば、こ
の条件を0.5≦w/h≦2として規定することができ
る。すなわち、統合したパターン矩形が縦長になったり
、横長になった場合には統合しない。
2及びパターン統合演算部34−3とを具備する。読出
し部34−1は、文字部分判定部33の比較部33−1
からパターン矩形の候補文字が漢字の偏部分に相当する
旨の判定結果を受は取ると、パターン切出し部31から
このパターン矩形と、これに後続するパターン矩形とを
読み出し、これらを判定部34−2に出力する。判定部
34−2は、読み出したパターン矩形とこれに後続する
パターン矩形とを統合すべきか否かを判定する。ここで
、統合とは、パターン矩形の後端と、後続のパターン矩
形の先端とを結合して、1つのパターン矩形を形成する
ことを意味している。また、統合すべきか否かの条件は
、例えば2つのパターン矩形を統合したと仮定して得ら
れるパターン矩形の縦の長さhと横の長さWの比w/h
が一定のしきい値以内にあるか否かである。例えば、こ
の条件を0.5≦w/h≦2として規定することができ
る。すなわち、統合したパターン矩形が縦長になったり
、横長になった場合には統合しない。
パターン統合演算部34−3は、判定部34−2で統合
すべきであると判定された場合にこの判定結果を受けて
、読出し部34−1から2つのパターン矩形を受は取り
、統合する。統合されたパターン矩形は、文字認識部3
2の文字認識実行部32−1に送られる。
すべきであると判定された場合にこの判定結果を受けて
、読出し部34−1から2つのパターン矩形を受は取り
、統合する。統合されたパターン矩形は、文字認識部3
2の文字認識実行部32−1に送られる。
候補文字列選択部35は、レジスタ部35−1゜読取り
不能文字判定部35−2及び候補文字列選択処理部35
−3を具備している。レジスタ部35−1は文字認識部
32から出力される候補文字を一時格納する。この候補
文字は、パターン切出し部31からの各パターン矩形の
候補文字と、パターン統合演算部34−3からの統合さ
れたパターン矩形の候補文字である。読取り不能文字判
定部35−2は、パターン切出し部31からの各パター
ン矩形の候補文字中に読み取り不能文字があるか否かを
判定する。この判定結果は候補文字列選択処理部35−
3に出力される。候補文字列選択処理部35−3は、各
候補文字を組み合わせた候補文字列のうち、読み取り不
能文字を含まない候補文字列を最終候補文字列として出
力する。
不能文字判定部35−2及び候補文字列選択処理部35
−3を具備している。レジスタ部35−1は文字認識部
32から出力される候補文字を一時格納する。この候補
文字は、パターン切出し部31からの各パターン矩形の
候補文字と、パターン統合演算部34−3からの統合さ
れたパターン矩形の候補文字である。読取り不能文字判
定部35−2は、パターン切出し部31からの各パター
ン矩形の候補文字中に読み取り不能文字があるか否かを
判定する。この判定結果は候補文字列選択処理部35−
3に出力される。候補文字列選択処理部35−3は、各
候補文字を組み合わせた候補文字列のうち、読み取り不
能文字を含まない候補文字列を最終候補文字列として出
力する。
次に、本実施例の動作を第4図及び第5図を参照して説
明する。ここで、第4図は本実施例の動作フローチャー
ト、及び第5図は本実施例の処理過程の説明図である。
明する。ここで、第4図は本実施例の動作フローチャー
ト、及び第5図は本実施例の処理過程の説明図である。
光電変換部30が出力する入力文字列パターン41(第
5図)は、パターン切出し部31によってパターン矩形
42−1〜4に変換される(第4図のステップ101)
。パターン矩形42−1〜4は文字認識実行部32−1
に送られ、標準文字パターン辞書32−2に予め格納さ
れている標準文字パターンと比較され、その結果、候補
文字43−1〜4が得られる(ステップ102)。これ
らの候補文字43−1〜4は候補文字列選択部35のレ
ジスタ部35−1に送られるとともに、文字部分判定部
33の比較部33−1に送られる。比較器33−1はこ
れらの候補文字43−1〜4と文字部分辞!33−2に
格納されている偏部分のコードと比較し、これらが漢字
の一部分、すなわち本実施例では偏部分のコードに相当
する可能性があるか否かを判定する(ステップ103)
。第5図の例では、候補文字43−1が水幅に相当する
と判定される。
5図)は、パターン切出し部31によってパターン矩形
42−1〜4に変換される(第4図のステップ101)
。パターン矩形42−1〜4は文字認識実行部32−1
に送られ、標準文字パターン辞書32−2に予め格納さ
れている標準文字パターンと比較され、その結果、候補
文字43−1〜4が得られる(ステップ102)。これ
らの候補文字43−1〜4は候補文字列選択部35のレ
ジスタ部35−1に送られるとともに、文字部分判定部
33の比較部33−1に送られる。比較器33−1はこ
れらの候補文字43−1〜4と文字部分辞!33−2に
格納されている偏部分のコードと比較し、これらが漢字
の一部分、すなわち本実施例では偏部分のコードに相当
する可能性があるか否かを判定する(ステップ103)
。第5図の例では、候補文字43−1が水幅に相当する
と判定される。
この判定結果はパターン統合部34の読出し部34−1
に送られる。読出し部34−1は候補文字43−1が水
幅に相当すると判定されたので、パターン切出し部31
からパターン矩形42−1とこれに続くパターン矩形4
2−2とを読み出し、判定部34−2に送る。判定部3
4−・2は前述した条件に従って、パターン矩形42−
1と42−2を統合すべきか否かを判定する。今、統合
すべきであると判定されると、パターン統合演算部34
−3はパターン矩形42−1と42−2とを統合し、新
たなパターン矩形42−5を文字認識実行部32−1に
出力する(ステップ104)。文字認識実行部32−1
はこの統合されたパターン矩形42−5に対して文字認
識処理を実行し、候補文字43−5を出力する(ステッ
プ105)。この候補文字43−5は先の文字認識処理
で得られた候補文字43−1〜4とともに、レジスタ3
5−1に格納される。
に送られる。読出し部34−1は候補文字43−1が水
幅に相当すると判定されたので、パターン切出し部31
からパターン矩形42−1とこれに続くパターン矩形4
2−2とを読み出し、判定部34−2に送る。判定部3
4−・2は前述した条件に従って、パターン矩形42−
1と42−2を統合すべきか否かを判定する。今、統合
すべきであると判定されると、パターン統合演算部34
−3はパターン矩形42−1と42−2とを統合し、新
たなパターン矩形42−5を文字認識実行部32−1に
出力する(ステップ104)。文字認識実行部32−1
はこの統合されたパターン矩形42−5に対して文字認
識処理を実行し、候補文字43−5を出力する(ステッ
プ105)。この候補文字43−5は先の文字認識処理
で得られた候補文字43−1〜4とともに、レジスタ3
5−1に格納される。
候補文字列選択部35の読取り不能文字判定部35−2
は、レジスタ部35−1中に読み取り不能文字が存在す
るか否かを判定する。図示する例では、43−2が読み
取り不能文字である。この判定結果を受けた候補文字列
選択処理部35−3は、候補文字43−1〜5を組み合
わせた候補文字列44−1及び44−2のうち、読み取
り不能文字を含まない候補文字列44−2を最終候補文
字列として出力する(ステップ106)。
は、レジスタ部35−1中に読み取り不能文字が存在す
るか否かを判定する。図示する例では、43−2が読み
取り不能文字である。この判定結果を受けた候補文字列
選択処理部35−3は、候補文字43−1〜5を組み合
わせた候補文字列44−1及び44−2のうち、読み取
り不能文字を含まない候補文字列44−2を最終候補文
字列として出力する(ステップ106)。
以上、説明したように本実施例では、第5図の例の場合
、5個のパターン矩形の組み合わせに対してのみ文字認
識処理を行えばよいので、従来技術に比較して文字認識
処理量を大幅に削減することができ、文字認識処理の^
連化が達成できる。
、5個のパターン矩形の組み合わせに対してのみ文字認
識処理を行えばよいので、従来技術に比較して文字認識
処理量を大幅に削減することができ、文字認識処理の^
連化が達成できる。
尚、上記実施例では文字部分として漢字の偏部分に相当
するものを登録した場合を例として示したが、これに代
えて第6図に示すような漢字の労部分を用いても良い。
するものを登録した場合を例として示したが、これに代
えて第6図に示すような漢字の労部分を用いても良い。
労部分を用いた場合、文字部分判定部33の比較部33
−1は労部分を格納する文字部分辞133−2を検索し
て判定結果をパターン統合部34の読出し部34−1に
送る。
−1は労部分を格納する文字部分辞133−2を検索し
て判定結果をパターン統合部34の読出し部34−1に
送る。
読出し部34−1は労部分に相当すると判定されたパタ
ーン矩形とこれに先行するパターン矩形とを読み出し、
判定部34−2に送る。判定部34−2は前述した条件
に従って統合すべきか否かを判定し、統合すべき場合は
パターン統合演粋部34−3でこれらの2つのパターン
矩形を統合して文字認識実行部32−1に送る。以下、
同様にして処理を行うことで、最終候補文字列が得られ
る。
ーン矩形とこれに先行するパターン矩形とを読み出し、
判定部34−2に送る。判定部34−2は前述した条件
に従って統合すべきか否かを判定し、統合すべき場合は
パターン統合演粋部34−3でこれらの2つのパターン
矩形を統合して文字認識実行部32−1に送る。以下、
同様にして処理を行うことで、最終候補文字列が得られ
る。
また、偏部分とともに労部分を用いる構成としても良い
。この場合は、偏部分に相当すると判定されたパターン
矩形に対しては後続するパターン矩形を統合し、労部分
に相当すると判定されたパターン矩形に対しては先行す
るパターン矩形と統合する。
。この場合は、偏部分に相当すると判定されたパターン
矩形に対しては後続するパターン矩形を統合し、労部分
に相当すると判定されたパターン矩形に対しては先行す
るパターン矩形と統合する。
更に、第7図に示すような偏置対辞書を単独で又は偏部
分辞書あるいは労部分辞書と併合して用いる構成として
も良い。偏置対辞書を用いた場合、文字部分判定部33
は得られた隣り合う2つの1吠補文字列の対が偏脅対辞
書中に存在するか否かを調べて判定結果をパターン統合
部34に送り、パターン統合部34はS力対辞書に存在
するという判定結果が得られた場合にはこれらのパター
ン矩形を統合する。
分辞書あるいは労部分辞書と併合して用いる構成として
も良い。偏置対辞書を用いた場合、文字部分判定部33
は得られた隣り合う2つの1吠補文字列の対が偏脅対辞
書中に存在するか否かを調べて判定結果をパターン統合
部34に送り、パターン統合部34はS力対辞書に存在
するという判定結果が得られた場合にはこれらのパター
ン矩形を統合する。
上記実施例では、候補文字列中に読み取り不能文字があ
るか否かによって候補文字列を選択したが、候補文字列
の選択方法はこれに限定されるものではない。例えば、
文字認識処理によって各候補文字に与えられる(7点の
総和を文字列長で正規化した値を候補文字列の得点とし
、得点の最も高い文字列を選択することとしとも良い。
るか否かによって候補文字列を選択したが、候補文字列
の選択方法はこれに限定されるものではない。例えば、
文字認識処理によって各候補文字に与えられる(7点の
総和を文字列長で正規化した値を候補文字列の得点とし
、得点の最も高い文字列を選択することとしとも良い。
すなわち、いま、ある候補文字列(C+ 、C2、・・
・Cη)の候補文字の得点(V+ 、V2 、・・・、
Vn )の候補文字列の得点の総和は、 となる。従って、これを文字列長で正規化した得点はV
/nと表わせる。ただし、nは文字列の文字数である。
・Cη)の候補文字の得点(V+ 、V2 、・・・、
Vn )の候補文字列の得点の総和は、 となる。従って、これを文字列長で正規化した得点はV
/nと表わせる。ただし、nは文字列の文字数である。
例えば、第5図に示す候補文字43−1〜4の得点がそ
れぞれ、10.5.9.8で32/4=8となる。一方
、候補文字43−5゜43−3及び43−4の得点が夫
々9.9.8のときはV/n=26/3= 8.67と
なる。この結果、候補文字列44−2が選択される。
れぞれ、10.5.9.8で32/4=8となる。一方
、候補文字43−5゜43−3及び43−4の得点が夫
々9.9.8のときはV/n=26/3= 8.67と
なる。この結果、候補文字列44−2が選択される。
更に別の候補文字の選択方法として、候補文字列を予め
用意したψ語辞書と比較し、一致する中詰が発見された
候補文字列を選択する方法を用いてもよい。
用意したψ語辞書と比較し、一致する中詰が発見された
候補文字列を選択する方法を用いてもよい。
第8図は、上記実施例のシステム構成例のブロック図で
ある。上記実施例は、図示するような計算機システムを
用いて実現することができる。ラインセンサ51は第2
図に示ケ光雷変換部30に相当する。制御部52は例え
ば中央処理装置で構成され、第2図に示すパターン切出
し部311文字認識実行部32−1.比較部33−1.
パターン統合部34及び候補文字列選択部35を機能的
に具備する。制御部52はまた、計算機システムの各構
成要素を制御する。デイスプレィ53は例えばCRT
(Cathode Ray Tube )t’構成
され、制御部52から出力される最終候補文字列を表示
する。RAM54は各種データを一時的に格納するため
に用いられる。ROM55は、第4図に示す動作フロー
のプログラムを含む各種プログラムを保持している。ハ
ードディスク56は、第2図に示す標準文字パターン辞
書32−2及び文字部分辞1133−2を記憶している
。その他、ハードディスク56はラインセンサ51から
の入力文字列パターンや制御部52が出力する最終候補
文字列を記憶するために用いられる。プリンタ57は、
最終候補文字列を含む各種データを印字出力する。バス
58は、上記各構成要素を接続する。その他、計篩磯シ
ステムは通信回線を介して外部装置とデータの授受を行
うための通信制御装置等を備えることもできる。
ある。上記実施例は、図示するような計算機システムを
用いて実現することができる。ラインセンサ51は第2
図に示ケ光雷変換部30に相当する。制御部52は例え
ば中央処理装置で構成され、第2図に示すパターン切出
し部311文字認識実行部32−1.比較部33−1.
パターン統合部34及び候補文字列選択部35を機能的
に具備する。制御部52はまた、計算機システムの各構
成要素を制御する。デイスプレィ53は例えばCRT
(Cathode Ray Tube )t’構成
され、制御部52から出力される最終候補文字列を表示
する。RAM54は各種データを一時的に格納するため
に用いられる。ROM55は、第4図に示す動作フロー
のプログラムを含む各種プログラムを保持している。ハ
ードディスク56は、第2図に示す標準文字パターン辞
書32−2及び文字部分辞1133−2を記憶している
。その他、ハードディスク56はラインセンサ51から
の入力文字列パターンや制御部52が出力する最終候補
文字列を記憶するために用いられる。プリンタ57は、
最終候補文字列を含む各種データを印字出力する。バス
58は、上記各構成要素を接続する。その他、計篩磯シ
ステムは通信回線を介して外部装置とデータの授受を行
うための通信制御装置等を備えることもできる。
以上詳細に説明したように、本発明の文字列パターン読
み取り装置によれば、初期の切り出し処理で漢字の幅部
分や労部分のような文字部分のみが分離して切り出され
た場合、文字認識処理の結果からこれを検出し、これに
先行する又は後続する一定範囲のパターン矩形と統合し
て再度文字認識処理を行って最終的な候補文字列を出力
するように構成したので、無用なパターン矩形の組み合
わせを生成せず、従ってパターン矩形の比較、照合処1
1ffiら少なく、よって文字認識処理時間の大幅な増
大を招くことなく正しい候補文字列を得ることが可能と
なる。
み取り装置によれば、初期の切り出し処理で漢字の幅部
分や労部分のような文字部分のみが分離して切り出され
た場合、文字認識処理の結果からこれを検出し、これに
先行する又は後続する一定範囲のパターン矩形と統合し
て再度文字認識処理を行って最終的な候補文字列を出力
するように構成したので、無用なパターン矩形の組み合
わせを生成せず、従ってパターン矩形の比較、照合処1
1ffiら少なく、よって文字認識処理時間の大幅な増
大を招くことなく正しい候補文字列を得ることが可能と
なる。
第1図は本発明の原理ブロック図、第2図は本発明の一
実施例のブロック構成図、第3図は第2図に示す文字部
分辞書を構成する幅部分辞書の(M成を示すための図、
第4図は第2図に示す実施例の動作フローチャート、第
5図は第2図に示す実施例の処理過程の説明図、第6図
は労部分辞書の構成を示すための図、第7図は偏置対辞
書の構成を示すための図、第8図は第2図に示す実施例
のシステム構成例のブロック図、第9図は従来の文字切
り出し仮説を用いた方式を説明するための図、及び第1
0図は従来の文字の分離接触パターン辞書を用いた方式
を説明するための図である。 31・・・パターン切出し部、32・・・文字認識部、
311・・・文字認識実行部、32−2・・・標準文字
パターン辞書、33・・・文字部分判定部、33−1・
・・比較部、33−2・・・文字部分辞書、34・・・
パターン統合部、34−1・・・読出し部、34−2・
・・判定部、34−3・・・パターン統合演算部、35
・・・候補文字列選択部、35−1・・・レジスタ部、
35−2・・・読取り不能文字判定部、35−3・・・
候補文字列選択処理部、41・・・入力文字列パターン
、42−1〜5・・・パターン矩形、43−1〜5・・
・候補文字、44−1〜2・・・候補文字列。 偏部分辞書の構成図 受部分辞書の構成図第3
図 第6図 本発明実施例の動作フローチャート 第4図 「不?出器」〜44−1 「検出器」〜44−2 本発明実施例の処理過程の説明図 第5図 装置対辞書の構成図 第7図 不発明実施例の/ステム構成例のブロック図21:文字
認識部 / 従来の文字の分離接触パターン辞書を 用いた方式を説明するための図 第10図
実施例のブロック構成図、第3図は第2図に示す文字部
分辞書を構成する幅部分辞書の(M成を示すための図、
第4図は第2図に示す実施例の動作フローチャート、第
5図は第2図に示す実施例の処理過程の説明図、第6図
は労部分辞書の構成を示すための図、第7図は偏置対辞
書の構成を示すための図、第8図は第2図に示す実施例
のシステム構成例のブロック図、第9図は従来の文字切
り出し仮説を用いた方式を説明するための図、及び第1
0図は従来の文字の分離接触パターン辞書を用いた方式
を説明するための図である。 31・・・パターン切出し部、32・・・文字認識部、
311・・・文字認識実行部、32−2・・・標準文字
パターン辞書、33・・・文字部分判定部、33−1・
・・比較部、33−2・・・文字部分辞書、34・・・
パターン統合部、34−1・・・読出し部、34−2・
・・判定部、34−3・・・パターン統合演算部、35
・・・候補文字列選択部、35−1・・・レジスタ部、
35−2・・・読取り不能文字判定部、35−3・・・
候補文字列選択処理部、41・・・入力文字列パターン
、42−1〜5・・・パターン矩形、43−1〜5・・
・候補文字、44−1〜2・・・候補文字列。 偏部分辞書の構成図 受部分辞書の構成図第3
図 第6図 本発明実施例の動作フローチャート 第4図 「不?出器」〜44−1 「検出器」〜44−2 本発明実施例の処理過程の説明図 第5図 装置対辞書の構成図 第7図 不発明実施例の/ステム構成例のブロック図21:文字
認識部 / 従来の文字の分離接触パターン辞書を 用いた方式を説明するための図 第10図
Claims (1)
- 【特許請求の範囲】 文字列パターンからパターン矩形を切り出すパターン切
出し部と、 パターン矩形を予め登録された標準文字パターンと比較
して候補文字を出力する文字認識部と、前記候補文字を
予め登録された文字部分と比較して、該候補文字が文字
部分に相当する可能性があるか否かを判定する文字部分
判定部と、 該文字部分判定部の判定結果に基づき、該文字部分に相
当すると判定されたパターン矩形を、それに先行するあ
るいは後続する一定範囲の矩形パターンと統合して前記
文字認識部に送るパターン統合部と、 前記文字認識部から出力される候補文字を組み合わせて
候補文字列を生成し、最も確からしい候補文字列を選択
する候補文字列選択部とを、具備することを特徴とする
文字列パターン読み取り装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63107096A JPH01277989A (ja) | 1988-04-28 | 1988-04-28 | 文字列パターン読み取り装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63107096A JPH01277989A (ja) | 1988-04-28 | 1988-04-28 | 文字列パターン読み取り装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01277989A true JPH01277989A (ja) | 1989-11-08 |
Family
ID=14450356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63107096A Pending JPH01277989A (ja) | 1988-04-28 | 1988-04-28 | 文字列パターン読み取り装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01277989A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05182028A (ja) * | 1992-01-06 | 1993-07-23 | Omron Corp | 文字認識装置 |
JPH05182027A (ja) * | 1992-01-06 | 1993-07-23 | Omron Corp | 文字認識装置 |
JP2008084105A (ja) * | 2006-09-28 | 2008-04-10 | Oki Electric Ind Co Ltd | 文字切出方法及び文字認識装置 |
-
1988
- 1988-04-28 JP JP63107096A patent/JPH01277989A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05182028A (ja) * | 1992-01-06 | 1993-07-23 | Omron Corp | 文字認識装置 |
JPH05182027A (ja) * | 1992-01-06 | 1993-07-23 | Omron Corp | 文字認識装置 |
JP2008084105A (ja) * | 2006-09-28 | 2008-04-10 | Oki Electric Ind Co Ltd | 文字切出方法及び文字認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4611346A (en) | Method and apparatus for character recognition accommodating diacritical marks | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
US5265171A (en) | Optical character reading apparatus for performing spelling check | |
JPH01277989A (ja) | 文字列パターン読み取り装置 | |
JP2001022883A (ja) | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 | |
JPH04302073A (ja) | 文字認識装置 | |
JP2002056356A (ja) | 文字認識装置、文字認識方法および記録媒体 | |
JP2019191680A (ja) | 情報処理装置及びプログラム | |
JPH06348911A (ja) | 英文字認識装置 | |
JPH07319880A (ja) | キーワード抽出・検索装置 | |
JP3115139B2 (ja) | 文字切り出し方法 | |
JP2985813B2 (ja) | 文字列認識装置および知識データベース学習方法 | |
JP2005078287A (ja) | 文字認識装置、文字認識プログラム | |
JP3420853B2 (ja) | 文字切り出し方法 | |
JP3595081B2 (ja) | 文字認識方法 | |
JP3060237B2 (ja) | 日本語文字認識装置 | |
JP2851102B2 (ja) | 文字切出し方法 | |
JP3226355B2 (ja) | 認識結果評価方法 | |
JPH0514952B2 (ja) | ||
JPH06131492A (ja) | ナンバープレート認識方法 | |
JPH05174185A (ja) | 日本語文字認識装置 | |
JPH02292691A (ja) | 文字認識装置 | |
JPH0498477A (ja) | 文字切り出し方法 | |
JPS63143684A (ja) | 文字認識装置における認識結果修正方法 | |
JPH11134434A (ja) | 網がけ領域の抽出方法及び装置 |