JPH06301813A - 文字読取方法 - Google Patents

文字読取方法

Info

Publication number
JPH06301813A
JPH06301813A JP5045068A JP4506893A JPH06301813A JP H06301813 A JPH06301813 A JP H06301813A JP 5045068 A JP5045068 A JP 5045068A JP 4506893 A JP4506893 A JP 4506893A JP H06301813 A JPH06301813 A JP H06301813A
Authority
JP
Japan
Prior art keywords
character
image
memory
reading frame
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5045068A
Other languages
English (en)
Inventor
Mitsuru Takiguchi
充 瀧口
Naoto Aoki
直人 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5045068A priority Critical patent/JPH06301813A/ja
Publication of JPH06301813A publication Critical patent/JPH06301813A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】タイトル付きのスタンプを使用して押印した場
合でも文字を正確に認識することができるようにする。 【構成】読取枠33の位置を示すフォーマットデータに
基づいて前記イメージメモリ15内の読取枠相当位置2
8を計算し、該読取枠相当位置28に基づいて、読取枠
相当位置28より広い文字探査範囲を計算する。続い
て、前記イメージメモリ15内の該文字探査範囲に相当
するエリアからイメージデータを読み出し、該イメージ
データの投影を投影メモリ24に形成する。そして、各
投影ブロック間の白間隔を求め、該白間隔をセパレート
閾値(しきいち)と比較して前記文字探査範囲内の読取
文字開始点を決定する。その後、該読取文字開始点から
文字探査範囲右端までの範囲で各文字イメージの切出位
置を決定し、イメージメモリ15から文字イメージを切
り出す。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学式文字読取装置に
おける文字読取方法に関するものである。
【0002】
【従来の技術】従来、光学式文字読取装置(以下、「O
CR」という。)においては、帳票の帳票イメージを光
学系によってイメージセンサに結像させ、該イメージセ
ンサにおいて得たアナログ信号をイメージデータに変換
し、イメージメモリに書き込むようになっている。
【0003】そして、前記イメージデータから切り出し
た文字のイメージ(以下、「文字イメージ」という。)
をパターンメモリに書き込み、前記文字イメージの特徴
を抽出することによって文字を認識することができる。
図2は従来のOCRのブロック図である。図において、
11は主制御CPU、12はメカコンCPU、13は前
処理CPU、14は認識CPU、15はイメージメモ
リ、16はA/D変換器、17はイメージセンサ、18
は光学フィルタ、19はレンズ、20はパターンメモ
リ、21は特徴抽出メモリ、22は認識辞書メモリ、2
3はフォーマットデータメモリ、24は投影メモリ、3
1は帳票、32は帳票搬送系である。
【0004】前記主制御CPU11は、メカコンCPU
12、前処理CPU13及び認識CPU14に接続さ
れ、該メカコンCPU12、前処理CPU13及び認識
CPU14を統括し、OCR全体の制御を行う。また、
該主制御CPU11は、帳票31のフォーマットデータ
を格納するフォーマットデータメモリ23を有する。そ
して、前記メカコンCPU12は、帳票31の帳票イメ
ージを読み取るために前記イメージセンサ17及び帳票
搬送系32に接続される。また、前処理CPU13はイ
メージメモリ15に接続され、該イメージメモリ15の
任意のアドレスにおけるイメージデータを文字イメージ
として切り出す。
【0005】そのため、該イメージメモリ15は、多値
(多値階調)のイメージデータを格納するとともに、A
/D変換器16を介してイメージセンサ17に接続され
る。該イメージセンサ17はラインセンサで形成され、
帳票31の入力画像がレンズ19及び光学フィルタ18
を通り、帳票イメージとなって結像される。ところで、
前記帳票31には文字34を記入したりスタンプで押印
したりすることができるようになっていて、記入者が容
易に文字34を記入したりスタンプで押印したりするこ
とができるように読取枠33がドロップアウトカラーに
よって印刷されている。この場合、前記イメージセンサ
17に帳票イメージを結像させようとすると、前記ドロ
ップアウトカラーの反射光は光学フィルタ18によって
吸収されるため、読取枠33はイメージセンサ17に結
像されず、記入され又は押印された文字34だけが結像
される。
【0006】また、前記前処理CPU13は、イメージ
メモリ15から読み出したイメージデータの投影を前記
投影メモリ24内に形成してイメージメモリ15の切出
位置を決定し、イメージメモリ15から切り出した文字
イメージを一時的にパターンメモリ20に書き込む。そ
して、認識CPU14が該パターンメモリ20に接続さ
れる。該認識CPU14は、前処理CPU13が切り出
した文字イメージの特徴を抽出し、その結果を特徴抽出
メモリ21に書き込むとともに、認識辞書メモリ22の
認識辞書を参照して文字34を認識し、該文字34の文
字コードを主制御CPU11に転送する。そして、該主
制御CPU11は転送された文字コードを編集し、上位
装置に送信する。
【0007】次に、従来のOCRの動作について説明す
る。ここでは、帳票31に読取枠33がドロップアウト
カラーで印刷され、該読取枠33内に文字34が非ドロ
ップアウトカラーで記入されているとする。そして、前
記主制御CPU11がメカコンCPU12に対して帳票
イメージの読取りを指示すると、該メカコンCPU12
は帳票31を帳票搬送系32によって搬送させ、レンズ
19、光学フィルタ18及びイメージセンサ17の前を
通過させる。この時、帳票31の帳票イメージは、レン
ズ19及び光学フィルタ18を通過し、イメージセンサ
17に結像される。そして、該イメージセンサ17にお
いて光電変換が行われ、帳票イメージに対応するアナロ
グ信号が出力される。該アナログ信号は、A/D変換器
16によって多値のイメージデータに変換され、イメー
ジメモリ15に書き込まれる。
【0008】ここで、前記ドロップアウトカラーで印刷
された読取枠33のイメージ(以下、「読取枠イメー
ジ」という。)は前記光学フィルタ18を通過すること
ができず、非ドロップアウトカラーで記入された文字イ
メージのみが通過する。したがって、イメージメモリ1
5には読取枠イメージが書き込まれず、文字イメージの
みがイメージデータとして書き込まれる。
【0009】次に、主制御CPU11は、イメージメモ
リ15から文字イメージを文字34ごとに切り出すため
に、フォーマットデータメモリ23のフォーマットデー
タに基づいてイメージメモリ15内の読取枠相当位置2
8を計算し、前処理CPU13に読取枠相当位置28に
よる切出しを指示する。図3は従来の文字読取方法にお
ける読取枠の説明図である。
【0010】図において、31は帳票、33は読取枠で
ある。この場合、読取枠33は帳票31にドロップアウ
トカラーで印刷されているため、実際はイメージメモリ
15(図2)に読取枠イメージは存在しない。また、3
4は文字、Pは前記帳票31の座標原点、fは前記帳票
31の左辺から読取枠33までの距離を示すフィールド
位置、hは前記読取枠33の高さを示す読取枠高さ、k
は前記帳票31の上辺から行の中心までの距離を示す行
位置、wは前記読取枠33の幅を示す読取枠幅である。
【0011】前記フォーマットデータは、フィールド位
置f、読取枠高さh、行位置k及び読取枠幅wについて
のデータから成り、帳票31上の読取枠33の位置を示
す。そして、主制御CPU11は、前記フォーマットデ
ータに基づいてイメージメモリ15内の読取枠相当位置
28を計算し、前処理CPU13に前記読取枠相当位置
28による切出しを指示する。
【0012】図4は従来の文字読取方法における文字探
査の説明図、図5は従来の文字読取方法における文字探
査の他の説明図、図6は従来の文字読取方法における切
出位置の説明図、図7は従来の文字読取方法における枠
詰処理の説明図である。図4及び5において、28は前
記帳票31(図2)上の読取枠33の位置に対応する読
取枠相当位置、29は文字探査範囲、34aは文字イメ
ージである。
【0013】前記前処理CPU13は、読取枠相当位置
28に基づいて文字探査範囲29を計算する。この場
合、記入され又は押印された文字34が読取枠33から
はみ出して、図5に示すように文字イメージ34aが読
取枠相当位置28を外れていても文字探査が可能になる
ように、文字探査範囲29を読取枠相当位置28より広
くなるように計算して設定する。
【0014】前記前処理CPU13は、イメージメモリ
15内の文字探査範囲29に相当するエリアからイメー
ジデータをラスタスキャンによって読み出し、その投影
を投影メモリ24内に形成する。そして、投影を形成し
た後、前処理CPU13は投影メモリ24内を左から右
の方向に探査し、図6に示すように各文字34に対応す
る投影ブロック35の開始点35a及び終了点35bを
検出する。該投影ブロック35の開始点35a及び終了
点35bを検出した後、前処理CPU13は各文字イメ
ージ34aごとに切出位置30を決定する。該切出位置
30の上端30aは文字探査範囲29の上端に対応し、
切出位置30の下端30bは文字探査範囲29の下端に
対応し、切出位置30の左端30cは前記投影ブロック
35の開始点35aに対応し、切出位置30の右端30
dは投影ブロック35の終了点35bに対応する。
【0015】次に、前記前処理CPU13は図6の切出
位置30から文字イメージ34aを切り出すために、切
出位置30に相当するイメージメモリ15内のエリアか
らイメージデータを読み出し、それをパターンメモリ2
0に書き込む。この時、前処理CPU13は多値−2値
変換を行う。続いて、前処理CPU13は図7に示すよ
うにパターンメモリ20に格納されたイメージデータに
ついて上下左右から枠詰処理を行い、文字位置31を決
定する。
【0016】次に、認識CPU14は、前記前処理CP
U13が決定した文字位置31の文字パターンの特徴を
抽出し、その結果を特徴抽出メモリ21に書き込むとと
もに、認識辞書メモリ22の認識辞書を参照して文字3
4を認識し、該文字34の文字コードを主制御CPU1
1に転送する。そして、該主制御CPU11は転送され
た文字コードを編集し、上位装置に送信する。
【0017】ところで、前記スタンプはタイトル無しの
ものとタイトル付きのものが存在する。そこで、タイト
ル無しのスタンプを使用した場合と、タイトル付きのス
タンプを使用した場合の押印状態について説明する。図
8はスタンプの押印状態を示す図である。図の(a)は
タイトル無しのスタンプを使用した場合の押印状態を、
(b)はタイトル付きのスタンプを使用した場合の押印
状態を示す。
【0018】図において、33はドロップアウトカラー
によって印刷された読取枠、34は帳票31(図2)上
の文字である。また、37はタイトル無しのスタンプ、
37aは該スタンプ37の読取文字部、38はタイトル
付きのスタンプ、38aは該スタンプ38の読取文字
部、38bはスタンプ38の読取りの対象にならないタ
イトル文字部である。
【0019】タイトル無しのスタンプ37で文字34を
押印して該文字34を読み取る場合、押印する者は読取
枠33内に文字34が入るようにして押印する。そし
て、タイトル付きスタンプ38で読取文字34A及びタ
イトル文字34Bから成る文字34を押印して該文字3
4を読み取る場合、押印する者は読取文字部38aのみ
を読取枠33に入れ、タイトル文字部38bを入れない
ようにして押印する。なお、前記スタンプ38の読取文
字部38aとタイトル文字部38bの間にはセパレータ
gが形成され、該セパレータgの長さはスタンプごとに
異なる。
【0020】
【発明が解決しようとする課題】しかしながら、前記従
来の文字読取方法においては、前処理CPU13は図4
に示すように文字探査範囲29を読取枠相当位置28よ
り広くなるように計算して設定するため、タイトル付き
のスタンプ38を使用して押印したときに、タイトル文
字部38bの文字イメージが文字探査範囲29内に進入
してしまうことがある。
【0021】図9はスタンプの他の押印状態を示す図で
ある。図において、28は読取枠相当位置、29は文字
探査範囲、34aは文字イメージ、34a1 は読取文字
部38aに対応する読取文字イメージ、34a2 は文字
探査範囲29内に進入したタイトル文字部38bに対応
するタイトル文字イメージ、38はタイトル付きのスタ
ンプである。
【0022】前記読取文字部38aとタイトル文字部3
8bの間のセパレータgの長さが短いスタンプ38の場
合には、押印した時にタイトル文字34B(図8)が読
取枠33内に進入し、タイトル文字イメージ34a2
文字探査範囲29内に進入してしまうことがある。その
結果、前記前処理CPU13(図2)が文字34を誤っ
て認識してしまう。
【0023】本発明は、前記従来の文字読取方法の問題
点を解決して、タイトル付きのスタンプを使用して押印
した場合でも文字を正確に認識することができる文字読
取方法を提供することを目的とする。
【0024】
【課題を解決するための手段】そのために、本発明の文
字読取方法においては、読取枠内に記入され、押印され
た文字を読み取ってイメージデータを形成し、該イメー
ジデータをイメージメモリに書き込み、前記イメージデ
ータから切り出した文字イメージの特徴を抽出すること
によって文字を認識するようになっている。
【0025】そして、読取枠の位置を示すフォーマット
データに基づいて前記イメージメモリ内の読取枠相当位
置を計算し、該読取枠相当位置に基づいて、読取枠相当
位置より広い文字探査範囲を計算し、前記イメージメモ
リ内の該文字探査範囲に相当するエリアからラスタスキ
ャンによってイメージデータを読み出す。次に、該イメ
ージデータの投影を投影メモリに形成し、該投影メモリ
を探査して各投影ブロック間の白間隔を求める。そし
て、該白間隔をセパレータ閾値(しきいち)と比較して
前記文字探査範囲内の読取文字開始点を決定し、該読取
文字開始点から文字探査範囲右端までの範囲で各文字イ
メージの切出位置を決定し、イメージメモリから文字イ
メージを切り出す。
【0026】
【作用】本発明によれば、前記のように文字読取方法に
おいては、読取枠内に記入され、押印された文字を読み
取ってイメージデータを形成し、該イメージデータをイ
メージメモリに書き込み、前記イメージデータから切り
出した文字イメージの特徴を抽出することによって文字
を認識するようになっている。
【0027】前記読取枠の帳票上の位置を示すためにフ
ォーマットデータが設けられていて、該フォーマットデ
ータに基づいて前記イメージメモリ内の読取枠相当位置
を計算し、該読取枠相当位置に基づいて、読取枠相当位
置より広い文字探査範囲を計算する。したがって、押印
された文字が読取枠からはみ出して、文字イメージが読
取枠相当位置を外れていても文字探査が可能になる。
【0028】続いて、前記文字探査範囲内にスタンプの
タイトル文字が進入した場合でも文字を正しく認識する
ことができるように、前記イメージメモリ内の文字探査
範囲に相当するエリアからラスタスキャンによってイメ
ージデータを読み出し、該イメージデータの投影を投影
メモリに形成する。そして、該投影メモリを探査して各
投影ブロック間の白間隔を求める。この場合、該白間隔
はスタンプのタイトル文字と読取文字の間のセパレータ
であるか、各文字間である。そこで、前記白間隔をセパ
レータ閾値と比較してセパレータがあるか否かの判断を
行い、前記文字探査範囲内の読取文字開始点を決定す
る。
【0029】その後、該読取文字開始点から文字探査範
囲右端までの範囲で各文字イメージの切出位置を決定
し、イメージメモリから文字イメージを切り出す。
【0030】
【実施例】以下、本発明の実施例について図面を参照し
ながら詳細に説明する。図1は本発明の文字切出方法が
適用されたOCRのブロック図である。図において、1
1は主制御CPU、12はメカコンCPU、13は前処
理CPU、14は認識CPU、15はイメージメモリ、
16はA/D変換器、17はイメージセンサ、18は光
学フィルタ、19はレンズ、20はパターンメモリ、2
1は特徴抽出メモリ、22は認識辞書メモリ、23はフ
ォーマットデータメモリ、24は投影メモリ、31は帳
票、32は帳票搬送系、41はセパレータ検出部であ
る。
【0031】前記主制御CPU11は、メカコンCPU
12、前処理CPU13及び認識CPU14に接続さ
れ、該メカコンCPU12、前処理CPU13及び認識
CPU14を統括し、OCR全体の制御を行う。また、
該主制御CPU11は、帳票31のフォーマットデータ
を格納するフォーマットデータメモリ23を有する。そ
して、前記メカコンCPU12は、帳票31の帳票イメ
ージを読み取るために前記イメージセンサ17及び帳票
搬送系32に接続される。また、前処理CPU13はイ
メージメモリ15に接続され、該イメージメモリ15の
任意のアドレスにおけるイメージデータを文字イメージ
として切り出す。
【0032】そのため、該イメージメモリ15は、多値
(多値階調)のイメージデータを格納するとともに、A
/D変換器16を介してイメージセンサ17に接続され
る。該イメージセンサ17はラインセンサで形成され、
帳票31の入力画像がレンズ19及び光学フィルタ18
を通り、帳票イメージとなって結像される。ところで、
前記帳票31には文字34を記入したりスタンプで押印
したりすることができるようになっていて、記入者が容
易に文字34を記入したりスタンプで押印したりするこ
とができるように読取枠33がドロップアウトカラーに
よって印刷されている。この場合、前記イメージセンサ
17に帳票イメージを結像させようとすると、前記ドロ
ップアウトカラーの反射光は光学フィルタ18によって
吸収されるため、読取枠33はイメージセンサ17に結
像されず、記入され又は押印された文字34だけが結像
される。
【0033】また、前記前処理CPU13はイメージメ
モリ15、パターンメモリ20、投影メモリ24及びセ
パレータ検出部41に接続されており、イメージメモリ
15から読み出したイメージデータの投影を前記投影メ
モリ24内に形成してイメージメモリ15の切出位置を
決定し、イメージメモリ15から切り出した文字イメー
ジを一時的にパターンメモリ20に書き込むとともに、
前記セパレータ検出部41によって読取文字イメージ3
4a1 (図9参照)とタイトル文字イメージ34a2
分離する。本実施例において前記セパレータ検出部41
は、前記前処理CPU13とは別に形成されたハード回
路で構成されているが、前記前処理CPU13において
プログラムされたアルゴリズムによって構成することも
できる。
【0034】そして、認識CPU14が該パターンメモ
リ20に接続される。該認識CPU14は、前処理CP
U13が切り出した文字イメージの特徴を抽出し、その
結果を特徴抽出メモリ21に書き込むとともに、認識辞
書メモリ22の認識辞書を参照して文字34を認識し、
該文字34の文字コードを主制御CPU11に転送す
る。そして、該主制御CPU11は転送された文字コー
ドを編集し、上位装置に送信する。
【0035】次に、本発明のOCRの動作について説明
する。ここでは、帳票31に読取枠33がドロップアウ
トカラーで印刷され、該読取枠33内に文字34が非ド
ロップアウトカラーで記入され又は押印されているとす
る。そして、前記主制御CPU11がメカコンCPU1
2に対して帳票イメージの読取りを指示すると、該メカ
コンCPU12は帳票31を帳票搬送系32によって搬
送させ、レンズ19、光学フィルタ18及びイメージセ
ンサ17の前を通過させる。この時、帳票31の帳票イ
メージは、レンズ19及び光学フィルタ18を通過し、
イメージセンサ17に結像される。そして、該イメージ
センサ17において光電変換が行われ、帳票イメージに
対応するアナログ信号が出力される。該アナログ信号
は、A/D変換器16によって多値のイメージデータに
変換され、イメージメモリ15に書き込まれる。
【0036】ここで、前記ドロップアウトカラーで印刷
された読取枠イメージは前記光学フィルタ18を通過す
ることができず、非ドロップアウトカラーで記入された
文字イメージのみが通過する。したがって、イメージメ
モリ15には読取枠イメージが書き込まれず、文字イメ
ージ34aのみがイメージデータとして書き込まれる。
【0037】次に、主制御CPU11は、イメージメモ
リ15から文字イメージ34aを文字34ごとに切り出
すために、フォーマットデータメモリ23のフォーマッ
トデータに基づいてイメージメモリ15内の読取枠相当
位置28を計算し、前処理CPU13に読取枠相当位置
28による切出しを指示する。図10は本発明の文字読
取方法における読取枠の説明図である。
【0038】図において、31は帳票、33は読取枠で
ある。この場合、読取枠33は帳票31にドロップアウ
トカラーで印刷されているため、実際はイメージメモリ
15(図1)に読取枠イメージは存在しない。また、3
4は文字、34Aは読取文字、34Bはタイトル文字、
Pは前記帳票31の座標原点、fは前記帳票31の左辺
から読取枠33までの距離を示すフィールド位置、hは
前記読取枠33の高さを示す読取枠高さ、kは前記帳票
31の上辺から行の中心までの距離を示す行位置、wは
前記読取枠33の幅を示す読取枠幅である。
【0039】前記フォーマットデータは、フィールド位
置f、読取枠高さh、行位置k及び読取枠幅wについて
のデータから成り、帳票31上の読取枠33の位置を示
す。そして、主制御CPU11は、前記フォーマットデ
ータに基づいてイメージメモリ15内の読取枠相当位置
28を計算し、前処理CPU13に前記読取枠相当位置
28による切出しを指示する。
【0040】図11は本発明の文字読取方法における文
字探査の説明図、図12は本発明の文字読取方法におけ
る文字探査の他の説明図、図13は本発明の文字読取方
法における投影状態図、図14は本発明の文字読取方法
における投影状態の例を示す図、図15は本発明の文字
読取方法における投影状態の他の例を示す図である。図
11及び12において、28は前記帳票31(図1)上
の読取枠33の位置に対応する読取枠相当位置、29は
文字探査範囲、34a1 は読取文字イメージ、34a2
はタイトル文字イメージである。
【0041】前記前処理CPU13は、読取枠相当位置
28に基づいて文字探査範囲29を計算する。この場
合、記入され又は押印された文字34が読取枠33から
はみ出して、図12に示すように読取文字イメージ34
2 が読取枠相当位置28を外れていても文字探査が可
能になるように、文字探査範囲29を読取枠相当位置2
8より広くなるように計算して設定する。
【0042】前記前処理CPU13は、イメージメモリ
15内の文字探査範囲29に相当するエリアからイメー
ジデータをラスタスキャンによって読み出し、その投影
を投影メモリ24内に形成する。次に、前記セパレータ
検出部41がタイトル付きのスタンプ38(図8参照)
の読取文字部38aとタイトル文字部38bの間にある
セパレータgを検出する。
【0043】そのため、該セパレータ検出部41は図1
3に示すように投影メモリ24内を左から右の方向に探
査し白開始点WS と白終了点WE を検出する。白開始点
Sは投影の黒点数が1以上の状態から0に変化した点
であり、白終了点WE は投影の黒点数が0の状態から1
以上に変化した点である。そして、セパレータ検出部4
1は白開始点WS と白終了点WE の間の距離を求め、そ
れを白間隔Lとする。図14に示すように白間隔L1
長く、あらかじめ設定されたセパレータ閾値α以上であ
る場合は、前記白開始点WS と白終了点WE の間の空白
部がセパレータgに対応するものとして決定される。ま
た、図15に示すように白間隔L2 が短く、セパレータ
閾値α未満である場合は、白開始点WS と白終了点WE
の間の空白部がセパレータgに対応するものとして決定
されることなく投影メモリ24内の探査を継続し、次の
白間隔L3 ,L4 をセパレータ閾値αと比較して空白部
がセパレータgに対応するものであるか否かの判断を繰
り返す。そして、投影メモリ24内の探査は文字探査範
囲右端Bを越えると終了させられる。
【0044】そして、探査を終了するまでにセパレータ
gを決定することができる場合は探査を終了し、その時
の白終了点WE のデータを読取文字開始点Aとして前処
理CPU13に対して出力する。また、探査を終了する
までにセパレータgを決定することができない場合は、
投影メモリ24内の左端すなわち文字探査範囲29の左
端のデータを読取文字開始点Aとして前処理CPU13
に対して出力する。
【0045】ここで、前記セパレータ閾値αと使用され
るスタンプ38の関係について説明する。図16はタイ
トル付きのスタンプのセパレータの長さと文字間隔の説
明図である。図の(a)はあるスタンプ38(図8参
照)のセパレータgの長さと文字間隔の説明図、(b)
は他のスタンプ38のセパレータgの長さと文字間隔の
説明図である。
【0046】図において、G1 ,G2 はセパレータgの
長さ、p1 〜p4 は文字間隔である。ここで、使用され
るすべてのスタンプ38のセパレータgの長さG1 ,G
2 の最小値をGS とし、使用されるすべてのスタンプ3
8の文字間隔p1 〜p4 の最大値をpB としたとき、前
記セパレータ閾値αを次式によって決定する。 α=(GS −pB )/n+pB (n=1,2,…) 本実施例においてはnを2とし、 α=(GS +pB )/2 とする。
【0047】続いて前記前処理CPU13(図1)は、
セパレータ検出部41が決定した投影メモリ24内の読
取文字開始点Aから文字探査範囲右端Bまでを探査し、
図6に示したものと同様に各文字34に対応する投影ブ
ロック35の開始点35a及び終了点35bを検出す
る。以下、図6及び7を援用して説明する。
【0048】前記投影ブロック35の開始点35a及び
終了点35bを検出した後、前処理CPU13は図6に
示すように各文字イメージ34aごとに切出位置30を
決定する。該切出位置30の上端30aは文字探査範囲
29の上端に対応し、切出位置30の下端30bは文字
探査範囲29の下端に対応し、切出位置30の左端30
cは前記投影ブロック35の開始点35aに対応し、切
出位置30の右端30dは投影ブロック35の終了点3
5bに対応する。
【0049】次に、前記前処理CPU13は図6の切出
位置30から文字イメージ34aを切り出すために、切
出位置30に相当するイメージメモリ15内のエリアか
らイメージデータを読み出し、それをパターンメモリ2
0に書き込む。この時、前処理CPU13は多値−2値
変換を行う。続いて、前処理CPU13は図7に示すよ
うにパターンメモリ20に格納されたイメージデータに
ついて上下左右から枠詰処理を行い、文字位置31を決
定する。
【0050】次に、認識CPU14は、前記前処理CP
U13が決定した文字位置31の文字パターンの特徴を
抽出し、その結果を特徴抽出メモリ21に書き込むとと
もに、認識辞書メモリ22の認識辞書を参照して文字3
4を認識し、該文字34の文字コードを主制御CPU1
1に転送する。そして、該主制御CPU11は転送され
た文字コードを編集し、上位装置に送信する。
【0051】なお、本発明は前記実施例に限定されるも
のではなく、本発明の趣旨に基づいて種々変形すること
が可能であり、これらを本発明の範囲から排除するもの
ではない。
【0052】
【発明の効果】本発明によれば、前記のように文字読取
方法においては、読取枠内に記入され、押印された文字
を読み取ってイメージデータを形成し、該イメージデー
タをイメージメモリに書き込み、前記イメージデータか
ら切り出した文字イメージの特徴を抽出することによっ
て文字を認識するようになっている。
【0053】そして、読取枠の位置を示すフォーマット
データに基づいて前記イメージメモリ内の読取枠相当位
置を計算し、該読取枠相当位置に基づいて、読取枠相当
位置より広い文字探査範囲を計算する。続いて、前記イ
メージメモリ内の該文字探査範囲に相当するエリアから
イメージデータを読み出し、該イメージデータの投影を
投影メモリに形成する。
【0054】そして、各投影ブロック間の白間隔を求
め、該白間隔をセパレート閾値と比較して前記文字探査
範囲内の読取文字開始点を決定する。その後、該読取文
字開始点から文字探査範囲右端までの範囲で各文字イメ
ージの切出位置を決定し、イメージメモリから文字イメ
ージを切り出す。したがって、タイトル付きのスタンプ
を使用して文字を押印した時にタイトル文字が読取枠内
に進入して、タイトル文字イメージが文字探査範囲内に
進入しても、読取文字開始点から文字探査範囲右端まで
の範囲で文字イメージを切り出すことができ、文字を誤
って認識してしまうことがない。
【図面の簡単な説明】
【図1】本発明の文字切出方法が適用されたOCRのブ
ロック図である。
【図2】従来のOCRのブロック図である。
【図3】従来の文字読取方法における読取枠の説明図で
ある。
【図4】従来の文字読取方法における文字探査の説明図
である。
【図5】従来の文字読取方法における文字探査の他の説
明図である。
【図6】従来の文字読取方法における切出位置の説明図
である。
【図7】従来の文字読取方法における枠詰処理の説明図
である。
【図8】スタンプの押印状態を示す図である。
【図9】スタンプの他の押印状態を示す図である。
【図10】本発明の文字読取方法における読取枠の説明
図である。
【図11】本発明の文字読取方法における文字探査の説
明図である。
【図12】本発明の文字読取方法における文字探査の他
の説明図である。
【図13】本発明の文字読取方法における投影状態図で
ある。
【図14】本発明の文字読取方法における投影状態の例
を示す図である。
【図15】本発明の文字読取方法における投影状態の他
の例を示す図である。
【図16】タイトル付きのスタンプのセパレータの長さ
と文字間隔の説明図である。
【符号の説明】
15 イメージメモリ 24 投影メモリ 28 読取枠相当位置 29 文字探査範囲 30 切出位置 33 読取枠 34 文字 34a 文字イメージ 34a1 ,34a2 読取文字イメージ 35 投影ブロック α セパレータ閾値 A 読取文字開始点 B 文字探査範囲右端 L 白間隔

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 読取枠内に記入され、押印された文字を
    読み取ってイメージデータを形成し、該イメージデータ
    をイメージメモリに書き込み、前記イメージデータから
    切り出した文字イメージの特徴を抽出することによって
    文字を認識する文字読取方法において、(a)読取枠の
    位置を示すフォーマットデータに基づいて前記イメージ
    メモリ内の読取枠相当位置を計算し、(b)該読取枠相
    当位置に基づいて、読取枠相当位置より広い文字探査範
    囲を計算し、(c)前記イメージメモリ内の文字探査範
    囲に相当するエリアからイメージデータを読み出し、そ
    の投影を投影メモリに形成し、(d)該投影メモリを探
    査して各投影ブロック間の白間隔を求め、(e)該白間
    隔をセパレータ閾値と比較して前記文字探査範囲内の読
    取文字開始点を決定し、(f)該読取文字開始点から文
    字探査範囲右端までの範囲で各文字イメージの切出位置
    を決定することを特徴とする文字読取方法。
JP5045068A 1993-03-05 1993-03-05 文字読取方法 Pending JPH06301813A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5045068A JPH06301813A (ja) 1993-03-05 1993-03-05 文字読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5045068A JPH06301813A (ja) 1993-03-05 1993-03-05 文字読取方法

Publications (1)

Publication Number Publication Date
JPH06301813A true JPH06301813A (ja) 1994-10-28

Family

ID=12709035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5045068A Pending JPH06301813A (ja) 1993-03-05 1993-03-05 文字読取方法

Country Status (1)

Country Link
JP (1) JPH06301813A (ja)

Similar Documents

Publication Publication Date Title
JPS63158678A (ja) 単語間スペ−ス検出方法
US5923790A (en) Method and apparatus for detecting vertical direction of document
IL98293A (en) A method for distinguishing between text and graphics
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH06301813A (ja) 文字読取方法
JP2812256B2 (ja) 文字認識装置および方法
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
JPH0632070B2 (ja) 文字認識装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2877380B2 (ja) 光学的文字読取装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPS6227887A (ja) 文字種分離方式
JP2002259909A (ja) 文字読取装置
JP2708604B2 (ja) 文字認識方法
JP2925270B2 (ja) 文字読取装置
JP2979089B2 (ja) 情景画像中の文字認識方式
JP3127413B2 (ja) 文字認識装置
JP2003123076A (ja) 画像処理装置及び画像処理プログラム
JPS6160184A (ja) 光学的文字読取装置
JPH0576674B2 (ja)
JPH0798747A (ja) 文字切出し装置
JPH0578068B2 (ja)
JPS6227877A (ja) 光学的文字読取装置
JP2001312696A (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法
JPS62295191A (ja) 光学文字画像読取装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19991116