JP2659182B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP2659182B2 JP2659182B2 JP61115611A JP11561186A JP2659182B2 JP 2659182 B2 JP2659182 B2 JP 2659182B2 JP 61115611 A JP61115611 A JP 61115611A JP 11561186 A JP11561186 A JP 11561186A JP 2659182 B2 JP2659182 B2 JP 2659182B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- character
- coordinates
- signal
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、光学文字読取り装置に関し、特に黒色系統
の枠内に記載された文字を認識する文字認識装置に関す
る。
の枠内に記載された文字を認識する文字認識装置に関す
る。
第2図に、黒色系統の枠内に記載された文字の一例を
示す。従来、この種の装置にあっては、枠内の文字信号
を読取る為に、枠及び文字ともどもに電気的な2値の映
像信号に変換し、その映像信号より、一般に知られてい
る投影法を用いて、枠A1B1,H1G1,C1D1J1I1及びE1F1L1K1
の切出しさらに位置,形状を検出し、しかる後、それぞ
れの枠を基準とした一定間隔内の領域(第2図中、破線
で囲まれた領域)を文字認識対象領域として抽出し、と
かして文字を認識していた。
示す。従来、この種の装置にあっては、枠内の文字信号
を読取る為に、枠及び文字ともどもに電気的な2値の映
像信号に変換し、その映像信号より、一般に知られてい
る投影法を用いて、枠A1B1,H1G1,C1D1J1I1及びE1F1L1K1
の切出しさらに位置,形状を検出し、しかる後、それぞ
れの枠を基準とした一定間隔内の領域(第2図中、破線
で囲まれた領域)を文字認識対象領域として抽出し、と
かして文字を認識していた。
上述した従来の装置にあっては、枠の切出し、枠の位
置,形状を検出する手段に投影法が用いられている為
に、第3図に示したような文字の一部が枠からはみ出し
た場合には、枠信号は、A2′B2′H2G2,E2′F2′L2K2と
して検出される。このために、これら枠を基準とした一
定間隔内の領域を文字認識対象領域として抽出するため
に、枠の一部をも文字信号として抽出されてしまい、読
取拒絶または誤読等の欠点があった。
置,形状を検出する手段に投影法が用いられている為
に、第3図に示したような文字の一部が枠からはみ出し
た場合には、枠信号は、A2′B2′H2G2,E2′F2′L2K2と
して検出される。このために、これら枠を基準とした一
定間隔内の領域を文字認識対象領域として抽出するため
に、枠の一部をも文字信号として抽出されてしまい、読
取拒絶または誤読等の欠点があった。
本発明は、上記欠点に鑑みてなされたもので、その目
的とするところは、文字の一部が枠をはみ出した場合で
も正確な枠の形状を検出し、その枠をもとに文字領域を
抽出することにある。すなわち、本発明は、黒色系統の
枠内に記入され、一部がその枠の上端あるいは下端から
はみ出したような文字を認識する文字認識装置にあっ
て、前記文字および枠を走査して得られる画像信号を格
納する格納手段と、前記画像信号に対し上下方向に走査
し、1走査線毎に、最初に出現する前記文字あるいは枠
の位置および最後に出現する前記文字あるいは枠の位置
をそれぞれ第1の座標及第2の座標として検出する検出
手段と、前記第1の座標および第2の座標を計数し、出
頻度の最も高い座標値を前記枠の上端および下端の座標
として算出する手段と、前記枠の上端および下端の座標
に基づいて、前記画像信号から前記枠を除去し、文字信
号のみを抽出する手段と、抽出された文字信号を読み取
る認識手段とを備えるものである。
的とするところは、文字の一部が枠をはみ出した場合で
も正確な枠の形状を検出し、その枠をもとに文字領域を
抽出することにある。すなわち、本発明は、黒色系統の
枠内に記入され、一部がその枠の上端あるいは下端から
はみ出したような文字を認識する文字認識装置にあっ
て、前記文字および枠を走査して得られる画像信号を格
納する格納手段と、前記画像信号に対し上下方向に走査
し、1走査線毎に、最初に出現する前記文字あるいは枠
の位置および最後に出現する前記文字あるいは枠の位置
をそれぞれ第1の座標及第2の座標として検出する検出
手段と、前記第1の座標および第2の座標を計数し、出
頻度の最も高い座標値を前記枠の上端および下端の座標
として算出する手段と、前記枠の上端および下端の座標
に基づいて、前記画像信号から前記枠を除去し、文字信
号のみを抽出する手段と、抽出された文字信号を読み取
る認識手段とを備えるものである。
以下、第4図を参照にして詳述することにする。第4
図は、第3図の一部分を拡大した図である。本図におい
て、矢印の線は走査線を示す。本発明は、1走査線毎
に、最初に出現する紙面部から枠或は文字に変化する点
α1(x3,y3)α2(x4,y4)……α5(x7,y7),α6
(x8,y8)……αj(xi,yi)……を、並びに、最後に出
現する枠或は文字から紙面部に変化する点β1(x3,
y3′),β2(x4,y4′)……βj(xi,yi′)をそれぞ
れ検出し、α1,α2……α5,α6……αj……並びにβ
1,β2……βj……のy座標を統計的に処理、例えばヒ
ストグラムを作成することにより、頻度の高い座標値を
もって、枠の下端の位置及び上端の位置とする。一方、
枠の左端及び右端の座標は従来の公知の手段で検出す
る。
図は、第3図の一部分を拡大した図である。本図におい
て、矢印の線は走査線を示す。本発明は、1走査線毎
に、最初に出現する紙面部から枠或は文字に変化する点
α1(x3,y3)α2(x4,y4)……α5(x7,y7),α6
(x8,y8)……αj(xi,yi)……を、並びに、最後に出
現する枠或は文字から紙面部に変化する点β1(x3,
y3′),β2(x4,y4′)……βj(xi,yi′)をそれぞ
れ検出し、α1,α2……α5,α6……αj……並びにβ
1,β2……βj……のy座標を統計的に処理、例えばヒ
ストグラムを作成することにより、頻度の高い座標値を
もって、枠の下端の位置及び上端の位置とする。一方、
枠の左端及び右端の座標は従来の公知の手段で検出す
る。
しかし、上記枠の上,下,左,右端の座標より枠A2B2
H2G2を検出し、この枠を基準とした一定間隔内の領域を
文字認識対象領域として抽出するものである。尚、前述
の1走査線毎に枠或は文字の変化点を検出する手段に於
て、数走査線毎に投影法により圧縮し、その圧縮信号を
用いて、変化点を検出しても良いことは言うまでもな
い。
H2G2を検出し、この枠を基準とした一定間隔内の領域を
文字認識対象領域として抽出するものである。尚、前述
の1走査線毎に枠或は文字の変化点を検出する手段に於
て、数走査線毎に投影法により圧縮し、その圧縮信号を
用いて、変化点を検出しても良いことは言うまでもな
い。
第1図は、本発明の一実施例を示すブロック図であ
る。図で、10は走査部、20は画像格納回路、30は枠切出
し回路、40は枠情報検出回路(枠の左・右端)、50は枠
位置検出回路、60は頻度分布作成回路、70は枠形状決定
回路、80は文字領域抽出回路である。走査部10は紙面部
に記載された文字及び枠を電気的な2値信号に変換する
もので、その映像信号はl10を通して画像格納回路20、
枠切出し回路30、枠位置検出回路50に導かれる。画像格
納回路20は、枠の形状が決定されるまで、映像信号を一
時的に格納するものである。
る。図で、10は走査部、20は画像格納回路、30は枠切出
し回路、40は枠情報検出回路(枠の左・右端)、50は枠
位置検出回路、60は頻度分布作成回路、70は枠形状決定
回路、80は文字領域抽出回路である。走査部10は紙面部
に記載された文字及び枠を電気的な2値信号に変換する
もので、その映像信号はl10を通して画像格納回路20、
枠切出し回路30、枠位置検出回路50に導かれる。画像格
納回路20は、枠の形状が決定されるまで、映像信号を一
時的に格納するものである。
枠切出し回路30は、l10からの映像信号にもとづき、
公知の技術である投影法により枠を切出すものである。
その切出し信号はl20を通して枠情報検出回路40に導か
れる。枠情報検出回路40は、枠切出し信号に基づき枠の
左右端の位置情報を検出するものである。その位置情報
はl30により文字領域抽出回路80に導かれる。枠位置検
出回路50は、l10より導かれる映像信号に基づき、1走
査線毎に文字を含む枠の上・下端の位置を検出するもの
である。この信号はl40を通して頻度分布作成回路60に
導かれる。頻度分泌作成回路60は、枠の上下端の位置情
報に基づき、上端,下端それぞれの枠座標を並びかえる
とともに、同一座標であれば、その頻度を計数するもの
である。この筆度分布の情報は、l50により枠形状決定
回路70に導かれる。
公知の技術である投影法により枠を切出すものである。
その切出し信号はl20を通して枠情報検出回路40に導か
れる。枠情報検出回路40は、枠切出し信号に基づき枠の
左右端の位置情報を検出するものである。その位置情報
はl30により文字領域抽出回路80に導かれる。枠位置検
出回路50は、l10より導かれる映像信号に基づき、1走
査線毎に文字を含む枠の上・下端の位置を検出するもの
である。この信号はl40を通して頻度分布作成回路60に
導かれる。頻度分泌作成回路60は、枠の上下端の位置情
報に基づき、上端,下端それぞれの枠座標を並びかえる
とともに、同一座標であれば、その頻度を計数するもの
である。この筆度分布の情報は、l50により枠形状決定
回路70に導かれる。
枠形状決定回路70は、枠の上・下端の頻度分布より、
頻度分布の一番高い座標をもって、枠の上端及び下端の
座標を決定するものである。この情報は、l60により文
字領域抽出回路80に導かれる。文字領域抽出回路80は、
l30及びl60により導かれる枠の左右端情報及び上・下端
の情報に基づき、l70より導かれる枠信号を含む文字の
映像信号にゲートをかけ、文字領域のみの映像信号を抽
出するものである。この映像信号はl80により文字認識
部90に導かれ、文字の認識が実行される。
頻度分布の一番高い座標をもって、枠の上端及び下端の
座標を決定するものである。この情報は、l60により文
字領域抽出回路80に導かれる。文字領域抽出回路80は、
l30及びl60により導かれる枠の左右端情報及び上・下端
の情報に基づき、l70より導かれる枠信号を含む文字の
映像信号にゲートをかけ、文字領域のみの映像信号を抽
出するものである。この映像信号はl80により文字認識
部90に導かれ、文字の認識が実行される。
以上説明したように本発明は、黒色系統の枠内に記載
された文字の一部がその枠からはみ出した場合でも、枠
の上,下端の座標を1走査線毎に抽出し、それらを統計
的に処理することにより、枠内の文字通の形状に全く影
響を受けずに、正確に文字枠を検出することができ、文
字領域を正確に抽出することができます。さらに、走査
線ごとに上端および下端の座標を検出しているために、
文字等が文字枠からはみ出している位置を容易に検出す
ることができ、したがって、文字抽出を行う際に、この
はみ出し文字に対して文字認識率を向上させる処理、例
えば、文字枠消去によってはみ出し文字の一部が枠内と
枠外とで分離してしまった場合に、それらをつなぐため
の処理を容易に施すことができる。
された文字の一部がその枠からはみ出した場合でも、枠
の上,下端の座標を1走査線毎に抽出し、それらを統計
的に処理することにより、枠内の文字通の形状に全く影
響を受けずに、正確に文字枠を検出することができ、文
字領域を正確に抽出することができます。さらに、走査
線ごとに上端および下端の座標を検出しているために、
文字等が文字枠からはみ出している位置を容易に検出す
ることができ、したがって、文字抽出を行う際に、この
はみ出し文字に対して文字認識率を向上させる処理、例
えば、文字枠消去によってはみ出し文字の一部が枠内と
枠外とで分離してしまった場合に、それらをつなぐため
の処理を容易に施すことができる。
【図面の簡単な説明】 第1図は本発明の一実施例を示すブロック図、第2図は
黒色系統の枠内に記載された文字の一例を示す図、第3
図は黒色系統の枠外に文字の一部がはみだした文字の一
例を示す図、第4図は第3図の一部を拡大した一例を示
す図。
黒色系統の枠内に記載された文字の一例を示す図、第3
図は黒色系統の枠外に文字の一部がはみだした文字の一
例を示す図、第4図は第3図の一部を拡大した一例を示
す図。
Claims (1)
- 【請求項1】黒色系統の枠内に記入され、一部がその枠
の上端あるいは下端からはみ出したような文字を認識す
る文字認識装置において、 前記文字および枠を走査して得られる画像信号を格納す
る格納手段と、 前記画像信号に対し上下方向に走査し、1走査線毎に、
最初に出現する前記文字あるいは枠の位置および最後に
出現する前記文字あるいは枠の位置をそれぞれ第1の座
標及び第2の座標として検出する検出手段と、 前記第1の座標および第2の座標を計数し、出現頻度の
最も高い座標値を前記枠の上端および下端の座標として
算出する手段と、 前記枠の上端および下端の座標に基づいて、前記画像信
号から前記枠を除去し、文字信号のみを抽出する手段
と、 抽出された文字信号を読み取る認識手段と を具備することを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61115611A JP2659182B2 (ja) | 1986-05-19 | 1986-05-19 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61115611A JP2659182B2 (ja) | 1986-05-19 | 1986-05-19 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62271084A JPS62271084A (ja) | 1987-11-25 |
JP2659182B2 true JP2659182B2 (ja) | 1997-09-30 |
Family
ID=14666932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61115611A Expired - Lifetime JP2659182B2 (ja) | 1986-05-19 | 1986-05-19 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2659182B2 (ja) |
-
1986
- 1986-05-19 JP JP61115611A patent/JP2659182B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS62271084A (ja) | 1987-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0717365B1 (en) | Linear line detection apparatus using projection image of character string including linear line | |
JP2659182B2 (ja) | 文字認識装置 | |
JPH0548510B2 (ja) | ||
JPS6316795B2 (ja) | ||
JP4242962B2 (ja) | 文字切出装置 | |
JP2909132B2 (ja) | 光学的文字読取装置 | |
JP2630261B2 (ja) | 文字認識装置 | |
JP2877380B2 (ja) | 光学的文字読取装置 | |
JP2832035B2 (ja) | 文字認識装置 | |
JP2925270B2 (ja) | 文字読取装置 | |
JPS60230282A (ja) | 文字認識装置 | |
JP2963807B2 (ja) | 郵便番号枠検出装置 | |
JP2002230481A (ja) | 光学式文字読取装置 | |
JPH01119885A (ja) | 文書読取装置 | |
JP3160458B2 (ja) | 文字読取装置及び文字読取方法 | |
JPS6161151B2 (ja) | ||
JPH09167205A (ja) | 文字パターン抽出方法 | |
JP2670074B2 (ja) | 車両番号認識装置 | |
JP2922992B2 (ja) | 光学的文字読取装置 | |
JPH01265378A (ja) | 欧文文字認識方式 | |
JPS62169286A (ja) | 文字切出方式 | |
JPH0535856A (ja) | 指紋特徴抽出装置 | |
JPH051513B2 (ja) | ||
JPS6045884A (ja) | 文字認識装置の文字枠除去装置 | |
JPS58222384A (ja) | フオント識別方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |