JPH0711816B2 - 文字切り出し方法 - Google Patents

文字切り出し方法

Info

Publication number
JPH0711816B2
JPH0711816B2 JP61205054A JP20505486A JPH0711816B2 JP H0711816 B2 JPH0711816 B2 JP H0711816B2 JP 61205054 A JP61205054 A JP 61205054A JP 20505486 A JP20505486 A JP 20505486A JP H0711816 B2 JPH0711816 B2 JP H0711816B2
Authority
JP
Japan
Prior art keywords
contour
character
entry frame
image
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61205054A
Other languages
English (en)
Other versions
JPS6361387A (ja
Inventor
清道 栗野
広美 内山
昭信 吉田
欣洋 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd, Hitachi Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Priority to JP61205054A priority Critical patent/JPH0711816B2/ja
Publication of JPS6361387A publication Critical patent/JPS6361387A/ja
Publication of JPH0711816B2 publication Critical patent/JPH0711816B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字読取装置等において使用される文字切り
出し方法に係り、特に黒色枠内の文字読取りに好適な文
字切り出し方法に関する。
[従来の技術] 従来の文字読取装置は、読取不可能なドロップアウトカ
ラーを用いて文字記入枠を印刷し、その中に記入された
文字を切り出して読取るものが大部分である。しかし、
複写帳票や一般に使用されている帳票を読取るために
は、文字記入枠が黒色(非ドロップアウトカラー)とな
るため、記入枠内の文字を記入枠と区別して切出すとと
もに、また枠に接触した文字をも切出す必要がある。こ
の種の装置に関連するものには、例えば特開昭60−1267
77号公報に開示された発明があげられる。
[発明が解決しようとする問題点] 上記した従来の装置においては、第2図(a),(b)
に示す様に、記入枠の一部が切れたり、記入枠が破線の
場合には、欠けている部分を修復する必要があり、修復
が不可能な場合には読取りができないという問題点があ
る。
また、第2図(c)の例のように文字が隣接文字枠まで
はみ出したような場合には、第2図(d)のようにはみ
出し部のパターンが記入枠部で分割され隣接文字が読取
不能となるという問題点がある。
このように従来技術では、一般に多く使用されている破
線記入枠の帳票や、あるいは複写帳票のように複写時の
切れ・かすれが発生した帳票を読取る場合、及び記入枠
から文字がはみ出している帳票を読み取る場合に問題が
あった。
本発明は上記した従来技術の問題点に鑑みなされたもの
で、記入枠が非ドロップアウトカラーで形成された一般
帳票や複写帳票において、記入枠が破線で形成されてい
たり、切れやかすれが生じていたり、記入枠からはみ出
して文字が記入されている場合でも、帳票の読み取りを
可能にする文字切り出し方法を提供することを目的とし
ている。
[問題点を解決するための手段] 前記目的を達成するため本発明は、予め規定されたサイ
ズおよび位置等の帳票の書式情報に基づき、記入枠及び
該記入枠中に記載された文字等を光学的に読み取って得
た二値画像に含まれる文字等を切り出す文字パターン認
識装置の文字切り出し方法において、 前記二値画像から黒画素の集合を輪郭追跡して内外両輪
郭から成る領域輪郭を抽出する第1ステップ、 該第1ステップより抽出した領域輪郭から予め規定され
た前記記入枠の書式情報を用いて内輪郭及び外輪郭から
成る記入枠の輪郭を選択する第2ステップ、 該第2ステップにおいて輪郭の不連続等により前記記入
枠の輪郭が選択できない場合、前記書式情報に基づいて
内輪郭及び外輪郭からなる定型的な仮想想記入枠を設定
すると共に、該仮想記入枠に接する領域輪郭を仮記入枠
輪郭として選択する第3ステップ、 前記第2ステップによる記入枠の輪郭を選択できた場
合、該記入枠の内輪郭の内側に含まれる輪郭を文字輪郭
として抽出し、前記第3ステップによる仮想記入枠を選
択した場合、仮想記入枠の内輪郭の内側に含まれる輪郭
の内、仮記入枠輪郭でない輪郭を文字輪郭として抽出す
る第4ステップ、 前記第2又は第3ステップにより選択した記入枠輪郭又
は仮記入枠輪郭に含まれ且つ接触した文字の画像を分離
するため、予め規定された記入枠に近似したマスク画像
の外側の文字部分画像と前記マスク画像の内側の文字部
分画像を前記記入枠輪郭あるいは仮記入枠輪郭から抽出
し、この文字部分画像を太め及び細め処理して修復した
文字部分画像の文字輪郭を抽出する第5ステップ或は、 前記第1ステップにおける記入枠の形状が矩形である場
合、該記入枠の縦方向の輪郭を含む左右の縦線消去領域
を横方向の細め処理により該記入枠の縦線を消去し、且
つ前記記入枠の横方向の輪郭を含む上下の横線消去領域
を縦方向の細め処理により該記入枠の横線を消去するこ
とにより、前記接触文字部分画像を修復した文字輪郭を
抽出する第6ステップ、 該第4乃至第6ステップにより選択した文字輪郭を用い
て文字を認識する第7ステップを含むことを特徴として
いる。
[作用] 前記特徴による文字切り出し方法は、第1ステップにて
帳票から切出した領域輪郭から内輪郭及び外輪郭から成
る記入枠の輪郭を第2ステップにより選択し、記入枠の
選択ができない場合は書式情報に基づいて内輪郭及び外
輪郭からなる定型的な仮想記入枠に含まれる仮記入枠輪
郭を第3ステップにより抽出し、第4ステップにおいて
記入枠の内外輪郭が選択された場合は該記入枠の内輪郭
の内側の全ての輪郭を文字輪郭として抽出すると共に、
第5ステップにより記入枠輪郭あるいは仮記入枠輪郭か
ら抽出したマスク画像の外側及び内側の文字部分画像、
或はステップ6による記入枠を含む左右上下の横及び縦
方向細め処理により抽出した文字部分画像を抽出するこ
とにより、記入枠が破断している場合であっても文字輪
郭の抽出を確実に行なうことができる。
次に、上記の内容を更に詳しく説明する。帳票から検出
された輪郭は、通常あらかじめ書式情報として指定され
る文字枠サイズと輪郭の大きさを比較することにより、
記入枠とそれ以外の輪郭に分類され、さらに記入枠の内
側と外側に分類される。仮想記入枠により分類する場合
は、仮想記入枠に接触する輪郭を仮記入枠輪郭とし、そ
れ以外の輪郭は、仮想記入枠の内側と外側の輪郭として
分類する。これにより切れ、かすれによる記入枠の部分
画像や破線記入枠は、仮記入枠輪郭として選択される。
本発明の第1の特徴による文字切り出し方法は、記入枠
が破断等により検出できない場合に前述した仮記入枠輪
郭を利用して文字が記入された文字部分画像を抽出する
ものである。
記入枠輪郭あるいは仮記入枠輪郭内に含まれる文字等の
画像は、まず文字等の記載事項の部分画像として、記入
枠輪郭あるいは仮記入枠輪郭より抽出する。文字等の記
載事項の部分画像には、記入枠画像は含まれず文字等の
記載事項と記入枠とが交差する部分で切断された形にな
るため、文字等の記載事項の部分画像から、記入枠と文
字が交差する部分を含む文字等のマスク画像を作成し、
この記入枠の輪郭あるいは仮記入枠輪郭からマスク画像
の外側にある文字等でない画像部分を消去し、文字等の
画像を抽出する。これが本発明の第2の特徴である。こ
のマスク画像は記入枠の輪郭を除去した文字画像部分の
二値画像を太目処理して連結補修後に細目処理すること
によって得る。接触文字等の記載事項が含まれていない
場合は当然文字等の画像は抽出されない。また、切れか
すれによる記入枠の部分画像や、破線記入枠は消去され
る。また、仮に記入枠に近接した文字輪郭等が記入枠輪
郭あるいは仮記入枠輪郭として選択された場合でも、文
字等の記載事項の部分画像として抽出されれば、文字等
の画像として抽出することが可能となる。そのため、記
入枠あるいは仮記入枠輪郭の選択は、厳密に行なわれな
くても良い。さらに、記入枠と文字等の記載事項が交差
する部分を文字画像として抽出するので、記入枠からは
み出した文字等の記載事項が文字枠部分で分割されて抽
出されることもない。本発明は、前記各記入枠の輪郭の
内輪郭と外輪郭の間の画像を除去して、交差文字部分画
像を含む記入枠の内外輪郭画像を得、これを太め及び細
め処理した交差部分の文字マスク画像を用いることによ
って交差部分を抽出するのが前記第3の特徴である。
また、記入枠の形状が矩形に限定できる場合は、記入枠
の上下・左右の辺の近傍において、記入枠あるいは仮記
入枠の画像に対し、上下の辺については上下方向に、左
右辺については左右方向に連続して連なる黒画素の長さ
が、記入枠の線の太さと同じと判定できる部分を消去す
ることにより、容易に文字等の画像でない部分を消去で
きる。この場合、記入枠の上下・左右辺の位置を正確に
検出する必要があるが、画像を輪郭として抽出するた
め、輪郭の座標から記入枠の各辺の位置を検出できる。
また、仮想記入枠の設定も同様に正確な位置に設定する
ことができる。これが本発明の第4の特徴である。
[実施例] 以下、本発明の一実施例について図面を用いて説明す
る。第1図は本発明による光学文字読取装置の構成図で
ある。第1図において、1は帳票搬送機構、2は帳票、
3は発光源、4は受光素子、5は二値化回路、6は記憶
部、7は切出/認識部でありマイクロプロセッサにより
構成される。
帳票2は、帳票搬送機構1により発光源3,受光素子4か
らなる読取部に搬送される。発光源3により照射された
光は、帳票2上で反射し、受光素子4に入射される。受
光素子4は順次入射されるパターンを電気信号に変換し
て出力する。受光素子4としては、一次元半導体CCDセ
ンサ等が使用される。二値化回路5は、受光素子4から
の出力信号を所定の閾値により“0",“1"の二値信号と
して記憶部6に出力する。記憶部6は、帳票2上のパタ
ーンを“0",“1"の二値画像として記憶するもので、半
導体メモリ等が使用される。切出/認識部7は記憶部6
の二値画像から文字パターンを一文字毎に切出し、標準
パターンとの比較を行ない、その結果を認識結果として
出力する。
第3図は、本発明の実施例におけるマイクロプロセッサ
7による文字切出しのフローチャートを示し、第4図,
第5図は本実施例の文字切出しの一例を示す図である。
本実施例において、第4図(a)に示す帳票上の読取領
域f1内の文字を読取る場合、まず、第3図のステップ10
0に示す様に、読取領域f1の切出しを行なう。読取領域f
1の切出しは、あらかじめ書式情報として指定された位
置から、実際には帳票の位置ずれや印刷誤差等を考慮
し、指定された位置よりも広い範囲で第4図(b)に示
すように切出す。
次に、読取領域f1内の黒画素の塊り、即ち黒画素の集合
を輪郭追跡することにより、第3図のステップ200に示
す様に領域輪郭として抽出する。こうして抽出した読取
領域f1の領域輪郭の例を第4図(c)に示す。第4図
(c)において、C1〜C15が外輪郭であり、C′1,C′3,
C′が内輪郭である。内外輪郭の区分は、輪郭のx方
向及びy方向の最大値と最小値である輪郭点の接線方向
の近傍の二値画像が、白か黒かにより判定され、白なら
ば外輪郭、黒なら内輪郭とする。
文字輪郭の選択は、まず、ステップ300において、記入
枠輪郭を選択することから開始する。記入枠輪郭か否か
の判定は、あらかじめ書式情報として指定される一文字
の記入枠のサイズ(幅W,高さH)と輪郭のサイズ(幅w,
高さh)を比較することにより行なう。本実施例におい
ては、記入枠が独立している場合も考慮して、w≧W−
Δω、h≧H−Δhの双方の条件を満たし、かつ、w+
h≧Max(w,H)+Δωhで、輪郭が書式情報として指定
された記入枠の位置にあれば、記入枠輪郭とする。Δh,
Δω,Δωhは共に定数で、1mm程度の値をとる。本実
施例の帳票においては、第5図に示すように、第1文字
目においては外輪郭C1,内輪郭C′が記入枠として選
択され第2、第3文字目については外輪郭C1のみが記入
枠として選択される。尚、上記の条件のうち、w≧W−
Δωとh≧H−Δhのいずれか一方が満足されるとき、
記入枠輪郭とする様にしても良い。
次に、記入枠が内外輪郭共に選択されていない場合、ス
テップ400〜600において仮想記入枠により、仮記入枠輪
郭を選択する。第5図の例では、第1文字目について
は、記入枠内外輪郭C′1,C1が存在するが、第2文字
目、第3文字目においては、内輪郭が存在せず外輪郭
C1,C14,C15のみしか存在しないため、仮想記入枠の外輪
郭CV及び内輪郭C′を設定し、仮想記入枠の外輪郭CV
及び内輪郭C′内に含まれる輪郭あるいは接触する輪
郭を仮記入枠輪郭とする。これにより、第2文字目は輪
郭C1,C′1,C14,C15の輪郭が仮記入枠として選択され、
第3文字目についてはC1,C′1,C13,C14,C15が仮記入枠
として選択される。仮想記入枠の外輪郭CV及び内輪郭
C′の位置は切り出し中の文字より前に検出された記
入枠内輪郭を基準に設定しても良いし、記入枠内輪郭が
存在しない場合は、あらかじめ書式情報として指定され
た位置に設定しても良い。第5図に示す例においては、
第2文字目・第3文字目の仮想記入枠の外輪郭CV及び内
輪郭C′とも、第1文字目の記入枠内輪郭C′を基
準に設定している。また、仮想記入枠の外輪郭CV及び内
輪郭C′のサイズ(高さhV,幅wV)は、書式情報とし
て指定された記入枠サイズ(高さH,幅W)に対し、記入
枠の線の太さtや、仮想記入枠位置の実際の記入位置に
対する誤差(Δx,Δy)を考慮し、 hV=H±(t+Δy),wV=W±(t+Δx) とする。
本実施例においては、処理時間を短縮するため、記入枠
内外輪郭が選択されない時のみ仮想記入枠による仮記入
枠の選択を実行しているが、第3図に示すステップ300,
400を省略し、無条件に仮想記入枠により仮記入枠の選
択を行なう様にしてもよい。仮記入枠輪郭には、第5図
の例でわかるように記入枠が切れて分離した輪郭C13,C
14,C15が含まれる。また、第5図には示していないが、
第2図(b)に示すような破線記入枠の輪郭が含まれる
のは言うまでもない。
記入枠輪郭あるいは仮記入枠輪郭を選択したら、ステッ
プ700において記入枠内の文字輪郭を選択する。文字輪
郭の選択は、記入枠内に輪郭が存在する場合は、記入枠
の内輪郭C′の内側に含まれる輪郭を文字輪郭とし、
記入枠内に輪郭が存在しない場合は、仮想記入枠の内輪
郭C′の内側に含まれる輪郭を文字輪郭とすることに
より行なう。第5図に示す例においては、図示する様
に、第1文字目で輪郭C2、第2文字目でC3,C′、第3
文字目でC4,C′が文字輪郭として選択される。輪郭
が、記入枠内に含まれる文字輪郭か否かの判定は、記入
枠が矩形の場合は、輪郭の最大値・最小値を比較するこ
とにより容易にできるが、形状が任意の場合は、輪郭を
二値画像に変換し、文字と記入枠の輪郭の各二値画像の
論理和の画像が、記入枠の二値画像と一致するか否かに
より判定できる。画像が一致するか否かは、上記の論理
和の画像と記入枠の二値画像との排他的論理和画像が全
て“0"となることにより判定される。
通常、記入枠に接触した文字がなければ、あるいは仮記
入枠輪郭内に記入枠以外の文字輪郭が存在しなければ、
ステップ700において選択した文字輪郭を認識すること
により、記入枠内の文字を読取ることができる。しか
し、第1文字目の例のように記入枠に文字が接触してい
る場合(C16)、記入枠輪郭に含まれる文字画像部(記
入枠の輪郭を交差する接触文字部分)を記入枠輪郭から
抽出する必要がある。本実施例においては、後述する方
法により、ステップ800において、無条件に記入枠内の
文字画像の抽出を行なう。ここで、無条件に記入枠内の
文字画像の抽出を行なっても、文字画像が含まれていな
ければ、記入枠から文字画像が抽出されることはない。
第5図に示す例においては、第1文字目と第2文字目で
文字“5"の接触画像C16,C17が抽出されるが、C17は第1
文字目に抽出され第1文字目の文字として認識されたC
16の輪郭と同じであることから、第2文字目の文字輪郭
から除去する。このようにして第1文字目の輪郭C2,
C16、第2文字目の輪郭C3,C′、第3文字目の輪郭C4,
C′が選択され、一文字毎認識処理を行ない前記の処
理を繰り返し、その結果を「5」「6」「0」として出
力する(ステップ900,1000)。
第6図は、記入枠輪郭又は仮記入枠輪郭に含まれる文字
画像を抽出する動作のフローチャートを示し、第7図は
第5図に示す一文字目についての文字画像の抽出動作を
示す説明図である。記入枠輪郭又は仮記入枠輪郭内の文
字画像を抽出するためには、先ず、ステップ1100におい
て、文字部分画像の抽出を行なう。文字部分画像の抽出
は、例えば第7図(a),(b)に示す様に、記入枠内
外輪郭C1,C′から文字部分画像B0〜B5,B16,B′16を二
値画像の形で抽出することによって行なわれる。ここ
で、文字部分画像B0〜B5,B16は記入枠外輪郭に含まれる
画像、B′16は記入枠内輪郭に含まれる画像として抽出
される。ここで、文字部分画像の具体的な抽出方法につ
いては、後に説明する。
次に、ステップ1100において抽出された文字部分画像
は、文字が記入枠に交差する部分を含まない画像である
が、記入枠が一文字毎に独立して設けられている場合の
ように、文字はみ出しが問題にならない場合は、記入枠
内輪郭C′内の部分画像B′16をそのまま文字画像と
してもよいが、完全な文字画像を抽出するためには、ス
テップ1200において、文字部分画像から文字マスク画像
を作成する。第7図(c)に示す例においては、内輪郭
に含まれる文字画像を含む文字マスク画像m16を作成す
る。次に、ステップ1300において、文字マスク画像m16
内に含まれる記入枠内外輪郭C′1,C1文字画像が記入枠
画像を消去することによって二値画像の形で抽出され
る。次に、ステップ1400において、抽出した二値文字画
像の輪郭を、記入枠内に含まれる文字画像輪郭として抽
出する。尚、後述する第9図に示す例の様に、文字マス
ク画像m16が文字画像と同一となる様な場合、文字マス
ク画像m16を文字画像として抽出しても良い。第7図に
示す例においては、第7図(d)に示すC′16が二値文
字画像、第7図(e)に示すC16が文字画像輪郭であ
る。
第8図は、記入枠輪郭から文字部分画像を抽出する際の
具体例を示し、第5図に示す一文字目を例としたもので
ある。第8図(a)は記入枠外輪郭C1を示し、第8図
(b)は記入枠外輪郭C1を二値画像へ変換した図であ
る。二値画像への変換は特願昭60−36371号に記載の方
法で行なう。次に、二値画像に変換した輪郭から文字画
像を消去するため、太め処理を行ない(第8図
(c))、さらに細め処理を行ない、第8図(d)のマ
スク画像を得、マスク画像と輪郭の二値画像(b)から
文字部分画像として、第8図(e)を得る。第8図
(e)を得るためには、第8図(b)の画像の白黒反転
画像と、第8図(d)の画像の論理積演算を実行すれば
よい。ここで、細めビット数n0と太めビット数n1は、記
入枠の一部が文字部分画像として抽出されない様に、n0
<n1とする。第8図に示す方法は、記入枠の形状が任意
の輪郭であっても適用可能であるが、記入枠の形状とサ
イズがあらかじめ既知の場合には、第8図(d)に示す
マスク画像を、第5図中の第2文字目や第3文字目に示
す様に、仮想記入枠を基準に簡便な方法で作成して、文
字部分画像を抽出しても良い。この様に本発明において
は記入枠に近似したマスク画像を用いて記入枠輪郭に含
まれる接触文字の部分画像を抽出する。尚第8図の例
は、外輪郭についての例であり内輪郭についても同様の
方法で文字部分画像を抽出できることは明白である。ま
た、文字部分画像の抽出は、第8図に示す方法に限定さ
れるものではなく、他の公知の方法によって行なうこと
も可能である。
第9図は、記入枠内外輪郭部分画像から記入枠内輪郭の
文字部分画像を含む文字マスク画像を抽出する方法を第
5図に示す第1文字目を例にして示す図である。第9図
(a)において、B0〜B5,B16が記入枠外輪郭に含まれる
文字部分画像、B′16が記入枠内輪郭に含まれる文字部
分画像を示す。第9図(a)に示す文字部分画像B0
B5,B16,B′16には、記入枠と交差する部分の画像が含ま
れないため、交差部分の画像を含む文字マスク画像を作
成するために、まず、第9図(a)の画像を太め処理
し、太め処理後細め処理することにより第9図(b)の
画像を得る。第9図(b)に示す画像は、文字部分画像
が記入枠と交差する部分が修復されたものとなる。太め
/細め処理を行なうビット数は、交差する部分を修復す
るのに十分な値とするため、約1mm程度としている。
尚、本実施例では文字は記入枠内にあることを前提とす
るため、記入枠外輪郭のみの文字部分画像を除去し、文
字マスク画像m16を得る。文字マスク画像m16は、第9図
(b)の画像の輪郭を抽出し(第9図(c))、抽出し
た輪郭のうち、記入枠内輪郭の文字部分画像B′16を含
む輪郭m′16を選択し、輪郭m′16を二値画像に変換し
文字マスク画像m16を得る(第9図(d))。なお、第
9図(b)に示す画像を文字マスク画像とし、文字マス
ク画像から文字輪郭を抽出し、抽出した文字輪郭のうち
記入枠外の文字輪郭として文字マスク画像m0,m12,m34,m
5に相当する文字輪郭を除去する方法もある。
以上第6図から第9図に示す実施例においては、記入枠
の内外輪郭から文字画像を抽出する方法として、記入枠
の形状やサイズが任意の場合を想定している。そのた
め、第1図に示す切出/認識部(マイクロプロセッサ)
7における処理時間の増大が避けられない。そこで、書
式情報により記入枠が矩形であることを指定すれば、次
に説明する第10図、第11図に示す方法で記入枠輪郭か
ら、文字画像を抽出することにより処理時間を短縮する
ことができる。
第10図は、記入枠が矩形であることを条件に、記入枠輪
郭から文字画像を抽出するための処理を示すフローチャ
ートであり、第11図は第4図の第1文字目における記入
枠輪郭から文字画像を抽出するための例を示す図であ
る。第10図において、まずステップ2100において、記入
枠内外輪郭を二値画像へ変換する。第11図(b)は、第
11図(a)の記入枠内外輪郭C′1,C1を二値画像へ変換
した状態を示すものである。次に、ステップ2200におい
て、記入枠縦線の消去を行なう。記入枠縦線を消去する
ためには、第11図(b)に示すように、境界Bxl,Bxrの
左側および右側に消去領域を設定する。境界Bxl,Bxr
は、記入枠内輪郭の最大X座標値,最小X座標値xmax,x
minから次式を用いて求める。
Bxl=xmin+Δx Bxr=xmax−Δx 上式において、Δxは定数で記入枠の線の太さとほぼ同
じ値としている。記入枠縦線の消去は、消去領域におい
て、x方向の細め処理により実現できる。消去した結果
を第11図(c)に示す。細め処理は、あらかじめ指定さ
れている記入枠の線の太さを消去するのに十分なビット
数分行なうが、記入枠の線の太さを検出して実行しても
よい。なお、消去されなかった画像を基に復元するた
め、細め処理後太め処理を行なう。同様にして、ステッ
プ2300において、記入枠横線の消去を行なう。記入枠横
線の消去は、消去領域を記入枠内輪郭C′のy方向の
最大値ymax,最小値yminを基準にして、境界Byu,Bylの値
を、 Byu=ymin+Δy Byl=ymax−Δy とし、上記境界Byuの上側とBylの下側に、図示する様に
設定して行なう。第11図(d)は、記入枠縦線と記入枠
横線を消去した後で残った文字画像C′16を示す図であ
る。次に、ステップ2400において、文字画像C′16を輪
郭追跡することにより、文字輪郭C16を得る。
なお、第5図に示す第2文字目、第3文字目のように、
記入枠内輪郭が存在しない場合、消去領域の設定は、第
5図の第2文字,第3文字目に示す仮想記入枠の外輪郭
CV及び内輪郭C′を基準に設定する。
以上述べたように本実施例によれば、記入枠形状が矩形
でなくても、記入枠内の文字はもちろん記入枠からはみ
出した文字でも、記入枠と分離して切出すことができ
る。また、記入枠が切れやかすれにより分離したり、記
入枠が破線であっても、仮想記入枠を設定することによ
り記入枠内の文字を記入枠と分離して切出すことができ
る。さらに、画像を輪郭として抽出し、記入枠の正確な
形状や位置情報を得ることができるので、記入枠以外の
輪郭を処理対象からはずすことにより、文字切出し処理
における記入枠以外の画像による影響を排除し、文字切
出しの信頼度を高くすることができる。
また、記入枠形状が、矩形に限定できる場合、記入枠輪
郭の二値画像に対し、容易に記入枠画像の消去ができる
ため、読取速度の低下を防止できる。
[発明の効果] 本発明によれば、非ドロップアウトカラー印刷の帳票
で、破線記入枠の帳票や、切れ・かすれの発生した複写
帳票を読取ることができるとともに、上記の帳票におい
て記入文字が記入枠からはみ出しても、読取りができ
る。従って、帳票作成の制限を緩和し、コストを削減で
きる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図
(a),(b),(c)は帳票の文字枠への文字記入例
を示す説明図、第2図(d)は第2図(c)に示す帳票
の文字枠への記入文字の従来技術による読み取り例を示
す説明図、第3図は第1図に示す切出し/認識部(マイ
クロプロセッサ)における文字切出し処理を示すフロー
チャート、第4図(a),(b),(c)及び第5図は
文字切出し処理の具体例を示す説明図、第6図は記入枠
輪郭又は仮記入枠輪郭に含まれる文字画像を抽出する処
理を示すフローチャート、第7図(a),(b),
(c),(d),(e)は第6図に示すフローチャート
に従って文字画像を抽出する処理の具体例を示す説明
図、第8図(a),(b),(c),(d),(e)は
第6図に示すフローチャートにおける文字部分画像の抽
出処理の具体例を示す説明図、第9図(a),(b),
(c),(d)は記入枠内外輪郭部分画像から記入枠内
輪郭の文字部分画像を含む文字マスク画像を抽出する具
体例を示す説明図、第10図は記入枠が矩形であることを
前提として、記入枠輪郭から文字画像を抽出する処理を
示すフローチャート、第11図(a),(b),(c),
(d),(e)は第10図に示すフローチャートによる処
理の具体例を示す図である。 1……帳票搬送機構、2……帳票、3……発光源、4…
…受光素子、5……二値化回路、6……記憶部、7……
切出し/認識部(マイクロプロセッサ)。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 吉田 昭信 神奈川県小田原市国府津2880番地 日立コ ンピュータ機器株式会社内 (72)発明者 上田 欣洋 神奈川県小田原市国府津2880番地 日立コ ンピュータ機器株式会社内 (56)参考文献 特開 昭60−126777(JP,A) 特開 昭60−142784(JP,A) 特開 昭57−178574(JP,A) 特開 昭61−125687(JP,A)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】予め規定されたサイズおよび位置等の帳票
    の書式情報に基づき、記入枠及び該記入枠中に記載され
    た文字等を光学的に読み取って得た二値画像に含まれる
    文字等を切り出す文字パターン認識装置の文字切り出し
    方法であって、 前記二値画像から黒画素の集合を輪郭追跡して内外両輪
    郭から成る領域輪郭を抽出する第1ステップ、 該第1ステップより抽出した領域輪郭から予め規定され
    た前記記入枠の書式情報を用いて内輪郭及び外輪郭から
    成る記入枠の輪郭を選択する第2ステップ、 該第2ステップにおいて輪郭の不連続等により前記記入
    枠の輪郭が選択できない場合、前記書式情報に基づいて
    内輪郭及び外輪郭からなる定型的な仮想記入枠を設定す
    ると共に、該仮想記入枠に接する領域輪郭を仮記入枠輪
    郭として選択する第3ステップ、 前記第2ステップによる記入枠の輪郭を選択できた場
    合、該記入枠の内輪郭の内側に含まれる輪郭を文字輪郭
    として抽出し、前記第3ステップによる仮想記入枠を選
    択した場合、仮想記入枠の内輪郭の内側に含まれる輪郭
    の内、仮記入枠輪郭でない輪郭を文字輪郭として抽出す
    る第4ステップ、 前記第2又は第3ステップにより選択した記入枠輪郭又
    は仮記入枠輪郭に含まれ且つ接触した文字の画像を分離
    するため、予め規定された記入枠に近似したマスク画像
    の外側の文字部分画像と予め規定された記入枠に近似し
    たマスク画像の内側の文字部分画像を前記記入枠輪郭あ
    るいは仮記入枠輪郭から抽出し、この文字部分画像を太
    め及び細め処理して修復した文字部分画像の文字輪郭を
    抽出する第5ステップ或は、 前記第1ステップにおける記入枠の形状が矩形である場
    合、該記入枠の縦方向の輪郭を含む左右の縦線消去領域
    を縦方向の細め処理により該記入枠の縦線を消去し、且
    つ前記記入枠の横方向の輪郭を含む上下の横線消去領域
    を横方向の細め処理により該記入枠の横線を消去するこ
    とによって、前記接触文字部分画像を修復した文字輪郭
    を抽出する第6ステップ、 該第4乃至第6ステップにより選択した文字輪郭を用い
    て文字を認識する第7ステップとを含むことを特徴とす
    る文字切り出し方法。
JP61205054A 1986-09-02 1986-09-02 文字切り出し方法 Expired - Lifetime JPH0711816B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61205054A JPH0711816B2 (ja) 1986-09-02 1986-09-02 文字切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61205054A JPH0711816B2 (ja) 1986-09-02 1986-09-02 文字切り出し方法

Publications (2)

Publication Number Publication Date
JPS6361387A JPS6361387A (ja) 1988-03-17
JPH0711816B2 true JPH0711816B2 (ja) 1995-02-08

Family

ID=16500680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61205054A Expired - Lifetime JPH0711816B2 (ja) 1986-09-02 1986-09-02 文字切り出し方法

Country Status (1)

Country Link
JP (1) JPH0711816B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5653308B2 (ja) * 2011-06-30 2015-01-14 株式会社東芝 領域検出装置、領域検出方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6010671B2 (ja) * 1978-05-08 1985-03-19 松下電器産業株式会社 パタ−ン読取装置
JPS57178574A (en) * 1981-04-25 1982-11-02 Toshiba Corp Character pattern detecting and segmenting device
JPS60126777A (ja) * 1983-12-14 1985-07-06 Hitachi Ltd 文字切り出し方式
JPS60142784A (ja) * 1983-12-29 1985-07-27 Fujitsu Ltd 文字分離方式
JPS61125687A (ja) * 1984-11-22 1986-06-13 Hitachi Ltd パタ−ン抽出方式

Also Published As

Publication number Publication date
JPS6361387A (ja) 1988-03-17

Similar Documents

Publication Publication Date Title
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3615333B2 (ja) 罫線消去装置
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JPH0711816B2 (ja) 文字切り出し方法
JP3794285B2 (ja) 光学式文字読取装置
JP2909132B2 (ja) 光学的文字読取装置
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP3190794B2 (ja) 文字切り出し装置
JP3437296B2 (ja) 文字列高速抽出装置
US6142374A (en) Optical character reader
JP2922992B2 (ja) 光学的文字読取装置
JPH08221518A (ja) 光学文字読取装置
JP3239965B2 (ja) 文字認識装置
JPH0728934A (ja) 文書画像処理装置
JP2925270B2 (ja) 文字読取装置
JP2721415B2 (ja) 文字画像抽出方法
JP2925275B2 (ja) 光学的文字読取装置
JP2570184B2 (ja) 光学式文字読取装置
JP2888885B2 (ja) 文字切出し装置
JP2963807B2 (ja) 郵便番号枠検出装置
JPH05242297A (ja) 文字切り出し方法
JP2002123794A (ja) フォーマットパラメータ作成装置及び文字認識装置
JPH08171610A (ja) 光学式文字読み取り装置および光学式文字読み取り方法
JPH10233930A (ja) 画像処理装置
JP2002373341A (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term