JPH0375889A - 画像抽出方法 - Google Patents
画像抽出方法Info
- Publication number
- JPH0375889A JPH0375889A JP1211260A JP21126089A JPH0375889A JP H0375889 A JPH0375889 A JP H0375889A JP 1211260 A JP1211260 A JP 1211260A JP 21126089 A JP21126089 A JP 21126089A JP H0375889 A JPH0375889 A JP H0375889A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image data
- pattern
- character pattern
- binary image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 20
- 238000000605 extraction Methods 0.000 claims description 25
- 230000008719 thickening Effects 0.000 abstract description 15
- 239000000284 extract Substances 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 8
- 239000004065 semiconductor Substances 0.000 description 5
- 238000003672 processing method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241000272201 Columbiformes Species 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野コ
この発明は画像処理における文字画像の抽出方法、特に
文字と文字記入枠を含む画像より文字画像を抽出する画
像抽出方法に関するものである。
文字と文字記入枠を含む画像より文字画像を抽出する画
像抽出方法に関するものである。
[従来の技術]
現在、光学式文字読取り装置(以下OCR装置と略する
)は各種帳票に記入されている文字を読取り認識し、計
算装置等に人力する装置として広く普及している。
)は各種帳票に記入されている文字を読取り認識し、計
算装置等に人力する装置として広く普及している。
従来のOCR装置において文字及び文字記入枠を含む画
像を読取る場合は、文字記入枠をドロップアウトカラー
(OCR装置が感知できない色)を用いて印刷しておき
、文字を非ドロップアウトカラー(OCR装置が感知で
きる色)で記入するという制限を設ける事により、画像
読取り時点で文字記入枠を削除するという方法か一般的
であった。
像を読取る場合は、文字記入枠をドロップアウトカラー
(OCR装置が感知できない色)を用いて印刷しておき
、文字を非ドロップアウトカラー(OCR装置が感知で
きる色)で記入するという制限を設ける事により、画像
読取り時点で文字記入枠を削除するという方法か一般的
であった。
しかしなから上記のような画像抽出方法では、文字記入
枠にドロップアウトカラーを用いた帳票にしか適用でき
ないので、文字記入枠が非ドロップアウトカラーで印刷
されている場合にも画像抽出が可能なOCR装置の要望
が高まっている。
枠にドロップアウトカラーを用いた帳票にしか適用でき
ないので、文字記入枠が非ドロップアウトカラーで印刷
されている場合にも画像抽出が可能なOCR装置の要望
が高まっている。
第2図は文字か文字記入枠に交差する例を説明する図で
ある。
ある。
また、従来第2図に示すように非ドロップアウトカラー
で描かれた文字記入枠に接するように文字が書かれてお
り、この文字のみを抽出する場合、文字記入枠パタンと
文字パタンの濃度に差かあることを利用して、多値パタ
ンを2値化することにより文字記入枠パタンを除去する
方法かとられていた。
で描かれた文字記入枠に接するように文字が書かれてお
り、この文字のみを抽出する場合、文字記入枠パタンと
文字パタンの濃度に差かあることを利用して、多値パタ
ンを2値化することにより文字記入枠パタンを除去する
方法かとられていた。
しかしながら、文字記入枠パタンを完全に除去する閾値
をもって2値化した場合、抽出幻象文字パタンの線幅か
細くなったり、あるいはかすれてしまう場合か多い。ま
た逆に文字パタンの線幅か細くならない閾値をもって2
値化した場合には、文字記入枠パタンか完全には除去さ
れずに残ってしまう場合か多い。
をもって2値化した場合、抽出幻象文字パタンの線幅か
細くなったり、あるいはかすれてしまう場合か多い。ま
た逆に文字パタンの線幅か細くならない閾値をもって2
値化した場合には、文字記入枠パタンか完全には除去さ
れずに残ってしまう場合か多い。
そこで、文字記入枠パタンか残った状態の2値パタンか
ら文字記入枠パタンを除去する方法として、例えば特公
昭[i2−7590号公報に開示された「画像抽出方式
」による方法かある。
ら文字記入枠パタンを除去する方法として、例えば特公
昭[i2−7590号公報に開示された「画像抽出方式
」による方法かある。
以下、上記文献に示された方法の概要を説明する。
まず、文字記入枠を構成する縦線及び横線と、文字を1
1カ成する縦線及び横線に幻し、太さ及び長さに関して
それぞれ叉なる制限条件を設定し、文字記入枠の制限条
件を満たす縦線及び横線を検出する。
1カ成する縦線及び横線に幻し、太さ及び長さに関して
それぞれ叉なる制限条件を設定し、文字記入枠の制限条
件を満たす縦線及び横線を検出する。
次に、上記により検出された文字記入枠の制限条件を満
たず縦線及び横線に相当するパタンを消去する。
たず縦線及び横線に相当するパタンを消去する。
最後に、これら消去した縦線及び横線と、これら以外の
文字等か交わっていた部分のパタンを補充する。
文字等か交わっていた部分のパタンを補充する。
上記の手順により文字の抽出を行う方法である。
[発明か解決しようとする課題]
しかしなから、」二記のような従来の画像抽出方法では
、原稿上の画像の性質と、画像を読取るOCR装置の走
査部の性質とから、縦線及び横線の太さ及び長さに関す
る制限条件を設定してやる必要かあるという問題点かあ
る。
、原稿上の画像の性質と、画像を読取るOCR装置の走
査部の性質とから、縦線及び横線の太さ及び長さに関す
る制限条件を設定してやる必要かあるという問題点かあ
る。
また、抽出文字パタンを構成する縦線及び横線のうち、
例外的に太さ及び長さが文字記入枠パタンの太さ及び長
さの制限値に比べ、細く長いものがある場合、その線を
文字記入枠として検出して抽出文字パタンから消去して
しまうため、正確な文字パタンか抽出てきないという問
題点かある。
例外的に太さ及び長さが文字記入枠パタンの太さ及び長
さの制限値に比べ、細く長いものがある場合、その線を
文字記入枠として検出して抽出文字パタンから消去して
しまうため、正確な文字パタンか抽出てきないという問
題点かある。
さらに、抽出文字パタンか文字記入枠と交差している部
分では、その交差部分も文字記入枠とともに消失してし
まうため、その後消去された部分を修正処理する必要が
あり処理に時間かかかるのと同時に原文字パタンに忠実
に復元させることが困難であるという問題点もある。
分では、その交差部分も文字記入枠とともに消失してし
まうため、その後消去された部分を修正処理する必要が
あり処理に時間かかかるのと同時に原文字パタンに忠実
に復元させることが困難であるという問題点もある。
この発明は、以」二述べた抽出文字及び文字記入枠の縦
線及び横線の太さと長さに制限条件か存在する、抽出文
字パタンの復元処理に時間かかかる、原文字パタンに忠
実に復元する事か困難であるといった問題点を除去し、
目的とする文字パタンを高速かつ高品質に抽出すること
かできる画像抽出方法を提供することを目的とする。
線及び横線の太さと長さに制限条件か存在する、抽出文
字パタンの復元処理に時間かかかる、原文字パタンに忠
実に復元する事か困難であるといった問題点を除去し、
目的とする文字パタンを高速かつ高品質に抽出すること
かできる画像抽出方法を提供することを目的とする。
[課題を解決するための手段]
この発明に係る画像抽出方法は、文字及び文字記入枠を
含む画像を読取り、その後、前記画像を量子化して得ら
れた多値画像データに対して、第1の閾値より第1の2
値画像データを生成する第1の2値化手段と、前記第1
の2値画像データより太めの2値画像データを生成する
太め処理手段と、前記多値画像データを第2の閾値より
第2の2値画像データを生成する第2の2値化手段と、
前記太めの2値画像データと、前記第2の2値画像デー
タとの論理積を演算し、該演算結果を文字パタンとして
抽出する文字パタン抽出手段とを備えたものである。
含む画像を読取り、その後、前記画像を量子化して得ら
れた多値画像データに対して、第1の閾値より第1の2
値画像データを生成する第1の2値化手段と、前記第1
の2値画像データより太めの2値画像データを生成する
太め処理手段と、前記多値画像データを第2の閾値より
第2の2値画像データを生成する第2の2値化手段と、
前記太めの2値画像データと、前記第2の2値画像デー
タとの論理積を演算し、該演算結果を文字パタンとして
抽出する文字パタン抽出手段とを備えたものである。
[作 用]
この発明においては、文字及び文字記入枠を含む画像か
ら文字パタンを抽出する方法として、第1の2値化手段
、太め処理手段、第2の2値化手段及び文字パタン抽出
手段を設け、文字及び文字記入枠を含む画像を読取り、
その後前記画像を量子化して得られた多値画像データに
対して、第1の2値化手段は文字記入枠パタンか完全に
消去される第1の閾値により2値化を行い第1の2値画
像データを生成し、該免1の2値画像データに対して太
め処理手段は細い線分を太い線分に変換する太め処理を
行い太め2値画像データを生成し、また前記多値画像デ
ータに対して、第2の2値化手段は抽出文字パタンか完
全な形で残る第2の閾値により2値化を行い第2の2値
画像データを生威し、文字パタン抽出手段は前記太め2
値両像デタと第2の2値画像データとの論理積を演算し
、該演算結果を文字パタンとして抽出する。
ら文字パタンを抽出する方法として、第1の2値化手段
、太め処理手段、第2の2値化手段及び文字パタン抽出
手段を設け、文字及び文字記入枠を含む画像を読取り、
その後前記画像を量子化して得られた多値画像データに
対して、第1の2値化手段は文字記入枠パタンか完全に
消去される第1の閾値により2値化を行い第1の2値画
像データを生成し、該免1の2値画像データに対して太
め処理手段は細い線分を太い線分に変換する太め処理を
行い太め2値画像データを生成し、また前記多値画像デ
ータに対して、第2の2値化手段は抽出文字パタンか完
全な形で残る第2の閾値により2値化を行い第2の2値
画像データを生威し、文字パタン抽出手段は前記太め2
値両像デタと第2の2値画像データとの論理積を演算し
、該演算結果を文字パタンとして抽出する。
[実施例コ
第1図は本発明に係る文字パタン抽出装置のブロック図
である。同図において20は読取部て光電変換部201
を内蔵し、人力画像を光学的に読取り、その画像濃度を
多値に量子化した多値量子化両像データ(例えば画像の
各画素の濃淡を16階調に区分し、これを2進数の4ビ
ツトで表示した画像データ)を出力する。21は画像メ
モリ部で、例えば半導体のランダムアクセスメモリ (
以下RAMという)、又はフロッピーディスク、もしく
はハトディスク等の画像データ保存手段2目を内蔵し、
前記多値量子化画像データを保存する。22は文字パタ
ン抽出部で下記の221〜228の機器を内蔵し、前記
画像メモリ部21に保存された多値量子化画像データに
対して、後述する第1及び第2の2種類の閾値を用いて
2値化し、その結果得られるそれぞれの2値パタンを用
いて文字パタンの抽出を行う。221は第1の2値化手
段であり、例えば内部に前記第1の閾値が設定された設
定器とデジタル比較器とを含む。該デジタル比較器は人
力する各画素毎の多値量子化画像データと、設定器に設
定された第1の閾値との大小関係を比較し、前者のデー
タ値の方が後者の閾値より小さいときは“0”の出力を
、また、そうでないときは“1”の出力を発生し、入力
する多値量子化画像データを2値化画像データに変換し
て出力するものである。
である。同図において20は読取部て光電変換部201
を内蔵し、人力画像を光学的に読取り、その画像濃度を
多値に量子化した多値量子化両像データ(例えば画像の
各画素の濃淡を16階調に区分し、これを2進数の4ビ
ツトで表示した画像データ)を出力する。21は画像メ
モリ部で、例えば半導体のランダムアクセスメモリ (
以下RAMという)、又はフロッピーディスク、もしく
はハトディスク等の画像データ保存手段2目を内蔵し、
前記多値量子化画像データを保存する。22は文字パタ
ン抽出部で下記の221〜228の機器を内蔵し、前記
画像メモリ部21に保存された多値量子化画像データに
対して、後述する第1及び第2の2種類の閾値を用いて
2値化し、その結果得られるそれぞれの2値パタンを用
いて文字パタンの抽出を行う。221は第1の2値化手
段であり、例えば内部に前記第1の閾値が設定された設
定器とデジタル比較器とを含む。該デジタル比較器は人
力する各画素毎の多値量子化画像データと、設定器に設
定された第1の閾値との大小関係を比較し、前者のデー
タ値の方が後者の閾値より小さいときは“0”の出力を
、また、そうでないときは“1”の出力を発生し、入力
する多値量子化画像データを2値化画像データに変換し
て出力するものである。
222は前記第1の2値化手段221からの出力信号を
記憶する第1の2値画像メモリ部である。このメモリ素
子としては、例えば半導体RAM等が用いられる。22
3は太め処理手段であり、太め処理とは一般に文字又は
キャラクタ等の細い線分を太い線分に変換するデータ処
理をいう。224は前記太め処理手段の出力データを記
憶する太め画像メモリ部である。またこのメモリ素子と
しては、例えば半導体RAM等が用いられる。225は
第2の2値化手段であり、例えば内部に前記第2の閾値
か設定された設定器とデジタル比較器とを含む。
記憶する第1の2値画像メモリ部である。このメモリ素
子としては、例えば半導体RAM等が用いられる。22
3は太め処理手段であり、太め処理とは一般に文字又は
キャラクタ等の細い線分を太い線分に変換するデータ処
理をいう。224は前記太め処理手段の出力データを記
憶する太め画像メモリ部である。またこのメモリ素子と
しては、例えば半導体RAM等が用いられる。225は
第2の2値化手段であり、例えば内部に前記第2の閾値
か設定された設定器とデジタル比較器とを含む。
該デジタル比較器は前記説明と同碌に、入力される各画
素毎の多値量子化画像データについて、設定器に設定さ
れた第2の閾値との大小関係を比較することにより、2
値化画像データに変換して出力するものである。当然第
1の閾値と第2の閾値とは光なる値であり、これらの閾
値については後に詳説する。226は前記第2の2値化
手段225の出力信号を記憶する第2の2値画像メモリ
部である。このメモリ素子には、同様に半導体RAM等
が用いられる。227は文字パタン抽出手段であり、前
記太め画像メモリ部224の出力信号と、第2の2値画
像メモリ部226の出力信号との論理積を演算し、該演
算結果を文字パタンとして抽出するものである。228
はパタンレジスタであり、前記文字パタン抽出手段22
7により抽出された文字パタンデータを一時記憶し、そ
の後外部に出力するものである。このレジスタとしては
半導体のバッファレンジ等が用いられる。
素毎の多値量子化画像データについて、設定器に設定さ
れた第2の閾値との大小関係を比較することにより、2
値化画像データに変換して出力するものである。当然第
1の閾値と第2の閾値とは光なる値であり、これらの閾
値については後に詳説する。226は前記第2の2値化
手段225の出力信号を記憶する第2の2値画像メモリ
部である。このメモリ素子には、同様に半導体RAM等
が用いられる。227は文字パタン抽出手段であり、前
記太め画像メモリ部224の出力信号と、第2の2値画
像メモリ部226の出力信号との論理積を演算し、該演
算結果を文字パタンとして抽出するものである。228
はパタンレジスタであり、前記文字パタン抽出手段22
7により抽出された文字パタンデータを一時記憶し、そ
の後外部に出力するものである。このレジスタとしては
半導体のバッファレンジ等が用いられる。
第3図の(a)〜(e)は本発明に係る画像処理過程を
説明する図であり、第3図の(a)〜(e)は第2図の
丸部で示された文字パタンと文字記入枠パタンの交差す
る部分の画像処理過程を示している。
説明する図であり、第3図の(a)〜(e)は第2図の
丸部で示された文字パタンと文字記入枠パタンの交差す
る部分の画像処理過程を示している。
第3図を参照し第1図の動作を説明する。
ます、読取部20が原稿の配置された読取り領域の走査
を開始すると、読取部20に内蔵される光電変換部20
1は、人力画像を光学的に読取り(−股間には光源から
の投射光を画像面に照射し、その反射光又は透過光を受
光センサにより読取る。)、該読取り信号の電圧レベル
をA/D変換器を介してデジタル信号(本実施例におい
ては入力アナログ電圧値を対応する2進4ビツトのデジ
タル信号)に変換する方法により、多値に量子化された
画像データを得る。この画像データは読取部20の走査
順序に従い各画素毎に出力するので、画像メモリ部21
はこの多値量子化画像データを順次保存する。
を開始すると、読取部20に内蔵される光電変換部20
1は、人力画像を光学的に読取り(−股間には光源から
の投射光を画像面に照射し、その反射光又は透過光を受
光センサにより読取る。)、該読取り信号の電圧レベル
をA/D変換器を介してデジタル信号(本実施例におい
ては入力アナログ電圧値を対応する2進4ビツトのデジ
タル信号)に変換する方法により、多値に量子化された
画像データを得る。この画像データは読取部20の走査
順序に従い各画素毎に出力するので、画像メモリ部21
はこの多値量子化画像データを順次保存する。
ここで本実施例における多値量子化画像データは第3図
の(a)に示すように低濃度から高濃度に渡り16進数
の“0”から“F”までの範囲の↓6階調に量子化する
ものとする。また第3図(a)においては、交差するパ
タンのうち傾斜したパタンを文字パタン32、垂直のパ
タンを文字記入枠パタン31として示している。そして
各パタンの水平方向の画像データ値は当然中心部がその
両端部よりも大きな値となっている。即ち文字パタン3
2の水平方向の画像データ値は“45954”となって
おり、中心部のデータ値“9”は、両端部のデータ値“
4”より大きな値である。また文字証人枠パタン3Lの
水平方向の画像データ値は“2552″となっており、
中心部のデータ値“5”は両端部のデータ値“2“より
大きな値である。さらに文字パタン32の画像データ値
は、最高値か“9”、最低値が“4”であり、また文字
記入枠パタン31のデータ値は、最高値が“5”、最低
値が“2”であるのて、前者の平均データ値は後者のそ
の値よりも全体的に大きなレヘル値となっている。この
ことより、両者の濃度に階調差があることが判る。
の(a)に示すように低濃度から高濃度に渡り16進数
の“0”から“F”までの範囲の↓6階調に量子化する
ものとする。また第3図(a)においては、交差するパ
タンのうち傾斜したパタンを文字パタン32、垂直のパ
タンを文字記入枠パタン31として示している。そして
各パタンの水平方向の画像データ値は当然中心部がその
両端部よりも大きな値となっている。即ち文字パタン3
2の水平方向の画像データ値は“45954”となって
おり、中心部のデータ値“9”は、両端部のデータ値“
4”より大きな値である。また文字証人枠パタン3Lの
水平方向の画像データ値は“2552″となっており、
中心部のデータ値“5”は両端部のデータ値“2“より
大きな値である。さらに文字パタン32の画像データ値
は、最高値か“9”、最低値が“4”であり、また文字
記入枠パタン31のデータ値は、最高値が“5”、最低
値が“2”であるのて、前者の平均データ値は後者のそ
の値よりも全体的に大きなレヘル値となっている。この
ことより、両者の濃度に階調差があることが判る。
次に第1の2値化手段221により、画像メモリ21に
保存されている多値画像データに対して、文字証人枠パ
タン31か完全に消去される第1の閾値をもって2値(
本実施例では画素値“1″および“O”の2値)化しを
行う。即ち本実施例では文字記入枠パタン31の最高値
が”5”であるので、文字証人枠パタン31を消去する
第1の閾値を“6“として、第1の2値化手段221は
、人力する多値画像データに対して、第1の閾値“6”
以下のデータはずべて“O“とし、その他のデータ(“
6″及び“6″以上のデータ)は“1“とじて2値化を
行う。この場合第3図(a)の多値画像データの内、デ
ータ“9“のみがデータ“]”に変更され、その他の多
値画像データはすべて“0”に変更されるので、この実
施例において第1の2値化手段221より出力される2
値画像データは第3図の(b)のようになる。(表示を
見やすくするため、] 1 画素値“0″の部分はブランクとする。以降の2値画像
データも同様である。) この第1の2値化手段221より出力される2値画像デ
ータは、次段の2値画像メモリ部222に順次記憶され
る。
保存されている多値画像データに対して、文字証人枠パ
タン31か完全に消去される第1の閾値をもって2値(
本実施例では画素値“1″および“O”の2値)化しを
行う。即ち本実施例では文字記入枠パタン31の最高値
が”5”であるので、文字証人枠パタン31を消去する
第1の閾値を“6“として、第1の2値化手段221は
、人力する多値画像データに対して、第1の閾値“6”
以下のデータはずべて“O“とし、その他のデータ(“
6″及び“6″以上のデータ)は“1“とじて2値化を
行う。この場合第3図(a)の多値画像データの内、デ
ータ“9“のみがデータ“]”に変更され、その他の多
値画像データはすべて“0”に変更されるので、この実
施例において第1の2値化手段221より出力される2
値画像データは第3図の(b)のようになる。(表示を
見やすくするため、] 1 画素値“0″の部分はブランクとする。以降の2値画像
データも同様である。) この第1の2値化手段221より出力される2値画像デ
ータは、次段の2値画像メモリ部222に順次記憶され
る。
次に太め処理手段223により、前記第1の2値画像メ
モリ部222に記憶されている2値画像データに対して
、細い線分を太くする太め処理を行なう。
モリ部222に記憶されている2値画像データに対して
、細い線分を太くする太め処理を行なう。
大め処理手段223は、本実施例においては、次の太め
処理方法を実現する信号処理手段を有するものである。
処理方法を実現する信号処理手段を有するものである。
」二記太め処理方法とは、第1の2値画像メモリ222
に記憶されている2値画像データの各画素の内の注目画
素において、次のいずれかの条件を満足するとき、その
注目画素値を“1”とするものである。
に記憶されている2値画像データの各画素の内の注目画
素において、次のいずれかの条件を満足するとき、その
注目画素値を“1”とするものである。
条件]:注目画素が“]”であること。
条件2:注目画素に接する8画素(注目画素を中心にし
て、上、下、左、右、左上、左下、右上、右下の8つの
画素)のうち少なくとも1個の“1” 2 かあること。
て、上、下、左、右、左上、左下、右上、右下の8つの
画素)のうち少なくとも1個の“1” 2 かあること。
上記の太め処理方法により太め処理を行なった結果得ら
れる太め2値画像データを第3図の(C)に示す。即ち
第3図の(c)では、同図の(a)の画像データが水平
方向に太くなり、細い斜線が太い斜線に変換されている
ことが判る。この太め処理は前記第1の2値化手段22
1において、文字記入枠パタン31を消去するように2
値化された画像データが一般に細線化されてしまうとい
うことに対処するために行なうものである。
れる太め2値画像データを第3図の(C)に示す。即ち
第3図の(c)では、同図の(a)の画像データが水平
方向に太くなり、細い斜線が太い斜線に変換されている
ことが判る。この太め処理は前記第1の2値化手段22
1において、文字記入枠パタン31を消去するように2
値化された画像データが一般に細線化されてしまうとい
うことに対処するために行なうものである。
またこの太め処理方法を実現する信号処理手段は、例え
ばマイクロプロセッサ(以下CPUという)、前記条件
1及び条件2の判別機能をプログラム化して記憶するリ
ードオンリーメモリ(以下ROMという)及び演算デー
タを一時記憶するRAM等により構成することができる
。
ばマイクロプロセッサ(以下CPUという)、前記条件
1及び条件2の判別機能をプログラム化して記憶するリ
ードオンリーメモリ(以下ROMという)及び演算デー
タを一時記憶するRAM等により構成することができる
。
大め処理手段223より出力される太め処理後の2値画
像データは太め画像メモリ部224に記憶される。
像データは太め画像メモリ部224に記憶される。
次に第2の2値化手段225により、画像メモリ部2H
こ保存されている多値画像データに刻して、文字パタン
32が完全な形で残る第2の閾値をもって2値化を行う
。本実施例では文字パタン32の最低値か“4”である
ので、“4”及び“4”以」二のデータを“1”とし、
その他のデータを“0“とするため、“4”を第2の閾
値として2値化を行う。この第2の閾値を“4”とした
場合に、第3図の(a)に示す多値画像データを2値化
したときの第2の2値画像を第3図の(d)に示す。
こ保存されている多値画像データに刻して、文字パタン
32が完全な形で残る第2の閾値をもって2値化を行う
。本実施例では文字パタン32の最低値か“4”である
ので、“4”及び“4”以」二のデータを“1”とし、
その他のデータを“0“とするため、“4”を第2の閾
値として2値化を行う。この第2の閾値を“4”とした
場合に、第3図の(a)に示す多値画像データを2値化
したときの第2の2値画像を第3図の(d)に示す。
第2の2値化手段225より出力される第2の2値画像
データは第2の2値画像メモリ部226に順次記憶すす
る。
データは第2の2値画像メモリ部226に順次記憶すす
る。
最後に文字パタン抽出手段227により、前述の太め画
像メモリ部224に保存されている太め2値画像データ
と、第2の2値画像メモリ部226に保存されている第
2の2値画像データとの各画素毎の論理積を演算する。
像メモリ部224に保存されている太め2値画像データ
と、第2の2値画像メモリ部226に保存されている第
2の2値画像データとの各画素毎の論理積を演算する。
本実施例では、第3図の(C)に示す太め画像メモリ部
224に保存されている太め2値画像データと、第3図
の(d)に示す第2の2値画像メモリ部226に保存さ
れている第2の2値画像データの画素毎の論理積演算を
行った結果得られる抽出2値画像データは、第3図の(
e)のように文字記入枠パタン31が消去され、文字パ
タン32のみが抽出される。
224に保存されている太め2値画像データと、第3図
の(d)に示す第2の2値画像メモリ部226に保存さ
れている第2の2値画像データの画素毎の論理積演算を
行った結果得られる抽出2値画像データは、第3図の(
e)のように文字記入枠パタン31が消去され、文字パ
タン32のみが抽出される。
前記、文字パタン抽出手段227の論理積演算処理は次
に示すような問題点を解決するために行なうものである
。
に示すような問題点を解決するために行なうものである
。
“9”のように内部に空間をもっている文字に対して太
め処理を行なう場合、空間部分が狭いときは、空間部分
が埋もれてしまうことがある。
め処理を行なう場合、空間部分が狭いときは、空間部分
が埋もれてしまうことがある。
“5”のように狭い間隔て線端の対が存在する文字に対
して太め処理を行なう場合、各線端がつながってしまう
ことがある。
して太め処理を行なう場合、各線端がつながってしまう
ことがある。
上記のように太め処理により必要以上に太くなってしま
った2値画像と、原画像との画素毎の論理積演算を行う
ことにより、より原文字パタンに忠実な形で文字パタン
を抽出することができる。
った2値画像と、原画像との画素毎の論理積演算を行う
ことにより、より原文字パタンに忠実な形で文字パタン
を抽出することができる。
第4図は文字が横罫線に交差する例を説明する図であり
、本発明の画像抽出方法によれば、第45 図に示すような横罫線41に文字が交差する場合におい
ても、前記と同様に文字のみを抽出する事か可能である
。
、本発明の画像抽出方法によれば、第45 図に示すような横罫線41に文字が交差する場合におい
ても、前記と同様に文字のみを抽出する事か可能である
。
文字パタン抽出手段227は、高速処理か必要な場合は
論理演算回路により(111或することもできるし、時
間的余裕かあればCPU、ROM及びRAMにより構成
することも可能である。
論理演算回路により(111或することもできるし、時
間的余裕かあればCPU、ROM及びRAMにより構成
することも可能である。
文字パタン抽出手段227から出力される演算結果の文
字パタンは一旦パタンレジスタ228に順次記憶される
。そしてこのパタンレジスタ228に記憶された文字パ
タンは、その後文字抽出データとして文字パタン抽出装
置より外部に出力される。
字パタンは一旦パタンレジスタ228に順次記憶される
。そしてこのパタンレジスタ228に記憶された文字パ
タンは、その後文字抽出データとして文字パタン抽出装
置より外部に出力される。
また上記実施例においては、太め処理は一回のみ行う例
を示したか、第1の2値化手段により2値化された文字
パタンのかすれの状態によっては、2回以上の太め処理
を行なうことも効果的である。
を示したか、第1の2値化手段により2値化された文字
パタンのかすれの状態によっては、2回以上の太め処理
を行なうことも効果的である。
[発明の効果]
以」二のようにこの発明によれば、文字及び文字記入枠
を含む画像から文字パタンを抽出する方法として、文字
記入枠が完全に消去される第1の閾] 6 値をもって2値化した第1の2値画像データに対し、好
適な太め処理を行なって得られる太め2値画像データと
、文字が完全な形で残る第2の閾値をもって2値化して
得られる第2の2値画像デタとの画素毎の論理積を演算
することにより原文字パタンに忠実に文字パタンを抽出
する。
を含む画像から文字パタンを抽出する方法として、文字
記入枠が完全に消去される第1の閾] 6 値をもって2値化した第1の2値画像データに対し、好
適な太め処理を行なって得られる太め2値画像データと
、文字が完全な形で残る第2の閾値をもって2値化して
得られる第2の2値画像デタとの画素毎の論理積を演算
することにより原文字パタンに忠実に文字パタンを抽出
する。
従って本発明の文字パタン抽出方法は信号処理及び手順
が簡単であるため、本発明を適用した装置は構成が簡単
で、小規模な経済的装置となり、且つ高速で文字パタン
抽出が可能となる効果が得られる。
が簡単であるため、本発明を適用した装置は構成が簡単
で、小規模な経済的装置となり、且つ高速で文字パタン
抽出が可能となる効果が得られる。
また、上記論理演算の結果得られる文字パタンは極めて
高品質であるので、この文字パタンを文字認識装置で認
識する場合に高認識率か期待できるという効果が得られ
る。
高品質であるので、この文字パタンを文字認識装置で認
識する場合に高認識率か期待できるという効果が得られ
る。
第1図は本発明に係る文字パタン抽出装置のブロック図
、第2図は文字が文字記入枠に交差する例を説明する図
、第3図(a)〜(e)は本発明に係る画像処理過程を
説明する図、第4図は文字か横罫線に交差する例を説明
する図である。 図において20は読取部、21は画像メモリ部、22は
文字パタン抽出部、31は文字証人枠パタン、32は文
字パタン、41は横罫線、201は光電変換部、211
は画像データ保存手段、221は第1の2値化手段、2
22は第1の2値画像メモリ部、223は太め処理手段
、224は太め画像メモリ部、225は第2の2値化手
段、226は第2の2値画像メモリ部、227は文字パ
タン抽出手段、228はパタンレジスタである。
、第2図は文字が文字記入枠に交差する例を説明する図
、第3図(a)〜(e)は本発明に係る画像処理過程を
説明する図、第4図は文字か横罫線に交差する例を説明
する図である。 図において20は読取部、21は画像メモリ部、22は
文字パタン抽出部、31は文字証人枠パタン、32は文
字パタン、41は横罫線、201は光電変換部、211
は画像データ保存手段、221は第1の2値化手段、2
22は第1の2値画像メモリ部、223は太め処理手段
、224は太め画像メモリ部、225は第2の2値化手
段、226は第2の2値画像メモリ部、227は文字パ
タン抽出手段、228はパタンレジスタである。
Claims (1)
- 【特許請求の範囲】 文字及び文字記入枠を含む画像を読取り、その後、前記
画像を量子化して得られた多値画像データに対して、 第1の閾値より、第1の2値画像データを生成する第1
の2値化手段と、 前記第1の2値画像データより太めの2値画像データを
生成する太め処理手段と、 前記多値画像データを第2の閾値より、第2の2値画像
データを生成する第2の2値化手段と、前記太めの2値
画像データと、前記第2の2値画像データとの論理積を
演算し、該演算結果を文字パタンとして抽出する文字パ
タン抽出手段とを有することを特徴とする画像抽出方法
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1211260A JPH0375889A (ja) | 1989-08-18 | 1989-08-18 | 画像抽出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1211260A JPH0375889A (ja) | 1989-08-18 | 1989-08-18 | 画像抽出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0375889A true JPH0375889A (ja) | 1991-03-29 |
Family
ID=16602966
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1211260A Pending JPH0375889A (ja) | 1989-08-18 | 1989-08-18 | 画像抽出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0375889A (ja) |
-
1989
- 1989-08-18 JP JP1211260A patent/JPH0375889A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4750209A (en) | System for processing an image having both letter and photographic information | |
| JPS61141087A (ja) | 画像処理方法及び装置 | |
| JPH0375889A (ja) | 画像抽出方法 | |
| JP3268542B2 (ja) | 微細文字画像の拡大方法 | |
| JPH0335374A (ja) | 文書における文字領域と写真領域とを区別する方法及びその装置 | |
| JPS60136476A (ja) | 画像処理装置 | |
| JP2732608B2 (ja) | 線図形画像の背景消去および2値化処理方法およびその装置ならびに指紋画像用画像処理装置 | |
| JP2853140B2 (ja) | 画像領域識別装置 | |
| JP3358133B2 (ja) | 画像処理装置 | |
| JPH10233930A (ja) | 画像処理装置 | |
| JPH07160815A (ja) | 輪郭強調による画像二値化処理方法及び装置 | |
| JPS60140349A (ja) | 網点画像の原画復元処理方法 | |
| JP2677989B2 (ja) | 擬似中間調処理装置 | |
| JP3281786B2 (ja) | 点字複写装置 | |
| JP2897351B2 (ja) | マーカー除去装置 | |
| JPS6180964A (ja) | 画信号処理方法 | |
| JP3584478B2 (ja) | 2値化処理装置及び2値化処理方法 | |
| JPS6277686A (ja) | 印影読取装置 | |
| JPS58220564A (ja) | 文字図形画像抽出方式 | |
| JPH0765161A (ja) | 画像処理装置 | |
| JPH0477954B2 (ja) | ||
| JPS6331825B2 (ja) | ||
| JPH07271907A (ja) | アナログ画像の二値化装置 | |
| Nishida | Restoring high-resolution text images to improve legibility and OCR accuracy | |
| JPH0360276A (ja) | 画情報読取り装置 |