JP3923034B2 - Symbol encircling judgment device, symbol encircling judgment method, program, and recording medium - Google Patents

Symbol encircling judgment device, symbol encircling judgment method, program, and recording medium Download PDF

Info

Publication number
JP3923034B2
JP3923034B2 JP2003187545A JP2003187545A JP3923034B2 JP 3923034 B2 JP3923034 B2 JP 3923034B2 JP 2003187545 A JP2003187545 A JP 2003187545A JP 2003187545 A JP2003187545 A JP 2003187545A JP 3923034 B2 JP3923034 B2 JP 3923034B2
Authority
JP
Japan
Prior art keywords
symbol
determination
predetermined
counting
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003187545A
Other languages
Japanese (ja)
Other versions
JP2005025314A (en
Inventor
豊晴 筒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Original Assignee
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc filed Critical Canon Marketing Japan Inc
Priority to JP2003187545A priority Critical patent/JP3923034B2/en
Publication of JP2005025314A publication Critical patent/JP2005025314A/en
Application granted granted Critical
Publication of JP3923034B2 publication Critical patent/JP3923034B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、イメージスキャナなどから読み取った文書画像の中にある数字等の記号を丸で囲む方式の選択肢の選択状態を認識(判定)する記号囲み判定装置および記号囲み判定方法およびプログラムおよび記録媒体に関するものである。
【0002】
【従来の技術】
様々な帳票用紙において、文字を記入する箇所だけでなく、文字を丸で囲むことによって項目を選択する“丸囲み式選択肢”の箇所が存在する。
【0003】
従来、このような丸囲み式選択肢の選択状態の判定は、特開平10−187865号公報(特許文献1)における発明にもあるように、あらかじめ丸が記入されていない状態の画像を標準画像として記憶しておき、入力された画像との比較によって丸で囲まれているか否かを判定するように構成されている。
【0004】
また、特開2002−183663号公報(特許文献2)における発明では、「丸付き数字」を登録した認識辞書を用い、読み取った帳票の選択肢部分に記録された画像を抽出し、認識辞書内の「丸付き数字」の画像パターンとの類似度を算出し、該算出された類似度に基づいて、「丸付き数字」であるか否を判定することで選択肢に対する丸付きの有無を判定する技術である。
【0005】
【特許文献1】
特開平10−187865号公報
【0006】
【特許文献2】
特開2002−183663号公報
【0007】
【発明が解決しようとする課題】
上記の特許文献1の技術では、帳票ごとに“丸囲み式選択肢”部分(未記入帳票の選択肢部分)を標準画像として記憶するための作業が必要であるため、操作が煩雑になるとともに、標準画像の管理が必要となり、非常に煩雑である等の欠点があった。そして、未記入(未選択)の帳票が無い場合(記入済の帳票のみが有る場合)には、上述した標準画像を記憶させることもできず、結果として、選択状態の判定を行うことができない等の欠点があった。
【0008】
また、上記の特許文献2の技術では、帳票ごとの標準画像は必要ないが、認識辞書を用いた技術であるため、記号を囲む丸の形や帳票読み取り時のノイズの影響を受け易い等の問題点があった。具体的には、丸付き数字と丸なし数字の認識辞書を用いてOCR(Optical Character Reader)を使用するため、記号を囲む丸の形やノイズの影響を受けやすく、上記認識辞書との類似度が低下してしまい、結果として認識率が低くなってしまという問題点がある。
【0009】
本発明は、上記の問題点を解決するためになされたもので、本発明の目的は、前記画像データから所定の記号を含む判定対象領域を切り出し、該切り出された領域を所定方向の帯状領域に分割した各帯状領域内にある線分を探索してカウントし、該カウントされた帯状領域内にある線分数が第1の規定値以上である帯状領域が連続している場合にその連続している帯状領域数をカウントし、該カウントされた帯状領域数と第1の閾値とを比較して、前記記号が所定図形で囲まれているか否かを判定することにより、帳票等の所定領域を標準画像として記憶・管理することなく、帳票等内の所定記号が丸等の所定図形で囲まれているか否かを容易に判定することができるので、管理の面においても判定精度においても格段に向上した記号囲み判定装置および記号囲み判定方法およびプログラムおよび記録媒体を提供することである。
【0010】
【課題を解決するための手段】
本発明の第1の発明は、画像データ内に含まれる所定の記号が所定図形で囲まれているか否かを認識する記号囲み判定装置において、前記画像データから前記所定の記号を含む判定対象領域を特定する特定手段(図1に示すCPU101,図5のステップS502,図7のステップS602,S603,図10のステップS702)と、前記特定手段により特定された判定対象領域を所定方向の帯状領域に分割した各帯状領域内を探索して線分数をカウントする第1のカウント手段(図1に示すCPU101,図5のステップS504,図7のステップS606)と、前記第1のカウント手段によりカウントされた線分数が第1の規定値以上である帯状領域が連続している場合にその連続している帯状領域数をカウントする第2のカウント手段(図1に示すCPU101,図5のステップS507,図7のステップS609)と、前記第2のカウント手段によりカウントされた帯状領域数と第1の閾値とを比較することにより、前記記号が所定図形で囲まれているか否かを判定する判定手段(図1に示すCPU101,図5のステップS510〜S512,図7のステップS612〜S614)とを備えることを特徴とする。
【0011】
本発明の第2の発明は、前記第1の閾値を前記画像データの解像度に基づいて算出する第1の算出手段(図1に示すCPU101,図5のステップS509,図7のステップS611)を更に有することを特徴とする。
【0012】
本発明の第3の発明は、前記第1のカウント手段によりカウントされた線分数が第1の規定値以上である行数の総数をカウントする第3のカウント手段(図1に示すCPU101,図5のステップS507,図7のステップS609)を更に有し、前記判定手段は、前記第2のカウント手段によりカウントされた帯状領域数と第1の閾値との比較結果と、前記第3のカウント手段によりカウントされた帯状領域数の総数と第2の閾値との比較結果とに基づいて、前記記号が所定図形で囲まれているか否かを判定する(図5のステップS510〜S512,図7のステップS612〜S614)ことを特徴とする。
【0013】
本発明の第4の発明は、前記第2の閾値を前記画像データの解像度に基づいて算出する第2の算出手段(図1に示すCPU101,図5のステップS509,図7のステップS611)を更に有することを特徴とする。
【0014】
本発明の第5の発明は、前記第2のカウント手段によりカウントされた帯状領域数の最大値を記憶する記憶手段(図1に示すRAM102)を更に備え、前記判定手段において、前記記憶手段により記憶された帯状領域数の最大値と第1の閾値と比較する(図5のステップS510〜S512,図7のステップS612〜S614)ことを特徴とする。
【0015】
本発明の第6の発明は、前記特定手段により特定された判定対象領域に対してノイズ除去を行うノイズ除去手段(図1に示すCPU101,図7のステップS604)を更に備えることを特徴とする。
【0016】
本発明の第7の発明は、前記所定の記号は、前記第1の閾値の数連続する帯状領域と所定値以上の幅で交わる「前記第1の規定値−1」本又は前記「第1の規定値−2」本の曲線を構成要素とする記号(例えば、記号をアラビア数字の‘0’〜‘9’は、上記第1の規定値を「3」とした場合、該アラビア数字含む判定対象領域を水平方向の行に分割すると、各行のうち連続する複数行と2画素以上の幅交わる「3−1」本(即ち、2本)又は「3−2」本(即ち、1本)の曲線を構成要素に持つため、本発明の記号囲み判定装置で判定可能な記号に相当する)であることを特徴とする。
【0017】
本発明の第8の発明は、前記所定の記号は、アラビア数字であることを特徴とする。
【0018】
本発明の第9の発明は、前記第1の規定値は、「3」又は「5」であることを特徴とする。
【0019】
本発明の第10の発明は、画像データ内に含まれる所定の記号が所定図形で囲まれているか否かを認識するための情報処理装置における記号囲み判定方法において、第1のカウント手段が、前記画像データ内の前記所定の記号を含む判定対象領域を所定方向の帯状領域に分割した各帯状領域内を検索して線分数をカウントする第1のカウント工程(図5のステップS504,図7のステップS606)と、第2のカウント手段が、前記第1のカウント工程によりカウントされた線分数が第1の規定値以上である帯状領域が連続している場合にその連続している帯状領域数をカウントする第2のカウント工程(図5のステップS507,図7のステップS609)と、判定手段が、前記第2のカウント工程によりカウントされた帯状領域数と第1の閾値とを比較することにより、前記記号が所定図形で囲まれているか否かを判定する判定工程(図5のステップS510〜S512,図7のステップS612〜S614)とを備えることを特徴とする。
【0020】
本発明の第11の発明は、第10の発明に記載された記号囲み判定方法を情報処理装置に実行させるためのプログラムであることを特徴とする。
【0021】
本発明の第12の発明は、第1の発明に記載されたプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【0022】
【発明の実施の形態】
〔第1実施形態〕
図1は、本発明の第1実施形態を示す記号囲み判定装置の構成を示すブロック図である。
【0023】
図において、101はCPUで、本装置全体の制御を行うものである。102はRAMで、CPU101のワーク領域として使用されるものであり、イメージスキャナ108等により読み込まれた帳票画像等の記憶にも使用される。103はROMで、本装置を制御するプログラムが格納されている。104は磁気ディスク(ハードディスク、フロッピー(登録商標)ディスク)、光磁気ディスク(MO)、光ディスク(CD−ROM、DVD−ROM)等の外部記憶装置である。なお、CPU101により実行される後述するフローチャートに示される丸囲み式選択肢の選択状態の判定プログラムは、ROM102又は外部記憶装置104に記憶される。105はディスプレイで、イメージスキャナ108等から読み取った帳票の画像データ等を表示するものである。106はキーボード、107はマウス等のポインティングデバイスである。108はイメージスキャナ等の画像形成装置であり、本装置に内蔵されていてもよいし、本装置と外部接続されていてもよい。なお、外部接続される場合は、USB、IEEE1394等のインタフェースを介して本装置に接続される。
【0024】
以下、図2,図3を参照して、丸囲み選択肢の選択状態判定方法について説明する。
【0025】
図2,図3は、本発明の記号囲み判定装置により判定する選択肢に対応する記号の一例を示す模式図であって、図2は丸で囲む選択がなされていない状態に対応し、図3は丸で囲む選択がなされている状態に対応する。
【0026】
図2に示すように、数字の文字の部分は黒画素になっており、それ以外の部分は白画素になっている。この数字画像を水平方向に並んだ画素を201〜205のように1つの行(選択肢記号を含む判定対象領域を所定方向に分割した帯状領域)として見た時、それぞれの行内に206〜210のように幾つかの連続した黒画素(線分)が見られる。
【0027】
通常、あらかじめ印刷された文字や手書きの丸印は、少なくとも2、3ドット以上の黒画素の線で構成されているため、連続していない黒画素(例えば1ドットのみの黒画素)はノイズとして無視して差し支えない。
【0028】
上記と同様に図3のような丸で囲まれている数字画像の各行を見た時、数字がある部分は311〜315のように線分が必ず3本以上存在する。
【0029】
丸で囲まれていない数字の場合、各行にある線分の数は通常は1または2本であり、一部の数字において3本ある行がわずかに存在するだけである。
【0030】
なお、図4に示すような、活字数字の「6」において、401の箇所を拡大した402の部分で403に示す行だけが3本となっている。
【0031】
よって、各行に含まれる線分の数が3本以上の行の数の総数および連続数が一定以上あれば、丸で囲まれていると判断することができる。
【0032】
なお、各行に含まれる線分の数が3本以上の行の数の総数および連続数が一定以上の場合に、丸で囲まれていると判断するのは、認識精度を向上させるためであり、上記総数と上記連続数のいずれも一定以上なければ、丸で囲まれていると判断することができないというわけではない。即ち、上記総数又は上記連続数のいずれか一方が一定以上あれば、丸で囲まれていると判断することができる。
【0033】
図5は、本発明の記号囲み判定装置における第1の制御処理の一例を示すフローチャートであり、記号を丸で囲む方式の選択肢の選択状態を判定する処理に対応する。なお、このフローチャートの処理は、図1に示したCPU101によりROM102、外部記憶装置104又はその他の記録媒体に格納されたプログラムに基づいて実行されるものとする。また、S501〜S512は各ステップを示す。
【0034】
まず、ステップS501において、イメージスキャナ108等の機器によって読み込まれた画像(帳票の画像データ)を外部記憶装置104又はRAM102等に記憶する。なお、その他の記録媒体(本装置とネットワークを介して接続されるファイルサーバが有する外部記憶装置等を含む。)に記憶してもよい。
【0035】
次に、ステップS502において、S501で読み込んで外部記憶装置104又はRAM102等に記憶した当該帳票の画像データから判定対象領域の座標(選択肢の位置座標)を取得してRAM102等のワーク領域に記憶する。その後、上記判定対象領域の座標から判定対象領域を特定して(切り出し処理)S503に進む。
【0036】
なお、上記判定対象領域の座標は、S501で読み込まれた帳票画像に対して例えば図6に示すようなウィンドウシステムのユーザインタフェースにおいて、マウス等のポインティングデバイス107の操作によって指定(例えば、図中600で示すように指定)して外部記憶装置104等に記憶する方法等で行うことが可能である。
【0037】
次に、ステップS503〜ステップS508において、ステップS502で取得した判定対象領域の座標をもとに特定した判定対象領域(選択肢の領域)の全ての行(最上行〜最下行)で、行内の規定値(例えば、2ドット)以上の長さの線分の本数をカウントして(S504)、線分が3本以上あるか否かを判定し(S505)、線分が3本以上あると判定した場合には、3本以上線分がある行の総数と連続数をカウントアップする(S507)。一方、線分が3本以上ないと判定した場合には、3本以上線分がある行の連続数をリセットする(S506)処理を行う。
【0038】
なお、ステップS506で、3本以上線分がある行の連続数をリセットする場合、3本以上線分がある行の連続数の最大値をRAM102内のワーク領域に記憶しておき、該記憶した最大値を3本以上線分がある行の連続数として後述するステップS510の判定で用いるものとする。
【0039】
ここで、丸で囲まれていると判断するために用いる3本以上線分がある行の総数と連続数の閾値は、判定対象の画像の解像度によって変更する。なお、最初から固定値を用意しRAM102、ROM103、外部記憶装置104、又はその他の記録媒体に記憶しておいてもよい。
【0040】
ステップS509において、その閾値を当該画像の解像度から計算する。例えば、連続数の閾値では、1ポイント(1/72インチ=300DPIで約4行)、総数の閾値では、4ポイント(1/18インチ=300DPIで約17行)というように解像度に応じて閾値を変化させる。なお、固定値が用意してある場合は、外部記憶装置104等からその固定値を読み出すものとする。
【0041】
次に、ステップS510において、上述の3本以上の線分がある行数の総数と連続数が共に閾値以上であるか否かを判定し、共に閾値以上であると判定した場合には、ステップS512において、当該選択肢は丸で囲まれている(即ち、選択されている)と判定し、処理を終了する。
【0042】
一方、ステップS510で、上述の3本以上の線分がある行数の総数と連続数の少なくとも一方が閾値未満であると判定した場合には、ステップS511において、当該選択肢は丸で囲まれていない(即ち、選択されていない)と判定し、処理を終了する。
【0043】
なお、本実施形態では、上述の3本以上の線分がある行数の総数と連続数が共に閾値以上であるか否かを判定し、共に閾値以上であると判定した場合には、ステップS512において、当該選択肢は丸で囲まれている(即ち、選択されている)と判定するとしているが、これは認識精度の向上を図るためであり、共に閾値以上でなければ選択肢が丸で囲まれているか否かの判断ができないわけではない。即ち、上述の3本以上の線分がある行数の総数又は連続数のいずれか一方が閾値以上であると判定した場合に、ステップS512において、当該選択肢は丸で囲まれている(即ち、選択されている)と判定し、処理を終了するようにしてもよい。
【0044】
また、後述する第2〜5の実施形態においても同様に3本以上の線分がある行数の総数又は連続数のいずれか一方が閾値以上であると判定した場合に、当該選択肢は丸で囲まれている(即ち、選択されている)と判定し、丸囲み判定処理を終了するような構成をとることができるのはいうまでもない。
【0045】
なお、上記フローチャートでは、行内の規定値以上の長さの線分の本数が3本以上ある行の総数と連続数が閾値以上であるか否かで、当該選択肢が丸で囲まれている(即ち、選択されている)か否かを判定する場合について説明したが、例えば、選択肢の数字がカッコ付き、例えば、「(6)」等の場合には、行内の規定値以上の長さの線分の本数が5本以上ある行の総数と連続数を用いて判定するものとする。
【0046】
〔第2実施形態〕
本実施形態では、上記第1実施形態で示した記号を丸で囲む方式の選択肢の選択状態の判定処理に、さらに画像のノイズを除去する工程を設けるように構成したものである。以下、その実施形態について説明する。
【0047】
図7は、本発明の記号囲み判定装置における第2の制御処理の一例を示すフローチャートであり、本発明の第2実施形態における記号を丸で囲む方式の選択肢の選択状態の判定処理に対応する。なお、このフローチャートの処理は、図1に示したCPU101によりROM102、外部記憶装置104又はその他の記録媒体に格納されたプログラムに基づいて実行されるものとする。また、S601〜S614は各ステップを示す。
【0048】
なお、図7に示すステップS601,S602は、図5に示したS501,S502と同一のステップであるため説明は省略する。
【0049】
ステップS602で選択肢の位置座標を取得した後、ステップS603において、上記帳票画像データの位置座標から判定対象領域部分を抽出し(イメージデータを切り出す処理)、RAM102等のワーク領域に記憶する。
【0050】
次に、ステップS604において、上記抽出した判定対象領域の画像からノイズ除去を行う。このノイズ除去の処理は、孤立している単独の黒画素(例えば、周囲が白画素の1ドットのみの黒画素)をノイズとして判定し除去するといった公知のノイズ除去処理方法を用いることができる。
【0051】
そして、ステップS604のノイズ除去処理の後、ステップS605〜S614に進み、全行内の規定値以上の長さの線分が3本以上の行数の総数と連続数をカウントし、選択の有無を判定する処理を行う。
【0052】
以下、ステップS605〜S614は図5に示したS503〜S512と同一のステップであるため説明は省略する。
【0053】
本実施形態によれば、上記第1実施形態で示した記号を丸で囲む方式の選択肢の選択状態の判定処理に、画像のノイズを除去する工程(ステップS603,S604)を設けたことにより、イメージスキャナ108等による帳票画像読み取り時に発生する画像のノイズ等の影響を受けず、丸で囲む方式の選択肢の選択状態の判定精度を格段に向上させることができる。
【0054】
〔第3実施形態〕
上記第1実施形態では、記号を丸で囲むことによって項目を選択する形式の選択肢において、1つの選択肢記号を判定領域として選択状態を判定する構成について説明したが、選択肢の記号が縦に複数並んでいる場合に、それら複数の選択肢記号を含む領域を判定領域として選択状態を判定するように構成してもよい。以下、その実施形態について説明する。
【0055】
図8は、本発明の第3実施形態における選択肢の判定領域の一例を示す模式図である。
【0056】
本実施形態では、図に示すように、数字を丸で囲むことによって項目を選択する形式の選択肢において、選択肢の数字が縦に複数並んでいる場合に当該複数の選択肢記号を、図8中801の点線枠で示すようにまとめて判定対象領域とした。
【0057】
そして、後述する図9に示すように、複数の選択肢記号を含む判定対象領域から各選択肢記号を含む領域を抽出し、該各抽出した領域の選択状態をそれぞれ判定することで、複数の選択肢記号を含む判定対象領域における選択状態を判定するものとする。
【0058】
以下、図9を用いて、上述した複数の選択肢記号を含む判定対象領域から各選択肢記号を含む領域を抽出して選択状態を判定する方法について説明する。
【0059】
図9は、本発明の第3実施形態における複数の選択肢記号を含む判定対象領域から各選択肢記号を含む領域を抽出して選択状態を判定する処理について説明する模式図である。
【0060】
なお、図9の処理は、後述する図10のフローチャートの説明にもあるように、CPU101によりROM102、外部記憶装置104又はその他の記録媒体に格納されたプログラムに基づいて実行されるものである。
【0061】
図9に示すように、判定対象領域は、黒画素が全く無い連続した行(図中901,902,903,904,905)と数字等の選択肢記号またはそれを囲む丸印の黒画素が存在する連続した行(図中906,907,908,909)とに分かれる。
【0062】
よって、黒画素がまったくない連続した行901が終了した後の行から次の黒画素がまったくない行902が始まるまでの領域906を、最初の選択肢として切り出し(抽出し)、第1実施形態又は第2実施形態で示した丸囲み選択肢の選択状態の判定方法で判定するものとする。
【0063】
そして、この抽出した領域(黒画素が存在する領域906)における判定結果が「選択されていない」の場合には、次の黒画素が存在する領域907を切り出して(抽出して)判定する。
【0064】
これを領域909まで繰り返し、判定結果が「選択されている」となった時の黒画素が存在する領域のインデックス(上から数えた選択肢の番号)が選択されているものと判定するように構成する。
【0065】
図10は、本発明の記号囲み判定装置における第3の制御処理の一例を示すフローチャートであり、本発明の第3実施形態における記号を丸で囲む方式の選択肢の選択状態の判定処理に対応する。なお、このフローチャートの処理は、図1に示したCPU101によりROM102、外部記憶装置104又はその他の記録媒体に格納されたプログラムに基づいて実行されるものとする。また、S701〜S708は各ステップを示す。
【0066】
なお、図10に示すステップS701,S702は、図5に示したS501,S502と同一のステップであるため説明は省略する。
【0067】
ステップS702で選択肢の位置座標(例えば、図8に示した判定対象領域801)を取得した後、ステップS703〜ステップS708において、選択肢の個数分、以下に示すステップS704〜S707の処理を行う。
【0068】
まず、ステップS704において、黒画素数0の行で挟まれている黒画素数0以上の連続した行の領域(例えば、図9の906)の抽出を行って、RAM102等のワーク領域に記憶する。、ステップS705において、上記抽出した黒画素数0以上の連続した行の領域に対して、図5のステップS503〜S512又は図7のステップS604〜614に示した判定処理を行い、ステップS706において、ステップS705の判定処理の判定結果が「選択されている」であるか否かを判定する。
【0069】
ステップS706において、ステップS705の判定結果が「選択されていない」であると判定した場合には、ステップS704に戻り、次の黒画素数0の行で挟まれている黒画素数0以上の連続した行の領域(例えば、図9の907)を抽出して、図5のステップS503〜S512又は図7のステップS604〜614に示した判定処理を行う。
【0070】
一方、ステップS706で、ステップS705の判定結果が「選択されている」であると判定した場合には、S703〜S708に示すループを抜け、ステップS707において、当該判定された領域に対応する選択肢のインデックスが選択されたものと判定し、当該インデックスをRAM102等のワーク領域又は外部記憶装置104等に保存し、処理を終了する。なお、ステップS707の選択肢のインデックスの保存処理では、図中には示していないが、ステップS703〜ステップS708におけるループ回数をカウントするカウンタを設け、このカウンタにより何番目の選択肢が選択されたかを取得しRAM102等のワーク領域又は外部記憶装置104等に保存するようにする。
【0071】
本実施形態によれば、記号を丸で囲むことによって項目を選択する形式の選択肢において、選択肢の記号が縦に複数並んでいる場合に、それら複数の選択肢記号を含む領域を判定領域として指定するだけで、当該複数の選択肢のいずれが選択されているかを判定することができ、ユーザによる判定対象領域指定作業を大幅に軽減させることができる。
【0072】
なお、本実施形態では、最初に選択状態と判定された選択肢が選択状態にあるものと判定する構成について説明したが、ある選択肢が選択状態であると判定された後も最後の選択肢までステップS703〜S708の判定処理を繰り返し、最終的に複数の選択肢が選択状態であると判定された場合には(単一選択のみを許している場合には)、エラーとして警告表示等を行ったり、当該選択状態と判定された選択肢のみを再度判定するように構成してもよい。
【0073】
これにより、複数選択等の選択ミスの発見を行うことや、選択状態の判定精度を向上させることができる。
【0074】
また、複数選択が許可されている場合には、複数選択結果を取得することも可能である。
【0075】
さらに、上記図8,図9では、選択肢が縦に複数並んでいる場合について、黒画素が全くない連続した行が終了した後の行から次の黒画素が全くない行が始まるまでの領域を、個々の選択肢判定領域として抽出し、判定する構成について説明したが、選択肢が縦以外の方向に複数並んでいる場合について、該複数の選択肢を含む領域を該選択肢が並んだ方向に直交する方向の帯状領域に分け、該黒画素が全くない連続した帯状領域が終了した後の帯状領域から次の黒画素が全くない帯状領域が始まるまでの領域を、選択肢判定領域として抽出し、それぞれ判定する(ステップS705〜S707)ように構成してもよい。
【0076】
例えば、選択肢が横方向に複数並んでいる場合について、該複数の選択肢を含む領域を縦方向の帯状領域(即ち、「列」)に分け、黒画素が全くない連続した列が終了した後の列から次の黒画素が全くない列が始まるまでの領域を、選択肢判定領域として抽出し、それぞれ判定するように構成してもよい。
【0077】
さらに、選択肢が縦方向及び横方向に複数並んでいる場合(例えば、縦横2×3の行列状に並んでいる場合等)について、ユーザに縦横に複数の選択肢記号を含む領域を判定領域として指定させておき、当該領域を選択肢の列数に分割し(例えば、2×3に並んだ選択肢の場合、縦に3つの領域に分割し)、該分割された各縦領域に対してステップS703〜S708の処理を行うように構成してもよい。なお、上述した縦領域の分割数等は、ユーザにより入力させてもよいし、OCR等により判定させるように構成してもよい。
【0078】
これにより、縦に並んだ選択肢、横に並んだ選択肢、平面的に並んだ選択肢のいずれに対しても、ユーザは複数の選択肢記号を含む領域を指定するだけで、当該領域内の選択状態の判定を行うことができるので、ユーザによる判定対象領域指定作業を大幅に軽減させることができる。
【0079】
〔第4実施形態〕
上記第1実施形態〜第3実施形態は、1種類の帳票の一箇所の判定対象領域に対して数字が丸で囲まれているか否かを判定する構成について示したが、図5のステップS502〜S512又は図7のステップS602〜S614又は図10のステップS702〜708を複数の判定領域に対して順次実行するように構成することで、1種類の帳票内で複数の判定対象領域に対して選択状態の判定処理を行うことができる。
【0080】
また、複数種類の帳票についても、既存の帳票種類判別手段(予め保存されている帳票画像と比較していずれの帳票が読み込まれたか判定する等の手段)と組み合わせて、各々に判定対象領域をあらかじめ設定しておけば、複数の帳票に対して、画像読込と判定実行の指示を行うだけで、記号が丸で囲まれているか否かを容易に判定することが可能である。
【0081】
〔第5実施形態〕
上記第1実施形態〜第4実施形態では、1枚の帳票に対して1箇所または複数箇所の判定対象領域に対して数字等の記号が丸で囲まれているか否かを判定する構成について示したが、連続読み込みが可能なイメージスキャナ108等を用いて、複数枚の帳票を上記イメージスキャナ108等にセットして、図5又は図7又は図10に示した処理を連続して実行するように構成することで、複数枚数の帳票(1種類又は複数種類の帳票)を順次読み込みながら順次判定対象領域(予め設定済の1箇所又は複数箇所の判定対象領域)内の記号が丸で囲まれているか否かを順次判定することも可能である。
【0082】
以上説明したように、上記各実施形態によれば、帳票の所定領域の画像を標準画像として記憶するための登録作業を行うことなく、また、数字等の選択肢記号を囲む丸の形を意識することなく、帳票上の記号を丸で囲む方式の選択肢の選択状態を判定することができる。
【0083】
また、記号を丸で囲む方式の選択肢の中には、図11に示すように数字等の選択肢記号の周りに点線状のガイドが印刷されているものがある。
【0084】
本発明では、一行に含まれる線分の数が規定の数を超えている行の総数と連続行数の双方を判定対象としているため、点線状のガイド部分が黒画素となっている場合でも、ガイド部分の黒画素を含み一行に含まれる線分の数が規定の数を超えるような行は連続しないので、一行に含まれる線分の数が規定の数を超えている行の連続行数が連続数の閾値を下回ることになり、(仮に一行に含まれる線分の数が規定の数を超えている行の総数が総数の閾値を超えていたとしても)選択肢記号の周りの点線状のガイドを選択状態と誤判定することを防止することができる。
【0085】
なお、上記第1〜5の実施形態では、図5のステップS503〜S508又は図7のステップS605〜S610に示すように、選択肢の領域の最上行から最下行まで、図5のステップS504〜S507又は図7のステップS604〜S609の処理を繰り返し、図5のステップS509又は図7のステップ612で、上述の3本以上の線分がある行数の総数と連続数が共に閾値以上であるか否かを判定し、共に閾値以上であると判定した場合には、図5のステップS512又は図7のステップ614において、当該選択肢は丸で囲まれている(即ち、選択されている)と判定し、処理を終了するという構成となっているが、最上行から最下行まで繰り返さず、図5のステップS504〜S507又は図7のステップS604〜S609の処理を繰り返している途中で、上述の3本以上の線分がある行数が連続数の閾値に達した場合は、当該選択肢は丸で囲まれている(即ち、選択されている)と判定し、処理を終了するという構成としてもよい。
【0086】
ただし、上記構成は、上述の3本以上の線分がある行数が連続数の閾値以上であることによって、当該選択肢が丸で囲まれている(即ち、選択されている)か否かを判定するので、連続数の閾値を用いる囲み判定装置でなければならない。即ち、総数の閾値のみで当該選択肢が丸で囲まれているか(即ち、選択されている)否かを判定する囲み判定装置では実現することができない。
【0087】
なお、上記第1〜5の実施形態のように総数の閾値と連続数の閾値を用いる囲み判定装置の場合、図5のステップS504〜S507又は図7のステップS604〜S609の処理を繰り返している途中で、上述の3本以上の線分がある行数が連続数の閾値に達した否かを判定する場合に用いる連続数の閾値を「連続数の閾値A」とし、図5のステップS510又は図7のステップ612で用いる連続数の閾値を「連続数の閾値B」とする構成をとってもよい。
【0088】
例えば、「連続数の閾値A」を4ポイント(1/18インチ=300DPIで約17行)、「連続数の閾値B」を1ポイント(1/72インチ=300DPIで約4行)というようにする。
【0089】
上記構成をとることにより認識精度の向上を図ることができる。
【0090】
また、上記各実施形態では、丸囲み選択肢(記号を丸で囲むことにより該記号に対応する選択肢が選択状態となる形式の選択肢)を示す記号の一例としてアラビア数字(「0」,「1」,「2」,「3」,「4」,「5」,「6」,「7」,「8」,「9」等)
を用いて説明した(特に、「6」を用いて説明した)が、選択肢を示す記号はアラビア数字に限られるものではなく、例えば、「a」,「b」,「c」,「d」,「e」,…、「A」,「B」,「C」,「D」,「E」,…等のアルファベットであってもよいし、「イ」,「ロ」,「ハ」,…等のかたかな文字であってもよく、これらの例に限定されるものではない。
【0091】
例えば、上記各実施形態では、図2に示した水平方向の行(201〜205)内で規定値以上の長さの線分の本数が3本以上の行数の総数と連続数が閾値以上か否かで選択の有無を判定する構成としたが、本発明の選択判定の条件を、所定方向(水平方向であっても垂直方向であっても、その他の方向であってもよい)の行内で規定値以上の長さの線分の本数が「n」本以上の行数の連続数(及び/又は総数)が閾値以上か否かで選択の有無を判定する構成とすれば、前記所定方向の行内で規定値以上の長さの線分の本数が「n−1」又は「n−2」本となる行が連続している記号(言い換えれば、前記連続数の閾値だけ連続する行(及び/又は前記総数の閾値だけの行)と規定値以上の幅で交わる「n−1」又は「n−2」本の曲線を構成要素とする記号)であればどのような記号を選択肢記号としても、その選択状態を判定することができる。
【0092】
なお、上記記号であって前記所定方向の行内で規定値以上の長さの線分の本数が「n」本となる行を含む記号(図4に示す「6」のような記号)であったとしても、連続数が閾値以上か否かで選択の有無を判定する構成としているため、選択状態の判定をすることができる。
【0093】
また、上記各実施形態で判定した、記号を丸で囲むことによって項目を選択する「丸囲み式選択肢」において、記号を囲む丸は、円形を示すものではなく、楕円,多角形等の閉じた図形(閉図形(凸閉図形や凹閉図形))であっても、一部線分が切れた図形(開図形)をも含むものである。
【0094】
但し、上記開図形には、上述した所定方向を水平方向とした場合は、その上部又は/及び下部が途切れていている図形、即ち「U」,「∩」「II」等の図形(例えば、図12に示す1201,1202,1203等)が含まれ、上述した所定方向を垂直方向とした場合は、その左部又は/及び右部が途切れている図形、即ち「C」,「⊃」「二」等の図形(例えば、図12に示す1204,1205,1206等)が含まれるものとする。
【0095】
以上説明したように、各実施形態によれば、帳票の所定領域の画像を標準画像として記憶するための登録作業を行うことなく、また、記号を囲む丸の形を意識することなく、帳票上の記号を丸で囲む方式の選択肢の選択状態を判定することができる。
【0096】
なお、上記各実施形態のいずれか又は全てを組み合わせた構成も全て本発明に含まれるものである。
【0097】
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0098】
以下、図13に示すメモリマップを参照して本発明に係る記号囲み判定装置で読み出し可能なデータ処理プログラムの構成について説明する。
【0099】
図13は、本発明に係る記号囲み判定装置で読み出し可能な各種データ処理プログラムを格納する外部記憶装置104等の記録媒体(記憶媒体)のメモリマップを説明する図である。
【0100】
なお、特に図示しないが、記録媒体に記憶されるプログラム群を管理する情報、例えばバージョン情報,作成者等も記憶され、かつ、プログラム読み出し側のOS等に依存する情報、例えばプログラムを識別表示するアイコン等も記憶される場合もある。
【0101】
さらに、各種プログラムに従属するデータも上記ディレクトリに管理されている。また、各種プログラムをコンピュータにインストールするためのプログラムや、インストールするプログラムが圧縮されている場合に、解凍するプログラム等も記憶される場合もある。
【0102】
本実施形態における図5,図7,図10に示す機能が外部からインストールされるプログラムによって、ホストコンピュータにより遂行されていてもよい。そして、その場合、CD−ROMやフラッシュメモリやFD等の記録媒体により、あるいはネットワークを介して外部の記録媒体から、プログラムを含む情報群を出力装置に供給される場合でも本発明は適用されるものである。
【0103】
以上のように、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
【0104】
この場合、記録媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記録媒体は本発明を構成することになる。
【0105】
従って、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
【0106】
プログラムを供給するための記録媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。
【0107】
この場合、記録媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記録媒体は本発明を構成することになる。
【0108】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは、圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバやftpサーバ等も本発明の請求項に含まれるものである。
【0109】
また、本発明のプログラムを暗号化してCD−ROM等の記録媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0110】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0111】
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0112】
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのソフトウエアによって表されるプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0113】
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から排除するものではない。
【0114】
本発明の様々な例と実施形態を示して説明したが、本発明の趣旨と範囲は、本明細書内の特定の説明に限定されるのではない。
【0115】
【発明の効果】
以上説明したように、本発明によれば、画像データから所定の記号を含む判定対象領域を切り出し、該切り出された領域を所定方向の帯状領域に分割した各帯状領域内にある線分を探索してカウントし、該カウントされた帯状領域内にある線分数が第1の規定値以上である帯状領域が連続している場合にその連続している帯状領域数をカウントし、該カウントされた帯状領域数の最大値と前記画像データの解像度に基づく閾値とを比較して、前記記号が所定図形で囲まれているか否かを判定するので、帳票の所定領域の画像を標準画像として記憶するための登録作業を行うことなく、また、記号を囲む丸の形を意識することなく、帳票上の記号を丸で囲む方式の選択肢の選択状態を判定することができる。標準画像の登録作業が必要でないということは、即ち、未記入の帳票を有しない利用者であっても記入済み帳票の選択状態の判定をすることができることを意味する。
【0116】
また、記号の周りに点線上のガイドが印刷されているような帳票であっても、一帯状領域に含まれる線分の数が規定の数を超えている行の総数と連続行数の双方を判定対象としているので、点線上のガイド部分が黒画素となっていても判定を誤ることはなく、精度よく判定することができる。なお、選択状態を判定する前にノイズ除去を行うことにより更に判定精度を向上させることができる。
【0117】
従って、帳票等の所定領域を標準画像として記憶・管理することなく、帳票等内の所定記号が丸等の所定図形で囲まれているか否かを容易に判定することができる管理の面においても判定精度においても格段に向上することができる等の効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1実施形態を示す記号囲み判定装置の構成を示すブロック図である。
【図2】本発明の記号囲み判定装置により判定する選択肢に対応する記号の一例を示す模式図である。
【図3】本発明の記号囲み判定装置により判定する選択肢に対応する記号の一例を示す模式図である。
【図4】本発明の記号囲み判定装置により判定する選択肢に対応する記号において1行に3本の線分が含まれる場合を示す模式図である。
【図5】本発明の記号囲み判定装置における第1の制御処理の一例を示すフローチャートである。
【図6】本発明の記号囲み判定装置における判定対象領域指定方法の一例を示す模式図である。
【図7】本発明の記号囲み判定装置における第2の制御処理の一例を示すフローチャートである。
【図8】本発明の第3実施形態における選択肢の判定領域の一例を示す模式図である。
【図9】本発明の第3実施形態における複数の選択肢記号を含む判定対象領域から各選択肢記号を含む領域を抽出して選択状態を判定する処理について説明する模式図である。
【図10】本発明の記号囲み判定装置における第3の制御処理の一例を示すフローチャートである。
【図11】本発明の記号囲み判定装置により判定する選択肢記号において周りに点線状のガイドが印刷されている状態を示す模式図である。
【図12】本発明の記号囲み判定装置における選択肢を囲む図形の一例を示す模式図である。
【図13】本発明に係る記号囲み判定装置で読み出し可能な各種データ処理プログラムを格納する記録媒体のメモリマップを説明する図である。
【符号の説明】
101 CPU
102 RAM
103 ROM
104 外部記憶装置
105 ディスプレイ
106 キーボード
107 ポインティングデバイス
108 イメージスキャナ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a symbol encircling determination apparatus, a symbol encircling determination method, a program, and a recording medium for recognizing (determining) a selection state of an option of a method of encircling symbols such as numbers in a document image read from an image scanner or the like It is about.
[0002]
[Prior art]
In various form sheets, there is not only a portion for entering characters, but also a “circled choice” portion for selecting an item by enclosing the characters in a circle.
[0003]
Conventionally, the determination of the selection state of such a circled-type option is performed by using an image without a circle in advance as a standard image, as in the invention in Japanese Patent Laid-Open No. 10-187865 (Patent Document 1). It is stored so that it is determined whether or not it is circled by comparison with the input image.
[0004]
In the invention disclosed in Japanese Patent Laid-Open No. 2002-183663 (Patent Document 2), an image recorded in an option part of a read form is extracted using a recognition dictionary in which “circled numbers” are registered, A technique for calculating the degree of similarity between an image pattern of “circled numbers” and determining whether or not the option is circled by determining whether the number is a “circled number” based on the calculated similarity It is.
[0005]
[Patent Document 1]
JP-A-10-187865
[0006]
[Patent Document 2]
JP 2002-183663 A
[0007]
[Problems to be solved by the invention]
In the technique of Patent Document 1 described above, since it is necessary to store a “circled option” part (an option part of an unfilled form) as a standard image for each form, the operation becomes complicated and the standard Image management is required, and there are drawbacks such as being very complicated. When there is no unfilled (unselected) form (when there is only a filled form), the above-described standard image cannot be stored, and as a result, the selection state cannot be determined. There were disadvantages such as.
[0008]
In addition, in the technique of Patent Document 2 described above, a standard image for each form is not necessary, but since it is a technique using a recognition dictionary, it is easily affected by the shape of a circle surrounding a symbol or noise when reading a form. There was a problem. Specifically, since OCR (Optical Character Reader) is used using a recognition dictionary for circled numbers and uncircled numbers, it is easily affected by the shape of circles surrounding the symbols and noise, and the degree of similarity with the above recognition dictionary Decreases, and as a result, the recognition rate is lowered.
[0009]
The present invention has been made to solve the above-described problems, and an object of the present invention is to cut out a determination target area including a predetermined symbol from the image data, and use the cut-out area as a band-shaped area in a predetermined direction. A line segment in each band-like area divided into two is searched and counted, and when the band-like areas in which the number of line segments in the counted band-like area is equal to or greater than the first specified value are continuous, A predetermined area such as a form by counting the number of belt-shaped areas that are counted and comparing the counted number of band-shaped areas with a first threshold value to determine whether or not the symbol is surrounded by a predetermined figure. It is possible to easily determine whether or not a predetermined symbol in a form or the like is surrounded by a predetermined figure such as a circle without storing and managing the image as a standard image. Improved symbol box format It is to provide an apparatus and a symbol enclosed determining method and program and recording medium.
[0010]
[Means for Solving the Problems]
According to a first aspect of the present invention, there is provided a symbol enclosing determination device for recognizing whether or not a predetermined symbol included in image data is surrounded by a predetermined figure, and a determination target region including the predetermined symbol from the image data Identifying means (CPU 101 shown in FIG. 1, step S502 in FIG. 5, steps S602, S603 in FIG. 7, step S702 in FIG. 10), and the determination target area specified by the specifying means as a band-like area in a predetermined direction The first counting means (CPU 101 shown in FIG. 1, step S504 in FIG. 5, step S606 in FIG. 7) and the first counting means count the number of line segments by searching in each band-like area divided into two. A second counting hand that counts the number of continuous band-like areas when the number of line-shaped areas that are equal to or greater than the first specified value is continuous. (The CPU 101 shown in FIG. 1, step S507 in FIG. 5, and step S609 in FIG. 7) and the number of strip regions counted by the second counting means and the first threshold value are compared, whereby the symbol is predetermined. It is characterized by comprising determination means (CPU 101 shown in FIG. 1, steps S510 to S512 in FIG. 5, steps S612 to S614 in FIG. 7) for determining whether or not it is surrounded by a figure.
[0011]
According to a second aspect of the present invention, there is provided first calculation means (the CPU 101 shown in FIG. 1, step S509 in FIG. 5, step S611 in FIG. 7) for calculating the first threshold value based on the resolution of the image data. Furthermore, it is characterized by having.
[0012]
According to a third aspect of the present invention, there is provided a third counting means (CPU 101 shown in FIG. 1, FIG. 1) for counting the total number of rows in which the number of line segments counted by the first counting means is equal to or greater than a first specified value. 5 in step S507 and step S609 in FIG. 7), and the determination means compares the number of strip regions counted by the second count means with the first threshold value, and the third count. Based on the total number of strip-like areas counted by the means and the comparison result between the second threshold value, it is determined whether or not the symbol is surrounded by a predetermined figure (steps S510 to S512, FIG. 7 in FIG. 5). Steps S612 to S614).
[0013]
According to a fourth aspect of the present invention, there is provided second calculation means (the CPU 101 shown in FIG. 1, step S509 in FIG. 5, step S611 in FIG. 7) for calculating the second threshold value based on the resolution of the image data. Furthermore, it is characterized by having.
[0014]
The fifth invention of the present invention further comprises storage means (RAM 102 shown in FIG. 1) for storing the maximum value of the number of band-like areas counted by the second counting means, and in the determination means, the storage means The maximum value of the number of strip-shaped areas stored is compared with the first threshold (steps S510 to S512 in FIG. 5 and steps S612 to S614 in FIG. 7).
[0015]
The sixth invention of the present invention further comprises noise removing means (CPU 101 shown in FIG. 1, step S604 in FIG. 7) for removing noise from the determination target area specified by the specifying means. .
[0016]
In a seventh aspect of the present invention, the predetermined symbol intersects with a band-like region that is continuous for the number of the first thresholds with a width equal to or greater than a predetermined value, or the first symbol Stipulated value -2 "symbol having a curve as a constituent element (for example, the symbols" 0 "to" 9 "of the Arabic numerals include the Arabic numerals when the first specified value is" 3 ") When the determination target region is divided into horizontal rows, “3-1” (that is, two) or “3-2” (that is, one) where two or more pixels intersect with each other in a row. ), Which corresponds to a symbol that can be determined by the symbol enclosing determination device of the present invention.
[0017]
The eighth invention of the present invention is characterized in that the predetermined symbol is an Arabic numeral.
[0018]
According to a ninth aspect of the present invention, the first specified value is “3” or “5”.
[0019]
The tenth aspect of the present invention recognizes whether or not a predetermined symbol included in image data is surrounded by a predetermined figure. In information processing equipment for In the symbol box judgment method, The first counting means includes the predetermined symbol in the image data A first counting step (step S504 in FIG. 5 and step S606 in FIG. 7) for searching the inside of each band-like area obtained by dividing the determination target area into band-like areas in a predetermined direction and counting the number of line segments; The second counting means is A second counting step (in FIG. 5) that counts the number of the continuous band-like regions when the number of line-segments counted in the first counting step is continuous. Step S507, Step S609 in FIG. The judging means A determination step (steps S510 to S512 in FIG. 5) for determining whether or not the symbol is surrounded by a predetermined figure by comparing the number of strip-like regions counted in the second counting step with a first threshold value. , Steps S612 to S614 in FIG. 7.
[0020]
An eleventh aspect of the present invention is the symbol encircling determination method described in the tenth aspect. Information processing equipment Execution Make It is the program for this.
[0021]
The twelfth aspect of the present invention is the first aspect 1 Described in the invention A computer-readable recording medium on which a program is recorded It is characterized by that.
[0022]
DETAILED DESCRIPTION OF THE INVENTION
[First Embodiment]
FIG. 1 is a block diagram showing a configuration of a symbol enclosing determination apparatus showing a first embodiment of the present invention.
[0023]
In the figure, reference numeral 101 denotes a CPU which controls the entire apparatus. Reference numeral 102 denotes a RAM which is used as a work area for the CPU 101 and is also used for storing a form image read by the image scanner 108 or the like. A ROM 103 stores a program for controlling the apparatus. Reference numeral 104 denotes an external storage device such as a magnetic disk (hard disk, floppy (registered trademark) disk), magneto-optical disk (MO), or optical disk (CD-ROM, DVD-ROM). It should be noted that the determination program for the selection status of the circled options shown in the flowchart described later executed by the CPU 101 is stored in the ROM 102 or the external storage device 104. Reference numeral 105 denotes a display for displaying image data of a form read from the image scanner 108 or the like. Reference numeral 106 denotes a keyboard, and 107 denotes a pointing device such as a mouse. Reference numeral 108 denotes an image forming apparatus such as an image scanner, which may be built in the apparatus or externally connected to the apparatus. When externally connected, it is connected to the apparatus via an interface such as USB or IEEE1394.
[0024]
Hereinafter, with reference to FIG. 2 and FIG. 3, the selection state determination method of the circled option will be described.
[0025]
2 and 3 are schematic diagrams showing examples of symbols corresponding to options determined by the symbol surrounding determination device of the present invention. FIG. 2 corresponds to a state where selection is not made in a circle. Corresponds to a state where selection is made in a circle.
[0026]
As shown in FIG. 2, the numerical character portion is a black pixel, and the other portions are white pixels. When the pixels arranged in the horizontal direction are viewed as one row (band-like region obtained by dividing the determination target region including option symbols in a predetermined direction) as in 201 to 205, 206 to 210 are included in each row. As can be seen, several continuous black pixels (line segments) are seen.
[0027]
Usually, pre-printed characters and handwritten circles are composed of black pixel lines of at least a few dots, so non-continuous black pixels (for example, black pixels of only one dot) are considered noise. You can ignore it.
[0028]
Similarly to the above, when looking at each row of a numeral image surrounded by a circle as shown in FIG. 3, there are always three or more line segments, such as 311 to 315, where there are numbers.
[0029]
For numbers that are not circled, the number of line segments in each row is usually 1 or 2 and there are only a few 3 rows in some numbers.
[0030]
In the type number “6” as shown in FIG. 4, there are only three rows indicated by 403 in the portion 402 where the portion 401 is enlarged.
[0031]
Therefore, if the total number of lines including three or more lines and the number of consecutive lines included in each line is a certain number or more, it can be determined that the line is surrounded by a circle.
[0032]
Note that the reason for determining that the number of line segments included in each row is circled when the total number of lines and the number of consecutive lines is equal to or greater than a certain value is to improve recognition accuracy. Unless both the total number and the continuous number are equal to or greater than a certain value, it is not impossible to determine that they are surrounded by a circle. That is, if either one of the total number or the continuous number is equal to or greater than a certain value, it can be determined that it is surrounded by a circle.
[0033]
FIG. 5 is a flowchart showing an example of the first control process in the symbol enclosing determination apparatus of the present invention, and corresponds to the process of determining the selection state of the option of enclosing the symbols in circles. Note that the processing in this flowchart is executed by the CPU 101 shown in FIG. 1 based on a program stored in the ROM 102, the external storage device 104, or other recording medium. S501 to S512 indicate each step.
[0034]
First, in step S501, an image (form image data) read by a device such as the image scanner 108 is stored in the external storage device 104, the RAM 102, or the like. In addition, you may memorize | store in other recording media (The external storage device etc. which a file server connected with this apparatus via a network include).
[0035]
Next, in step S502, the coordinates of the determination target area (option position coordinates) are acquired from the image data of the form read in S501 and stored in the external storage device 104 or the RAM 102, and stored in the work area such as the RAM 102. . Thereafter, the determination target area is identified from the coordinates of the determination target area (cutout process), and the process proceeds to S503.
[0036]
Note that the coordinates of the determination target area are specified by operating the pointing device 107 such as a mouse (for example, 600 in the figure) in the window system user interface shown in FIG. 6 for the form image read in S501. It can be performed by a method of storing in the external storage device 104 or the like.
[0037]
Next, in step S503 to step S508, the rules in the row are determined in all rows (top row to bottom row) of the determination target region (option region) specified based on the coordinates of the determination target region acquired in step S502. The number of line segments having a length equal to or greater than a value (for example, 2 dots) is counted (S504), whether or not there are three or more line segments is determined (S505), and it is determined that there are three or more line segments. If so, the total number and the number of consecutive lines with three or more line segments are counted up (S507). On the other hand, if it is determined that there are not three or more line segments, the process resets the number of consecutive lines with three or more line segments (S506).
[0038]
When the number of consecutive lines having three or more line segments is reset in step S506, the maximum value of the number of consecutive lines having three or more line segments is stored in the work area in the RAM 102, and the memory is stored. The maximum value obtained is used in the determination in step S510, which will be described later, as the number of consecutive rows having three or more line segments.
[0039]
Here, the total number of lines having three or more line segments used for determining that they are surrounded by a circle and the threshold value for the continuous number are changed according to the resolution of the image to be determined. A fixed value may be prepared from the beginning and stored in the RAM 102, ROM 103, external storage device 104, or other recording medium.
[0040]
In step S509, the threshold value is calculated from the resolution of the image. For example, the threshold for the continuous number is 1 point (1/72 inch = approximately 4 lines at 300 DPI), and the threshold for the total number is 4 points (1/18 inch = approximately 17 lines at 300 DPI). To change. When a fixed value is prepared, the fixed value is read from the external storage device 104 or the like.
[0041]
Next, in step S510, it is determined whether or not the total number of rows and the number of consecutive lines having the above three or more line segments are both equal to or greater than the threshold value. In S512, it is determined that the option is circled (that is, selected), and the process ends.
[0042]
On the other hand, if it is determined in step S510 that at least one of the total number of rows and the number of consecutive lines having the three or more line segments is less than the threshold value, the option is circled in step S511. It is determined that there is no (that is, not selected), and the process ends.
[0043]
In the present embodiment, it is determined whether or not the total number of rows and the number of consecutive lines having the above three or more line segments are both equal to or greater than the threshold value. In S512, it is determined that the option is circled (that is, selected), but this is to improve recognition accuracy. If both are not equal to or greater than the threshold value, the option is circled. It does not mean that it cannot be judged whether or not That is, if it is determined that either the total number of rows or the number of consecutive lines having three or more line segments is equal to or greater than the threshold value, the option is circled in step S512 (ie, It may be determined that the process has been selected), and the process may be terminated.
[0044]
Similarly, in the second to fifth embodiments to be described later, when it is determined that either one of the total number of rows having three or more line segments or the continuous number is greater than or equal to the threshold value, the option is round. It goes without saying that it is possible to adopt a configuration in which it is determined that the frame is surrounded (that is, selected) and the circled circle determination process is terminated.
[0045]
In the above flow chart, the option is circled depending on whether the total number of lines having three or more line segments having a length equal to or longer than the specified value in the line and the continuous number is equal to or greater than a threshold value (see FIG. In other words, for example, when the number of options is in parentheses, for example, “(6)”, the length of the line is longer than the specified value in the line. Assume that determination is made using the total number of lines having five or more line segments and the number of continuous lines.
[0046]
[Second Embodiment]
In the present embodiment, a process for removing the image noise is further provided in the selection processing of the option selection state of the method of enclosing the symbols shown in the first embodiment in a circle. The embodiment will be described below.
[0047]
FIG. 7 is a flowchart showing an example of the second control process in the symbol enclosing determination apparatus of the present invention, and corresponds to the determination process of the selection state of the option of the method of enclosing the symbols in the second embodiment of the present invention. . Note that the processing in this flowchart is executed by the CPU 101 shown in FIG. 1 based on a program stored in the ROM 102, the external storage device 104, or other recording medium. S601 to S614 indicate each step.
[0048]
Note that steps S601 and S602 shown in FIG. 7 are the same steps as S501 and S502 shown in FIG.
[0049]
After acquiring the position coordinates of the options in step S602, in step S603, the determination target area portion is extracted from the position coordinates of the form image data (processing for cutting out image data) and stored in the work area such as the RAM 102.
[0050]
Next, in step S604, noise is removed from the extracted image of the determination target area. For this noise removal processing, a known noise removal processing method in which an isolated black pixel (for example, a black pixel having only one dot surrounding a white pixel) is determined and removed as noise can be used.
[0051]
Then, after the noise removal processing in step S604, the process proceeds to steps S605 to S614, where the total number of lines having three or more line segments having a length equal to or longer than the specified value in all lines and the number of consecutive lines are counted, and whether or not selection is made is determined. Processing to determine is performed.
[0052]
Hereinafter, steps S605 to S614 are the same as steps S503 to S512 shown in FIG.
[0053]
According to the present embodiment, the process of removing the image noise (steps S603 and S604) is provided in the determination process of the selection state of the option of the method of enclosing the symbols shown in the first embodiment in a circle. The determination accuracy of the selection status of the circled options can be significantly improved without being affected by image noise generated when the form image is read by the image scanner 108 or the like.
[0054]
[Third Embodiment]
In the first embodiment, the configuration in which the selection state is determined using one option symbol as a determination region in the option of selecting an item by enclosing the symbol in a circle has been described. However, a plurality of option symbols are arranged vertically. In this case, the selection state may be determined using a region including the plurality of option symbols as a determination region. The embodiment will be described below.
[0055]
FIG. 8 is a schematic diagram showing an example of an option determination area in the third embodiment of the present invention.
[0056]
In the present embodiment, as shown in the figure, in the option of selecting an item by enclosing the numbers in circles, when a plurality of option numbers are arranged vertically, the plurality of option symbols are displayed as 801 in FIG. As shown by the dotted frame, the region to be determined is collectively included.
[0057]
Then, as shown in FIG. 9 to be described later, a plurality of option symbols are obtained by extracting a region including each option symbol from a determination target region including a plurality of option symbols and determining a selection state of each of the extracted regions. It is assumed that the selection state in the determination target area including the is determined.
[0058]
Hereinafter, a method for determining a selection state by extracting a region including each option symbol from the determination target region including a plurality of option symbols described above will be described with reference to FIG.
[0059]
FIG. 9 is a schematic diagram illustrating processing for extracting a region including each option symbol from the determination target region including a plurality of option symbols and determining the selection state in the third embodiment of the present invention.
[0060]
The processing in FIG. 9 is executed by the CPU 101 based on a program stored in the ROM 102, the external storage device 104, or other recording medium, as described in the flowchart in FIG.
[0061]
As shown in FIG. 9, the determination target area includes continuous rows (901, 902, 903, 904, and 905 in the figure) having no black pixels and option symbols such as numbers or circled black pixels surrounding it. Are divided into consecutive lines (906, 907, 908, and 909 in the figure).
[0062]
Therefore, an area 906 from the line after the end of the continuous line 901 having no black pixel to the start of the line 902 having no next black pixel is extracted (extracted) as the first option, and the first embodiment or Assume that the determination is made by the method for determining the selection state of the circled options shown in the second embodiment.
[0063]
When the determination result in the extracted area (area 906 where black pixels exist) is “not selected”, the area 907 where the next black pixels exist is cut out (extracted) and determined.
[0064]
This is repeated up to the area 909, and it is determined that the index of the area where the black pixel exists when the determination result is “selected” (the option number counted from the top) is selected. To do.
[0065]
FIG. 10 is a flowchart showing an example of the third control process in the symbol enclosing determination apparatus of the present invention, corresponding to the determination process of the selection state of the option of the method of enclosing the symbols in the third embodiment of the present invention. . Note that the processing in this flowchart is executed by the CPU 101 shown in FIG. 1 based on a program stored in the ROM 102, the external storage device 104, or other recording medium. S701 to S708 indicate each step.
[0066]
Note that steps S701 and S702 shown in FIG. 10 are the same steps as S501 and S502 shown in FIG.
[0067]
After the position coordinates of the options (for example, the determination target area 801 shown in FIG. 8) are acquired in step S702, the following steps S704 to S707 are performed for the number of options in steps S703 to S708.
[0068]
First, in step S704, an area (for example, 906 in FIG. 9) of continuous rows with 0 or more black pixels sandwiched between rows with 0 black pixels is extracted and stored in a work area such as the RAM 102. . In step S705, the above-explained continuous row region having 0 or more black pixels is subjected to the determination processing shown in steps S503 to S512 in FIG. 5 or steps S604 to 614 in FIG. 7, and in step S706. It is determined whether or not the determination result of the determination process in step S705 is “selected”.
[0069]
If it is determined in step S706 that the determination result in step S705 is “not selected”, the process returns to step S704, and the number of black pixels that are sandwiched by the next black pixel number 0 row is equal to or greater than zero. The region of the row (for example, 907 in FIG. 9) is extracted, and the determination process shown in steps S503 to S512 in FIG. 5 or steps S604 to 614 in FIG. 7 is performed.
[0070]
On the other hand, if it is determined in step S706 that the determination result in step S705 is “selected”, the process exits the loop shown in steps S703 to S708, and in step S707, the option corresponding to the determined area is selected. It is determined that an index has been selected, the index is stored in a work area such as the RAM 102 or the external storage device 104, and the process ends. In the option index storage process in step S707, although not shown in the figure, a counter for counting the number of loops in steps S703 to S708 is provided, and the number of options selected by this counter is acquired. The data is stored in a work area such as the RAM 102 or the external storage device 104.
[0071]
According to this embodiment, in the option of selecting an item by enclosing the symbol in a circle, when a plurality of option symbols are arranged vertically, an area including the plurality of option symbols is designated as a determination area. As a result, it can be determined which of the plurality of options is selected, and the determination target region designation work by the user can be greatly reduced.
[0072]
In the present embodiment, the configuration in which the option first determined to be in the selected state is determined to be in the selected state has been described. However, even after it is determined that a certain option is in the selected state, step S703 is performed up to the last option. When the determination process of S708 is repeated and it is finally determined that a plurality of options are selected (when only a single selection is permitted), a warning is displayed as an error, Only the options determined to be in the selected state may be determined again.
[0073]
Thereby, it is possible to discover selection mistakes such as multiple selections and improve the determination accuracy of the selection state.
[0074]
If multiple selection is permitted, it is also possible to obtain a multiple selection result.
[0075]
Further, in FIG. 8 and FIG. 9, in the case where a plurality of options are arranged vertically, the area from the line after the end of a continuous line without any black pixels to the start of the line without any black pixels is shown. In the case where a plurality of options are arranged in a direction other than the vertical direction, the area including the plurality of options is orthogonal to the direction in which the options are arranged. The areas from the end of the continuous band-shaped area having no black pixel to the start of the next band-shaped area having no black pixel are extracted as option determination areas and determined respectively. (Steps S705 to S707) may be configured.
[0076]
For example, in the case where a plurality of options are arranged in the horizontal direction, an area including the plurality of options is divided into a vertical belt-like area (that is, “column”), and a continuous column having no black pixels is completed. An area from the column until the start of a column having no next black pixel may be extracted as an option determination region and each may be determined.
[0077]
Furthermore, when a plurality of options are arranged in the vertical and horizontal directions (for example, arranged in a matrix of 2 × 3 in length and width, etc.), an area including a plurality of option symbols in the vertical and horizontal directions is designated as a determination area. In addition, the area is divided into the number of columns of options (for example, in the case of options arranged in 2 × 3, it is divided into three areas vertically), and step S703 is performed for each of the divided vertical areas. You may comprise so that the process of S708 may be performed. Note that the number of divisions of the vertical area described above may be input by the user, or may be determined by OCR or the like.
[0078]
As a result, for any of the choices arranged vertically, the choices arranged side by side, and the choices arranged side by side, the user simply designates an area including a plurality of option symbols, and the selection state in the area is determined. Since the determination can be performed, the determination target area designation work by the user can be greatly reduced.
[0079]
[Fourth Embodiment]
In the first to third embodiments described above, the configuration for determining whether or not a number is surrounded by a circle with respect to one determination target region of one type of form has been described, but step S502 in FIG. 5 is performed. ~ S512 or steps S602 to S614 in FIG. 7 or steps S702 to 708 in FIG. 10 are sequentially executed for a plurality of determination areas, so that a plurality of determination target areas in one type of form are processed. Selection state determination processing can be performed.
[0080]
In addition, for a plurality of types of forms, in combination with existing form type discriminating means (means for judging which form has been read in comparison with a pre-stored form image, etc.) If set in advance, it is possible to easily determine whether or not a symbol is circled by simply instructing image reading and execution of determination for a plurality of forms.
[0081]
[Fifth Embodiment]
In the first to fourth embodiments described above, a configuration for determining whether or not symbols such as numbers are circled for one or a plurality of determination target areas for one form is shown. However, using the image scanner 108 or the like capable of continuous reading, a plurality of forms are set in the image scanner 108 or the like, and the processing shown in FIG. 5, FIG. 7, or FIG. With this configuration, the symbols in the determination target area (one or a plurality of predetermined determination target areas) are sequentially circled while sequentially reading a plurality of forms (one type or a plurality of types of forms). It is also possible to sequentially determine whether or not they are.
[0082]
As described above, according to each of the embodiments described above, the registration work for storing the image of the predetermined area of the form as a standard image is not performed, and the circular shape surrounding the option symbols such as numbers is conscious. It is possible to determine the selection state of the option of the method of enclosing the symbols on the form with circles.
[0083]
Further, among the options of the method of encircling the symbols, there is one in which a dotted guide is printed around the option symbols such as numbers as shown in FIG.
[0084]
In the present invention, since both the total number of lines and the number of continuous lines in which the number of line segments included in one line exceeds the prescribed number are to be determined, even when the dotted guide portion is a black pixel. , Because the number of line segments included in one line including the black pixels of the guide part exceeds the specified number is not continuous, so the continuous lines of lines where the number of line segments included in one line exceeds the specified number Dotted lines around the choice symbol (even if the total number of lines in a line exceeds the specified number exceeds the total threshold) It can be prevented that the guide in the shape is erroneously determined as the selected state.
[0085]
In the first to fifth embodiments, as shown in steps S503 to S508 in FIG. 5 or steps S605 to S610 in FIG. 7, from the top row to the bottom row in the option area, steps S504 to S507 in FIG. Alternatively, the processes in steps S604 to S609 in FIG. 7 are repeated, and in step S509 in FIG. 5 or step 612 in FIG. 7, whether the total number of rows having the three or more line segments and the continuous number are both equal to or greater than the threshold value. If both are determined to be greater than or equal to the threshold value, it is determined in step S512 in FIG. 5 or step 614 in FIG. 7 that the option is circled (that is, selected). However, the process is terminated, but the process is not repeated from the top row to the bottom row, and steps S504 to S507 in FIG. 5 or steps S604 to S609 in FIG. 7 are performed. If the number of rows with three or more line segments described above reaches the threshold for the number of continuations while repeating the process, it is determined that the option is circled (that is, selected). The processing may be terminated.
[0086]
However, in the above configuration, whether or not the option is circled (that is, selected) is determined by the fact that the number of rows having three or more line segments is equal to or greater than the threshold value of the continuous number. Since it determines, it must be an enclosure determination apparatus using the threshold value of a continuous number. That is, it cannot be realized by an enclosure determination device that determines whether or not the option is circled (that is, selected) only by the total number of thresholds.
[0087]
In the case of an enclosure determination device that uses the total number threshold and the continuous number threshold as in the first to fifth embodiments, the processing in steps S504 to S507 in FIG. 5 or steps S604 to S609 in FIG. 7 is repeated. On the way, the threshold value of the continuous number used when determining whether or not the number of rows having the above three or more line segments has reached the threshold value of the continuous number is set as “continuous number threshold value A”, and step S510 in FIG. Alternatively, the configuration may be such that the continuous number threshold used in step 612 of FIG. 7 is “continuous number threshold B”.
[0088]
For example, “threshold number threshold A” is 4 points (1/17 inch = about 17 lines at 300 DPI), and “threshold number threshold B” is 1 point (1/72 inch = about 4 lines at 300 DPI). To do.
[0089]
By adopting the above configuration, recognition accuracy can be improved.
[0090]
In each of the above embodiments, Arabic numerals (“0”, “1”) are shown as an example of a symbol indicating a circled option (an option in a format in which the option corresponding to the symbol is selected by enclosing the symbol in a circle). , “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”, etc.)
(Especially, using “6”), the symbols indicating the options are not limited to Arabic numerals. For example, “a”, “b”, “c”, “d” , “E”,..., “A”, “B”, “C”, “D”, “E”,..., Or “i”, “b”, “c”, It may be a katakana character such as ... and is not limited to these examples.
[0091]
For example, in each of the above-described embodiments, the total number of lines in which the number of line segments having a length equal to or greater than a specified value in the horizontal rows (201 to 205) illustrated in FIG. Whether or not there is a selection is determined according to whether or not the selection is made. However, the selection determination condition of the present invention is set in a predetermined direction (which may be a horizontal direction, a vertical direction, or another direction). If the number of line segments having a length equal to or greater than a specified value in a row is determined to determine whether or not there is a selection depending on whether or not the continuous number (and / or the total number) of the number of rows equal to or greater than “n” is greater than or equal to a threshold, A symbol in which the number of line segments having a length equal to or longer than a prescribed value in a row in a predetermined direction is “n−1” or “n-2” is continuous (in other words, the number of continuous segments is continuous by the threshold of the number of continuous values). Construct "n-1" or "n-2" curves that intersect a line (and / or a line with a threshold of the total number) with a width greater than a specified value What symbol if the symbol) to prime as alternative symbols, it is possible to determine the selection state.
[0092]
Note that the above symbol is a symbol (a symbol such as “6” shown in FIG. 4) including a row in which the number of line segments having a length equal to or greater than a specified value in the row in the predetermined direction is “n”. Even so, the selection state can be determined because the presence / absence of selection is determined based on whether or not the number of continuations is equal to or greater than a threshold value.
[0093]
In addition, in the “circle selection options” in which the items are selected by enclosing the symbols in circles determined in the above embodiments, the circles surrounding the symbols do not indicate a circle but are closed such as an ellipse or a polygon. Even a figure (closed figure (convex closed figure or concave closed figure)) includes a figure (open figure) partially broken in line segments.
[0094]
However, when the above-mentioned predetermined direction is the horizontal direction, the upper figure and / or the lower part thereof are broken, that is, figures such as “U”, “∩”, “II” (for example, 1201, 1202, 1203, etc. shown in FIG. 12 are included, and when the predetermined direction described above is a vertical direction, the left or / and right part of the figure is broken, that is, “C”, “⊃” “ 2 ”etc. (for example, 1204, 1205, 1206, etc. shown in FIG. 12).
[0095]
As described above, according to each embodiment, without performing registration work for storing an image of a predetermined area of a form as a standard image, and without being aware of the shape of a circle surrounding a symbol, It is possible to determine the selection state of the option of the method of enclosing the symbol in circle.
[0096]
In addition, all the structures which combined one or all of said each embodiment are also contained in this invention.
[0097]
Although one embodiment has been described above, the present invention can take an embodiment as, for example, a system, apparatus, method, program, or recording medium, and specifically includes a plurality of devices. The present invention may be applied to a system including a single device.
[0098]
The configuration of a data processing program that can be read by the symbol enclosing determination apparatus according to the present invention will be described below with reference to the memory map shown in FIG.
[0099]
FIG. 13 is a diagram illustrating a memory map of a recording medium (storage medium) such as the external storage device 104 that stores various data processing programs that can be read by the symbol box determination device according to the present invention.
[0100]
Although not specifically shown, information for managing a program group stored in the recording medium, for example, version information, creator, etc. is also stored, and information depending on the OS on the program reading side, for example, a program is identified and displayed. Icons may also be stored.
[0101]
Further, data depending on various programs is also managed in the directory. In addition, a program for installing various programs in the computer, and a program for decompressing when the program to be installed is compressed may be stored.
[0102]
The functions shown in FIGS. 5, 7, and 10 in this embodiment may be performed by a host computer by a program installed from the outside. In this case, the present invention is applied even when an information group including a program is supplied to the output device from a recording medium such as a CD-ROM, a flash memory, or an FD, or from an external recording medium via a network. Is.
[0103]
As described above, a recording medium recording software program codes for realizing the functions of the above-described embodiments is supplied to a system or apparatus, and a computer (or CPU or MPU) of the system or apparatus stores the recording medium in the recording medium. It goes without saying that the object of the present invention can also be achieved by reading and executing the programmed program code.
[0104]
In this case, the program code itself read from the recording medium realizes the novel function of the present invention, and the recording medium storing the program code constitutes the present invention.
[0105]
Therefore, as long as it has the function of the program, the form of the program such as an object code, a program executed by an interpreter, or script data supplied to the OS is not limited.
[0106]
As a recording medium for supplying the program, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, MO, CD-ROM, CD-R, CD-RW, magnetic tape, nonvolatile memory card, ROM, DVD, etc. Can be used.
[0107]
In this case, the program code itself read from the recording medium realizes the functions of the above-described embodiment, and the recording medium storing the program code constitutes the present invention.
[0108]
As another program supply method, a browser of a client computer is used to connect to a homepage on the Internet, and the computer program itself of the present invention or a compressed file including an automatic installation function is stored on a recording medium such as a hard disk from the homepage. It can also be supplied by downloading. It can also be realized by dividing the program code constituting the program of the present invention into a plurality of files and downloading each file from a different homepage. That is, a WWW server, an ftp server, and the like that allow a plurality of users to download a program file for realizing the functional processing of the present invention on a computer are also included in the claims of the present invention.
[0109]
In addition, the program of the present invention is encrypted, stored on a recording medium such as a CD-ROM, distributed to users, and key information for decryption is downloaded from a homepage via the Internet to users who have cleared predetermined conditions. It is also possible to execute the encrypted program by using the key information and install the program on a computer.
[0110]
Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) or the like running on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
[0111]
Furthermore, after the program code read from the recording medium is written in a memory provided in a function expansion board inserted in the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. It goes without saying that the case where the CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
[0112]
Further, the present invention may be applied to a system composed of a plurality of devices or an apparatus composed of a single device. Needless to say, the present invention can be applied to a case where the present invention is achieved by supplying a program to a system or apparatus. In this case, by reading a recording medium storing a program represented by software for achieving the present invention into the system or apparatus, the system or apparatus can enjoy the effects of the present invention. .
[0113]
The present invention is not limited to the above embodiments, and various modifications (including organic combinations of the embodiments) are possible based on the spirit of the present invention, and these are excluded from the scope of the present invention. is not.
[0114]
While various examples and embodiments of the present invention have been shown and described, the spirit and scope of the present invention are not limited to the specific description within this specification.
[0115]
【The invention's effect】
As described above, according to the present invention, a determination target area including a predetermined symbol is cut out from image data, and a line segment in each band area obtained by dividing the cut out area into a band area in a predetermined direction is searched. And, when the number of line segments in the counted band-like area is more than the first specified value, the number of the continuous band-like areas is counted and the counted Since the maximum value of the number of band-like areas is compared with a threshold value based on the resolution of the image data to determine whether or not the symbol is surrounded by a predetermined figure, the image of the predetermined area of the form is stored as a standard image. Therefore, it is possible to determine the selection state of the options of the method of encircling the symbols on the form without performing the registration work for the image and without being aware of the shape of the circle surrounding the symbols. The fact that the registration work of the standard image is not necessary means that even a user who does not have an unfilled form can determine the selection state of the filled form.
[0116]
In addition, even for a form in which a dotted guide is printed around the symbol, both the total number of lines and the number of continuous lines where the number of line segments included in the one-band area exceeds the specified number Therefore, even if the guide portion on the dotted line is a black pixel, the determination is not erroneous and the determination can be made with high accuracy. Note that the determination accuracy can be further improved by removing noise before determining the selection state.
[0117]
Therefore, it is possible to easily determine whether or not a predetermined symbol in a form or the like is surrounded by a predetermined figure such as a circle without storing and managing a predetermined area such as a form as a standard image. There is an effect that the determination accuracy can be remarkably improved.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a symbol enclosing determination apparatus showing a first embodiment of the present invention.
FIG. 2 is a schematic diagram showing an example of symbols corresponding to options determined by the symbol surrounding determination device of the present invention.
FIG. 3 is a schematic diagram showing an example of symbols corresponding to options determined by the symbol surrounding determination device of the present invention.
FIG. 4 is a schematic diagram showing a case where three lines are included in one line in a symbol corresponding to an option determined by the symbol enclosing determination apparatus of the present invention.
FIG. 5 is a flowchart showing an example of a first control process in the symbol enclosing determination apparatus of the present invention.
FIG. 6 is a schematic diagram showing an example of a determination target region designation method in the symbol surrounding determination device of the present invention.
FIG. 7 is a flowchart showing an example of a second control process in the symbol surrounding determination device of the present invention.
FIG. 8 is a schematic diagram showing an example of an option determination area in the third embodiment of the present invention.
FIG. 9 is a schematic diagram illustrating processing for extracting a region including each option symbol from a determination target region including a plurality of option symbols and determining a selection state according to the third embodiment of the present invention.
FIG. 10 is a flowchart showing an example of a third control process in the symbol enclosing determination apparatus of the present invention.
FIG. 11 is a schematic diagram showing a state in which a dotted guide is printed around an option symbol determined by the symbol surrounding determination device of the present invention.
FIG. 12 is a schematic diagram showing an example of a figure surrounding options in the symbol enclosing determination apparatus of the present invention.
FIG. 13 is a diagram illustrating a memory map of a recording medium that stores various data processing programs that can be read by the symbol box determination device according to the present invention.
[Explanation of symbols]
101 CPU
102 RAM
103 ROM
104 External storage device
105 display
106 keyboard
107 pointing device
108 Image Scanner

Claims (12)

画像データ内に含まれる所定の記号が所定図形で囲まれているか否かを認識する記号囲み判定装置において、
前記画像データから前記所定の記号を含む判定対象領域を特定する特定手段と、
前記特定手段により特定された判定対象領域を所定方向の帯状領域に分割した各帯状領域内を探索して線分数をカウントする第1のカウント手段と、
前記第1のカウント手段によりカウントされた線分数が第1の規定値以上である帯状領域が連続している場合にその連続している帯状領域数をカウントする第2のカウント手段と、
前記第2のカウント手段によりカウントされた帯状領域数と第1の閾値とを比較することにより、前記記号が所定図形で囲まれているか否かを判定する判定手段と、
を備えることを特徴とする記号囲み判定装置。
In a symbol enclosing determination device for recognizing whether or not a predetermined symbol included in image data is surrounded by a predetermined figure,
A specifying means for specifying a determination target region including the predetermined symbol from the image data;
First counting means for searching in each band area obtained by dividing the determination target area specified by the specifying means into band areas in a predetermined direction and counting the number of line segments;
A second counting unit that counts the number of continuous band-like areas when the number of line-segments counted by the first counting means is continuous;
A determination unit that determines whether or not the symbol is surrounded by a predetermined graphic by comparing the number of strip-like regions counted by the second counting unit with a first threshold;
A symbol encircling determination device comprising:
前記第1の閾値を前記画像データの解像度に基づいて算出する第1の算出手段を、更に有することを特徴とする請求項1記載の記号囲み判定装置。The symbol surrounding determination device according to claim 1, further comprising first calculation means for calculating the first threshold based on a resolution of the image data. 前記第1のカウント手段によりカウントされた線分数が第1の規定値以上である行数の総数をカウントする第3のカウント手段を更に有し、
前記判定手段は、前記第2のカウント手段によりカウントされた帯状領域数と第1の閾値との比較結果と、前記第3のカウント手段によりカウントされた帯状領域数の総数と第2の閾値との比較結果とに基づいて、前記記号が所定図形で囲まれているか否かを判定することを特徴とする請求項1又は2記載の記号囲み判定装置。
And further comprising third counting means for counting the total number of rows in which the number of line segments counted by the first counting means is equal to or greater than a first specified value,
The determination means includes a comparison result between the number of band-like areas counted by the second counting means and the first threshold value, a total number of band-like areas counted by the third counting means, and a second threshold value. The symbol surrounding determination device according to claim 1, wherein it is determined whether or not the symbol is surrounded by a predetermined figure based on the comparison result.
前記第2の閾値を前記画像データの解像度に基づいて算出する第2の算出手段を、更に有することを特徴とする請求項3記載の記号囲み判定装置。The symbol surrounding determination device according to claim 3, further comprising second calculation means for calculating the second threshold based on a resolution of the image data. 前記第2のカウント手段によりカウントされた帯状領域数の最大値を記憶する記憶手段を更に備え、
前記判定手段において、前記記憶手段により記憶された帯状領域数の最大値と第1の閾値と比較することを特徴とする請求項1〜4のいずれかに記載の記号囲み判定装置。
Storage means for storing the maximum value of the number of band-like areas counted by the second counting means;
The symbol enclosing determination apparatus according to any one of claims 1 to 4, wherein the determination means compares the maximum value of the number of belt-shaped areas stored by the storage means with a first threshold value.
前記特定手段により特定された判定対象領域に対してノイズ除去を行うノイズ除去手段を更に備えることを特徴とする請求項1〜5のいずれかに記載の記号囲み判定装置。The symbol surrounding determination device according to any one of claims 1 to 5, further comprising a noise removing unit that performs noise removal on the determination target region identified by the identifying unit. 前記所定の記号は、前記第1の閾値の数連続する帯状領域と所定値以上の幅で交わる前記「第1の規定値−1」本又は前記「第1の規定値−2」本の曲線を構成要素とする記号であることを特徴とする請求項1〜6のいずれかに記載の記号囲み判定装置。The predetermined symbol is a curve of the “first specified value−1” or the “first specified value−2” curve that intersects the band-like region that is continuous by the number of the first thresholds with a width equal to or greater than a predetermined value. The symbol enclosing determination device according to claim 1, wherein the symbol enclosing symbol is a symbol. 前記所定の記号は、アラビア数字であることを特徴とする請求項1〜6のいずれかに記載の記号囲み判定装置。The symbol surrounding determination device according to claim 1, wherein the predetermined symbol is an Arabic numeral. 前記第1の規定値は、「3」又は「5」であることを特徴とする請求項1〜8のいずれかに記載の記号囲み判定装置。The symbol surrounding determination device according to claim 1, wherein the first specified value is “3” or “5”. 画像データ内に含まれる所定の記号が所定図形で囲まれているか否かを認識するための情報処理装置における記号囲み判定方法において、
第1のカウント手段が、前記画像データ内の前記所定の記号を含む判定対象領域を所定方向の帯状領域に分割した各帯状領域内を検索して線分数をカウントする第1のカウント工程と、
第2のカウント手段が、前記第1のカウント工程によりカウントされた線分数が第1の規定値以上である帯状領域が連続している場合にその連続している帯状領域数をカウントする第2のカウント工程と、
判定手段が、前記第2のカウント工程によりカウントされた帯状領域数と第1の閾値とを比較することにより、前記記号が所定図形で囲まれているか否かを判定する判定工程と、
を備えることを特徴とする記号囲み判定方法。
In a symbol surrounding determination method in an information processing apparatus for recognizing whether or not a predetermined symbol included in image data is surrounded by a predetermined figure,
A first counting step in which a first counting unit searches each band-like area obtained by dividing the determination target area including the predetermined symbol in the image data into band-like areas in a predetermined direction and counts the number of line segments;
A second counting unit that counts the number of continuous band-like areas when the band-like areas whose line segments counted in the first counting step are equal to or greater than the first specified value are continuous; Counting process,
A determination step for determining whether or not the symbol is surrounded by a predetermined figure by comparing the number of band-shaped regions counted in the second counting step with a first threshold;
A symbol encircling determination method comprising:
請求項10に記載された記号囲み判定方法を情報処理装置に実行させるためのプログラム。A non-transitory computer-readable storage medium storing a program for causing an information processing apparatus to execute the symbol enclosing determination method according to claim 10. 請求項1に記載されたプログラムを記録したコンピュータ読み取り可能な記録媒体 Computer readable recording medium recording the program according to claim 1 1.
JP2003187545A 2003-06-30 2003-06-30 Symbol encircling judgment device, symbol encircling judgment method, program, and recording medium Expired - Fee Related JP3923034B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003187545A JP3923034B2 (en) 2003-06-30 2003-06-30 Symbol encircling judgment device, symbol encircling judgment method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003187545A JP3923034B2 (en) 2003-06-30 2003-06-30 Symbol encircling judgment device, symbol encircling judgment method, program, and recording medium

Publications (2)

Publication Number Publication Date
JP2005025314A JP2005025314A (en) 2005-01-27
JP3923034B2 true JP3923034B2 (en) 2007-05-30

Family

ID=34186362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003187545A Expired - Fee Related JP3923034B2 (en) 2003-06-30 2003-06-30 Symbol encircling judgment device, symbol encircling judgment method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP3923034B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2899052B1 (en) * 2006-03-22 2009-04-24 Imra Europ Sas Soc Par Actions ADAPTIVE FILTER FOR COMMUNICATION SIGNAL RECEIVER
JP6531368B2 (en) * 2014-06-30 2019-06-19 キヤノンマーケティングジャパン株式会社 INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING DEVICE, PROCESSING METHOD, AND PROGRAM

Also Published As

Publication number Publication date
JP2005025314A (en) 2005-01-27

Similar Documents

Publication Publication Date Title
US6996276B2 (en) Method and apparatus for discriminating between documents in batch scanned document files
US6470336B1 (en) Document image search device and recording medium having document search program stored thereon
JP4553241B2 (en) Character direction identification device, document processing device, program, and storage medium
JP3919617B2 (en) Character recognition device, character recognition method, program, and storage medium
US20040223197A1 (en) Image processing method
US8452097B2 (en) Apparatus and method for extracting circumscribed rectangles of characters in transplantable electronic document
JP2007086954A (en) Character recognition processing device, character recognition processing method, and computer program
US8526744B2 (en) Document processing apparatus and computer readable medium
US8600175B2 (en) Apparatus and method of processing image including character string
JP3923034B2 (en) Symbol encircling judgment device, symbol encircling judgment method, program, and recording medium
JP7039882B2 (en) Image analysis device and image analysis program
EP2787448A1 (en) Method and device for determining font
WO2002021331A1 (en) Analysing hypertext documents
JP4678712B2 (en) Language identification device, program, and recording medium
JP4328511B2 (en) Pattern recognition apparatus, pattern recognition method, program, and storage medium
JP7532171B2 (en) IMAGE JUDGMENT DEVICE, IMAGE JUDGMENT METHOD, AND PROGRAM
JP2993533B2 (en) Information processing device and character recognition device
JP4915337B2 (en) Print data processing program, method and apparatus
JP7358838B2 (en) Information processing device and information processing program
JP2868392B2 (en) Handwritten symbol recognition device
JP2006072524A (en) Information processing apparatus and method
JPH1055408A (en) Pattern separating device and its method for separating contact pattern
JP4148966B2 (en) Pattern matching apparatus, program for realizing the same, and recording medium
JP3220226B2 (en) Character string direction determination method
JPH0436885A (en) Optical character reader

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070220

R150 Certificate of patent or registration of utility model

Ref document number: 3923034

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100302

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110302

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110302

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120302

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120302

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130302

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130302

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130302

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130302

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140302

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees