JP2014086067A - 矩形領域検出によるマークシート認識手段 - Google Patents
矩形領域検出によるマークシート認識手段 Download PDFInfo
- Publication number
- JP2014086067A JP2014086067A JP2012247860A JP2012247860A JP2014086067A JP 2014086067 A JP2014086067 A JP 2014086067A JP 2012247860 A JP2012247860 A JP 2012247860A JP 2012247860 A JP2012247860 A JP 2012247860A JP 2014086067 A JP2014086067 A JP 2014086067A
- Authority
- JP
- Japan
- Prior art keywords
- mark
- sheet
- specified
- rectangle
- software
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【課題】従来のマークシートにおいては、高価な専用読み取り機を使用し、それに合わせた専用用紙を用意するか、または自由に用紙を作成するソフトウェアを使用する場合も、マーク記入済み用紙を読み取る際のエラー防止目的等の理由から、用紙に基準点・基準線を別途配置する必要があり、作成される用紙レイアウトに制約が持たされるものであった。
【解決手段】本発明では、マーク領域矩形の輪郭を検出したものを反映させ、ユーザー指定によるマークの個数と読み取ったマークを対比させる事により、従来法のように用紙上に読取り基準点を設けることなく、また用紙上のどの位置にマーク領域が存在しても読み取りが可能となる。
【選択図】図1
【解決手段】本発明では、マーク領域矩形の輪郭を検出したものを反映させ、ユーザー指定によるマークの個数と読み取ったマークを対比させる事により、従来法のように用紙上に読取り基準点を設けることなく、また用紙上のどの位置にマーク領域が存在しても読み取りが可能となる。
【選択図】図1
Description
この発明は、マークシートの認識手段に関する。
従来のマークシート認識方法は、認識されるマークが「使用される用紙上のどの位置にあるか」を検出するため、専用の用紙フォーマットに厳密な精度が必要であり、それを読み取るにあたっての専用装置を必用とするのが一般的であった。
また近年は、専用の用紙を必要とせず、自由にマークシートを作成可能なソフトウェアも存在する。
また近年は、専用の用紙を必要とせず、自由にマークシートを作成可能なソフトウェアも存在する。
「マークシート読取君2」(2012年10月現在)http://www.magnolia.co.jp/products/utility/mread2/index.htm
「Area61マークリーダVer.2.2.7」(2012年10月現在)http://www.area61.com/markreader/
「OpenCV」(2012年10月現在)http://opencv.org/
しかしながら、上記を例とする先行技術によれば、高価な専用読み取り機を使用し、それに合わせた専用紙を用意するか、または自由に用紙を作成するためのソフトウェアを使用した場合も、マークが記入された用紙を汎用スキャナ等で読み取る際の用紙の傾きによる読取りエラー防止目的等の理由から、用紙上に基準点・基準線を別途配置する必要があった。
また、矩形を検出するための技術として、上記[非特許文献3]のようにインターネットのWebサイトで利用許諾に基づき無償提供されているプログラムも存在しているが、これは画像から矩形を検出するにとどまるものである。
そこで、この発明は、用紙上に基準点・基準線を別途配置することなく、マークシートを一般的な書類作成(描画機能あり)ソフトウェアと印刷機を用いて作成し、スキャナ等の一般的な読み取り装置を用いることで画像データ化したものから、高い精度でマーク位置を認識する手段を提供することを課題とする。
また、矩形を検出するための技術として、上記[非特許文献3]のようにインターネットのWebサイトで利用許諾に基づき無償提供されているプログラムも存在しているが、これは画像から矩形を検出するにとどまるものである。
そこで、この発明は、用紙上に基準点・基準線を別途配置することなく、マークシートを一般的な書類作成(描画機能あり)ソフトウェアと印刷機を用いて作成し、スキャナ等の一般的な読み取り装置を用いることで画像データ化したものから、高い精度でマーク位置を認識する手段を提供することを課題とする。
以上の課題を解決するための手段は請求項1に記載されるものである。
(ア)用紙上にある全ての矩形を、本ソフトウェア利用者によって指定された「マーク領域サイズSM」に近い順に並べ替え、また同時に用紙の縁に極めて近くに検出された矩形は「用紙そのものの輪郭を辺の一部として誤検出したもの」として候補から除外する。
(イ)残った矩形のうちSMに最も近いものから順に、本ソフトウェア利用者によって指定されたNC個を取り出す。このNC個の矩形のそれぞれの頂点について平均値を算出し、これらの座標を頂点とする矩形を定義し、これをマーク領域RMとする。
(ウ)マーク領域RMの辺がX軸Y軸と平行になるよう、アフィン変換により正規化。以降、この正規化した矩形領域RNに対して処理を行う。
(エ)ヒストグラムが均一となるようRNの明るさを正規化。
(オ)本ソフトウェア利用者によって指定されたTBを閾値としてRNを二値化。
(カ)二値化したRNを本ソフトウェア利用者によって指定されたマーク個数(横DC個×縦DR個)に従って等分割。
(キ)それぞれの部分領域について、領域内の全画素数に対する黒画素数が本ソフトウェア利用者によって指定された割合TC以上であれば、その部分領域を「塗りつぶされたマーク」として認識。
上記(ア)〜(キ)の技術によるマークシート認識手段。
(ア)用紙上にある全ての矩形を、本ソフトウェア利用者によって指定された「マーク領域サイズSM」に近い順に並べ替え、また同時に用紙の縁に極めて近くに検出された矩形は「用紙そのものの輪郭を辺の一部として誤検出したもの」として候補から除外する。
(イ)残った矩形のうちSMに最も近いものから順に、本ソフトウェア利用者によって指定されたNC個を取り出す。このNC個の矩形のそれぞれの頂点について平均値を算出し、これらの座標を頂点とする矩形を定義し、これをマーク領域RMとする。
(ウ)マーク領域RMの辺がX軸Y軸と平行になるよう、アフィン変換により正規化。以降、この正規化した矩形領域RNに対して処理を行う。
(エ)ヒストグラムが均一となるようRNの明るさを正規化。
(オ)本ソフトウェア利用者によって指定されたTBを閾値としてRNを二値化。
(カ)二値化したRNを本ソフトウェア利用者によって指定されたマーク個数(横DC個×縦DR個)に従って等分割。
(キ)それぞれの部分領域について、領域内の全画素数に対する黒画素数が本ソフトウェア利用者によって指定された割合TC以上であれば、その部分領域を「塗りつぶされたマーク」として認識。
上記(ア)〜(キ)の技術によるマークシート認識手段。
本発明によれば、マーク領域の枠線そのものを認識し読み取ることが可能となるため、マークシート作成時に用紙上に別途の基準点・基準線を設ける必要がなくなる。
この発明の実施形態を、図1に示す。
本ソフトウェア利用者は図7、図8のように書類作成(描画機能あり)ソフトウェアを用いて作成されたマークシートを用紙として、テスト、アンケート等を実施。記入済みの用紙を回収し、スキャナ等の汎用読取り装置にて画像ファイル化する。
画像ファイルから、用紙上にある大きさや傾きの異なる全ての矩形を検出(マーク領域の他、図形として描画されたものも含める)。なお、矩形検出にはインターネットのWebサイトで利用許諾に基づき無償提供されているプログラム「OpenCV」を使用している。
図6のパラメーター設定インターフェースP1より設定されたマーク領域の枠線サイズに基づき、候補として図2のようにサイズの近い順に矩形の並べ替えを行うP2(用紙の縁に極めて近く配置された矩形については、用紙の縁を誤検出したものとして候補から除外P3)。
並べ替えを行った矩形のうち、指定されたサイズに最も近いものから順に並べ替えを行い、本ソフトウェア利用者によって指定されたNC個を取り出す。このNC個の矩形のそれぞれの頂点について平均値を算出し、これらの座標を頂点とする矩形を定義し、これをマーク領域とする。
図3のように、マーク領域の辺がX軸Y軸と平行になるよう、アフィン変換P4により正規化(傾きや歪みの補正)。
ヒストグラムを均一化P5し、図6のパラメーターP1で設定した閾値によって二値化P6。
図6のパラメーター設定インターフェースで指定したマークの縦横列の個数により、図4のようにマークを等分割するP7。
等分割されたそれぞれのマークは、図6のパラメーターP1で指定した閾値に基づき、全画素数に対する黒画素数の数が読み取られ、指定値より多ければ「塗りつぶされたマーク」3、指定値より少なければ「空白のマーク」4と認識するP8。
本ソフトウェア利用者は図7、図8のように書類作成(描画機能あり)ソフトウェアを用いて作成されたマークシートを用紙として、テスト、アンケート等を実施。記入済みの用紙を回収し、スキャナ等の汎用読取り装置にて画像ファイル化する。
画像ファイルから、用紙上にある大きさや傾きの異なる全ての矩形を検出(マーク領域の他、図形として描画されたものも含める)。なお、矩形検出にはインターネットのWebサイトで利用許諾に基づき無償提供されているプログラム「OpenCV」を使用している。
図6のパラメーター設定インターフェースP1より設定されたマーク領域の枠線サイズに基づき、候補として図2のようにサイズの近い順に矩形の並べ替えを行うP2(用紙の縁に極めて近く配置された矩形については、用紙の縁を誤検出したものとして候補から除外P3)。
並べ替えを行った矩形のうち、指定されたサイズに最も近いものから順に並べ替えを行い、本ソフトウェア利用者によって指定されたNC個を取り出す。このNC個の矩形のそれぞれの頂点について平均値を算出し、これらの座標を頂点とする矩形を定義し、これをマーク領域とする。
図3のように、マーク領域の辺がX軸Y軸と平行になるよう、アフィン変換P4により正規化(傾きや歪みの補正)。
ヒストグラムを均一化P5し、図6のパラメーターP1で設定した閾値によって二値化P6。
図6のパラメーター設定インターフェースで指定したマークの縦横列の個数により、図4のようにマークを等分割するP7。
等分割されたそれぞれのマークは、図6のパラメーターP1で指定した閾値に基づき、全画素数に対する黒画素数の数が読み取られ、指定値より多ければ「塗りつぶされたマーク」3、指定値より少なければ「空白のマーク」4と認識するP8。
この実施形態によれば、自由にマーク領域用矩形2を設定することを前提とした場合、描画されたマーク領域用矩形の縦横サイズが一定であれば、その矩形の枠線を認識して読み取るため、マークシート用紙1上において従来必用とされた別途基準点・基準線を配置する必要が無くなり、スキャナ等の読取り装置での用紙読取りの際に、用紙または矩形に傾きがある場合もマークを認識することが可能となる。
また、指定されたマーク領域用矩形の縦横サイズが一定であれば、用紙のどの位置にマーク領域用矩形が配置されていても読み取りが可能となるため、読取りの際に連続する複数枚の用紙でそれぞれ違う位置にマーク領域用矩形が存在しても読取り可能となる。
また、指定されたマーク領域用矩形の縦横サイズが一定であれば、用紙のどの位置にマーク領域用矩形が配置されていても読み取りが可能となるため、読取りの際に連続する複数枚の用紙でそれぞれ違う位置にマーク領域用矩形が存在しても読取り可能となる。
1.用紙 2.描画されたマーク領域用矩形 3.塗りつぶされたマーク 4.空白のマーク
P1.パラメーター P2.検出した矩形の並べ替え及び特定条件下のマーク除外 P3.矩形サイズの平均値計算 P4.アフィン変換 P5.ヒストグラムの均一化 P6.指定閾値による二値化 P7.指定されたマークの個数で領域を等分割 P8.黒画素数による塗りつぶしの判定
P1.パラメーター P2.検出した矩形の並べ替え及び特定条件下のマーク除外 P3.矩形サイズの平均値計算 P4.アフィン変換 P5.ヒストグラムの均一化 P6.指定閾値による二値化 P7.指定されたマークの個数で領域を等分割 P8.黒画素数による塗りつぶしの判定
Claims (1)
- 矩形領域検出によるマークシート認識手段
(ア)用紙上にある全ての矩形を、本ソフトウェア利用者によって指定された「マーク領域サイズSM」に近い順に並べ替え、また同時に用紙の縁に極めて近くに検出された矩形は「用紙そのものの輪郭を辺の一部として誤検出したもの」として候補から除外する。
(イ)残った矩形のうちSMに最も近いものから順に、本ソフトウェア利用者によって指定されたNC個を取り出す。このNC個の矩形のそれぞれの頂点について平均値を算出し、これらの座標を頂点とする矩形を定義し、これをマーク領域RMとする。
(ウ)マーク領域RMの辺がX軸Y軸と平行になるよう、アフィン変換により正規化。以降、この正規化した矩形領域RNに対して処理を行う。
(エ)ヒストグラムが均一となるようRNの明るさを正規化。
(オ)本ソフトウェア利用者によって指定されたTBを閾値としてRNを二値化。
(カ)二値化したRNを本ソフトウェア利用者によって指定されたマーク個数{横DC個×縦DR個)に従って等分割。
(キ)それぞれの部分領域について、領域内の全画素数に対する黒画素数が本ソフトウェア利用者によって指定された割合TC以上であれば、その部分領域を「塗りつぶされたマーク」として認識。
上記(ア)〜(キ)の技術によるマークシート認識手段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012247860A JP2014086067A (ja) | 2012-10-24 | 2012-10-24 | 矩形領域検出によるマークシート認識手段 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012247860A JP2014086067A (ja) | 2012-10-24 | 2012-10-24 | 矩形領域検出によるマークシート認識手段 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014086067A true JP2014086067A (ja) | 2014-05-12 |
Family
ID=50789009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012247860A Pending JP2014086067A (ja) | 2012-10-24 | 2012-10-24 | 矩形領域検出によるマークシート認識手段 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014086067A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416345A (zh) * | 2018-02-08 | 2018-08-17 | 海南云江科技有限公司 | 一种答题卡区域识别方法和计算设备 |
-
2012
- 2012-10-24 JP JP2012247860A patent/JP2014086067A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416345A (zh) * | 2018-02-08 | 2018-08-17 | 海南云江科技有限公司 | 一种答题卡区域识别方法和计算设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210232844A1 (en) | Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks | |
CN109034165B (zh) | 一种证件图像的裁切方法、装置、系统及存储介质 | |
US20130121595A1 (en) | Image processing apparatus, rectangle detection method, and computer-readable, non-transitory medium | |
US8774514B2 (en) | Method of and apparatus for classifying image using histogram analysis, and method of and apparatus for recognizing text image using the histogram analysis | |
US9160884B2 (en) | Image processing apparatus, line detection method, and computer-readable, non-transitory medium | |
US20120093434A1 (en) | Edge detection | |
RU2014112237A (ru) | Ввод данных с изображений документов с фиксированной структурой | |
US9104940B2 (en) | Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines | |
US8027539B2 (en) | Method and apparatus for determining an orientation of a document including Korean characters | |
JP6642970B2 (ja) | 注目領域検出装置、注目領域検出方法及びプログラム | |
US10586321B2 (en) | Automatic detection, counting, and measurement of lumber boards using a handheld device | |
US20130120806A1 (en) | Image processing apparatus, line detection method, and computer-readable, non-transitory medium | |
CN102760225A (zh) | 一种基于矩形包围框的试卷客观题答题卡定位方法 | |
US11216905B2 (en) | Automatic detection, counting, and measurement of lumber boards using a handheld device | |
US20160180164A1 (en) | Method for converting paper file into electronic file | |
JP6578858B2 (ja) | 情報処理装置及びプログラム | |
CN107798355B (zh) | 一种基于文档图像版式自动分析与判断的方法 | |
US9483834B1 (en) | Object boundary detection in an image | |
US9110926B1 (en) | Skew detection for vertical text | |
JP2014086067A (ja) | 矩形領域検出によるマークシート認識手段 | |
KR20150099116A (ko) | Ocr를 이용한 컬러 문자 인식 방법 및 그 장치 | |
KR101672389B1 (ko) | 화상 처리 장치 및 방법, 지정 마크 추정 장치 및 방법, 및 기억 매체 | |
US20130156288A1 (en) | Systems And Methods For Locating Characters On A Document | |
JP7370574B2 (ja) | コマ抽出方法及びプログラム | |
JP5871116B2 (ja) | 画像処理装置、方法、およびプログラム |