JP6348038B2 - プログラム - Google Patents

プログラム Download PDF

Info

Publication number
JP6348038B2
JP6348038B2 JP2014195602A JP2014195602A JP6348038B2 JP 6348038 B2 JP6348038 B2 JP 6348038B2 JP 2014195602 A JP2014195602 A JP 2014195602A JP 2014195602 A JP2014195602 A JP 2014195602A JP 6348038 B2 JP6348038 B2 JP 6348038B2
Authority
JP
Japan
Prior art keywords
answer
function
unit
confirmation
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014195602A
Other languages
English (en)
Other versions
JP2016066302A (ja
Inventor
憲吾 寺沢
憲吾 寺沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Future University Hakodate
Original Assignee
Future University Hakodate
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Future University Hakodate filed Critical Future University Hakodate
Priority to JP2014195602A priority Critical patent/JP6348038B2/ja
Publication of JP2016066302A publication Critical patent/JP2016066302A/ja
Application granted granted Critical
Publication of JP6348038B2 publication Critical patent/JP6348038B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)

Description

本発明はプログラムに関し、特にコンピュータにナンバープレースの正誤判定機能を実現させるコンピュータプログラムに関する。
近年、科学技術の発展に伴い、様々な分野で電子化が進み、便利な電子ツールが実用化されている。これはナンバープレース(Number Place)を始めとするペンシルパズルにおいても同様であり、主に問題を提供するものや自動解答を行うものが数多く存在する。この中には、例えば紙に印刷されたナンバープレースの問題をWebカメラの映像から認識し、リアルタイムで自動解答を行うというシステムも提案されている。
その他にも、問題のデータを手入力することで同様に自動解答を行うものや、解答過程を入力していくことで各マスに入る数字候補の明示化や解答手順の記録を行う機能を持つ補助ツールなどが存在している。このように、ナンバープレースに関する多くの電子ツールがインターネットを通じて広く公開されている。
Webカメラで解く数独 -MATLAB ビデオ- MathWorks日本, http://www.mathworks.co.jp/videos/solving-asudoku-puzzle-using-a-webcam-87733.html,(2014年9月5日検索)。
こうした電子化の流れが進む一方で、それでも「紙媒体に手書きで解く」というナンバープレースの解答形式は未だ高い人気を誇っており、現在も多くのユーザが鉛筆片手にナンバープレースを楽しんでいる。本来であればそれら手書きでの解答に対する便益向上を目的とした電子ツールも存在して然るべきであることから、本願の発明者は、手書きのナンバープレースの解答について正誤判定を実現する技術の有用性について認識するに至った。
本発明はこうした状況に鑑みてなされたものであり、その目的は、手書きで解答したナンバープレースの正誤を判定する技術を提供することにある。
上記課題を解決するために、本発明のある態様は、コンピュータにナンバープレースの正誤判定機能を実現させるプログラムである。このプログラムがコンピュータに実現させる正誤判定機能は、手書きで解答したナンバープレースの画像を取得する画像取得機能と、取得した画像から、ナンバープレースの解答枠を検出する解答枠検出機能と、検出した解答枠が所定の形状および大きさとなるように画像を正規化する正規化機能と、正規化された解答枠から、9行9列の81個の数字特定領域に区分けする区分け機能と、区分けされた数字特定領域それぞれに1文字ずつ記載されている数字を特定する数字特定機能と、区分けされた81個の数字特定領域の中から、9個の数字特領域をひとつの解答確認領域として、複数の異なる解答確認領域を設定する解答確認領域設定機能と、設定された複数の解答確認領域それぞれについて、1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認する正誤確認機能と、確認結果を通知する通知機能とを含む。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、サーバ、システム、コンピュータプログラム、当該コンピュータプログラムを格納した記録媒体などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、手書きで解答したナンバープレースの正誤を判定する技術を提供することができる。
ナンバープレースの問題例を示す図である。 実施の形態に係る情報処理装置の機能構成を模式的に示す図である。 画像取得部が取得する解答済み画像の一例を示す図である。 解答枠検出部が検出した解答枠を正規化部が正規化した結果の一例を示す図である。 区分け部が区分けした数字特定領域の画像の一例を示す図である。 数字特定部の機能構成を模式的に示す図である。 実施の形態に係る情報処理装置が実行するナンバープレースの正誤判定処理の流れを示すフローチャートである。 実施の形態に係る数字特定部が実行する数字特定処理の流れを説明するフローチャートである。
図1は、ナンバープレースの問題例を示す図である。ナンバープレースは、有名なペンシルパズルの一種である。このパズルの内容は、予めいくつかのマスが埋められた9行9列のマス目状の盤面を問題とし、ルールに従って残りのマスに1〜9の数字を当てはめるというものである。ナンバープレースは世界的に流行しており、毎年世界選手権なども開催されている。また、書店や100円ショップにナンバープレース問題集のコーナーが存在することなどを見ても、ナンバープレースが一般に広く普及し、人々に楽しまれていることがわかる。
ナンバープレースを手書きで解く場合、「書き込みの自由度の高さ」という非常に重要度が高い利点があると考えられる。ナンバープレースでは、ある程度難易度の高い問題を解答する場合、途中でメモを記入しながら解答を進めるのが一般的である。この際、手書きであれば好きな場所に好きなようにメモや解答を書くことができる。一方、アプリ等の電子的な手段でナンバープレースを解く場合、アプリの中にあまり自由な形でメモが書けないものもあり、そもそもメモ書き機能がついていないものが多い。したがって、ナンバープレースを紙媒体で解くことには大きなメリットがあると考えられる。この他にも、ナンバープレースを手書きで解くことには、問題の紙と鉛筆1本で手軽に出来るという利点もある。
一方で、手書きでナンバープレースを解答するデメリットの1つに、「解答後の答え合わせが面倒である」ということが挙げられる。ナンバープレースの答え合わせは、基本的に解答枠を1マスずつ確認しなければならず手間がかかる。また、ミスに気付かずに最後まで解答してしまうこともあり、答え合わせをしないというのも憚られる。そこで、実施の形態に係る情報処理装置は、手書きで解答したナンバープレースの画像を取得し、ナンバープレースの答え合わせを自動化する。以下、図2〜図6を参照して、実施の形態に係る情報処理装置についてより詳細に説明する。
図2は、実施の形態に係る情報処理装置100の機能構成を模式的に示す図である。情報処理装置100は、撮影部2、画像取得部4、解答枠検出部6、正規化部8、区分け部10、数字特定部12、ユーザインタフェース14、通知部16、正誤確認部18、解答確認領域設定部20、および種類取得部22を備える。
図2は、実施の形態に係る情報処理装置100がナンバープレースの正誤判定処理を実現するための機能構成を示しており、その他の構成は省略している。図2において、さまざまな処理を行う機能ブロックとして記載される各要素は、ハードウェア的には、CPU(Central Processing Unit)、メインメモリ、その他のLSI(Large Scale Integration)で構成することができる。またソフトウェア的には、メインメモリにロードされたプログラムなどによって実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組み合わせによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。
以下本明細書において、情報処理装置100はスマートフォンであり、ナンバープレースの正誤判定機能は情報処理装置100が実行するプログラムによって実現されることを前提に説明する。しかしながら、情報処理装置100はスマートフォンに限られず、携帯電話、デスクトップPC(Personal Computer)、ノートPC、タブレットPC、ファブレット、ウェアラブルコンピュータ、ゲーム機、携帯テレビ、電子辞書、メインフレーム、あるいはクラウドコンピューティングを用いて実現されてもよい。
撮影部2は、手書きで解答したナンバープレースの解答用紙を撮像素子(不図示)に撮影させて解答画像を生成する。撮像素子は情報処理装置100に備えられているカメラモジュールであり、例えばCCD(Charge Coupled Device)イメージセンサやCMOS(Complementary Metal Oxide Semiconductor Image Sensor)等で実現できる。
画像取得部4は、手書きで解答したナンバープレースの解答済みの画像を取得する。なお、画像取得部4が取得する解答済みの画像は、撮影部2が生成した画像に限られない。この他にも、図示しないスキャナで読み込んだ解答済みの画像を取得してもよいし、ネットワークを介して解答済みの画像を取得してもよい。
図3は、画像取得部4が取得する解答済み画像の一例を示す図である。雑誌等に掲載されているナンバープレースの画像を撮影する場合、図3に示す例のように、解答枠がゆがんで撮像される場合もありうる。そこで解答枠検出部6は、画像取得部4が取得した解答済みの画像から、ナンバープレースの解答枠を検出する。解答枠検出部6による解答枠の検出処理は例えば2値化処理、エッジ抽出処理等の既知の画像処理技術を用いて実現できる。
ここで、解答枠検出部6が解答枠の検出に失敗した場合、撮影部2は、ナンバープレースの解答用紙を撮像素子に再撮影させてもよい。このとき、解答枠検出部6は、解答枠の検出に失敗したことをユーザインタフェース14を介してユーザに通知してもよい。
ユーザインタフェース14は、例えば情報処理装置100が備える図示しないタッチスクリーンや、スピーカ、マイク、カメラ等で実現される。解答枠検出部6は、解答枠の検出に失敗した場合、情報処理装置100のユーザにナンバープレースの解答用紙の全体が撮像されるように設置することを促すメッセージをユーザインタフェース14に表示したり、音声で案内したりする。これにより、ユーザが、例えばナンバープレースの解答用紙のゆがみを正したり、折りたたまれた解答用紙を伸ばしたりする等、解答枠検出部6が解答枠を検出しやすいようにする契機となる。これにより、ひとたび解答枠検出部6が解答枠の検出に失敗したとしても、再度の撮影によって解答枠の検出に成功する確率を向上することができる。
正規化部8は、解答枠検出部6が検出した解答枠が所定の形状および大きさとなるように画像を正規化する。限定はしないが、例として、正規化部8は、画像中の解答枠の外周が縦360ピクセル、横360ピクセルの大きさの正方形となるように、画像を変換する。これは例えば射影変換や、歪み補正等の既知の画像処理技術を用いて実現できる。
図4は、解答枠検出部6が検出した解答枠を正規化部8が正規化した結果の一例を示す図である。図4に示すように、解答枠の画像は2値化されており、解答枠の外周が正方形となるように変換されている。区分け部10は、正規化部8によって正規化された解答枠から、9行9列の81個の数字特定領域に区分けする。
上述したように、ナンバープレースの解答用紙は9×9の格子状の領域である。正規化部8は解答枠の外周が縦360ピクセル、横360ピクセルの大きさの正方形となるように正規化している。したがって、ひとつの数字特定領域の大きさは縦40ピクセル、横40ピクセルの正方形となる。
図5は、区分け部10が区分けした数字特定領域の画像の一例を示す図である。図5に示す例では、背景画像は黒色の画素で構成され、前景画像は白色の画素で構成されている。白色の画素で構成される画像が、数字として認識すべき認識対象のデータとなる。
例えば難易度の高いナンバープレースの解答画像には、場合によっては数字特定領域の中にメモ書きが存在することもある。図5に示す例は、そのようなメモ書きが存在する数字特定領域の画像の一例を示している。数字特定部12は、区分け部10によって区分けされた数字特定領域それぞれに1文字ずつ記載されている数字を特定する。
図6は、数字特定部12の機能構成を模式的に示す図である。数字特定部12は、候補領域設定部120、数字認識部122、および数字受付部124を含む。
候補領域設定部120は、区分け部10によって区分けされた数字特定領域それぞれの中から、数字が記載されている領域の候補である候補領域を設定する。図5に示すように、数字特定領域には認識すべき数字以外のメモ書きが存在する場合もある。そこで候補領域設定部120は、数字特定領域中のデータの中から、認識対象とするデータが存在する領域を候補領域として設定する。
一般に、ナンバープレースの解答枠に記載されるメモ書きは、真の解答である数字よりも小さな文字であると考えられる。そこで候補領域設定部120は、数字特定領域それぞれについて、ラベリング処理を実行する。ラベリング処理とは、前景画像のうち互いに隣接し連続する画素毎に同じラベル(例えば、通し番号)を割り当てる処理をいう。図5に示す例では、ラベリング処理によって4つの領域に分割される。候補領域設定部120は、連結する画素の数が最も多いラベルの要素を含む領域を、候補領域として設定する。これにより、数字特定領域中にメモ書きが存在する場合であっても、そのメモ書きを除去することができる。
メモ書きは認識対象とは異なるデータであり、数字認識の観点から見るといわばノイズデータといえる。候補領域設定部120が候補領域を設定することによってノイズデータが除去されるため、数字認識の精度を向上することができる。なお、数字特定領域中にメモ書きがない場合には、数字特定領域中の前景画像を含む領域のみがラベリングされる。このため、候補領域設定部120は前景画像をそのまま候補領域として設定することになる。
数字認識部122は、候補領域設定部120によって設定された候補領域に記載されている数字を認識する。数字認識部122が実行する数字認識は、k−NN法、SVM(Support Vector Machine)、ブースティング、ニューラルネットワーク等の機械学習手法など、既知の文字認識技術を用いて実現できる。また、数字認識部122が数字認識に用いる特徴量は、例えば候補領域における輪郭方向分布特徴量やSIFT−descriptor等、既知の特徴抽出技術を利用すればよい。
数字受付部124は、数字認識部122が数字の特定に失敗した場合、その旨をユーザインタフェース14を用いてユーザに通知する。数字受付部124はさらに、数字認識部122が数字の特定に失敗した場合は、ユーザインタフェース14を介してユーザから数字の入力を受け付ける。数字受付部124は、例えばタッチスクリーンにテンキーを表示してユーザに数字を入力させることで数字を取得する。あるいは数字受付部124は、ユーザに発声させた数字の音声をマイクで取得し、既知の音声認識技術を用いて数字を認識して取得してもよい。
このように、数字受付部124がユーザから数字を取得することにより、仮に81個の数字特定領域のうちいくつかの数字特定領域において数字認識部122が数字の認識に失敗したとても、それによってナンバープレースの正誤判定処理全体が停止することが回避できる。
ところで、ナンバープレースにはいくつかの種類があり、その種類によってナンバープレースを解答するためのルールが異なる。しかしながら、いずれのルールであっても、以下に記載する3つの基本ルールは共通であると仮定する。
ルール1:9行9列の81個の数字特定領域のうち、いずれの縦1列にも、1〜9までの数字が漏れなく重複なく入る。
ルール2:9行9列の81個の数字特定領域のうち、いずれの横1行にも、1〜9までの数字が漏れなく重複なく入る。
ルール3:9行9列の81個の数字特定領域のうち、所定の9個の数字特定領域をひとつの解答確認領域として定められる。いずれの解答確認領域にも、1〜9までの数字が漏れなく重複なく入る。
例えば、最も基本的なナンバープレースの解答用紙においては、9行9列の81個の数字特定領域は、図1にも例示すように、さらに3行3列の9個の数字特定領域からなる9つの部分領域に区切られる。この場合、上記ルール3における解答確認領域は、9つの3行3列の部分領域となる。この他、正方形以外の解答領域が設定され、それぞれの解答確認領域が異なる色で塗り分けられていたり、9行9列の81個の数字特定領域の対角線も、9までの数字が漏れなく重複なく入るというルールが追加されたりする。
そこで種類取得部22は、ナンバープレースのルールまたは種類を取得する。これは例えば種類取得部22が、ナンバープレースのルールに関する説明をユーザインタフェース14に表示し、ユーザに選択させることによって実現できる。あるいはナンバープレースの解答用紙に、そのナンバープレースの種類を特定するための情報(例えば、QRコード(登録商標)等)が記載されている場合には、種類取得部22がその情報を読み取ることでも実現できる。
解答確認領域設定部20は、種類取得部22が取得したナンバープレースのルールの情報を取得する。解答確認領域設定部20は、取得したナンバープレースのルールをもとに、区分け部10によって区分けされた81個の数字特定領域の中から、9個の数字特領域をひとつの解答確認領域として、複数の異なる解答確認領域を設定する。
正誤確認部18は、解答確認領域設定部20によって設定された複数の解答確認領域それぞれについて、1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認する。ここで「解答確認領域」は、正誤確認部18が1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認すべき領域である。したがって、上述したルール1における各列およびルール2における各行も、解答確認領域となる。
通知部16は、正誤確認部18による確認結果をユーザに通知する。具体的には、通知部16は、ナンバープレースが正しく解答されている場合にはその旨をユーザインタフェース14に表示したり、音声で通知したりする。ナンバープレースの解答が誤っている場合には、通知部16は誤っていることを示すメッセージをユーザインタフェース14に表示したり、音声で通知したりする。
図7は、実施の形態に係る情報処理装置100が実行するナンバープレースの正誤判定処理の流れを示すフローチャートである。本フローチャートにおける処理は、例えば情報処理装置100が、ナンバープレースの正誤判定処理を実現するためのプログラムを起動したときに開始する。
撮影部2は、手書きで解答したナンバープレースの解答用紙を撮像素子に撮影させて解答画像を生成する(S2)。画像取得部4は、撮影部2が生成したナンバープレースの解答画像を取得する(S4)。
解答枠検出部6は、画像取得部4が取得した解答画像中に写っているナンバープレースの解答枠を検出する(S6)。解答枠検出部6による解答枠の検出が失敗した場合(S8のN)、解答枠検出部6は、解答枠の検出に失敗した旨をユーザインタフェース14を介してユーザに通知する(S10)。
解答枠検出部6による解答枠の検出が成功した場合(S8のY)、正規化部8は、解答枠検出部6が検出した解答枠が、所定の形状および大きさ(例えば、縦360ピクセル、横360ピクセルの正方形)となるように、解答画像を正規化する(S12)。
区分け部10は、正規化部8が正規化した解答画像中の解答枠を、9行9列の81個の数字特定領域に区分けする(S14)。数字特定部12は、区分け部10が区分けした数字特定領域それぞれに1文字ずつ記載されている数字を特定する(S16)。
種類取得部22は、ユーザインタフェース14を介してユーザからナンバープレースのルールを取得する(S18)。解答確認領域設定部20は、種類取得部22が取得したルールの種類にしたがって、区分け部10が区分けした81個の数字特定領域の中から、9個の数字特領域をひとつの解答確認領域として、複数の異なる解答確認領域を設定する(S20)。
正誤確認部18は、解答確認領域設定部20が設定した複数の解答確認領域それぞれについて、1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認する(S22)。通知部16は、正誤確認部18による確認結果をユーザインタフェース14を介してユーザに通知する(S24)。通知部16が確認結果を通知すると、本フローチャートにおける処理は終了する。
図8は、実施の形態に係る数字特定部12が実行する数字特定処理の流れを説明するフローチャートであり、図7におけるステップS16をより詳細に説明する図である。
候補領域設定部120は、区分け部10が区分した数字特定領域のうち、数字が記載されている領域の候補である候補領域を設定する(S40)。数字認識部122は、候補領域設定部120が設定した候補領域に記載されている数字を1文字認識する(S42)。
数字認識部122が候補領域に記載されている数字の認識に失敗した場合(S46のN)、数字受付部124は、数字入力のためのインタフェースをユーザインタフェース14に表示する(S48)。数字入力のためのインタフェースは、例えばテンキーのGUI(Graphical User Interface)である。数字受付部124は、数字入力のインタフェースを介してユーザから数字の入力を受け付ける(S50)。数字認識部122が候補領域に記載されている数字の認識に成功した場合(S46のY)、数字受付部124はステップS48およびステップS50に記載した数字入力処理を実行しない。
全ての数字特定領域について上述したステップS40からステップS50までの数字認識処理が完了しない間(S52のN)、数字特定領域を変更しながらステップS40からステップS50までの数字認識処理を実行する。全ての数字特定領域について数字認識処理が完了すると(S52のY)、本フローチャートにおける処理は終了する。
以上説明したように、実施の形態に係る情報処理装置100は、手書きで解答したナンバープレースの正誤を判定することができる。特に、ナンバープレースの解答枠の認識や数字認識に失敗した場合はその旨をユーザに通知してユーザからのフィードバックを取得することにより、数字認識処理に失敗しても正誤判定処理を停止することなく実行することができる。
ナンバープレースの答え合わせは、基本的に1マスずつ確認しなければならず手間がかかる。また、ミスに気付かずに最後までいくこともしばしばあるため、答え合わせをしないというのも憚られる。実施の形態に係る情報処理装置100によれば、ナンバープレースの正誤判定を電子的に自動化することができるため、ナンバープレースの手書きでの解答の便益を向上することができる。さらに、数多くいると考えられる紙に印刷されたナンバープレースの問題を手書きで解くことを好むユーザのナンバープレースを解く意欲を向上することもできる。
以上、本発明を実施の形態をもとに説明した。これらの実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
上記の説明では、数字特定部12中の候補領域設定部120が、ラベリング処理によって分割された領域のうち、連結する画素の数が最も多いラベルの要素を含む領域を、認識対象とする候補領域として設定する場合について説明した。これに加えて、候補領域設定部120は、数字特定領域中の画素の色相や彩度を候補領域の設定に用いてもよい。
この場合、撮影部2がナンバープレースの解答用紙を撮影させる撮像素子として、カラー画像を撮影できる撮像素子を利用する。一般に、ナンバープレースの問題として最初から印刷されている数字は、ユーザが解答のために用いる筆記用具で記載した文字と色相や彩度が異なる。例えば、ナンバープレースの問題として最初から印刷されている数字は濃い黒色であるが、ユーザが解答に用いる鉛筆で書いた文字は薄いグレーである場合、それらの彩度に差異が生じる。あるいは、ナンバープレースの問題として最初から印刷されている数字の文字色と、ユーザが解答に用いるペンのインクの色が異なるかもしれない。また、ナンバープレースの問題として最初から数字が印刷されている領域の背景色は、他の領域の背景色とは異なる場合もある。
そこで候補領域設定部120は、まず数字特定領域中の画素の色相や彩度を利用して、印刷文字と手書き文字とをクラスタリングする。一般に、メモ書きは手書き文字が記載されている数字特定領域に含まれると考えられる。このため、候補領域設定部120が実行するラベリング処理によって複数のラベルが割り当てられる数字特定領域を含む方が、手書き文字のクラスタと推定することができる。
あるいはまた、印刷されているナンバープレースの解答枠の色と、問題として最初から印刷されている数字の色とが同一か、少なくとも類似する同系統の色である場合には、候補領域設定部120は、色情報を用いて印刷文字と手書き文字とをクラスタリングしてもよい。より具体的には、候補領域設定部120は、解答枠検出部6が検出した解答枠の位置を取得し、取得した位置情報をもとに解答枠の色相を検出する。続いて候補領域設定部120は、数字特定領域中の画素の色相と解答枠の色相とを比較する。これにより、候補領域設定部120は、解答枠の色相に近い色相を持つ画素を持つ数字特定領域を含むクラスタを、印刷文字のクラスタと推定することができる。
文字を印刷文字と手書き文字とにクラスタリングした場合、手書き文字用の文字認識エンジンと、印刷文字用の文字認識エンジンとを別に用意してもよい。一般に、同じ数字であっても印刷文字と手書き文字とは異なる形状となるため、それぞれ専用の認識エンジンを用意することにより、文字認識の精度をより高めることができる。
なお、本発明の実施の形態は、以下の項目によって特定されてもよい。
[項目1]
手書きで解答したナンバープレースの画像を取得する画像取得部4と、
取得した画像から、ナンバープレースの解答枠を検出する解答枠検出部6と、
検出した解答枠が所定の形状および大きさとなるように画像を正規化する正規化部8と、
正規化された解答枠から、9行9列の81個の数字特定領域に区分けする区分け部10と、
区分けされた数字特定領域それぞれに1文字ずつ記載されている数字を特定する数字特定部12と、
区分けされた81個の数字特定領域の中から、9個の数字特領域をひとつの解答確認領域として、複数の異なる解答確認領域を設定する解答確認領域設定部20と、
設定された複数の解答確認領域それぞれについて、1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認する正誤確認部18と、
確認結果を通知する通知部16とを備えることを特徴とする情報処理装置100。
[項目2]
ナンバープレースのルールを取得する種類取得部22をさらに備え、
前記解答確認領域設定部20は、取得したナンバープレースのルールをもとに、解答確認領域を設定することを特徴とする項目1に記載の情報処理装置100。
[項目3]
前記数字特定部12は、
数字特定領域に記載されている数字を認識する数字認識部122と、
前記数字認識部122が数字の特定に失敗した場合、ユーザから数字の入力を受け付ける数字受付部124を備えることを特徴とする項目1または2に記載の情報処理装置100。
[項目4]
前記数字特定部12は、
区分けされた数字特定領域それぞれの中から、数字が記載されている領域の候補である候補領域を設定する候補領域設定部120とをさらに備え、
前記数字認識部122は、設定された候補領域に記載されている数字を認識することを特徴とする項目3に記載の情報処理装置100。
[項目5]
手書きで解答したナンバープレースの解答用紙を撮像素子に撮影させて解答画像を生成する撮影部2をさらに備え、
前記撮影部2は、前記解答枠検出部6が解答枠の検出に失敗した場合、前記解答用紙を前記撮像素子に再撮影させることを特徴とする項目1から4のいずれかに記載の情報処理装置100。
[項目6]
プロセッサがナンバープレースの正誤判定処理を実行する情報処理方法であって、前記正誤判定処理は、
手書きで解答したナンバープレースの画像を取得する画像取得ステップと、
取得した画像から、ナンバープレースの解答枠を検出する解答枠検出ステップと、
検出した解答枠が所定の形状および大きさとなるように画像を正規化する正規化ステップと、
正規化された解答枠から、9行9列の81個の数字特定領域に区分けする区分けステップと、
区分けされた数字特定領域それぞれに1文字ずつ記載されている数字を特定する数字特定ステップと、
区分けされた81個の数字特定領域の中から、9個の数字特領域をひとつの解答確認領域として、複数の異なる解答確認領域を設定する解答確認領域設定ステップと、
設定された複数の解答確認領域それぞれについて、1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認する正誤確認ステップと、
確認結果を通知する通知機能とを含むことを特徴とする情報処理方法。
[項目7]
コンピュータにナンバープレースの正誤判定機能を実現させるプログラムを格納した記録媒体であって、前記正誤判定機能は、
手書きで解答したナンバープレースの画像を取得する画像取得機能と、
取得した画像から、ナンバープレースの解答枠を検出する解答枠検出機能と、
検出した解答枠が所定の形状および大きさとなるように画像を正規化する正規化機能と、
正規化された解答枠から、9行9列の81個の数字特定領域に区分けする区分け機能と、
区分けされた数字特定領域それぞれに1文字ずつ記載されている数字を特定する数字特定機能と、
区分けされた81個の数字特定領域の中から、9個の数字特領域をひとつの解答確認領域として、複数の異なる解答確認領域を設定する解答確認領域設定機能と、
設定された複数の解答確認領域それぞれについて、1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認する正誤確認機能と、
確認結果を通知する通知機能とを含むことを特徴とするコンピュータが読み出し可能な記録媒体。
2 撮影部、 4 画像取得部、 6 解答枠検出部、 8 正規化部、 10 区分け部、 12 数字特定部、 14 ユーザインタフェース、 16 通知部、 18 正誤確認部、 20 解答確認領域設定部、 22 種類取得部、 100 情報処理装置、 120 候補領域設定部、 122 数字認識部、 124 数字受付部。

Claims (5)

  1. コンピュータにナンバープレースの正誤判定機能を実現させるプログラムであって、前記正誤判定機能は、
    手書きで解答したナンバープレースの画像を取得する画像取得機能と、
    取得した画像から、ナンバープレースの解答枠を検出する解答枠検出機能と、
    検出した解答枠が所定の形状および大きさとなるように画像を正規化する正規化機能と、
    正規化された解答枠から、9行9列の81個の数字特定領域に区分けする区分け機能と、
    区分けされた数字特定領域それぞれに1文字ずつ記載されている数字を特定する数字特定機能と、
    区分けされた81個の数字特定領域の中から、9個の数字特領域をひとつの解答確認領域として、複数の異なる解答確認領域を設定する解答確認領域設定機能と、
    設定された複数の解答確認領域それぞれについて、1から9までの数字が漏れなくかつ重複なく特定されているか否かを確認する正誤確認機能と、
    確認結果を通知する通知機能とを含むことを特徴とするプログラム。
  2. 前記正誤判定機能は、
    ナンバープレースのルールを取得する種類取得機能をさらに備え、
    前記解答確認領域設定機能は、取得したナンバープレースのルールをもとに、解答確認領域を設定することを特徴とする請求項1に記載のプログラム。
  3. 前記数字特定機能は、
    数字特定領域に記載されている数字を認識する数字認識機能と、
    前記数字認識機能による数字の特定に失敗した場合、ユーザから数字の入力を受け付ける数字受付機能を含むことを特徴とする請求項1または2に記載のプログラム。
  4. 前記数字特定機能は、
    区分けされた数字特定領域それぞれの中から、数字が記載されている領域の候補である候補領域を設定する候補領域設定機能とをさらに含み、
    前記数字認識機能は、設定された候補領域に記載されている数字を認識することを特徴とする請求項3に記載のプログラム。
  5. 前記正誤判定機能は、
    手書きで解答したナンバープレースの解答用紙を撮像素子に撮影させて解答画像を生成する撮影機能をさらに含み、当該撮影機能は、前記解答枠検出機能による解答枠の検出に失敗した場合、前記解答用紙を撮像素子に再撮影させることを特徴とする請求項1から4のいずれかに記載のプログラム。
JP2014195602A 2014-09-25 2014-09-25 プログラム Active JP6348038B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014195602A JP6348038B2 (ja) 2014-09-25 2014-09-25 プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014195602A JP6348038B2 (ja) 2014-09-25 2014-09-25 プログラム

Publications (2)

Publication Number Publication Date
JP2016066302A JP2016066302A (ja) 2016-04-28
JP6348038B2 true JP6348038B2 (ja) 2018-06-27

Family

ID=55804194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014195602A Active JP6348038B2 (ja) 2014-09-25 2014-09-25 プログラム

Country Status (1)

Country Link
JP (1) JP6348038B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2848926B2 (ja) * 1990-06-29 1999-01-20 株式会社リコー 画像生成装置
JPH09114918A (ja) * 1995-10-18 1997-05-02 Oki Electric Ind Co Ltd 光学式文字読取装置
JP4843991B2 (ja) * 2005-04-26 2011-12-21 大日本印刷株式会社 パズル作成支援装置及びパズル作成支援プログラム

Also Published As

Publication number Publication date
JP2016066302A (ja) 2016-04-28

Similar Documents

Publication Publication Date Title
US10713528B2 (en) System for determining alignment of a user-marked document and method thereof
US8958643B2 (en) Recognition of numerical characters in digital images
CN110008944A (zh) 基于模板匹配的ocr识别方法及装置、存储介质
CN109446873A (zh) 手写字体识别方法、系统以及终端设备
JPWO2017141802A1 (ja) 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体
CN111062377B (zh) 一种题号检测方法、系统、存储介质及电子设备
CN112200230A (zh) 一种训练板的识别方法、装置及机器人
CN111753715A (zh) 点读场景下试题拍摄的方法、装置、电子设备和存储介质
Wicht et al. Camera-based sudoku recognition with deep belief network
JP5940615B2 (ja) 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置
JP6348038B2 (ja) プログラム
WO2016117564A1 (ja) プログラム、情報記憶媒体及び認識装置
Kleber et al. Robust skew estimation of handwritten and printed documents based on grayvalue images
de Assis Zampirolli et al. Automatic correction of multiple-choice tests using digital cameras and image processing
Cutter et al. Improving the accessibility of mobile OCR apps via interactive modalities
CN114241486A (zh) 一种提高识别试卷学生信息准确率的方法
Li et al. A platform for creating Smartphone apps to enhance Chinese learning using augmented reality
CN112686253A (zh) 一种用于电子白板的屏幕文字提取系统及方法
Rachchh et al. Inclusion of vertical bar in the OMR sheet for image-based robust and fast OMR evaluation technique using mobile phone camera
JP5913763B1 (ja) 基準線設定装置、基準線設定方法及び基準線設定プログラム
Friedman et al. Icon scanning: Towards next generation QR codes
JP2022045168A (ja) 画像処理装置、制御方法及び制御プログラム
CN112115907B (zh) 固定版面证件结构化信息提取方法、装置、设备及介质
Nguyen et al. A lightweight and effective music score recognition on mobile phones
WO2022024835A1 (ja) 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170623

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180530

R150 Certificate of patent or registration of utility model

Ref document number: 6348038

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250