JP6907565B2 - 画像処理装置および画像処理プログラム - Google Patents
画像処理装置および画像処理プログラム Download PDFInfo
- Publication number
- JP6907565B2 JP6907565B2 JP2017017421A JP2017017421A JP6907565B2 JP 6907565 B2 JP6907565 B2 JP 6907565B2 JP 2017017421 A JP2017017421 A JP 2017017421A JP 2017017421 A JP2017017421 A JP 2017017421A JP 6907565 B2 JP6907565 B2 JP 6907565B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character string
- region
- recorded
- manuscript
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある前記第1の領域に対応づけられている文字列を特定する文字列特定部とを備え、
前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視することを特徴とする画像処理装置である。
前記文字列認識部が、認識した個々の文字の中の、1点もしくは複数点の座標で表現された領域であることを含む領域どうしが互いに重なっていることを含む予め定められた第2の閾値以内にある複数の領域に含まれる複数の文字を、1つの文字列として認識し、前記第1の画像上の、文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む該領域を、前記第1の領域として該文字列に対応付けることを特徴とする請求項1に記載の画像処理装置である。
前記文字列特定部が、前記第2の領域に対し該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある領域が存在しない場合は、該第2の領域に対応しては文字列を特定しないことを特徴とする請求項1または2に記載の画像処理装置である。
前記文字列認識部は、前記第1の画像が罫線を含む画像の場合に、該罫線で囲まれた領域ごとに文字列を認識するものであることを特徴とする請求項1から3のうちのいずれか1項に記載の画像処理装置である。
プログラムを実行する情報処理装置内で実行されて、該情報処理装置を、
第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある前記第1の領域に対応づけられている文字列を特定する文字列特定部とを備え、
前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視する画像処理装置として動作させることを特徴とする画像処理プログラムである。
さらに、請求項1の画像処理装置によれば、本来1つの第2の領域として認識すべき基になった図形等が掠れ等により複数に分かれていて複数の第2の領域として認識されても、文字列の正しい特定が可能となる。
ここで、本実施形態の文字列認識部62は、文字列の認識に加え、認識した文字列ごとに、未記入原稿上の、その文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域をその文字列に対応付ける。この文字列に対応付ける「第1の領域」は、1点の座標あるいは領域の4隅の座標などで代表させたものであってもよい。
また、本実施形態の文字列認識部62はさらに、認識した個々の文字の、1点もしくは複数点の座標で表現された領域であることを含む領域どうしが予め定められた第2の位置関係(第1の位置関係については後述する)にある複数の文字を1つの文字列として認識する。その場合、未記入原稿上の、その文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む領域を第1の領域として、その文字列に対応付ける。この「第2の位置関係」としては、一例として、予め定められた第2の閾値距離以内で互いに左右に並んでいる、という位置関係が採用される。
さらには、本実施形態の文字列認識部62は、未記入原稿に罫線が描かれている場合には、その罫線で囲まれた領域ごとに文字列を認識する。罫線が描かれている場合は、その罫線を文字列の認識に利用したほうが認識率が向上することが期待されるからである。
また、追加記録画像抽出部63は、記入済原稿の中から、未記入原稿に対し追加記録された画像である追加記録画像を抽出する。ここでは、具体的には、例えば、記録済原稿と未記入原稿との差分の画像を算出することにより、追加記録された回答の画像である追加記録画像を抽出する。
ここで、本実施形態における文字列特定部64は、上記の第2の領域に対し予め定められた第1の位置関係にある第1の領域を特定し、その第1の領域に対応付けられている文字列を特定する。ここでは、一例として、「第2の領域に重なっている第1の領域が存在する場合、あるいは、第2の領域に重なっている第1の領域が存在しなくても、その第2の領域に対し予め定められた第1の閾値距離以内であってその第2の領域の右に並ぶ第1の領域が存在する場合に、その第1の領域が、「第2の領域に対し予め定められた第1の位置関係にある」第1の領域として特定される。
また、本実施形態における文字列特定部64は、複数の第2の領域に対応して、同一の第1の領域に対応付けられた同一の文字列が特定されたときは、同一の第1の領域に対応付けられた同一の文字列についての複数回の特定のうちの1回の特定を除く残りの特定において特定された同一の文字列を無視する。例えば、本実施形態における文字列特定部64は、複数の第2の領域に対応して、同一の第1の領域に記録されていた同一の文字列が複数回にわたって特定されたときは、最初の1回目を除き2回目以降に特定された同一の文字列を無視する。
さらに、本実施形態における文字列特定部64は、第2の領域に対し上記の第1の位置関係にある第1の領域が存在しない場合は、その第2の領域に対応しては文字列を特定しない。無理に特定すると誤認識が増えるからである。
ここで、図4(A)は、記入前のアンケート用紙、すなわち未記入原稿51Aを表している。ここでは、アンケート内容として(1)〜(3)の3つの設問があり、それら3つの設問に対する回答は、1〜5の数字のうちのいずれか1つの数字を○印で囲うことによりその数字を選択する方式のものである。
図4の場合と同様、図5(A)は、記入前のアンケート用紙、すなわち未記入原稿51Bを表している。また、図5(B)は、図5(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52Bを表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
図4,図5の場合と同様、図6(A)は、記入前のアンケート用紙、すなわち未記入原稿51Cを表している。また、図6(B)は、図6(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52Cを表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
図4〜図6の場合と同様、図7(A)は、記入前のアンケート用紙、すなわち未記入原稿51Dを表している。また、図7(B)は、図7(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52Dを表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
図12は、図3に1つのステップ(ステップS09)で示した文字認識処理の詳細フローを示した図である。
図13は、差分画像の一例を示した図である。
この図13に示す差分画像53Aは、図4(A)に示す未記入原稿51Aと、図4(B)に示す記入済原稿52Aのうちの一番上の1枚の記入済原稿との間の差分画像である。この差分画像53Aには、回答者によって記入された、3つの○印521,522,523が抽出される。この差分画像上に現れた追加記録画像は、本発明にいう追加記録画像の一例に相当する。また、ここでは、追加記録画像を構成している1つ1つの画像を個別追加記録画像と称する。ここで、○印521に関しては、記入時の掠れ等により、2つの部分521a,521bに分かれている。このため、2つの部分521a,521bの各々が個別追加記録画像となる。
図12に戻って説明を続ける。
図13に例示するような差分画像を生成すると(ステップS21)、次に、差分画像を左上から右下に向かって検査していき(ステップS22)、個別追加記録画像を見つけたら、その見つけた1つの個別追加記録画像を取り出す(ステップS23)。そして、今回対象としている差分画像上に未処理の個別追加記録画像が無くなるまで(ステップS24)、以下の処理を繰り返す。
ここでは先ず、領域算出処理が行われる(ステップS25)。この領域算出処理は、ステップS23で取り出した1つの個別追加記録画像の記入済原稿上の領域(第2の領域)を算出する処理である。本実施形態では、この第2の領域の算出にあたり、図9に示した、未記入原稿上の第1の領域の算出方法と同じ算出方法が採用されている。すなわち、ここでは、ステップS23で取り出した1つの個別追加記録画像に外接する長方形Rが算出され、その長方形Rがその個別追加記録画像に対応する第2の領域として、その個別追加記録画像に対応付けられる。あるいは、これも第1の領域の場合と同様、その長方形Rの4隅の座標のセット、もしくは、その長方形Rの中心座標を第2の領域としてもよい。
1つの個別追加記録画像に対応する第2の領域が算出されると(ステップS25)、次に、文字列特定処理が行われる(ステップS26)。
例えば、図13に示す○印521は、その○印の記入時の掠れ等により、2つの部分521a,521bに分かれている。このため、各部分521a,521bのそれぞれが1つずつの個別追加記録画像として認識されることが有り得る。その場合、それら2つの部分521a,521bで同じ座標の同じ文字列(ここでは図4に示す数字の「3」)が特定される。図12のステップS27は、このような場合に、2度目以降に特定された同一の第1の領域の同一の文字列は不要なので、2度目以降に特定された同一の第1の領域の同一の文字列は無視される。
ステップS27において、これまでとは別の第1の領域の文字列が特定されたときは、その特定された文字列が保存される(ステップS28)。
ここでは以上の処理が、1枚の差分画像上の個別追加記録画像の1つ1つについて実行され(ステップS22,S23)、その1枚の差分画像上の全ての個別追加記録画像についての処理が終了すると(ステップS24)、その1枚の差分画像についての、図12に示す処理、すなわち、図3にステップS09として示す文字認識処理が終了し、未処理の次の記入済原稿に関する文字認識処理に移行する(図3のステップS07)。そして、全ての記入済原稿に関する文字認識処理が終了すると(図3のステップS08)、画像処理ルーチンの今回の実行を終了する。
このように、本実施形態によれば、マークシートのマークの各位置ごとに、その位置のマークが何を意味しているか、という情報を予めインプットしておくといったような事前設定なしに、回答者の回答を認識することができる。
20 スキャナ
21 原稿トレイ
22 排紙トレイ
23 上蓋
30 ノート型パーソナルコンピュータ(ノートPC)
31 表示画面
32 キーボード
51A,51B,51C,51D 未記入原稿
52A,52B,52C,52D 記入済原稿
53A 差分画像
521,522,523 ○印
551,552 個別追加記録画像
60 画像処理装置
61 画像取得部
62 文字列認識部
63 追加記録画像抽出部
64 文字列特定部
Claims (5)
- 第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに、該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある前記第1の領域に対応づけられている文字列を特定する文字列特定部とを備え、
前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視することを特徴とする画像処理装置。 - 前記文字列認識部が、認識した個々の文字の中の、1点もしくは複数点の座標で表現された領域であることを含む領域どうしが互いに重なっていることを含む予め定められた第2の閾値以内にある複数の領域に含まれる複数の文字を、1つの文字列として認識し、前記第1の画像上の、文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む該領域を、前記第1の領域として該文字列に対応付けることを特徴とする請求項1に記載の画像処理装置。
- 前記文字列特定部が、前記第2の領域に対し該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある領域が存在しない場合は、該第2の領域に対応しては文字列を特定しないことを特徴とする請求項1または2に記載の画像処理装置。
- 前記文字列認識部は、前記第1の画像が罫線を含む画像の場合に、該罫線で囲まれた領域ごとに文字列を認識するものであることを特徴とする請求項1から3のうちのいずれか1項に記載の画像処理装置。
- プログラムを実行する情報処理装置内で実行されて、該情報処理装置を、
第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある第1の領域に対応づけられている文字列を特定する文字列特定部とを備え、
前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視する画像処理装置として動作させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017017421A JP6907565B2 (ja) | 2017-02-02 | 2017-02-02 | 画像処理装置および画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017017421A JP6907565B2 (ja) | 2017-02-02 | 2017-02-02 | 画像処理装置および画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018124854A JP2018124854A (ja) | 2018-08-09 |
JP6907565B2 true JP6907565B2 (ja) | 2021-07-21 |
Family
ID=63109614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017017421A Active JP6907565B2 (ja) | 2017-02-02 | 2017-02-02 | 画像処理装置および画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6907565B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112639818B (zh) * | 2018-08-27 | 2024-06-04 | 京瓷办公信息系统株式会社 | Ocr系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3294995B2 (ja) * | 1996-06-21 | 2002-06-24 | 三菱電機株式会社 | 帳票読取装置 |
JP2002207955A (ja) * | 2001-01-05 | 2002-07-26 | Sharp Corp | 情報入力支援システム |
JP4873138B2 (ja) * | 2006-06-21 | 2012-02-08 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP2013218364A (ja) * | 2012-04-04 | 2013-10-24 | Canon Inc | 画像処理システム |
-
2017
- 2017-02-02 JP JP2017017421A patent/JP6907565B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018124854A (ja) | 2018-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8155443B2 (en) | Image extracting apparatus, image extracting method and computer readable medium | |
US20070242882A1 (en) | Image processing apparatus for identifying the position of a process target within an image | |
US8391607B2 (en) | Image processor and computer readable medium | |
US8897574B2 (en) | Image processing apparatus, line detection method, and computer-readable, non-transitory medium | |
US9626738B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP4807489B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
CN111950557A (zh) | 错题处理方法、图像形成装置及电子设备 | |
JP4655824B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラム | |
JP2022074466A (ja) | 画像処理装置および画像形成装置 | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
JP6474504B1 (ja) | 手書文字認識システム | |
JP6907565B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2007005950A (ja) | 画像処理装置及びネットワークシステム | |
JP6662023B2 (ja) | 画像処理装置および画像処理プログラム | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
JP2017174031A (ja) | 画像処理装置及び画像処理プログラム | |
JP4807487B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
US7865130B2 (en) | Material processing apparatus, material processing method, and material processing program product | |
JP6888299B2 (ja) | 画像処理装置および画像処理プログラム | |
JP4894184B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
US20230394228A1 (en) | Image processing apparatus and image forming apparatus | |
CN110909723A (zh) | 信息处理装置及存储介质 | |
JP7516170B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP7457903B2 (ja) | 画像処理装置 | |
US11659106B2 (en) | Information processing apparatus, non-transitory computer readable medium, and character recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210614 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6907565 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |