JP6907565B2 - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JP6907565B2
JP6907565B2 JP2017017421A JP2017017421A JP6907565B2 JP 6907565 B2 JP6907565 B2 JP 6907565B2 JP 2017017421 A JP2017017421 A JP 2017017421A JP 2017017421 A JP2017017421 A JP 2017017421A JP 6907565 B2 JP6907565 B2 JP 6907565B2
Authority
JP
Japan
Prior art keywords
image
character string
region
recorded
manuscript
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017017421A
Other languages
English (en)
Other versions
JP2018124854A (ja
Inventor
猪股 浩司郎
浩司郎 猪股
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2017017421A priority Critical patent/JP6907565B2/ja
Publication of JP2018124854A publication Critical patent/JP2018124854A/ja
Application granted granted Critical
Publication of JP6907565B2 publication Critical patent/JP6907565B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、画像処理装置および画像処理プログラムに関する。
官公庁等に提出する書類や様々なアンケート用紙への記入等、印字された用紙(帳票やアンケート用紙等)に手書きで記入して提出する機会が多い。記入された用紙を集める側は、記入済のアンケート用紙等を自動で読み取って集計したいという要求がある。
その要求に対し、特許文献1には、マークシートのように塗りつぶして回答する種類の帳票について、回答が記入されたマークシートをスキャナ等で読み取って集計する技術が開示されている。
特開平2013―45309号公報
しかしながら、上掲の特許文献1に開示された技術の場合、マークシートに記入されているマークの位置を検出することはできるが、その位置に記入されたマークが何を意味しているかは、別途の情報として事前設定しておく必要がある。
本発明は、特定された位置に対応する文字情報を、文字と文字の位置とを予め対応づけて設定する作業を必要とすることなく認識する画像処理装置および画像処理プログラムを提供することを目的とする。
請求項1は、
第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある前記第1の領域に対応づけられている文字列を特定する文字列特定部とを備え、
前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視することを特徴とする画像処理装置である。
請求項は、
前記文字列認識部が、認識した個々の文字の中の、1点もしくは複数点の座標で表現された領域であることを含む領域どうしが互いに重なっていることを含む予め定められた第2の閾値以内にある複数の領域に含まれる複数の文字を、1つの文字列として認識し、前記第1の画像上の、文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む領域を、前記第1の領域として該文字列に対応付けることを特徴とする請求項に記載の画像処理装置である。
請求項は、
前記文字列特定部が、前記第2の領域に対し該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある領域が存在しない場合は、該第2の領域に対応しては文字列を特定しないことを特徴とする請求項またはに記載の画像処理装置である。
請求項4は、
前記文字列認識部は、前記第1の画像が罫線を含む画像の場合に、該罫線で囲まれた領域ごとに文字列を認識するものであることを特徴とする請求項からのうちのいずれか1項に記載の画像処理装置である。
請求項5は、
プログラムを実行する情報処理装置内で実行されて、該情報処理装置を、
第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある前記第1の領域に対応づけられている文字列を特定する文字列特定部とを備え、
前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視する画像処理装置として動作させることを特徴とする画像処理プログラムである。
請求項1の画像処理装置および請求項の画像処理プログラムによれば、特定された位置に対応する文字情報を、文字と文字の位置とを予め対応づけて設定する作業を必要とすることなく認識することができる。
また、請求項の画像処理装置によれば、予め定められた第1の閾値以内にある第1の領域という概念なしに文字列を特定する場合と比べ、文字列をより正確に特定することができる。
さらに、請求項1の画像処理装置によれば、本来1つの第2の領域として認識すべき基になった図形等が掠れ等により複数に分かれていて複数の第2の領域として認識されても、文字列の正しい特定が可能となる。
請求項の画像処理装置によれば、1つの第2の領域に対応する文字列が複数の文字からなる文字列であっても、その複数の文字からなる文字列を特定することができる。
請求項の画像処理装置によれば、全ての第2の領域について文字列を特定する場合と比べ、誤認識が抑制される。
請求項の画像処理装置によれば、罫線が記録されていても罫線を利用せずに座標を認識する場合と比べ、文字列をより正確に認識することができる。
文字認識システムの模式図である。 ノートPC内での画像処理プログラムの実行により実現する画像処理装置の機能ブロック図である。 本発明の一実施形態としての画像処理プログラムのフローチャートを示した図である。 未記入原稿と記入済原稿の第1例を示した図である。 未記入原稿と記入済原稿の第2例を示した図である。 未記入原稿と記入済原稿の第3例を示した図である。 未記入原稿と記入済原稿の第4例を示した図である。 未記入原稿上の文字列および領域認識処理のフローチャートを示した図である。 認識された文字に対応づけられる第1の領域の算出方法を示した図である。 罫線が描かれている原稿の一部を示した図である。 罫線を利用した第1の領域どうしの結合例を示した図である。 図3に1つのステップ(ステップS09)で示した文字認識処理の詳細フローを示した図である。 差分画像の一例を示した図である。 文字列特定処理の詳細フローを示した図である。 第2の領域と第1の領域が重なっている例を示した図である。 第2の領域の右側に第1の領域が存在している例を示した図である。
以下、本発明の実施の形態について説明する。
図1は、文字認識システムの模式図である。
ここに示す文字認識システム10は、スキャナ20とノート型パーソナルコンピュータ(以下、「ノートPC」と略記する)30とを備えている。スキャナ20とノートPC30との間は、通信ケーブル40で接続されている。
スキャナ20は、原稿に記録されている画像を読み取って画像データを生成する装置である。このスキャナ20の原稿トレイ21上に原稿を置き、スタートボタン(不図示)を押すと、あるいは、ノートPCから指示を与えると、原稿が1枚、スキャナ20内に送り込まれる。スキャナ20内には原稿上の画像を光電的に読み取るセンサ(不図示)が備えられていて、スキャナ20内に送り込まれた原稿から、その原稿上に記録されている画像が光電的に読み取られて画像データが生成される。記録されている画像が読み取られた後の原稿は、排紙トレイ22上に排出される。この原稿トレイ21には複数枚の原稿を積み重ねて載置することができ、スキャナ20は、原稿トレイ21上の複数枚の原稿を1枚ずつ順次にスキャナ20内に送り込み、その送り込まれた原稿上の画像を読み取り、排紙トレイ22上に排出する。
また、このスキャナ20は、背面側に設けられた左右に延びるヒンジ(不図示)を回転中心として上蓋23を持ち上げることができる。この上蓋23を持ち上げてその下に原稿を1枚置き、上蓋23を閉じて、その置かれた原稿を読み取ることもできる。
このスキャナ20での読み取りにより得られた画像データは、通信ケーブル40を経由してノートPC30に入力される。
ノートPC30は、表示画面31やキーボード32を備えており、また、その内部には、プログラムを実行するためのCPUやメモリ等の設備を備えている。このノートPC30ではプログラムが実行されて、その実行されたプログラムに応じた処理が行われる。本実施形態に対応しては、このノートPCでは、後述する画像処理プログラムが実行される。このノートPC30内で実行される画像処理プログラムは、本発明の画像処理プログラムの一例に相当する。そして、このノートPC30は、この画像処理プログラムの実行により、本発明の一実施形態としての画像処理装置として動作する。
図2は、ノートPC内での画像処理プログラムの実行により実現する画像処理装置の機能ブロック図である。
本実施形態の画像処理装置60は、画像取得部61と、文字列認識部62と、追加記録画像抽出部63と、文字列特定部64とを有する。具体的な実施形態の例示は後回しにして、ここでは、各部61〜64について概括的に説明する。なお、ここでは、データ上の画像を取り扱っており、したがって、ここでは、特に区別する必要がある場合を除き、データ上の画像であっても、データ上の画像であることを特に明記することなく、単に「画像」あるいは「原稿」と称することがある。
画像取得部61は、アンケートの設問としての文字が記録されていてその設問に対する回答が未記入の未記入原稿の画像と、その未記入原稿に回答が追加記録された記入済原稿の画像とを取得する。未記入原稿は1枚であるが、記入済原稿は通常は複数枚存在し、画像取得部61は、それら全ての画像を取得する。これら未記入原稿および記入済原稿は、本発明にいう、それぞれ第1の画像および第2の画像の各一例に相当する。
また、文字列認識部62は、未記入原稿から、1文字であることを含む文字列を認識する。ここでいう「文字列」は、複数文字からなる文字列だけでなく、1文字のみからなるものも含む概念である。
ここで、本実施形態の文字列認識部62は、文字列の認識に加え、認識した文字列ごとに、未記入原稿上の、その文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域をその文字列に対応付ける。この文字列に対応付ける「第1の領域」は、1点の座標あるいは領域の4隅の座標などで代表させたものであってもよい。
また、本実施形態の文字列認識部62はさらに、認識した個々の文字の、1点もしくは複数点の座標で表現された領域であることを含む領域どうしが予め定められた第2の位置関係(第1の位置関係については後述する)にある複数の文字を1つの文字列として認識する。その場合、未記入原稿上の、その文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む領域を第1の領域として、その文字列に対応付ける。この「第2の位置関係」としては、一例として、予め定められた第2の閾値距離以内で互いに左右に並んでいる、という位置関係が採用される。
さらには、本実施形態の文字列認識部62は、未記入原稿に罫線が描かれている場合には、その罫線で囲まれた領域ごとに文字列を認識する。罫線が描かれている場合は、その罫線を文字列の認識に利用したほうが認識率が向上することが期待されるからである。
また、追加記録画像抽出部63は、記入済原稿の中から、未記入原稿に対し追加記録された画像である追加記録画像を抽出する。ここでは、具体的には、例えば、記録済原稿と未記入原稿との差分の画像を算出することにより、追加記録された回答の画像である追加記録画像を抽出する。
ここで、本実施形態における追加画像抽出部63は、追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、記入済原稿上の、その個別追加記録画像が記録されていた記入済原稿上の、1点もしくは複数点の座標で表現された領域であることを含む領域を抽出する。ここでは、この抽出された記入済原稿上の領域を、上記の第1の領域と区別して、「第2の領域」と称する。この第2の領域は、本発明にいう第2の領域の一例に相当する。なお、「第2の領域」は未記入原稿と記入済原稿との位置合わせをした上で同一の座標系で抽出するのがよい。また、「第2の領域」は、例えば1点の座標として表現され、あるいは4点の座標の集まりとして表現されてもよい。
さらに、文字列特定部64は、文字列認識部62で認識された文字列の中から、未記入原稿上の、追加記録画像に対応する領域に記録された文字列を特定する。
ここで、本実施形態における文字列特定部64は、上記の第2の領域に対し予め定められた第1の位置関係にある第1の領域を特定し、その第1の領域に対応付けられている文字列を特定する。ここでは、一例として、「第2の領域に重なっている第1の領域が存在する場合、あるいは、第2の領域に重なっている第1の領域が存在しなくても、その第2の領域に対し予め定められた第1の閾値距離以内であってその第2の領域の右に並ぶ第1の領域が存在する場合に、その第1の領域が、「第2の領域に対し予め定められた第1の位置関係にある」第1の領域として特定される。
また、本実施形態における文字列特定部64は、複数の第2の領域に対応して、同一の第1の領域に対応付けられた同一の文字列が特定されたときは、同一の第1の領域に対応付けられた同一の文字列についての複数回の特定のうちの1回の特定を除く残りの特定において特定された同一の文字列を無視する。例えば、本実施形態における文字列特定部64は、複数の第2の領域に対応して、同一の第1の領域に記録されていた同一の文字列が複数回にわたって特定されたときは、最初の1回目を除き2回目以降に特定された同一の文字列を無視する。
さらに、本実施形態における文字列特定部64は、第2の領域に対し上記の第1の位置関係にある第1の領域が存在しない場合は、その第2の領域に対応しては文字列を特定しない。無理に特定すると誤認識が増えるからである。
図3は、本発明の一実施形態としての画像処理プログラムのフローチャートを示した図である。
図1に示すスキャナ20で原稿上の画像が読み取られて画像データが生成され、その生成された画像データが通信ケーブル40を経由してノートPC30に入力される。すると、この図3に示す画像処理プログラムが起動し、通信ケーブル40を経由してノートPC30に入力されてきた画像データが取得される(ステップS01)。なお、前述の通り、ここでは、特に必要がある場合を除き、データ上の画像であっても「データ」を省略し、「画像」あるいは「原稿」と称することがある。
ステップS01にて画像を取得すると、今回取得した画像が1枚目の画像であるか2枚目以降の画像であるかが判定される(ステップS02)。
本実施形態では、スキャナ20に、1枚目は未記入原稿を読み取らせ、その後、2枚目以降に記入済原稿を順次読み取らせるというルールを置いている。そこで、この画像処理プログラムは、取得した画像が1枚目の画像のときは、その画像を未記入原稿として一時保存する(ステップS03)。2枚目以降についても画像取得を繰り返し(ステップS05)、2枚目以降に取得した画像は全て記入済原稿として一時保存する(ステップS04)。
図4は、未記入原稿と記入済原稿の第1例を示した図である。
ここで、図4(A)は、記入前のアンケート用紙、すなわち未記入原稿51Aを表している。ここでは、アンケート内容として(1)〜(3)の3つの設問があり、それら3つの設問に対する回答は、1〜5の数字のうちのいずれか1つの数字を○印で囲うことによりその数字を選択する方式のものである。
また、図4(B)は、図4(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52Aを表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
この図4(B)に示されている1枚の記入済原稿52Aでは、(1)の設問に関しては、数字の「3」が○印521で囲まれている。また、(2)の設問に関しては、数字の「1」が○印522で囲まれている。さらに、(3)の設問に関しては、数字の「5」が○印523で囲まれている。
図5は、未記入原稿と記入済原稿の第2例を示した図である。
図4の場合と同様、図5(A)は、記入前のアンケート用紙、すなわち未記入原稿51Bを表している。また、図5(B)は、図5(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52Bを表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
ここでは、アンケート内容として(1)から(4)の4つの設問があり、それらの設問のうちの(1)から(3)に対する回答は、「大変良い」、「良い」、「普通」、「悪い」、「大変悪い」のいずれかに重ねて○印等のマークを記入することにより、また(4)の設問に対しては、「ぜひ紹介したい」、「まあ紹介したい」、「あまり紹介したくない」のいずれかに重ねて○印等のマークを記入することにより、そのマークを記入した内容を選択する方式のものである。
図6は、未記入原稿と記入済原稿の第3例を示した図である。
図4,図5の場合と同様、図6(A)は、記入前のアンケート用紙、すなわち未記入原稿51Cを表している。また、図6(B)は、図6(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52Cを表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
ここでは、アンケート内容として(1)と(2)の2つの設問があり、それら2つの設問に対する回答は、図6(B)に示すように、□印内にチェックマークを記入することにより行われる。□印内にチェックマークを記入すると、そのチェックマークを記入した□印のすぐ右側に記録されている文字列が表わす内容を回答したことになる。
図7は、未記入原稿と記入済原稿の第4例を示した図である。
図4〜図6の場合と同様、図7(A)は、記入前のアンケート用紙、すなわち未記入原稿51Dを表している。また、図7(B)は、図7(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52Dを表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
ここでは、アンケート内容として、図6と同じ内容の(1)と(2)の2つの設問がある。ただし、ここでは、回答候補としての文字列は、罫線で囲まれた枠内に記録されている。この設問に対する回答は、図7(B)に示すように、回答しようとしている文字列の左に並ぶ、罫線によって囲まれた枠内にチェックマークを記入することによって行われる。枠内にチェックマークを記入すると、そのチェックマークの枠のすぐ右側に並ぶ枠内に記録されている文字列が表わす内容を回答したことになる。
図3に戻って説明を続ける。
一連の画像取得を終了すると(ステップS05)、次に、未記入原稿に記録されている文字列およびその文字列が記録されている領域の認識処理が行われる(ステップS06)。図4に示す第1例では数字のみの認識で足りるが、本実施形態における認識対象は図4〜図7に示すように多岐のアンケート用紙にわたっているため、認識すべき文字のの文字種は限定されていない。
図8は、未記入原稿上の文字列および領域認識処理のフローチャートを示した図である。図3のステップS06では、この図8に示す処理が実行される。
ここでは先ず、未記入原稿上に記録されている個々の文字について、文字とその文字が記録されている領域(第1の領域)とが認識される(ステップS61)。この文字と第1の領域の認識は、未記入原稿の全面にわたって行なわれる。
図9は、認識された文字に対応付けられる第1の領域の算出方法を例示した図である。
ここでは、図9に示すように、数字の「3」が認識されたものとする。このとき、その数字の「3」に外接する長方形Rが算出されて、その長方形Rがその認識された数字「3」に対応する第1の領域として認識され、その長方形Rが、ここで認識された数字の「3」に対応する第1の領域として、その数字「3」に対応づけられる。ただし、ここで対応づけられる第1の領域は、必ずしも2次元的な広がりのある領域ではなく、例えば、その長方形Rの4隅の座標C1〜C4のセット、あるいは、その長方形Rの中心の1点の座標C0等であってもよい。
図8に戻って説明を続ける。
未記入原稿上の個々の文字および個々の文字に対応する個々の第1の領域が認識されると(ステップS61)、次に、その未記入原稿上の罫線の認識が試みられる(ステップS62)。ここでは、図4〜図6に示すような、罫線が描かれていないアンケート用紙も、図7に示すような罫線が描かれているアンケート用紙も処理対象としている。このため、アンケート用紙によっては、罫線が描かれている場合も有り得る。そこで、ここでは、未記入原稿上の罫線の有無、および罫線が描かれていた場合の、その罫線の位置や長さ等が認識される。
個々の文字および個々の第1の領域の認識(ステップS61)と罫線の認識(ステップS62)が終了すると、次に、未記入原稿上を左上から右下に向かって順次に検査していき(ステップS63)、認識された文字を見つけたら、その見つけた1つの文字とその文字に対応する第1の領域を取り出す(ステップS64)。そして、取り出すべき文字が無くなるまで、以下の処理を繰り返す(ステップS65)。
ここでは先ず、今回取り出した1つの文字が1行の左側の先頭の文字か否かを判定するステップS66)。1行の左側の先頭の文字1つだけでは、以下の処理を実行できないため、今回取り出した1つの文字が1行の左側の先頭の文字であったときは、ステップS63に戻り、次の文字とその文字に対応する第1の領域を取り出す(ステップS64)。
そして次に、先に取り出した文字を囲う罫線が存在するか否かを判定する(ステップS67)。
ここでは先ずは、罫線(先に取り出した文字を囲う罫線)が存在しない場合について説明する。上記の条件を満たす罫線が存在しない場合、次に、先に取り出した文字と今回取り出した文字との2つの文字に対応する2つの第1の領域どうしを結合する結合条件を満たすか否かを判定する(ステップS68)。ここでは、この結合条件として、今回取り出した文字に対応する第1の領域が、先に取り出した文字に対応する第1の領域に対し、右隣に有り、かつ、予め定められた閾値距離以内に存在すること、という条件を採用している。
図10は、第1の領域どうしを結合する結合条件の説明図である。
ここには、「以下の質問にお答えください」の文字が並んでいる。そして、先に取り出した文字が「以」であって、今回取り出した文字が「下」であるとする。ここで、今回取り出した文字「下」に対応する、その文字「下」を取り巻く第1の領域(ここでは、これを、「今回の第1の領域」と称する。)は、先に取り出した文字「以」に対応する、その文字「以」を取り巻く第1の領域(ここでは、これを、「先の第1の領域」と称する。)に対し右隣に位置していて、かつ、予め定められた閾値距離以内に存在する。そして、この結合条件を満たすと、それら2つの第1の領域が、「以」と「下」という2つの文字からなる文字列「以下」に対応する1つの第1の領域となるように結合される(図8、ステップS69)。
今回の第1の領域が先の第1の領域に対し予め定められた閾値距離以内に存在するか否かの判定は、特定の判定方法に限定されるものではないが、例えば以下の判定方法が採用される。
例えば、図10(A)に示すように、先の第1の領域(文字「以」を囲う領域)の右辺と、今回の第1の領域(文字「下」を囲う領域)の左辺との間の距離を計算し、その距離が閾値距離以内であるか否かが判定される。
あるいは、これも図10(A)に示すように、先の第1の領域(文字「以」を囲う領域)の4隅の座標の各々と、今回の第1の領域(文字「下」を囲う領域)の4隅の座標の各々との間の距離を計算し、それらの距離の中に閾値距離以内の距離が存在するか否かで判定してもよい。
あるいは、図10(B)に示すように、先の第1の領域の中心座標と今回の第1の領域の中心座標との間の距離を計算し、その距離が閾値距離以内であるか否かで判定してもよい。
ただし、これらの異なる判定方法に応じて、その判定方法に適した閾値距離が採用される。あるいは、これらの複数の判定方法を併用してもよい。
このような判定方法により結合条件を満たすと判定された場合は、第1の領域どうしを結合する(ステップS69)。そして、以上の処理を、未記入原稿上の全ての文字の取出しが終了するまで繰り返す(ステップS65)。図10に示す文字列の場合、この繰り返しにより、図10(C)に示すように、「以下の質問にお答えください」の文字列全体に対応する1つの第1の領域が生成される。
次に、取り出した文字を囲う罫線が存在する場合について説明する。
この場合、図8のステップS67において先に取り出した文字を囲う罫線が存在すると判定されると、つぎにステップS71に進み、今回取り出した文字が、先に取り出した文字を囲う罫線領域(罫線で囲まれた枠)と同じ罫線領域内に存在するか否かが判定される。そして、それらの文字が同じ罫線領域内(罫線で囲まれた同じ枠内)に存在すると判定されると、それらの文字に対応する2つの第1の領域どうしが結合される(ステップS72)。
図11は、罫線を利用した第1の領域どうしの結合例を示した図である。
ここでは、「Ver7.0」、「Ver7.1」、「Ver8.0」、「Ver8.02」、「Ver8.05」、の各文字列が、それぞれ1つの罫線領域(罫線で囲まれた同じ枠内)に記録されている。そこで、ここでは、「Ver7.0」について例示すると、「V」「e」「r」「7」「.」「0」の個々の文字の第1の領域どうしが結合されて、文字列「Ver7.0」に対応する1つの第1の領域が生成される。その他の文字列についても同様である。
このようにして、図8に示した処理の実行により、文字列ごとの第1の領域が生成される。ここで、今回取り出した文字が先に取り出した文字から離れていて、さらに、次に取り出した文字も離れているときは、1文字のみからなる文字列が構成されることになる。
図8に示した処理、すなわち、図3のステップS06の処理により1文字のみであることを含む各文字列に対応する各第1の領域が生成されると、次に、図3のステップS07に進む。ここでは、ステップS04で一時保存しておいた記入済原稿のうちの1枚を取り出す(ステップS07)。ただし、ステップS09における文字認識処理が済んでいる記入済原稿は取出しの対象からは外している。そして、未処理の記入済原稿が有ったときは、すなわち、未処理の記入済原稿を取り出せたときは(ステップS08)、その取り出した1枚の未処理の記入済原稿について、文字認識処理を実行する(ステップS09)。文字認識処理の詳細については、後述する。
未処理の記入済原稿を取り出せなかったとき、すなわち、全ての記入済原稿について文字認識処理(ステップS09)が終了したときは(ステップS08)、今回の文字認識ルーチンを終了する。
図12は、図3に1つのステップ(ステップS09)で示した文字認識処理の詳細フローを示した図である。
ここでは先ず、図3のステップS07で取り出した1枚の記入済原稿とステップS03で一時保存しておいた未記入原稿との間の差分の画像を生成する(ステップS21)。
図13は、差分画像の一例を示した図である。
この図13に示す差分画像53Aは、図4(A)に示す未記入原稿51Aと、図4(B)に示す記入済原稿52Aのうちの一番上の1枚の記入済原稿との間の差分画像である。この差分画像53Aには、回答者によって記入された、3つの○印521,522,523が抽出される。この差分画像上に現れた追加記録画像は、本発明にいう追加記録画像の一例に相当する。また、ここでは、追加記録画像を構成している1つ1つの画像を個別追加記録画像と称する。ここで、○印521に関しては、記入時の掠れ等により、2つの部分521a,521bに分かれている。このため、2つの部分521a,521bの各々が個別追加記録画像となる。
図12に戻って説明を続ける。
図13に例示するような差分画像を生成すると(ステップS21)、次に、差分画像を左上から右下に向かって検査していき(ステップS22)、個別追加記録画像を見つけたら、その見つけた1つの個別追加記録画像を取り出す(ステップS23)。そして、今回対象としている差分画像上に未処理の個別追加記録画像が無くなるまで(ステップS24)、以下の処理を繰り返す。
ここでは先ず、領域算出処理が行われる(ステップS25)。この領域算出処理は、ステップS23で取り出した1つの個別追加記録画像の記入済原稿上の領域(第2の領域)を算出する処理である。本実施形態では、この第2の領域の算出にあたり、図9に示した、未記入原稿上の第1の領域の算出方法と同じ算出方法が採用されている。すなわち、ここでは、ステップS23で取り出した1つの個別追加記録画像に外接する長方形Rが算出され、その長方形Rがその個別追加記録画像に対応する第2の領域として、その個別追加記録画像に対応付けられる。あるいは、これも第1の領域の場合と同様、その長方形Rの4隅の座標のセット、もしくは、その長方形Rの中心座標を第2の領域としてもよい。
1つの個別追加記録画像に対応する第2の領域が算出されると(ステップS25)、次に、文字列特定処理が行われる(ステップS26)。
図14は、文字列特定処理の詳細フローを示した図である。
ここでは、図12のステップS25で今回算出された第2の領域が、いずれかの第1の領域と重なっているか否かが判定される(ステップS261)。
図15は、第2の領域と第1の領域が重なっている例を示した図である。
図15(A)〜(C)のいずれにおいても、第2の領域(○印を囲う領域)と重なる第1の領域(文字列を囲う領域)とが重なっている。中心座標どうしの距離を算出して重なっているかどうかを判定するときは、第2の領域の中心座標と、文字列を構成している各文字それぞれの中心座標のうちの第2の領域の中心座標に一番接近した文字の中心座標との間の距離が閾値距離以内にあるか否かによって重なっているか否かを判定してもよい。
図14に戻って説明を続ける。
図15に例示したように、第2の領域と重なっている第1の領域が存在するときは、その重なっている第1の領域に対応する文字列が、その第2の領域、すなわち今回の個別追加記録画像に対応する文字列として特定される(ステップS262)。
第2の領域と重なっている第1の領域が存在しないときは(ステップS261)、その第2の領域の右側であって閾値距離以内の距離に第1の領域が存在するか否かが判定される(ステップS263)。この判定方法としては、前述した、第1の領域どうしを結合するか否かの判定方法と同様の、様々な判定方法が採用され得る。ただし、文字の中心座標どうしの距離に基づいて判定するときは、判定対象の第1の領域に対応する文字列の中の一番左側の文字の中心座標が採用される。
図16は、第2の領域の右側に第1の領域が存在している例を示した図である。
ここには、□印内に記入されたチェックマークを囲う第2の領域の右側であって閾値距離以内に「Ver7.0」の文字列を囲う第1の領域が存在している。そこで、この「Ver7.0」の文字列を囲う第1の領域に対応する文字列である「Ver7.0」が、その第2の領域、すなわち今回の個別追加記録画像であるチェックマークに対応する文字列として特定される(図14、ステップS264)。なお、第2の領域の右側であって閾値距離以内に複数の第1の領域が存在するときは、それら複数の第1の領域のうちの第2の領域からの距離が最短の第1の領域に対応する文字列が、その第2の領域に対応する文字列として特定される。
第2の領域と重なっている第1の領域が存在せず、しかも、第2の領域の右側の閾値距離以内にも第1の領域が存在しなかったときは、今回の第2の領域、すなわち今回の個別追加記録画像に対応しては、文字列は特定されないステップS265)。
図12に戻って説明を続ける。
今回の1つの第2の領域に対応する図14に示した文字列特定処理、すなわち、今回の1つの第2の領域に対応する図12のステップS26における文字列特定処理が終了すると、次に、このようにして特定された文字列が、ステップS22で個別追加記録画像を1つづつ取り出して処理していく間に複数回通過するステップS26において先に特定された文字列に対応する第1の領域と同一の第1の領域の文字列であるか否かが判定される(ステップS27)。
例えば、図13に示す○印521は、その○印の記入時の掠れ等により、2つの部分521a,521bに分かれている。このため、各部分521a,521bのそれぞれが1つずつの個別追加記録画像として認識されることが有り得る。その場合、それら2つの部分521a,521bで同じ座標の同じ文字列(ここでは図4に示す数字の「3」)が特定される。図12のステップS27は、このような場合に、2度目以降に特定された同一の第1の領域の同一の文字列は不要なので、2度目以降に特定された同一の第1の領域の同一の文字列は無視される。
ステップS27において、これまでとは別の第1の領域の文字列が特定されたときは、その特定された文字列が保存される(ステップS28)。
ここでは以上の処理が、1枚の差分画像上の個別追加記録画像の1つ1つについて実行され(ステップS22,S23)、その1枚の差分画像上の全ての個別追加記録画像についての処理が終了すると(ステップS24)、その1枚の差分画像についての、図12に示す処理、すなわち、図3にステップS09として示す文字認識処理が終了し、未処理の次の記入済原稿に関する文字認識処理に移行する(図3のステップS07)。そして、全ての記入済原稿に関する文字認識処理が終了すると(図3のステップS08)、画像処理ルーチンの今回の実行を終了する。
このように、本実施形態によれば、マークシートのマークの各位置ごとに、その位置のマークが何を意味しているか、という情報を予めインプットしておくといったような事前設定なしに、回答者の回答を認識することができる。
ここで、本実施形態の場合、スキャナ20で複数枚の原稿を連続的に読み取り、それら複数枚の原稿のうちの1枚目の原稿を未記入原稿とし、2枚目以降の原稿を記入済原稿とするというルールが定められている。この場合、未記入原稿の画像データを容易かつ確実に取得することができる。しかしながら、本発明においては、未記入原稿を1枚目などの特定の位置に配置するというルールは必ずしも必要ではない。未記入原稿を、例えば複数枚積み重ねた記入済原稿の途中位置に挟みこんでおいてもよい。その場合、画像取得部の中に未記入原稿を複数枚の原稿から見つけ出す処理を実施すればよい。未記入原稿を見つけ出す処理の一例としては、1枚目の原稿と2枚目以降の原稿との差分を抽出する処理を順次行い、1枚目の原稿にのみ差分が出た原稿を未記入原稿とすればよい。また、未記入原稿であるか記入済原稿であるかを問わずに読取により得られたテータ上の複数枚の原稿の共通部分を抽出した画像を作成し、その作成した画像と読み込んだ各原稿とのパターンマッチングを行い、一致度が最も高かった原稿を未記入原稿としてもよい。
あるいは、記入済原稿の読み込みが複数回に分かれていても、同種の原稿についての未記入原稿の読み込みは1回のみとし、一旦読み込んだ未記入原稿を記憶しておいて、今回読み込んだ記入済原稿とのパターンマッチングや特徴点抽出、あるいは直線で囲まれた領域の一致度を使ったフォーム認識により、今回読み込んだ記入済原稿に対応する未記入原稿を特定してもよい。
さらには、本発明では、未記入原稿を読み込むことすら必ずしも必要ではない。例えば、複数枚の記入済原稿から、それら複数枚の記入済原稿の共通部分を抽出することにより、データ上で未記入原稿を作成してもよい。この場合、共通部分を抽出することにより作成されたデータ上での未記入原稿が第1の画像を表す第1の画像データに対応する。
また、ここでは、図1に示すように、通信ケーブル40でスキャナ20と接続されたノートPC30からなる画像処理装置について説明したが、本発明における画像処理装置は必ずしもこの形態である必要はない。例えば、スキャナとプリンタとが合体した形態のコピー機ないしはさらに機能が増えた複合機に、本発明の画像処理装置の機能を組み込んでもよい。さらには、カメラ機能を備えた携帯型端末に本発明の画像処理装置の機能を組み込んでもよい。その場合、カメラ機能で原稿を撮影することにより得られた画像が文字認識の対象となる。
10 文字認識システム
20 スキャナ
21 原稿トレイ
22 排紙トレイ
23 上蓋
30 ノート型パーソナルコンピュータ(ノートPC)
31 表示画面
32 キーボード
51A,51B,51C,51D 未記入原稿
52A,52B,52C,52D 記入済原稿
53A 差分画像
521,522,523 ○印
551,552 個別追加記録画像
60 画像処理装置
61 画像取得部
62 文字列認識部
63 追加記録画像抽出部
64 文字列特定部

Claims (5)

  1. 第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
    前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
    前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに、該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
    前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある前記第1の領域に対応づけられている文字列を特定する文字列特定部とを備え
    前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視することを特徴とする画像処理装置。
  2. 前記文字列認識部が、認識した個々の文字の中の、1点もしくは複数点の座標で表現された領域であることを含む領域どうしが互いに重なっていることを含む予め定められた第2の閾値以内にある複数の領域に含まれる複数の文字を、1つの文字列として認識し、前記第1の画像上の、文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む該領域を、前記第1の領域として該文字列に対応付けることを特徴とする請求項に記載の画像処理装置。
  3. 前記文字列特定部が、前記第2の領域に対し該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある領域が存在しない場合は、該第2の領域に対応しては文字列を特定しないことを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記文字列認識部は、前記第1の画像が罫線を含む画像の場合に、該罫線で囲まれた領域ごとに文字列を認識するものであることを特徴とする請求項1から3のうちのいずれか1項に記載の画像処理装置。
  5. プログラムを実行する情報処理装置内で実行されて、該情報処理装置を、
    第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとをスキャナから取得する画像取得部と、
    前記第1の画像から、1文字であることを含む文字列を認識し、さらに、認識した文字列ごとに、該第1の画像上の、該文字列が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第1の領域を該文字列に対応付ける文字列認識部と、
    前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出し、さらに該追加記録画像を構成する、個別の記録ごとの個別追加記録画像ごとに、前記第2の画像上の、該個別追加記録画像が記録されていた、1点もしくは複数点の座標で表現された領域であることを含む第2の領域を抽出する追加記録画像抽出部と、
    前記文字列認識部で認識された文字列の中から、前記第2の領域に対し、該第2の領域に重なっていることを含む予め定められた第1の閾値以内にある第1の領域に対応づけられている文字列を特定する文字列特定部とを備え、
    前記文字列特定部が、複数の第2の領域に対応して、同一の前記第1の領域に対応付けられた同一の文字列が特定されたときは、該同一の文字列についての複数回の特定のうちの初回の特定を除く残りの特定における、特定された該同一の文字列を無視する画像処理装置として動作させることを特徴とする画像処理プログラム。
JP2017017421A 2017-02-02 2017-02-02 画像処理装置および画像処理プログラム Active JP6907565B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017017421A JP6907565B2 (ja) 2017-02-02 2017-02-02 画像処理装置および画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017017421A JP6907565B2 (ja) 2017-02-02 2017-02-02 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2018124854A JP2018124854A (ja) 2018-08-09
JP6907565B2 true JP6907565B2 (ja) 2021-07-21

Family

ID=63109614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017017421A Active JP6907565B2 (ja) 2017-02-02 2017-02-02 画像処理装置および画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6907565B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112639818B (zh) * 2018-08-27 2024-06-04 京瓷办公信息系统株式会社 Ocr系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3294995B2 (ja) * 1996-06-21 2002-06-24 三菱電機株式会社 帳票読取装置
JP2002207955A (ja) * 2001-01-05 2002-07-26 Sharp Corp 情報入力支援システム
JP4873138B2 (ja) * 2006-06-21 2012-02-08 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2013218364A (ja) * 2012-04-04 2013-10-24 Canon Inc 画像処理システム

Also Published As

Publication number Publication date
JP2018124854A (ja) 2018-08-09

Similar Documents

Publication Publication Date Title
US8155443B2 (en) Image extracting apparatus, image extracting method and computer readable medium
US20070242882A1 (en) Image processing apparatus for identifying the position of a process target within an image
US8391607B2 (en) Image processor and computer readable medium
US8897574B2 (en) Image processing apparatus, line detection method, and computer-readable, non-transitory medium
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
JP4807489B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム
CN111950557A (zh) 错题处理方法、图像形成装置及电子设备
JP4655824B2 (ja) 画像認識装置、画像認識方法および画像認識プログラム
JP2022074466A (ja) 画像処理装置および画像形成装置
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
JP6474504B1 (ja) 手書文字認識システム
JP6907565B2 (ja) 画像処理装置および画像処理プログラム
JP2007005950A (ja) 画像処理装置及びネットワークシステム
JP6662023B2 (ja) 画像処理装置および画像処理プログラム
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP2017174031A (ja) 画像処理装置及び画像処理プログラム
JP4807487B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム
US7865130B2 (en) Material processing apparatus, material processing method, and material processing program product
JP6888299B2 (ja) 画像処理装置および画像処理プログラム
JP4894184B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム
US20230394228A1 (en) Image processing apparatus and image forming apparatus
CN110909723A (zh) 信息处理装置及存储介质
JP7516170B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7457903B2 (ja) 画像処理装置
US11659106B2 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210614

R150 Certificate of patent or registration of utility model

Ref document number: 6907565

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150