JP2018109866A - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JP2018109866A
JP2018109866A JP2017000149A JP2017000149A JP2018109866A JP 2018109866 A JP2018109866 A JP 2018109866A JP 2017000149 A JP2017000149 A JP 2017000149A JP 2017000149 A JP2017000149 A JP 2017000149A JP 2018109866 A JP2018109866 A JP 2018109866A
Authority
JP
Japan
Prior art keywords
image
character recognition
area
character
additional recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017000149A
Other languages
English (en)
Other versions
JP6888299B2 (ja
Inventor
猪股 浩司郎
Koshiro Inomata
浩司郎 猪股
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2017000149A priority Critical patent/JP6888299B2/ja
Publication of JP2018109866A publication Critical patent/JP2018109866A/ja
Application granted granted Critical
Publication of JP6888299B2 publication Critical patent/JP6888299B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】記入あるいは選択された位置に対応する文字情報を事前設定することなく認識する。【解決手段】アンケート記入前の未記入原稿51と、その未記入原稿51にアンケートが記録された記入済原稿52を表わす画像データとを取得し、未記入原稿51と記入済原稿52との差分画像を生成することで未記入原稿51に対し追加記録された画像である追加記録画像を抽出し、各追加記録画像に対応する各領域に文字認識処理を実行する文字認識領域を設定し、文字認識領域の面積を変化させながら、文字認識領域について文字認識処理を繰り返し実行する。【選択図】図4

Description

本発明は、画像処理装置および画像処理プログラムに関する。
官公庁等に提出する書類や様々なアンケート用紙への記入等、印字された用紙(帳票やアンケート用紙等)に手書きで記入して提出する機会が多い。記入された用紙を集める側は、それらの用紙に記入された手書き文字や、○印等のマークで選択された文字(数字を含む)を自動で読み取って集計したいという要求がある。
その要求に対し、特許文献1には、マークシートのように塗りつぶして回答する種類の帳票について、回答が記入されたマークシートをスキャナ等で読み取って集計する技術が開示されている。
特開平2013―45309号公報
しかしながら、上掲の特許文献1に開示された技術の場合、マークシートに記入されているマークの位置を検出することはできるが、その位置に記入されたマークが何を意味しているかは、別途の情報として事前設定しておく必要がある。
「本発明は、記入あるいは選択された位置に対応する文字情報を、あらかじめ文字と文字の位置とを対応づけて設定する作業を必要とすることなく認識する画像処理装置および画像処理プログラムを提供することを目的とする。
請求項1は、
第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとを取得する画像取得部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出する追加記録画像抽出部と、
前記追加記録画像に対応する第1の画像の領域に文字認識処理を実行する文字認識領域を設定し、該文字認識領域の面積を変化させながら、該文字認識領域について文字認識処理を繰り返し実行する文字認識処理実行部と
を備えたことを特徴とする文字認識装置である。
請求項2は、
前記追加記録画像抽出部が、前記追加記録画像を構成する、相互に分離した複数の図形であっても、予め定められた閾値距離以内に互いに近づいた複数の図形については該複数の図形が同一の追加記録画像に属するものとみなすことを特徴とする請求項1に記載の文字認識装置である。
請求項3は、
前記文字認識処理実行部が、認識の確からしさの算出を含む文字認識処理を実行するものであって、前記文字認識領域の面積を変化させながら文字認識処理の実行を繰り返して、確からしさが予め定められた閾値を越えたときの文字、確からしさが極大値に達したときの文字、若しくは、文字認識処理の実行を予め定められた回数繰り返した中での最大の確からしさが得られた文字を認識結果とするものであることを特徴とする請求項1または2に記載の文字認識装置である。
請求項4は、
前記文字認識処理実行部が、前記追加記録画像に対応する領域に、予め定められた閾値を越える確からしさの文字が認識されなかった場合に、該追加記録画像に対応する領域に設定された前記文字認識領域の位置をずらして、文字認識処理を実行することを特徴とする請求項3に記載の文字認識装置である。
請求項5は、
前記文字認識処理実行部は、他の第2の画像の追加記録画像の位置を参照して、前記文字認識領域をずらす位置を決定することを特徴とする請求項4に記載の文字認識装置である。
請求項6は、
前記文字認識処理実行部は、前記追加記録画像に対応する領域に設定された前記文字認識領域の位置をずらすとともに、前記他の第2の画像の追加記録画像に対応する、予め定められた閾値を越える確からしさが得られたときの文字認識領域の面積に応じた面積の文字認識領域を設定して、該文字認識領域について文字認識処理を実行することを特徴とする請求項4または5に記載の文字認識装置である。
請求項7は、
前記文字認識処理実行部は、前記第1の画像上に前記文字認識領域を設定し、該第1の画像上の文字を認識対象とするものであることを特徴とする請求項1から6のうちのいずれか1項に記載の文字認識装置である。
請求項8は、
前記文字認識処理実行部は、前記第2の画像上若しくは前記第1の画像と該第2の画像との差分の画像上に前記文字認識領域を設定し、該第2の画像上若しくは該差分の画像上の文字を認識対象とするものであることを特徴とする請求項1から6のうちのいずれか1項に記載の文字認識装置である。
請求項9は、
前記文字認識処理実行部は、前記第1の画像上の、前記追加記録画像に対応する領域が空白の領域であった場合に、前記第2の画像上若しくは前記第1の画像と該第2の画像との差分の画像上に前記文字認識領域を設定して該第2の画像上若しくは該差分の画像上の文字を認識対象とし、前記第1の画像上の前記追加記録画像に対応する領域が空白の領域ではなかった場合に、該第1の画像上に前記文字認識領域を設定して該第1の画像上の文字を認識対象とするものであることを特徴とする請求項1から6のうちのいずれか1項に記載の文字認識装置である。
請求項10は、
プログラムを実行する情報処理装置内で実行されて、該情報処理装置を、
第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとを取得する画像取得部と、
前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出する追加記録画像抽出部と、

前記追加記録画像に対応する領域に文字認識処理を実行する文字認識領域を設定し、該文字認識領域の面積を変化させながら、該文字認識領域について文字認識処理を実行する文字認識処理実行部と
を備えた文字認識装置として動作させることを特徴とする文字認識プログラムである。
請求項1の文字認識装置および請求項10の文字認識プログラムによれば、記入あるいは選択された位置に対応する文字情報を、あらかじめ文字と文字の位置とを対応づけて設定する作業を必要とすることなく認識することができる。
請求項2の文字認識装置によれば、物理的に分離した図形ごとに追加記録画像とみなす場合と比べ、正しく認識される可能性が高まる。
請求項3の文字認識装置によれば、予め定められた確からしさに達しなくても無限ループとなって処理が終了しないことが防止される。
請求項4の文字認識装置によれば、文字認識領域の位置をずらさない場合と比べ、正しく認識される可能性が高まる。
請求項5の文字認識装置によれば、他の第2の画像の追加記録画像の位置を参照しない場合と比べ、正しく認識される可能性が高まる。
請求項6の文字認識装置によれば、ずらした位置での文字認識領域の面積を初期面積から再スタートして文字認識処理を繰り返す場合と比べ、文字認識終了までの時間が短縮される可能性が高まる。
請求項7の文字認識装置によれば、認識対象の文字が第1の画像と第2の画像との双方に存在する場合に、第2の画像上に文字認識領域を設定する場合と比べ、正しく認識される可能性が高まる。
請求項8の文字認識装置によれば、認識対象の文字が第1の画像には存在しない場合には、第2の画像上若しくは差分画像上に文字認識領域を設定することによって、文字認識を行なうことができる。
請求項9の文字認識装置によれば、文字認識領域を設定する画像を、第1の画像、第2の画像、若しくは差分画像のいずれかに固定した場合と比べ、広範囲の認識が可能である。
文字認識システムの外観図である。 ノートPC内での文字認識プログラムの実行により実現する文字認識装置の機能ブロック図である。 本発明の一実施形態としての文字認識プログラムのフローチャートを示した図である。 未記入原稿と記入済原稿の一例を示した図である。 図3に1つのステップ(ステップS08)で示した文字認識処理の第1例についての詳細フローを示した図である。 差分画像の一例を示した図である。 2つに分離した図形を1つの個別追加記録画像として認識するための処理を示した模式図である。 文字認識領域設定方法の説明図である。 文字認識領域の再設定方法を示した図である。 図3に1つのステップ(ステップS08)で示した文字認識処理の第2例についての詳細フローを示した図である。 回答としての○印が認識対象の文字からずれた位置に記入された場合の、文字認識領域を示した模式図である。 図3に1つのステップとして示した再認識処理の第1例についての詳細フロ―を示した図である。 図3に1つのステップとして示した再認識処理の第2例についての詳細フロ―を示した図である。 対象の差分画像上の1つの個別追加記録画像と、それに対応する、対象以外の差分画像上の1つの個別追加記録画像を、未記入原稿上に重ねて示した図である。
以下、本発明の実施の形態について説明する。
図1は、文字認識システムの外観図である。
ここに示す文字認識システム10は、スキャナ20とノート型パーソナルコンピュータ(以下、「ノートPC」と略記する)30とを備えている。スキャナ20とノートPC30との間は、通信ケーブル40で接続されている。
スキャナ20は、原稿に記録されている画像を読み取って画像データを生成する装置である。このスキャナ20の原稿トレイ21上に原稿を置き、スタートボタン(不図示)を押すと、あるいは、ノートPCから指示を与えると、原稿が1枚、スキャナ20内に送り込まれる。スキャナ20内には原稿上の画像を光電的に読み取るセンサ(不図示)が備えられていて、スキャナ20内に送り込まれた原稿から、その原稿上に記録されている画像が光電的に読み取られて画像データが生成される。記録されている画像が読み取られた後の原稿は、排紙トレイ22上に排出される。この原稿トレイ21には複数枚の原稿を積み重ねて載置することができ、スキャナ20は、原稿トレイ21上の複数枚の原稿を1枚ずつ順次にスキャナ20内に送り込み、その送り込まれた原稿上の画像を読み取り、排紙トレイ22上に排出する。
また、このスキャナ20は、背面側に設けられた左右に延びるヒンジ(不図示)を回転中心として上蓋23を持ち上げることができる。この上蓋23を持ち上げてその下に原稿を1枚置き、上蓋23を閉じて、その置かれた原稿を読み取ることもできる。
このスキャナ20での読み取りにより得られた画像データは、通信ケーブル40を経由してノートPC30に入力される。
ノートPC30は、表示画面31やキーボード32を備えており、また、その内部には、プログラムを実行するためのCPUやメモリ等の設備を備えている。このノートPC30ではプログラムが実行されて、その実行されたプログラムに応じた処理が行われる。本実施形態に対応しては、このノートPCでは、以下に説明する文字認識プログラムが実行される。このノートPC30内で実行される文字認識プログラムは、本発明の文字認識プログラムの一例に相当する。そして、このノートPC30は、この文字認識プログラムの実行により、本発明の一実施形態としての文字認識装置として動作する。
図2は、ノートPC内での文字認識プログラムの実行により実現する文字認識装置の機能ブロック図である。
本実施形態の文字認識装置50は、画像取得部51と、追加記録画像抽出部52と、追加記録画像分離部53と、文字認識処理実行部54とを有する。具体的な実施形態の例示は後回しにして、ここでは、各部51〜54について概括的に説明する。なお、ここでは、データ上の画像を取り扱っており、したがって、ここでは、特に区別する必要がある場合を除き、データ上の画像であっても、データ上の画像であることを特に明記することなく、単に「画像」あるいは「原稿」と称することがある。
画像取得部51は、アンケートの設問としての文字が記録されていてその設問に対する回答が未記入の未記入原稿の画像と、その未記入原稿に回答が追加記録された記入済原稿の画像とを取得する。未記入原稿は1枚であるが、記入済原稿は通常は複数枚存在し、画像取得部51は、それら全ての画像を取得する。これら未記入原稿および記入済原稿は、本発明にいう、それぞれ第1の画像および第2の画像の各一例に相当する。
また、追加記録画像抽出部52は、記録済原稿と未記入原稿との差分の画像を算出することにより、記録済原稿の中から、未記入原稿に対し追加記録された回答の画像である追加記録画像を抽出する。
また、追加記録画像分離部53は、抽出された追加記録画像を、個別の記録ごとの追加記録画像(ここでは、個別の記録ごとの追加記録画像を「個別追加記録画像」と称する)に分離する。ここで、本実施形態における追加記録画像分離部53は、追加記録画像を各個別追加記録画像に分離するにあたり、追加記録画像を構成する、相互に分離した複数の図形であっても、予め定められた閾値距離以内に互いに近づいた複数の図形についてはそれら複数の図形が同一の個別追加記録画像に属するものとみなして、追加記録画像を各個別追加記録画像に分離する。
さらに、文字認識処理実行部54は、各個別追加記録画像に対応する各領域に文字認識処理を実行する文字認識領域を設定し、その文字認識領域の面積を変化させながら、その文字認識領域について文字認識処理を繰り返し実行する。ここで、本実施形態における文字認識処理実行部54は、未記入原稿上の、個別追加記録画像に対応する領域が空白の領域であった場合には、記入済原稿上若しくは未記入原稿と記入済原稿との差分の画像上に文字認識領域を設定して記入済原稿上若しくは差分画像上の文字を認識対象とし、未記入原稿上の個別追加記録画像に対応する領域が空白の領域ではなかった場合には、未記入原稿上に文字認識領域を設定して未記入原稿上の文字を認識対象とする。
また、この文字認識処理実行部54は、認識の確からしさの算出を含む文字認識処理を実行するものであって、前記文字認識領域の面積を変化させながら、予め定められた認識処理停止条件を満足するまで、文字認識処理の実行を繰り返す。この認識処理停止条件としては、確からしさが予め定められた閾値を越えること、確からしさが極大値に達すること、若しくは、文字認識処理の実行を予め定められた回数繰り返すこと、などが採用される。
ここで、本実施形態では、個別追加記録画像に対応する未記入原稿上の領域が空白の領域ではなかった場合には、未記入原稿上に文字認識領域が設定されて未記入原稿上の文字が認識対象となるが、本実施形態における文字認識処理実行部54は、未記入原稿上に設定された文字認識領域に予め定められた閾値を越える確からしさの文字が認識されなかった場合に、その文字認識領域の位置をずらして、文字認識処理を実行する。この文字認識領域の位置をずらすにあたっては、文字認識処理実行部54は、現在処理の対象としている記入済原稿とは異なる他の記入済原稿に記録されている個別追加記録画像の位置を参照して、文字認識領域をずらす位置を決定する。また、この文字認識処理実行部54は、個別追加記録画像に対応する未記入原稿上の領域に設定された文字認識領域の位置をずらすとともに、上記の他の記入済原稿上の個別追加記録画像に対応する、閾値以上の確からしさが得られたときの文字認識領域の面積に応じた面積の文字認識領域を設定して、その面積の文字認識領域について文字認識処理を実行する。具体例は後述する。
図3は、本発明の一実施形態としての文字認識プログラムのフローチャートを示した図である。
図1に示すスキャナ20で原稿上の画像が読み取られて画像データが生成され、その生成された画像データが通信ケーブル40を経由してノートPC30に入力される。すると、この図3に示す文字認識プログラムが起動し、通信ケーブル40を経由してノートPC30に入力されてきた画像データが取得される(ステップS01)。なお、前述の通り、ここでは、特に必要がある場合を除き、データ上の画像であっても「データ」を省略し、「画像」あるいは「原稿」と称している。
ステップS01にて画像を取得すると、今回取得した画像が1枚目の画像であるか2枚目以降の画像であるかが判定される(ステップS02)。
本実施形態では、スキャナ20に、1枚目は未記入原稿を読み取らせ、その後、2枚目以降に記入済原稿を順次読み取らせるというルールを置いている。そこで、この文字認識プログラムは、取得した画像が1枚目の画像のときは、その画像を未記入原稿として一時保存する(ステップS03)。2枚目以降についても画像取得を繰り返し(ステップS05)、2枚目以降に取得した画像は全て記入済原稿として一時保存する(ステップS04)。
図4は、未記入原稿と記入済原稿の一例を示した図である。
図4(A)は、記入前のアンケート用紙、すなわち未記入原稿51を表している。ここでは、アンケート内容として(1)〜(3)の3つの設問があり、それら3つの設問のうち、(1)と(2)の設問に対する回答は、1〜5の数字のうちのいずれか1つの数字を○印で囲うことによりその数字を選択する方式のものである。(3)の設問は、その回答を、空白の回答欄511に自由に記入してもらう形式の設問である。
また、図4(B)は、図4(A)に示したアンケート用紙と同一様式のアンケート用紙上に回答者が回答を記入した記入済原稿52を表している。記入済原稿は1枚とは限らず、スキャナ20で順次読み込まれた複数枚の原稿のうちの2枚目以降の原稿の1枚1枚それぞれが記入済原稿として取り扱われる。
この図4(B)に示されている1枚の記入済原稿では、(1)の設問に関しては、数字の「3」が○印521で囲まれている。また、(2)の設問に関しては、数字の「1」が○印522で囲まれている。さらに、(3)の設問に関しては、空白だった回答欄に回答者が記入した文字列523が並んでいる。
図3に戻って説明を続ける。
一連の画像取得を終了すると(ステップS05)、次に、ステップS04で一時保存しておいた記入済原稿のうちの1枚を取り出す(ステップS06)。ただし、ステップS08における文字認識処理が済んでいる記入済原稿は取出しの対象からは外している。そして、未処理の記入済原稿が有ったときは、すなわち、未処理の記入済原稿を取り出せたときは(ステップS07)、その取り出した1枚の未処理の記入済原稿について、文字認識処理を実行する(ステップS08)。文字認識処理の詳細については、後述する。
未処理の記入済原稿を取り出せなかったとき、すなわち、全ての記入済原稿について文字認識処理(ステップS08)が終了したときは(ステップS07)、次に、一定条件下にある文字1つずつについて(ステップS09)、再認識処理を実行する(ステップS10)。ステップS09の条件および再認識処理(ステップS10)については後述する。ステップS09の条件を満たす文字が存在しないとき、あるいは、再認識処理(ステップS10)によってステップS09の条件を満たす文字が存在しなくなったときは、今回の文字認識ルーチンを終了する。
図5は、図3に1つのステップ(ステップS08)で示した文字認識処理の第1例についての詳細フローを示した図である。
ここでは先ず、図3のステップS06で取り出した1枚の記入済原稿とステップS03で一時保存しておいた未記入原稿との間の差分の画像を生成する(ステップS21)。
図6は、差分画像の一例を示した図である。
この図6に示す差分画像53は、図4(A)に示す未記入原稿51と、図4(B)に示す記入済原稿52のうちの一番上の1枚の記入済原稿との間の差分画像である。この差分画像53には、回答者によって記入された、2つの○印521,522と文字列523とからなる「追加記録画像」が抽出される。この差分画像上に現れた追加記録画像は、本発明にいう追加記録画像の一例に相当する。
図5に戻って説明を続ける。
図6に例示するような差分画像を生成すると(ステップS21)、次に、その差分画像上に現れた追加記録画像を、個別の記録ごとの画像である「個別追加記録画像」に分離する(ステップS22)。ここで、「個別追加記録画像」とは、回答者が1つの文字あるいは1つの図形として認識する程度にまとまった画像の各々をいう。具体的には、図6に示す例では、2つの○印521,522の各々と、文字列523を構成するひと文字ひと文字が、各個別追加記録画像である。したがって、記入時の掠れ等により複数に分離した図形や複数の部位に分離した文字であっても、複数に分離した図形あるいは複数の部位に分離した文字を1つの個別追加記録画像として認識すべき場面も存在する。
図7は、2つに分離した図形を1つの個別追加記録画像として認識するための処理を示した模式図である。
図7(A)は、差分画像上に現れた、回答者によって描かれた○印の1つである。この図7(A)に示された○印は、途中が掠れて2つに分離した図形となっている。
ここでは、図7(A)に示す○印を構成する各画素の周りを、予め定められた範囲に亘ってその○印を構成する画素として埋めていくことで、図7(B)に示すように、○印を構成している線を太らせる。
図7(C)は、画素を升目で表現した模式図である。1つの升目が1つの画素を表わしている。中央の画素Pは、図7(A)の○印を構成する線上の多数の画素を代表させて1つだけ示した画素である。
線を太らせるにあたっては、具体的には、この図7(C)に示すように、○印を構成している1つの画素Pが存在したときに、その画素Pの周りの予め定められた範囲内(ここに示す例では、5画素×5画素の範囲内)にある画素を、○印を構成する画素として塗り潰す。ここでは、代表的に1つの画素Pについて示したが、○印を構成している全ての画素について同様の処理を行なって、図7(B)に示すような、太線の丸印を生成する。このようにして線を太らせた結果、繋がった図形を、1つの個別追加記録画像として認識する。本実施形態では、このような処理により、差分画像上に現れた追加記録画像が各個別追加記録画像に分離される。図6に示す差分画像53の例では、上記の処理により、2つの○印521,522の1つずつと、文字列523を構成している文字1つずつに分離され、それらの1つずつが、各個別追加記録画像として認識される。
なお、本実施形態では、線を太らせて互いに繋がる図形を個別追加記録画像とする処理を採用しているが、この処理は、互いに離れた図形が互いに予め定められた距離以内に近接しているか否かを判定する処理の1つである。すなわち、ここでは、互いに離れた図形が互いに予め定められた距離以内に近接している場合に、1つの個別追加記録画像として認識される。
再び図5に戻って説明を続ける。
差分画像上に現れた追加記録画像を、上記のようにして個々の個別追加記録画像に分離した後(ステップS22)、差分画像を左上から右下に向かって検査していき(ステップS23)、個別追加記録画像を見つけたら、その見つけた1つの個別追加記録画像を取り出す(ステップS24)。そして、今回対象としている差分画像上に未処理の個別追加記録画像が無くなるまで(ステップS25)、以下の処理を繰り返す。
ここでは先ず、未記入原稿上の、今回取り出した1つの個別追加記録画像に対応する領域が、空白か否かを判定する(ステップS26)。ここで説明している第1例の場合、空白か否かの判定方法として、2値化処理を行ない、白側に傾いたことをもって空白としている。空白か否かの判定方法の他の例については、後述する。
今回取り出した1つの個別追加記録画像に対応する未記入原稿上の領域が空白ではなかったときは(ステップS26)、次に、その領域に追加記録されている画像が閾値以上の寸法の画像か否かが判定される(ステップS27)。そして、その領域に閾値以上の寸法の画像が記録されていたときは、未記入原稿上に文字認識領域を設定する(ステップS28)。一方、その個別追加記録画像に対応する未記入原稿上の領域が空白だったときは(ステップS26)、本実施形態では、差分画像上に文字認識領域を設定する(ステップS29)。また、その個別追加記録画像に対応する未記入原稿上の画像が空白ではないものの閾値に満たない寸法の画像、すなわちノイズ画像であったときも(ステップS27)、差分画像上に文字認識領域を設定する(ステップS29)。なお、その個別追加記録画像に対応する未記入原稿上の領域が空白あるいは閾値に満たない寸法の画像だったときは、差分画像上ではなく、今回処理を行なっている記入済原稿上に文字認識領域を設定してもよい。
図8は、文字認識領域設定方法の説明図である。ここでは、未記入原稿と差分画像が互いに重ねられているものとし、未記入原稿上の文字認識領域と差分画像上の文字認識領域とを区別せずに説明する。
図8(A)は、1つの個別追加記録画像(一例として○印)を示している。ここでは、図8(B)に示すような、この個別追加記録画像が内接する長方形を考えて、その長方形の中心部に予め定められた最小面積の文字認識領域Dを設定する。ただし、長方形を考えることなく、この個別追加記録画像の重心点に文字認識領域を設定するなど、個別追加記録画像のほぼ中央を見つける他の手法を採用してもよい。
このようにして文字認識領域を設定して(ステップS28,S29)、その文字認識領域内について文字認識処理を実行する(ステップS30)。文字認識処理自体は既存の技術であり、ここでの説明は省略する。この文字認識処理では、認識した文字についての「確からしさ」についても算出される。
そして、この文字認識処理(ステップS30)は、停止条件を満足するまで(ステップS31)、文字認識領域を再設定しながら(ステップS32)、繰り返される。
図9は、文字認識領域の再設定方法を示した図である。
最初は、図8(C)に示すように、面積最小の文字認識領域Dが設定され(図5、ステップS30)、その文字認識領域の面積を、図9に示すD1→D2→D3→・・・のように徐々に拡大しながら(ステップS32)、停止条件を満足するまで(ステップS31)、文字認識処理を実行する(ステップS30)。
ここで、ステップS31の停止条件としては、
(a)文字認識の確からしさが予め定められた閾値を越えたこと
(b)文字認識の確からしさが極大値に達したこと
(c)文字認識領域の面積を徐々に拡大しながらの文字認識処理を、予め定められた回数繰り返したこと
などが採用される。ここで、停止条件として上記の(a)または(b)を採用したときも、文字認識処理が無限に続かないように、上記の(c)を併用することが望ましい。
なお、ここでは、文字認識領域の面積を徐々に拡大しながら文字認識処理を繰り返す旨、説明したが、初期の文字認識領域として、例えば、図8(B)に示す長方形の枠に近似した大面積の文字認識領域を設定し、その文字認識領域の面積を徐々に縮小しながら、文字認識処理を繰り返してもよい。
文字認識の停止条件を満足すると(ステップS31)、今回認識されたひと文字が、その「確からしさ」とともに保存される(ステップS33)。
以上の処理が1枚の差分画像上の個別追加記録画像の1つ1つについて実行され(ステップS23,S24)、その1枚の差分画像上の全ての個別追加記録画像についての処理が終了すると(ステップS25)、その1枚の差分画像についての、図5に示す処理、すなわち、図3にステップS08として示す文字認識処理が終了し、未処理の次の記入済原稿に関する文字認識処理に移行する(ステップS06)。そして、全ての記入済原稿に関する文字認識処理が終了すると(ステップS07)、次に再認識処理(ステップS10)に移る。
ここでは、再認識処理(ステップS10)の説明に移る前に、ステップS08における文字認識処理の第2例について説明する。
図10は、図3に1つのステップ(ステップS08)で示した第2例としての文字認識処理の第2例についての詳細フローを示した図である。この図10に示した第2例としての文字認識処理は、図5に示した第1例としての文字認識処理に代えて採用することのできる文字認識処理である。
この図10に示した文字認識処理のステップS21〜S25は、図5に示した文字認識処理の同じステップS21〜S25とそれぞれ同一の処理であり、ここでの重複説明は省略する。
ステップS25において個別追加記録画像有り、と判定されると、図5に示した第1例の場合、2値化処理により、空白か否かが判定され(図5、ステップS26)、空白でなかったときは、そこに記録されている画像が閾値以上の寸法の画像か否かが判定される(ステップS27)。これに対し、この図10に示した第2例の場合、それらステップS27,S28は存在せず、いきなり、未記入原稿上に文字認識領域を設定し(ステップS211)、その文字認識領域について文字認識処理を実行する(ステップS212)。そして、その文字認識処理(ステップS212)を、停止条件を満足するまで(ステップS213)、文字認識領域を図9に示すD1→D2→D3→・・・のように再設定しながら(ステップS214)、繰り返す。これらステップS212〜S214は、未記入原稿のみを処理対象としている点を除き、図5のステップS30〜S32とそれぞれ同一の処理である。
そして、停止条件を満足すると(ステップS213)、その未記入原稿上に設定(再設定)された文字認識領域から文字が認識されたか否かが判定される(ステップS215)。文字が認識されたか否かのここでの判定は、単なるノイズと区別するための判定であり、閾値としての確からしさは、かなり低いレベル(例えば、確からしさ20%)に設定されている。そして、文字が認識されたと判定されると(ステップS215)、その認識された情報が保存される(ステップS216)。
一方、ステップS215において、文字が認識されない、あるいは確からしさが閾値以下と判定されると、今度は差分画像上に文字認識領域が設定されて(ステップS217)、文字認識処理が実行される(ステップS218)。ステップS217〜S221の処理は、差分原稿のみを処理対象としている点を除き、図5のステップS30〜S33とそれぞれ同一の処理である。
図5に示した第1例の場合、未記入原稿上の対象の領域が空白か否かを直接に判定しているが(図5、スッテップS26)、それに代えて、この図10示した処理のように、未記入原稿上に文字が存在することを仮定して、未記入原稿上から文字を認識しようとし、文字が認識できない場合を空白とし、あるいは低い確からしさでしか認識できない場合をノイズとして、差分画像上からの文字認識処理に移ってもよい。
次に、再認識処理(図3、ステップS10)について説明する。
図11は、回答としての○印が認識対象の文字からずれた位置に記入された場合の、文字認識領域を示した模式図である。
回答としての○印が認識対象の文字からずれた位置に記入されると、この図11に示すように文字認識領域の中心点が認識対象の文字(ここでは数字の「3」)からずれた位置に設定され、その数字「3」の下に記録されている罫線を文字として誤認識し、確からしさが閾値未満のまま、その文字についての文字認識処理が終了することが有り得る。
図3のステップS10の再認識処理は、このような場面での認識率の低さを救うための処理である。
この再認識処理は、ステップS09の再認識処理条件に適合する文字ひと文字ひと文字について実行される。このステップS09の再認識処理条件は、以下の(d)〜(f)の全てを満足することである。
(d)この再認識処理は、未記入原稿上の文字を認識する場合を対象としている。差分画像あるいは記入済原稿上の文字については、以下の再認識処理の対象としても確からしさの向上には大きく資することは期待できないため、ここでは、差分画像あるいは記入済原稿上の文字については、再認識処理の対象とはしない。
(e)また、この再認識処理は、文字認識処理(ステップS08)において、確からしさが予め定められた閾値(例えば、確からしさ80%)未満の確からしさしか得られなかった文字を対象としている。
(f)さらに、この再認識処理は、未記入原稿上の文字認識における確からしさ80%未満の文字のうちの、再認識処理を未だ実行していない文字を対象としている。
ここでは、以上の(d)〜(f)の再認識処理条件を満たす文字が存在する場合に(ステップS09)、その再認識処理条件を満たす文字1つ1つについて、再認識処理(ステップS10)が実行される。
図12は、図3に1つのステップとして示した再認識処理の第1例についての詳細フロ―を示した図である。
ここでは、文字認識処理の中心点(図11に示す面積最小の文字認識領域D)を予め定められた領域内(例えば上下左右4ピクセルずつの領域内)で移動させながら、図9を参照して説明した文字認識処理が繰り返される。具体的には、図12に示したフローの通りである。
ここでは先ず、予め定められた領域内(例えば上下左右4ピクセルずつの領域内)における、ある1つのずれた位置に面積最小の文字認識領域を設定し(ステップS41)、その文字認識領域について文字認識処理を実行する(ステップS42)。そして、この文字認識処理を、停止条件を満足するまで(ステップS43)、文字認識領域を再設定しながら(すなわち、図9に示すD1→D2→D3→・・・のように文字認識領域を徐々に広げながら)(ステップS44)、繰り返す。
停止条件を満足すると(ステップS43)、予め定められた領域内(例えば上下左右4ピクセルずつの領域内)の全てについて中心点(面積最小の文字認識領域D)をずらして文字認識処理を行なったか否かが判定され(ステップS45)、中心点をずらすべき位置がその領域内に未だ残っているときは、ステップS41に戻って、その残っている、中心点をずらすべき位置のうちの1つに中心点をずらして、ステップS42〜S44の処理を実行する。一方、ステップS45において、中心点をずらすべき領域内の全ての位置に中心点をずらし終えたことが判定されると、今度は、今回の一連の文字認識処理の結果、確からしさがアップしたか否かが判定され(ステップS46)、確からしさがアップしたときは、それまで保存しておいた同じ対象の認識結果が、今回の再認識結果に置き換えられる(ステップS47)。
以上の再認識処理が、上記の(d)〜(f)の条件を満たす各文字について実行されて(図3、ステップS09,S10)、この文字認識処理ルーチンの実行を終了する。
次に、再認識処理の第2例について説明する。
図13は、図3に1つのステップとして示した再認識処理の第2例についての詳細フローを示した図である。この第2例の再認識処理は、図12を参照して説明した第1例としての再認識処理に代えて採用することのできる処理である。
この第2例の再認識処理では、先ず、認識対象の文字を認識するための文字認識領域をずらす位置およびその文字認識領域の面積を決定する(ステップS411)。このために、この文字の認識の際に用いられた差分画像(ここでは、この差分画像を、「対象の差分画像」と称する)とは別の差分画像(ここでは、この差分画像を、「対象以外の差分画像」と称する)を参照し、対象の差分画像と対象以外の差分画像とを重ねたときに、この文字の認識の基になった個別追加記録画像の中心点(図8(C)参照)と比べ、中心点同士が予め定められた距離以内にあって、対象以外の差分画像に関して確からしさ80%以上の文字認識結果が得られたときの文字認識領域設定の基になった個別追加記録画像を探し出す。
図14は、対象の差分画像上の1つの個別追加記録画像と、それに対応する、対象以外の差分画像上の1つの個別追加記録画像を、未記入原稿上に重ねて示した図である。
対象の差分画像上の個別追加記録画像551は、認識対象の文字(ここでは数字の「3」)から少しずれた位置にある。そして、この個別追加記録画像551を基にして設定した文字認識領域からは、確からしさ80%未満の認識結果しか得られなかったものとする。
一方、対象以外の差分画像上の個別追加記録画像552は、認識対象の文字(ここでは数字の「3」)をきれいに取り巻くように描かれている。そして、この個別追加記録画像552を基にして設定した文字認識領域からは確からしさが80%を越える認識結果が得られたものとする。
この場合、確からしさ80%未満の認識結果しか得られなかった文字について再認識処理を実行するにあたっては、その再認識処理を実行するための文字認識領域を、確からしさが80%を越える認識結果が得られた、対象以外の差分画像上の個別追加記録画像552を基にして設定した文字認識領域と同じ位置にずらす。また、文字認識領域の面積に関しては、対象以外の差分画像上の個別追加記録画像552を基にして設定した文字認識領域であって、確からしさ80%を越えたときの面積が設定される。例えば、図9に示す面積Dxの文字認識領域が、対象以外の差分画像に関して確からしさ80%を越えた確からしさが得られたときの文字認識領域であったときは、確からしさ80%未満の認識結果しか得られなかった文字についての再認識処理にあたっては、その面積Dxの文字認識領域が採用される。
図13のステップS411では、以上のようにして、文字認識領域のずらす位置および文字認識領域の面積を決定し、その決定した文字認識領域について文字認識処理を実行する(ステップS412)。
そして、その文字認識処理(ステップS412)の結果、確からしさがアップしたか否かが判定され(ステップS413)、確からしさがアップしたときは、それまで保存しておいた同じ対象の認識結果が、今回の再認識結果に置き換えられる(ステップS414)。
以上の再認識処理が上記の(d)〜(f)の条件を満たす各文字について実行されて(図3、ステップS09,S10)、この文字認識処理ルーチンの実行を終了する。
以上に説明したように、本実施形態によれば、マークシートのマークの各位置ごとに、その位置のマークが何を意味しているか、という情報を予めインプットしておくといったような事前設定なしに、回答者の回答を認識することができる。
ここで、本実施形態の場合、スキャナ20で複数枚の原稿を連続的に読み取り、それら複数枚の原稿のうちの1枚目の原稿を未記入原稿とし、2枚目以降の原稿を記入済原稿とするというルールが定められている。この場合、未記入原稿の画像データを容易かつ確実に取得することができる。しかしながら、本発明においては、未記入原稿を1枚目などの特定の位置に配置するというルールは必ずしも必要ではない。未記入原稿を、例えば複数枚積み重ねた記入済原稿の途中位置に挟みこんでおいてもよい。その場合、画像取得部の中に未記入原稿を複数枚の原稿から見つけ出す処理を実施すればよい。未記入原稿を見つけ出す処理の一例としては、1枚目の原稿と2枚目以降の原稿との差分を抽出する処理を順次行い、1枚目の原稿にのみ差分が出た原稿を未記入原稿とすればよい。また、未記入原稿であるか記入済原稿であるかを問わずに読取により得られたテータ上の複数枚の原稿の共通部分を抽出した画像を作成し、その作成した画像と読み込んだ各原稿とのパターンマッチングを行い、一致度が最も高かった原稿を未記入原稿としてもよい。
あるいは、記入済原稿の読み込みが複数回に分かれていても、同種の原稿についての未記入原稿の読み込みは1回のみとし、一旦読み込んだ未記入原稿を記憶しておいて、今回読み込んだ記入済原稿とのパターンマッチングや特徴点抽出、あるいは直線で囲まれた領域の一致度を使ったフォーム認識により、今回読み込んだ記入済原稿に対応する未記入原稿を特定してもよい。
さらには、本発明では、未記入原稿を読み込むことすら必ずしも必要ではない。例えば、複数枚の記入済原稿から、それら複数枚の記入済原稿の共通部分を抽出することにより、データ上で未記入原稿を作成してもよい。この場合、共通部分を抽出することにより作成されたデータ上での未記入原稿が第1の画像を表す第1の画像データに対応する。
また、ここでは、図1に示すように、通信ケーブル40でスキャナ20と接続されたノートPC30からなる文字認識装置について説明したが、本発明における文字認識装置は必ずしもこの形態である必要はない。例えば、スキャナとプリンタとが合体した形態のコピー機ないしはさらに機能が増えた複合機に、本発明の文字認識装置の機能を組み込んでもよい。さらには、カメラ機能を備えた携帯型端末に本発明の文字認識装置の機能を組み込んでもよい。その場合、カメラ機能で原稿を撮影することにより得られた画像が文字認識の対象となる。
10 文字認識システム
11 画像取得部
12 追加記録画像抽出部
13 追加記録画像分離部
14 文字認識処理実行部
20 スキャナ
21 原稿トレイ
22 排紙トレイ
23 上蓋
30 ノート型パーソナルコンピュータ(ノートPC)
31 表示画面
32 キーボード
51 未記入原稿
52 記入済原稿
53 差分画像
511 回答欄
521,522 ○印
523 文字列
551,552 個別追加記録画像

Claims (10)

  1. 第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとを取得する画像取得部と、
    前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出する追加記録画像抽出部と、
    前記追加記録画像に対応する第1の画像の領域 に文字認識処理を実行する文字認識領域を設定し、該文字認識領域の面積を変化させながら、該文字認識領域について文字認識処理を繰り返し実行する文字認識処理実行部と
    を備えたことを特徴とする文字認識装置。
  2. 前記追加記録画像抽出部が、前記追加記録画像を構成する、相互に分離した複数の図形であっても、予め定められた閾値距離以内に互いに近づいた複数の図形については該複数の図形が同一の追加記録画像に属するものとみなすことを特徴とする請求項1に記載の文字認識装置。
  3. 前記文字認識処理実行部が、認識の確からしさの算出を含む文字認識処理を実行するものであって、前記文字認識領域の面積を変化させながら文字認識処理の実行を繰り返して、確からしさが予め定められた閾値を越えたときの文字、確からしさが極大値に達したときの文字、若しくは、文字認識処理の実行を予め定められた回数繰り返した中での最大の確からしさが得られた文字を認識結果とするものであることを特徴とする請求項1または2に記載の文字認識装置。
  4. 前記文字認識処理実行部が、前記追加記録画像に対応する領域に、予め定められた閾値を越える確からしさの文字が認識されなかった場合に、該追加記録画像に対応する領域に設定された前記文字認識領域の位置をずらして、文字認識処理を実行することを特徴とする請求項3に記載の文字認識装置。
  5. 前記文字認識処理実行部は、他の第2の画像の追加記録画像の位置を参照して、前記文字認識領域をずらす位置を決定することを特徴とする請求項4に記載の文字認識装置。
  6. 前記文字認識処理実行部は、前記追加記録画像に対応する領域に設定された前記文字認識領域の位置をずらすとともに、前記他の第2の画像の追加記録画像に対応する、予め定められた閾値を越える確からしさが得られたときの文字認識領域の面積に応じた面積の文字認識領域を設定して、該文字認識領域について文字認識処理を実行することを特徴とする請求項4または5に記載の文字認識装置。
  7. 前記文字認識処理実行部は、前記第1の画像上に前記文字認識領域を設定し、該第1の画像上の文字を認識対象とするものであることを特徴とする請求項1から6のうちのいずれか1項に記載の文字認識装置。
  8. 前記文字認識処理実行部は、前記第2の画像上若しくは前記第1の画像と該第2の画像との差分の画像上に前記文字認識領域を設定し、該第2の画像上若しくは該差分の画像上の文字を認識対象とするものであることを特徴とする請求項1から6のうちのいずれか1項に記載の文字認識装置。
  9. 前記文字認識処理実行部は、前記第1の画像上の、前記追加記録画像に対応する領域が空白の領域であった場合に、前記第2の画像上若しくは前記第1の画像と該第2の画像との差分の画像上に前記文字認識領域を設定して該第2の画像上若しくは該差分の画像上の文字を認識対象とし、前記第1の画像上の前記追加記録画像に対応する領域が空白の領域ではなかった場合に、該第1の画像上に前記文字認識領域を設定して該第1の画像上の文字を認識対象とするものであることを特徴とする請求項1から6のうちのいずれか1項に記載の文字認識装置。
  10. プログラムを実行する情報処理装置内で実行されて、該情報処理装置を、
    第1の画像を表わす第1の画像データと、該第1の画像データに追加記録がなされた第2の画像を表わす第2の画像データとを取得する画像取得部と、
    前記第2の画像の中から、前記第1の画像に対し追加記録された画像である追加記録画像を抽出する追加記録画像抽出部と、

    前記追加記録画像に対応する領域に文字認識処理を実行する文字認識領域を設定し、該文字認識領域の面積を変化させながら、該文字認識領域について文字認識処理を実行する文字認識処理実行部と
    を備えた文字認識装置として動作させることを特徴とする文字認識プログラム。
JP2017000149A 2017-01-04 2017-01-04 画像処理装置および画像処理プログラム Active JP6888299B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017000149A JP6888299B2 (ja) 2017-01-04 2017-01-04 画像処理装置および画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017000149A JP6888299B2 (ja) 2017-01-04 2017-01-04 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2018109866A true JP2018109866A (ja) 2018-07-12
JP6888299B2 JP6888299B2 (ja) 2021-06-16

Family

ID=62845147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017000149A Active JP6888299B2 (ja) 2017-01-04 2017-01-04 画像処理装置および画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6888299B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241357A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置、画像処理プログラムおよび画像処理方法
JP2008003739A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム
JP2008003647A (ja) * 2006-06-20 2008-01-10 Fuji Xerox Co Ltd 追記情報処理方法、追記情報処理装置、およびプログラム
WO2009031242A1 (ja) * 2007-09-07 2009-03-12 Glory Ltd. 紙葉類識別装置及び紙葉類識別方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241357A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置、画像処理プログラムおよび画像処理方法
JP2008003647A (ja) * 2006-06-20 2008-01-10 Fuji Xerox Co Ltd 追記情報処理方法、追記情報処理装置、およびプログラム
JP2008003739A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム
WO2009031242A1 (ja) * 2007-09-07 2009-03-12 Glory Ltd. 紙葉類識別装置及び紙葉類識別方法

Also Published As

Publication number Publication date
JP6888299B2 (ja) 2021-06-16

Similar Documents

Publication Publication Date Title
JP5826081B2 (ja) 画像処理装置、文字認識方法及びコンピュータプログラム
JP2011097251A (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
JP7479925B2 (ja) 画像処理システム、画像処理方法、及びプログラム
JP6021665B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
JP4655824B2 (ja) 画像認識装置、画像認識方法および画像認識プログラム
JP6662023B2 (ja) 画像処理装置および画像処理プログラム
US11496635B2 (en) Information processing system for obtaining read data of handwritten characters, training a model based on the characters, and producing a font for printing using the model
JP2017068562A (ja) 情報処理装置及びプログラム
JP5505106B2 (ja) 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム
US10049269B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
CN105100616B (zh) 一种图像处理方法及电子设备
JP2021149452A (ja) 画像処理装置、制御方法及び制御プログラム
JP6888299B2 (ja) 画像処理装置および画像処理プログラム
JP6563084B1 (ja) カード番号認識装置およびカード番号認識方法
JP6907565B2 (ja) 画像処理装置および画像処理プログラム
JP4474231B2 (ja) 文書リンク情報取得システム
JP6540597B2 (ja) 情報処理装置、情報処理方法及びプログラム
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP7267854B2 (ja) 帳票認識装置、帳票認識方法、及び帳票認識システム
JP7013341B2 (ja) 帳票認識装置、帳票認識方法、及び帳票認識プログラム
JP4866184B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP6639257B2 (ja) 情報処理装置及びその制御方法
JP2024037299A (ja) 画像処理装置、画像処理プログラム及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210420

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210503

R150 Certificate of patent or registration of utility model

Ref document number: 6888299

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150