JP2006277509A - ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム - Google Patents

ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム Download PDF

Info

Publication number
JP2006277509A
JP2006277509A JP2005097847A JP2005097847A JP2006277509A JP 2006277509 A JP2006277509 A JP 2006277509A JP 2005097847 A JP2005097847 A JP 2005097847A JP 2005097847 A JP2005097847 A JP 2005097847A JP 2006277509 A JP2006277509 A JP 2006277509A
Authority
JP
Japan
Prior art keywords
pixel
dot
dot area
estimated
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005097847A
Other languages
English (en)
Inventor
Masaki Nakagawa
正樹 中川
Taro Shimamura
太郎 島村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo University of Agriculture and Technology NUC
Tokyo University of Agriculture
Original Assignee
Tokyo University of Agriculture and Technology NUC
Tokyo University of Agriculture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo University of Agriculture and Technology NUC, Tokyo University of Agriculture filed Critical Tokyo University of Agriculture and Technology NUC
Priority to JP2005097847A priority Critical patent/JP2006277509A/ja
Publication of JP2006277509A publication Critical patent/JP2006277509A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】 ドットテクスチャに重ねて記載された表記部を分離した際に得られる表記部の画像から効果的に付着ドットを除去して、表記部の元の形状を回復する。
【解決手段】 既知の手法でドットテクスチャから分離された表記部52に対して、ドットテクスチャを構成するドットの存在する位置を推定して推定ドットエリアEdを決定し、推定ドットエリア中の画素であって、推定ドットエリアとその外部の境界に接する位置にある任意の第1画素のx方向又はy方向の隣り合う画素であって、推定ドットエリアの外部にある画素を検査対象画素とし、検査対象画素の少なくとも1つ以上について黒画素が存在するとき、第1画素を黒画素と判断し、第1画素以外の推定ドットエリア中の1つの画素であって、推定ドットエリアとその外部の境界に接する位置にある画素について順次同様の判定を行って、その画素の白、黒を決定し、推定ドットエリア内の画素のデータを最終的に決定する。
【選択図】 図9

Description

本発明は、ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラムに関し、特にドットテクスチャに重ね書きされた手書き文字などの表記部を背景のドットテクスチャから分離する際に表記部の元の形状を回復する手法に関する。
例えば手書き文字などを記入する帳票の用紙自体に、あらかじめ所定のビット情報をドットの大きさで表現するドットテクスチャを印刷しておき、その上に重ねて手書き文字などを記入する構成の帳票が知られている。かかる帳票は、アクティブ帳票などと呼ばれ、ビット情報として、手書きの属性、文字種類、見出し、指示情報などを記録しておき、必要に応じて読み出すことができる。本発明の発明者らは、下記の非特許文献1において、モノクロ環境下において、ドットテクスチャを構成する微細なドットの形状を変化させることでそこに情報を記録し、また、ドットテクスチャで印刷された帳票の記入枠などから、それに上書きされた手書きを分離する方式について提案している。
島村太郎、朱碧蘭、櫻田武嗣、中川正樹、"アクティブ帳票システムの設計と開発、"信学論(D-II),Vol.J87-D-II, No.12, pp.2091-2103, Dec. 2004
しかしながら、手書きの表記部とドットテクスチャを分離した際、手書きの表記部と重なりのあるドットが手書きの表記部の画像に残り、手書きが文字の場合は文字認識に悪影響を及ぼす場合がある。すなわち、手書きの表記部の周囲に付着したドット(残存黒画素)の影響で、また処理の際に手書きに表記部の画素を余計に削除し過ぎることの影響で、例えばOCR(光学的文字読取装置)により文字を読み取る際の誤認識の原因となる。
本発明は、上記従来の問題を解決するもので、ドットテクスチャに重ねて記載された表記部をドットテクスチャから分離した際に得られる、ドットが残った表記部の画像から効果的にドットを除去して、表記部の元の形状を回復する方法及びそれを実現するコンピュータプログラムを提供することを目的とする。
上記目的を達成するために本発明では、既知の手法でドットテクスチャから分離された表記部に対して、ドットテクスチャを構成するドットの存在する位置を推定して推定ドットエリアを決定し、推定ドットエリア中の画素であって、推定ドットエリアとその外部の境界に接する位置にある任意の第1画素のx方向又はy方向の隣り合う画素であって、推定ドットエリアの外部にある画素を検査対象画素とし、検査対象画素の少なくとも1つ以上について黒画素が存在するとき、第1画素を黒画素と判断し、第1画素以外の推定ドットエリア中の1つの画素であって、推定ドットエリアとその外部の境界に接する位置にある画素について順次同様の判定を行って、その画素の白、黒を決定し、推定ドットエリア内の画素のデータを最終的に決定している。
すなわち、本発明によれば、あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法であって、
既知の手法で前記表記部と前記ドットテクスチャの2つに分離する第1ステップと、
分離された前記ドットテクスチャについて水平射影、垂直射影を求め複数のドットエリアを求める第2ステップと、
求められた前記ドットエリアのそれぞれについて、ドットの横幅を測定し、0、1に変換する第3ステップと、
前記第3ステップを水平方向又は垂直方向に1行分実行して、記録されていたデータをデコードする第4ステップと、
前記第4ステップを各行又は各列に対して実行する第5ステップと、
全ての行又は列のデコードデータの多数決をとり、最終的なデコードデータを決定する第6ステップと、
前記第3ステップ及び前記第4ステップで、1つの行又は列に欠損部分がある場合は、前記最終的なデコードデータを用いて、前記欠損部分を補完し、誤読部分があるときはエラー訂正する第7ステップと、
各ドットエリアの中に前記ドットエリアより小さい推定ドットエリアの位置の座標を決める第8ステップと
前記第8ステップで得られた前記各推定ドットエリアの座標を用いて、前記表記部について、前記各推定ドットエリアごとに前記推定ドットエリアの外部の画素の白、黒の判定結果を用いて、前記各推定ドットエリア内の画素の白、黒を判定して前記表記部の形状回復処理を行う第9ステップとを、
有するドットテクスチャ重畳表記部形状回復方法が提供される。
また、前記第9ステップが、
前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第9−1ステップと、
前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第9−2ステップと、
前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第9−3ステップと、
前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第9−1ステップから第9−3ステップを実行する第9−4ステップと、
前記第9−1ステップから前記第9−4ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第9−5ステップとを、
有するドットテクスチャ重畳表記部形状回復方法は、本発明の好ましい態様である。
また本発明によれば、あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法であって、
既知の手法で前記ドットテクスチャから分離された前記表記部に対して、前記ドットテクスチャを構成するドットの存在する位置を推定して推定ドットエリアを決定する第1ステップと、
前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第2ステップと、
前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第3ステップと、
前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第4ステップと、
前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第2ステップから前記第4ステップを実行する第5ステップと、
前記第4ステップから前記第5ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第6ステップとを、
有するドットテクスチャ重畳表記部形状回復方法が提供される。
さらに本発明によれば、あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラムであって、
既知の手法で前記表記部と前記ドットテクスチャの2つに分離する第1ステップと、
分離された前記ドットテクスチャについて水平射影、垂直射影を求め複数のドットエリアを求める第2ステップと、
求められた前記ドットエリアのそれぞれについて、ドットの横幅を測定し、0、1に変換する第3ステップと、
前記第3ステップを水平方向又は垂直方向に1行分実行して、記録されていたデータをデコードする第4ステップと、
前記第4ステップを各行又は各列に対して実行する第5ステップと、
全ての行又は列のデコードデータの多数決をとり、最終的なデコードデータを決定する第6ステップと、
前記第3ステップ及び前記第4ステップで、1つの行又は列に欠損部分がある場合は、前記最終的なデコードデータを用いて、前記欠損部分を補完し、誤読部分があるときはエラー訂正する第7ステップと、
各ドットエリアの中に前記ドットエリアより小さい推定ドットエリアの位置の座標を決める第8ステップと
前記第8ステップで得られた前記各推定ドットエリアの座標を用いて、前記表記部について、前記各推定ドットエリアごとに前記推定ドットエリアの外部の画素の白、黒の判定結果を用いて、前記各推定ドットエリア内の画素の白、黒を判定して前記表記部の形状回復処理を行う第9ステップとを、
有するドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラムが提供される。
前記第9ステップが、
前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第9−1ステップと、
前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第9−2ステップと、
前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第9−3ステップと、
前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第9−1ステップから第9−3ステップを実行する第9−4ステップと、
前記第9−1ステップから前記第9−4ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第9−5ステップとを、
有するドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラムは本発明の好ましい態様である。
また本発明によれば、あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラムであって、
既知の手法で前記ドットテクスチャから分離された前記表記部に対して、前記ドットテクスチャを構成するドットの存在する位置を推定して推定ドットエリアを決定する第1ステップと、
前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第2ステップと、
前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第3ステップと、
前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第4ステップと、
前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第2ステップから前記第4ステップを実行する第5ステップと、
前記第4ステップから前記第5ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第6ステップとを、
有するドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラムが提供される。
本発明によれば、平均黒画素数差(平均残存黒画素数と平均過削除黒画素数の合計)が従来の処理手法と比較して格段に減少し、よって、文字認識率が飛躍的に向上する。
以下、本発明の実施の形態について、図1Aから図17を用いて詳細に説明する。図1Aは、本発明のドットテクスチャ重畳表記部形状回復方法の前提となる既知の方法によるドットテクスチャから重畳表記部を分離する様子を示す図である。所定のビットパターンで構成されたドットテクスチャ40の2次元平面上に、いま手書き文字の表記部50が重ね書きされているものとする。図1Aの上部には、ドットテクスチャ40に重ねて手書き文字の表記部50が印刷された状態が示されている。なお、本実施の形態では、表記部50は、手書き文字として説明するが、これに限らず、活字の印刷やその他の表記であってもよい。ドットテクスチャ40は、複数のビットからなる情報を水平に並んだ同数個のドットのパターンからなるx方向の横1行により表現し、同一内容のドットパターンが複数行縦方向(y方向)に繰り返して設けられ、2次元平面を構成している。なお、各行のビットパターンは同一であるが、行ごとのドットの配列にずれをもたせるようにして、読み取りエラーを低減させるようにしている。この点は、図4と共に後述する。ラベリング処理などの既知の方法によりドットテクスチャ40と表記部50が分離された結果、分離後のドットテクスチャ42と分離後の表記部52を得ることができる。既知の手法では、表記部50の周囲にドットが付着した状態で分離が行われるため、分離後のドットテクスチャ42からは、本来のドットのいくつかが消失し、一方、分離後の表記部52には、本来の表記部50の周囲にドットが付着している。
図1Bは、本発明のドットテクスチャ重畳表記部形状回復方法を実行するためのドットテクスチャ重畳表記部形状回復装置10の好ましい実施の形態を示すブロックである。手書き文字の表記部50が重畳されているドットテクスチャ40(又は、あらかじめ分離された後のドットテクスチャ42及び分離後の表記部52)を撮像してビデオ信号を送出するカメラ12が設けられている。カメラ12としては、汎用のイメージスキャナを用いることができる。カメラ12の出力信号は、処理部20に入力される。処理部20は、図示省略のCPU(中央演算処理装置)、メモリ、インターフェイス、バスラインなどから構成され、CPUは、メモリにあらかじめ格納されているプログラムにより所定の処理を行う。入力部14は、操作者が処理部20に対して種々の命令を入力するためのものであり、キーボードとマウスなどからなる。処理部20の出力信号は、表示部30に供給され、各処理過程での画像を表示する。
図2は、本発明の原理を説明するために、ドットテクスチャから既知の方法で重畳表記部を分離した際に生じる現象を説明する図である。図2に示すように、ドットが付着している(ラベリングなどの処理で除去し残された)手書き画像において、黒画素は、ドット(Dp)、手書き(Hp)、及びドットと手書きによる共有画素(HDp)の3つに分類できる。ここで、ドットの付着した手書きからドットの画素(Dp)を除去するためには、まず、手書き画像中のドットの位置と形状を知り、かつ、共有画素(HDp)を残しドットの画素(Dp)を除去する必要がある。
ここでドットテクスチャについて説明すると、デジタル信号の1と0に対応して大きなドットと小さなドットを用いて、これらを横1列(x方向)に配列してビット情報を表し、同一の情報を縦方向(y方向)に繰り返して、2次元平面を構成する。図3は、本発明の実施の形態におけるドットテクスチャを構成するデジタル信号の1と0にそれぞれ対応する大きなドットと小さなドットを示し、図4は、本発明の実施の形態におけるドットテクスチャを構成する10ドットからなるx方向の1行分のビット情報がy方向に複数行並んで配列されている様子を示している。
記録する情報をTrとし、この例ではデジタル信号の(0101010101)とする。横(x)方向にドット図形を並べることで記録する情報Trを表現したドット集合Trdを作成する。図4の黒色の長方形で示すようにドット集合Trdを行方向に1ドットずつ交互にずらして重ね、ドットテクスチャTを作成する。ドットテクスチャTの両端においてドット集合Trdでない個所は、隣接するドット図形が“0”ならば“1”を、“1”ならば“0”を示すドット図形を使用する。
次にドットテクスチャTに手書きの表記部を記入した画像THを作成する。画像THにラベリング処理を行い微小な要素を除去することで、手書きの画像THmとドットテクスチャの画像THdに分離する。この分離の手法としては、前述の非特許文献1に記載の手法を用いることができる。図5は、図4の部分拡大図であり、図5に示すように、ドットテクスチャの画像THdの水平方向に沿った射影を求めドットの垂直方向の位置Ayを求める。また、垂直方向に沿った射影を求め、射影が存在する区間の中央を通る垂線をドット列中心線Mxとし、隣り合うMxの中央の垂線を求めドット列の区切り線Axとする。ここで「射影」とは、所定方向にスキャンした場合の黒色画素の個数をヒストグラム的に求めた結果のことである。両端のドット列の外側の区切り線Axについては、両端の中心線から外側に全ドット列中心線間隔の中央値の半分離れた垂線を設定する。区切り線Ay、 Axで囲まれた領域をドットエリアAと呼ぶ。その後、記録された情報のデコードは、ドット図形の横幅を測定して“0”、“1”に変換した後、各行のドット集合Trdの対応するドット図形の変換結果を多数決することで行う。上書きなどによりドットが欠損している個所は、デコード結果を元に補完する。また、誤読部分があるときは、デコード結果を基にエラー訂正を行う。エラー訂正は、周知のCRCCなどのエラー訂正符号を用いても行うことができる。これにより、デコードが可能であれば全ドットエリアAのドット図形の形状を知ることができる。
次に図6に示すように、ドットエリアAの中でドットエリアAより小さい推定ドットエリアEdの位置を求める。ドットエリアAの位置を隅の画素のx、 y座標Axi、Ayi、(i = 1,2)(Ax2 >Ax1 , Ay2≧Ay1)を用いて表し、推定ドットエリアEdをDxi,Dyi(i = 1,2)を用いて表す。今回、Dxi,Dyi(i = 1,2)の初期値はそれぞれ、Dxi = Axi + Lxi, Dyi = Ayi , (i =1,2)とした。Lxi はAxiからDxiまでの距離をピクセル数で表したものであり、図6に示す部分である。なお、Lx2は負の数値で表記する。
このようにして求めた推定ドットエリアEdの位置すなわち座標を用いて、先に分離された手書きの画像THmについて形状回復処理を行う。
図7は、本発明の実施の形態において、形状回復処理を行う分離された手書きの画像THmの含まれる2次元領域の画素位置を示す図である。図8は、図7における推定ドットエリアEdの位置を模式的に示す図である。図8に示すように、読取り後の手書きの画像THmに付着しているドットは方形であると仮定している。図9に示すように推定ドットエリアEdの位置を隅の画素のx, y座標Dxi,Dyi(i = 1,2),(Dx2≧Dx1,Dy2≧Dy1)を用いて表す。また、Ph =Dy2−Dy1,Pw =Dx2−Dx1 とする。
推定ドットエリアEdの外周の画素に対し、次に示す形状回復処理を行い注目画素I(x, y)の値を求める。I(x, y)の4近傍のうち、推定ドットエリアEdの外側にある画素を検査対象画素とし、検査対象画素のうち、1つ以上が“1”(黒)であれば、I(x, y)=1 (黒)、それ以外の場合はI(x, y)=0(白)とする。ここで4近傍とは、注目画素の上下、左右に隣接して位置する画素のことを言う。検査対象画素をI(x+Sx, y+Sy) とした場合、Sx, SyはPh, Pwの条件及び各注目画素位置(x, y)において表1に示す値をとる。ただし、Dx1 =Dx2の場合はDx1,Dy1 =Dy2の場合はDy1とする。推定ドットエリアEd内の該当するすべての画素の処理が終了したら、Dx1=Dx1 +1, Dx= Dx−1, Dy1=Dy1 + 1, Dy2 = Dy2−1 を行い、再び同じ処理を行う。Dx2−Dx1<0 あるいはDy2−Dy1<0となった場合、処理を終了する。
表1は検査対象画素のパラメータである。
Figure 2006277509
表1において、記号「∩」は、アンドの意味で用いている。
図10は、判定(後述する処理A)が終了した後の推定ドットエリアEd内の画素の状態を示す図である。上記判定の手順は、図11〜図17のフローチャートにより更に詳細に示されている。すなわち、図1B中の処理部の構成要素であるCPUの処理内容が図11以下のフローチャートに示されている。図11は、図8に符号0,1,2・・・k・・・KS−1で示される全ての推定ドットエリアEdについて形状回復動作をするための全体の処理を示すフローチャートである。図11中、処理Aとは、図12に示すフローチャートで示される処理である。図12中、処理B、処理C、処理D、処理Eは、それぞれ図13、図14、図15、図16(一部は図17に記載)に示すフローチャートで示される処理である。なお、フローチャート中、記号「∩」は、アンドの意味で、また記号「∪」は、オアの意味で用いている。
表1及び、上記図11以降のフローチャートから明らかなように、各推定ドットエリアEd内の画素中、推定ドットエリアEdの外部に隣接する画素については、隣接する外部の画素が白か黒かによって、白か黒かを判定している。こうして、各推定ドットエリアEd内の画素中、推定ドットエリアEdの外部に隣接する全ての画素の白、黒の判定が行われ、その結果をもって形状回復状態としている。図11のフローチャートで、k<KSがNoとなると、図8中の全ての推定ドットエリアEdについて判定が終了したことになり、分離された手書きの画像である表記部50の形状回復が完了したこととなる。
上記実施の形態では、ドットテクスチャを構成する大きなドットと小さなドットを横方向(x方向)に配列してビット情報を表し、同一の情報を縦方向(y方向)に繰り返して、2次元平面を構成しているが、ドットを縦方向(y方向)に配列してビット情報を表し、同一の情報を横方向(x方向)に繰り返して、2次元平面を構成してもよい。
本発明の効果を確認すべく、本発明者は次の実験を行った。
(1)実験方法
今回、試験対象の表記部には手書き文字を使用する。ドットテクスチャ画像T(図1A中の40に相当)と手書き文字画像H(図1A中の50に相当)のORを求め、ドットテクスチャ上に手書き文字が記入された様子を模擬した画像THを作成する。THをドットの画像THd(図1A中の42に相当)、文字の画像THm(図1A中の52に相当)に分離する。文字の画像THmに対し、上記形状回復処理を行った画像THmk、推定ドットエリアEd内の画素をすべて白画素にした場合の画像THmw、そして、輪郭の平滑化効果のあるメディアンフィルタを用いた場合の画像THmmを作成する。メディアンフィルタは注目画素及びその8近傍の値の中央値を注目画素の値とする方式のものを用いた。
(2)評価方法
残存ドット除去効果の評価方法として、THm、THmk、THmw、THmmとHとの差を求め、 1サンプルあたりの平均残存黒画素数Rn、平均過削除黒画素数On及びそれらの合計である平均黒画素数差Snを求める。また、全サンプルにおけるTHm、THmk、THmw、THmm及びHの文字認識率を求める。文字認識エンジンは2次識別関数を用いる方式のものを使用する。
(3)実験条件
手書き文字画像Hには1cmの正方形の記入領域にボールペンで記入された手書き文字の単文字を用いた。サンプル数は100文字であり、使用字種は平仮名20種、片仮名10種、漢字30種、英文字20種、数字10種、句読点及び記号が10種である。
今回、読取り解像度は100dpiとした。これは、解像度が低いほど読取り後の手書きとドットのサイズが相対的に近くなるため、影響が大きくなることが考えられ、また、実際にファクシミリなどで利用されている解像度であるためである。ドットテクスチャに手書きが記入された状態を模擬した画像THは幅76×高さ76(画素)であり、画素数は5776個である。一方、Tには図3に示すドットを用い、 100dpiでのドット図形の読取りを可能とするためwを1.5mm、hを0.8mm、ドットの直径を約0.2mm、“1”を示すドットの最長部分の長さを約0.9mmとした。ドット図形数は横方向に11個、縦方向に20個とした。TはPostScriptにて作成後1200dpiで印刷し、T、 Hともにスキャナにて100dpiで読み込んだ。なお、今回“1”を示すドット図形の場合、(Lx1,Lx2)=(2,-1)、“0”を示すドット図形の場合(Lx1,Lx2)=(3,-2)とした。実験に使用したPC(図1Bの処理部の構成要素の1つ)は、OS:Windows(登録商標)2000 Professional、CPU:Intel Xeon 2.2GHz(Dual CPU構成)、メモリ1024MByteである。
(4)実験結果
実験結果を表2、3に示す。処理過程の画像例を図18に示す。平均黒画素数差については、上記の本発明による形状回復処理によるものが最も少なかった。また、文字認識率についても、今回提案した方法が1位決定率、10位候補含有率ともに最も高い値を示した。なお,形状回復処理部分の平均処理時間は1画像あたり0.2msであった。同一の解像度で、A4紙面だと、34ms程度の時間になる。
表2は平均黒画素数差である。
Figure 2006277509
表3は文字認識率である。
Figure 2006277509
認識率についても、本発明の方法が1位決定率、10位候補含有率共に最も高い値を示した。なお、形状回復処理部分の平均処理時間は1画像あたり0.2msであった。同一の解像度で、A4紙面だと、34ms程度の時間になる。
以上本発明の実施の形態を、ドットテクスチャ重畳表記部形状回復方法として説明したが、本発明はかかる方法を実行するコンピュータのプログラムとしても成り立つものであり、またかかる方法を実現する装置やシステムとしても成り立つものである。
本発明のドットテクスチャ重畳表記部形状回復方法及びそのためのプログラムは、いわゆるアクティブ帳票などにて使用される情報をドットで記録したドットテクスチャに重ね書きした表記部をドットテクスチャから分離する際に生ずるドットの付着を効果的に除去でき、表記の元の形状を回復することができるので、本発明は商業取引や一般事務、教育、研究など様々な分野で使用される種々の帳票への重畳された表記を用いる分野に有用である。
本発明のドットテクスチャ重畳表記部形状回復方法の前提となる既知の方法によるドットテクスチャから重畳表記部を分離する様子を示す図である。 本発明のドットテクスチャ重畳表記部形状回復方法を実行するためのドットテクスチャ重畳表記部形状回復装置の好ましい実施の形態を示すブロックである。 本発明の原理を説明するために、ドットテクスチャから既知の方法で重畳表記部を分離した際に生じる現象を説明する図である。 本発明の実施の形態におけるドットテクスチャを構成するデジタル信号の1と0にそれぞれ対応する大きなドットと小さなドットを示す図である。 本発明の実施の形態におけるドットテクスチャを構成する10ドットからなるx方向の1行分のビット情報がy方向に複数行並んで配列されている様子を示す図である。 図4の部分拡大図である。 本発明の実施の形態において、ドットエリアの中でドットエリアより小さい推定ドットエリアの位置を求める手法を説明する図である。 本発明の実施の形態において、形状回復処理を行う分離された手書きの画像の含まれる2次元領域の画素位置を示す図である。 図7における推定ドットエリアの位置を模式的に示す図である。 本発明の実施の形態において、推定ドットエリアにおける画素の白、黒の判定手法を説明する図である。 本発明の実施の形態において、処理Aが終了した後の推定ドットエリア内の画素の状態を示す図である。 本発明の実施の形態において、全ての推定ドットエリアについて形状回復動作をするための全体の処理を示すフローチャートである。 図11中の処理Aの内容を示すフローチャートである。 図11中の処理Bの内容を示すフローチャートである。 図11中の処理Cの内容を示すフローチャートである。 図11中の処理Dの内容を示すフローチャートである。 図11中の処理Eの内容の前半を示すフローチャートである。 図11中の処理Eの内容の後半を示すフローチャートである。 本発明での処理過程の画像例を示す図である。
符号の説明
10 ドットテクスチャ重畳表記部形状回復装置
12 カメラ
14 入力部
20 処理部
30 表示部
40 ドットテクスチャ
42 分離後のドットテクスチャ
50 表記部
52 分離後の表記部
A ドットエリア
Ed 推定ドットエリア
Dp ドットの画素
HDp 共有画素
Hp 手書き

Claims (6)

  1. あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法であって、
    既知の手法で前記表記部と前記ドットテクスチャの2つに分離する第1ステップと、
    分離された前記ドットテクスチャについて水平射影、垂直射影を求め複数のドットエリアを求める第2ステップと、
    求められた前記ドットエリアのそれぞれについて、ドットの横幅を測定し、0、1に変換する第3ステップと、
    前記第3ステップを水平方向又は垂直方向に1行分実行して、記録されていたデータをデコードする第4ステップと、
    前記第4ステップを各行又は各列に対して実行する第5ステップと、
    全ての行又は列のデコードデータの多数決をとり、最終的なデコードデータを決定する第6ステップと、
    前記第3ステップ及び前記第4ステップで、1つの行又は列に欠損部分がある場合は、前記最終的なデコードデータを用いて、前記欠損部分を補完し、誤読部分があるときはエラー訂正する第7ステップと、
    各ドットエリアの中に前記ドットエリアより小さい推定ドットエリアの位置の座標を決める第8ステップと
    前記第8ステップで得られた前記各推定ドットエリアの座標を用いて、前記表記部について、前記各推定ドットエリアごとに前記推定ドットエリアの外部の画素の白、黒の判定結果を用いて、前記各推定ドットエリア内の画素の白、黒を判定して前記表記部の形状回復処理を行う第9ステップとを、
    有するドットテクスチャ重畳表記部形状回復方法。
  2. 前記第9ステップが、
    前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第9−1ステップと、
    前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第9−2ステップと、
    前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第9−3ステップと、
    前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第9−1ステップから第9−3ステップを実行する第9−4ステップと、
    前記第9−1ステップから前記第9−4ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第9−5ステップとを、
    有する請求項1に記載のドットテクスチャ重畳表記部形状回復方法。
  3. あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法であって、
    既知の手法で前記ドットテクスチャから分離された前記表記部に対して、前記ドットテクスチャを構成するドットの存在する位置を推定して推定ドットエリアを決定する第1ステップと、
    前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第2ステップと、
    前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第3ステップと、
    前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第4ステップと、
    前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第2ステップから前記第4ステップを実行する第5ステップと、
    前記第4ステップから前記第5ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第6ステップとを、
    有するドットテクスチャ重畳表記部形状回復方法。
  4. あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラムであって、
    既知の手法で前記表記部と前記ドットテクスチャの2つに分離する第1ステップと、
    分離された前記ドットテクスチャについて水平射影、垂直射影を求め複数のドットエリアを求める第2ステップと、
    求められた前記ドットエリアのそれぞれについて、ドットの横幅を測定し、0、1に変換する第3ステップと、
    前記第3ステップを水平方向又は垂直方向に1行分実行して、記録されていたデータをデコードする第4ステップと、
    前記第4ステップを各行又は各列に対して実行する第5ステップと、
    全ての行又は列のデコードデータの多数決をとり、最終的なデコードデータを決定する第6ステップと、
    前記第3ステップ及び前記第4ステップで、1つの行又は列に欠損部分がある場合は、前記最終的なデコードデータを用いて、前記欠損部分を補完し、誤読部分があるときはエラー訂正する第7ステップと、
    各ドットエリアの中に前記ドットエリアより小さい推定ドットエリアの位置の座標を決める第8ステップと
    前記第8ステップで得られた前記各推定ドットエリアの座標を用いて、前記表記部について、前記各推定ドットエリアごとに前記推定ドットエリアの外部の画素の白、黒の判定結果を用いて、前記各推定ドットエリア内の画素の白、黒を判定して前記表記部の形状回復処理を行う第9ステップとを、
    有するドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラム。
  5. 前記第9ステップが、
    前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第9−1ステップと、
    前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第9−2ステップと、
    前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第9−3ステップと、
    前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第9−1ステップから第9−3ステップを実行する第9−4ステップと、
    前記第9−1ステップから前記第9−4ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第9−5ステップとを、
    有する請求項4に記載のドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラム。
  6. あらかじめ所定情報を表示するビット情報を2次元のドットテクスチャとして用意しておき、その上に記載された表記部を前記ドットテクスチャから正確に分離して、前記表記部の形状を回復させるドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラムであって、
    既知の手法で前記ドットテクスチャから分離された前記表記部に対して、前記ドットテクスチャを構成するドットの存在する位置を推定して推定ドットエリアを決定する第1ステップと、
    前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある任意の画素を第1画素とするとき、前記第1画素について、前記第1画素のx方向又はy方向の隣り合う画素であって、前記推定ドットエリアの外部にある画素を検査対象画素とする第2ステップと、
    前記検査対象画素の少なくとも1つ以上について黒画素が存在するか否かを判断する第3ステップと、
    前記検査対象画素のうち、1つ以上が黒画素であると判断されたときは、前記第1画素を黒画素と判断し、一方、前記検査対象画素のいずれにも黒画素が存在しないときは、前記第1画素を白画素と判断する第4ステップと、
    前記第1画素以外の前記推定ドットエリア中の1つの画素であって、前記推定ドットエリアとその外部の境界に接する位置にある画素について順次前記第2ステップから前記第4ステップを実行する第5ステップと、
    前記第4ステップから前記第5ステップが実行されることにより得られた白画素か黒画素かの判断結果に基づいて、前記推定ドットエリア内の画素のデータを最終的に決定する第6ステップとを、
    有するドットテクスチャ重畳表記部形状回復方法をコンピュータに実行させるためのプログラム。
JP2005097847A 2005-03-30 2005-03-30 ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム Pending JP2006277509A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005097847A JP2006277509A (ja) 2005-03-30 2005-03-30 ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005097847A JP2006277509A (ja) 2005-03-30 2005-03-30 ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム

Publications (1)

Publication Number Publication Date
JP2006277509A true JP2006277509A (ja) 2006-10-12

Family

ID=37212185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005097847A Pending JP2006277509A (ja) 2005-03-30 2005-03-30 ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム

Country Status (1)

Country Link
JP (1) JP2006277509A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101785260B1 (ko) 2014-10-30 2017-10-16 김동혁 맞춤생산식 물품용 라벨
CN111459593A (zh) * 2020-03-31 2020-07-28 杭州海康威视数字技术股份有限公司 绘制方法、装置及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101785260B1 (ko) 2014-10-30 2017-10-16 김동혁 맞춤생산식 물품용 라벨
CN111459593A (zh) * 2020-03-31 2020-07-28 杭州海康威视数字技术股份有限公司 绘制方法、装置及设备
CN111459593B (zh) * 2020-03-31 2023-03-24 杭州海康威视数字技术股份有限公司 绘制方法、装置及设备

Similar Documents

Publication Publication Date Title
US9171218B2 (en) Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
CN102360427A (zh) 可调节扫描模式的文字采集方法和扫描装置
CN102737240B (zh) 分析数字文档图像的方法
US7630572B2 (en) Image processing apparatus, image processing method, and computer program
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JP5005732B2 (ja) 画像形成装置及び画像処理方法
JP4049560B2 (ja) 網点除去方法及びシステム
JP3989733B2 (ja) フォーム処理でのひずみの訂正
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP2007072642A (ja) 画像処理装置および画像処理装置の制御方法
JP2006277509A (ja) ドットテクスチャ重畳表記部形状回復方法及びそのためのプログラム
JP2007041832A (ja) 差分画像抽出装置
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP4847378B2 (ja) 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
JP4552757B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP5517028B2 (ja) 画像処理装置
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JP4803001B2 (ja) 画像処理装置及び画像処理プログラム
JP2008269131A (ja) 画像処理装置及び画像処理プログラム
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP4083723B2 (ja) 画像処理装置
JP4792117B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2010258627A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP5146199B2 (ja) 差分抽出装置及び差分抽出プログラム
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム