JP2012043408A - 文書画像を処理する方法、装置及びプログラム - Google Patents
文書画像を処理する方法、装置及びプログラム Download PDFInfo
- Publication number
- JP2012043408A JP2012043408A JP2011122757A JP2011122757A JP2012043408A JP 2012043408 A JP2012043408 A JP 2012043408A JP 2011122757 A JP2011122757 A JP 2011122757A JP 2011122757 A JP2011122757 A JP 2011122757A JP 2012043408 A JP2012043408 A JP 2012043408A
- Authority
- JP
- Japan
- Prior art keywords
- text
- vertical
- overlap
- horizontal
- text line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
Abstract
【解決手段】文書画像の処理方法は、文書画像に対して水平及び垂直テキストライン抽出を実行するステップと、水平及び垂直テキストライン間の重複関係を示す値を有する要素から成る重複行列を提供するステップと、垂直及び水平方向において重複行列をマージするステップと、マージされた重複行列の要素の値に基づいて、文書画像において1又はそれ以上のテキスト重複領域を決定するステップと、1つのテキスト重複領域内で、水平及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするステップと、水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、そのテキスト重複領域の位置付けは水平であると決定し、そうでない場合は垂直であると決定するステップとを有する。
【選択図】図1
Description
1.画像の全テキストラインの抽出は必要でないこと、及び
2.処理速度が可能な限り速いこと
がある。
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行するステップと、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行するステップと、
Nh行及びNv列を有するMOによって表される重複行列を提供するステップであって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示すステップと、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージするステップと、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージするステップと、
前記マージされた重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するステップと、
前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするステップと、
水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するステップと
を前記文書画像処理装置が実行する方法が提供される。
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行するよう構成される水平テキストライン抽出ユニットと、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行するよう構成される垂直テキストライン抽出ユニットと、
Nh行及びNv列を有するMOによって表される重複行列を提供するよう構成される重複行列提供ユニットであって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示す前記重複行列提供ユニットと、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージするよう構成される垂直マージユニットと、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージするよう構成される水平マージユニットと、
前記垂直マージユニット及び前記水平マージユニットによってマージされた前記重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するよう構成されるテキスト重複領域決定ユニットと、
前記テキスト重複領域決定ユニットよって決定された前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするよう構成されるカウントユニットと、
前記カウントユニットによってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、前記カウントユニットによってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するよう構成されるテキスト配置決定ユニットと
を有する装置が提供される。
文書画像を処理するためのコンピュータを、
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行する水平テキストライン抽出手段、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行する垂直テキストライン抽出手段、
Nh行及びNv列を有するMOによって表される重複行列を提供する重複行列提供手段であって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示す前記重複行列提供手段、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージする垂直マージ手段、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージする水平マージ手段、
前記垂直マージ手段及び前記水平マージ手段によってマージされた前記重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するテキスト重複領域決定手段、
前記テキスト重複領域決定手段よって決定された前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするカウント手段、及び
前記カウント手段によってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、前記カウント手段によってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するよう構成されるテキスト配置決定手段
として機能させるための文書画像処理プログラムが提供される。
文書画像処理装置の動作方法であって、
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行するステップと、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行するステップと、
Nh行及びNv列を有するMOによって表される重複行列を提供するステップであって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示すステップと、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージするステップと、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージするステップと、
前記マージされた重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するステップと、
前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするステップと、
水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦方向であると決定するステップと
を前記文書画像処理装置が実行する方法。
前記文書画像処理装置が、
前記文書画像において1又はそれ以上のテキスト重複領域を決定する前に、前記重複行列MOの要素の値がもはや変化しなくなるまで、垂直方向及び水平方向において前記重複行列MOのマージを繰り返すステップ
を更に実行する、付記1に記載の方法。
MO(i,j)=0は、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在しないことを示し、
MO(i,j)=iは、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在することを示し、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値は、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に最小値に設定され、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値は、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に最小値に設定される、
付記1又は2に記載の方法。
前記文書画像処理装置が、
前記1又はそれ以上のテキスト重複領域の夫々の位置付けが横向きであると決定される場合に、前記文書画像は横向きにあると決定するステップと、
前記1又はそれ以上のテキスト重複領域の夫々の位置付けが縦方向であると決定される場合に、前記文書画像は縦方向にあると決定するステップと、
前記1又はそれ以上のテキスト重複領域の位置付けが横向き及び縦向きの両方を含むと決定される場合に、前記文書画像は複合的な位置付けにあると決定するステップと
を更に実行する、付記1に記載の方法。
文書画像を処理する装置であって、
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行するよう構成される水平テキストライン抽出ユニットと、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行するよう構成される垂直テキストライン抽出ユニットと、
Nh行及びNv列を有するMOによって表される重複行列を提供するよう構成される重複行列提供ユニットであって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示す前記重複行列提供ユニットと、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージするよう構成される垂直マージユニットと、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージするよう構成される水平マージユニットと、
前記垂直マージユニット及び前記水平マージユニットによってマージされた前記重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するよう構成されるテキスト重複領域決定ユニットと、
前記テキスト重複領域決定ユニットよって決定された前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするよう構成されるカウントユニットと、
前記カウントユニットによってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、前記カウントユニットによってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するよう構成されるテキスト配置決定ユニットと
を有する装置。
前記テキスト重複領域決定ユニットが前記文書画像において1又はそれ以上のテキスト重複領域を決定する前に、前記垂直マージユニット及び前記水平マージユニットは、前記重複行列MOの要素の値がもはや変化しなくなるまで、垂直方向及び水平方向において前記重複行列MOのマージを繰り返す、
付記5に記載の装置。
MO(i,j)=0は、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在しないことを示し、
MO(i,j)=iは、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在することを示し、
前記垂直マージユニットは、垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値を、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に最小値に設定し、
前記水平マージユニットは、水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値を、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に最小値に設定する、
付記5又は6に記載の装置。
前記1又はそれ以上のテキスト重複領域の夫々の位置付けが横向きであると決定される場合に、前記文書画像は横向きにあると決定し、
前記1又はそれ以上のテキスト重複領域の夫々の位置付けが縦向きであると決定される場合に、前記文書画像は縦向きにあると決定し、
前記1又はそれ以上のテキスト重複領域の位置付けが横向き及び縦向きの両方を含むと決定される場合に、前記文書画像は複合的な位置付けにあると決定する
よう構成される画像配置決定ユニットを更に有する、付記5に記載の装置。
コンピュータによって読み出されて実行される場合に、前記コンピュータが付記1乃至4のうちいずれか1つに記載される方法を実行することを可能にする機械可読命令コードを記憶したプログラムプロダクト。
付記9に記載のプログラムプロダクトを有する機械可読記憶媒体。
文書画像を処理するためのコンピュータを、
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行する水平テキストライン抽出手段、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行する垂直テキストライン抽出手段、
Nh行及びNv列を有するMOによって表される重複行列を提供する重複行列提供手段であって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示す前記重複行列提供手段、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージする垂直マージ手段、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージする水平マージ手段、
前記垂直マージ手段及び前記水平マージ手段によってマージされた前記重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するテキスト重複領域決定手段、
前記テキスト重複領域決定手段よって決定された前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするカウント手段、及び
前記カウント手段によってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、前記カウント手段によってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するよう構成されるテキスト配置決定手段
として機能させるための文書画像処理プログラム。
410 水平テキスト抽出ユニット
420 垂直テキスト抽出ユニット
430 重複行列提供ユニット
440 垂直マージユニット
450 水平マージユニット
460 テキスト重複領域決定ユニット
470 カウントユニット
480 テキスト配置決定ユニット
H−1〜H−5 水平テキストライン
V−1〜V−7 垂直テキストライン
Claims (9)
- 文書画像処理装置の動作方法であって、
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行するステップと、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行するステップと、
Nh行及びNv列を有するMOによって表される重複行列を提供するステップであって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示すステップと、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージするステップと、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージするステップと、
前記マージされた重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するステップと、
前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするステップと、
水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するステップと
を前記文書画像処理装置が実行する方法。 - 前記文書画像処理装置が、
前記文書画像において1又はそれ以上のテキスト重複領域を決定する前に、前記重複行列MOの要素の値がもはや変化しなくなるまで、垂直方向及び水平方向において前記重複行列MOのマージを繰り返すステップ
を更に実行する、請求項1に記載の方法。 - MO(i,j)=0は、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在しないことを示し、
MO(i,j)=iは、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在することを示し、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値は、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に最小値に設定され、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値は、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に最小値に設定される、
請求項1又は2に記載の方法。 - 前記文書画像処理装置が、
前記1又はそれ以上のテキスト重複領域の夫々の位置付けが横向きであると決定される場合に、前記文書画像は横向きにあると決定するステップと、
前記1又はそれ以上のテキスト重複領域の夫々の位置付けが縦向きであると決定される場合に、前記文書画像は縦向きにあると決定するステップと、
前記1又はそれ以上のテキスト重複領域の位置付けが横向き及び縦向きの両方を含むと決定される場合に、前記文書画像は複合的な位置付けにあると決定するステップと
が更に実行する、請求項1に記載の方法。 - 文書画像を処理する装置であって、
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行するよう構成される水平テキストライン抽出ユニットと、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行するよう構成される垂直テキストライン抽出ユニットと、
Nh行及びNv列を有するMOによって表される重複行列を提供するよう構成される重複行列提供ユニットであって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示す前記重複行列提供ユニットと、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージするよう構成される垂直マージユニットと、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージするよう構成される水平マージユニットと、
前記垂直マージユニット及び前記水平マージユニットによってマージされた前記重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するよう構成されるテキスト重複領域決定ユニットと、
前記テキスト重複領域決定ユニットよって決定された前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするよう構成されるカウントユニットと、
前記カウントユニットによってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、前記カウントユニットによってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するよう構成されるテキスト配置決定ユニットと
を有する装置。 - 前記テキスト重複領域決定ユニットが前記文書画像において1又はそれ以上のテキスト重複領域を決定する前に、前記垂直マージユニット及び前記水平マージユニットは、前記重複行列MOの要素の値がもはや変化しなくなるまで、垂直方向及び水平方向において前記重複行列MOのマージを繰り返す、
請求項5に記載の装置。 - MO(i,j)=0は、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在しないことを示し、
MO(i,j)=iは、水平テキストラインのi行目と垂直テキストラインのj列目との間には重複が存在することを示し、
前記垂直マージユニットは、垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値を、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に最小値に設定し、
前記水平マージユニットは、水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値を、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に最小値に設定する、
請求項5又は6に記載の装置。 - 前記1又はそれ以上のテキスト重複領域の夫々の位置付けが横向きであると決定される場合に、前記文書画像は横向きにあると決定し、
前記1又はそれ以上のテキスト重複領域の夫々の位置付けが縦向きであると決定される場合に、前記文書画像は縦向きにあると決定し、
前記1又はそれ以上のテキスト重複領域の位置付けが横向き及び縦向きの両方を含むと決定される場合に、前記文書画像は複合的な位置付けにあると決定する
よう構成される画像配置決定ユニットを更に有する、請求項5に記載の装置。 - 文書画像を処理するためのコンピュータを、
Nh行の水平テキストラインを得るよう前記文書画像に対して水平テキストライン抽出を実行する水平テキストライン抽出手段、
Nv列の垂直テキストラインを得るよう前記文書画像に対して垂直テキストライン抽出を実行する垂直テキストライン抽出手段、
Nh行及びNv列を有するMOによって表される重複行列を提供する重複行列提供手段であって、該重複行列MOのi行目(1≦i≦Nh)及びj列目(1≦j≦Nv)のMO(i,j)によって表される要素の値はi行目の水平テキストラインとj列目の垂直テキストラインとの間の重複関係を示す前記重複行列提供手段、
垂直テキストラインの列と水平テキストラインの複数行の夫々との間の重複関係を示す前記重複行列MOの要素の値が、垂直テキストラインの当該列が水平テキストラインの前記複数行と同時に重なり合う場合に同じ値に設定されるように、垂直方向において前記重複行列MOをマージする垂直マージ手段、
水平テキストラインの行と垂直テキストラインの複数列の夫々との間の重複関係を示す前記重複行列MOの要素の値が、水平テキストラインの当該行が垂直テキストラインの前記複数列と同時に重なり合う場合に同じ値に設定されるように、水平方向において前記重複行列MOをマージする水平マージ手段、
前記垂直マージ手段及び前記水平マージ手段によってマージされた前記重複行列MOの要素の値に基づいて、前記文書画像において1又はそれ以上のテキスト重複領域を決定するテキスト重複領域決定手段、
前記テキスト重複領域決定手段よって決定された前記1又はそれ以上のテキスト重複領域の1つの領域内で、水平テキストライン及び垂直テキストラインの夫々においてストローク又は画素点の総数をカウントするカウント手段、及び
前記カウント手段によってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも大きい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは横向きであると決定し、前記カウント手段によってカウントされた水平テキストラインにおけるストローク又は画素点の総数が垂直テキストラインにおけるストローク又は画素点の総数よりも小さい場合は、前記1又はそれ以上のテキスト重複領域の前記1つの領域の位置付けは縦向きであると決定するよう構成されるテキスト配置決定手段
として機能させるための文書画像処理プログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010257650.6 | 2010-08-17 | ||
CN2010102576506A CN102375988B (zh) | 2010-08-17 | 2010-08-17 | 文件图像处理方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012043408A true JP2012043408A (ja) | 2012-03-01 |
JP5644678B2 JP5644678B2 (ja) | 2014-12-24 |
Family
ID=45594120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011122757A Active JP5644678B2 (ja) | 2010-08-17 | 2011-05-31 | 文書画像を処理する方法、装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8345977B2 (ja) |
JP (1) | JP5644678B2 (ja) |
CN (1) | CN102375988B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018116647A (ja) * | 2017-01-20 | 2018-07-26 | リード テクノロジーズ,インコーポレイティド | テキストの回転角を決定する装置、方法及びコンピュータ可読記憶媒体 |
KR102138747B1 (ko) * | 2019-02-08 | 2020-07-28 | 네이버 주식회사 | 가로 글자와 세로 글자를 동시에 처리하기 위한 방법 및 시스템 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375988B (zh) * | 2010-08-17 | 2013-12-25 | 富士通株式会社 | 文件图像处理方法和设备 |
CA2863522C (en) | 2012-01-23 | 2018-08-28 | Microsoft Corporation | Formula detection engine |
CN103383732B (zh) | 2012-05-04 | 2016-12-14 | 富士通株式会社 | 图像处理方法和装置 |
US8787702B1 (en) * | 2012-11-30 | 2014-07-22 | Accusoft Corporation | Methods and apparatus for determining and/or modifying image orientation |
US9330070B2 (en) | 2013-03-11 | 2016-05-03 | Microsoft Technology Licensing, Llc | Detection and reconstruction of east asian layout features in a fixed format document |
TWI569982B (zh) * | 2014-04-16 | 2017-02-11 | 虹光精密工業股份有限公司 | 兼能處理大尺寸文件與小尺寸文件之雙面事務機 |
CN106295486B (zh) * | 2015-06-12 | 2019-11-05 | 富士通株式会社 | 文档图像的处理方法和处理装置 |
CN106845473B (zh) * | 2015-12-03 | 2020-06-02 | 富士通株式会社 | 用于确定图像是否为带地址信息的图像的方法和装置 |
US10146763B2 (en) | 2016-01-29 | 2018-12-04 | Bank Of America Corporation | Renderable text extraction tool |
JP2017151493A (ja) * | 2016-02-22 | 2017-08-31 | 富士ゼロックス株式会社 | 画像処理装置、画像読み取り装置及びプログラム |
CN108804978B (zh) * | 2017-04-28 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种版面分析方法及装置 |
JP7406884B2 (ja) * | 2019-06-27 | 2023-12-28 | キヤノン株式会社 | 情報処理装置、プログラム及び制御方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040001628A1 (en) * | 2002-06-28 | 2004-01-01 | Fujitsu Limited | Apparatus and method of analyzing layout of document, and computer product |
JP2004038530A (ja) * | 2002-07-03 | 2004-02-05 | Ricoh Co Ltd | 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5335290A (en) * | 1992-04-06 | 1994-08-02 | Ricoh Corporation | Segmentation of text, picture and lines of a document image |
US5774579A (en) * | 1995-08-11 | 1998-06-30 | Canon Kabushiki Kaisha | Block selection system in which overlapping blocks are decomposed |
US6104833A (en) * | 1996-01-09 | 2000-08-15 | Fujitsu Limited | Pattern recognizing apparatus and method |
JPH09222824A (ja) * | 1996-02-19 | 1997-08-26 | Toshiba Corp | 画像処理装置 |
JP4112968B2 (ja) * | 2002-12-26 | 2008-07-02 | 富士通株式会社 | ビデオテキスト処理装置 |
JP3714350B2 (ja) * | 2004-01-27 | 2005-11-09 | セイコーエプソン株式会社 | 画像中の人物候補領域抽出方法及び人物候補領域抽出システム並びに人物候補領域抽出プログラム |
US7930627B2 (en) * | 2005-09-22 | 2011-04-19 | Konica Minolta Systems Laboratory, Inc. | Office document matching method and apparatus |
CN100548030C (zh) * | 2007-05-29 | 2009-10-07 | 中国科学院计算技术研究所 | 一种基于时空条带模式分析的新闻主播镜头检测方法 |
US8384917B2 (en) * | 2010-02-15 | 2013-02-26 | International Business Machines Corporation | Font reproduction in electronic documents |
CN102375988B (zh) * | 2010-08-17 | 2013-12-25 | 富士通株式会社 | 文件图像处理方法和设备 |
JP5153857B2 (ja) * | 2010-11-25 | 2013-02-27 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体 |
-
2010
- 2010-08-17 CN CN2010102576506A patent/CN102375988B/zh not_active Expired - Fee Related
-
2011
- 2011-05-18 US US13/067,247 patent/US8345977B2/en active Active
- 2011-05-31 JP JP2011122757A patent/JP5644678B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040001628A1 (en) * | 2002-06-28 | 2004-01-01 | Fujitsu Limited | Apparatus and method of analyzing layout of document, and computer product |
JP2004038530A (ja) * | 2002-07-03 | 2004-02-05 | Ricoh Co Ltd | 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018116647A (ja) * | 2017-01-20 | 2018-07-26 | リード テクノロジーズ,インコーポレイティド | テキストの回転角を決定する装置、方法及びコンピュータ可読記憶媒体 |
KR102138747B1 (ko) * | 2019-02-08 | 2020-07-28 | 네이버 주식회사 | 가로 글자와 세로 글자를 동시에 처리하기 위한 방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
US20120045129A1 (en) | 2012-02-23 |
US8345977B2 (en) | 2013-01-01 |
JP5644678B2 (ja) | 2014-12-24 |
CN102375988B (zh) | 2013-12-25 |
CN102375988A (zh) | 2012-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5644678B2 (ja) | 文書画像を処理する方法、装置及びプログラム | |
Ke et al. | Musiq: Multi-scale image quality transformer | |
Xie et al. | Pyramid grafting network for one-stage high resolution saliency detection | |
CN109508681B (zh) | 生成人体关键点检测模型的方法和装置 | |
Bulat et al. | Super-fan: Integrated facial landmark localization and super-resolution of real-world low resolution faces in arbitrary poses with gans | |
CN104217202B (zh) | 信息识别方法、设备和系统 | |
CN108229290B (zh) | 视频物体分割方法和装置、电子设备、存储介质 | |
CN109523470B (zh) | 一种深度图像超分辨率重建方法及系统 | |
CN109308678B (zh) | 利用全景图像进行重定位的方法、装置及设备 | |
Zhang et al. | Distractor-aware fast tracking via dynamic convolutions and mot philosophy | |
Li et al. | Short-term and long-term context aggregation network for video inpainting | |
Ignatov et al. | Aim 2019 challenge on raw to rgb mapping: Methods and results | |
CN109313805A (zh) | 图像处理装置、图像处理系统、图像处理方法和程序 | |
Zhang et al. | Benchmarking ultra-high-definition image super-resolution | |
WO2013089265A1 (ja) | 辞書作成装置、画像処理装置、画像処理システム、辞書作成方法、画像処理方法及びプログラム | |
CN108846385B (zh) | 基于卷积-反卷积神经网络的图像识别、校正方法和装置 | |
WO2019065703A1 (ja) | 情報処理装置 | |
CN109871841A (zh) | 图像处理方法、装置、终端及存储介质 | |
CN111833237A (zh) | 基于卷积神经网络和局部单应性变换的图像配准方法 | |
JP6062207B2 (ja) | 画像処理方法、および画像処理装置 | |
CN106530219A (zh) | 图像拼接方法及装置 | |
Tang et al. | An object fine-grained change detection method based on frequency decoupling interaction for high-resolution remote sensing images | |
EP4287072A1 (en) | Methods for performing multi-view object detection by using homography attention module and devices using the same | |
Liu et al. | Unsupervised global and local homography estimation with motion basis learning | |
US8805080B2 (en) | Method of and device for identifying direction of characters in image block |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140304 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141020 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5644678 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |