JP2002056398A - 文書画像処理装置、文書画像処理方法、及び記憶媒体 - Google Patents

文書画像処理装置、文書画像処理方法、及び記憶媒体

Info

Publication number
JP2002056398A
JP2002056398A JP2000241492A JP2000241492A JP2002056398A JP 2002056398 A JP2002056398 A JP 2002056398A JP 2000241492 A JP2000241492 A JP 2000241492A JP 2000241492 A JP2000241492 A JP 2000241492A JP 2002056398 A JP2002056398 A JP 2002056398A
Authority
JP
Japan
Prior art keywords
pixel block
document image
page
unit
reference position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000241492A
Other languages
English (en)
Other versions
JP3962891B2 (ja
Inventor
Yukio Kumazawa
幸夫 熊澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2000241492A priority Critical patent/JP3962891B2/ja
Priority to US09/917,766 priority patent/US6959121B2/en
Publication of JP2002056398A publication Critical patent/JP2002056398A/ja
Application granted granted Critical
Publication of JP3962891B2 publication Critical patent/JP3962891B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 任意のフォーマットの文書に対して位置補正
が可能な文書画像処理装置を提供する。 【解決手段】 予め、文書画像の基準位置を基準位置指
定部4において指定しておく。画像入力部1でページご
とに文書画像が入力され、画像記憶部2に保持される。
所定画素塊抽出部3は、1ページ分の文書画像中から、
各ページに共通して存在する所定の画素塊を抽出し、そ
の座標値を差分抽出部5に送る。差分抽出部5では、所
定画素塊抽出部3で抽出した所定の画素塊の位置と、基
準位置指定部4で指定された基準位置との差分値を算出
し、画像移動部6に送る。画像移動部6は、差分抽出部
5で算出した差分値に基づいて当該ページの文書画像を
移動し、文書画像の位置補正を行う。位置補正に用いる
所定の画素塊は任意に設定できるので、任意のフォーマ
ットの文書について位置補正が可能である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像の位置補
正を行う文書画像処理装置及び文書画像処理方法と、そ
のような処理をコンピュータに実行させるプログラムを
記憶したコンピュータが読み取り可能な記憶媒体に関す
るものである。
【0002】
【従来の技術】紙文書をスキャナ等により電子化して入
力し、様々な画像ファイルフォーマットにて保管・管理
し、ディスプレイなどの表示装置やプリンタなどの出力
装置に出力するシステムが広く利用されている。紙文書
をスキャナなどで読み込んだ文書画像は、例えばスキャ
ナに対する紙文書のセットの状態や、文書を搬送するタ
イプのスキャナでは、搬送時のスキューなど、種々の要
因によって文書位置がずれてしまうことがある。
【0003】上述のように紙文書を電子化して保管・管
理するシステムでは、文書画像を最良の状態で保管・管
理することが望まれる。そのため、上述のような読み取
った文書画像の位置のずれを補正し、文書画像の位置を
そろえる処理を行うことが考えられている。
【0004】画像の位置ずれに関する従来の技術とし
て、例えば特開平11−120288号公報に記載され
ているように、基準となる位置に罫線で表現される表が
文書中に存在するとき、表の縦線と横線の位置を黒画素
のランレングスで抽出し、位置のずれを検出する方法が
ある。しかしこの方法では、文書画像中に罫線のある表
が必要であり、表のない文書では位置のずれを検出し、
補正することができない。
【0005】また、例えば特開平11−282959号
公報に記載されているように、所定の書式の文書を対象
とし、文字列が存在すべき座標を辞書として記憶してお
き、入力した文書画像から文字列の位置を画素投影法に
より検出し、辞書にある座標の値と投影法により検出し
た座標値との差によりずれを検出する方法がある。しか
しこの方法では、文書画像データは多階調である必要が
あるため多くのメモリを必要とする。また、各文字と文
字列の位置があらかじめ決められた定型の文書でないと
文書の位置のずれを検出し、補正することはできない。
そのため、フォーマットの異なる文書を蓄積して保管す
るといった用途には利用できないという問題がある。さ
らに、文字列を検出できなかったときには補正処理を中
止するだけであり、その後の処理について考慮されてい
なかった。
【0006】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、任意のフォーマットの文書
に対して位置補正を行うことができる文書画像処理装置
を提供することを目的とするものである。また、位置補
正ができなかった文書について後での取り扱いを容易に
した文書画像処理装置及び文書画像処理方法を提供する
ことを目的とするものである。さらに、そのような処理
をコンピュータに実行させるプログラムを記憶したコン
ピュータが読み取り可能な記憶媒体を提供することを目
的とするものである。
【0007】
【課題を解決するための手段】本発明は、少なくとも一
部のページに共通して存在する所定の画素塊を入力され
た文書画像から抽出し、抽出した所定の画素塊の位置が
基準位置又は基準となる画素塊の位置となるように、入
力された文書画像全体の位置を補正するものである。こ
のように、位置補正を行う際の画素塊は少なくとも一部
のページに共通して存在するものであればよい。従っ
て、従来のように文書中に必ず表が存在しなければなら
ないといった制限はなく、また固定的な文字列などを設
けておく必要もなく、任意のフォーマットの文書につい
て、予め指定された基準位置又は基準となる画素塊の位
置となるように文書画像の位置を補正することができ
る。
【0008】所定の画素塊は予め設定しておくほか、例
えば処理すべき複数ページの文書画像のレイアウトを解
析し、各ページの文書画像中の同様の位置にほぼ同一の
画素塊が存在する場合に、その画素塊を所定の画素塊と
することができる。またこのときに基準位置も決定して
おくか、あるいは、基準位置についてはユーザに指定し
てもらう。そして、各ページの文書画像中の所定の画素
塊の位置が基準位置となるように、各ページの文書画像
全体の位置を補正すればよい。このようにして、文書画
像中に共通して現れる画素塊を自動的に抽出し、それを
基準として文書画像の位置を補正することができる。
【0009】なお、基準位置または基準となる画素塊の
位置は、例えば見開きの文書などのように右ページと左
ページで異なる場合には、左ページと右ページについて
それぞれの位置が設定されてもよい。また、各ページの
文書画像について、先にスキュー補正を行っておくと、
所定の画素塊の抽出が容易になるとともに、位置補正後
の文書画像に傾きなどが発生せず、良好な処理結果を提
供することができる。さらに、入力された文書画像のペ
ージを認識し、ページ順にソートして出力してもよい。
特に所定の画素塊としてページ番号の記載領域を抽出す
る場合には、位置補正用に抽出した画素塊について文字
認識を行えば文書画像のページを認識することが可能で
ある。
【0010】上述のような位置補正の処理を行う際に、
所定の画素塊を抽出できないときには位置補正を行うこ
とができない。このような場合には、該当する文書画像
に関する情報を未検出ログとして記録しておく。このよ
うにして、位置補正できない文書画像を除き、多くの文
書画像の位置補正を自動的に行った上で、位置補正でき
なかった文書画像についてユーザに提示することが可能
になる。ユーザは、記録されている未検出ログをもと
に、位置補正できなかった文書画像のみについて位置補
正を行えばよい。
【0011】
【発明の実施の形態】図1は、本発明の第1の実施の形
態を示すブロック図である。図中、1は画像入力部、2
は画像記憶部、3は所定画素塊抽出部、4は基準位置指
定部、5は差分抽出部、6は画像移動部である。画像入
力部1は、スキャナなどの画像読取装置で構成され、文
書上の画像を読み取り、文書画像として出力する。もち
ろん文書画像がファイルなどとして既に存在している場
合には、画像入力部1はファイルなどから文書画像を読
み込むものであってよい。さらに、文書画像がネットワ
ークなどを介して転送されてくるような構成でもよく、
この場合には画像入力部1はネットワークのインタフェ
ースとして構成することができる。このように画像入力
部1は文書画像の入力形態に応じて構成される。
【0012】画像記憶部2は、画像入力部1で入力され
た文書画像をページ単位で保持する。また、位置補正処
理を行った後の文書画像についても保持することができ
る。もちろん、位置補正処理後の文書画像は別の記憶部
に保持したり、あるいは外部へ出力するように構成し、
この画像記憶部2には保持しないようにしてもよい。ま
た、次の所定画素塊抽出部3や画像移動部6の要求に応
じて文書画像を画像入力部1で入力可能であれば、入力
された文書画像をこの画像記憶部2に保持しなくてもよ
いし、画像記憶部2自体を設けなくてもよい。
【0013】所定画素塊抽出部3は、画像記憶部2に保
持している各ページの文書画像中から所定の画素塊を抽
出し、抽出した所定の画素塊の座標を差分抽出部5へ出
力する。所定の画素塊は、処理する各文書画像中に共通
に存在する文書構成要素とし、例えばページ番号、ヘッ
ダ、フッタ、ロゴなどとすることができる。これらの文
書構成要素のうちの1つについて所定の画素塊とし、そ
の所定の画素塊を文書画像のレイアウト解析によって取
得したり、あるいは、予め所定の画素塊が存在する大ま
かな領域を特定座標領域として設定しておき、その特定
座標領域から所定の画素塊を抽出することができる。こ
の所定の画素塊を抽出する際に、基準位置指定部4で指
定される基準位置を利用することも可能である。なお、
所定の画素塊の抽出方法の具体例については後述する。
【0014】基準位置指定部4は、所定の画素塊を移動
させたい座標を基準位置として指定する。具体的には基
準位置指定部4は、例えばキーボード、マウス、ディス
プレイ等からなるユーザインタフェースで構成すること
ができ、このユーザインタフェースを介してユーザから
基準位置として与えられる文書画像中での位置情報を獲
得し、2次元の座標データとして差分抽出部5へ座標値
を出力する。
【0015】差分抽出部5は、所定画素抽出部3から出
力される座標値と基準位置指定部4から出力される座標
値の差を求め、差分値を画像移動部6へ出力する。
【0016】画像移動部6は、差分抽出部5から入力し
た差分量に従い、画像記憶部2に保持されている当該ペ
ージの文書画像全体を差分量だけ移動させる。これによ
って文書画像の位置補正が行われる。位置補正後の文書
画像は、この例では画像記憶部2に保持させる。このと
き、位置補正前の文書画像と置き換えてもよい。あるい
は、位置補正後の文書画像をそのまま出力してもよい。
【0017】次に、本発明の第1の実施の形態における
動作について、概要を説明する。図2は、本発明の第1
の実施の形態における動作の具体例の説明図、図3は、
位置補正後の文書画像の具体例の説明図である。ここで
は、例えば図2(B)に示すような文書画像において、
所定の画素塊としてページの右下に記載されたページ番
号(図中の「11」の部分)を抽出して基準位置に合わ
せるものとする。
【0018】まず、予め基準位置指定部4を用いて、所
定の画素塊を配置したい基準位置の座標を指定してお
く。例えば図2(A)に×印で示す位置をユーザが基準
位置指定部4で基準位置として指定したものとする。指
定された基準位置の座標が差分抽出部5に出力される。
【0019】基準位置の指定が終わった後、画像入力部
1は、例えば紙文書をスキャナ等により読み込んだり、
あるいは予めビットマップの形式で保存されている1な
いし複数ページの文書画像を受け取り、画像記憶部2へ
送る。図2(B)には、画像入力部1に入力された文書
画像の一例を示している。この例では、文書内容が全体
的に左上にずれた画像となっている。
【0020】所定画素塊抽出部3は、画像記憶部2に保
持されている所定ページの文書画像中から所定の画素塊
を抽出し、抽出した画素塊の座標を差分抽出部5へ出力
する。この例では上述のように文書画像中のページ番号
を所定の画素塊として抽出する。図2(B)に示す例で
は、下部の右よりの領域に存在するページ番号「11」
を所定の画素塊として抽出する。
【0021】差分抽出部5は、所定画素抽出部3から出
力される座標値と、基準位置指定部4から出力される座
標値の差を求め、差分値を画像移動部6へ出力する。図
2(C)において、所定画素抽出部3で抽出したページ
番号を表す所定の文字塊「11」と、図2(A)に示し
た基準位置指定部4で指定された基準位置の座標(×で
示す)との差分値(両矢印で示す)を求める。なお、所
定の画素塊中のいずれの位置と基準位置との差を求める
かは任意であり、例えば所定の画素塊の中心や左上隅、
右下隅等とすることができる。
【0022】画像移動部6は、差分抽出部5から出力さ
れた差分値に従い、画像記憶部2に記憶されている所定
ページの文書画像全体を差分値に従って移動させる。こ
れによって、例えば図2(B)に示すように右上にずれ
ていた文書画像は、図2(C)に示す差分値だけ右下に
移動され、図3に示すような文書画像が得られる。得ら
れた位置補正後の文書画像は、そのまま出力したり、あ
るいは画像記憶部2に再度格納する。
【0023】このようにして1ページ分の文書画像につ
いて、位置補正の処理が終了する。画像入力部1は、画
像移動部により文書画像の位置補正処理が終了すると、
次のページの画像データを読み込み、画像記憶部2へ送
る。以降、順番にすべてのページの画像データの移動が
終わるまで繰り返し実行する。あるいは、画像入力部1
はすべてのページの文書画像を画像記憶部2に保持させ
ておき、所定画素塊抽出部3以降の処理を各ページの文
書画像について繰り返して実行してもよい。この場合、
画像入力部1による画像記憶部2への2ページ目以降の
文書画像の格納は、所定画素塊抽出部3以降の処理と並
行して実行することも可能である。
【0024】上述の処理をすべてのページの文書画像に
ついて実行することによって、各ページの文書画像の位
置を揃えることができる。上述の具体例では右下に存在
するページ番号を所定の画素塊として抽出し、位置補正
を行う例を示したが、これに限らず、各ページに共通し
て存在する任意の文書構成要素を所定の画素塊として抽
出し、位置補正を行うことが可能である。
【0025】次に、所定画素塊抽出部3の構成及び動作
についてさらに説明する。図4は、所定画素塊抽出部3
におけるレイアウト解析による所定画素塊の抽出の具体
例の説明図である。所定画素塊抽出部3において所定の
画素塊を抽出するための一つの方法として、ページ全体
のレイアウトを解析して、基準位置に近い画素塊を所定
の画素塊として抽出する方法がある。例えば1ページ分
の文書画像を解析し、図4(A)に実線で示すように文
書中の各構成要素をそれぞれ矩形領域として抽出する。
ここで、基準位置指定部4から図中の破線で示した×印
の位置が基準位置として指定されている場合、この基準
位置に最も近い矩形領域を図4(B)に示すように所定
の画素塊として抽出することができる。以下に、このよ
うなレイアウト解析を行って所定の画素塊を抽出する構
成について示す。
【0026】図5は、所定画素塊抽出部3の一例を示す
ブロック構成図、図6は、所定画素塊抽出部3の一例に
おける動作の具体例の説明図である。図中、11は矩形
枠抽出部、12は文字列方向指定部、13は連結矩形枠
作成部、14は連結矩形枠抽出部である。矩形枠抽出部
11は、黒画素が連結している領域を矩形枠の座標群で
抽出する。例えば図2(B)に示すような文書画像が入
力されている場合には、矩形枠抽出部11は、この文書
画像中の黒画素の連結から黒画素の外接矩形枠を抽出
し、その結果、図6(A)に示すような矩形枠が得られ
る。
【0027】文字列方向指定部12は、文字列の方向を
指定する。例えば図2(B)に示すような文書画像の場
合には、文字列方向を横と指定すればよい。この文字列
方向指定部12は、基準位置指定部4と同様にユーザイ
ンタフェースで構成することができる。あるいは、入力
された文書画像に文字列方向を示す情報が付加されてい
れば、その情報を利用することもできる。もちろん、予
め決めておいたり、外部から指定されてもよい。
【0028】連結矩形枠作成部13は、矩形枠抽出部1
1で抽出した矩形枠を、文字列方向指定部12で指定さ
れた文字列の方向に連結して連結矩形枠を作成する。例
えば矩形枠抽出部11で図6(A)に示すように矩形枠
が抽出され、文字列方向指定部12で文字列の方向とし
て横方向が指定された場合には、各矩形枠を横方向に連
結し、図6(B)に示すような連結矩形枠を作成する。
【0029】連結矩形枠抽出部14は、連結矩形枠作成
部13で作成した連結矩形枠のうちから、所定の画素塊
に対応する連結矩形枠を抽出する。連結矩形枠の抽出方
法としては、例えば基準位置指定部4から基準位置の座
標を受け取ることができる場合には、その基準位置に近
い連結矩形枠を抽出すればよい。例えば図6(B)にお
いて破線の×印で示した位置が基準位置として指定され
ているとき、図6(C)に示すように基準位置に最も近
い連結矩形枠が抽出されることになる。このようにして
所定の画素塊を抽出することができる。この図6(C)
に示す連結矩形枠(所定の画素塊)の所定の位置の座標
が差分抽出部5に出力されることになる。
【0030】図7は、文字列方向指定部12の一例を示
すブロック構成図、図8は、文字列方向指定部12の一
例における動作の具体例の説明図である。図中、図5と
同様の部分には同じ符号を付して説明を省略する。21
は縦方向白ラン抽出部、22は縦方向白ラン連結部、2
3は縦方向連結白ラン選択部、24は横方向白ラン抽出
部、25は横方向白ラン連結部、26は横方向連結白ラ
ン選択部、27は連結白ラン数比較及び文字列方向決定
部である。この例では、図5に示した例における説明で
は、文字列方向指定部12をユーザインタフェースで構
成し、ユーザが文字列の方向を指定する例を示した。こ
れに限らず、文字列方向を文書画像の解析によって自動
的に検出することが可能であり、図7及び図8にその場
合の構成及び動作を示している。
【0031】まず、文書画像を縦方向と横方向に走査
し、一定以上の長さを持つ白ランを縦方向白ラン抽出部
21及び横方向白ラン抽出部24において抽出する。そ
して、縦方向白ラン連結部22は、縦方向白ラン抽出部
21で抽出した隣接する白ランを統合する。同様に、横
方向白ラン連結部25は、横方向白ラン抽出部24で抽
出した隣接する白ランを統合する。図2(B)に示した
文書画像について縦方向白ラン抽出部21で抽出した白
ランを縦方向白ラン連結部22で統合した状態を図8
(A)にハッチングを施して示している。また、同じく
横方向白ラン抽出部24において抽出した白ランを横方
向白ラン連結部25で統合した状態を図8(B)にハッ
チングを施して示している。
【0032】このようにして横方向と縦方向に白ランを
統合した後、連結白ラン数比較及び文字列方向決定部2
7において、統合された白ランの領域の数(連結白ラン
数)を数え、縦方向と横方向で連結白ラン数を比較する
ことによって文書画像の文字列方向を決める。一般に横
書き文書では横方向の連結白ラン数が多く、縦書きでは
縦方向が多い。図2(B)に示すような文書画像の例の
場合には、図8(A)、(B)から分かるように横方向
の連結白ラン数が多く、横書きの文書であると判断され
る。
【0033】上述の図5に示した例と同様に、矩形枠抽
出部11で外接矩形枠を抽出した後、上述のようにして
連結白ラン数比較及び文字列方向決定部27から出力さ
れる文字列方向をもとに、連結矩形枠作成部12は連結
矩形枠を作成する。そして、所定の画素塊を連結矩形枠
抽出部13で抽出して出力することになる。図2(B)
に示した文書画像の例では、矩形枠抽出部11で図6
(A)に示すように外接矩形枠が抽出された後、上述の
ようにして連結白ラン数比較及び文字列方向決定部27
から出力される文字列方向(この例では横書き)をもと
に、連結矩形枠作成部12は図6(B)に示すような連
結矩形枠が作成される。そして、例えば図6(C)に示
すように、基準位置に最も近い連結矩形枠が所定の画素
塊として抽出されることになる。
【0034】なお、基準位置に最も近い連結矩形枠を選
択する際に、もともと選択すべき矩形枠(画素塊)が存
在しない場合の誤選択を防止するため、例えば領域や距
離などの制限を付しておくとよい。
【0035】図9は、本発明の第2の実施の形態を示す
ブロック図である。図中、図1と同様の部分には同じ符
号を付して説明を省略する。31はレイアウト解析部、
32はページレイアウト保持部、33は共通要素抽出部
である。この第2の実施の形態では、各ページの文書画
像に共通して存在する画素塊を自動的に検出し、その検
出した画素塊を所定の画素塊として基準位置に合わせる
構成を示している。この第2の実施の形態における所定
画素塊抽出部3は、レイアウト解析部31,ページレイ
アウト保持部32,共通要素抽出部33などを有してい
る。
【0036】レイアウト解析部31は、画像記憶部2に
保持されている文書画像のレイアウトを解析し、各領域
の黒画素塊の属性(文字、図形、グラフなど)を取得す
る。レイアウト解析部31で取得されたレイアウトデー
タは、ページごとにページレイアウト保持部32に保持
される。
【0037】共通要素抽出部33は、ページレイアウト
保持部32に保持されているページ毎のレイアウト情報
(領域の座標値と属性)を解析し、各ページから抽出し
た矩形枠で各ページ間の座標値の差が小さく、属性が同
じ矩形枠を抽出する。その矩形枠を所定の画素塊とすれ
ばよい。なお、複数の矩形枠が抽出される場合には、す
べてを利用してもよいし、そのうちの1ないし複数を選
択して利用してもよい。抽出された矩形枠の選択時に
は、例えば位置の誤差が小さい、矩形枠の大きさのバラ
ツキが少ない、矩形枠の位置がどこであるかなどの選定
条件を設け、その選定条件に従って矩形枠を選択すれば
よい。この例ではさらに、共通要素抽出部33はそれぞ
れのページの文書画像について、上述のようにして抽出
した所定の画素塊の座標を差分抽出部5へ出力する。さ
らに、各ページの文書画像中の所定の画素塊の位置か
ら、例えば平均値や統計的な手法などを用いて基準位置
を算出してもよい。
【0038】差分抽出部5は、共通要素抽出部33から
出力される所定の画素塊の座標と、基準位置指定部4で
指定された基準位置との差分値を求める。共通要素抽出
部33で基準位置を算出する場合には、算出された基準
位置を用いて各ページの文書画像中の所定の画素塊の位
置との差分値を求めてもよい。この場合には基準位置指
定部4は不要である。
【0039】次に、本発明の第2の実施の形態における
動作の一例について、具体例を用いながら概要を説明す
る。図10は、本発明の第2の実施の形態における動作
の具体例の説明図である。まず画像入力部1から1ペー
ジ分の文書画像が画像記憶部2に保持されると、レイア
ウト解析部31は文書画像のレイアウトを解析し、各領
域の画素塊の属性(文字、図形、グラフなど)を取得し
てページレイアウト保持部32に格納する。図10
(A)には、1ページ目のレイアウト解析結果を模式的
に示している。この例では、右上部にロゴマークなどの
図形が存在し、中央部に本文などの文字領域が存在し、
下部中央にページ番号などの文字領域が存在している。
【0040】1ページ目の文書画像のレイアウト解析が
終了すると、画像入力部1は、2ページ目の文書画像を
画像記憶部2へ送る。レイアウト解析部31は、同様に
して画像記憶部2に保持されている文書画像のレイアウ
トを解析し、画素塊の属性を取得してページレイアウト
保持部32に格納する。図10(B)には、2ページ目
のレイアウト解析結果を模式的に示している。この例で
は、右上部にロゴマークなどの図形が存在し、中央部右
側にグラフなどの図形が、またその図形の左側と中央下
部に本文などの文字領域が存在し、下部中央にページ番
号などの文字領域が存在している。
【0041】以後同様にして、レイアウト解析部31は
すべてのページの文書画像についてレイアウト解析を行
い、解析結果をページレイアウト保持部32へ格納して
ゆく。図10(C)にはnページ目のレイアウト解析結
果を模式的に示しており、途中のページについても同様
のレイアウト解析結果が得られる。
【0042】このようにしてすべてのページのレイアウ
ト情報をページレイアウト保持部32に格納したら、共
通要素抽出部33は、ページレイアウト保持部32に保
持されているページ毎のレイアウト情報(領域の座標値
と属性)を解析し、各ページから抽出した矩形枠の間で
座標値の差が小さく、属性が同じ矩形枠を抽出する。図
10(A)〜(C)に示すようなレイアウト解析結果が
得られている場合には、図10(D)に示すように右上
部に配置されている図形と、下部中央に配置されている
文字領域が抽出される。中央部の領域については各ペー
ジにおいて形状が大きく異なっており、抽出されない。
【0043】図10(D)に示す例では、共通した矩形
枠が複数抽出されている。このような場合、予め設定さ
れた選定条件に基づいて選択することができる。例えば
ページ間で誤差が小さいものや、大きさが揃っているも
のを選択することができる。または、上部にあるもの、
下部にあるもの等といった存在位置や、矩形枠の属性
(例えば図形、文字など)によって選択してもよい。あ
るいはユーザがユーザインタフェースを用いて選択した
り、基準位置指定部4によって指定された基準位置に最
も近いものを選択してもよい。
【0044】このようにして共通の矩形枠が抽出され、
複数の場合にはそのうちの1つが選択されたら、その矩
形枠を所定の画素塊とする。そして、各ページの文書画
像における所定の画素塊(矩形枠)の座標を順次差分抽
出部5へ送る。
【0045】差分抽出部5では、共通要素抽出部33か
ら送られてくる所定の画素塊の座標と、基準位置指定部
4で指定された基準位置との差分値を算出する。あるい
は、共通要素抽出部33で基準位置についても算出し、
この基準位置を用いて同じく共通要素抽出部33から送
られてくる所定の画素塊の座標との差分値を算出しても
よい。差分値は画像移動部6に送られ、この差分値に従
って画像移動部6で文書画像の移動を行う。このように
して、自動的に所定の画素塊を探索して設定し、基準位
置に合わせるように位置補正処理を行うことができる。
【0046】図11は、本発明の第3の実施の形態を示
すブロック構成図、図12は、スキューを含む文書画像
の一例の説明図である。図中、図1と同様の部分には同
じ符号を付して説明を省略する。41はスキュー補正部
である。入力される文書画像は、例えば図2に示したよ
うに位置がずれているほか、傾いている場合もある。例
えば文書画像を入力する際に、画像読取装置で紙文書を
搬送する際に傾いたり、紙文書をセットする際に傾いた
ままセットしたり、あるいは、紙文書上に形成されてい
る画像自体が傾いている場合など、種々の要因によって
文書画像に傾きが生じる。この第3の実施の形態では、
このような文書画像の傾きについても補正するものであ
る。
【0047】スキュー補正部41は、画像入力部1から
送られてくる文書画像について傾きを検出し、傾きがな
くなるように文書画像の回転処理を行って画像記憶部2
に保持させる。傾きの検出方法は任意である。例えば、
文書画像から黒画素塊を囲む矩形枠を抽出し、文字とし
て想定する大きさの矩形枠のみを選択する。文字として
想定する大きさは、例えば入力された文書画像の解像度
が100dpiなら6ドット以上80ドット以下の大き
さ程度に設定しておくとよい。このようにして選択され
た矩形枠の中心座標群を求め、これらの中心座標群から
ハフ変換により傾き角度を計算すればよい。このように
して計算された傾き角度だけ文書画像の回転を行えばよ
い。
【0048】例えば図12(A)に示すように傾いた文
書画像が入力された場合、黒画素塊を囲む矩形枠を抽出
して想定する大きさの矩形枠を選択すると、図12
(B)に示すような矩形枠が得られる。得られた矩形枠
の中心座標群からハフ変換を行って傾き角度を求め、そ
の角度だけ図12(A)に示す文書画像を回転すればよ
い。このようにして、スキューなどの傾きが文書画像に
存在していても、それを補正することができる。
【0049】なお、画像記憶部2に傾き補正後の文書画
像が保持された以降の処理については上述の第1の実施
の形態と同様であるので、ここでは説明を省略する。図
11に示した例では第1の実施の形態として示した構成
にスキュー補正部41を設けたが、これに限らず、第2
の実施の形態に対して適用してもよい。
【0050】この第3の実施の形態では、入力された文
書情報を画像記憶部2に保持させる前に傾き補正処理を
行っているが、傾き補正処理に限らず、種々の処理を入
力された文書情報を画像記憶部2に保持させる前に行う
ことが可能である。例えば複数ページの文書画像中に天
地が逆の画像が存在する場合、そのままでは位置補正が
できないし、保存にも耐えられる画像ではない。そこ
で、天地が逆か否かを判定し、天地が逆の文書画像につ
いては180度回転させる処理を行うとよい。もちろ
ん、他の処理も含め、2以上の処理を組み合わせて行っ
てもよい。
【0051】図13は、本発明の第4の実施の形態を示
すブロック構成図、図14は、奇数ページと偶数ページ
とでレイアウトが異なる文書の一例の説明図である。図
中、図1と同様の部分には同じ符号を付して説明を省略
する。51は奇数ページ基準位置指定部、52は偶数ペ
ージ基準位置指定部、53はページ切替部である。入力
される文書画像によっては、見開きの文書をそれぞれの
ページごとに入力される場合がある。このような見開き
の文書においては、ページ番号やヘッダ、フッタ、ロゴ
などの位置が左右対称に設けられるなど、奇数ページと
偶数ページとで異なるレイアウトである場合がある。例
えば図14に示した例では、偶数ページではページ番号
が左下に振られ、奇数ページでは右下に振られている。
このような文書画像が入力された場合、1つの基準位置
の指定だけでは奇数ページあるいは偶数ページのいずれ
かの位置が大きくずれてしまったり、あるいは所定の画
素塊が抽出できなくなって位置あわせを行えなくなって
しまう。この第4の実施の形態では、奇数ページと偶数
ページとでそれぞれ基準位置を指定することで、このよ
うな問題を解消したものである。
【0052】奇数ページ基準位置指定部51は、奇数ペ
ージにおける基準位置を指定する。また、偶数ページ基
準位置指定部52は、偶数ページにおける基準位置を指
定する。なお、奇数ページ基準位置指定部51及び偶数
ページ基準位置指定部52は、同じユーザインタフェー
スを用いて構成してもよい。
【0053】ページ切替部53は、位置補正の対象とな
っている文書画像が奇数ページであるか偶数ページであ
るかによって、奇数ページ基準位置指定部51で指定さ
れた基準位置あるいは偶数ページ基準位置指定部52で
指定された基準位置のいずれかを選択して差分抽出部5
に送る。
【0054】それ以外の部分の動作は上述の第1の実施
の形態と同様であり、差分抽出部5では、ページ切替部
53から送られてくる基準位置と所定画素塊抽出部3で
抽出した所定画素塊の位置との差分値を算出すればよ
く、その差分値を用いて画像移動部6で文書画像の移動
を行えばよい。
【0055】なお、所定画素塊抽出部3において、指定
された基準位置を利用して所定の画素塊を抽出する場合
には、ページ切替部53から出力される基準位置を用い
て所定の画素塊を抽出すればよい。これによって奇数ペ
ージと偶数ページとで異なる位置に配置されている所定
の画素塊を正確に抽出することができる。
【0056】図13に示した例では第1の実施の形態と
して示した構成に、奇数ページ及び偶数ページそれぞれ
の基準位置を指定する構成を設けた例を示した。しかし
これに限らず、例えば上述の第2の実施の形態において
基準位置指定部4を用いる構成において適用することも
可能である。また上述の第2の実施の形態においては、
所定画素塊抽出部3で所定の画素塊を特定する際に、奇
数ページのレイアウト情報と偶数ページのレイアウト情
報に分けて、それぞれ、所定の画素塊を特定するように
構成するとよい。もちろんこの第4の実施の形態は、上
述の第3の実施の形態と組み合わせることも可能であ
る。
【0057】図15は、本発明の第5の実施の形態を示
すブロック構成図、図16は、ページソートの一例の説
明図である。図中、図1と同様の部分には同じ符号を付
して説明を省略する。61は文字認識部、62は認識結
果保存部、63はページソート部である。入力される文
書画像によっては、ページ順序が入力される順序と異な
る場合がある。例えば画像読取装置に紙原稿をセットし
たときに原稿が入れ替わっていた場合には入力された文
書画像のページ順序が入れ替わってしまう。このような
場合に、例えば所定の画素塊としてページ番号が記載さ
れた文字領域を用いる場合、抽出した所定の画素塊につ
いて文字認識を行えばページ番号を知ることができる。
これを利用して、入力された文書画像の並べ替えが可能
である。この第5の実施の形態では、このようなページ
順序の並べ替えを実現する例を示している。
【0058】文字認識部61は、所定画素塊抽出部3で
抽出された所定の画素塊、すなわちページ番号が記載さ
れた文字領域の画像について文字認識処理を行い、ペー
ジ番号を取得する。認識結果保存部62は、各ページの
文書画像毎に文字認識部61で認識されるページ番号を
保存する。ページソート部63は、認識結果保存部62
に保存されているページ番号を参照し、例えばページ番
号が昇順となるように画像記憶部2内の各ページの文書
画像の順序を入れ替える。このとき、画像記憶部2内の
文書画像自体を移動させて入れ替えてもよいし、入力順
序のインデックスを並べ替えてもよい。
【0059】また、画像入力部1にファイル名のリスト
を与え、画像入力部1が与えられたリストをもとにファ
イルから文書画像を読み出して入力する場合には、文字
認識部61で認識したページ番号を、画像入力部1で文
書画像を読み出す際に使用したファイル名と対応付けて
認識結果保存部62に格納しておき、ページソート部6
3でページ順序を並べ替えてもよい。図16にはこの場
合の例を示しており、文字認識部61で認識されたペー
ジ番号はファイル名と対応付けられて、図16(A)に
示すように認識結果保存部62に格納される。ページソ
ート部63は認識結果保存部62に格納された認識結果
を基にページ番号によって並べ替えを行い、図16
(B)に示すような並べ替えたファイル名のリストを得
る。並べ替えたファイル名のリストは、画像記憶部2に
格納したり、あるいは外部へ出力することができる。こ
れによって、ページ順序が昇順に並んでいなくても、位
置補正のために抽出した所定の画素塊をもとにページ番
号を認識し、ページ順序を並べ替えることができる。な
お、認識結果保存部62には文字認識部61による認識
結果のみを保持させ、ページソート部63でファイル名
のリストを取得して、認識結果保存部62内の文字認識
結果に従ってファイル名を並べ替えてもよい。
【0060】本発明の第5の実施の形態について、簡単
に動作の一例を説明しておく。ここでは処理対象となる
文書画像のファイル名のリストが与えられるものとして
説明する。画像入力部1は、与えられたファイル名のリ
ストを元にページ毎に文書画像を読み出し、画像記憶部
2へ出力する。所定画素塊抽出部3は、文書画像中から
所定の画素塊、ここではページ番号やページ順序を示す
文字列を含む画素塊を抽出する。基準位置指定部4,差
分抽出部5,画像移動部6の動作は上述の第1の実施の
形態などと同様であり、抽出した所定の画素塊の位置と
基準位置との差分値に従って当該ページの文書画像の位
置を補正する。
【0061】一方、所定画素塊抽出部3で抽出した所定
の画素塊は文字認識部61に送られる。文字認識部61
は、入力された所定の画素塊について文字認識処理を行
い、認識結果を認識結果保存部62へ送る。認識結果保
存部62は、現在処理しているページのファイル名と文
字認識結果を対にして保存する。
【0062】画像入力部1は、画像移動部により1ペー
ジ分の文書画像の位置補正処理及びページ番号の認識処
理が終了すると、次のページの文書画像を読み込み、画
像記憶部2へ送る。以降、順番にすべてのページの文書
画像について、位置補正処理及びページ番号の認識処理
を行ってゆく。
【0063】最後のページの文書画像について位置補正
処理及びページ番号の認識処理が終了したら、ページソ
ート部63は、認識結果保存部62に保存している文字
認識結果のコード順(ページ番号順)にファイル名のリ
ストをソートし、順番を入れ替える。このようにして、
与えられたファイル名を正しいページ順序で並べ替える
ことができる。
【0064】なお、上述の動作例では文書画像のファイ
ル名のリストが画像入力部1に与えられる場合の例を示
したが、例えば画像入力装置から文書画像が順次読み取
られる場合や、回線などを介して文書画像が順次入力さ
れる場合もある。これらの場合には入力された1ページ
分の文書画像毎に一連番号やファイル名などの識別情報
を付与しておき、この識別情報を並べ替えればよい。あ
るいは、並べ替えた順に再度識別情報を付与し直しても
よい。
【0065】また、図15に示した例では上述の第1の
実施の形態に示した構成に対して文字認識部61,認識
結果保存部62,ページソート部63を追加して構成し
た例を示したが、これに限らず、上述の第2の実施の形
態に対してもこの第5の実施の形態を適用可能である。
ただし、共通要素抽出部33においてページ番号などの
ページ順序を示す画素塊を所定の画素塊として抽出し、
抽出した所定の画素塊の画像を文字認識部61に転送す
ることになる。さらに、上述の第3及び第4の実施の形
態と適宜組み合わせて構成することも可能である。
【0066】図17は、本発明の第6の実施の形態を示
すブロック構成図である。図中、図1と同様の部分には
同じ符号を付して説明を省略する。71は未検出ログ生
成部である。上述のように所定画素抽出部3は、文書画
像中から所定の画素塊を抽出するが、文書画像中の所定
の画素塊が存在せず、所定の画素塊を抽出できなかった
場合には、当該ページの文書画像に関する情報を未検出
ログ生成部71に送る。例えば画像入力部1に文書画像
のファイル名のリストが与えられている場合には、その
ページの文書画像に対応するファイル名を未検出ログ生
成部71へ送ればよい。もちろん、ファイル名以外で
も、所定の画素塊を抽出できなかったページの文書画像
を特定できればどのような情報でもよい。
【0067】未検出ログ生成部71は、所定画素塊抽出
部3で所定の画素塊が抽出できなかったときに送られて
くる文書画像に関する情報を記録しておく。このように
所定の画素塊が抽出できなかったページの文書画像につ
いてログを残しておくことによって、一連の位置補正処
理が終了した後、ユーザがログを参照して位置補正でき
なかったページの文書画像についてのみ、手動あるいは
別の画素塊を利用して位置補正を行うことができる。あ
るいは、この未検出ログ生成部71によって生成された
ログを別のユーザ支援システムで参照し、自動で位置補
正できなかったページの文書画像についてユーザによる
位置補正を支援するようにシステムを構成することも可
能である。
【0068】図17に示した例では上述の第1の実施の
形態を用いて構成した例を示したが、これに限らず、第
2の実施の形態においても未検出ログ生成部71を搭載
可能である。ただしこの場合には、共通要素抽出部33
で共通の矩形枠を抽出する際にすべてのページに存在す
る矩形枠が存在しないときに、より多くのページに存在
する矩形枠を所定の画素塊として抽出するようにし、そ
の矩形枠が存在しなかったページの文書画像について、
その文書画像に関する情報を未検出ログ生成部71に残
すように構成すればよい。さらに、この第6の実施の形
態を上述の第3ないし第5の実施の形態と適宜組み合わ
せて構成することも可能である。
【0069】図18は、本発明の文書画像処理装置の機
能または文書画像処理方法をコンピュータプログラムで
実現した場合におけるコンピュータプログラムを格納し
た記憶媒体の一例の説明図である。図中、101はプロ
グラム、102はコンピュータ、111は光磁気ディス
ク、112は光ディスク、113は磁気ディスク、11
4はメモリ、121は光磁気ディスク装置、122は光
ディスク装置、123は磁気ディスク装置である。
【0070】上述の本発明の各実施の形態に示した構成
における機能は、コンピュータにより実行可能なプログ
ラム101によっても実現することが可能である。その
場合、そのプログラム101およびそのプログラムが用
いるデータなどは、コンピュータが読み取り可能な記憶
媒体に記憶することも可能である。記憶媒体とは、コン
ピュータのハードウェア資源に備えられている読取装置
に対して、プログラムの記述内容に応じて、磁気、光、
電気等のエネルギーの変化状態を引き起こして、それに
対応する信号の形式で、読取装置にプログラムの記述内
容を伝達できるものである。例えば、光磁気ディスク1
11,光ディスク112、磁気ディスク113,メモリ
114等である。もちろんこれらの記憶媒体は、可搬型
に限られるものではない。
【0071】これらの記憶媒体にプログラム101を格
納しておき、例えばコンピュータ102の光磁気ディス
ク装置121,光ディスク装置122,磁気ディスク装
置123,あるいは図示しないメモリスロットにこれら
の記憶媒体を装着することによって、コンピュータから
プログラム101を読み出し、本発明の各実施の形態で
説明した構成の機能を実行することができる。あるい
は、予め記憶媒体をコンピュータ102に装着してお
き、例えばネットワークなどを介してプログラム101
をコンピュータ102に転送し、記憶媒体にプログラム
101を格納して実行させてもよい。
【0072】
【発明の効果】以上の説明から明らかなように、本発明
によれば、任意のフォーマットの文書画像について、共
通する文書要素が存在していれば位置補正処理を行うこ
とができる。また位置補正ができなかった場合、その旨
を記録しておくことで、後工程での修正が容易となると
いう効果がある。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態を示すブロック図
である。
【図2】 本発明の第1の実施の形態における動作の具
体例の説明図である。
【図3】 位置補正後の文書画像の具体例の説明図であ
る。
【図4】 所定画素塊抽出部3におけるレイアウト解析
による所定画素塊の抽出の具体例の説明図である。
【図5】 所定画素塊抽出部3の一例を示すブロック構
成図である。
【図6】 所定画素塊抽出部3の一例における動作の具
体例の説明図である。
【図7】 文字列方向指定部12の一例を示すブロック
構成図。
【図8】 文字列方向指定部12の一例における動作の
具体例の説明図である。
【図9】 本発明の第2の実施の形態を示すブロック図
である。
【図10】 本発明の第2の実施の形態における動作の
具体例の説明図である。
【図11】 本発明の第3の実施の形態を示すブロック
構成図である。
【図12】 スキューを含む文書画像の一例の説明図で
ある。
【図13】 本発明の第4の実施の形態を示すブロック
構成図である。
【図14】 奇数ページと偶数ページとでレイアウトが
異なる文書の一例の説明図である。
【図15】 本発明の第5の実施の形態を示すブロック
構成図である。
【図16】 ページソートの一例の説明図である。
【図17】 本発明の第6の実施の形態を示すブロック
構成図である。
【図18】 本発明の文書画像処理装置の機能または文
書画像処理方法をコンピュータプログラムで実現した場
合におけるコンピュータプログラムを格納した記憶媒体
の一例の説明図である。
【符号の説明】
1…画像入力部、2…画像記憶部、3…所定画素塊抽出
部、4…基準位置指定部、5…差分抽出部、6…画像移
動部、11…矩形枠抽出部、12…文字列方向指定部、
13…連結矩形枠作成部、14…連結矩形枠抽出部、2
1…縦方向白ラン抽出部、22…縦方向白ラン連結部、
23…縦方向連結白ラン選択部、24…横方向白ラン抽
出部、25…横方向白ラン連結部、26…横方向連結白
ラン選択部、27…連結白ラン数比較及び文字列方向決
定部、31…レイアウト解析部、32…ページレイアウ
ト保持部、33…共通要素抽出部、41…スキュー補正
部、51…奇数ページ基準位置指定部、52…偶数ペー
ジ基準位置指定部、53…ページ切替部、61…文字認
識部、62…認識結果保存部、63…ページソート部、
71…未検出ログ生成部、101…プログラム、102
…コンピュータ、111…光磁気ディスク、112…光
ディスク、113…磁気ディスク、114…メモリ、1
21…光磁気ディスク装置、122…光ディスク装置、
123…磁気ディスク装置。

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも一部のページに共通して存在
    する所定の画素塊を入力された文書画像から抽出する所
    定画素塊抽出手段と、前記所定画素塊抽出手段により抽
    出した所定の画素塊の位置が基準位置又は基準となる画
    素塊の位置となるように入力された文書画像全体の位置
    を補正する画像補正手段を有することを特徴とする文書
    画像処理装置。
  2. 【請求項2】 文書画像中において基準位置又は基準と
    なる画素塊の位置をユーザが指定する基準位置指定手段
    を有し、前記画像補正手段は、前記所定画素塊抽出手段
    により抽出した所定の画素塊の位置が前記基準位置指定
    手段で指定された基準位置又は基準となる画素塊の位置
    となるように入力された文書画像全体の位置を補正する
    ことを特徴とする請求項1に記載の文書画像処理装置。
  3. 【請求項3】 入力された文書画像をページごとに保持
    する画像記憶手段を有し、前記所定画素塊抽出手段は、
    前記画像記憶手段中の処理すべき複数ページの文書画像
    のレイアウトを解析し各ページの文書画像中の同様の位
    置にほぼ同一の画素塊が存在する場合に該画素塊を所定
    の画素塊とするとともに前記基準位置を決定することを
    特徴とする請求項1に記載の文書画像処理装置。
  4. 【請求項4】 入力された文書画像をページごとに保持
    する画像記憶手段と、文書画像中において基準位置をユ
    ーザが指定する基準位置指定手段を有し、前記所定画素
    塊抽出手段は、前記画像記憶手段中の処理すべきすべて
    のページの文書画像のレイアウトを解析し各ページの文
    書画像中の同様の位置にほぼ同一の画素塊が存在する場
    合に該画素塊を所定の画素塊とし、前記画像補正手段
    は、前記所定画素塊抽出手段により抽出した所定の画素
    塊の位置が前記基準位置指定手段で指定された基準位置
    又は基準となる画素塊の位置となるように入力された文
    書画像全体の位置を補正することを特徴とする請求項1
    に記載の文書画像処理装置。
  5. 【請求項5】 前記所定画素塊抽出手段は、前記文書画
    像から画素塊の矩形枠を抽出する矩形枠抽出手段と、文
    書画像の文字列方向を特定する文字列方向指定手段と、
    前記文字列方向指定手段により指定された方向に前記矩
    形枠を連結する連結矩形枠作成手段と、前記基準位置又
    は基準となる画素塊の位置に最も近い連結矩形枠を抽出
    する連結矩形枠抽出手段を含むことを特徴とする請求項
    1または請求項2に記載の文書画像処理装置。
  6. 【請求項6】 前記文字列方向指定手段は、ユーザが文
    字列の方向を指定するユーザインタフェースを有するこ
    とを特徴とする請求項5に記載の文書画像処理装置。
  7. 【請求項7】 前記文字列方向指定手段は、文書画像の
    レイアウトを解析することによって文字列の方向を特定
    する文書レイアウト解析手段を有することを特徴とする
    請求項5に記載の文書画像処理装置。
  8. 【請求項8】 前記文書レイアウト解析手段は、文書画
    像の背景となる白画素のランを縦と横の両方向で抽出
    し、予め与えられた閾値以上の白画素のランに対して隣
    接する白画素のラン同士を統合して白画素領域の矩形枠
    を縦と横の両方向で作成し、前記矩形枠で縦と横の両方
    向で所定の幅以上の矩形枠を抽出し、抽出した縦方向と
    横方向の矩形枠で数の多い方をその文書の文字列方向と
    決定する構成であることを特徴とする請求項7に記載の
    文書画像処理装置。
  9. 【請求項9】 さらに、前記所定画素塊抽出手段におい
    て所定の画素塊を抽出できないとき該当する文書画像に
    関する情報を記録しておく未検出ログ生成手段を有する
    ことを特徴とする請求項1または請求項2または請求項
    5ないし請求項8のいずれか1項に記載の文書画像処理
    装置。
  10. 【請求項10】 前記基準位置指定手段は、奇数ページ
    における基準位置又は基準となる画素塊の位置を指定す
    る奇数ページ基準位置指定手段と、偶数ページにおける
    基準位置又は基準となる画素塊の位置を指定する偶数ペ
    ージ基準位置指定手段と、奇数ページと偶数ページとで
    前記奇数ページ基準位置指定手段または偶数ページ基準
    位置指定手段のいずれかの出力を切り替えるページ切替
    手段を含んで構成されており、奇数ページと偶数ページ
    とで個別に抽出領域を設定可能であることを特徴とする
    請求項2または請求項4に記載の文書画像処理装置。
  11. 【請求項11】 前記所定画素塊抽出手段は、文書画像
    の奇数ページについて同様の位置にほぼ同一の画素塊が
    存在する場合に該画素塊を奇数ページにおける所定の画
    素塊とし、また文書画像の偶数ページについて同様の位
    置にほぼ同一の画素塊が存在する場合に該画素塊を偶数
    ページにおける所定の画素塊とすることを特徴とする請
    求項3または請求項4に記載の文書画像処理装置。
  12. 【請求項12】 さらに、入力された文書画像に対して
    スキュー補正を行うスキュー補正手段を有することを特
    徴とする請求項1ないし請求項11のいずれか1項に記
    載の文書画像処理装置。
  13. 【請求項13】 前記スキュー補正手段は、画素塊群の
    矩形枠の中心座標をハフ変換し、スキュー角を検出する
    ことを特徴とする請求項12に記載の文書画像処理装
    置。
  14. 【請求項14】 前記所定の画素塊はページ番号の画像
    であり、さらに、画像中の文字を認識する文字認識手段
    と、画像補正手段にて位置を補正した後に前記ページ番
    号の画像中のページ番号を前記文字認識手段にて認識し
    該ページ番号順にページの順番をソートするソート手段
    を有することを特徴とする請求項1ないし請求項13の
    いずれか1項に記載の文書画像処理装置。
  15. 【請求項15】 予めユーザが基準位置または基準とな
    る画素塊の位置を指定しておき、少なくとも一部のペー
    ジに共通して存在する所定の画素塊を入力された文書画
    像から抽出し、抽出した所定の画素塊の位置が前記基準
    位置又は前記基準となる画素塊の位置となるように入力
    された文書画像全体の位置を補正することを特徴とする
    文書画像処理方法。
  16. 【請求項16】 処理すべき複数ページの文書画像のレ
    イアウトを解析し、各ページの文書画像中の同様の位置
    にほぼ同一の画素塊が存在する場合に該画素塊を所定の
    画素塊とするとともに前記基準位置を決定し、各ページ
    の文書画像に存在する所定の画素塊の位置が前記基準位
    置となるように文書画像全体の位置を補正することを特
    徴とする文書画像処理方法。
  17. 【請求項17】 予めユーザが基準位置を指定してお
    き、処理すべき複数ページの文書画像のレイアウトを解
    析し、各ページの文書画像中の同様の位置にほぼ同一の
    画素塊が存在する場合に該画素塊を所定の画素塊とし、
    各ページの文書画像に存在する所定の画素塊の位置が前
    記基準位置となるように文書画像全体の位置を補正する
    ことを特徴とする文書画像処理方法。
  18. 【請求項18】 文書画像から所定の画素塊を抽出でき
    ないとき、該当する文書画像に関する情報を記録してお
    くことを特徴とする請求項15ないし請求項17のいず
    れか1項に記載の文書画像処理方法。
  19. 【請求項19】 予めユーザが行う基準位置または基準
    となる画素塊の位置の指定を受けるステップと、少なく
    とも一部のページに共通して存在する所定の画素塊を入
    力された文書画像から抽出するステップと、抽出した所
    定の画素塊の位置が前記基準位置又は前記基準となる画
    素塊の位置となるように入力された文書画像全体の位置
    を補正するステップをコンピュータに実行させるプログ
    ラムを記憶した前記コンピュータが読み取り可能な記憶
    媒体。
  20. 【請求項20】 処理すべき複数ページの文書画像のレ
    イアウトを解析するステップと、各ページの文書画像中
    の同様の位置にほぼ同一の画素塊が存在する場合に該画
    素塊を所定の画素塊とするとともに前記基準位置を決定
    するステップと、各ページの文書画像に存在する所定の
    画素塊の位置が前記基準位置となるように文書画像全体
    の位置を補正するステップをコンピュータに実行させる
    プログラムを記憶した前記コンピュータが読み取り可能
    な記憶媒体。
  21. 【請求項21】 予めユーザが行う基準位置の指定を受
    けるステップと、処理すべき複数ページの文書画像のレ
    イアウトを解析するステップと、各ページの文書画像中
    の同様の位置にほぼ同一の画素塊が存在する場合に該画
    素塊を所定の画素塊とするステップと、各ページの文書
    画像に存在する所定の画素塊の位置が前記基準位置とな
    るように文書画像全体の位置を補正するステップをコン
    ピュータに実行させるプログラムを記憶した前記コンピ
    ュータが読み取り可能な記憶媒体。
  22. 【請求項22】 さらに、文書画像から所定の画素塊を
    抽出できないとき、該当する文書画像に関する情報を記
    録しておくステップをコンピュータに実行させるプログ
    ラムを記憶した前記コンピュータが読み取り可能な請求
    項19ないし請求項21のいずれか1項に記載の記憶媒
    体。
JP2000241492A 2000-08-09 2000-08-09 文書画像処理装置、文書画像処理方法、及び記憶媒体 Expired - Fee Related JP3962891B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000241492A JP3962891B2 (ja) 2000-08-09 2000-08-09 文書画像処理装置、文書画像処理方法、及び記憶媒体
US09/917,766 US6959121B2 (en) 2000-08-09 2001-07-31 Document image processing device, document image processing method, and memory medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000241492A JP3962891B2 (ja) 2000-08-09 2000-08-09 文書画像処理装置、文書画像処理方法、及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2002056398A true JP2002056398A (ja) 2002-02-20
JP3962891B2 JP3962891B2 (ja) 2007-08-22

Family

ID=18732671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000241492A Expired - Fee Related JP3962891B2 (ja) 2000-08-09 2000-08-09 文書画像処理装置、文書画像処理方法、及び記憶媒体

Country Status (2)

Country Link
US (1) US6959121B2 (ja)
JP (1) JP3962891B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346519A (ja) * 2004-06-04 2005-12-15 Fuji Xerox Co Ltd 画像表示装置、画像表示方法及びそのプログラム
JP2007251491A (ja) * 2006-03-15 2007-09-27 Tietech Co Ltd ファクシミリ端末装置
JP2010220060A (ja) * 2009-03-18 2010-09-30 Casio Computer Co Ltd 画像処理装置、画像処理プログラム、画像処理方法及び画像処理システム
US8189229B2 (en) 2005-01-31 2012-05-29 Canon Kabushiki Kaisha Image processing method, image processing apparatus and program for image position correction processing
JP2015191356A (ja) * 2014-03-27 2015-11-02 日本電気株式会社 情報処理装置、プレビュー画面表示方法、および、プログラム
JP2015195428A (ja) * 2014-03-31 2015-11-05 ブラザー工業株式会社 画像処理装置
JP2015201673A (ja) * 2014-04-04 2015-11-12 キヤノン株式会社 画像形成装置
JP2018006946A (ja) * 2016-06-30 2018-01-11 京セラドキュメントソリューションズ株式会社 画像形成装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7411593B2 (en) * 2001-03-28 2008-08-12 International Business Machines Corporation Image rotation with substantially no aliasing error
JP2005275820A (ja) * 2004-03-25 2005-10-06 Canon Inc 帳票認識装置、方法、プログラムおよび記憶媒体
KR100677755B1 (ko) * 2005-01-14 2007-02-02 삼성전자주식회사 화상형성장치 및 화상형성장치 제어방법
JP2006268372A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
JP2007080178A (ja) * 2005-09-16 2007-03-29 Ricoh Co Ltd 画像処理装置
JP4856925B2 (ja) * 2005-10-07 2012-01-18 株式会社リコー 画像処理装置、画像処理方法及び画像処理プログラム
JP4849883B2 (ja) * 2005-12-16 2012-01-11 富士通株式会社 行方向判定プログラム、方法及び装置
JP4977368B2 (ja) * 2005-12-28 2012-07-18 富士通株式会社 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
JP4750047B2 (ja) * 2006-03-31 2011-08-17 株式会社リコー 位置ずれ検出装置、位置ずれ検出方法、位置ずれ検出プログラムおよび記録媒体
JP2008028858A (ja) * 2006-07-24 2008-02-07 Ricoh Co Ltd 画像読取装置、画像読取方法および画像読取プログラム
ATE541710T1 (de) * 2007-11-23 2012-02-15 Mueller Martini Holding Ag Verfahren zum herstellen von druckprodukten
US8290302B2 (en) * 2009-01-30 2012-10-16 Xerox Corporation Method and system for skew detection of a scanned document using connected components analysis
JP5950700B2 (ja) * 2012-06-06 2016-07-13 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US10067917B2 (en) * 2013-01-31 2018-09-04 Bluebeam, Inc. Method for managing and selectively arranging sets of multiple documents and pages within documents
US10138021B2 (en) * 2016-08-30 2018-11-27 Replenish Bottling, Llc Deployable clip
JP6530432B2 (ja) * 2017-02-03 2019-06-12 株式会社東芝 画像処理装置、画像処理方法及びプログラム
JP2020065193A (ja) * 2018-10-18 2020-04-23 シャープ株式会社 画像形成装置、画像処理方法及び画像処理プログラム
CN110009712B (zh) * 2019-03-01 2021-05-04 华为技术有限公司 一种图文排版方法及其相关装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5941960A (ja) * 1982-09-01 1984-03-08 Canon Inc 画像情報記録再生装置
US4985930A (en) * 1987-09-24 1991-01-15 Hitachi, Ltd. Image data filing system and image data correcting method
JP2829006B2 (ja) * 1988-11-10 1998-11-25 株式会社リコー 画像処理装置
JP3078002B2 (ja) * 1990-08-31 2000-08-21 株式会社東芝 画像情報処理装置
US5359677A (en) * 1990-12-11 1994-10-25 Sharp Kabushiki Kaisha Image reader and facsimile machine using such image reader
JP2891342B2 (ja) * 1992-03-09 1999-05-17 富士ゼロックス株式会社 画像信号処理装置
JPH06274680A (ja) * 1993-03-17 1994-09-30 Hitachi Ltd 文書認識方法およびシステム
JPH11120288A (ja) 1997-10-13 1999-04-30 Oki Electric Ind Co Ltd 画像のずれ検出方法
JP3223878B2 (ja) 1998-03-27 2001-10-29 日本電気株式会社 文字列照合装置、方法及び記録媒体
JP2000067247A (ja) * 1998-06-08 2000-03-03 Toshiba Corp 画像認識装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346519A (ja) * 2004-06-04 2005-12-15 Fuji Xerox Co Ltd 画像表示装置、画像表示方法及びそのプログラム
US7646928B2 (en) 2004-06-04 2010-01-12 Fuji Xerox Co., Ltd. Image display control apparatus, image display apparatus, image displaying method and program thereof
JP4491777B2 (ja) * 2004-06-04 2010-06-30 富士ゼロックス株式会社 画像表示装置、画像表示方法及びそのプログラム
US8189229B2 (en) 2005-01-31 2012-05-29 Canon Kabushiki Kaisha Image processing method, image processing apparatus and program for image position correction processing
JP2007251491A (ja) * 2006-03-15 2007-09-27 Tietech Co Ltd ファクシミリ端末装置
JP2010220060A (ja) * 2009-03-18 2010-09-30 Casio Computer Co Ltd 画像処理装置、画像処理プログラム、画像処理方法及び画像処理システム
JP2015191356A (ja) * 2014-03-27 2015-11-02 日本電気株式会社 情報処理装置、プレビュー画面表示方法、および、プログラム
JP2015195428A (ja) * 2014-03-31 2015-11-05 ブラザー工業株式会社 画像処理装置
JP2015201673A (ja) * 2014-04-04 2015-11-12 キヤノン株式会社 画像形成装置
JP2018006946A (ja) * 2016-06-30 2018-01-11 京セラドキュメントソリューションズ株式会社 画像形成装置

Also Published As

Publication number Publication date
JP3962891B2 (ja) 2007-08-22
US6959121B2 (en) 2005-10-25
US20020025081A1 (en) 2002-02-28

Similar Documents

Publication Publication Date Title
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
KR100390264B1 (ko) 폼처리중자동페이지등록및자동영역검출을위한시스템및방법
JP3302147B2 (ja) 文書画像処理方法
US10606933B2 (en) Method and system for document image layout deconstruction and redisplay
US5528732A (en) Reprographic device for making copies with multi-spaced lines
US5675672A (en) Two dimensional linker for character string data
US8675260B2 (en) Image processing method and apparatus, and document management server, performing character recognition on a difference image
JP4183527B2 (ja) 帳票定義データ作成方法および帳票処理装置
JPH01253077A (ja) 文字列検出方法
US8531726B2 (en) Image read processing device and image read processing method
JPH04195692A (ja) 文書読取装置
US8068261B2 (en) Image reading apparatus, image reading method, and image reading program
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2022092119A (ja) 画像処理装置、画像処理方法およびプログラム
JP2004504650A (ja) フォーム認識及びデジタル化画像処理のための方法及びシステム
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP3604909B2 (ja) 画像間位置合わせ方法
JPH08329187A (ja) 文書読取装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
JPH11250179A (ja) 文字認識装置および文字認識方法
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JPH1166231A (ja) 文字認識装置及びその文字認識方法
JPS61198376A (ja) 光学的文字読取装置
JP2933947B2 (ja) 画像処理方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070508

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140601

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees