JP2006054885A - 走査中のアウトライア検出 - Google Patents

走査中のアウトライア検出 Download PDF

Info

Publication number
JP2006054885A
JP2006054885A JP2005230964A JP2005230964A JP2006054885A JP 2006054885 A JP2006054885 A JP 2006054885A JP 2005230964 A JP2005230964 A JP 2005230964A JP 2005230964 A JP2005230964 A JP 2005230964A JP 2006054885 A JP2006054885 A JP 2006054885A
Authority
JP
Japan
Prior art keywords
page
image
document
scanned image
scanned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005230964A
Other languages
English (en)
Other versions
JP4963809B2 (ja
Inventor
Marvin P Bruenner
ペー ブリュンネル マルフィン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Production Printing Netherlands BV
Original Assignee
Oce Technologies BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oce Technologies BV filed Critical Oce Technologies BV
Publication of JP2006054885A publication Critical patent/JP2006054885A/ja
Application granted granted Critical
Publication of JP4963809B2 publication Critical patent/JP4963809B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Input (AREA)
  • Facsimiles In General (AREA)
  • Character Input (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Abstract

【課題】 品質の自動的な検出に基づいて、限られた数のページ画像を補正するよう操作者に柔軟な選択肢を提供する。
【解決手段】 マルチページ文書の走査及び処理が開示される。走査画像は、本のようなマルチページ文書の一連のページを光学的に走査することにより生成される。走査画像は、例えばデスキューし黒の境界領域を除去することにより、マルチページ文書の元のページに対応するページ画像を生成するために処理される。提案のページ画像を生成した後、テキスト領域座標値(X1,X2,X3,X4,Y1,Y2)のような、その画像パラメータが文書の統計的な解析に基づく目標基準に従っているかどうかを検出することにより、画像がエラーを含む機会があったかどうかがチェックされる。ページ画像が目標基準を満足している場合、ページ画像が自動的に受け入れられる。しかし、そうでない場合、ページ画像(65,66)が表示され、操作者が当該ページ画像を受け入れるか又は調整できるようにする。
【選択図】 図6

Description

本発明は、マルチページ文書の一連のページの光学的な走査により走査画像を受信するステップと、マルチページ文書の元のページに対応するページ画像を生成するために前記走査画像を処理するステップとを備える、マルチページ文書処理方法に関する。
本発明は、更に、マルチページ文書を処理するためのコンピュータープログラムに関する。
本発明は、更に、マルチページ文書の一連のページの光学的な走査により走査画像を生成するスキャナユニットと、ローカルインターフェースユニットと、マルチページ文書の元のページに対応するページ画像を生成するために前記走査画像を処理する画像プロセッサユニットと、を備える文書処理システムに関する。
大規模な文書がアーカイビングのために走査される必要があるとき、文書の全てのページが欠陥なく走査されることが極めて重要であり、というのは、後で走査エラーが検出されたとき、元の文書がもはや入手不能でありうるからである。それ故に、各走査画像の品質をチェックすることは重要である。しかし、各走査画像の品質は、多大な時間と労力を要し、走査作業を実行する個人に多大な負担を強いる。更に、多数の画像をチェックすることは、つまらなく誤りが起き易い。
人間のチェック処理を回避する1つの方法として、各新しい走査画像を自動的にチェックし、可能な場合は、対応する画像処理技術により欠陥のある画像を補正する自動化システムを用いることである。所定の品質基準に準拠しない走査画像は、ここでは“アウトライア”と呼ぶ。
かかる方法は、特許出願WO98/09427から知られており、走査又は複写中の品質を保証する構成及び方法を開示する。この方法は、走査されるべきページ(複数も可)を送り入れ、走査画像の品質を一連のステップでチェックするステップを含み、スキュー、2重送り/重なり、形の逸脱、幾何的な変形に関して実行される外部特性のチェック、ページのコンテンツのいわゆる内部品質のチェック、及び情報コンテンツの品質のチェックが含まれる。測定された品質が限界に従っているかそれよりも良い場合、走査画像の自動的な調整が必要に応じて実行され、その後、走査画像は、走査ファイルに付加される。測定された品質が限界より下の場合、操作者は、e−走査のためにページを再供給するように要求される。
知られたシステムでは、品質チェックは、固定された、事前にプログラムされた品質制限であって、実際の状況に常に一致しているとは限らない品質制限に基づいてなされる。チェック結果が否定的な場合、再走査せざるを得ず、これにより操作者は文書を再供給することを強いられる。しかし、拒絶された走査画像が実際には依然として受容可能であるか、若しくは、小さな調整で受容可能となることができ、再走査が必要でないことを起こりうる。
本発明は、マルチページ文書の元のページに忠実に対応する一連のページ画像を生成するために走査画像を処理しつつ、品質の自動的な検出に基づいて、限られた数のページ画像を補正するよう操作者に柔軟な選択肢を提供する方法及びシステムの提供を目的とする。
本発明の第1の局面によると、上記の目的は、冒頭部の段落で記載されるような方法であって、前記走査画像の処理中に得られるマルチページ文書のページ特性に基づいて画像パラメータに対する目標基準を自動的に決定するステップと、ページのページ特性が目標基準に従っているか否かをチェックするステップとを備え、従っている場合は、ページ画像を自動的に受け入れ、そうでない場合は、操作者に対して補正措置のためにページ画像を表示し又はページ画像を受け入れることを特徴とする方法により達成される。
本発明の第2の局面によると、上記の目的は、本方法を実行するためのコンピュータープログラムにより達成される。
本発明の第3の局面によると、上記の目的は、冒頭部の段落で記載されるような文書処理システムであって、前記走査画像の処理中に得られるマルチページ文書のページ特性に基づいて画像パラメータに対する目標基準を決定し、ページのページ特性が目標基準に従っているか否かをチェックし、従っている場合は、ページ画像を自動的に受け入れ、そうでない場合は、操作者に対して補正措置のためにページ画像を表示し又はユーザインターフェースユニットを介してページ画像を受け入れるアウトライア検出手段を備えることを特徴とする、文書処理システムにより達成される。
上記の方策は以下の作用を有する。走査画像の処理は、検出されたページ特性に基づいたページ画像を生む。ページ画像において走査処理の種々の作用が走査画像の処理ステップにおいて補償され又は補正されてもよい。ページ特性及び補正は、マルチページ文書の統計的特性自体に基づいてセットされる目標基準に比較される。従って、ページ画像の品質は、文書の特性に対して測定され、次いで、ページ画像は、提案された処理ページ画像が目標基準から有意に逸脱している場合に、アウトライアと看做される。提案されたページ画像は、表示され、操作者は、これを受け入れ、又は、補正措置でページ画像を調整又は補正、再走査、又は拒絶してよい。これは、走査画像の大部分は自動的に処理される一方で、操作者には、限られた数のアウトライアだけを確かめるように要求がなされるという効果を有する。更に、操作者は、受容可能であるか又は依然として調整できる画像の拒絶を防止することができる。
特に、目標基準は、文書のグローバルな特性に調整され、実際の走査されるマルチページ文書の特性が考慮される。これは、アウトライアの検出を効果的に改善し、誤ってアウトライアとしてクラス分けされる正確なページの数を効果的に低減する。アウトライアは、有意な逸脱が目標基準から検出された場合に検出され、そのときだけ、提案される画像が、認証又は補正のために操作者に提示される。従って、ページ画像の最終セットにおける誤りは、選択的な検査及び補正により効率的に防止される。
本方法の一実施例において、目標基準を決定する方法は、走査画像の処理の間に得られるページ特性に基づいて、少なくとも1つの画像パラメータに対する目標範囲を統計的に決定することを含む。これは、期待値の目標範囲が、マルチページ文書の走査画像の特性に基づいて統計的に決定又は調整される効果を有する。
一実施例では、画像パラメータは、ページサイズ、テキスト領域位置又は寸法を含む。かかるパラメータは、通常的には、本や雑誌のようなマルチページ文書を通して一定である。検出された紙サイズのような画像パラメータが、期待値の目標範囲外であるかの検出に基づいて、アウトライアが検出され操作者に対して表示される。
本方法の一実施例において、前記画像パラメータが目標基準に従っているか否かを検出するステップは、ページ画像を生成するためになされる調整に対する信頼性を指示する信頼性ファクタを算出することを含む。信頼度は、デスキュー又は回転のような処理ステップに対して算出され、例えば、処理中、提案されるページ画像の結果が不明確なデータに起因して信頼性が無いと検出される。従って、目標基準は、信頼性の最低レベルを含んでよい。
一実施例では、期待値は、マルチページ文書のページの所定パラメータに対する文書についての先験的知識を含む。先験的知識は、マルチページ文書からの統計的なデータで検証され又は結合されてもよい。文書の一般的な特性は、文字は水平ラインで配列されているといったように、一般的に予測されるものである。また、日本語文書に対して垂直ラインといったように、所定のセットのパラメータが、適切な文書に対して適用され又は選択されてよい。先験的知識を用いることで、アウトライアは、通常の文書特性から逸脱しているので、容易に検出できるようになる。
一実施例では、所定パラメータは、テキストラインの向きを含み、走査画像を処理するステップは、テキストラインの向きを検出し、検出したテキストラインの向きに応じて走査画像のスキューを補正することを含む。これは、走査中の通常的なエラー、即ちスキャナユニット上の元の画像の傾斜した位置を、容易に補正することができるという効果がある。
一実施例では、本方法は、ページ画像の複合セットを構築することを含み、該複合セットは、マルチページ文書におけるページの範囲に対応する論理部分を有する。これは、元の文書の論理的な副次的な分割、例えば本における章が、ページ画像の複合セット内で維持されることができるという効果を有する。特定の実施例では、本方法は、走査画像のサブセットがページ画像の複合セットの論理部分を構成することを指示するコマンドをユーザから受けることを含む。これにより、操作者は、走査中、元の文書のページの整合のとれた範囲が、開始及び/又は完了されるときに、容易にコマンドを入力することができる。
更に、本発明による装置の好ましい実施例が、添付の請求項に付与され、そこでの開示は、ここでの参照により本明細書に組み込まれる。
本発明のこれら及び他の局面は、添付の図面を参照すると共に、次の説明における例により説明される実施例を参照することで、明らかになり且つ更に教示されることになる。図は、スケースどおりに描かれていない。図において、既に技術した要素と対応する要素には同一の参照符号が付与される。
図1は、文書を処理するための装置を示し、そこでは、異なる部分は概略的に別々に示される。文書は、通常的には紙の文書であるが、例えばOHPシート、本、図面等、情報を運ぶ如何なるタイプのシートを含んでよい。文書処理装置1は、スキャナのみであってよいが、好ましくは、例えば多用途複写機のような、印刷、複写又はファックス機能を含む多機能装置である。スキャナユニット120は、元の文書を載置できるグラスプラテン、CCDアレイ、及び、CCDアレイ上に文書を撮像する可動ミラー及びレンズを有するイメージングユニットを備える平らなベッドスキャナを含む。この状況では、CCDアレイは、とりわけ知られた態様でデジタル画像データに変換される電気信号を生成する。文書フィーダ110は、文書のスタックの導入用の入力トレイ111、スキャナユニット120に沿って一枚ずつ文書を搬送するための搬送機構(図示せず)、及び、走査後に文書が配置される送出トレイ112を備えてよい。
走査されるべきマルチページ文書は、適切なときに文書フィーダを介して入力されることができる。例えば、文書や雑誌は、プラテン上に手動で入力される。更なる走査補助、例えば本の自動的なページの回転が備えられてよい。
装置は、例えばとりわけ知られている電子写真処理セクションを含む、プリンタユニット130を有してよく、その場合、光伝導媒体が、デジタル画像データによりLEDアレイを介して晒され、チャージされ、その後、トナー画像が転写され、画像支持体上、通常的には紙のシートに固定される。異なるフォーマット及び向きの画像支持体のストックが、供給セクション140において利用可能である。トナー画像を備える画像支持体は、仕上げ及び送出セクション150まで移送され、このセクションは、必要な場合はそれらをセットにまとめ、ホッチキス止めをし、送出トレイ151内にそれらを堆積させる。
装置の制御ユニットは、参照符号170により概略的に示される。本発明による走査画像の処理機能は、図5を参照して以下で詳説される。ケーブル171は、ローカルネットワークに制御ユニット170を接続してよい。ネットワークは、優先であってよいが、部分的又は完全に無線であってもよい。
装置は、例えば、装置上にその操作のために設けられる操作者制御パネルを含めて、ユーザインターフェース160を有する。ユーザインターフェースは、ディスプレイ161及びキーを備える。文書処理を制御するためのディスプレイの動作が、以下で説明される。
本発明による文書処理システムにおいて、走査は、別の装置で実行されてよく、後述の画像処理は、例えばユーザワークステーションのような、ディスプレイ及び操作者インターフェースを有するプロセッサユニットで実行されてよい。プロセッサは、専用のハードウェアユニットとして構築されてよく、又は、以下で説明する画像処理及び補正機能を実現する標準的な処理ユニット及びソフトウェアプログラムを含んでよい。
図2は、マルチページ文書の走査方法を示す。第1の段階では、本方法は、ステップSCAN22においてマルチページ文書を光学的に走査することで、START21にて開始される。走査は、完全な文書に対して、又は、部分的な文書に対して実行されてもよい。各走査動作に対して、走査画像は、スキャナ上に新しい元のページを置き、又は、本に対して、スキャナユニットのプラテン上に双方のページを置くことにより、生成される。2ページを含む走査画像は、2連(デュアル)走査画像と称される。特別な場合、走査画像は、ページ画像を分離するために自動的に処理されるより多数のサブ画像を含んでよい。走査画像は、直接処理され又は中間ファイルとして記憶されてよく、又は、例えば生のソース材料も維持するために、最終ファイルに含められてもよい。
次のステップPROC23では、走査画像は、マルチページ文書の一連のページの走査からの走査画像が受信及び処理され、マルチページ文書の元のページに対応するページ画像が生成される。各走査画像に対して、多数の処理ステップが、ページ画像、又は、2連走査画像の場合は2つのページ画像を取り出すために実行される。ページ画像は、元のページの表現であり、即ち、走査画像により提供される走査データの処理バージョンである。走査画像をページ画像に処理する幾つかの例が以下で説明される。
本発明によれば、ステップPROC23の処理の間、統計的な情報STAT20が収集され、当該統計的情報は、走査画像の処理の間に得られるマルチページ文書のページ特性に基づいて画像パラメータに対する目標基準を決定するために用いられる。例えば、紙サイズ、テキスト領域寸法及びコントラストのような特性に対する期待値が、決定されてもよい。目標基準は、例えば平均、中央値、分散に基づく公差のような、統計的に決定された特性に基づく所定の画像パラメータに対する期待値及び公差である。
尚、統計的なパラメータが信頼性の高い態様で決定されるように少なくとも多数のページが先ず処理される必要がある。従って、マルチページ文書の初期部分(少なくとも2,3ページであるが、好ましくは、文書の本質的な部分又は文書全体までも)は、利用可能(即ち、走査及び記憶される)である必要があり、後述するアウトライア検出が開始されるまで、処理される。その結果、マルチページ文書の初期部分が10ページを含み、例えば第1又は第2の走査画像がアウトライアであると分かった場合、10ページの遅れが提示される。初期部分が処理された後、更なる走査画像が、遅れ無しでアウトライアに対して試験されてよい。初期的に決定された統計的なパラメータは、文書の残りの部分の処理の間に精密化されてもよい。或いは、完全なマルチページ文書が、走査され記憶されてよく、走査画像の完全なセットが、統計的なパラメータを決定するために初期実行として処理されてよく、2番目の実行でアウトライアが、完全な文書の統計値に基づいて検出される。
処理ステップ23は、ステップPROP24において、検出された画像パラメータに基づいて、強化又は補正処理機能により、提案されたページ画像を生成する。かかる処理機能の幾つかの例が以下で説明される。
次のステップOUTLIER25では、ページ画像がアウトライアであるか否か、即ち、画像ページが、統計的な情報20に基づく目標基準から有意に逸脱する特性又は画像パラメータを有するか否かが決定される。ページ画像は、画像パラメータが目標基準外であるかどうかを決定することによって評価される。
ページ画像がアウトライアでない場合、処理は、ページ画像を自動的に受け入れることでステップSTORE26にて継続される。しかし、ページ画像がアウトライアであると検出された場合、処理は、次の通り、操作者との対話により継続される。ステップDISPLAY30では、ページ画像が操作者に対して表示される。従って、操作者は、提案されたページ画像を可視的に検査することができる。結果が受容可能でない場合、ページ画像の処理が、ステップADJUST32で人手により調整されることができる。例えば、間違ったテキスト領域が提案された場合、元のテキストのエッジを含む走査画像の部分が、切り捨てられ、操作者は、提案されたページ画像のテキスト領域の境界を調整してもよい。続いて、調整され又は受け入れられたページ画像が、ステップSTORE26において保存される。
最後に、利用可能な走査画像が、ステップNEXTIMAGE27において検出されるように処理され、更なるページ又は文書部分が、ステップNEXTSCAN28で検出されるように走査される必要がない場合、結果として得られるページ画像は、ステップCOMBINE29において元のマルチページ文書のマルチページデジタル出力文書に結合され、例えばファイルに保存される。尚、ステップNEXTSCAN28は、処理がバッチ追求型であり、処理が開始される前に完全な文書が走査されることを要求する場合は、省略されてもよい。処理は、END33にて出力文書ファイルを送出することで終了される。
本方法の一実施例では、ステップPROC23における画像パラメータに対する統計的な値を決定するステップは、次を含む。ページエッジ検出器は、走査における最も強いエッジを検出し、ページ面積に最も近くなる境界ボックスを形成する4つのエッジを選択する。個々のページに対して検出される紙サイズに関連するパラメータ及び特性は、統計的に解析され、例えば平均化され、元のページの最終的な紙サイズ特徴が推定される。続いて、パラメータ又は特性に対する期待値が、マルチページ文書の更なるページと比較される紙サイズ基準として記憶される。
一実施例では、目標基準は、走査画像の処理中に得られるページ特性に基づく画像パラメータの少なくとも1つに対する目標範囲を含む。例えば、画像パラメータは、テキスト領域位置を含んでよい。テキスト領域パラメータは、通常的には、マルチページ文書に対する範囲内で一定である。また、ページヘッダー、フッターの位置や、ページのシーケンス又は章番号のような、より詳細な特徴が、期待値として、別々に検出され記憶されてもよい。従って、失われたページが検出される場合がある。
走査画像の統計的に解析された特性に基づく期待値に加えて、ステップPROC23における処理は、文書についての先験的知識を含んでよく、即ち、マルチページ文書のページの所定のパラメータ又は特性が存在すると仮定される。例えば、多くの走査画像は、
A4やLetterのような、標準的な紙サイズを有する。所定のパラメータの実際例は、テキストラインの向きであり、即ち、テキストは、紙のエッジに平行な方向に直線で整列されるという仮想であり、直立の文字が水平ラインで配列されていると考えられる。従って、テキストラインの検出された角度から、元のページが斜めの位置で走査され、テキストラインが水平になるまで、即ちいわゆるスキューがゼロになるまで、回転される必要があることが、想定される。続いて、走査画像の処理は、テキストラインの向きを検出し、検出したテキストラインの向きに応じて走査画像のスキューを補正することを含む。
本方法の更なる実施例は、走査画像における多数の元のページ、特に本又は雑誌の2連走査画像における2ページを扱うことを可能とする。従って、2連走査画像は、マルチページ文書の背(スパイン)及び背の両側に位置するページを含む。
図3は、本の走査画像の一例を示す。走査画像は、本の2ページ35,36の2連走査画像である。ページは、300DPI(インチあたりのドット数)で、256のグレーレベルで走査されているが、図では解像度が低減されている。ページ間のライン、いわゆるマルチページ文書の背37は、両ページを分離するために検出される。テキスト領域39は、各ページに関して利用可能であるが、絵を含むために用いられていてもよく、又は、幾つかのページでは不使用、即ち白であってもよい。紙サイズは、ページ35,36の白の領域の境界から検出されてよい。本の背に隠れる紙の量は、本を位置づける方法に起因して変化されてよい。かかる変化量は、左右の両エッジで適切なページ余白を有するもとのページを再構成することによって、例えば本の背に依存せずにテキスト領域39を中心合わせすることによって、補償されてもよい。
図2に示すような本方法において、ステップPROC23の走査画像の処理は、マルチページ文書の背を検出し、単一の走査画像から2つのページ画像を生成することを含んでよい。元の画像の検出は、例えば、テキストラインの向きとの組み合わせでの検出された紙サイズ、及び/又は、背の存在、平行な文字領域に基づいて、自動的でであってよい。或いは、操作者は、背タイプのマルチページ文書が走査及び処理されるべきことを指示するコマンドを入力してもよい。
ステップPROC23の一実施例では、2連走査画像の処理は、当該2ページのそれぞれに対して独立的に、テキストラインの向きを検出することを含む。双方のページの傾斜角度は、本を位置づける方法に起因して異なり得る。従って、検出されたテキストラインの向きに依存して2連走査画像の双方の部分のスキューを検出し補正することによって、双方の画像は、ゼロのスキューを有するように個々に処理される。
マルチページ文書の更なる特性は、各ページが正確で、いわゆる直立の向きを有することである。しかし、走査中、マルチページ文書は、上側を下又は横向きであってよい。処理中に、走査画像に関する元のページの向きが検出されてよく、上側が上のページ画像が、適切な回転により、異なる態様で方向付けられた走査画像から生成される。ページの向きは、上部又は底部の余白、ページ番号等のようなページレイアウト特性により検出されてもよい。特定の例では、ページの向きを検出することは、文字を検出し、文字の特性を判断することに基づく。
図4は、向き、特に上下逆を検出するための文字の特性を示す。テキスト断片40が解析され、底部のベースライン42の下方まで延在する文字がデセンダー44と呼ばれ、上部のベースライン44の上方まで延在する文字がアセンダー43と呼ばれる。一般的に、デセンダー及びアセンダーに対して比があり、例えば、ラテン言語に対しては、ある一定の比が予測される。かかる先験的知識は、初期値として用いられてよい。特定の文書に対する比は、走査画像の処理中に統計的に決定され又は調整されてもよい。目標比が適用され、文書ビットマップ(走査画像内のページ領域)が上下逆又は真っ直ぐかが検出され、検出した向きの信頼性が算出される。各文字は、アセンダー、デセンダー又は何もなしと分類される。例えば、完全なページに対するアセンダーとデセンダーの比が目標比に近い場合、ページは真っ直ぐであったことになる。当該比が目標比の逆数に近い場合、ページは上下逆であり、180度の回転が実行されページが補正される。(補正された)ページの比が目標比から有意に逸脱している場合、アウトライアが検出される。
文字の他の特性も、文字の向きを検出するために用いられてよい。例えば、文字iのような、選択した文字の向きの決定が、文字の向きのパラメータを提供する。
図2に示すように本方法におけるステップOUTLIER25は、画像パラメータが目標範囲外であるか否かを検出するためのものである。目標範囲は、次のような信頼性基準を含んでよい。ステップPROC23における種々の補正及び調整の処理の間、ページ画像を生成するためになされた調整が正確であることの信頼性を指示する信頼性ファクタが計算される。例えば、ページ上のテキストラインの量は非常に少なくてもよい。従って、検出されるようなテキストラインの向きや文字特徴は、信頼性が低くなりえ、信頼性ファクタは低くなる。また、検出されるような紙エッジは、例えばプラテン上で完全に平らに処理されない元のマルチページ文書の紙に起因して、グレー領域を示しうる。従って、検出される紙エッジ近傍のグレーピクチャ要素(ピクセル)の存在から、紙エッジ又は向きの低い信頼性が想定され、低い信頼性ファクタが算出される。
図5は、文書処理システムの構成部分の図である。文書処理システム50は、マルチページ文書58の一連のページの光学的な走査から走査画像を生成するスキャナユニット51を有する。スキャナユニットは、走査及び処理装置の部分であってよく、又は、別のスキャナ装置であってもよい。文書処理システム50は、スキャナユニット51に接続される制御ユニット52、ローカルメモリ57、及び、ディスプレイ55、キーのようなユーザコマンド要素56、カーソルを介したメニューコントロール、タッチセクション等を含むユーザインターフェース54を含む。メモリは、固体記憶装置、磁気ディスク等であってよい。プロセッサユニットは、走査画像の取り込みを制御する走査制御ユニット60、ユーザインターフェース54を介して操作者と通信するユーザインターフェース制御ユニット63、及び、処理されて画像特徴の期待された目標範囲内であることがチェックされたページ画像及び選択的に操作者により調整されたページ画像を含む出力文書59を生成するアウトライア検出ユニット62及び画像プロセッサユニット61を含む。
画像プロセッサユニット61は、マルチページ文書の元のページに対応するページ画像を生成するために走査画像を処理する。アウトライア検出ユニット62は、画像パラメータが期待値の目標範囲外であるか否かを判断することによりページ画像がアウトライアであるか否かを検出する。続いて、アウトライア検出ユニットは、ページ画像がアウトライアでない場合は自動的にページ画像を受け入れる。ページ画像がアウトライアである場合、ページ画像は、ディスプレイ55上に表示され、操作者が、ユーザインターフェースユニット54上のユーザコマンド要素56を介してページ画像を受け入れ又は調整できるようにする。
システム50において、画像処理ユニットは、先験的知識を用いてよく、又は、上述のような画像パラメータに対して期待値を算出するように構成されてもよい。特に、期待値は、平均紙サイズのような、走査画像の処理中に得られるページ特性に基づくものであってよい。システム50は、出力文書59におけるページ画像の複合セットを構築するように構成されてもよい。複合セットは、例えば章や付録のような、マルチページ文書のページ範囲に対応する論理部分の構造を有する。ローカルユーザインターフェースユニット54は、走査画像のサブセットがページ画像の複合セットの論理部分を構成することを指示するためのコマンドをユーザから受信するために、インポートボタンのような制御可能な要素を有する。一実施例では、システムは、ページ画像又は他の要求された印刷ジョブを印刷するためのプリンタユニット(図示せず)を含む。
実用的な実施例では、出力文書を生成するためのワークフローは、次の通りである。本のようなマルチページ文書は、コンマで区切られたテキストファイルの形式でテーブル及び走査画像を含むディレクトリで開始される。テーブルは、一連の走査画像に対する制御データを提供し、各ラインは、幾つかのフィールド、即ち、画像のタイプ、カラー又は白黒、左ページのページ番号、右ページのページ番号、及び、両ページを含む走査画像のファイル名を有する。次の反復的なステップは、走査画像を処理するために実行される。即ち、各画像をデスキュー(傾きをなくし)し、局所的に適応的な閾値(バイレベル)画像とグレーレベル画像の双方を保存し、走査画像上の紙エッジ及び本の背を探し、左右双方のページのテキスト領域を見つけ、例えば向きやテキスト領域選択において考えられる誤りのような、範囲外のパラメータを検出し、誤りを補正するためにユーザインターフェースをポップアップし、元のマルチページ文書の紙領域でない黒/グレー領域を削除して走査画像からページ画像を切り出し、PDF(Portable Document Format)やHTML(Hypertext Markup Language)のような広く知られた発行フォーマットで、ファイルを最終的に生成する。
デスキュープロセスに対しては、例えば“Digital Image Processing,page 115,W.Niblack,Prentice Hall 1986”に記載されるNiblack法でバイレベル画像が生成される。Niblackによる二値化アルゴリズムは、ローカル適応法である。サイズ(n*n)のウインドウに対して、平均及び標準偏差(stdev)が算出される。ウインドウサイズ(n)は、例えば31にセットされてよい。テキストが背景よりも暗い場合、次の公式が、中心ピクセルに対する閾値を算出するために用いられる。閾値=平均(window)−0.18*stdev(window)。このアルゴリズムは、悪い照明に起因して、又は、元のエージングに起因して、画像がディザをかけられるべきでなく又は低コントラストを有するべきときに非常に有用である。背景が文字よりも暗い場合、−0.18係数は+0.18にされなければならない。バイレベル画像は、テキストライン又は紙エッジのような、走査画像における要素の角度を検出するために用いられる。バイレベル画像は、OCR及びテキスト領域位置に対しても用いられてよい。
比較的小さな角度(例えば30度まで)をデスキューするための種々の方法は、画像処理において通常的に用いられ、角度のヒストグラムを算出する。明らかなピークの欠如のような、ヒストグラムの品質は、提案された角度が信頼性のないときを指示しうる。信頼性パラメータは、アウトライア検出のために導出され又は用いられてもよい。尚、デスキューされたページは、上下逆であってよく、これは初期のスキュー検出アルゴリズムでは分からない。改善は、前の走査画像を用いることで、例えば、追加的なルールの実行により達成できる。即ち、ヒストグラムの品質があまりに低い場合、当該ページを前のページと同一に回転させる。品質が低いままの場合、アウトライアが検出され、走査結果が操作者に対して判断のために表示される。
デスキュー処理の一部として、図4を参照して上述したように、ページの向きが検出される。走査画像に関する個々のページ又は走査画像の90度又は180度を越える回転は、元のマルチページ文書を異なる態様で位置付けることを補償するため、ページ画像の直立の向きを達成するために必要とされる。ある場合には、ページは、個々にデスキューされる必要があり、又は、異なる向きを有してよい。しかし、デスキュー処理は、走査画像が数字のペンストロークのような分散した要素を含む場合には、失敗しうる。アウトライア検出に対して用いられるべき信頼性ファクタは、デスキュー処理中に生成される角度指示値のスペクトルから算出されてもよい。
紙のエッジ及び本の背を検出することは次のように実行されてもよい。第1のステップは、9×9カーネルを用いて、形態学的フィルタ、クロージング動作(エロージョンが後続する膨張により小さな開口を埋める基本的な画像処理)により文字を除去することである。次いで、Sobelフィルタが、当該画像に関して用いられ(n×nカーネルでピクセル間の差に基づく導関数計算)、白と黒の領域間の境界にて強い成分を有する画像の近似導関数を生む。次に、固定された閾値が画像に適用され、二値の候補ブックエッジを生む。形態学的フィルタは、たいていの文字を除去し、それ故に誤りのエッジを除去するが、本に存在する数字は、依然として、誤ったブックエッジ候補を生成することになる。これらの候補は、例えば次の8接続成分に関するルールのような、一掃(クリーンナップ)ルールを適用することによって除去される。対象の範囲が全体面積の5分の1より大きく、アスペクト比が10より小さい場合、対照は、紙エッジ又は本の背に対する誤りの候補であり、除去される。かかるルールは、‘太った(blobby)’対象を除去し、細長い形状又はアウトラインの部分を維持する。
一般的に、最終的な画像は、ブックエッジ近傍及び本の背の近傍に多数のラインのみを含む。これらのラインを位置決めするため、Hough変換が算出され、次の通り角度ドメインで画像を表す。直線が、角度のスペクトルを構築するために用いられ、次の形式、即ちρ=xsin(θ)+ycos(θ)でパラメータ化される。ここで、ρは、原点からの垂直距離であり、θは法線との角度である。共線ポイント(x,y)、i=1,...N,は、点(ρ,θ)において交わる(ρ,θ)平面内のN個の正弦波曲線へと変換される。Hough面では、例えば、θ=0°近くの10個の最大値が、10個の垂直エッジ候補を与え、θ=90°近くの20個の最大値が、20個の水平エッジ候補を与える。本の背のエッジも検出されなければならないので、より多くの水平候補が選択される。このラインセットから、期待される本サイズに近いサイズの外径を形成する4つが選択される。水平ラインのセットからは、選択された上部及び底部のブックエッジの中間部に近くなる候補が、本の背として選択される。それに基づいて2つのページが切り出され、更に処理される。適切なラインが選択されない場合、又は、提案された切り出しページが、ページサイズの目標範囲から非常に大きく逸脱する場合、アウトライアが検出され、更なる処理のために操作者に提示される。
紙領域及び中間部を探す新規な方法は、紙の白さに基づくものである。グレーのデスキューされた画像が入力として用いられ、先ず、文字対象が、クロージング動作により除去される。結果は、isodataアルゴリズムにより閾値処理され、例えば次のような二値画像が生成される。
閾値を選択するための反復技術が、T.W.RidlerとS.Calvardにより“Picture Thresholding Using an Iterativ [sic] Selection Method, IEEE Transactions on Systems, Man and Cybernetics, Volume SMC−8, No.8, pp.630−2, August 1978”に記載されている。ヒストグラムは、最大のダイナミックレンジの半分、t=2B−1のような初期の閾値tを用いて2つの部分へと初期的にセグメント化される。最前面のピクセル(mf)に関連するグレー値のサンプル平均、及び、バックグラウンドのピクセル(mbkg)に関連するグレー値のサンプル平均が算出される。新たな閾値tは、今度は、2つのサンプル平均の平均として算出される。処理が、新たな閾値に基づいて、閾値がもはや変化しなくなるまで繰り返される。
次いで、二値画像に存在する対象は、ラベル付けされ、最も大きいものが選択される。最も大きい対象が、ある閾値よりも小さい場合、2番目に大きい対象も選択される。そして、全ての選択された対象が新しい画像に複写される。二値の対象のエッジでのスパーが、形態学的なオープニングにより除去され、クロージングが穴を埋める。結果の画像は一般的に唯一の対象を含み、そのバウンディングボックスが測定され、本の紙エッジとして用いられる。ギャプが最終的な紙領域マスク内に現れうるが(例えば除去されないピクチャに起因して)、対象のバウンディングボックスに悪影響を及ぼさない。
次のステップでは、本の中心(本の背の位置)が決定される。2つの画像、即ち、上述の如くisodata閾値処理された入力画像、及び、例えば11×11パターンを用いて閉じられ3×3Sobelフィルタによりフィルタ処理された、クロージングによる処理画像が、この目的のために用いられる。そして、本の中心に対する幾つかの候補が、isodata閾値処理された画像においてピクセル遷移(黒から白、又はその逆)の回数が25より下回る縦列(カラム)を見出すことにより、算出される。これらの候補に対して、Sobelフィルタがかけられた画像の1縦列におけるピクセルの最大積算値を見出すことにより、中心が選択される。
尚、このステップはデスキューされた元が必要であるので、このステップ(特に本の中心検索)は、デスキューが失敗している場合は失敗することになる。従って、このステップに対する信頼性ファクタは、デスキューステップのパラメータに依存してもよい。信頼性ファクタは、処理された画像がアウトライアであり操作者の承認又は調整が必要であるかどうかを検出するために適用される。
処理中、走査画像上のテキスト領域位置が判断されてもよい。この段落は、本のページのテキスト領域を位置決めするために必要とされるステップを説明する。算出された値は、黒の境界の無い走査画像からページ画像を切り出すために用いられ、又は、OCR又はページ数認識をガイドするために用いられる。基本的なアルゴリズムは、縦列と横列の遷移の数を用いるだけである。品質の改善は、レイアウト解析アルゴリズムを用いることによってなすことができる。入力画像は、白黒のデスキューされた画像であり、上述のデスキューステップで生成される。
図6は、テキスト領域位置を検出する結果を示す。本図は、走査画像67と、テキスト領域位置を含む6つの画像パラメータとを示し、それぞれのパラメータX1,X2,X3,X4,Y1,Y2は、テキスト領域の提案された境界を指示する。2つのテキスト領域65,66は、6つの座標値により定義され、この場合、左のテキスト領域65と右のテキスト領域66のy座標Y1,Y2は、図に示すように等しい。走査画像の上部から始まり、各横列での遷移数が算出される。この数が15を越えるとき、テキスト領域のY1が見出される。Y2に対しては、同一方法が用いられる。両ページのテキスト領域の左右の境界を見つけることは、より困難でありうる。これは、ページが数行(ライン)のテキストだけを含みうるという事実により起こる。左から5より多い遷移の最初の発生が、X1を定義する。位置X4は、右から開始して30ピクセルより多く左に寄った位置で25遷移より多く、縦列における15より多い遷移の最初の発生により位置特定される。位置X2は、10ピクセルより多く右に寄った位置で5より少ない遷移となる、最初の5より少ない遷移で位置特定される。探索は、走査画像の幅の1/4で右に向かって開始される。位置X3は、10ピクセルより多く左に寄った位置で5より少ない遷移となる、5より少ない遷移の最初の発生により位置特定される。探索は、走査画像の幅の3/4にて左に向かって開始される。単純明快なアプローチに起因して、このステップは誤りを有しうる。少なくともデスキューされた画像及び幾らかのテキストがページ上に必要とされる。幾つかの通常的な誤りは、X1,X2,X3又はX4が、幾らかのテキストを通ってカットし、X2とX3の間のページ番号が切り出されること、又は、空ページにより引き起こされる作用である。誤り検出ステップは、かかるエラーの可能性を指示するパラメータを算出することによって、結果がアウトライアと看做されるべきかどうかを検出する。例えば、空のページが検出されることができる。X2とX3の間のスペース内の対象が検出された場合、X2又はX3ラインは、問題を解決するように対応して移動されてよく、又は、結果が、操作者に対して表示されるべきアウトライアとしてクラス分けされてもよい。
アウトライア検出ユニットにおいて、誤り検出ステップは、例えばヒストグラム品質に基づく信頼性ファクタに基づいて、先行する処理ステップの誤りの尤度を算出する。紙の幅、ある領域(テキスト又は数字)のスペクトル特性、角度のような異なるドメインの品質、対象のサイズ、色、白色度又はコントラスト等の、種々のパラメータがアウトライアを検出するために用いられてよい。アウトライア検出ユニットは、ページ画像の追加的な特性を判断してもよく、例えば、紙に対するテキスト領域位置、テキスト領域の幅のアウトライアを判断してもよい。全てのパラメータ又は特性は、処理中に収集されるマルチページ文書の統計的な知識、又は、操作者によって入力され又は自動的に仮想される先験的知識と比較されてよい。
一実施例では、アウトライア検出器は、ページのテキスト領域の幅に関して規則性を仮想することによって、テキスト領域幅のアウトライアを検出することができる。尚、左右のテキスト領域の上部及び/又は底部は同一と仮定されてよく、又は、異なると仮想されて別々に処理されてもよい。テキスト領域幅のアウトライアを検出するために用いられる方法は、次の場合にアウトライアを検出する式により表される。
Figure 2006054885
ここで、p=テキスト領域幅、Mpはテキスト領域幅の中央値である。中央値が用いられる理由は、平均値に過大な悪影響を及ぼす非常に大きなアウトライア(例えば、幅ゼロの空ページ)が存在しうるからである。閾値は、テキスト領域幅又は位置の全ての誤りを実質的に検出する実用値を見つけるため操作者により調整されてもよい。通常的な本に対する実際的な例では、閾値14が良好な結果を与えることが実証されている。
アウトライア関数により検出される考えられる誤りは、ユーザインターフェースを介して人手で調整されるように操作者に対して後に表示される。
ユーザインターフェースは、例えばディスプレイスクリーン上のメニューやツールバーのような、提案される画像を受け入れる又は調整する次の選択肢を有してよい。ユーザは、現に検査されている画像ページの下のボタンの1つを選択することによって各種機能を実行する。即ち、
・向き:本のページ内に水平であるべきラインを描くことによる人手によるデスキュー、又は、90又は180度を超える回転の指示
・紙領域:紙領域を含む長方形のセクション
・紙中央部:本の背の位置の選択
・左ページ:左ページのテキスト領域を含む長方形の選択
・右ページ:右ページのテキスト領域を含む長方形の選択
・正しくないと疑われている次の走査にいくこと、又は、誤り検出が用いられない場合にただ単にラインで次の走査にいくこと。
全ての機能は、同一の画像に関して必要に応じて多数回実行されてもよい。出力文書において、操作者が実行するアクションは記録されてもよく、再度見ることが可能となる。従って、アウトライアとしてマークされた走査をスキップすることは、永久的でなく、再スタート時に再度提供されることができる。ユーザが手動のデスキュー処理を行う場合、新しいグレー画像は、別々に記録されてもよい。
最後に、画像ページは、走査画像から切り出され、あらゆるデスキュー処理が考慮される。2連走査画像は、テキスト領域の境界で2つのページ画像に切り分けられ、全ての辺で35ピクセルが増加される。これは、狭い削り落としを防止するために実行され、画像の文字の部分を喪失することがほとんどなくなる。これは、画像の位置決めに悪影響を及ぼさない。最後に、一連の走査画像の切り出しとしてページ画像を含むファイルが構成される。ファイルは、元のマルチページ文書に対応するページ数及びブックマークを備えてよく、光学式文字認識(OCR)や適応的な背景補正のような光学処理に対して用いられてよい。
マルチページ文書を処理する更なる方法は、生成される一連のページ画像において論理構造を生成することを含む。基本的には、単一のマルチページ文書の走査画像の一セットは、例えば単一の文書ファイルであってよい、ページ画像の複合セットへと変換される。しかし、元のマルチページ文書は、通常的には、章や段落のような論理構造を有し、又は、複数の付録を含んでよい。元の構造は、複合セットにおける類似の構造に変換され、即ち、マルチページ文書のページ範囲に対応するセットの論理部分を指示する。尚、元の構造は、例えばページの番号付けから、又は、太くて大きいフォントでの章のタイトルのようなグラフィックレイアウト特徴から、自動的に検出されてよい。
論理構造を指示するために、スキャナ又は処理ユニットは、走査される文書における論理構造を生成するための選択肢を操作者に提供してよい。したがって、本方法は、一連のページ画像に割り当てられるべき構造を指示するためのコマンドを操作者から受けることを含む。コマンドは、マルチページ文書の操作中に与えられてよい。走査画像の各々のサブセットがページ画像の複合セットの論理部分を構成することを指示するため、マルチページ文書の一部の走査前及び/又は後に特別なボタンが押されてもよい。例えばインポートセット番号のようなブックマークの名前が、自動的に生成されてよく、その後、開始及び最終ページ番号が生成されてよい。したがって、変換される一連のページ画像内に論理構造を生成しつつ、構造化マルチページ文書を効率的に走査することができる。
図7は、多数のボタン又はキー72、及び、操作者に可視データを提供するためのディスプレイスクリーン71を有する。ディスプレイ71は、走査から得られるページ画像、又は、上述の如く提案のページ画像の品質を判断及び調整するために十分な大きさの少なくとも画像の一部を、表示するために十分なサイズ及び解像度である。
特に、ユーザインターフェース70は、IMPORTボタン74とSTARTボタン73を有する。STARTボタンは、OPEN/CLOSEボタンと名づけられてよい。STARTボタンは、走査動作を開閉し、IMPORTボタン74は、マルチページ分の部分の走査画像を既存のセットの後尾に付加する。各々の部分の元は、文書自動送り装置(ADF)にルーズシートとして配置されてよく、又は、操作者が本若しくは書類の連続するページをプラテン上に配置することによって人手により供給されてもよい。かかる部分を走査した後、操作者は、IMPORTボタンを押し、更なる部分を後尾に付け、同時に、ちょうど閉じられた部分に対してブックマークを文書ファイル内に定義する。最後に、処理は、STARTボタンを押すことにより終了されてよく、また、文書のデジタルバージョンの論理構造が完成される。
また、ユーザインターフェースは、論理部分が2連走査画像の左又は右ページで開始又は終了することを指示する特別ボタン又はメニュー機能を備えてもよい。
本発明は、本を走査する実施例により説明されてきたが、本発明は如何なるマルチページ文書処理に適していることは注意されるべきである。更に、会社環境に次いで、文書処理は、消費者の家庭又は公衆の商業サービスにおいてのように、如何なる規模であってもよい。また、生成された一連のページ画像内の論理構造の生成方法は、別々に適用されてもよい。尚、この文書において、動詞‘含む’及びその変形は、他の要素やステップの存在を排除するものでなく、単数表現は、複数の要素の存在を排除するものでなく、如何なる参照符号もクレームの範囲を制限するものでなく、本発明及び各ユニット又は手段は、適切なハードウェア及び/又はソフトウェアにより実現されてよく、幾つかの‘ユニット’又は‘手段’は、同一のアイテムにより表現されてもよい。更に、本発明の範囲は、実施例に限定されるものでなく、本発明は、上述の各それぞれの新規な特徴及びその組み合わせに存ずる。
文書を処理するための装置を示す図である。 マルチページ文書の走査方法を示す図である。 本の走査画像の一例を示す図である。 向きを検出するためのテキストの特性を示す図である。 文書処理システムの構成部分の図である。 文字領域位置を検出する結果を示す図である。 ユーザインターフェースを示す図である。
符号の説明
65,66 ページ画像
67 走査画像

Claims (18)

  1. マルチページ文書の一連のページの光学的な走査により走査画像を受信するステップと、マルチページ文書の元のページに対応するページ画像を生成するために前記走査画像を処理するステップとを備える、マルチページ文書処理方法において、
    前記走査画像の処理中に得られるマルチページ文書のページ特性に基づいて画像パラメータに対する目標基準を自動的に決定するステップと、
    ページのページ特性が目標基準に従っているか否かをチェックするステップとを備え、
    従っている場合は、ページ画像を自動的に受け入れ、
    そうでない場合は、操作者に対して補正措置のためにページ画像を表示し又はページ画像を受け入れることを特徴とする、マルチページ文書処理方法。
  2. 前記目標基準の決定は、走査画像の処理の間に得られるページ特性に基づいて、少なくとも1つの画像パラメータに対する目標範囲を統計的に決定することを含む、請求項1に記載のマルチページ文書処理方法。
  3. 画像パラメータは、紙サイズ、テキスト領域又は寸法を含む、請求項2に記載のマルチページ文書処理方法。
  4. 前記画像パラメータが目標基準に従っているか否かを検出するステップは、ページ画像を生成するためになされる調整に対する信頼性を指示する信頼性ファクタを算出することを含む、請求項1又は2に記載のマルチページ文書処理方法。
  5. 走査画像を処理するステップは、異なる向きの走査画像から上側が上になるページ画像を生成するためにページの向きを検出することを含む、請求項4に記載のマルチページ文書処理方法。
  6. ページの向きを検出するステップは、テキストを検出し、テキストの特性を判断し、特別な場合はアセンダーやデセンダーの比を判断し、又は、選択した文字の向きを判断することを含む、請求項5に記載のマルチページ文書処理方法。
  7. 画像パラメータは、テキストラインの向きを含み、走査画像を処理するステップは、テキストラインの向きを検出し、検出したテキストラインの向きに応じて走査画像のスキューを補正することを含む、請求項1〜6の何れかに記載のマルチページ文書処理方法。
  8. 目標基準は、マルチページ文書のページの所定パラメータに対する文書についての先験的知識に依存する、請求項1〜7の何れかに記載のマルチページ文書処理方法。
  9. 走査画像を処理するステップは、マルチページ文書における本の背を検出し、単一の走査画像からの2つのページ画像を生成することを含む、請求項1〜8の何れかに記載のマルチページ文書処理方法。
  10. 走査画像を処理するステップは、2ページのそれぞれに対して独立的に、テキストラインの向きを検出し、検出したテキストラインの向きに応じて走査画像のスキューを補正することを含む、請求項9に記載のマルチページ文書処理方法。
  11. ページ画像の複合セットを構築することを含み、該複合セットは、マルチページ文書におけるページの範囲に対応する論理部分を有する、請求項1に記載のマルチページ文書処理方法。
  12. 走査画像のサブセットがページ画像の複合セットの論理部分を構成していることを指示するコマンドをユーザから受けることを含む、請求項11に記載のマルチページ文書処理方法。
  13. マルチページ文書を処理するためのコンピュータープログラムであって、
    プロセッサをして請求項1〜12の何れかに記載のマルチページ文書処理方法を実行させるように動作する、コンピュータープログラム。
  14. マルチページ文書の一連のページの光学的な走査により走査画像を生成するスキャナユニット(51)と、
    ユーザインターフェースユニット(54)と、
    マルチページ文書の元のページに対応するページ画像を生成するために前記走査画像を処理する画像プロセッサユニット(61)と、を備える文書処理システムにおいて、
    前記走査画像の処理中に得られるマルチページ文書のページ特性に基づいて画像パラメータに対する目標基準を決定し、
    ページのページ特性が目標基準に従っているか否かをチェックし、
    従っている場合は、ページ画像を自動的に受け入れ、
    そうでない場合は、操作者に対して補正措置のためにページ画像を表示し又はユーザインターフェースユニット(54)を介してページ画像を受け入れるアウトライア検出手段(62)を備えることを特徴とする、文書処理システム。
  15. アウトライア検出手段(62)は、走査画像の処理の間に得られるページ特性に基づいて、少なくとも1つの画像パラメータに対する目標範囲を統計的に決定することを含む、請求項14に記載のシステム。
  16. 画像プロセッサユニット(61)は、ページ画像の複合セットを構築するように構成され、該複合セットは、マルチページ文書におけるページの範囲に対応する論理部分を有する、請求項14に記載のシステム。
  17. ユーザインターフェースユニット(54)は、走査画像のサブセットがページ画像の複合セットの論理部分を構成していることを指示するコマンドをユーザから受けるように構成される、請求項16に記載のシステム。
  18. 前記がページ画像を印刷するプリンタユニット(130)を含む、請求項14に記載のシステム。
JP2005230964A 2004-08-10 2005-08-09 走査中のアウトライア検出 Expired - Fee Related JP4963809B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04077285.7 2004-08-10
EP04077285 2004-08-10

Publications (2)

Publication Number Publication Date
JP2006054885A true JP2006054885A (ja) 2006-02-23
JP4963809B2 JP4963809B2 (ja) 2012-06-27

Family

ID=34928444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005230964A Expired - Fee Related JP4963809B2 (ja) 2004-08-10 2005-08-09 走査中のアウトライア検出

Country Status (6)

Country Link
US (1) US8564844B2 (ja)
EP (2) EP1628240B1 (ja)
JP (1) JP4963809B2 (ja)
CN (1) CN1734469B (ja)
AT (1) ATE388449T1 (ja)
DE (1) DE602005005117T2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009003937A (ja) * 2007-06-21 2009-01-08 Sharp Corp デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
JP2009003936A (ja) * 2007-06-21 2009-01-08 Sharp Corp デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
JP2009231977A (ja) * 2008-03-19 2009-10-08 Olympus Corp 受信システム
JP2013157947A (ja) * 2012-01-31 2013-08-15 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、プログラムおよび記録媒体
US8749832B2 (en) 2006-03-24 2014-06-10 Brother Kogyo Kabushiki Kaisha Information processing device

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9110868B2 (en) * 2005-01-10 2015-08-18 Xerox Corporation System and method for logical structuring of documents based on trailing and leading pages
TWI281346B (en) * 2005-07-15 2007-05-11 Avision Inc Continuous scanning method with a multi-page preview function
JP4341629B2 (ja) * 2006-01-27 2009-10-07 カシオ計算機株式会社 撮像装置、画像処理方法及びプログラム
US8213687B2 (en) * 2006-04-28 2012-07-03 Hewlett-Packard Development Company, L.P. Image processing methods, image processing systems, and articles of manufacture
JP2007336143A (ja) * 2006-06-14 2007-12-27 Ricoh Co Ltd 画像処理装置
US7917338B2 (en) * 2007-01-08 2011-03-29 International Business Machines Corporation Determining a window size for outlier detection
US8340430B2 (en) 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
KR101198769B1 (ko) * 2007-07-13 2012-11-12 삼성전자주식회사 화상형성장치 및 그 제어방법
KR20090018339A (ko) * 2007-08-17 2009-02-20 삼성전자주식회사 화상판독장치 및 이를 이용한 화상보정방법
US8023741B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
JP5060404B2 (ja) * 2008-06-20 2012-10-31 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
JP4800365B2 (ja) * 2008-09-30 2011-10-26 株式会社沖データ 画像処理装置
US8135776B2 (en) * 2008-11-24 2012-03-13 The Boeing Company System and method for scalable architecture for web-based collaborative annotation of page-based documents
US8311331B2 (en) * 2010-03-09 2012-11-13 Microsoft Corporation Resolution adjustment of an image that includes text undergoing an OCR process
CN101930594B (zh) * 2010-04-14 2012-05-23 山东山大鸥玛软件有限公司 一种扫描文档图像的快速纠偏方法
US8526709B2 (en) 2011-01-13 2013-09-03 Lam Research Corporation Methods and apparatus for detecting multiple objects
JP5582106B2 (ja) * 2011-07-19 2014-09-03 コニカミノルタ株式会社 画像処理装置および画像処理装置の制御プログラム
CN102447810A (zh) * 2011-10-27 2012-05-09 天津大学 一种非接触式图像扫描还原方法
CN102938063B (zh) * 2012-12-05 2016-02-10 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子化方法
US20140181155A1 (en) * 2012-12-21 2014-06-26 Dropbox, Inc. Systems and methods for directing imaged documents to specified storage locations
US9076058B2 (en) 2013-01-29 2015-07-07 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for determining orientation in a document image
US9292537B1 (en) 2013-02-23 2016-03-22 Bryant Christopher Lee Autocompletion of filename based on text in a file to be saved
US9256813B2 (en) * 2014-05-22 2016-02-09 Xerox Corporation Automatic print job ticket settings based on raster images of previously printed document
US9239961B1 (en) * 2014-09-24 2016-01-19 Amazon Technologies, Inc. Text recognition near an edge
US9639768B2 (en) * 2014-12-09 2017-05-02 Xerox Corporation Methods and systems to adaptively detect object borders from electronic device images
US10042031B2 (en) 2015-02-11 2018-08-07 Xerox Corporation Method and system for detecting that an object of interest has re-entered a field of view of an imaging device
KR20170076335A (ko) * 2015-12-24 2017-07-04 에스프린팅솔루션 주식회사 화상형성장치, 그의 가이드 제공 방법, 클라우드 서버 및 그의 오류 분석 방법
JP2017146938A (ja) * 2016-02-19 2017-08-24 富士通株式会社 書籍検出装置、書籍検出方法及び書籍検出用コンピュータプログラム
US10255457B2 (en) * 2016-09-28 2019-04-09 Microsoft Technology Licensing, Llc Outlier detection based on distribution fitness
US10043019B2 (en) * 2016-09-28 2018-08-07 Microsoft Technology Licensing, Llc External dataset-based outlier detection for confidential data in a computer system
US10025939B2 (en) * 2016-09-28 2018-07-17 Microsoft Technology Licensing, Llc Internal dataset-based outlier detection for confidential data in a computer system
US10121250B2 (en) * 2016-12-01 2018-11-06 International Business Machines Corporation Image orientation detection
US10262154B1 (en) 2017-06-09 2019-04-16 Microsoft Technology Licensing, Llc Computerized matrix factorization and completion to infer median/mean confidential values
JP6991072B2 (ja) * 2018-01-31 2022-01-12 シャープ株式会社 画像読取装置、画像形成装置および制御方法
CN108449525B (zh) * 2018-03-26 2019-06-28 京东方科技集团股份有限公司 自动光学检查中标准图像的获取方法及自动光学检查设备
CN108810307B (zh) * 2018-06-15 2020-09-04 深圳市成者云科技有限公司 一种边框页码扫描系统
US10311556B1 (en) 2018-07-02 2019-06-04 Capital One Services, Llc Systems and methods for image data processing to remove deformations contained in documents
TWI733053B (zh) * 2018-09-07 2021-07-11 虹光精密工業股份有限公司 事務機與事務機的操控組件之控制方法
US11115551B2 (en) * 2019-07-16 2021-09-07 Tata Consultancy Services Limited Device for performing secure and automatic flipping and scanning of documents

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0927888A (ja) * 1995-07-13 1997-01-28 Ricoh Co Ltd 画像読取装置
JP2002290637A (ja) * 2001-03-23 2002-10-04 Murata Mach Ltd 画像処理装置
JP2004104435A (ja) * 2002-09-09 2004-04-02 Ricoh Co Ltd 画像読み取り方法、画像読み取り装置およびネットワークシステム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2109266C (en) * 1992-11-05 2002-05-07 Edward Schmid Method of and system and apparatus for automatically creating, identifying, routing and storing digitally scanned documents
JPH06259597A (ja) * 1993-03-09 1994-09-16 Ricoh Co Ltd ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置
DE69600461T2 (de) * 1995-01-17 1999-03-11 Eastman Kodak Co System und Verfahren zur Bewertung der Abbildung eines Formulars
EP0772145A3 (en) * 1995-11-06 1999-02-24 JOHNSON & QUIN, INC. System and method for determining quality of printed matter
SE508972C2 (sv) 1996-08-28 1998-11-23 Ralip International Ab Förfarande för kvalitetssäkring vid scanning/kopiering av bilder/dokument samt anordning för genomförande av förfarandet
JPH11136410A (ja) * 1997-10-29 1999-05-21 Canon Inc 情報処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP3854024B2 (ja) * 1999-11-30 2006-12-06 株式会社Pfu 文字認識前処理装置及び方法並びにプログラム記録媒体
US7668362B2 (en) * 2000-05-03 2010-02-23 Aperio Technologies, Inc. System and method for assessing virtual slide image quality
US6735335B1 (en) * 2000-05-30 2004-05-11 Microsoft Corporation Method and apparatus for discriminating between documents in batch scanned document files
US7212671B2 (en) * 2001-06-19 2007-05-01 Whoi-Yul Kim Method of extracting shape variation descriptor for retrieving image sequence
US6996290B2 (en) * 2002-01-31 2006-02-07 Hewlett-Packard Development Company, L.P. Binding curvature correction
JP4141235B2 (ja) * 2002-02-08 2008-08-27 株式会社リコー 画像補正装置及びプログラム
US20030174228A1 (en) * 2002-03-14 2003-09-18 Brake Wilfred F. System for user-selectable image pre-processing in a digital camera
US7170644B2 (en) * 2002-08-30 2007-01-30 Xerox Corporation Method and system for reducing distortion in scanned images
JP4113804B2 (ja) * 2003-03-19 2008-07-09 株式会社リコー 画像処理装置及び画像処理プログラム
US7483589B2 (en) * 2004-12-07 2009-01-27 Lexmark International, Inc. Method for copying objects

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0927888A (ja) * 1995-07-13 1997-01-28 Ricoh Co Ltd 画像読取装置
JP2002290637A (ja) * 2001-03-23 2002-10-04 Murata Mach Ltd 画像処理装置
JP2004104435A (ja) * 2002-09-09 2004-04-02 Ricoh Co Ltd 画像読み取り方法、画像読み取り装置およびネットワークシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8749832B2 (en) 2006-03-24 2014-06-10 Brother Kogyo Kabushiki Kaisha Information processing device
JP2009003937A (ja) * 2007-06-21 2009-01-08 Sharp Corp デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
JP2009003936A (ja) * 2007-06-21 2009-01-08 Sharp Corp デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
JP2009231977A (ja) * 2008-03-19 2009-10-08 Olympus Corp 受信システム
JP2013157947A (ja) * 2012-01-31 2013-08-15 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
DE602005005117T2 (de) 2009-03-19
DE602005005117D1 (de) 2008-04-17
US8564844B2 (en) 2013-10-22
JP4963809B2 (ja) 2012-06-27
ATE388449T1 (de) 2008-03-15
EP1843275A3 (en) 2007-12-19
US20060033967A1 (en) 2006-02-16
EP1628240A2 (en) 2006-02-22
CN1734469B (zh) 2011-01-12
EP1628240A3 (en) 2006-05-31
EP1628240B1 (en) 2008-03-05
EP1843275A2 (en) 2007-10-10
CN1734469A (zh) 2006-02-15

Similar Documents

Publication Publication Date Title
JP4963809B2 (ja) 走査中のアウトライア検出
US6839459B2 (en) Method and apparatus for three-dimensional shadow lightening
US7768676B2 (en) Image reading apparatus
US6567628B1 (en) Methods and apparatus to determine page orientation for post imaging finishing
US9319547B2 (en) Document scanning method, system, and device having sets of parallel lines as background
US8270041B2 (en) Image processing apparatus for reading open book documents
US11341733B2 (en) Method and system for training and using a neural network for image-processing
US20070188810A1 (en) Image processing apparatus
US20110102858A1 (en) Layout editing system, layout editing method, and image processing apparatus
US10896012B2 (en) Image processing apparatus, image processing method, and storage medium
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
US10943108B2 (en) Image reader performing character correction
US11074441B2 (en) Image processing apparatus, storage medium, and image processing method for performing image repeat print processing
JP6394579B2 (ja) 画像読取装置及び画像形成装置
JP7482625B2 (ja) 画像処理装置、画像処理装置の制御方法、及びプログラム
JP4168957B2 (ja) 画像処理プログラムおよび装置
US20070236755A1 (en) Method of generating an image of a single document
US11032439B2 (en) Image processing apparatus
JP7434981B2 (ja) 情報処理装置及びプログラム
JP2022162474A (ja) 画像処理システム、画像処理方法、及びプログラム
JP2006178657A (ja) 画像保証システム、画像保証方法及び画像保証プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080716

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111202

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20111212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120327

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees