JP2006235784A - 画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラム - Google Patents

画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP2006235784A
JP2006235784A JP2005046554A JP2005046554A JP2006235784A JP 2006235784 A JP2006235784 A JP 2006235784A JP 2005046554 A JP2005046554 A JP 2005046554A JP 2005046554 A JP2005046554 A JP 2005046554A JP 2006235784 A JP2006235784 A JP 2006235784A
Authority
JP
Japan
Prior art keywords
document
area
information
image processing
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005046554A
Other languages
English (en)
Inventor
Atsushi Ito
篤 伊藤
Isao Yamaguchi
功 山口
Yoshihiko Mitamura
欣彦 三田村
Hideaki Ashikaga
英昭 足利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005046554A priority Critical patent/JP2006235784A/ja
Publication of JP2006235784A publication Critical patent/JP2006235784A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】 原本ドキュメントを参照することなく、ドキュメントにおける追記情報の解析を可能とした装置、および方法を提供する。
【解決手段】 ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域の位置情報を含む領域情報を生成し、生成した領域情報を出力ドキュメント中に埋め込んで出力し、追記情報解析処理においては、ドキュメントに記録された領域情報に基づいて、余白領域を特定し、余白領域に記録されたデータを追記情報として判別して解析する。本構成により、ドキュメントに対する追記の検証、抽出を原本イメージを適用することなく効率的に実行することが可能となる。
【選択図】 図1

Description

本発明は、画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラムに関する。さらに詳細には、テキストやイメージデータなどから構成されるドキュメント、例えばプリント出力されたドキュメントに対して行なわれたメモ書きなどの追記情報を効率的に確実に解析、取得する画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラムに関する。
画像処理の分野において、例えばプリンタやFAXなどから出力したドキュメントに、ユーザが記入したメモ書きなどの追記情報を抽出したり、セキュリティ文書が改竄されていないかどうかを検証する処理について、様々な研究、開発が行なわれている。一般的に、このような追記、改竄検証処理には、オリジナルのドキュメントデータと、追記等の可能性がある出力ドキュメントとの比較を行う処理が行なわれる。
さらに、近年、オリジナルドキュメントとの比較処理を行なうことなく、追記等の可能性のあるドキュメントのみの解析に基づいて追記情報を抽出する処理について研究がなされている。例えば、特許文献1は、予め決められたフォームを設定し、そのフォームの出力用紙に追記領域を指定し、その指定領域位置情報を例えばバーコードで出力用紙に記録し、解析字にバーコードから追記領域情報を取得し、その追記領域中のデータのみを追記情報として解析する構成を開示している。この構成により、オリジナルドキュメントとの比較なしに追記情報を取得することができる。
さらに、特許文献2は、原本画像を領域分割して、分割イメージ情報をバーコードとして、印刷文書に印刷し、印刷文書の解析時にバーコードから原本イメージを取得して、印刷文書の対応領域のイメージとの比較を行って追記情報を抽出する処理構成を開示している。
上述の特許文献1の構成は、予め決められたフォームの原稿に対しての追記情報抽出であり、任意のフォームの原稿に対する追記情報抽出はできないという問題がある。すなわち、対応可能な原稿は限定され、汎用性は低い。また特許文献2の構成は、原本イメージのコード化を行なっているものであり、結果として原本イメージを保持しておく必要がある。つまり、原本画像情報の格納、原本画像情報の通信転送、原本画像と追記あり画像との比較など、処理が煩雑であり、またコストにおいける負担が大きいという問題がある。
特開2003−271942号公報 特開2003−018393号公報
本発明は、上述の問題点に鑑みてなされたものであり、ドキュメントに対する追記の検証、抽出を原本イメージを適用することなく効率的に実行することを可能とし、また任意のフォームの出力ドキュメントに対する追記情報抽出を可能とした画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラムを提供することを目的とする。
本発明の第1の側面は、画像処理装置であり、入力ドキュメントのレイアウトを解析するレイアウト解析手段と、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段と、を有することを特徴とする画像処理装置にある。
さらに、本発明の画像処理装置の一実施態様において、前記領域情報生成手段は、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域の位置を識別可能な座標データを生成する構成であることを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記領域情報生成手段は、前記座標データをデータ変換したコードデータを生成し、前記ドキュメント編集手段は、前記コードデータを構成データとして含む出力ドキュメントの編集を実行する構成であることを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記画像処理装置は、さらに、入力ドキュメントのレイアウトを修正するレイアウト修正手段を有し、前記領域選択手段は、前記レイアウト修正手段によって修正されたドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する処理を実行する構成であることを特徴とする。
さらに、本発明の第2の側面は、画像処理装置であり、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、入力ドキュメント構成データおよびドキュメント識別子を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段と、前記ドキュメント識別子と、前記領域情報を対応付けた管理テーブルをデータベースに記録する登録手段と、を有することを特徴とする画像処理装置にある。
さらに、本発明の第3の側面は、画像処理装置であり、入力ドキュメントのレイアウトを解析するレイアウト解析手段と、入力ドキュメントに記録された領域情報に基づいて、該入力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析手段と、前記領域情報解析結果に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析手段と、を有することを特徴とする画像処理装置。
さらに、本発明の画像処理装置の一実施態様において、前記領域情報解析手段は、入力ドキュメントに記録された領域情報に基づいて、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域に対応する座標データを取得する構成であることを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記画像処理装置は、さらに、入力ドキュメントのレイアウトを修正するレイアウト修正手段と、前記レイアウト修正手段によって修正された修正ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、前記修正ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段と、を有することを特徴とする。
さらに、本発明の第4の側面は、画像処理装置であり、入力ドキュメントのレイアウトを解析するレイアウト解析手段と、入力ドキュメントに記録されたドキュメント識別情報を取得し、該ドキュメント識別情報に対応付けられたドキュメントの余白領域または非余白領域の位置情報を、データベースから取得する領域情報解析手段と、
前記データベースから取得した位置情報に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析手段と、を有することを特徴とする画像処理装置にある。
さらに、本発明の第5の側面は、ドキュメント解析システムであり、出力ドキュメントを生成するドキュメント出力装置と、前記出力ドキュメントの解析を実行するドキュメント解析装置とを有し、前記ドキュメント出力装置は、入力ドキュメントのレイアウトを解析するレイアウト解析手段と、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段とを有し、前記ドキュメント解析装置は、前記出力ドキュメントのレイアウトを解析するレイアウト解析手段と、出力ドキュメントに記録された領域情報に基づいて、該出力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析手段と、前記領域情報解析結果に基づいて、出力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析手段と、を有することを特徴とするドキュメント解析システムにある。
さらに、本発明の第6の側面は、画像処理方法であり、入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、を有することを特徴とする画像処理方法にある。
さらに、本発明の画像処理方法の一実施態様において、前記領域情報生成ステップは、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域の位置を識別可能な座標データを生成することを特徴とする。
さらに、本発明の画像処理方法の一実施態様において、前記領域情報生成ステップは、前記座標データをデータ変換したコードデータを生成し、前記ドキュメント編集ステップは、前記コードデータを構成データとして含む出力ドキュメントの編集を実行することを特徴とする。
さらに、本発明の画像処理方法の一実施態様において、前記画像処理方法は、さらに、入力ドキュメントのレイアウトを修正するレイアウト修正ステップを有し、前記領域選択ステップは、前記レイアウト修正ステップによって修正されたドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する処理を実行することを特徴とする。
さらに、本発明の第7の側面は、画像処理方法であり、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、入力ドキュメント構成データおよびドキュメント識別子を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、前記ドキュメント識別子と、前記領域情報を対応付けた管理テーブルをデータベースに記録する登録ステップと、を有することを特徴とする画像処理方法にある。
さらに、本発明の第8の側面は、画像処理方法であり、入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、入力ドキュメントに記録された領域情報に基づいて、該入力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析ステップと、前記領域情報解析結果に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析ステップとを有することを特徴とする画像処理方法にある。
さらに、本発明の画像処理方法の一実施態様において、前記領域情報解析ステップは、入力ドキュメントに記録された領域情報に基づいて、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域に対応する座標データを取得することを特徴とする。
さらに、本発明の画像処理方法の一実施態様において、前記画像処理方法は、さらに、入力ドキュメントのレイアウトを修正するレイアウト修正ステップと、前記レイアウト修正ステップによって修正された修正ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、前記修正ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、を有することを特徴とする。
さらに、本発明の第9の側面は、画像処理方法であり、入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、入力ドキュメントに記録されたドキュメント識別情報を取得し、該ドキュメント識別情報に対応付けられたドキュメントの余白領域または非余白領域の位置情報を、データベースから取得する領域情報解析ステップと、前記データベースから取得した位置情報に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析ステップとを有することを特徴とする画像処理方法にある。
さらに、本発明の第10の側面は、画像処理をコンピュータ上において実行させるコンピュータ・プログラムであり、入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、を有することを特徴とするコンピュータ・プログラムにある。
さらに、本発明の第11の側面は、画像処理をコンピュータ上において実行させるコンピュータ・プログラムであり、入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、入力ドキュメントに記録された領域情報に基づいて、該入力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析ステップと、前記領域情報解析結果に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析ステップとを有することを特徴とするコンピュータ・プログラムにある。
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
本発明の構成によれば、ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域の位置情報を含む領域情報を生成し、生成した領域情報を出力ドキュメント中に埋め込んで出力する構成とし、ドキュメントの追記情報解析を行う装置において、ドキュメントに記録された領域情報に基づいて、ドキュメントの余白領域または非余白領域の位置情報を取得して、入力ドキュメントに設定された余白領域を特定し、余白領域に記録されたデータを追記情報として判別して解析する構成としたので、ドキュメントに対する追記の検証、抽出を原本イメージを適用することなく効率的に実行することが可能となる。
また、本発明の構成では、レイアウト変更を可能として変更したレイアウトにおける余白情報などを設定する構成としたので、任意のフォームの出力ドキュメントに対する追記情報の抽出が可能となる。
本発明の構成では、オリジナルドキュメントを参照することなく、ドキュメントにおける追記情報を判別して取得、解析を行うことが可能となり、原本ドキュメントの保存、照合といったプロセスが不要となり、効率的な追記情報解析が可能となる。
以下、図面を参照しながら本発明の実施形態に係る画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラムの詳細について説明する。
まず、図1を参照して、本発明のドキュメント解析システム、および画像処理装置を適用した処理の概要について説明する。図1に示す原本ドキュメント10は、スキャナ101などのデータ読み取り処理装置によって読み取られPCなどの画像処理装置A102に格納される。画像処理装置A102は、本発明のドキュメント解析システムにおいてドキュメント出力装置として機能する装置である。なお、スキャナ101などのデータ読み取り処理装置によって読み取られるデータはイメージデータ、テキストデータ等いずれでもよく、例えばOCRなどによってテキスト解析済みのデータとして取り込まれる場合もある。すなわち、本発明において処理対象とするドキュメントは、イメージデータ、テキストデータのいずれでもよい。
なお、原本ドキュメントは、図に示すようにスキャナなどのデータ読み取り装置に読み取られるドキュメントのみならず、PCなどの画像処理装置A102において生成し、ハードディスクなどのデータベース112に格納された電子データとしてのドキュメント10'であってもよい。例えばレイアウト情報などの様々な属性データが付与されている文書作成アプリケーションで生成した文書などであってもよい。
PCなどの画像処理装置A102にスキャナ101を介して入力したドキュメントあるいはハードディスク等のデータベース112に格納されたドキュメントデータはプリンタ103を介して出力され、ユーザに配布される。プリンタの出力する出力ドキュメントは、図に示す出力ドキュメント200である。出力ドキュメントは、原本ドキュメントの記録されたデータに加えて領域情報記録部202に、出力ドキュメントにおける余白領域または非余白領域に関する情報が記録される。
すなわち、図に示す出力ドキュメント200に、予め定められた一定以上の面積を有する余白領域が存在するか否かをPC等の画像処理装置A102が解析し、出力ドキュメント200に含まれる余白領域201に関する情報、例えば座標情報を取得して、座標情報をバーコード,QRコードなどのコードに変換し、コードデータを領域情報記録部202に記録して出力する。
例えば余白領域201の左上端座標と右下段座標に対応するデータがコードデータとして領域情報記録部202に記録された出力ドキュメント202がプリンタ103から出力されることになる。なお、出力ドキュメント200には、複数の異なる態様があり、これらについては、図2を参照して後段で説明する。
出力ドキュメント200に対しては、ユーザによってメモ書きなど、様々な追記情報が記録される。追記情報を解析するのが、図1に示すPC等によって構成される画像処理装置B105である。追記情報が記録された可能性のある出力ドキュメント200は、スキャナ104などのデータ読み取り処理装置によって読み取られPCなどの画像処理装置B105に入力される。画像処理装置B105は、本発明のドキュメント解析システムにおいてドキュメント解析装置として機能する装置である。
画像処理装置B105は、読み取りデータから領域情報記録部202に記録された情報を抽出して、余白領域の位置を特定する。その後、余白領域内に含まれる記録データを解析し、解析データを追記データとして判定し、サーバ106などに登録、あるいは追記情報の出力を行なう。
以上が、本発明の画像処理装置を適用した基本的な処理の概要である。上述の説明から理解されるように、本発明の構成では、原本ドキュメントの保存データを適用することなく、出力ドキュメントのみから追記情報を取得することが可能となる。
以下、図2以下を参照しながら、本発明の画像処理装置の実行する処理の詳細について説明する。図2は、図1における画像処理装置A102が原本ドキュメントに基づいて生成し、プリンタ103を介して出力する出力ドキュメントの例を示した図である。
図2には、(a)〜(c)の3種類の出力ドキュメントの例を示している。
(a)は、領域情報記録部202aに、余白領域の位置情報を埋め込んだ例である。例えば余白領域201aの左上端座標と右下段座標に対応するデータがコードデータとして領域情報記録部202aに記録されている。なお、図には1つの余白領域のみを示しているが、複数の余白領域が存在する場合は、複数の余白領域に関する情報をまとめて領域情報記録部202aに記録する。なお、余白領域として認定する領域は、例えば予め定められた閾値以上の高さ、幅を持つ領域であり、画像処理装置A102は、設定閾値に基づいて、余白領域の抽出を実行して、各余白領域の座標を算出して、コード変換を実行して領域情報記録部202aに記録するコードを生成する。
(b)は、領域情報記録部202bに、非余白領域の位置情報を埋め込んだ例である。例えば非余白領域202bの左上端座標と右下段座標に対応するデータがコードデータとして領域情報記録部202bに記録される。
(c)は、(a)と同様、余白領域201cの座標情報等の余白領域情報を領域情報記録部202cに埋め込んだ例であるが、(c)の例は、さらに、余白領域をユーザに明示するため、罫線などで余白領域を囲み、さらに、この領域が追記情報の記録領域であることを示すテキストを記録して出力した例である。ユーザはこの領域に追記情報を記録すればよいことが分かる。
次に、図1における画像処理装置A102の実行する処理、すなわち、原本ドキュメントに基づいて、余白領域または非余白領域などの情報を含む出力ドキュメントを生成し、プリンタ103を介して出力する処理の詳細について図3〜図6を参照して説明する。
まず、図3、図4を参照して、画像処理装置A102の実行する基本的な処理例について説明する。図3は、画像処理装置A102の実行する基本的処理に対応する機能を説明するブロック図であり、図4は処理手順を示すフローチャートである。
図3のブロック図を参照して、画像処理装置A102の実行する基本的な処理について説明する。画像処理装置A102は、原本ドキュメント入力手段321から原本ドキュメントのデータを入力する。例えばスキャナ311、あるいはハードディスクなどのデータベース312から入力する。なお、入力ドキュメントは、イメージデータ、テキストデータ、さらにレイアウト情報などの属性データを含むドキュメントなど様々なデータが含まれる。
原本ドキュメント入力手段321に入力された原本ドキュメントデータは、レイアウト解析手段322に入力され、原本ドキュメントのレイアウト解析が行われる。なお、原本ドキュメントに属性情報としてレイアウト情報が含まれる場合は、その情報を適用してもよい。レイアウト情報が含まれない場合は、原本ドキュメントのイメージの取得などを実行しレイアウト解析を実行する。なお、レイアウト解析手段322におけるレイアウト解析は、文字領域、写真領域などの領域解析であり、その目的は、主に余白位置と非余白位置の判別である。
レイアウト解析手段322におけるレイアウト解析結果は、余白または非余白領域選択手段323に入力され、原本ドキュメントにおける余白あるいは非余白領域の選択処理が実行される。先に説明した図2(a)または(c)に示す出力ドキュメントを生成する場合は、余白領域の選択が行なわれ、図2(b)に示す出力ドキュメントを生成する場合には、非余白領域の選択が実行されることになる。
埋め込み領域情報生成手段324は、余白または非余白領域選択手段323の選択した余白または非余白領域に対応する余白位置、または非余白位置情報を取得し、さらに、位置情報をコード変換して、埋め込み領域情報を生成する。余白位置、または非余白位置としては、例えば、余白位置、または非余白位置の左上端座標と右下端座標の組データが適用される。余白位置、または非余白位置の位置が識別可能であれば、その他のデータであってもよい。また、埋め込み領域情報生成手段324は、位置情報に対応するコードとして、例えばバーコードやQRコードなどのコードデータを生成する。なお、コードデータとせず、数値データとしてそのまま出力ドキュメントに記録出力する構成としてもよい。ただし、出力ドキュメントの解析を実行する画像処理装置B105において読み取り可能であり解釈可能なデータであることが必要である。
次に、出力ドキュメント編集手段325において、原本ドキュメントの内容と、埋め込み領域情報生成手段324の生成した余白位置または非余白位置を示す位置情報からなる埋め込み領域情報を併せた出力ドキュメントを編集生成し、出力ドキュメント出力手段、すなわちプリンタ103を介して出力する。ここで出力される出力ドキュメントは、先に図2を参照して説明した出力ドキュメントである。
図3に、上述した画像処理装置A102の実行する基本処理のシーケンスを説明するフローチャートを示す。フローに示す各ステップの処理について説明する。ステップS101において原本ドキュメントを入力する。例えばスキャナ、あるいはハードディスクなどから入力する。
ステップS102、S103は、レイアウト解析手段322におけるレイアウト解析処理であり、ステップS102において原本ドキュメントのレイアウト解析が行われ、ステップS103において、文字領域、写真領域などの領域解析が実行される。
ステップS104、S105は、余白または非余白位置情報取得手段323における余白または非余白分析処理であり、ステップS104において、原本ドキュメントにおける余白あるいは非余白領域の候補が抽出され、ステップS105において、候補領域から、一定以上の面積を有する領域を抽出する。
ステップS106、S107は、埋め込み領域情報生成手段324における埋め込み領域情報生成処理であり、ステップS106において、余白または非余白領域選択手段323の選択した余白または非余白領域に対応する余白位置、または非余白位置情報としての座標を取得し、さらに、ステップS107において、位置情報をバーコードやQRコードなどのコードデータに変換する。
ステップS108は、出力ドキュメント編集手段325における画像編集処理であり、原本ドキュメントの内容と、埋め込み領域情報生成手段324の生成した余白位置または非余白位置を示す位置情報からなる埋め込み領域情報を併せた出力ドキュメントを編集生成する。
ステップS109は、出力ドキュメント出力手段326の処理であり、出力ドキュメント編集手段325の生成した編集データ、すなわち、原本ドキュメントの記録情報と領域情報記録部の記録情報を併せた出力ドキュメントを出力して処理を終了する。ここで出力される出力ドキュメントは、先に図2を参照して説明した出力ドキュメントである。
次に、図5、図6を参照して、画像処理装置A102の実行するもう1つの処理例について説明する。以下で説明する処理例は、原本ドキュメントのレイアウトを修正して出力ドキュメントを生成する処理例であり、例えば、原本ドキュメントに追記領域として設定すべき余白領域が少ない場合など、原本ドキュメントのレイアウトを変更して余白領域を増加させて追記領域として設定することを可能とした拡張処理構成である。
図5は、画像処理装置A102の実行する拡張処理に対応する機能を説明するブロック図であり、図6は処理手順を示すフローチャートである。
図5のブロック図を参照して、画像処理装置A102の実行する拡張処理について説明する。画像処理装置A102は、原本ドキュメント入力手段321から原本ドキュメントのデータを入力する。例えばスキャナ311、あるいはハードディスクなどのデータベース312から入力する。なお、入力ドキュメントは、イメージデータ、テキストデータ、さらにレイアウト情報などの属性データを含むドキュメントなど様々なデータが含まれる。
原本ドキュメント入力手段321に入力された原本ドキュメントデータは、レイアウト解析手段322に入力され、原本ドキュメントのレイアウト解析が行われる。なお、原本ドキュメントに属性情報としてレイアウト情報が含まれる場合は、その情報を適用してもよい。レイアウト情報が含まれない場合は、原本ドキュメントのイメージの取得などを実行しレイアウト解析を実行する。
レイアウト解析手段322におけるレイアウト解析結果は、レイアウト修正手段331に入力され、ここで、レイアウト修正処理が実行される。例えば、レイアウト解析手段322におけるレイアウト解析の結果、選別された文字領域、写真領域などの領域を移動させる再配置処理を実行し、余白領域を1つにまとめるなどのレイアウト修正処理が実行される。
レイアウト修正手段331における修正されたレイアウトを持つ修正原本ドキュメントは、余白または非余白領域選択手段323に入力され、原本ドキュメントにおける余白あるいは非余白領域の選択処理が実行される。先に説明した図2(a)または(c)に示す出力ドキュメントを生成する場合は、余白領域の選択が行なわれ、図2(b)に示す出力ドキュメントを生成する場合には、非余白領域の選択が実行されることになる。
その後の処理は、図3を参照して説明したと同様の処理であり、埋め込み領域情報生成手段324において、余白または非余白領域選択手段323の選択した余白または非余白領域に対応する余白位置、または非余白位置情報を取得し、さらに、位置情報をコード変換して、埋め込み領域情報を生成し、出力ドキュメント編集手段325において、原本ドキュメントの内容と、埋め込み領域情報生成手段324の生成した余白位置または非余白位置を示す位置情報からなる埋め込み領域情報を併せた出力ドキュメントを編集生成し、出力ドキュメント出力手段、すなわちプリンタ103を介して出力する。ここで出力される出力ドキュメントは、先に図2を参照して説明した出力ドキュメントである。
図6に、上述した画像処理装置A102の実行する拡張処理のシーケンスを説明するフローチャートを示す。フローに示す各ステップの処理について説明する。ステップS201において原本ドキュメントを入力する。例えばスキャナ、あるいはハードディスクなどから入力する。
ステップS202、S203は、レイアウト解析手段322におけるレイアウト解析処理であり、ステップS202において原本ドキュメントのレイアウト解析が行われ、ステップS203において、文字領域、写真領域などの領域解析が実行される。
ステップS204、S205は、レイアウト修正手段331および余白または非余白位置情報取得手段323におけるレイアウト修正および余白または非余白分析処理である。ステップS204において、原本ドキュメントの文字領域、写真領域などの領域を移動させる再配置処理が実行される。具体的には、文字領域、写真領域を所定領域内にまとめて配置する。余白領域外の領域に再配置するなどの予め設定されたルールが適用され、余白領域を1つにまとめるなどのレイアウト修正処理が実行される。ステップS205では、修正原本ドキュメントにおける余白あるいは非余白領域の候補抽出、候補領域から、一定以上の面積を有する領域の抽出が実行される。
ステップS206、S207は、埋め込み領域情報生成手段324における埋め込み領域情報生成処理であり、ステップS206において、余白または非余白領域選択手段323の選択した余白または非余白領域に対応する余白位置、または非余白位置情報としての座標を取得し、さらに、ステップS207において、位置情報をバーコードやQRコードなどのコードデータに変換する。
ステップS208、ステップS209は、出力ドキュメント編集手段325における画像編集処理であり、ステップS208において、原本ドキュメントの内容と、埋め込み領域情報生成手段324の生成した余白位置または非余白位置を示す位置情報からなる埋め込み領域情報を併せた出力ドキュメントを編集生成する。ステップS209は、先に図2(c)を参照して説明した出力ドキュメントを生成する再に実行する処理であり、余白領域を示す囲み線などの罫線と、追記情報の記入領域であることを示す文字情報を生成する処理である。
ステップS210は、出力ドキュメント出力手段326の処理であり、出力ドキュメント編集手段325の生成した編集データ、すなわち、原本ドキュメントの記録情報と領域情報記録部の記録情報を併せた出力ドキュメントを出力して処理を終了する。ここで出力される出力ドキュメントは、先に図2を参照して説明した出力ドキュメントである。
次に、上述した処理によって生成された出力ドキュメントの解析に基づく追記情報の取得を行なう画像処理装置B105の構成および処理について、図7〜図10を参照して説明する。
まず、図7、図8を参照して、画像処理装置B105の実行する基本的な処理例について説明する。図7は、画像処理装置B105の実行する基本的処理に対応する機能を説明するブロック図であり、図8は処理手順を示すフローチャートである。
図7のブロック図を参照して、画像処理装置B105の実行する基本的な処理について説明する。画像処理装置B105は、出力ドキュメント入力手段421からユーザによって追記された情報が含まれる可能性のある出力ドキュメントのデータを入力する。例えばスキャナ411から入力する。
出力ドキュメント入力手段421に入力された出力ドキュメントデータは、レイアウト解析手段422に入力され、出力ドキュメントのレイアウト解析が行われるとともに、埋め込み領域情報解析手段423に入力され、出力ドキュメントに含まれるバーコード、QRコードなどの埋め込み領域情報の解析処理が実行される。レイアウト解析手段422におけるレイアウト解析は、文字領域、写真領域などの領域解析である。埋め込み領域情報解析手段423は、出力ドキュメントに含まれるバーコード、QRコードなどの埋め込み領域情報から、余白または非余白位置に対応する座標情報を取得して余白位置、すなわち追記情報書き込み領域を特定する処理を実行する。
追記情報解析手段424は、レイアウト解析手段422におけるレイアウト解析結果と、埋め込み領域情報解析手段423において特定された余白位置、すなわち追記情報書き込み領域情報を入力し、これらの情報に基づいて、特定された余白領域内に含まれるデータ、例えばテキストやイメージデータなどのデータを取得しこれらを追記情報と判定してテキストやイメージデータの読み取り処理、解析処理を実行する。
追記情報出力手段425は、追記情報解析手段424の取得、解析した追記情報を出力する。この出力処理は、例えばサーバなどのデータベースに格納する処理や、プリンタを介して、追記情報のみを出力するなどの処理として実行される。
図8に、上述した画像処理装置B105の実行する基本処理のシーケンスを説明するフローチャートを示す。フローに示す各ステップの処理について説明する。ステップS301において解析対象とする出力ドキュメントを入力する。例えばスキャナなどから入力する。
ステップS302、S303は、レイアウト解析手段422におけるレイアウト解析処理であり、ステップS302において解析対象とする出力ドキュメントのレイアウト解析が行われ、ステップS303において、文字領域、写真領域などの領域解析が実行される。
ステップS304、S305は、埋め込み領域情報解析手段423における埋め込み領域情報解析処理であり、ステップS304において、解析対象とする出力ドキュメントに記録された埋め込み領域情報を特定し、ステップS305において、埋め込み領域情報から、余白または非余白位置に対応する座標情報を取得して余白位置、すなわち追記情報書き込み領域を特定する処理を実行する。
ステップS306は、追記情報解析手段424における処理であり、レイアウト解析結果と、埋め込み領域情報に基づいて特定された余白位置、すなわち追記情報書き込み領域情報に基づいて、特定された余白領域内に含まれるデータ、例えばテキストやイメージデータなどのデータを取得し解析する。
ステップS307は、追記情報出力手段425における処理であり、追記情報解析手段424の取得、解析した追記情報をサーバなどのデータベースに格納、あるいはプリンタを介して追記情報のみを出力する。
次に、図9、図10を参照して、画像処理装置B105において、追記情報の解析を行うとともに、さらに、追記可能な出力ドキュメントを生成して再出力する処理を実行する処理例について説明する。図9は、画像処理装置B105の実行するこの拡張処理に対応する機能を説明するブロック図であり、図10は処理手順を示すフローチャートである。
図9のブロック図を参照して、画像処理装置B105の実行する拡張処理について説明する。図9において、出力ドキュメント入力手段421、レイアウト解析手段422、埋め込み領域情報解析手段423、追記情報解析手段424、追記情報出力手段425の処理は、図7を参照して説明した処理と同様であり、出力ドキュメントの入力、レイアウト解析、埋め込み領域情報の解析、余白領域内に含まれるデータの読み取り、解析、出力処理である。
本実施例においては、追記情報解析手段424における解析結果をレイアウト修正手段431に入力し、出力ドキュメントに基づく再出力ドキュメントの生成処理が実行される。レイアウト修正手段431は、出力ドキュメントに含まれる追記情報を削除したり、あるいは手書き文字などを文字コードに基づく文字データに変換してレイアウトを変更したり、追記情報を所定の大きさ、領域範囲に収める、などの処理を実行して、追記情報を含むドキュメントを再構成して新たな余白領域を設定するなどのレイアウト変更処理を実行する。
レイアウト修正手段431における修正されたレイアウトを持つ再出力ドキュメントは、余白または非余白領域選択手段432に入力され、再出力ドキュメントにおける余白あるいは非余白領域の選択処理が実行される。先に説明した図2(a)または(c)に示す出力ドキュメントを生成する場合は、余白領域の選択が行なわれ、図2(b)に示す出力ドキュメントを生成する場合には、非余白領域の選択が実行されることになる。
その後の処理は、図3を参照して説明したと同様の処理であり、埋め込み領域情報生成手段433において、余白または非余白領域選択手段432の選択した余白または非余白領域に対応する余白位置、または非余白位置情報を取得し、さらに、位置情報をコード変換して、埋め込み領域情報を生成し、出力ドキュメント編集手段434において、再出力ドキュメントの内容と、埋め込み領域情報生成手段433の生成した余白位置または非余白位置を示す位置情報からなる埋め込み領域情報を併せた出力ドキュメントを編集生成し、出力ドキュメント出力手段435を介して出力する。ここで出力される出力ドキュメントは、先に図2を参照して説明した出力ドキュメントとなる。
図10に、上述した画像処理装置B105の実行する拡張処理のシーケンスを説明するフローチャートを示す。フローに示す各ステップの処理について説明する。ステップS401において解析対象とする出力ドキュメントを入力する。例えばスキャナなどから入力する。
ステップS402、S403は、レイアウト解析手段422におけるレイアウト解析処理であり、ステップS402において解析対象とする出力ドキュメントのレイアウト解析が行われ、ステップS403において、文字領域、写真領域などの領域解析が実行される。
ステップS404、S405は、埋め込み領域情報解析手段423における埋め込み領域情報解析処理であり、ステップS404において、解析対象とする出力ドキュメントに記録された埋め込み領域情報を特定し、ステップS405において、埋め込み領域情報から、余白または非余白位置に対応する座標情報を取得して余白位置、すなわち追記情報書き込み領域を特定する処理を実行する。
ステップS406は、追記情報解析手段424における処理であり、レイアウト解析結果と、埋め込み領域情報に基づいて特定された余白位置、すなわち追記情報書き込み領域情報に基づいて、特定された余白領域内に含まれるデータ、例えばテキストやイメージデータなどのデータを取得し解析する。
ステップS407は、追記情報出力手段425における処理であり、追記情報解析手段424の取得、解析した追記情報をサーバなどのデータベースに格納、あるいはプリンタを介して追記情報のみを出力する。
次のステップS408、S409の処理は、レイアウト修正手段431および余白または非余白位置情報取得手段432におけるレイアウト修正および余白または非余白分析処理である。ステップS408において、再出力ドキュメントの文字領域、写真領域、先の出力ドキュメントにおける追記情報記入領域などの領域を移動させる再配置処理が実行される。具体的には、文字領域、写真領域を所定領域内にまとめて配置する。余白領域外の領域に再配置するなどの予め設定されたルールが適用され、新たに生成する余白領域を1つにまとめるなどのレイアウト修正処理が実行される。ステップS409では、再出力ドキュメントにおける余白あるいは非余白領域の候補抽出、候補領域から、一定以上の面積を有する領域の抽出が実行される。
ステップS410、S411は、埋め込み領域情報生成手段433における埋め込み領域情報生成処理であり、ステップS410において、余白または非余白領域選択手段432の選択した余白または非余白領域に対応する余白位置、または非余白位置情報としての座標を取得し、さらに、ステップS411において、位置情報をバーコードやQRコードなどのコードデータに変換する。
ステップS412は、出力ドキュメント編集手段434における画像編集処理であり、再出力ドキュメントの内容と、埋め込み領域情報生成手段433の生成した余白位置または非余白位置を示す位置情報からなる埋め込み領域情報を併せた出力ドキュメントを編集生成する。
ステップS413は、出力ドキュメント出力手段435の処理であり、出力ドキュメント編集手段434の生成した編集データ、すなわち、再出力ドキュメントの記録情報と領域情報記録部の記録情報を併せた再出力ドキュメントを出力して処理を終了する。ここで出力される再出力ドキュメントは、先に図2を参照して説明した出力ドキュメントである。
上述した実施例では、出力ドキュメントの余白領域あるいは非余白領域に関する情報を出力ドキュメントに併せて記録して出力する構成としたが、例えば図11に示すように、余白領域451を持つ出力ドキュメント450にはドキュメント識別情報としてのID450のみを出力し、図11に示すような、IDとドキュメントの余白情報または非余白情報を対応付けた管理テーブルを、出力ドキュメントの生成を行なう画像処理装置、あるいは追記情報の解析を実行する画像処理装置、あるいは外部の管理サーバなどの管理装置461の記憶手段に格納し、追記情報の解析処理を実行する際に、ドキュメントからIDを取得して、IDに基づいて管理テーブルから余白情報または非余白情報を取得して、ドキュメントに対応する追記領域を特定する処理を実行する構成としてもよい。
出力ドキュメントにドキュメント識別情報としてのIDを出力して、管理テーブルにドキュメントIDとドキュメントの余白情報または非余白情報を登録する処理を実行する画像処理装置の構成例を図12に示す。
図12に示す構成は、先に、図3を参照して説明した画像処理装置A102の構成に対応しており、図3の装置構成に、領域情報生成手段471、ドキュメントID生成手段、登録手段473、データベース474が付加された構成である。
領域情報生成手段471は、図3における埋め込み領域情報生成手段324に対応し、原本ドキュメントの余白または非余白領域の位置情報を生成する。ただしドキュメントに出力することなくサーバ等のデータベース474に登録するので、コード情報への変換はかならずしも実行することは必要ではない。ドキュメントID生成手段472は、出力ドキュメントに対応する識別情報としてのドキュメントIDを生成する。登録手段473は、領域情報生成手段471の生成した領域情報とドキュメントID生成手段472の生成したドキュメントIDとを対応付けた管理テーブル(図11参照)をデータベース474に登録する。データベース474は画像処理装置のデータベースでも、ネットワーク接続されたサーバなどのデータベースでもよい。ただし追記情報の解析を実行する画像処理装置B105からのアクセス可能な構成であることが必要である。
追記情報の解析を実行する画像処理装置B105は、例えば図6示す埋め込み領域情報解析手段423に相当する領域情報解析手段において、解析対象となるドキュメントに記録されたドキュメント識別情報を取得し、ドキュメント識別情報に対応付けられたドキュメントの余白領域または非余白領域の位置情報を、データベースから取得する。追記情報解析手段は、取得した位置情報に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する。
以上、説明したように、本発明の構成では、オリジナルドキュメントを参照することなく、ドキュメントにおける追記情報を判別して取得、解析を行うことが可能となり、原本ドキュメントの保存、照合といったプロセスが不要となり、効率的な追記情報解析が可能となる。
最後に、図13を参照して、画像処理装置A102および画像処理装置B105のハードウェア構成例について説明する。図13に示す構成は、例えばPCなどによって構成される画像処理装置A102および画像処理装置B105と、スキャナ等のデータ読み取り部531と、プリンタなどのデータ出力部532を備えたハード構成例を示している。
CPU(Central Processing Unit)501は、上述の実施例において説明した各種のデータ処理、すなわちレイアウト解析、余白または非余領域選択処理、埋め込み領域情報生成処理、ドキュメント編集処理、レイアウト修正処理、埋め込み領域情報解析処理、追記情報解析処理等の各処理の実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。
ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。
ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。
キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、例えば解析された追記情報などを格納する。さらに、各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。リムーバブル記録媒体521も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部531は、ドキュメントの読み取り処理を実行し、データ出力部532は、ドキュメントデータの出力処理を実行する。
なお、図13に示す画像処理装置のハードウェア構成例は、1つの装置例を示すものであり、本発明の画像処理装置は、図13に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
以上、説明したように、本発明の構成によれば、ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域の位置情報を含む領域情報を生成し、生成した領域情報を出力ドキュメント中に埋め込んで出力する構成とし、ドキュメントの追記情報解析を行う装置において、ドキュメントに記録された領域情報に基づいて、ドキュメントの余白領域または非余白領域の位置情報を取得して、入力ドキュメントに設定された余白領域を特定し、余白領域に記録されたデータを追記情報として判別して解析する構成としたので、ドキュメントに対する追記の検証、抽出を原本イメージを適用することなく効率的に実行することが可能となる。
また、本発明の構成では、レイアウト変更を可能として変更したレイアウトにおける余白情報などを設定する構成としたので、任意のフォームの出力ドキュメントに対する追記情報の抽出が可能となる。
本発明の構成では、オリジナルドキュメントを参照することなく、ドキュメントにおける追記情報を判別して取得、解析を行うことが可能となり、原本ドキュメントの保存、照合といったプロセスが不要となり、効率的な追記情報解析が可能となる。
本発明の画像処理装置を適用した処理の概要について説明する図である。 本発明の画像処理装置によって出力されるドキュメントの構成例について説明する図である。 ドキュメント出力を実行する本発明の画像処理装置の構成について説明する図である。 ドキュメント出力を実行する本発明の画像処理装置の基本的な処理シーケンスについて説明するフローチャートを示す図である。 ドキュメント出力を実行する本発明の画像処理装置の拡張された構成について説明する図である。 ドキュメント出力を実行する本発明の画像処理装置の拡張処理シーケンスについて説明するフローチャートを示す図である。 ドキュメント解析を実行する本発明の画像処理装置の構成について説明する図である。 ドキュメント解析を実行する本発明の画像処理装置の基本的な処理シーケンスについて説明するフローチャートを示す図である。 ドキュメント解析を実行する本発明の画像処理装置の拡張された構成について説明する図である。 ドキュメント解析を実行する本発明の画像処理装置の拡張処理シーケンスについて説明するフローチャートを示す図である。 出力ドキュメントに識別子のみを記録し、余白情報などを管理装置において記憶して管理する構成について説明する図である。 ドキュメントIDを出力データとしたドキュメント出力を実行する本発明の画像処理装置の構成について説明する図である。 本発明の画像処理装置のハードウェア構成例について説明する図である。
符号の説明
10 原本ドキュメント
101 スキャナ
102 画像処理装置A
103 プリンタ
104 スキャナ
105 画像処理装置
106 サーバ
112 データベース
200 出力ドキュメント
201 余白領域
202 領域情報記録部
203 非余白領域
311 スキャナ
312 データベース
321 原本ドキュメント入力手段
322 レイアウト解析手段
323 余白または非余白領域選択手段
324 埋め込み領域情報生成手段
325 出力ドキュメント編集手段
326 出力ドキュメント出力手段
331 レイアウト修正手段
411 スキャナ
421 出力ドキュメント入力手段
422 レイアウト解析手段
423 埋め込み領域情報解析手段
424 追記情報解析手段
425 追記情報出力手段
431 レイアウト修正手段
432 余白または非余白領域選択手段
433 埋め込み領域情報生成手段
434 出力ドキュメント編集手段
435 出力ドキュメント出力手段
450 出力ドキュメント
451 余白領域
452 識別情報(ID)
461 管理装置
471 領域情報生成手段
472 ドキュメントID生成手段
473 登録手段
474 データベース
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
531 データ読み取り部
532 データ出力部

Claims (21)

  1. 画像処理装置であり、
    入力ドキュメントのレイアウトを解析するレイアウト解析手段と、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、
    前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、
    入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段と、
    を有することを特徴とする画像処理装置。
  2. 前記領域情報生成手段は、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域の位置を識別可能な座標データを生成する構成であることを特徴とする請求項1に記載の画像処理装置。
  3. 前記領域情報生成手段は、
    前記座標データをデータ変換したコードデータを生成し、
    前記ドキュメント編集手段は、
    前記コードデータを構成データとして含む出力ドキュメントの編集を実行する構成であることを特徴とする請求項2に記載の画像処理装置。
  4. 前記画像処理装置は、さらに、
    入力ドキュメントのレイアウトを修正するレイアウト修正手段を有し、
    前記領域選択手段は、前記レイアウト修正手段によって修正されたドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。
  5. 画像処理装置であり、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、
    前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、
    入力ドキュメント構成データおよびドキュメント識別子を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段と、
    前記ドキュメント識別子と、前記領域情報を対応付けた管理テーブルをデータベースに記録する登録手段と、
    を有することを特徴とする画像処理装置。
  6. 画像処理装置であり、
    入力ドキュメントのレイアウトを解析するレイアウト解析手段と、
    入力ドキュメントに記録された領域情報に基づいて、該入力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析手段と、
    前記領域情報解析結果に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析手段と、
    を有することを特徴とする画像処理装置。
  7. 前記領域情報解析手段は、
    入力ドキュメントに記録された領域情報に基づいて、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域に対応する座標データを取得する構成であることを特徴とする請求項6に記載の画像処理装置。
  8. 前記画像処理装置は、さらに、
    入力ドキュメントのレイアウトを修正するレイアウト修正手段と、
    前記レイアウト修正手段によって修正された修正ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、
    前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、
    前記修正ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段と、
    を有することを特徴とする請求項6に記載の画像処理装置。
  9. 画像処理装置であり、
    入力ドキュメントのレイアウトを解析するレイアウト解析手段と、
    入力ドキュメントに記録されたドキュメント識別情報を取得し、該ドキュメント識別情報に対応付けられたドキュメントの余白領域または非余白領域の位置情報を、データベースから取得する領域情報解析手段と、
    前記データベースから取得した位置情報に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析手段と、
    を有することを特徴とする画像処理装置。
  10. ドキュメント解析システムであり、
    出力ドキュメントを生成するドキュメント出力装置と、
    前記出力ドキュメントの解析を実行するドキュメント解析装置とを有し、
    前記ドキュメント出力装置は、
    入力ドキュメントのレイアウトを解析するレイアウト解析手段と、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択手段と、
    前記領域選択手段において選択された領域の位置情報を含む領域情報を生成する領域情報生成手段と、
    入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集手段とを有し、
    前記ドキュメント解析装置は、
    前記出力ドキュメントのレイアウトを解析するレイアウト解析手段と、
    出力ドキュメントに記録された領域情報に基づいて、該出力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析手段と、
    前記領域情報解析結果に基づいて、出力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析手段と、
    を有することを特徴とするドキュメント解析システム。
  11. 画像処理方法であり、
    入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、
    前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、
    入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、
    を有することを特徴とする画像処理方法。
  12. 前記領域情報生成ステップは、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域の位置を識別可能な座標データを生成することを特徴とする請求項11に記載の画像処理方法。
  13. 前記領域情報生成ステップは、
    前記座標データをデータ変換したコードデータを生成し、
    前記ドキュメント編集ステップは、
    前記コードデータを構成データとして含む出力ドキュメントの編集を実行することを特徴とする請求項12に記載の画像処理方法。
  14. 前記画像処理方法は、さらに、
    入力ドキュメントのレイアウトを修正するレイアウト修正ステップを有し、
    前記領域選択ステップは、前記レイアウト修正ステップによって修正されたドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する処理を実行することを特徴とする請求項11に記載の画像処理方法。
  15. 画像処理方法であり、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、
    前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、
    入力ドキュメント構成データおよびドキュメント識別子を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、
    前記ドキュメント識別子と、前記領域情報を対応付けた管理テーブルをデータベースに記録する登録ステップと、
    を有することを特徴とする画像処理方法。
  16. 画像処理方法であり、
    入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、
    入力ドキュメントに記録された領域情報に基づいて、該入力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析ステップと、
    前記領域情報解析結果に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析ステップと、
    を有することを特徴とする画像処理方法。
  17. 前記領域情報解析ステップは、
    入力ドキュメントに記録された領域情報に基づいて、入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域に対応する座標データを取得することを特徴とする請求項16に記載の画像処理方法。
  18. 前記画像処理方法は、さらに、
    入力ドキュメントのレイアウトを修正するレイアウト修正ステップと、
    前記レイアウト修正ステップによって修正された修正ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、
    前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、
    前記修正ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、
    を有することを特徴とする請求項16に記載の画像処理方法。
  19. 画像処理方法であり、
    入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、
    入力ドキュメントに記録されたドキュメント識別情報を取得し、該ドキュメント識別情報に対応付けられたドキュメントの余白領域または非余白領域の位置情報を、データベースから取得する領域情報解析ステップと、
    前記データベースから取得した位置情報に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析ステップと、
    を有することを特徴とする画像処理方法。
  20. 画像処理をコンピュータ上において実行させるコンピュータ・プログラムであり、
    入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、
    入力ドキュメントに対応する余白領域または非余白領域の少なくともいずれかの領域を選択する領域選択ステップと、
    前記領域選択ステップにおいて選択された領域の位置情報を含む領域情報を生成する領域情報生成ステップと、
    入力ドキュメント構成データおよび前記領域情報を構成データとして含むドキュメントを出力ドキュメントとして生成するドキュメント編集ステップと、
    を有することを特徴とするコンピュータ・プログラム。
  21. 画像処理をコンピュータ上において実行させるコンピュータ・プログラムであり、
    入力ドキュメントのレイアウトを解析するレイアウト解析ステップと、
    入力ドキュメントに記録された領域情報に基づいて、該入力ドキュメントの余白領域または非余白領域の位置情報を取得する領域情報解析ステップと、
    前記領域情報解析結果に基づいて、入力ドキュメントに設定された余白領域を特定し、該余白領域に記録されたデータを追記情報として判別して解析する追記情報解析ステップと、
    を有することを特徴とするコンピュータ・プログラム。
JP2005046554A 2005-02-23 2005-02-23 画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラム Pending JP2006235784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005046554A JP2006235784A (ja) 2005-02-23 2005-02-23 画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005046554A JP2006235784A (ja) 2005-02-23 2005-02-23 画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラム

Publications (1)

Publication Number Publication Date
JP2006235784A true JP2006235784A (ja) 2006-09-07

Family

ID=37043389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005046554A Pending JP2006235784A (ja) 2005-02-23 2005-02-23 画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP2006235784A (ja)

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
JP4591229B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2010055354A (ja) 画像処理装置及び画像処理プログラム
JP2007141159A (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2009031937A (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2008282094A (ja) 文字認識処理装置
JP5720182B2 (ja) 画像処理装置及び画像処理プログラム
JP2018195899A (ja) 情報処理装置及び情報処理プログラム
JP2007219682A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP7328797B2 (ja) 端末装置、文字認識システム及び文字認識方法
JP2006235784A (ja) 画像処理装置、ドキュメント解析システム、および画像処理方法、並びにコンピュータ・プログラム
JP2006085234A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP4535176B2 (ja) 作業制御プログラム及び作業制御システム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP4692315B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム
JP5343584B2 (ja) 情報処理装置及びプログラム
JP2007081472A (ja) 画像処理装置、画像形成装置、及び画像形成システム
JP5521530B2 (ja) 情報処理装置、情報処理システム、情報処理方法、プログラム、及び記憶媒体
JP2007011472A (ja) 情報処理方法及びその装置、プログラム、コンピュータ可読メモリ
JP2007034923A (ja) 画像処理システム
JP5720166B2 (ja) 画像処理装置及び画像処理プログラム
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム