JP2005149097A - 画像処理システム及び画像処理方法 - Google Patents

画像処理システム及び画像処理方法 Download PDF

Info

Publication number
JP2005149097A
JP2005149097A JP2003385186A JP2003385186A JP2005149097A JP 2005149097 A JP2005149097 A JP 2005149097A JP 2003385186 A JP2003385186 A JP 2003385186A JP 2003385186 A JP2003385186 A JP 2003385186A JP 2005149097 A JP2005149097 A JP 2005149097A
Authority
JP
Japan
Prior art keywords
electronic file
information
image data
image
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003385186A
Other languages
English (en)
Inventor
Shinichi Kato
進一 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003385186A priority Critical patent/JP2005149097A/ja
Publication of JP2005149097A publication Critical patent/JP2005149097A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 ユーザが加筆した手書き文字等を含めた紙文書上の情報を消失することなく再利用・再編集可能な電子ファイルとして保存することができるとともに、それらを効率良く検索することができる画像処理システム及び画像処理方法を提供する。
【解決手段】 サーバが保持する電子ファイルの中から指定された原稿に対応する電子ファイルを取得して出力する。まず、原稿を表す画像データを入力し、入力された画像データに対応する電子ファイルをサーバが保持する電子ファイルの中から検索する。そして、検索された電子ファイルと入力された画像データとの差分情報を抽出し、電子ファイルと差分情報とを対応付けて所定の格納場所に格納する。
【選択図】 図3

Description

本発明は、複写機等の画像処理装置で読み取った画像に基づいてデータベースに保存されている電子ファイルを検索する画像処理システム及び画像処理方法に関する。
近年、環境問題がクローズアップされている中で、オフィス等でのペーパーレス化が急速に進んでいる。そこで、従来からバインダー等で蓄積・保存された紙文書をスキャナで読み取って、ポータブルドキュメントフォーマット(以下、「PDF」と略す。)に変換し、画像記憶装置(データベース)に蓄積・保存する文書管理システムが構築されている。
一方、機能が拡張されたデジタル複合機(以下、「MFP」と略す。)には、画像(イメージデータ)を紙文書として印刷・出力する際に、当該画像が記憶されている画像記憶装置内のポインタ情報を紙文書の表紙或いは記載情報中に付加情報として記録しておくものがある。そして、当該画像が記録された紙文書を複写する場合には、表紙等に付加されているポインタ情報からオリジナルの画像が格納されている画像記憶装置内の格納場所を検出し、紙文書から読み取られた画像を再印刷等に用いるのではなく、画像記憶装置内に記憶されているオリジナルの画像を編集や再印刷に直接用いることができる。これにより、紙文書から読み取られた画像を何度も再利用することによって生じる画質の劣化等の問題を防ぐことができる(例えば、特許文献1参照。)。
特開平10−143414号公報
しかしながら、前者は紙文書をコンパクトな情報量のPDFファイルとして保存することが可能であるが、ファイル全体が1つのイメージデータとして保存されるので、当該文書の一部のオブジェクトだけを部分的に検索して再利用・再編集することはできない。従って、当該データを再利用等する場合は、図や表等については、新たにアプリケーションソフトを用いて作成し直さなければならない。
また、後者は出力された紙文書に対応するオリジナルの電子ファイルに直接アクセスできるため容易に再利用・再編集することができる。しかし、紙文書上に後から手書き等によってユーザ等が追記した情報がオリジナルの電子ファイル中には存在しないため、紙文書から読み取ったイメージデータを対応するオリジナルの電子ファイルに置き換えてしまうことにより、追記された情報が消失してしまうという不具合が発生する。
本発明は、このような事情を考慮してなされたものであり、例えば、ユーザが加筆した手書き文字等を含めた紙文書上の情報を消失することなく再利用・再編集可能な電子ファイルとして保存することができるとともに、それらを効率良く検索することができる画像処理システム及び画像処理方法を提供することを目的とする。
上記課題を解決するために、本発明は、サーバが保持する電子ファイルの中から指定された原稿に対応する電子ファイルを取得して出力する画像処理システムであって、
原稿を表す画像データを入力する入力手段と、
前記入力手段で入力された画像データに対応する電子ファイルを前記サーバが保持する電子ファイルの中から検索する検索手段と、
前記検索手段で検索された電子ファイルと前記入力手段で入力された画像データとの差分情報を抽出する抽出手段と、
前記電子ファイルと前記差分情報とを対応付けて保持する保持手段と
を備えることを特徴とする。
また、本発明は、サーバが保持する電子ファイルの中から指定された原稿に対応する電子ファイルを取得して出力する画像処理方法であって、
原稿を表す画像データを入力する入力工程と、
前記入力工程で入力された画像データに対応する電子ファイルを前記サーバが保持する電子ファイルの中から検索する検索工程と、
前記検索工程で検索された電子ファイルと前記入力工程で入力された画像データとの差分情報を抽出する抽出工程と、
前記電子ファイルと前記差分情報とを対応付けて所定の格納場所に格納する格納工程と
を有することを特徴とする。
本発明によれば、ユーザが加筆した手書き文字等を含めた紙文書上の情報を消失することなく再利用・再編集可能な電子ファイルとして保存することができるとともに、それらを効率良く検索することができる。
以下、図面を参照して、本発明の実施形態について説明する。
図1は、本発明の第1の実施例に係る画像処理システムの構成を示すブロック図である。図1に示す画像処理システムは、オフィス10とオフィス20とをインターネット等のネットワーク104で接続された環境で実現される。
オフィス10内に構築されたLAN107には、MFP100と、MFP100を制御するマネージメントPC101と、クライアントPC102と、文書管理サーバ106aと、そのデータベース105a及びプロキシサーバ103aが接続されている。また、オフィス20内に構築されたLAN108には、文書管理サーバ106bと、そのデータベース105b及びプロキシサーバ103bが接続されている。尚、クライアントPC102は、外部記憶部、検索イメージ入力部及び検索結果出力部を備えている。また、LAN107及びオフィス20内のLAN108は、プロキシサーバ103a、103bを介してインターネット等のネットワーク104に接続されている。
MFP100は、本実施形態において紙文書を光学的に読み取って画像信号に変換する画像読み取り処理と、読み取った画像信号に対する画像処理の一部を担当し、画像信号はLAN109を用いてマネージメントPC101に入力する。尚、マネージメントPC101は、通常のPCでも実現可能であり、内部に画像記憶部、画像処理部、表示部及び入力部を備える。尚、マネージメントPC101は、その一部又は全部をMFP100と一体化して構成してもよい。
図2は、本発明の第1の実施例に係るMFP100の構成を示すブロック図である。図2において、オートドキュメントフィーダ(以下、「ADF」と略す。)を含む画像読み取り部110は、束状或いは1枚の原稿画像を内部に備える光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読み取り信号を例えば600dpiの密度のイメージ情報として得る。そして通常の複写機能を用いる場合は、この画像信号をデータ処理部115で記録信号へ画像処理し、複数毎複写の場合は記憶装置111に一旦1ページ分の記録データを保持した後、形成装置112に順次出力して紙上に画像を形成する。
一方、クライアントPC102から出力されるプリントデータは、LAN107からMFP100に入力され、ネットワークIF114を経てデータ処理装置115で記録可能なラスタデータに変換された後、形成装置112に出力して紙上に記録画像として形成される。
MFP100への操作者の指示は、MFP100に装備されているキー等の入力装置113、或いはマネージメントPC101のキーボードやマウス等からなる入力装置から行われ、これら一連の動作はデータ処理装置115内の制御部で制御される。
一方、操作入力の状態表示及び処理中の画像データの表示は、MFP100の表示装置116又は、マネージメントPC101、クライアントPC102のモニタ等で行われる。尚、記憶装置111は、マネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの授受及び制御は、ネットワークIF117及び直結したLAN109を用いて行われる。
[処理概要]
次に、本発明の一実施形態に係る画像処理システムによる画像処理全体の概要について説明する。図3は、本発明の第1の実施例に係る画像処理システムによる画像処理の手順について説明するためのフローチャートである。
まず、MFP100の画像読み取り部110によって原稿画像の入力を行うために、当該画像読み取り部110を動作させて1枚の原稿をラスタ状に走査し、例えば600dpi、8ビットの画像信号を取得する(イメージ情報入力処理:ステップS120)。
入力された画像信号に対してデータ処理部115で前処理を施し、記憶装置111に1ページ分のイメージデータ(画像データ)として保存する。そして、マネージメントPC101のCPUは、記憶装置111に格納されたイメージデータから、文字/線画部分とハーフトーンの画像部分とに領域を分離し、文字部分はさらに段落で塊としてまとまっているブロック毎に、或いは、線で構成された表、図形に分離して各々セグメント化する。一方、ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分や背景部等のいわゆるブロック毎に独立したオブジェクトに分割する(ブロックセレクション処理:ステップS121)。
このとき、原稿画像中に付加情報として記録されている2次元バーコード、或いはURLに該当するオブジェクトを検出し、2次元バーコードの場合であれば当該マークを解読し、URLの場合であればOCR(Optical Character Reader)等で文字認識する(ステップS122)。これによって、当該原稿画像のオリジナルの電子ファイルが格納されている記憶先のサーバ等のアドレスに関するポインタ情報を検出する(ステップS123)。尚、ポインタ情報を付加する手段は、上記の他に1次元バーコードや、文字と文字の間隔に情報を埋め込む方法及びハーフトーンの画像に埋め込む方法等の直接可視化されない電子透かしによる方法を用いてもよい。
次いで、ポインタ情報が検出できたかどうかを判定し(ステップS124)、ポインタ情報が検出された場合(Yes)は、検出されたポインタで示されたオリジナルの電子ファイルが格納されているサーバ等のアドレスに従って、図1で示されるネットワーク104又はLAN107等に接続されたサーバ等が保持する電子ファイルを検索する(ステップS125)。尚、本実施例では、電子ファイルは、図1で示したクライアントPC102内のハードディスク内、或いはオフィス10、20のLAN107、108に接続された文書管理サーバ106a、b内のデータベース105a、b内、或いはMFP100自体が有する記憶装置111のいずれかに格納されており、ステップS123で得られたサーバアドレス情報(ポインタ情報)に従ってこれらの記憶装置内を検索する。
ステップS125で特定の電子ファイルが見つからなかった場合や見つかったがPDF、tiff等のいわゆるイメージファイルであった場合(No)、或いはステップS124でポインタ情報が検出できなかった場合(すなわち、ポインタ情報が示すサーバアドレス自体が存在しなかった場合)は、全サーバで管理されているデータ(すなわち、本実施例では、データベース105a、b、記憶装置111に記憶されている全データ)を対象に入力されたイメージデータに基づいてステップS126以下のファイル検索処理を行う。一方、ステップS125でポインタ情報に基づくサーバアドレスからサーバが見つかった場合(Yes)は、ポインタが示すサーバを検索対象としてステップS129以下の処理を行う。
ステップS126は、いわゆる文書検索処理ルーチンである。まず、ステップS122で各文字ブロックに対して行ったOCRの結果から単語を抽出して、全文検索、或いは各オブジェクトの配列と各オブジェクトの属性からいわゆるレイアウト検索を行う。そして、検索の結果、類似度の高い電子ファイルが検索対象のサーバから見つかった場合は、その電子ファイルを候補としてそのサムネール等を表示し、複数の中から操作者の選択が必要なら操作者の入力操作によってファイルの特定を行う(ステップS127)。尚、候補が1ファイルの場合、ステップS127をバイパスして自動的にステップS128に分岐し、候補ファイルの格納アドレスをユーザに通知するようにしてもよい。一方、ステップS126の検索処理で電子ファイルが見つからなかった場合や見つかったがPDFやtiff等のイメージファイルの場合(ステップS128でNoの場合)は、ステップS132に分岐する。
ここで、ステップS120で入力されたイメージ情報は、上記処理で検索、特定された電子ファイルをそのままプリント出力したものである場合だけでなく、プリント出力が資料として配付され、それを入手したユーザがその資料上にペン等で手書きによる書き込みをした場合や、元の特定された電子ファイルには存在しない新規の情報を付加した場合等も想定する。
そこで、ステップS125、S128で電子ファイルが特定された場合、入力されたイメージ情報と特定された電子ファイルとの差分情報を抽出して、オリジナルの原稿に対して後から追記された新規情報を抽出するようにする。すなわち、特定された電子ファイルの格納場所等のアドレスをクライアントに通知し(ステップS129)により、実際に電子ファイルを入手し(ステップS130)、入力イメージ情報と入手したオリジナルの電子ファイルとの差分情報を抽出する(ステップS130。
抽出された差分情報は、ベクトル化処理(ステップS132)によりイメージデータからベクトルデータに変換される。例えば、差分情報が、手書きで追記された文字情報等である場合は、OCRによるコード化又は輪郭追跡によってアウトライン化することによりベクトル情報に変換される。また、入力されたイメージデータが図形等の場合にも、ベクトルデータとしてベクトル情報に変換する。
ステップS132でベクトル化された差分情報は、ユーザからの指示に従って、新たな電子ファイルとして生成され保存される。以下に生成の例を記載する。
(例1)ベクトル化された差分情報とオリジナルの電子ファイルとを合成し、オリジナルの電子ファイルに上書き保存する。
(例2)ベクトル化された差分情報とオリジナルの電子ファイルとを合成し、新たな電子ファイルとして生成する。この場合、オリジナルの電子ファイルは別に保存されている。
(例3)ベクトル化された差分情報をオリジナルの電子ファイル内の別レイヤーとして保存する。
(例4)ベクトル化された差分情報をオリジナルの電子ファイルとは別の差分情報ファイルとして保存する。この場合、後述するステップS134と同様な処理、すなわち、オリジナルの電子ファイルに差分情報ファイルの位置を示すポインタ情報を埋め込むことで、オリジナルの電子ファイルと差分情報ファイルのリンクを行う。また、差分情報ファイルにオリジナルの電子ファイルの位置を示すポインタ情報を埋め込んでも良い。
上記(例1)によれば、オリジナルの電子ファイルに対して差分情報を付加した形で上書きするので、記憶されるデータの容量を削減し、また、新たな電子ファイルの増殖を防ぐことができる。しかしながら、電子ファイルのオリジナル性の確保ができなくなる。
上記(例2)は、オリジナルの電子ファイルのオリジナル性の確保をすることができる。しかしながら、差分情報のみ異なる同じような内容の電子ファイルが複数記憶されていくことになる。
上記(例3)は、オリジナルの電子ファイルのオリジナル性を確保しつつ、新たな電子ファイルの増殖を防ぐことができる。しかしながら、差分情報をレイヤー構造で保存するため、電子ファイルの構造が複雑になってしまう。
上記(例4)は、オリジナルの電子ファイルのオリジナル性を確保しつつ、差分情報ファイルを別に保存するので、差分情報ファイル専用の記憶手段等を設けておくことで、以後の検索の高速化を図ることができる。しかしながら、異なる差分情報が多い場合、差分情報ファイルが多く生成されてしまう。
上述したような差分情報とオリジナルの電子ファイルとの関係から、ユーザの使用に最適な形で差分情報と電子ファイルを生成し保存することで、ファイル容量を削減したり、検索を高速化したり、オリジナル性の確保を行うことができる。そこで、システムで予め差分情報の取り扱いについて固定しておく場合だけでなく、ユーザ側からどのような形で差分情報を取り扱うか、例えば、上記(例1)から(例4)のどの形で差分情報を格納するかを選択するようにしてもよい。
但し、ステップS128で電子ファイルの特定ができなかった場合(No)は、入力されたイメージデータ全体に対してベクトル化処理を行い、イメージデータをオリジナルの電子ファイルに近い電子ファイルに変換する。例えば、ステップS122でOCR処理された文字ブロックに対しては、さらに文字のサイズ、スタイル及び字体等を認識し、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。また、線で構成される表や図形ブロックに対しては、アウトライン化する。さらに、画像ブロックに対しては、そのままイメージデータとして個別のJPEGファイル等として処理する。
これらのベクトル化処理(ステップS132)は各オブジェクト毎に行い、更に各オブジェクトのレイアウト情報を保存して、一般のアプリケーションで編集可能なアプリデータに変換し(ステップS133)、新たな電子ファイルとして記憶装置111等に格納する(ステップS135)。また、JPEGファイルではなく、汎用のファイル形式として、例えばRTF(Rich Text Format)形式に変換するようにしてもよい。
尚、本実施例では、ステップS133でのアプリデータへの変換処理後に、電子ファイルの格納場所のサーバ等のアドレスを「ポインタ情報(アドレス情報)」として、保存対象の電子ファイルに付加するようにする(ステップS134)。このようにすることにより、保存された電子ファイルが格納されたサーバ等(例えば、記憶装置111等)が次回以降の検索対象となる。また、電子ファイルの印刷時にポインタ情報を2次元バーコード等を用いて付加して印字するようにすれば、次回以降にポインタ情報が付加された原稿を読み取って、当該ポインタ情報を解析することにより、オリジナルの電子ファイルを保存するサーバ等に容易にアクセスすることができるようになる。
以上の手順によってオリジナルの電子ファイル、又はそれに非常に近いベクトル情報を有する電子ファイルを容易に検索して取得することができる。すなわち、本実施形態では、電子ファイルのデータはベクトル化されたデータであって、編集可能な形式で全て保存されており、従来のように1枚のイメージデータとして取得するだけではなく、取得後にそのデータを直接加工、再利用したり、あるいは蓄積、伝送、再印刷を行うことが可能になる。
これらの処理は、単純にイメージデータを直接扱う場合に比べて単に再利用・再編集が可能となるだけではなく、情報量を削減することができ、蓄積効率が高まり、伝送時間が短縮され、記録表示する際には高品位なデータとして非常に優位となる。
以下、各処理ブロックに対して詳細に説明する。
[ブロックセレクション(BS)処理(ステップS121)]
図4は、ブロックセレクション処理によって読み取った1枚のイメージデータを属性を判定し複数のブロックに分割する様子を示す図である。すなわち、ブロックセレクション処理とは、符号41に示すステップS120で読み取った一頁のイメージデータを、符号42に示すようにオブジェクト毎の塊として認識し、それぞれのブロックを文字(Text)、写真(Photo)、線(Line)、表(Table)等の属性に判定し、異なる属性を持つ領域(ブロック)に分割する処理である。
ブロックセレクション処理の一実施例を以下に説明する。
まず、入力画像を白黒に2値化して、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。そして、面積の大きい黒画素の塊については、内部にある白画素に対して同様に輪郭線追跡を行って白画素の塊を抽出する。さらに、一定面積以上の白画素の塊の内部からも再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素(白画素)の塊を、大きさ及び形状等で分類し、異なる属性を持つ領域へ分類する。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字領域とする。また、扁平な画素塊を線領域、一定の大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域等とする。
図5は、ブロックセレクション処理で得られた各ブロックに対するブロック情報の一例について示す図である。図5に示されるブロック毎の情報は、後述するベクトル化、検索処理のための情報として用いられる。
[イメージデータからポインタ情報の検出]
まず、ステップS122で示す電子ファイルの格納位置を、読み取られたイメージデータから抽出するためのOCR/OMR処理について説明する。図6は、原稿画像中に付加された2次元バーコード(QRコードシンボル)を復号してデータ文字列を出力する手順を説明するためのフローチャートである。図7は、2次元バーコードが付加された原稿310の一例を示す図である。
まず、データ処理装置115内のページメモリに格納された原稿310を読み取って得られたイメージデータを内部のCPUで走査して、前述したブロックセレクション処理の結果から所定の2次元バーコードシンボル311の位置を検出する。QRコードの位置検出パターンは、シンボルの4隅のうちの3隅に配置される同一の位置検出要素パターン311a〜311cから構成される (ステップS300)。
次に、位置検出パターンに隣接する形式情報を復元し、シンボルに適用されている誤り訂正レベル及びマスクパターンを得る(ステップS301)。さらに、シンボルの型番を決定した後(ステップS302)、形式情報で得られたマスクパターンを使って符号化領域ビットパターンをXOR演算することによってマスク処理を解除する(ステップS303)。
そして、モデルに対応する配置規則に従い、シンボルキャラクタを読み取り、メッセージのデータ及び誤り訂正コード語を復元する(ステップS304)。次いで、復元されたコード上に誤りがあるかどうかの検出を行う(ステップS305)。その結果、誤りが検出された場合(Yes)は当該誤りを訂正する(ステップS306)。そして、誤り訂正されたデータより、モード指示子及び文字数指示子に基づいて、データコード語をセグメントに分割する(ステップS307)。最後に、仕様モードに基づいてデータ文字を復号し、結果を出力する(ステップS308)。尚、ステップS305で誤りが検出されなかった場合(No)は、上記ステップS307に進む。
ここで、2次元バーコード内に組み込まれたデータは、対応する電子ファイルが格納されているサーバアドレス情報(ポインタ情報)を表しており、例えばファイルサーバ名及びサーバアドレスを示すIPアドレス、対応するURL等からなるパス情報で構成される。
本実施例では上述したように、ポインタ情報が2次元バーコードを用いて付与された原稿310を例に挙げて説明したが、直接文字列でポインタ情報が記録される場合には、所定のルールに従った文字列のブロックを前述したブロックセレクション処理で検出し、当該ポインタ情報を示す文字列の各文字を文字認識することで、直接、オリジナルの電子ファイルが保存されているサーバのサーバアドレス情報を得ることが可能である。
また、図7の文書310の文字ブロック312や文字ブロック313の文字列に対して、隣接する文字と文字の間隔等に視認し難い程度の変調を加え、当該文字間隔を用いた透かし情報を埋め込むことでもポインタ情報を付与することができる。このような透かし情報は、後述する文字認識処理を行う際に各文字の間隔を検出することによって、ポインタ情報を得ることができる。また、自然画ブロック314の中に電子透かしとしてポインタ情報を付加することも可能である。
[ポインタ情報による電子ファイル検索処理]
次に、図3を用いて説明したステップS125、S128の処理で行われるポインタ情報からの電子ファイル検索処理について詳細に説明する。図8は、検出されたポインタ情報から電子ファイルを検索する処理手順について説明するためのフローチャートである。
まず、ポインタ情報に含まれるサーバアドレスに基づいて、当該電子ファイルが格納されているファイルサーバを特定する(ステップS400)。ここでファイルサーバとは、クライアントPC102や、データベース105a、bを内蔵する文書管理サーバ106a、bや、記憶装置111を内蔵するMFP100自身を指す。また、アドレスとは、URLやサーバ名からなるパス情報である。
そして、ファイルサーバを特定した後、図3を用いて説明したステップS127におけるポインタ情報が示すサーバ(ファイルサーバ)に対してアドレスを転送する(ステップS401)。ファイルサーバは、ステップS126のファイル検索処理に従って、該当する電子ファイルを検索する(ステップS402)。そして、電子ファイルが存在するか否かを判定する(ステップS403)。
この結果、電子ファイルが存在しない場合(No)は、MFP100に対してその旨を通知して終了する。一方、電子ファイルが存在する場合(Yes)は、図3を用いて前述したように、差分抽出処理を行うために候補表示を行い、その後、該当する電子ファイルのアドレスを通知すると共に、当該電子ファイルをユーザ(すなわち、MFP100)に対して転送する(ステップS408)。
[ファイルアクセス権を含むポインタ情報によるサーバ検索処理]
次に、ファイルアクセス権について考慮した実施例について説明する。通常扱われる文書ファイルの中には、第三者による再利用を制限することが望ましい文書がある。前述した図8を用いた検索処理では、ファイルサーバに蓄積された電子ファイルは全て自由にアクセスすることが可能であり、ファイル全体、或いはその一部のオブジェクトは全て再利用が可能なことを前提に説明した。以下では、ポインタ情報から電子ファイルを検索した際に、検索の結果から特定された電子ファイルにアクセス権の制限が有る場合について説明する。
図9は、ファイルアクセス権を含むポインタ情報から電子ファイルが格納されているサーバを検索する処理手順について説明するためのフローチャートである。図9において、ステップS400〜S403までは、図8におけるステップと同様であるため、説明は省略する。ステップS403で電子ファイルが特定された場合(Yes)、ファイルサーバはそのファイルのアクセス権情報を調べる(ステップS404)。その結果、アクセス制限がある場合(Yes)は、MFP100に対してパスワードの送信を要求する(ステップS405)。
そして、MFP100は、操作者に対してパスワード等の認証情報の入力を促し、入力されたパスワード等をファイルサーバに送信する(ステップS406)。ファイルサーバは送信されたパスワード等を照合し(ステップS407)、一致した場合(Yes)は、図3を用いて説明したように、電子ファイルのアドレスを通知すると共に、ユーザの希望する処理がイメージデータの取得であれば、MFP100に対して電子ファイルを転送する(ステップS408)。
尚、アクセス権の制御を行うための認証の方法は、ステップS405、S406に示したパスワードによる方法に限定されず、例えば、指紋認証等の一般に広く用いられている生体認証、カードによる認証等のあらゆる認証手段を用いることができる。
一方、ステップS403でファイルサーバ内からファイルを特定することができなかった場合は、図3のステップS133で説明したベクトル化処理に対しても、制限を加えることができる。すなわち、紙文書を走査して得られたイメージデータからオリジナルの電子ファイルに対してのアクセス権の制限の存在を検出した場合には、認証確認が取れた場合のみベクトル化処理を行うことで、機密性の高い文書の使用に制限をかけることができる。
[ファイル検索処理]
次に、図3のステップS126で示すファイル検索処理の詳細について図5及び図10を使用して説明する。ここでは、ステップS122のOCR/OMR処理の結果、抽出された各ブロック及び入力ファイルが、図5に示す情報(ブロック情報、入力ファイル情報)を備えるものとする。本実施形態では、情報内容として、図5に示すように属性、座標位置、幅及び高さのサイズ、OCR情報の有無を用いる。
属性は、さらに、文字、線、写真、絵、表等に分類される。尚、図5では説明を簡単にするため、ブロックは座標Xの小さい順(例えば、X1<X2<X3<X4<X5<X6)に、ブロック1、ブロック2、ブロック3、ブロック4、ブロック5、ブロック6としている。また、ブロック総数は、入力ファイル中の全ブロック数であり、図5に示す例におけるブロック総数は6である。以下、これらの情報を使用して、データベース内から入力イメージファイルに類似した電子ファイルのレイアウト検索を行う手順について説明する。図10は、データベース内から入力イメージファイルに類似した電子ファイルのレイアウト検索を行う手順について説明するためのフローチャートである。尚、データベースファイルも、図5に示す情報と同様の情報を備えることを前提とする。図10のフローチャートの流れは、入力された原稿から読み取られた電子ファイルとデータベース中の電子ファイルを順次比較するものである。
まず、後述する類似率等の初期化を行って初期値を設定する(ステップS510)。次に、ブロック総数の比較を行い(ステップS511)、真の場合(Yes)は、さらにファイル内のブロックの情報を順次比較する(ステップS512)。すなわち、データベースのファイルのブロック数nが入力ファイルのブロック数Nの誤差ΔN範囲内かどうかを調べ、誤差範囲内であれば真(Yes)、範囲外であれば偽(No)とする。また、ステップS512では、入力ファイルとデータベースファイルのブロック属性を比較して一致すればステップS513以降の比較処理へ進み、不一致であればステップS521に進む。
ブロックの情報比較では、ステップS513、S515、S518において、それぞれ属性類似率、サイズ類似率、OCR類似率をそれぞれ算出し、ステップS522においてそれらに基づいて総合類似率を算出する。各類似率の算出方法については、公知の技術を用いることができるので説明を省略する。
ステップS523においては、総合類似率が予め設定された閾値Thより高いかどうかを判定し、高い場合(Yes)は、その電子ファイルを類似候補として挙げて保存する(ステップS524)。尚、図中のN、W、Hは、入力ファイルのブロック総数、各ブロック幅、各ブロック高さ、ΔN、ΔW、ΔHは、入力ファイルのブロック情報を基準として誤差を考慮したものである。また、n、w、hは、データベースファイルのブロック総数、各ブロック幅、各ブロック高さとする。尚、ステップS514におけるサイズ比較時に、位置情報(X,Y)の比較等を行ってもよい。
以上、検索の結果、総合類似率が閾値Thより高いもので候補として保存されたデータベースファイルをサムネール等で表示する(ステップS129)。これにより、複数の中から操作者の選択が必要な場合は、操作者の入力操作よってファイルの特定を行う。
[差分抽出処理]
次に、図3のステップS131で示す差分情報抽出処理の詳細について説明する。図20は、図3に示すフローチャートにおける差分抽出処理(ステップS131)の手順を説明するための概略を示すフローチャートである。
図20に示すフローチャートにおいて、「入力画像」とは図3のステップ120でイメージ情報として入力された原稿から読み取り走査されたイメージデータを示し、「電子ファイル」とは図3のステップS125、S128で得られたオリジナルの電子ファイルを示す。ここで入力画像は、図3のステップS121、S122、S123においてブロックセレクション処理、OCR/OMR処理、ポインタ情報の検出が終わっているので、図4で示したブロックセレクション後のブロックレイアウト情報、また、図5で示したブロック情報、図7で示したポインタ情報がすでに得られている。この様子を図21に示す。
図21は、図20に示す差分抽出処理内容を説明するための電子ファイルに関する入力画像のイメージデータ例及びブロックセレクション例を示す図である。図21において、2110はオリジナルの電子ファイルを示し、2111は電子ファイル2110に対してブロックセレクション処理を行った後のブロックレイアウト情報例を示す。尚、ブロックレイアウト情報としては、図5で示したブロック情報を別途含まれる。また、2114は図7で示したポインタ情報を示す2次元バーコードであり、2115はブロックセレクション処理後の2次元バーコードのブロックである。
また、図21において、2112は入力画像の内容を示し、2113は入力画像2112に対してブロックセレクション処理を行った後のブロックレイアウト情報である。尚、ブロックレイアウト情報としては、図5で示したブロック情報を別途含まれる。また、2116は図7で示したポインタ情報を示す2次元バーコードであり、2117はブロックセレクション処理後の2次元バーコードのブロックである。ここで、電子ファイル2110とは異なり、入力画像2112には、手書き文字2118が記入されており、それをブロックセレクション処理することで、手書き文字ブロック2119がブロックレイアウト情報2113として生成されている。
以下、図20及び図21を用いて、差分抽出処理について具体的に説明する。本実施例では、図3のステップS134で説明したように、ポインタ情報は印刷時にイメージデータとして電子ファイルに付加されるため、ステップS125で検索処理によって電子ファイルを入手した段階では、まだ電子ファイルにポインタ情報は付加されていない。そこで、まず、電子ファイル2110に対してポインタ情報である2次元バーコード2114を付加する(ステップS2001)。
次に、イメージデータとして付加されたポインタ情報である2次元バーコード2114を含む電子ファイル2110に対して、ブロックセレクション処理を行う(ステップS2002)。ブロックセレクション処理に関しては、図4で説明を行った内容と同様である。図4では、入力画像(イメージデータ)に対して、入力画像中の各オブジェクト毎を塊として認識し、当該ブロックの各々を文字/図画/写真/線/表等の属性に判定し、異なる属性を持つ領域に分割する処理を説明したが、ステップS2002では、これと同様の処理を電子ファイル2110に対して行うことになる。
そして、電子ファイル2110に対してブロックセレクション処理をされた後に、各々のオブジェクトに対して既知のOCR/OMR処理を行う(ステップS2003)。尚、当該処理は、図3のステップS122と同様の処理である。
次いで、電子ファイル2110から、ステップS2001で付加したポインタ情報である2次元バーコード2114を検出する(ステップS2004)。尚、当該処理は、図3のステップS123と同様の処理である。
さらに、図3のステップS123において検出済みの入力画像2112のブロックレイアウト情報2113から得られるポインタ情報である2次元バーコード2117の座標と、ステップS2004で検出した電子ファイル2110のブロックレイアウト情報2111から得られるポインタ情報である2次元バーコード2115の座標とを比較して、入力画像2112と電子ファイル2110の向き、大きさ等を比較する(ステップS2005)。
そして、ステップS2005での比較結果から、入力画像2112に対する回転、拡大縮小、傾き補正等の補正処理を必要に応じて行う(ステップS2006)。これらの処理は、画像に対してだけ行うのではなく、ブロックセレクション後のブロックレイアウト情報2111、2113やブロック情報、さらにポインタ情報である2次元バーコードブロック2115、2117にも施す。
また、ブロックレイアウト情報、ブロック情報及びポインタ情報に関しては、回転、拡大縮小、傾き補正等の補正処理を行った入力画像2112に対して、一連のブロックセレクション処理、OCR/OMR処理、ポインタ情報検出処理を再度行って更新するようにしてもよい。
いずれにしても、ステップS2006によって、入力画像2112は、電子ファイル2110と向きや大きさが揃うことになる。尚、図21に示す例では、同じ向き、等倍を示しているため、これらの処理を行う必要がない。
次いで、入力画像2112と電子ファイル2110の各々ブロックセレクション処理結果のブロックレイアウト情報2113、2111において、分割されたブロックごとに同一内容であるか否かの同一性を判断する(ステップS2007)。この判断は、各々のブロックレイアウト情報、ブロック情報、及びOCR/OMR情報から行う。図21では、手書き文字2118部分のブロック2119の存在によって、入力画像2112が電子ファイル2110と異なるブロックを有すると判断される。
そして、ステップS2007で同一と判断されたブロックを入力画像から消去する(ステップS2008)。これによって、例えば図21では、手書き文字ブロック2119以外のブロックが消去される。
さらに、ステップS2008で消去されずに残ったブロック(本実施例では、ブロック2119)を、入力画像2112と電子ファイル2110間の差分イメージデータとして抽出する。図21では手、書き文字ブロック2119が差分イメージデータとして差分抽出される。
[ベクトル化処理]
次に、図3のステップS132で示されるイメージ全体のベクトル化について詳細に説明する。本実施例では、上述した差分抽出によって抽出された差分情報のみをベクトル化する場合と、ステップS128で電子ファイルが特定できなかった場合にイメージデータ全体をベクトル化する処理との2通りが考えられるが、ここでは、まず、後者(イメージ全体のベクトル化)について説明する。そこで、文字ブロックに対しては各文字に対して文字認識処理を行う。
《文字認識処理》
文字認識処理では、入力されたイメージデータから文字単位で切り出された画像に対し、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
ステップS121のブロックセレクション処理で抽出された文字領域に対して文字認識を行う場合は、まず、該当領域に対して横書き、縦書きの判定を行う。次いで、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。文字列及び文字への分解は、横書きの場合は水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。一方、縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚、この時文字のサイズを検出することができる。
《フォント認識処理》
文字認識の際に用いられる字種数分の辞書特徴ベクトルを、文字形状種、すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントを認識することができる。
《文字のベクトル化》
前述した文字認識処理及びフォント認識処理によって得られた文字コード及びフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。尚、入力された原稿画像がカラーの場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
以上の処理により、文字ブロックに属するイメージ情報をほぼ形状、大きさ、色が忠実なベクトルデータに変換することができる。
《文字以外の部分のベクトル化》
ステップS121のブロックセレクション処理で、図画或いは線、表領域とされた領域を対象として、それぞれ抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭を成す画素の点列を角とみなされる点で区切って、各区間を部分的な直線或いは曲線で近似する。ここで、「角」とは、曲率が極大となる点である。
図11は、曲率が極大となる点を説明するための図である。図11に示すように、任意点Piに対して左右k個の離れた点Pi-k〜Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi-k〜Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法等を用いて、曲線は3次スプライン関数等を用いてベクトル化することができる。
また、対象が内輪郭を持つ場合、ブロックセレクション処理で抽出した白画素輪郭の点列を用いて、同様に部分的直線或いは曲線で近似する。
以上のように、輪郭の区分線近似を用いることによって、任意形状の図形のアウトラインをベクトル化することができる。尚、入力される原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
図12は、外輪郭が内輪郭又は別の外輪郭と近接している場合に太さを持った線として表現する例について説明するための図である。図12に示すように、ある区間で外輪郭が、内輪郭又は別の外輪郭が近接している場合、2つの輪郭線を一まとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線又は曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記したような太さを持つ線の集合として、効率よくベクトル表現することができる。
尚、文字ブロックに対する文字認識処理を用いたベクトル化については前述したように、当該文字認識処理の結果、辞書からの距離が最も近い文字を認識結果として用いる。ここで、この距離が所定値以上の場合は、必ずしも本来の文字に一致するとは限らず、形状が類似する文字に誤認識するような場合が多い。従って、本実施例では、このような文字に対しては上記したように、一般的な線画と同様に扱って当該文字をアウトライン化する。すなわち、従来は文字認識処理で誤認識を起こしていたような文字でも、誤った文字にベクトル化されることなく、可視的にイメージデータに忠実なアウトライン化によるベクトル化を行うことができる。また、写真と判定されたブロックに対しては、本発明ではベクトル化せずに、イメージデータのままとする。
《図形認識》
ここでは、上述したように任意形状の図形のアウトラインをベクトル化した後、これらのベクトル化された区分線を図形オブジェクト毎にグループ化する処理について説明する。
図13は、ベクトルデータを図形オブジェクト毎にグループ化するまでの処理手順を説明するためのフローチャートである。まず、各ベクトルデータの始点、終点を算出する(ステップS700)。次に、各ベクトルの始点、終点情報を用いて、図形要素を検出する(ステップS701)。ここで、図形要素の検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用して検出を行う。
次に、図形要素内に存在する他の図形要素又は区分線をグループ化し、一つの図形オブジェクトとする(ステップS702)。尚、図形要素内に他の図形要素又は区分線が存在しない場合は、図形要素を図形オブジェクトとする。
図14は、図形要素を検出する処理手順を説明するためのフローチャートである。まず、ベクトルデータから両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する(ステップS710)。次に、閉図形構成ベクトルの中から当該ベクトルの始点を開始点とし、時計回りに順にベクトルを追っていく。そして、開始点に戻るまで追跡を行い、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する(ステップS711)。尚、この際に、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらに、まだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。最後に、ステップS710で除去された不要ベクトルのうち、ステップS711で閉図形としてグループ化されたベクトルに接合しているものを検出し、一つの図形要素としてグループ化する(ステップS712)。
以上の処理によって、図形ブロックを個別に再利用可能な個別の図形オブジェクトとして扱うことが可能になる。
[差分情報のベクトル化処理]
次に、ステップS132のベクトル化処理のうち、前述の前者である図20で抽出された差分情報のベクトル化処理について説明する。
ベクトル化に関しては、上述した[ベクトル化処理]と同等な処理を行う。これにより、手書きされた文字、例えば図21で示した手書き文字2118は、文字認識された後、文字のベクトル化又はフォント化される。
ここで、手書き文字については、ステップS121のブロックセレクション処理の結果、場合によってはテキストブロックと認識されずに細線と認識され、ラインブロックと判断される可能性がある。そこで、このような場合には、前述した[ベクトル化処理]内の項目《文字以外の部分のベクトル化》で説明したように、輪郭を検出してアウトライン化することで、可視的にイメージデータに忠実なアウトラインによるベクトル化を行うことができる。
図21では手書き文字2118での例を示しているが、手書きの細線や図面等に関しても同様であり、例えば細線等はアウトラインによるベクトル化、図面や図形等に関しては、前述した《図形認識》と同様な処理を行うことでベクトル化を行うことができる。
[電子ファイルとの合成]
次に、入力画像と電子ファイルとの差分部分のベクトル化が終了し、オリジナルの電子ファイルに当該差分部分のベクトルデータを合成する処理について説明する。図22は、図21の入力画像データ2112の手書き文字2118をベクトル化して合成した電子ファイルの一例を示す図である。図22において、2200は、図21の電子ファイル2110に手書き文字2118をベクトル化したベクトル文字2201を付加した合成後の新たな電子ファイルデータを示す。
図22に示すように、ベクトル化された手書き文字2118は、ブロックレイアウト情報2113の座標に手書き文字に最も似たフォント及びサイズで、ベクトル文字2201として元の電子ファイル2110に合成される。
以上説明したように、入力画像中に手書き文字やオリジナルの電子ファイルと異なる情報が含まれているような場合であっても、入力画像と電子ファイルとの差分情報の抽出を行い、その差分情報のベクトル化を行い、元の電子ファイルに合成し、保存や格納アドレスの通知を行うことで、入力されたイメージデータを新たな電子ファイルとして取得、或いは電子ファイルの更新を好適に行うことができる。
[アプリデータへの変換処理]
図15は、一頁分のイメージデータをブロックセレクション処理(ステップS121)及びベクトル化処理(ステップS132)によって変換された結果として得られる中間データ形式のファイルのデータ構造を示す図である。図15に示すようなデータ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。すなわち、図15は、DAOFのデータ構造を示す図である。
図15において、791はHeader(ヘッダ)であり、処理対象の文書画像データに関する情報が保持される。792はレイアウト記述データ部であり、文書画像データ中のTEXT(文字)、TITLE(タイトル)、CAPTION(キャプション)、LINEART(線画)、PICTURE(自然画)、FRAME(枠)、TABLE(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。
793は文字認識記述データ部であり、TEXT、TITLE、CAPTION等のTEXTブロックを文字認識して得られる文字認識結果を保持する。794は表記述データ部であり、TABLEブロックの構造の詳細を格納する。795は画像記述データ部であり、PICTUREやLINEART等のブロックのイメージデータを文書画像データから切り出して保持する。
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、一般の文書作成アプリケーションで個々のオブジェクトを再利用することはできない。そこで、次に、DAOFからアプリデータに変換する処理(ステップS130)について詳説する。
図16は、アプリデータへの変換処理全体の概略手順を説明するためのフローチャートである。まず、DAOFデータを入力する(ステップS800)。次いで、アプリデータの元となる文書構造ツリー生成を行う(ステップS802)。そして、生成した文書構造ツリーに基づいて、DAOF内の実データを流し込み、実際のアプリデータを生成する(ステップS804)。
図17は、文書構造ツリー生成処理(ステップS802)の詳細な処理手順を説明するためのフローチャートである。また、図18は、文書構造ツリーの概要を説明するための図である。尚、全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行するものとする。また、以後の説明では、ブロックとは、ミクロブロック及びマクロブロック全体を指す。
まず、ブロック単位で縦方向の関連性を元に再グループ化する(ステップS802a)。尚、スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近く、ブロック幅(横方向の場合は高さ)がほぼ同一であること等で定義することができる。また、距離、幅、高さ等の情報はDAOFを参照して抽出する。
図18において、(a)は実際のページ構成、(b)はその文書構造ツリーを示している。ステップS802aのグループ化の結果、T3、T4、T5が一つのグループV1として、T6、T7が一つのグループV2として、それぞれ同じ階層のグループとして生成される。
次に、縦方向のセパレータの有無をチェックする(ステップS802b)。セパレータは、例えば、物理的にはDAOF中でライン属性を持つオブジェクトである。また、論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
次いで、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する(ステップS802c)。例えば、縦方向のグルーピング長がページ高さか否かを判定する。その結果、縦方向のグループ長がページ高さとなっている場合は(Yes)、文書構造ツリー生成は終了する。例えば、図18に示すような構造の場合は、セパレータもなく、グループ高さはページ高さではないので、Noと判定され、ステップS802dに進む。
ステップS802dでは、ブロック単位で横方向の関連性を元に再グループ化する。但し、この再グループ化においてもスタート直後の第一回目は、ミクロブロック単位で判定を行うことになる。また、関連性及びその判定情報の定義は、縦方向の場合と同じである。例えば、図18の構造の場合は、T1とT2でH1、V1とV2でH2が生成され、H1はT1、T2の一つ上、H2はV1、V2の1つ上の同じ階層のグループとして生成される。
次いで、横方向セパレータの有無をチェックする(ステップS802e)。図18では、S1があるので、これをツリーに登録し、H1、S1、H2という階層が生成される。そして、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する(ステップS802f)。例えば、横方向のグルーピング長がページ幅か否かを判定する。その結果、横方向のグループ長がページ幅となっている場合(Yes)、文書構造ツリー生成は終了する。一方、ページ幅となっていない場合(No)は、ステップS802bに戻り、再度もう一段上の階層で、縦方向の関連性チェックから繰り返す。例えば、図18の構造の場合は、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
文書構造ツリーが完成した後、その情報に基づいて、ステップS804においてアプリデータの生成を行う。図18の構造の場合は、具体的に以下のようになる。
すなわち、H1は横方向に2つのブロックT1、T2があるので、2カラムとし、T1の内部情報(DAOFを参照した文字認識結果の文章や画像等)を出力後、カラムを変えて、T2の内部情報出力し、その後S1を出力する。また、H2は横方向に2つのブロックV1、V2があるので、2カラムとして出力し、V1はT3、T4、T5の順にその内部情報を出力し、その後カラムを変えて、V2のT6、T7の内部情報を出力する。以上により、アプリデータへの変換処理を行うことができる。
[ポインタ情報の付加]
次に、ステップS134で示されるポインタ情報付加処理について詳細に説明する。処理すべき文書が検索処理で特定された場合、或いはベクトル化によって元ファイルが再生できた場合において、該文書を記録処理する場合においては、紙への記録の際にポインタ情報を付与することで、この文書を用いて再度各種処理を行う場合に簡単に元ファイルデータを取得できる。
図19は、ポインタ情報としてのデータ文字列を2次元バーコード(QRコードシンボル:JIS X0510)311を用いて符号化して画像中に付加する手順を説明するためのフローチャートである。
2次元バーコード内に組み込むデータは、対応するファイルが格納されるサーバアドレス情報を表しており、例えばファイルサーバ名からなるパス情報で構成される。或いは、対応するサーバのURLや、対応するファイルが格納されているデータベース105a、b内或いはMFP100自体が有する記憶装置111を管理するためのID等で構成される。
まず、符号化する種種の異なる文字を識別するため、入力データ列を分析する。また、誤り検出及び誤り訂正レベルを選択し、入力データが収容できる最小型番を選択する(ステップS900)。次に、入力データ列を所定のビット列に変換し、必要に応じてデータのモード(数字、英数字、8ビットバイト、漢字等)を表す指示子や、終端パターンを付加する。さらに、所定のビットコード語に変換することによってデータの符号化を行う(ステップS901)。
この時、誤り訂正を行うため、コード語列を型番及び誤り訂正レベルに応じて所定のブロック数に分割し、各ブロック毎に誤り訂正コード語を生成し、データコード語列の後に付加する(ステップS902)。さらに、ステップS902で得られた各ブロックのデータコード語を接続し、各ブロックの誤り訂正コード語、また必要に応じて剰余コード語を接続して、メッセージの構築を行う(ステップS903)。
次に、マトリクスに位置検出パターン、分離パターン、タイミングパターン及び位置合わせパターン等とともにコード語モジュールを配置する(ステップS904)。さらに、シンボルの符号化領域に対して最適なマスクパターンを選択して、マスク処理パターンをステップS904で得られたモジュールにXOR演算により変換する(ステップS905)。最後に、ステップS905で得られたモジュールに形式情報及び型番情報を生成して、2次元コードシンボルを完成させる(ステップS906)。
上述したサーバアドレス情報の組み込まれた2次元バーコードは、例えば、クライアントPC102から電子ファイルをプリントデータとして形成装置112で紙上に記録画像として形成する場合に、データ処理装置115内で記録可能なラスタデータに変換された後にラスタデータ上の所定の個所に付加されて画像形成される。ここで、画像形成された紙を配布されたユーザは、画像読み取り部110で読み取ることにより、前述したステップS123においてポインタ情報からオリジナルの電子ファイルが格納されているサーバの場所を適切に検出することができる。
尚、同様の目的で付加情報を付与する手段は、本実施例で説明した2次元バーコードの他に、例えば、ポインタ情報を直接文字列で文書に付加する方法、文書内の文字列、特に文字と文字の間隔を変調して情報を埋め込む方法、文書中の中間調画像中に埋め込む方法等の一般に電子透かしと呼ばれる方法を適用してもよい。
上述したように本実施例によれば、ユーザが加筆した手書き文書情報等を含めたあらゆる紙文書上の情報を消失することなく再利用可能な電子ファイルとして保存することができる。また、それらの情報をベクトルデータとすることで、データ量を減少することができ、入力された原稿の再利用性、編集可能性を大きく高めることもできる。
また、本実施例によれば、原稿を読み取り走査することによって得られたイメージ情報から、当該原稿のオリジナルの電子ファイルを特定し、上記イメージ情報に一致するオリジナルの電子ファイルを特定することで、入力イメージ情報とオリジナル電子ファイルとの差分情報を抽出することができ、オリジナルには存在しない追記情報を取り扱うことが可能になる。
また、ベクトル化された差分情報をオリジナルの電子ファイルに合成し、オリジナルの電子ファイルに上書き保存する。或いは、ベクトル化された差分情報とオリジナルの電子ファイルとを合成して新たな電子ファイルとして生成する。或いは、ベクトル化された差分情報をオリジナルの電子ファイル内の別レイヤーとして保存する。或いは、ベクトル化された差分情報をオリジナルの電子ファイルとは別の差分情報ファイルとして保存する等、ユーザが選択を行うことにより、オリジナルの電子データと差分情報データの生成、保存に対して、ファイル容量を削減したり、検索を高速化したり、オリジナル性の確保を重視したデータ処理が可能となる。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の第1の実施例に係る画像処理システムの構成を示すブロック図である。 本発明の第1の実施例に係るMFP100の構成を示すブロック図である。 本発明の第1の実施例に係る画像処理システムによる画像処理の手順について説明するためのフローチャートである。 ブロックセレクション処理によって読み取った1枚のイメージデータを属性を判定し複数のブロックに分割する様子を示す図である。 ブロックセレクション処理で得られた各ブロックに対するブロック情報の一例について示す図である。 原稿画像中に付加された2次元バーコード(QRコードシンボル)を復号してデータ文字列を出力する手順を説明するためのフローチャートである。 2次元バーコードが付加された原稿310の一例を示す図である。 検出されたポインタ情報から電子ファイルを検索する処理手順について説明するためのフローチャートである。 ファイルアクセス権を含むポインタ情報から電子ファイルが格納されているサーバを検索する処理手順について説明するためのフローチャートである。 データベース内から入力イメージファイルに類似した電子ファイルのレイアウト検索を行う手順について説明するためのフローチャートである。 曲率が極大となる点を説明するための図である。 外輪郭が内輪郭又は別の外輪郭と近接している場合に太さを持った線として表現する例について説明するための図である。 ベクトルデータを図形オブジェクト毎にグループ化するまでの処理手順を説明するためのフローチャートである。 図形要素を検出する処理手順を説明するためのフローチャートである。 一頁分のイメージデータをブロックセレクション処理及びベクトル化処理によって変換された結果として得られる中間データ形式のファイルのデータ構造を示す図である。 アプリデータへの変換処理全体の概略手順を説明するためのフローチャートである。 文書構造ツリー生成処理の詳細な処理手順を説明するためのフローチャートである。 文書構造ツリーの概要を説明するための図である。 ポインタ情報としてのデータ文字列を2次元バーコードを用いて符号化して画像中に付加する手順を説明するためのフローチャートである。 図3に示すフローチャートにおける差分抽出処理(ステップS131)の手順を説明するための概略を示すフローチャートである。 図20に示す差分抽出処理内容を説明するための電子ファイルに関する入力画像のイメージデータ例及びブロックセレクション例を示す図である。 図21の入力画像データ2112の手書き文字2118をベクトル化して合成した電子ファイルの一例を示す図である。
符号の説明
100 デジタル複合機(MFP)
101 マネージメントPC
102 クライアントPC
103a、103b プロキシサーバ
104 ネットワーク
105a、105b データベース
106a、106b 文書管理サーバ
107、108、109 LAN
110 画像読み取り部
111 記憶装置
112 形成装置
113 入力装置
114、117 ネットワークI/F
115 データ処理装置
116 表示装置

Claims (14)

  1. サーバが保持する電子ファイルの中から指定された原稿に対応する電子ファイルを取得して出力する画像処理システムであって、
    原稿を表す画像データを入力する入力手段と、
    前記入力手段で入力された画像データに対応する電子ファイルを前記サーバが保持する電子ファイルの中から検索する検索手段と、
    前記検索手段で検索された電子ファイルと前記入力手段で入力された画像データとの差分情報を抽出する抽出手段と、
    前記電子ファイルと前記差分情報とを対応付けて保持する保持手段と
    を備えることを特徴とする画像処理システム。
  2. 前記入力手段が、所定の付加情報が形成された原稿を光学的に読み取り走査して得られた画像データを入力することを特徴とする請求項1に記載の画像処理システム。
  3. 前記入力手段で入力された画像データから該画像データに対応する電子ファイルが格納されている格納場所を示す透かし、バーコード、文字、図形のいずれかで示されるポインタ情報を認識する認識手段をさらに備え、
    前記検索手段は、前記認識手段で認識された前記ポインタ情報に基づいて前記画像データに対応する電子ファイルを検出する
    ことを特徴とする請求項1又は2に記載の画像処理システム。
  4. 前記差分情報を、その属性に応じて、文字コード化する文字処理手段、ベクトルデータに変換するベクトル化手段、所定の画像形式に変換する画像変換手段の少なくともいずれかを用いて変換する変換手段をさらに備えることを特徴とする請求項1から3までのいずれか1項に記載の画像処理システム。
  5. 前記保持手段が、前記変換手段により変換された前記差分情報を前記電子ファイルと合成し、合成された新たな電子ファイルを合成前の電子ファイルに代えて保持することを特徴とする請求項4に記載の画像処理システム。
  6. 前記保持手段が、前記変換手段により変換された前記差分情報を前記電子データと合成し、合成されたデータを新たな電子ファイルを保持することを特徴とする請求項4に記載の画像処理システム。
  7. 前記保持手段が、前記変換手段により変換された前記差分情報を前記電子ファイルの既存の画像データの別レイヤーとして互いに関連付けて保持することを特徴とする請求項4に記載の画像処理システム。
  8. 前記保持手段が、前記変換手段により変換された前記差分情報を前記電子ファイルとは別の差分情報ファイルとして保持することを特徴とする請求項4に記載の画像処理システム。
  9. 前記保持手段が、前記電子ファイルに前記差分情報ファイルの保持先を示すポインタ情報を付加して該電子ファイルを保持することを特徴とする請求項8に記載の画像処理システム。
  10. 前記保持手段は、前記差分情報ファイルに前記電子ファイルの格納先を示すポインタ情報を付加して該差分情報を保持することを特徴とする請求項8に記載の画像処理システム。
  11. アクセス制限のある画像データを保持するサーバから該画像データを取得するに先立って、認証情報の入力を要求するパスワード要求手段と、
    入力された認証情報が正しいかどうかを判定する認証情報判定手段と、
    正しい認証情報が入力された場合、前記サーバに対する前記画像データへのアクセスを許可する許可手段とをさらに備え、
    前記許可手段によって前記画像データへのアクセスが許可されたことを条件として、該画像データを取得する
    ことを特徴とする請求項1から10までのいずれか1項に記載の画像処理システム。
  12. 前記抽出手段が、
    前記検索手段で検索された前記電子ファイルと前記入力手段で入力された前記画像データとを比較して該画像データを補正する補正手段と、
    補正後の画像データと前記電子ファイルとをブロックごとに同一性を比較する比較手段と、
    前記比較手段により前記電子ファイルと同一のブロックであるとされたブロックを前記画像データから消去して前記差分情報を取得する消去手段と
    を備えることを特徴とする請求項1から11までのいずれか1項に記載の画像処理システム。
  13. 前記検索手段で検索された前記電子ファイルに前記ポインタ情報を付加する付加手段と、
    前記ポインタ情報が付加された前記電子ファイルを所定媒体上に形成して出力する出力手段と
    をさらに備えることを特徴とする請求項3に記載の画像処理システム。
  14. サーバが保持する電子ファイルの中から指定された原稿に対応する電子ファイルを取得して出力する画像処理方法であって、
    原稿を表す画像データを入力する入力工程と、
    前記入力工程で入力された画像データに対応する電子ファイルを前記サーバが保持する電子ファイルの中から検索する検索工程と、
    前記検索工程で検索された電子ファイルと前記入力工程で入力された画像データとの差分情報を抽出する抽出工程と、
    前記電子ファイルと前記差分情報とを対応付けて所定の格納場所に格納する格納工程と
    を有することを特徴とする画像処理方法。
JP2003385186A 2003-11-14 2003-11-14 画像処理システム及び画像処理方法 Withdrawn JP2005149097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003385186A JP2005149097A (ja) 2003-11-14 2003-11-14 画像処理システム及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003385186A JP2005149097A (ja) 2003-11-14 2003-11-14 画像処理システム及び画像処理方法

Publications (1)

Publication Number Publication Date
JP2005149097A true JP2005149097A (ja) 2005-06-09

Family

ID=34693343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003385186A Withdrawn JP2005149097A (ja) 2003-11-14 2003-11-14 画像処理システム及び画像処理方法

Country Status (1)

Country Link
JP (1) JP2005149097A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007025995A (ja) * 2005-07-14 2007-02-01 Konica Minolta Business Technologies Inc 文書情報の管理方法および文書処理装置
JP2007158858A (ja) * 2005-12-06 2007-06-21 Konica Minolta Business Technologies Inc 画像形成装置及び画像形成処理プログラム
JP2008310423A (ja) * 2007-06-12 2008-12-25 Photron Ltd 画像ファイル作成編集装置、画像ファイル閲覧装置、及び画像ファイル作成編集方法
US7738703B2 (en) 2006-03-01 2010-06-15 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer readable medium storing image processing program
US9754559B2 (en) 2013-09-27 2017-09-05 Ricoh Company, Ltd. Image processing apparatus
US10334139B2 (en) 2017-09-01 2019-06-25 Toshiba Tec Kabushiki Kaisha Image decoloring apparatus and method setting password to access difference of image data read before and after heating
JP2019180014A (ja) * 2018-03-30 2019-10-17 ブラザー工業株式会社 プリンタ及びコンピュータプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007025995A (ja) * 2005-07-14 2007-02-01 Konica Minolta Business Technologies Inc 文書情報の管理方法および文書処理装置
JP2007158858A (ja) * 2005-12-06 2007-06-21 Konica Minolta Business Technologies Inc 画像形成装置及び画像形成処理プログラム
US7738703B2 (en) 2006-03-01 2010-06-15 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer readable medium storing image processing program
JP2008310423A (ja) * 2007-06-12 2008-12-25 Photron Ltd 画像ファイル作成編集装置、画像ファイル閲覧装置、及び画像ファイル作成編集方法
US9754559B2 (en) 2013-09-27 2017-09-05 Ricoh Company, Ltd. Image processing apparatus
US10334139B2 (en) 2017-09-01 2019-06-25 Toshiba Tec Kabushiki Kaisha Image decoloring apparatus and method setting password to access difference of image data read before and after heating
US10659659B2 (en) 2017-09-01 2020-05-19 Toshiba Tec Kabushiki Kaisha Image decoloring apparatus and method setting password to access difference of image data read before and after heating
JP2019180014A (ja) * 2018-03-30 2019-10-17 ブラザー工業株式会社 プリンタ及びコンピュータプログラム
JP7021588B2 (ja) 2018-03-30 2022-02-17 ブラザー工業株式会社 プリンタ及びコンピュータプログラム
US11360715B2 (en) 2018-03-30 2022-06-14 Brother Kogyo Kabushiki Kaisha Printer and non-transitory computer readable storage medium with shared review function

Similar Documents

Publication Publication Date Title
JP4266784B2 (ja) 画像処理システム及び画像処理方法
US7681121B2 (en) Image processing apparatus, control method therefor, and program
US7640269B2 (en) Image processing system and image processing method
JP4393161B2 (ja) 画像処理装置及び画像処理方法
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7542605B2 (en) Image processing apparatus, control method therefor, and program
JP3997198B2 (ja) 画像処理システム及び画像処理方法
JP3862694B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2005159517A (ja) 画像処理装置及びその制御方法、プログラム
JP2008109394A (ja) 画像処理装置及びその方法、プログラム
JP4338189B2 (ja) 画像処理システム及び画像処理方法
JP4227432B2 (ja) 画像処理方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP4185858B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4310176B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2006134042A (ja) 画像処理システム
JP2006146486A (ja) 画像処理装置
JP2005208872A (ja) 画像処理システム
JP2005157447A (ja) 画像処理システム及び画像処理方法
JP2005149098A (ja) 画像処理システム及び画像処理装置並びに画像処理方法
JP2005136729A (ja) 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体
JP2005165674A (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2008084127A (ja) 画像形成装置
JP2006195886A (ja) 画像処理システム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070206