JP2004334340A

JP2004334340A - 画像処理方法及び装置

Info

Publication number: JP2004334340A
Application number: JP2003125819A
Authority: JP
Inventors: Tomonori Kudou; 朋紀工藤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2003-04-30
Filing date: 2003-04-30
Publication date: 2004-11-25

Abstract

【課題】画像処理システムにおいて、ユーザの希望の処理をあらかじめ設定することで、文書の加工、蓄積、伝送、記録等を行うユーザの操作性を大幅に向上させる。
【解決手段】複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法において、「原稿出力」もしくは「原本出力」の何れかを設定可能とする。スタートキーの操作により、原稿を光学的に読み取って画像信号を入力し（Ｓ２００１）、「原稿出力」が設定されていた場合は上記読み取った画像信号をそのまま出力し（Ｓ２００２，Ｓ２００４）、「原本出力」が設定されていた場合は、上記読み取った画像信号に基づいて記憶手段より対応する電子ファイルを検索し、これを出力する（Ｓ２００２〜Ｓ２００４）。
【選択図】図２２

Description

【０００１】
【発明の属する技術分野】
本願発明は、光学的に原稿画像を読み取って得られた画像データを処理する画像処理技術に関する。
【０００２】
【従来の技術】
近年、環境問題が叫ばれる中、オフィスでのペーパーレス化が急速に進んでいる。このような中、バインダー等で蓄積された紙文書、あるいは配付資料等をスキャナで読み取り、オリジナルの検索、あるいはオリジナルが存在しない場合は、所定のフォーマットに変換して画像記憶装置にデータベースとして蓄積するような文書管理システムが提案されている。この種のシステムにおいては、オリジナル文書は、テキスト、写真、線画など属性ごとにベクトル化されて保存されている。そこで、スキャナ読み取り画像からオリジナルの文書を検索する際には、スキャナ読み取り画像をテキスト、写真、線画などの属性ごとにベクトル化し、保存文書との間でテキストの一致度、写真画像一致度、線画一致度、そして各属性のレイアウト情報を用いたレイアウト一致度などを算出する。すなわち、これら複数の一致度を総合的に判断する複合検索によってオリジナル文書を特定できるのが大きな特徴である。
【０００３】
例えば、この種の文書検索装置は特許文献１によって提案されている。特許文献１に記載された文書検索装置は、原稿をスキャンし、スキャンされた原稿から文字認識された文字列をユーザが指定して検索することにより、内容及び位置関係が一致する文書を検索する。
【０００４】
【特許文献１】
特開平３−２６３５１２号公報
【０００５】
【発明が解決しようとする課題】
しかしながら、スキャンした紙文書がオリジナル文書のデータベースに存在しないことがあらかじめわかっているような場合に、データベースの検索を行なうことは無駄な処理である。また、オリジナル文書のデータベースに登録する必要のないメモのコピーなどの場合に当該画像をデータベースに登録してしまうのは、無駄な処理時間を費やすとともに、メモリの浪費でもある。
【０００６】
このような不具合を避けるためには、操作の都度これから行なう処理を指定する必要があるが、これはユーザにとって非常に煩わしい操作である。
【０００７】
本発明は上記の課題に鑑みてなされたものであり、原稿画像の読み取りにおいてユーザの意図通りの処理を簡易な操作で実行可能とすることを目的とする。
【０００８】
【課題を解決するための手段】
上記の目的を達成するための本発明による画像処理方法は、
複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法であって、
第１の動作モードもしくは第２の動作モードを設定する設定工程と、
原稿を光学的に読み取って画像信号を入力する画像入力工程と、
前記設定工程で前記第１の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号をそのまま出力する第１出力工程と、
前記設定工程で前記第２の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号に基づいて前記記憶手段を検索する検索工程と、
前記検索工程で得られた電子ファイルを出力する第２出力工程とを備える。
【０００９】
また、上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。すなわち、
複数の画像や電子データを保持する記憶手段へのアクセスが可能な画像処理装置であって、
第１の動作モードもしくは第２の動作モードを設定する設定手段と、
原稿を光学的に読み取って画像信号を入力する画像入力手段と、
前記設定手段で前記第１の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号をそのまま出力する第１出力手段と、
前記設定手段で前記第２の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号に基づいて前記記憶手段を検索する検索手段と、
前記検索手段で得られた電子ファイルを出力する第２出力手段とを備える。
【００１０】
【発明の実施形態】
以下、添付の図面を参照して本発明の好適な実施形態について説明する。
【００１１】
〈第１実施形態〉
［システムの概要］
図１は本実施形態による画像処理システム構成例を示すブロック図である。この画像処理システムは、オフィス１０とオフィス２０とをインターネット１０４で接続された環境で実現する。オフィス１０内に構築されたＬＡＮ１０７には、ＭＦＰ１００、ＭＦＰ１００を制御するマネージメントＰＣ１０１、クライアントＰＣ（外部記憶手段）１０２、文書管理サーバ１０６、そのデータベース１０５、およびプロキシサーバ１０３が接続されている。また、オフィス２０内に構築されたＬＡＮ２０８には、文書管理サーバ２０６、そのデータベース２０５およびプロキシサーバ２０３が接続されている。オフィス１０内のＬＡＮ１０７及びオフィス２０内のＬＡＮ２０８はそれぞれプロキシサーバ１０３及び２０３を介してインターネット１０４に接続される。
【００１２】
ＭＦＰ１００は本実施形態において紙文書の画像読み取りと、読み取った画像信号に対する画像処理の一部を担当する。画像信号はケーブル１０９を介してマネージメントＰＣ１０１に入力する（ＬＡＮ１０７を介してもよい）。マネージメントＰＣ１０１は通常のＰＣ（パーソナルコンピュータ）であり、画像記憶手段としてのメモリ、画像処理手段としてのＣＰＵやソフトウエア、表示手段としてのＣＲＴ或いはＬＣＤ、入力手段としてのキーボードやポインティングデバイスを有するが、その一部をＭＦＰ１００に一体化して構成されている。例えば、ＰＣの一部であるＬＣＤがＭＦＰに一体化されて実装される。
【００１３】
図２はＭＦＰ１００の構成図である。図２においてオートドキュメントフィーダ（以降ＡＤＦと記す）を含む画像読み取り部１１０は、束状の或いは１枚の原稿画像を図示しない光源で照射し、原稿反射像を固体撮像素子上に結像させ、固体撮像素子からラスター状の画像読み取り信号を６００ＤＰＩの密度のイメージ情報として得る。通常の複写機能はこの画像信号をデータ処理部１１５で画像処理して記録信号へ変換し、複数枚複写の場合は記録装置１１１に一旦一ページ分の記録データを記憶保持した後、記録装置１１２に順次出力することで紙上に画像を形成する。
【００１４】
一方クライアントＰＣ１０２から出力されるプリントデータはＬＡＮ１０７からネットワークＩＦ１１４を経てデータ処理装置１１５に入力される。ここでプリントデータは記録可能なラスターデータに変換された後、記録装置１１２によって紙上に記録画像として形成される。
【００１５】
ＭＦＰ１００への操作者の指示はＭＦＰ１００に装備された操作キーを含む入力装置１１３から、或いはマネージメントＰＣ１０１の入力装置であるキーボード及びマウスから行われる。一方操作入力の状態表示及び処理中の画像データの表示は表示装置１１６で行われる。尚、記憶装置１１１はマネージメントＰＣ１０１からも制御され、ＭＦＰ１００とマネージメントＰＣ１０１とのデータの授受及び制御はネットワークＩＦ１１７および直結した通信手段（ケーブル１０９）を介して行われる。
【００１６】
以上の一連の動作はデータ処理装置１１５内の図示しない制御部で制御される。
【００１７】
［処理概要］
次に本実施形態によるＭＦＰ１００の処理動作の概要を図２１及び図２２を用いて説明する。
【００１８】
図２１は本実施形態によるＭＦＰ１００のユーザインターフェース部を示す図であり、入力装置１１３と表示装置１１６の具体例が示されている。表示装置１１６上には入力装置１１３の一部としてのタッチパネルが設けられている。図２１の状態では「原本出力」ボタン１１６ａと「原稿出力」ボタン１１６ｂの操作が可能な処理設定画面が表示されている。ユーザは所定の操作によってこのような処理設定画面を表示させ、例えばＳＴＡＲＴキー１１３ａを押したときの出力形態として原本出力か原稿出力のいずれかを指定することができる。なお、原稿出力とは画像読み取り部１１０で原稿を読み取って得られた画像データをそのまま出力するモードである。従って、例えばこのモードにおいて記録出力を行なえば、通常のコピー動作となる。また、原本出力とは、画像読み取り部１１０で原稿を読み取って得られた画像データに基づいてデータベース１０５等を検索し、得られた電子ファイル（読み取った画像に対応する電子ファイル）を出力するモードである。
【００１９】
図２２は本実施形態によるＭＦＰ１００の概略の動作を説明するフローチャートである。まずステップＳ２００１において、ＭＦＰ１００の画像読み取り部１１０を動作させ、１枚の原稿をラスター状に走査して６００ＤＰＩ−８ビットの画像信号を得る。次に、ステップＳ２００２において、図２１に示す処理設定画面において「原本出力」か「原稿出力」のいずれが設定されているかを判定する。
【００２０】
原稿出力が設定されていると判定された場合はステップＳ２００３をスキップしてステップＳ２００４へ進み、ステップＳ２００１で入力した画像をそのまま、画像編集／蓄積／伝達／記録等のために出力する。また、原本を検索する「原本出力」が設定されていた場合には、ステップＳ２００３で原本処理を行なう。原本処理では、その詳細は後述するが、当該入力画像に対応する原本データをデータベース１０５等を検索して取得し、得られた原本データを画像編集／蓄積／伝達／記録等のために出力する。
【００２１】
例えば原本画像がカラー画像であって、これに対応する原稿として白黒画像の原稿を持っていた場合、「原稿出力」がセットされた状態でＳＴＡＲＴキー１１３ａを押せば通常通り白黒画像のコピー出力が得られるが、「原本出力」がセットされた状態でＳＴＡＲＴキー１１３ａを押せばカラー画像の印刷出力（コピー）が得られるといったようにＳＴＡＲＴキーをカスタマイズできる。
【００２２】
［原本処理概要］
次に本実施形態による原本処理（ステップＳ２００３）の概要を図３を用いて説明する。
【００２３】
原稿入力処理で入力した画像信号をデータ処理部１１５で前処理を施し記憶装置１１１に１ページ分の画像データとして保存する。マネージメントＰＣ１０１のＣＰＵは該格納された画像データについてブロックセレクション処理（ＢＳ処理）を実行し、まず文字／線画部分とハーフトーンの画像部分とに領域を分離する（ステップＳ１２１）。なお、文字部は更に段落で塊として纏まっているブロック毎に、或いは、線で構成された表、図形に分離し各々セグメント化する。一方、ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分、背景部等、所謂ブロック毎に独立したオブジェクトに分割する。
【００２４】
このとき原稿画像中に付加情報として記録された２次元バーコード、或いはＵＲＬに該当するオブジェクトを検出し、ＵＲＬを認識して当該原稿のオリジナルの電子ファイルが格納されている記憶装置（データベース１０５等）内のポインター情報を検出する（ステップＳ１２２、Ｓ１２３）。なお、ＵＲＬが通常の文字で記述されている場合はこれをＯＣＲで文字認識してＵＲＬを得る。或いはＵＲＬが２次元バーコードで記述されている場合には、該マークを解読して（ＯＭＲ）ＵＲＬを得る。
【００２５】
尚、ポインター情報を付加する手段としては文字やバーコードに限られず、例えば文字と文字の間に情報を埋め込む方法、ハーフトーンの画像に埋め込む方法等、直接可視化されない所謂電子透かしによる方法等を用いてもよい。
【００２６】
ポインター情報が検出された場合、処理はステップＳ１２５に分岐し、ポインターで示されたアドレスから元の電子ファイルを検索する。電子ファイルは図１においてクライアントＰＣ１０２内のハードディスク内、或いはオフィス１０或いは２０のＬＡＮ１０７、２０８に接続された文書管理サーバ１０６内のデータベース１０７内、或いはＭＦＰ１００自体が有する記憶装置１１１のいずれかに格納されている。そして、ステップＳ１２３で得られたアドレス情報に従ってこれらの記憶装置内を検索する。ステップＳ１２５で電子ファイルが見つからなかった場合、見つかったがＰＤＦあるいはＴＩＦＦに代表される所謂イメージファイルであった場合、或いはポインター情報自体が存在しなかった場合はステップＳ１２６に進む。なお、ファイルの種類は拡張子により判断できる。
【００２７】
ステップＳ１２６〜Ｓ１２８ではデータベース上のオリジナル電子ファイルを検索する。このため、まずステップＳ１２６において、原稿入力処理で入力した画像をベクトルデータへ変換する。ベクトル化処理（ステップＳ１２６）では、テキストブロックに対してＯＣＲを施し、ＯＣＲされたテキストブロックに対しては、更に文字のサイズ、スタイル、字体が認識され、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線で構成される表、線画ブロックに対してはアウトライン化し、表など図形形状が認識できるものは、その形状を認識する。写真ブロックに対してはイメージデータとして個別のＪＰＥＧファイルとして処理する。以上のベクトル化処理はブロックセレクション処理によって得られた各オブジェクト毎に行う。
【００２８】
以上のようにしてイメージをベクトル化したならば、ステップＳ１２７でデータベース１０５上の各ファイルとの類似度（ベクトルの類似度）を調べ、オリジナルを検索する。こうして、ステップＳ１２６により変換されたベクトルデータを用いて忠実にオリジナルファイルが検索される。より具体的には、オブジェクト毎に類似度を求め、オブジェクト毎の類似度をそのオブジェクトのファイル内占有率に応じてファイル全体の類似度へ反映させる。ファイル内で占めている割合の大きいオブジェクトの類似度が、ファイル全体の類似度へより大きく反映されるため、いかなるフォーマットのファイルにも適応的に対応することが可能である。
【００２９】
以上のような検索処理の結果類似度の高い電子ファイルが見つかった場合は、当該電子ファイルをサムネイル等で表示（ステップＳ１２８）する。複数の候補が見つかった場合は、複数のサムネイルが表示され、操作者の入力操作よってファイルが特定され、ステップＳ１３３でそのファイルの格納アドレスが通知される。尚、候補が１ファイルの場合は、自動的にステップＳ１２９からステップＳ１３３に分岐して検索されたファイルの格納アドレスを通知するようにしてもよい。一方、ステップＳ１２６の検索処理で電子ファイルが見つからなかった場合、或いは、見つかったがＰＤＦあるいはＴＩＦＦに代表される所謂イメージファイルであった場合、処理はステップＳ１２９からステップＳ１３０に進む。
【００３０】
これらのベクトル化処理は各オブジェクト毎に行い、更に各オブジェクトのレイアウト情報を保存して例えば、ｒｔｆに変換（ステップＳ１３０）して電子ファイルとして記憶装置１１１に格納（ステップＳ１３１）する。
【００３１】
今、ベクトル化した原稿画像は以降同様の処理を行う際に直接電子ファイルとして検索出来るように、先ずステップＳ１３２において検索の為のインデックス情報を生成して検索用インデックスファイル（原本を検索するためのインデックスであり、全文検索インデックス或いは類似画像検索のインデックス等）に追加する。ステップＳ１３３では、生成した電子ファイルの格納アドレスを通知する。そして、ステップＳ１３４で、操作者が行いたい処理が記録であると判断されれば、ステップＳ１３５に分岐し、ポインター情報をイメージデータとしてファイルに付加する。なお、検索処理で電子ファイルが特定できた場合も同様である。すなわち、ステップＳ１２９からステップＳ１３３に分岐して格納アドレスを操作者に通知すると共に、紙に記録する場合にはポインター情報を電子ファイルに付加する。こうして、以降からは、その原稿のポインター情報によって直接電子ファイルを特定することが可能となる。
【００３２】
尚、ステップＳ１２５でポインター情報から電子ファイルが特定できた場合、検索処理で電子ファイルが特定出来た場合、ベクトル化により電子ファイルに変換した場合には、ステップＳ１３３において該電子ファイルの格納アドレスが操作者に通知される。
【００３３】
以上の処理によって得られた電子ファイル自体を用いて、例えば文書の加工、蓄積、伝送、記録をステップＳ１３６で行うことが可能になる。これらの処理はイメージデータを用いる場合に比べて情報量が削減され、蓄積効率が高まり、伝送時間が短縮され、又記録表示する際には高品位なデータとして非常に有利となる。以下各処理ブロックに対して詳細に説明する。
【００３４】
＜ブロックセレクション処理（Ｓ１２１）＞
先ずステップＳ１２１で示すブロックセレクション処理について図４を参照して説明する。
【００３５】
ブロックセレクション処理とは、画像読み取り部１１０によって光学的に原稿画像を読み取って得られた一頁のイメージデータ（例えば図４の（ａ））を各オブジェクト毎の塊として認識し、該ブロックの各々をテキスト／線画／写真／線／表等の属性に分類し、異なる属性を持つ領域に分割する（図４の（ｂ））処理である。具体的には、本実施形態では以下の手順でブロックセレクション処理を実行する。
【００３６】
先ず、入力画像を白黒に二値化し、輪郭線追跡をおこなって黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡をおこない白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
【００３７】
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なる属性を持つ領域へ分類していく。たとえば、縦横比が１に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分をテキスト領域、扁平な画素塊を線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を線画領域、などとする。
【００３８】
ブロックセレクション処理で得られた各ブロックに対するブロック情報の例を図４の（ｂ）に示す。これらのブロック毎の情報は以降に説明するベクトル化、或いは検索の為の情報として用いる。
【００３９】
＜ポインター情報の検出（Ｓ１２２）＞
次に、ステップＳ１２２で示す、ファイルの格納位置をイメージ情報から抽出する為のＯＣＲ／ＯＭＲ処理について、図５及び図６を用いて説明する。
【００４０】
図５は原稿画像中に付加された２次元バーコード（ＱＲコードシンボル）を復号して、データ文字列を出力する過程を示すフローチャートである。また、図６は２次元バーコードの付加された原稿３１０の一例を示す。
【００４１】
まず、データ処理装置１１５は、不図示のページメモリに格納された原稿３１０を表すイメージ画像を走査して、先に説明したブロックセレクション処理の結果から所定の２次元バーコードシンボル３１１の位置を検出する。ＱＲコードの位置検出パターンは、シンボルの４隅のうちの３隅に配置される同一の位置検出要素パターンから構成される（ステップＳ３００）。次に、位置検出パターンに隣接する形式情報を復元し、シンボルに適用されている誤り訂正レベルおよびマスクパターンを得る（ステップＳ３０１）。
【００４２】
シンボルの型番を決定し（ステップＳ３０２）、形式情報で得られたマスクパターンを使って符号化領域ビットパターンをＸＯＲ演算することによってマスク処理を解除する（ステップＳ３０３）。モデルに対応する配置規則に従い、シンボルキャラクタを読み取り、メッセージのデータ及び誤り訂正コード語を復元する（ステップＳ３０４）。復元されたコード上に、誤りがあるかどうかの検出を行い（ステップＳ３０５）、誤りが検出された場合はステップＳ３０６に分岐してこれを訂正する。
【００４３】
誤り訂正されたデータより、モード指示子および文字数指示子に基づいて、データコード語をセグメントに分割する（ステップＳ３０７）。最後に、仕様モードに基づいてデータ文字を復号し、結果を出力する（ステップＳ３０８）。
【００４４】
尚、２次元バーコード内に組み込まれたデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバー名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのＵＲＬで構成される。
【００４５】
また、本実施形態ではポインター情報が２次元バーコードを用いて付与された原稿３１０について説明したが、直接文字列でポインター情報が記録される場合は所定のルールに従った文字列のブロックを先のブロックセレクション処理で検出し、該ポインター情報を示す文字列の各文字を文字認識（ＯＣＲ）することで、直接元ファイルのアドレス情報を得ることが可能である。
【００４６】
或いは、図６の文書３１０のテキストブロック３１２、或いは３１３の文字列に対して隣接する文字と文字の間隔等に視認し難い程度の変調を加え、該文字間隔に情報を埋め込むことでもポインター情報を付与してもよい。このような、所謂透かし情報においては、後述する文字認識処理を行う際に各文字の間隔を測定することにより、ポインター情報を抽出することができる。また、写真３１４の中に電子透かしとしてポインター情報を付加することも可能である。
【００４７】
＜ポインター情報によるファイル検索（Ｓ１２５）＞
次に、図３で先に説明したステップＳ１２５における、ポインター情報からの電子ファイルの検索について図７のフローチャートを使用して説明する。
【００４８】
まず、ポインタ情報に含まれるアドレスに基づいて、ファイルサーバを特定する（ステップＳ４００）。ここでファイルサーバとは、クライアントＰＣ１０２や、データベース１０５を内蔵する文書管理サーバ１０６や、記憶装置１１１を内蔵するＭＦＰ１００自身を指す。また、ここでアドレスとは、ＵＲＬやサーバ名とファイル名からなるパス情報である。
【００４９】
ファイルサーバが特定できたら、ファイルサーバに対してアドレスを転送する（ステップＳ４０１）。ファイルサーバはアドレスを受信すると、該当するファイルを検索する（ステップＳ４０２）。ファイルが存在しない場合（ステップＳ４０３でＮＯ）には、ＭＦＰ１００に対してその旨通知する。一方、ファイルが存在した場合（ステップＳ４０３でＹＥＳ）には、図３で説明した様に、当該ファイルのアドレスを通知（ステップＳ１３３）すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、ＭＦＰ１００に対してファイルを転送する（ステップＳ４０８）。
【００５０】
＜ベクトル化処理（Ｓ１２６）＞
次にステップＳ１２６で示されるベクトル化について詳説する。ポインタ情報がない場合、或いはファイルサーバに元ファイルが存在しない場合は、読み込んだイメージデータをブロックセレクション処理で得られた各ブロック（オブジェクト）毎にベクトル化する。
【００５１】
『文字認識』
テキストブロックに対しては各文字に対して文字認識処理を行う。
【００５２】
文字認識部では、文字単位で切り出された画像に対し、パターンマッチの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には種々の公知手法があり、たとえば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
【００５３】
ブロックセレクション（ステップＳ１２１）で抽出された文字領域に対して文字認識を行う場合は、まず該当領域に対し横書き、縦書きの判定をおこない、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平／垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことでおこなう。縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚この時文字のサイズが検出出来る。
【００５４】
『フォント認識』
文字認識の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントが認識出来る。
【００５５】
『文字のベクトル化』
前記文字認識およびフォント認識よって得られた、文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。なお、元原稿がカラーの場合はカラー画像から各文字の色を抽出してベクトルデータとともに記録する。
【００５６】
以上の処理によりテキストブロックに属するイメージ情報をほぼ形状、大きさ、色に関して忠実なベクトルデータに変換出来る。
【００５７】
『文字以外の部分のベクトル化』
ブロックセレクション処理（ステップＳ１２１）で、線画あるいは線、表領域とされた領域を対象に、中で抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図９に図示するように、任意点Ｐｉに対し左右ｋ個の離れた点Ｐｉ−ｋ，Ｐｉ＋ｋの間に弦を引いたとき、この弦とＰｉの距離が極大となる点として求められる。さらに、Ｐｉ−ｋ，Ｐｉ＋ｋ間の弦の長さ／弧の長さをＲとし、Ｒの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は３次スプライン関数などを用いてベクトル化することができる。
【００５８】
また、対象が内輪郭を持つ場合、ブロックセレクションで抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
【００５９】
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。元原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
【００６０】
さらに、図１０に示す様に、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、２つの輪郭線をひとまとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Ｐｉから別輪郭上で最短距離となる点Ｑｉまで線を引き、各距離ＰＱｉが平均的に一定長以下の場合、注目区間はＰＱｉ中点を点列として直線あるいは曲線で近似し、その太さはＰＱｉの平均値とする。線や線の集合体である表罫線は、前記のような太さを持つ線の集合として効率よくベクトル表現することができる。
【００６１】
尚、先にテキストブロックに対する文字認識処理を用いたベクトル化を説明したが、該文字認識処理の結果辞書からの距離が最も近い文字を認識結果として用いるが、この距離が所定値以上の場合は、必ずしも本来の文字に一致せず、形状が類似する文字に誤認識している場合が多い。従って本実施形態では、この様な文字に対しては、上記した様に、一般的な線画と同じに扱い、該文字をアウトライン化する。即ち従来文字認識処理で誤認識を起こす文字に対しても誤った文字にベクトル化されず、可視的にイメージデータに忠実なアウトライン化によるベクトル化が行える。
【００６２】
又、写真と判定されたブロックに対しては本実施形態では、ベクトル化を行なわず、イメージデータのままとする（なお、後述の検索において利用する特徴ベクトルは算出し、保持しておく）。
【００６３】
＜ファイル検索（Ｓ１２７）＞
次に、図２のステップＳ１２７で示すファイル検索処理の詳細について図４、図１１〜図１３を用いて説明する。
【００６４】
ファイル検索は、前述したブロックセレクション処理により分割され、ベクトル化された各ブロック情報を利用し検索を行う。具体的には、検索は、各ブロックの属性とファイル中のブロック座標情報との比較、すなわちレイアウトによる比較と、ファイル内の各ブロックの属性により異なる比較方法が適用されるブロック毎の内部情報比較とを複合した複合検索を用いる。
【００６５】
図１２は、図２のステップＳ１２６でベクトル化されたスキャン画像データ（入力ファイル）を、既にベクトル化されデータベース上に保存されてある画像データ（データベースファイル）と順次比較し、一致するファイルを検索する処理を示すフローチャートである。まず、マネージメントＰＣ１０１よりデータベースファイルへアクセスする（ステップＳ５０１）。入力ファイルの各ブロックとデータベースファイルの各ブロックを比較し、入力ファイルのブロック毎にデータベースファイルのブロックとの類似率を求める（ステップＳ５０２）。
【００６６】
図４、図１１及び図１３を用いてステップＳ５０２のブロック比較について詳説する。図４（ｂ）を入力ファイルとし図１１にデータベースファイルの例を示す。図１１のデータベースファイルの例では、ブロックＢ１’〜Ｂ１０’に分割されかつそれぞれがベクトル化処理されている。図１３は、入力ファイル中の一つのブロックをデータベースファイルのブロックと比較し、類似率を算出するフローチャートである。ブロック毎に類似率を算出する際、まず入力ファイルの該ブロックとレイアウト上一致すると推定されるデータベースファイルの対象ブロックを選出する。例えば、Ｂ１に対してはＢ１’が選出されるとし、また他の入力ブロックＢ２〜Ｂ９に対しては、Ｂ２’〜Ｂ９’が選出されるとする。この処理においては、入力ファイルの複数のブロックに対し、データベースファイルの対象ブロックが重複されて選出されてもよい。
【００６７】
次に、該ブロックと対象ブロックとのレイアウト情報の類似率を求める。ブロックの位置、サイズ、属性を比較し（ステップＳ５１２、Ｓ５１３、Ｓ５１４）、その誤差からレイアウトの類似率を求める。次にブロック内部の比較を行うが、ブロック内部を比較する際は同じ属性として比較するため、属性が異なる場合は片方のブロックを一致する属性へ再ベクトル化するなど前処理を行う。前処理により同じ属性として扱われる入力ファイルのブロックとデータベースファイルの対象ブロックは、ブロックの内部比較を行う（ステップＳ５１５）。
【００６８】
ブロック内部比較では、ブロックの属性に最適な比較手法をとるため、属性によりその比較手法は異なる。例えば、前述したブロックセレクション処理により、ブロックはテキスト（ＴＥＸＴ）、写真（ＰＨＯＴＯ）、表（ＴＡＢＬＥ）、線画（ＬＩＮＥＡＲＴ）、線（ＬＩＮＥ）などの属性に分割される。テキストブロックを比較する場合は、ベクトル化処理により文字コード、フォントが判別されているため、各文字の一致度からその文章の類似度を算出し、ブロック内部の類似率が算出される。また、写真画像ブロックでは、画像より抽出される特徴ベクトルを特徴空間上の誤差より類似率が算出される。ここでいう特徴ベクトルとは、色ヒストグラムや色モーメントのような色に関する特徴量、共起行列、コントラスト、エントロピ、ＧａＢｏｒ変換等で表現されるテクスチャ特徴量、フーリエ記述子等の形状特徴量など複数挙げられ、このような複数の特徴量のうち最適な組み合わせを用いる。また、線画ブロックはベクトル化処理によりアウトライン線、もしくは罫線、曲線の集合として表現されるため、線画ブロックでは各線の始点、終点の位置、曲率などの誤差を算出することにより線画の類似度が算出される。また、表ブロックでは、表の格子数、各枠子のサイズ、各格子内のテキスト類似度などを算出することにより、表ブロック全体の類似率が算出できる。
【００６９】
以上より、ブロック位置、サイズ、属性、ブロック内部の類似率を算出し、各類似率を合計することで入力ファイルの該ブロックに対しその類似率を算出することが可能であり、該ブロック類似率を記録する。入力ファイルのブロック全てについて、一連の処理を繰り返す。求められたブロック類似率は、全て統合することで、入力ファイルの類似率を求める（ステップＳ５０３）。統合処理について説明する。図４（ｂ）の入力ファイルのブロックＢ１〜Ｂ９に対し、ブロック毎の類似率がｎ１〜ｎ９と算出されたとする。このときファイル全体の総合類似率Ｎは、以下の式、
Ｎ＝ｗ１＊ｎ１＋ｗ２＊ｎ２＋ｗ３＊ｎ３＋…＋ｗ９＊ｎ９＋γ …（１）
で表現される。
【００７０】
ここで、ｗ１〜ｗ９は、各ブロックの類似率を評価する重み係数である。γは補正項であり、例えば、図１１のデータベースファイルの入力ファイルに対する対象ブロックとして選出されなかったブロックＢ１０’の評価値などとする。また，重み係数ｗ１〜ｗ９は、ブロックのファイル内占有率により求める。例えばブロックｎのサイズをＳｎとすると、ブロックｋの占有率ｗｋは、
ｗｋ＝Ｓｋ／ΣＳｎ（ｎ＝１〜９） …（２）
として算出できる。このような占有率を用いた重み付け処理により、ファイル内で大きな領域を占めるブロックの類似率がよりファイル全体の類似率に反映されるようになる。
【００７１】
以上の計算の結果、類似率が閾値Ｔｈより高いデータベースファイルを候補として（ステップＳ５０５）保存し、これをサムネイル等で表示（ステップＳ１２８）する。複数の中から操作者の選択が必要なら操作者の入力操作よってファイルの特定を行う。そして、以上の処理をデータベース内の全ファイルについて実行する（ステップＳ５０６）。
【００７２】
＜アプリデータへの変換処理（Ｓ１３０）＞
次に、ステップＳ１３０におけるアプリデータへの変換処理について、図１４〜図１７を参照して説明する。
【００７３】
一頁分のイメージデータをブロックセレクション処理（ステップＳ１２１）し、ベクトル化処理（ステップＳ１２９）した結果は図１４に示す様な中間データ形式のファイルとして変換されている。このようなデータ形式はドキュメント・アナリシス・アウトプット・フォーマット（ＤＡＯＦ）と呼ばれる。
【００７４】
図１４はＤＡＯＦのデータ構造を示す図である。図１４において、７９１はＨｅａｄｅｒであり、処理対象の文書画像データに関する情報が保持される。レイアウト記述データ部７９２では、文書画像データ中のＴＥＸＴ（文字）、ＴＩＴＬＥ（タイトル）、ＣＡＰＴＩＯＮ（キャプション）、ＬＩＮＥＡＲＴ（線画）、ＰＨＯＴＯ（写真）、ＦＲＡＭＥ（枠表の一部（部分集合））、ＴＡＢＬＥ（表）等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。文字認識記述データ部７９３では、ＴＥＸＴ、ＴＩＴＬＥ、ＣＡＰＴＩＯＮ（ＴＩＴＬＥ、ＣＡＰＴＩＯＮはテキストの一部）等のＴＥＸＴブロックを文字認識して得られる文字認識結果を保持する。表記述データ部７９４では、ＴＡＢＬＥブロックの構造の詳細を格納する。画像記述データ部７９５は、ＰＩＣＴＵＲＥやＬＩＮＥＡＲＴ等のブロックのイメージデータを文書画像データから切り出して保持する。
【００７５】
このようなＤＡＯＦは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクトを再利用することは出来ない。そこで、次にこのＤＡＯＦからアプリデータに変換する処理（ステップＳ１３０）について詳説する。
【００７６】
図１５は、本実施形態によるアプリデータ作成の処理の全体の概略フローである。ステップＳ８０００はＤＡＯＦデータの入力を行う。ステップＳ８００２ではアプリデータの元となる文書構造ツリーを生成する。ステップＳ８００４では、文書構造ツリーを元に、ＤＡＯＦ内の実データを流し込み、実際のアプリデータを生成する。
【００７７】
図１６は、ステップＳ８００２における文書構造ツリー生成の詳細フローを示し、図１７は、文書構造ツリーの例を示す図である。全体制御の基本ルールとして、処理の流れはミクロブロック（単一ブロック）からマクロブロック（ブロックの集合体）へ移行する。なお、以後、ブロックとは、ミクロブロック、及びマクロブロック全体を指す。
【００７８】
ステップＳ８１００は、ブロック単位で縦方向の関連性を元に再グループ化する。スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近い、ブロック幅（横方向の場合は高さ）がほぼ同一であることなどで定義することができる。また、距離、幅、高さなどの情報はＤＡＯＦを参照し、抽出する。
【００７９】
図１７（ａ）は実際のページ構成、（ｂ）はその文書構造ツリーである。ステップＳ８１００の結果、Ｔ３、Ｔ４、Ｔ５を含む一つのグループＶ１と、Ｔ６、Ｔ７を含む一つのグループＶ２が同じ階層のグループとしてまず生成される。ステップＳ８１０２では、縦方向のセパレータの有無をチェックする。セパレータは、例えば物理的にはＤＡＯＦ中でライン属性を持つオブジェクトである。また論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。ステップＳ８１０４では、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、縦方向のグループ長がページ高さとなっている場合は、文書構造ツリー生成は終了する。
【００８０】
図１７の場合は、セパレータもなく、グループ高さはページ高さではないのでステップＳ８１０６に進む。
【００８１】
ステップＳ８１０６では、ブロック単位で横方向の関連性を元に再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。関連性、及びその判定情報の定義は、縦方向の場合と同じである。
【００８２】
図１７の場合は、Ｔ１，Ｔ２でＨ１、Ｖ１，Ｖ２でＨ２、がＶ１，Ｖ２の１つ上の同じ階層のグループとして生成される。
【００８３】
ステップＳ８１０８は、横方向セパレータの有無をチェックする。図１７では、Ｓ１があるので、これをツリーに登録し、Ｈ１、Ｓ１、Ｈ２という階層が生成される。ステップＳ８１１０は、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、横方向のグループ長がページ幅となっている場合は、文書構造ツリー生成は終了する。そうでない場合は、ステップＳ８１０２に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。
【００８４】
図１７の場合は、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のＶ０が文書構造ツリーに付加される。文書構造ツリーが完成した後、その情報を元にステップＳ８００４においてアプリデータの生成を行う。図１７の場合は、具体的には、以下のようになる。
【００８５】
すなわち、Ｈ１は横方向に２つのブロックＴ１とＴ２があるので、２カラムとし、Ｔ１の内部情報（ＤＡＯＦを参照、文字認識結果の文章、画像など）を出力後、カラムを変え、Ｔ２の内部情報を出力し、その後Ｓ１を出力する。Ｈ２は横方向に２つのブロックＶ１とＶ２があるので、２カラムとして出力、Ｖ１はＴ３、Ｔ４、Ｔ５の順にその内部情報を出力、その後カラムを変え、Ｖ２のＴ６、Ｔ７の内部情報を出力する。以上によりアプリデータへの変換処理が行える。
【００８６】
＜ポインター情報の付加（Ｓ１３５）＞
次に、ステップＳ１３５で示す、ポインター情報付加処理について図１８を参照して説明する。
【００８７】
今、処理すべき文書が検索処理で特定された場合、あるいはベクトル化によって元ファイルが再生できた場合において、該文書を記録処理する場合においては、紙への記録の際にポインター情報を付与する事で、この文書を用いて再度各種処理を行う場合に簡単に元ファイルデータを取得できる。
【００８８】
図１８はポインター情報としてのデータ文字列を２次元バーコード（ＱＲコードシンボル：ＪＩＳＸ０５１０）３１１にて符号化して画像中に付加する過程を示すフローチャートである。
【００８９】
２次元バーコード内に組み込むデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバ名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのＵＲＬや、対応するファイルの格納されているデータベース１０５内あるいはＭＦＰ１００自体が有する記憶装置内で管理されるファイルＩＤ等で構成される。
【００９０】
まず、符号化する種種の異なる文字を識別するため、入力データ列を分析する。また、誤り検出及び誤り訂正レベルを選択し、入力データが収容できる最小型番を選択する。（ステップＳ９００）。次に、入力データ列を所定のビット列に変換し、必要に応じてデータのモード（数字、英数字、８ビットバイト、漢字等）を表す指示子や、終端パターンを付加する。さらに所定のビットコード語に変換する（ステップＳ９０１）。この時、誤り訂正を行うため、コード語列を型番および誤り訂正レベルに応じて所定のブロック数に分割し、各ブロック毎に誤り訂正コード語を生成し、データコード語列の後に付加する（ステップＳ９０２）。
【００９１】
該ステップＳ９０２で得られた各ブロックのデータコード語を接続し、各ブロックの誤り訂正コード語、必要に応じて剰余コード語を後続する。（ステップＳ９０３）。次に、マトリクスに位置検出パターン、分離パターン、タイミングパターンおよび位置合わせパターン等とともにコード語モジュールを配置する。（ステップＳ９０４）。更に、シンボルの符号化領域に対して最適なマスクパターンを選択して、マスク処理パターンをステップＳ９０４で得られたモジュールにＸＯＲ演算により変換する（ステップＳ９０５）。最後に、ステップＳ９０５で得られたモジュールに形式情報および型番情報を生成して、２次元コードシンボルを完成する（ステップＳ９０６）。
【００９２】
上記に説明した、アドレス情報の組み込まれた２次元バーコードは、例えば、クライアントＰＣ１０２から電子ファイルをプリントデータとして記録装置１１２に紙上に記録画像として形成する場合に、データ処理装置１１５内で記録可能なラスターデータに変換された後にラスターデータ上の所定の個所に付加されて画像形成される。ここで画像形成された紙を配布されたユーザーは、画像読取り部１１０で読み取ることにより、前述したステップＳ１２３にてポインター情報からオリジナル電子ファイルの格納場所を検出することができる。
【００９３】
尚、同様の目的で付加情報を付与する手段は、本実施形態で説明した２次元バーコードの他に、例えば、ポインター情報を直接文字列で文書に付加する方法、文書内の文字列、特に文字と文字の間隔を変調して情報を埋め込む方法、文書中の中間調画像中に埋め込む方法等、一般に電子透かしと呼ばれる方法が適用出来る。
【００９４】
＜ファイルアクセス権に関する別実施形態＞
文書ファイルの中には、第３者による再利用を制限すべきものがある。先の実施形態ではファイルサーバに蓄積されたファイルは全て自由にアクセス出来、ファイル全体、或いはその一部のオブジェクトは全て再利用が可能な事を前提に説明した。そこで、先の実施形態でポインター情報からファイルを検索した際に、検索の結果特定出来たファイルにアクセス権の制限が有る場合についての別実施形態を図８を用いて説明する。ステップＳ４０３までは先の実施形態と同様の為説明は省略する。
【００９５】
ファイルが特定された場合、ファイルサーバはそのファイルのアクセス権情報を調べ、アクセス制限がある場合（ステップＳ４０４）には、ＭＦＰ１００に対してパスワードの送信を要求する（ステップＳ４０５）。ＭＦＰ１００は操作者に対してパスワードの入力を促し、入力されたパスワードをファイルサーバに送信する（ステップＳ４０６）。ファイルサーバは送信されたパスワードを照合し（ステップＳ４０７）、一致した場合には図３で説明した様に、ファイルのアドレスを通知（ステップＳ１３４）すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、ＭＦＰに対してファイルを転送する（ステップＳ４０８）。
【００９６】
尚、アクセス権の制御を行う為の認証の方法は、ステップＳ４０５、４０６に示したパスワードによる方法に限定されず、例えば指紋認証等の一般に広く用いられている生体認証、カードによる認証等全ての認証手段を用いることが出来る。
【００９７】
又、本別実施形態例では紙文書に付加的に付与されたポインター情報によりファイルを特定した場合の実施形態を示したが、図３のステップＳ１２６〜Ｓ１２８で示す所謂検索処理でファイルを特定した場合においても同様の制御が可能である。
【００９８】
一方、ファイルサーバ内からファイルを特定出来なかった場合、即ち図３のステップＳ１２９〜Ｓ１３２で説明したベクトル化処理に対しても制限を加えることが出来る。即ち、紙文書を走査して得られたイメージ情報から該文書に対してのアクセス権の制限の存在を検出した場合には、認証確認が取れた場合のみベクトル化処理を行うことで、機密性の高い文書の使用に制限をかけることが出来る。
【００９９】
＜ファイル検索における別実施形態（その１）＞
先の実施形態では、ファイル検索において、入力ファイルとデータベースファイルを比較する際、全ての入力ファイルの全てのブロックについて、レイアウト情報とブロックの内部情報の比較を行った。しかし、ブロック内部情報の比較を行わずともレイアウトの情報を比較した段階である程度ファイルを選別することが可能である。すなわち、入力ファイルとレイアウトが全く異なるデータベースファイルはブロック内部情報の比較処理を省くことが可能である。
【０１００】
図１９にレイアウト情報によるファイル選別を実施した際のフローチャートである。まず、入力ファイルの全てのブロックに対し、位置、サイズ、属性の比較を行い、その類似率を求め、ファイル全体のレイアウト類似率を求める（ステップＳ５２２）。レイアウト類似率が閾値より低い場合は、ブロック内部情報比較は行わない（ステップＳ５２３）。閾値より高い場合、つまりレイアウトが似ている場合のみ、ブロック内部情報の比較（ステップＳ５２４）を行い、先に求めたレイアウト類似率とブロック内部の類似率より、ファイル全体の総合類似率が求まる（ステップＳ５２５）。ブロック毎の類似率からの総合類似率の求める手法は、図１２のステップＳ５０３と同様の処理であり、説明を省略する。該類似率が閾値以上のファイルに関しては候補として保存する（ステップＳ５２６）。以上の処理をデータベースの全ファイルについて行なう（ステップＳ５２７）。ブロック内部情報の類似率を求める処理は特に写真ブロックの一致を調べるときなど、一般的に重い処理となる。よって、レイアウトである程度ファイルを絞り込むことで、検索処理量の軽減、処理の高速化が行え、効率よく所望のファイルを検索できる。
【０１０１】
＜ファイル検索における別実施形態（その２）＞
また、先の実施形態は全て、ファイル検索に関してはユーザが何も指定せずに検索を施した場合の検索処理実施形態である。しかし、ユーザに文書内の特徴となる部分（ブロックセレクションより求められるブロック）、を指定させる、もしくは無駄なブロックを省く、または文書内の特徴を指定させることで、ファイル検索をより最適化することが可能になる。
【０１０２】
図２０は検索時、ユーザによる検索オプション指定のユーザインタフェース画面（１００１）の例を示す図である。入力ファイルはブロックセレクション処理により、複数のブロックに分割されており、入力画面にはファイル上のテキスト、写真、表、線画など各ブロックがサムネイルとなり表示される（１０１１〜１０１７）。
【０１０３】
ユーザは表示されたブロック中から、特徴となるブロックを選択する。上述のようにタッチパネルで構成されているので、所望のブロックの位置に触れることでブロックを選択できる。このとき選択するブロックは複数であってもよい。例として、ブロック１０１４を選択したとする。ブロック１０１４が選択された状態で、「重視」ボタン１００２を押すと、よりブロック１０１４を重視した検索処理を行うようにする。重視した検索とは、例えば、ブロック毎の類似率からファイル全体の類似率を求める演算式（１）の指定されたブロック１０１４の重み係数を大きくし、選択外のブロックの重み係数を小さくするようにするということで実現できる。複数回「重視」ボタン１００２を押せば、選択されたブロックの重み係数を大きくし、よりブロックを重視した検索が行える。
【０１０４】
また、「除外」ボタン１００３を押せば、選択されたブロック１０１４を省いた状態で検索処理を施す。ブロックが誤って認識された場合などには、無駄な検索処理を省略し、かつ誤った検索処理を防止できる。また、「詳細設定」ボタン１００４によりブロックの属性の変更を実現可能とし、ブロックセレクション（ステップＳ１２１）での誤って属性を認識した場合でもユーザが修正することで、正確な検索できる。また、「詳細設定」ボタン１００５では、ユーザにより、ブロックの検索優先する重みを細かく調節可能とする。このように、検索する際、ユーザが特徴となるブロックを指定、設定させることで、検索の最適化が行える。
【０１０５】
一方、ファイルによっては、レイアウトが特殊な場合も考えられる。このようなファイルに関しては、図２０の「レイアウト優先」ボタン１００５を選択することにより、レイアウトを重視したファイル検索を可能とする。この場合、レイアウトの類似率の結果をより重視するように、重み付けすることで実現する。また、「テキスト優先」ボタン１００６では、テキストブロックのみの検索を実行し、処理の軽減を図れる。
【０１０６】
このように、ユーザに画像の特徴を選択させることで、ファイルの特徴を重視した検索が行える。また、ユーザという人為的手段を信頼する、すなわちユーザ指定により重みを変更する際に、それに伴い変更された重みが閾値以下になる選択外ブロックを検索処理しないなどの制限を加えれば、ユーザの簡単な操作で、無駄なブロックの検索処理を大幅に削減できることも可能である。
【０１０７】
〈第２実施形態〉
次に第２実施形態について図２３、図２４を用いて説明する。上述の第１実施形態では「原本出力」を行なうか「原稿出力」を行なうかを選択した。第２実施形態では更にデータベースへの原本登録の実行を設定可能とし、より細かいユーザ設定に対応する。なお、図２４において図３と同じ処理には同一のステップ番号を付してある。
【０１０８】
ステップＳ２１２１では、図２３のようなユーザインタフェースで設定された設定内容を判定する。ここで、原稿出力（原本登録しない）１１６ｃが設定されている場合にはステップＳ１３６へ処理を進め、その他の場合はステップＳ１２１へ処理を進める。また、ステップＳ２１２３では、ステップＳ２１２０で得られたイメージ情報に基づく新たな電子ファイルを登録するか否かを判定する。ステップＳ２１２３は図３で上述したステップＳ１２９の判定／分岐に加えて、原本登録１１６ｄ或いは原稿出力（原本登録する）１１６ｅが設定されている場合には、ステップＳ１３０へ処理を分岐させる。ステップＳ２１２４では、上述のステップＳ１３４による判定／分岐に加えて、原稿出力（原本登録する）１１６ｅが設定されている場合にはステップＳ１３６へ処理を進める。この場合、出力対象のデータはステップＳ２１２０で取得したイメージデータとなる。また、図示していないが、原本登録１１６ｄが設定されていた場合には、ステップＳ１３６もスキップしてそのまま本処理を終了する。
【０１０９】
以上のような、ステップＳ２１２１、Ｓ２１２３、Ｓ２１２４の判定／分岐処理により、以下のような処理が実現される。まず、ＭＦＰ１００の画像読み取り部１１０を動作させ１枚の原稿をラスター状に走査し、イメージ情報入力処理ステップＳ２１２０で６００ＤＰＩ−８ビットの画像信号を得る。該画像信号をデータ処理部１１５で前処理を施し記憶装置１１１に１ページ分の画像データとして保存する。
【０１１０】
次に、図２３のようなユーザインタフェースで原本出力１１６ａが設定されていた場合は、ステップＳ２１２０で画像を入力した後、ステップＳ２１２１からステップＳ１２１へ進み、上記第１実施形態で説明した処理を実行する。原稿出力（原本登録しない）１１６ｃが設定されていた場合は、第１実施形態の原稿出力１１６ｂと同様の処理が実行される。すなわち、ステップＳ２１２０で入力した画像をそのまま、画像の編集／蓄積／伝達／記録に出力する（ステップＳ２１２１〜Ｓ１３６）。原稿出力（原本登録する）１１６ｅが設定されていた場合は、ステップＳ１２１〜Ｓ１３３の処理を実行し、ステップＳ２１２４からステップＳ１３６へ進み、ステップＳ２１２０で読み取った画像データを出力する。
【０１１１】
原本登録１１６ｄが設定されていた場合は、ステップＳ１２１〜Ｓ１３３が実行され、そのまま本処理を終了させる。
【０１１２】
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ（またはＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【０１１３】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【０１１４】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク，ハードディスク，光ディスク，光磁気ディスク，ＣＤ−ＲＯＭ，ＣＤ−Ｒ，磁気テープ，不揮発性のメモリカード，ＲＯＭなどを用いることができる。
【０１１５】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているＯＳ（オペレーティングシステム）などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【０１１６】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【発明の効果】
以上詳述したように本発明によれば、画像処理システムにおいて、ユーザの希望の処理をあらかじめ設定することで、文書の加工、蓄積、伝送、記録等を行うユーザの操作性を大幅に向上させることが可能になる。
【図面の簡単な説明】
【図１】本発明の実施形態に係るシステムの構成を示すブロック図である。
【図２】本発明の実施形態に係るＭＦＰの構成を示すブロック図である。
【図３】本発明の実施形態に係る原本処理手順を示すフローチャートである。
【図４】本発明の実施形態に係るブロックセレクション処理の実施形態である。
【図５】本発明の実施形態に係るポインター情報の検出手順を示すフローチャートである。
【図６】本発明の実施形態に係るブロック情報である。
【図７】本発明の実施形態に係るポインター情報によるファイル検索手順を示すフローチャートである。
【図８】本発明のファイルアクセス権に関する別実施形態の処理手順を示すフローチャートである。
【図９】本発明の実施形態に係るベクトル化例を示す図である。
【図１０】本発明の実施形態に係るベクトル化例を示す図である。
【図１１】ブロック例を示す図である。
【図１２】ファイル検索処理の処理手順を示すフローチャートである。
【図１３】ファイル検索処理のブロック比較処理手順を示すフローチャートである。
【図１４】ＤＡＯＦ例を示す図である。
【図１５】アプリデータ変換処理手順を示すフローチャートである。
【図１６】文書構造ツリー生成処理手順を示すフローチャートである。
【図１７】文書構造ツリー説明図である。
【図１８】バーコード付加処理手順を示すフローチャートである。
【図１９】レイアウト情報によるファイル選別処理手順を示すフローチャートである。
【図２０】ユーザインタフェース画面の例を示す図である。
【図２１】ユーザインタフェース画面の例を示す図である。
【図２２】図２１のユーザインターフェースを用いた設定内容に基づいて処理を切り換える様子を説明するフローチャートである。
【図２３】ユーザインタフェース画面の他の例を示す図である。
【図２４】図２３のユーザインターフェースを用いた設定内容に基づいて処理を切り換える様子を説明するフローチャートである。

Claims

複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法であって、
第１の動作モードもしくは第２の動作モードを設定する設定工程と、
原稿を光学的に読み取って画像信号を入力する画像入力工程と、
前記設定工程で前記第１の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号をそのまま出力する第１出力工程と、
前記設定工程で前記第２の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号に基づいて前記記憶手段を検索する検索工程と、
前記検索工程で得られた電子ファイルを出力する第２出力工程とを備えることを特徴とする画像処理方法。
前記画像入力工程で得られた画像信号に基づいて電子ファイルを生成する生成工程と、
前記生成工程で生成された電子ファイルを登録する登録工程とを更に備えることを特徴とする請求項１に記載の画像処理方法。
前記生成工程及び前記登録工程は、前記検索工程において対応する電子ファイルが取得できなかった場合に実行されることを特徴とする請求項２に記載の画像処理方法。
前記設定工程は、前記第１モードの実行とともに前記生成工程及び前記登録工程を実行するか否かの指示を含むことを特徴とする請求項１に記載の画像処理方法。
複数の画像や電子データを保持する記憶手段へのアクセスが可能な画像処理装置であって、
第１の動作モードもしくは第２の動作モードを設定する設定手段と、
原稿を光学的に読み取って画像信号を入力する画像入力手段と、
前記設定手段で前記第１の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号をそのまま出力する第１出力手段と、
前記設定手段で前記第２の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号に基づいて前記記憶手段を検索する検索手段と、
前記検索手段で得られた電子ファイルを出力する第２出力手段とを備えることを特徴とする画像処理装置。
前記画像入力手段で得られた画像信号に基づいて電子ファイルを生成する生成手段と、
前記生成手段で生成された電子ファイルを登録する登録手段とを更に備えることを特徴とする請求項５に記載の画像処理装置。
前記生成手段及び前記登録手段は、前記検索手段において対応する電子ファイルが取得できなかった場合に実行されることを特徴とする請求項６に記載の画像処理装置。
前記設定手段は、前記第１モードの実行とともに前記生成手段及び前記登録手段を実行するか否かの指示を含むことを特徴とする請求項５に記載の画像処理装置。
請求項１乃至４のいずれかに記載の画像処理方法をコンピュータに実行させるための制御プログラム。
請求項１乃至４のいずれかに記載の画像処理方法をコンピュータに実行させるための制御プログラムを格納する記憶媒体。