JP2004334340A - 画像処理方法及び装置 - Google Patents
画像処理方法及び装置 Download PDFInfo
- Publication number
- JP2004334340A JP2004334340A JP2003125819A JP2003125819A JP2004334340A JP 2004334340 A JP2004334340 A JP 2004334340A JP 2003125819 A JP2003125819 A JP 2003125819A JP 2003125819 A JP2003125819 A JP 2003125819A JP 2004334340 A JP2004334340 A JP 2004334340A
- Authority
- JP
- Japan
- Prior art keywords
- image
- file
- block
- unit
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】画像処理システムにおいて、ユーザの希望の処理をあらかじめ設定することで、文書の加工、蓄積、伝送、記録等を行うユーザの操作性を大幅に向上させる。
【解決手段】複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法において、「原稿出力」もしくは「原本出力」の何れかを設定可能とする。スタートキーの操作により、原稿を光学的に読み取って画像信号を入力し(S2001)、「原稿出力」が設定されていた場合は上記読み取った画像信号をそのまま出力し(S2002,S2004)、「原本出力」が設定されていた場合は、上記読み取った画像信号に基づいて記憶手段より対応する電子ファイルを検索し、これを出力する(S2002〜S2004)。
【選択図】 図22
【解決手段】複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法において、「原稿出力」もしくは「原本出力」の何れかを設定可能とする。スタートキーの操作により、原稿を光学的に読み取って画像信号を入力し(S2001)、「原稿出力」が設定されていた場合は上記読み取った画像信号をそのまま出力し(S2002,S2004)、「原本出力」が設定されていた場合は、上記読み取った画像信号に基づいて記憶手段より対応する電子ファイルを検索し、これを出力する(S2002〜S2004)。
【選択図】 図22
Description
【0001】
【発明の属する技術分野】
本願発明は、光学的に原稿画像を読み取って得られた画像データを処理する画像処理技術に関する。
【0002】
【従来の技術】
近年、環境問題が叫ばれる中、オフィスでのペーパーレス化が急速に進んでいる。このような中、バインダー等で蓄積された紙文書、あるいは配付資料等をスキャナで読み取り、オリジナルの検索、あるいはオリジナルが存在しない場合は、所定のフォーマットに変換して画像記憶装置にデータベースとして蓄積するような文書管理システムが提案されている。この種のシステムにおいては、オリジナル文書は、テキスト、写真、線画など属性ごとにベクトル化されて保存されている。そこで、スキャナ読み取り画像からオリジナルの文書を検索する際には、スキャナ読み取り画像をテキスト、写真、線画などの属性ごとにベクトル化し、保存文書との間でテキストの一致度、写真画像一致度、線画一致度、そして各属性のレイアウト情報を用いたレイアウト一致度などを算出する。すなわち、これら複数の一致度を総合的に判断する複合検索によってオリジナル文書を特定できるのが大きな特徴である。
【0003】
例えば、この種の文書検索装置は特許文献1によって提案されている。特許文献1に記載された文書検索装置は、原稿をスキャンし、スキャンされた原稿から文字認識された文字列をユーザが指定して検索することにより、内容及び位置関係が一致する文書を検索する。
【0004】
【特許文献1】
特開平3−263512号公報
【0005】
【発明が解決しようとする課題】
しかしながら、スキャンした紙文書がオリジナル文書のデータベースに存在しないことがあらかじめわかっているような場合に、データベースの検索を行なうことは無駄な処理である。また、オリジナル文書のデータベースに登録する必要のないメモのコピーなどの場合に当該画像をデータベースに登録してしまうのは、無駄な処理時間を費やすとともに、メモリの浪費でもある。
【0006】
このような不具合を避けるためには、操作の都度これから行なう処理を指定する必要があるが、これはユーザにとって非常に煩わしい操作である。
【0007】
本発明は上記の課題に鑑みてなされたものであり、原稿画像の読み取りにおいてユーザの意図通りの処理を簡易な操作で実行可能とすることを目的とする。
【0008】
【課題を解決するための手段】
上記の目的を達成するための本発明による画像処理方法は、
複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法であって、
第1の動作モードもしくは第2の動作モードを設定する設定工程と、
原稿を光学的に読み取って画像信号を入力する画像入力工程と、
前記設定工程で前記第1の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号をそのまま出力する第1出力工程と、
前記設定工程で前記第2の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号に基づいて前記記憶手段を検索する検索工程と、
前記検索工程で得られた電子ファイルを出力する第2出力工程とを備える。
【0009】
また、上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。すなわち、
複数の画像や電子データを保持する記憶手段へのアクセスが可能な画像処理装置であって、
第1の動作モードもしくは第2の動作モードを設定する設定手段と、
原稿を光学的に読み取って画像信号を入力する画像入力手段と、
前記設定手段で前記第1の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号をそのまま出力する第1出力手段と、
前記設定手段で前記第2の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号に基づいて前記記憶手段を検索する検索手段と、
前記検索手段で得られた電子ファイルを出力する第2出力手段とを備える。
【0010】
【発明の実施形態】
以下、添付の図面を参照して本発明の好適な実施形態について説明する。
【0011】
〈第1実施形態〉
[システムの概要]
図1は本実施形態による画像処理システム構成例を示すブロック図である。この画像処理システムは、オフィス10とオフィス20とをインターネット104で接続された環境で実現する。オフィス10内に構築されたLAN107には、MFP100、MFP100を制御するマネージメントPC101、クライアントPC(外部記憶手段)102、文書管理サーバ106、そのデータベース105、およびプロキシサーバ103が接続されている。また、オフィス20内に構築されたLAN208には、文書管理サーバ206、そのデータベース205およびプロキシサーバ203が接続されている。オフィス10内のLAN107及びオフィス20内のLAN208はそれぞれプロキシサーバ103及び203を介してインターネット104に接続される。
【0012】
MFP100は本実施形態において紙文書の画像読み取りと、読み取った画像信号に対する画像処理の一部を担当する。画像信号はケーブル109を介してマネージメントPC101に入力する(LAN107を介してもよい)。マネージメントPC101は通常のPC(パーソナルコンピュータ)であり、画像記憶手段としてのメモリ、画像処理手段としてのCPUやソフトウエア、表示手段としてのCRT或いはLCD、入力手段としてのキーボードやポインティングデバイスを有するが、その一部をMFP100に一体化して構成されている。例えば、PCの一部であるLCDがMFPに一体化されて実装される。
【0013】
図2はMFP100の構成図である。図2においてオートドキュメントフィーダ(以降ADFと記す)を含む画像読み取り部110は、束状の或いは1枚の原稿画像を図示しない光源で照射し、原稿反射像を固体撮像素子上に結像させ、固体撮像素子からラスター状の画像読み取り信号を600DPIの密度のイメージ情報として得る。通常の複写機能はこの画像信号をデータ処理部115で画像処理して記録信号へ変換し、複数枚複写の場合は記録装置111に一旦一ページ分の記録データを記憶保持した後、記録装置112に順次出力することで紙上に画像を形成する。
【0014】
一方クライアントPC102から出力されるプリントデータはLAN107からネットワークIF114を経てデータ処理装置115に入力される。ここでプリントデータは記録可能なラスターデータに変換された後、記録装置112によって紙上に記録画像として形成される。
【0015】
MFP100への操作者の指示はMFP100に装備された操作キーを含む入力装置113から、或いはマネージメントPC101の入力装置であるキーボード及びマウスから行われる。一方 操作入力の状態表示及び処理中の画像データの表示は表示装置116で行われる。尚、記憶装置111はマネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの授受及び制御はネットワークIF117および直結した通信手段(ケーブル109)を介して行われる。
【0016】
以上の一連の動作はデータ処理装置115内の図示しない制御部で制御される。
【0017】
[処理概要]
次に本実施形態によるMFP100の処理動作の概要を図21及び図22を用いて説明する。
【0018】
図21は本実施形態によるMFP100のユーザインターフェース部を示す図であり、入力装置113と表示装置116の具体例が示されている。表示装置116上には入力装置113の一部としてのタッチパネルが設けられている。図21の状態では「原本出力」ボタン116aと「原稿出力」ボタン116bの操作が可能な処理設定画面が表示されている。ユーザは所定の操作によってこのような処理設定画面を表示させ、例えばSTARTキー113aを押したときの出力形態として原本出力か原稿出力のいずれかを指定することができる。なお、原稿出力とは画像読み取り部110で原稿を読み取って得られた画像データをそのまま出力するモードである。従って、例えばこのモードにおいて記録出力を行なえば、通常のコピー動作となる。また、原本出力とは、画像読み取り部110で原稿を読み取って得られた画像データに基づいてデータベース105等を検索し、得られた電子ファイル(読み取った画像に対応する電子ファイル)を出力するモードである。
【0019】
図22は本実施形態によるMFP100の概略の動作を説明するフローチャートである。まずステップS2001において、MFP100の画像読み取り部110を動作させ、1枚の原稿をラスター状に走査して600DPI−8ビットの画像信号を得る。次に、ステップS2002において、図21に示す処理設定画面において「原本出力」か「原稿出力」のいずれが設定されているかを判定する。
【0020】
原稿出力が設定されていると判定された場合はステップS2003をスキップしてステップS2004へ進み、ステップS2001で入力した画像をそのまま、画像編集/蓄積/伝達/記録等のために出力する。また、原本を検索する「原本出力」が設定されていた場合には、ステップS2003で原本処理を行なう。原本処理では、その詳細は後述するが、当該入力画像に対応する原本データをデータベース105等を検索して取得し、得られた原本データを画像編集/蓄積/伝達/記録等のために出力する。
【0021】
例えば原本画像がカラー画像であって、これに対応する原稿として白黒画像の原稿を持っていた場合、「原稿出力」がセットされた状態でSTARTキー113aを押せば通常通り白黒画像のコピー出力が得られるが、「原本出力」がセットされた状態でSTARTキー113aを押せばカラー画像の印刷出力(コピー)が得られるといったようにSTARTキーをカスタマイズできる。
【0022】
[原本処理概要]
次に本実施形態による原本処理(ステップS2003)の概要を図3を用いて説明する。
【0023】
原稿入力処理で入力した画像信号をデータ処理部115で前処理を施し記憶装置111に1ページ分の画像データとして保存する。マネージメントPC101のCPUは該格納された画像データについてブロックセレクション処理(BS処理)を実行し、まず文字/線画部分とハーフトーンの画像部分とに領域を分離する(ステップS121)。なお、文字部は更に段落で塊として纏まっているブロック毎に、或いは、線で構成された表、図形に分離し各々セグメント化する。一方、ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分、背景部等、所謂ブロック毎に独立したオブジェクトに分割する。
【0024】
このとき原稿画像中に付加情報として記録された2次元バーコード、或いはURLに該当するオブジェクトを検出し、URLを認識して当該原稿のオリジナルの電子ファイルが格納されている記憶装置(データベース105等)内のポインター情報を検出する(ステップS122、S123)。なお、URLが通常の文字で記述されている場合はこれをOCRで文字認識してURLを得る。或いはURLが2次元バーコードで記述されている場合には、該マークを解読して(OMR)URLを得る。
【0025】
尚、ポインター情報を付加する手段としては文字やバーコードに限られず、例えば文字と文字の間に情報を埋め込む方法、ハーフトーンの画像に埋め込む方法等、直接可視化されない所謂電子透かしによる方法等を用いてもよい。
【0026】
ポインター情報が検出された場合、処理はステップS125に分岐し、ポインターで示されたアドレスから元の電子ファイルを検索する。電子ファイルは図1においてクライアントPC102内のハードディスク内、或いはオフィス10或いは20のLAN107、208に接続された文書管理サーバ106内のデータベース107内、或いはMFP100自体が有する記憶装置111のいずれかに格納されている。そして、ステップS123で得られたアドレス情報に従ってこれらの記憶装置内を検索する。ステップS125で電子ファイルが見つからなかった場合、見つかったがPDFあるいはTIFFに代表される所謂イメージファイルであった場合、或いはポインター情報自体が存在しなかった場合はステップS126に進む。なお、ファイルの種類は拡張子により判断できる。
【0027】
ステップS126〜S128ではデータベース上のオリジナル電子ファイルを検索する。このため、まずステップS126において、原稿入力処理で入力した画像をベクトルデータへ変換する。ベクトル化処理(ステップS126)では、テキストブロックに対してOCRを施し、OCRされたテキストブロックに対しては、更に文字のサイズ、スタイル、字体が認識され、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線で構成される表、線画ブロックに対してはアウトライン化し、表など図形形状が認識できるものは、その形状を認識する。写真ブロックに対してはイメージデータとして個別のJPEGファイルとして処理する。以上のベクトル化処理はブロックセレクション処理によって得られた各オブジェクト毎に行う。
【0028】
以上のようにしてイメージをベクトル化したならば、ステップS127でデータベース105上の各ファイルとの類似度(ベクトルの類似度)を調べ、オリジナルを検索する。こうして、ステップS126により変換されたベクトルデータを用いて忠実にオリジナルファイルが検索される。より具体的には、オブジェクト毎に類似度を求め、オブジェクト毎の類似度をそのオブジェクトのファイル内占有率に応じてファイル全体の類似度へ反映させる。ファイル内で占めている割合の大きいオブジェクトの類似度が、ファイル全体の類似度へより大きく反映されるため、いかなるフォーマットのファイルにも適応的に対応することが可能である。
【0029】
以上のような検索処理の結果 類似度の高い電子ファイルが見つかった場合は、当該電子ファイルをサムネイル等で表示(ステップS128)する。複数の候補が見つかった場合は、複数のサムネイルが表示され、操作者の入力操作よってファイルが特定され、ステップS133でそのファイルの格納アドレスが通知される。尚、候補が1ファイルの場合は、自動的にステップS129からステップS133に分岐して検索されたファイルの格納アドレスを通知するようにしてもよい。一方、ステップS126の検索処理で電子ファイルが見つからなかった場合、或いは、見つかったがPDFあるいはTIFFに代表される所謂イメージファイルであった場合、処理はステップS129からステップS130に進む。
【0030】
これらのベクトル化処理は各オブジェクト毎に行い、更に各オブジェクトのレイアウト情報を保存して例えば、rtfに変換(ステップS130)して電子ファイルとして記憶装置111に格納(ステップS131)する。
【0031】
今、ベクトル化した原稿画像は以降同様の処理を行う際に直接電子ファイルとして検索出来るように、先ずステップS132において検索の為のインデックス情報を生成して検索用インデックスファイル(原本を検索するためのインデックスであり、全文検索インデックス或いは類似画像検索のインデックス等)に追加する。ステップS133では、生成した電子ファイルの格納アドレスを通知する。そして、ステップS134で、操作者が行いたい処理が記録であると判断されれば、ステップS135に分岐し、ポインター情報をイメージデータとしてファイルに付加する。なお、検索処理で電子ファイルが特定できた場合も同様である。すなわち、ステップS129からステップS133に分岐して格納アドレスを操作者に通知すると共に、紙に記録する場合にはポインター情報を電子ファイルに付加する。こうして、以降からは、その原稿のポインター情報によって直接電子ファイルを特定することが可能となる。
【0032】
尚、ステップS125でポインター情報から電子ファイルが特定できた場合、検索処理で電子ファイルが特定出来た場合、ベクトル化により電子ファイルに変換した場合には、ステップS133において該電子ファイルの格納アドレスが操作者に通知される。
【0033】
以上の処理によって得られた電子ファイル自体を用いて、例えば文書の加工、蓄積、伝送、記録をステップS136で行うことが可能になる。これらの処理はイメージデータを用いる場合に比べて情報量が削減され、蓄積効率が高まり、伝送時間が短縮され、又記録表示する際には高品位なデータとして非常に有利となる。以下各処理ブロックに対して詳細に説明する。
【0034】
<ブロックセレクション処理(S121)>
先ずステップS121で示すブロックセレクション処理について図4を参照して説明する。
【0035】
ブロックセレクション処理とは、画像読み取り部110によって光学的に原稿画像を読み取って得られた一頁のイメージデータ(例えば図4の(a))を各オブジェクト毎の塊として認識し、該ブロックの各々をテキスト/線画/写真/線/表等の属性に分類し、異なる属性を持つ領域に分割する(図4の(b))処理である。具体的には、本実施形態では以下の手順でブロックセレクション処理を実行する。
【0036】
先ず、入力画像を白黒に二値化し、輪郭線追跡をおこなって黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡をおこない白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
【0037】
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分をテキスト領域、扁平な画素塊を線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を線画領域、などとする。
【0038】
ブロックセレクション処理で得られた各ブロックに対するブロック情報の例を図4の(b)に示す。これらのブロック毎の情報は以降に説明するベクトル化、或いは検索の為の情報として用いる。
【0039】
<ポインター情報の検出(S122)>
次に、ステップS122で示す、ファイルの格納位置をイメージ情報から抽出する為のOCR/OMR処理について、図5及び図6を用いて説明する。
【0040】
図5は原稿画像中に付加された2次元バーコード(QRコードシンボル)を復号して、データ文字列を出力する過程を示すフローチャートである。また、図6は2次元バーコードの付加された原稿310の一例を示す。
【0041】
まず、データ処理装置115は、不図示のページメモリに格納された原稿310を表すイメージ画像を走査して、先に説明したブロックセレクション処理の結果から所定の2次元バーコードシンボル311の位置を検出する。QRコードの位置検出パターンは、シンボルの4隅のうちの3隅に配置される同一の位置検出要素パターンから構成される (ステップS300)。次に、位置検出パターンに隣接する形式情報を復元し、シンボルに適用されている誤り訂正レベルおよびマスクパターンを得る(ステップS301)。
【0042】
シンボルの型番を決定し(ステップS302)、形式情報で得られたマスクパターンを使って符号化領域ビットパターンをXOR演算することによってマスク処理を解除する(ステップS303)。モデルに対応する配置規則に従い、シンボルキャラクタを読み取り、メッセージのデータ及び誤り訂正コード語を復元する(ステップS304)。復元されたコード上に、誤りがあるかどうかの検出を行い(ステップS305)、誤りが検出された場合はステップS306に分岐してこれを訂正する。
【0043】
誤り訂正されたデータより、モード指示子および文字数指示子に基づいて、データコード語をセグメントに分割する(ステップS307)。最後に、仕様モードに基づいてデータ文字を復号し、結果を出力する(ステップS308)。
【0044】
尚、2次元バーコード内に組み込まれたデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバー名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのURLで構成される。
【0045】
また、本実施形態ではポインター情報が2次元バーコードを用いて付与された原稿310について説明したが、直接文字列でポインター情報が記録される場合は所定のルールに従った文字列のブロックを先のブロックセレクション処理で検出し、該ポインター情報を示す文字列の各文字を文字認識(OCR)することで、直接元ファイルのアドレス情報を得ることが可能である。
【0046】
或いは、図6の文書310のテキストブロック312、或いは313の文字列に対して隣接する文字と文字の間隔等に視認し難い程度の変調を加え、該文字間隔に情報を埋め込むことでもポインター情報を付与してもよい。このような、所謂透かし情報においては、後述する文字認識処理を行う際に各文字の間隔を測定することにより、ポインター情報を抽出することができる。また、写真314の中に電子透かしとしてポインター情報を付加することも可能である。
【0047】
<ポインター情報によるファイル検索(S125)>
次に、図3で先に説明したステップS125における、ポインター情報からの電子ファイルの検索について図7のフローチャートを使用して説明する。
【0048】
まず、ポインタ情報に含まれるアドレスに基づいて、ファイルサーバを特定する(ステップS400)。ここでファイルサーバとは、クライアントPC102や、データベース105を内蔵する文書管理サーバ106や、記憶装置111を内蔵するMFP100自身を指す。また、ここでアドレスとは、URLやサーバ名とファイル名からなるパス情報である。
【0049】
ファイルサーバが特定できたら、ファイルサーバに対してアドレスを転送する(ステップS401)。ファイルサーバはアドレスを受信すると、該当するファイルを検索する(ステップS402)。ファイルが存在しない場合(ステップS403でNO)には、MFP100に対してその旨通知する。一方、ファイルが存在した場合(ステップS403でYES)には、図3で説明した様に、当該ファイルのアドレスを通知(ステップS133)すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、MFP100に対してファイルを転送する(ステップS408)。
【0050】
<ベクトル化処理(S126)>
次にステップS126で示されるベクトル化について詳説する。ポインタ情報がない場合、或いはファイルサーバに元ファイルが存在しない場合は、読み込んだイメージデータをブロックセレクション処理で得られた各ブロック(オブジェクト)毎にベクトル化する。
【0051】
『文字認識』
テキストブロックに対しては各文字に対して文字認識処理を行う。
【0052】
文字認識部では、文字単位で切り出された画像に対し、パターンマッチの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には種々の公知手法があり、たとえば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
【0053】
ブロックセレクション(ステップS121)で抽出された文字領域に対して文字認識を行う場合は、まず該当領域に対し横書き、縦書きの判定をおこない、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことでおこなう。縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚この時文字のサイズが検出出来る。
【0054】
『フォント認識』
文字認識の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントが認識出来る。
【0055】
『文字のベクトル化』
前記文字認識およびフォント認識よって得られた、文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。なお、元原稿がカラーの場合はカラー画像から各文字の色を抽出してベクトルデータとともに記録する。
【0056】
以上の処理によりテキストブロックに属するイメージ情報をほぼ形状、大きさ、色に関して忠実なベクトルデータに変換出来る。
【0057】
『文字以外の部分のベクトル化』
ブロックセレクション処理(ステップS121)で、線画あるいは線、表領域とされた領域を対象に、中で抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図9に図示するように、任意点Piに対し左右k個の離れた点Pi−k,Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi−k,Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は3次スプライン関数などを用いてベクトル化することができる。
【0058】
また、対象が内輪郭を持つ場合、ブロックセレクションで抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
【0059】
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。元原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
【0060】
さらに、図10に示す様に、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、2つの輪郭線をひとまとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線あるいは曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記のような太さを持つ線の集合として効率よくベクトル表現することができる。
【0061】
尚、先にテキストブロックに対する文字認識処理を用いたベクトル化を説明したが、該文字認識処理の結果辞書からの距離が最も近い文字を認識結果として用いるが、この距離が所定値以上の場合は、必ずしも本来の文字に一致せず、形状が類似する文字に誤認識している場合が多い。従って本実施形態では、この様な文字に対しては、上記した様に、一般的な線画と同じに扱い、該文字をアウトライン化する。即ち従来文字認識処理で誤認識を起こす文字に対しても誤った文字にベクトル化されず、可視的にイメージデータに忠実なアウトライン化によるベクトル化が行える。
【0062】
又、写真と判定されたブロックに対しては本実施形態では、ベクトル化を行なわず、イメージデータのままとする(なお、後述の検索において利用する特徴ベクトルは算出し、保持しておく)。
【0063】
<ファイル検索(S127)>
次に、図2のステップS127で示すファイル検索処理の詳細について図4、図11〜図13を用いて説明する。
【0064】
ファイル検索は、前述したブロックセレクション処理により分割され、ベクトル化された各ブロック情報を利用し検索を行う。具体的には、検索は、各ブロックの属性とファイル中のブロック座標情報との比較、すなわちレイアウトによる比較と、ファイル内の各ブロックの属性により異なる比較方法が適用されるブロック毎の内部情報比較とを複合した複合検索を用いる。
【0065】
図12は、図2のステップS126でベクトル化されたスキャン画像データ(入力ファイル)を、既にベクトル化されデータベース上に保存されてある画像データ(データベースファイル)と順次比較し、一致するファイルを検索する処理を示すフローチャートである。まず、マネージメントPC101よりデータベースファイルへアクセスする(ステップS501)。入力ファイルの各ブロックとデータベースファイルの各ブロックを比較し、入力ファイルのブロック毎にデータベースファイルのブロックとの類似率を求める(ステップS502)。
【0066】
図4、図11及び図13を用いてステップS502のブロック比較について詳説する。図4(b)を入力ファイルとし図11にデータベースファイルの例を示す。図11のデータベースファイルの例では、ブロックB1’〜B10’に分割されかつそれぞれがベクトル化処理されている。図13は、入力ファイル中の一つのブロックをデータベースファイルのブロックと比較し、類似率を算出するフローチャートである。ブロック毎に類似率を算出する際、まず入力ファイルの該ブロックとレイアウト上一致すると推定されるデータベースファイルの対象ブロックを選出する。例えば、B1に対してはB1’が選出されるとし、また他の入力ブロックB2〜B9に対しては、B2’〜B9’が選出されるとする。この処理においては、入力ファイルの複数のブロックに対し、データベースファイルの対象ブロックが重複されて選出されてもよい。
【0067】
次に、該ブロックと対象ブロックとのレイアウト情報の類似率を求める。ブロックの位置、サイズ、属性を比較し(ステップS512、S513、S514)、その誤差からレイアウトの類似率を求める。次にブロック内部の比較を行うが、ブロック内部を比較する際は同じ属性として比較するため、属性が異なる場合は片方のブロックを一致する属性へ再ベクトル化するなど前処理を行う。前処理により同じ属性として扱われる入力ファイルのブロックとデータベースファイルの対象ブロックは、ブロックの内部比較を行う(ステップS515)。
【0068】
ブロック内部比較では、ブロックの属性に最適な比較手法をとるため、属性によりその比較手法は異なる。例えば、前述したブロックセレクション処理により、ブロックはテキスト(TEXT)、写真(PHOTO)、表(TABLE)、線画(LINE ART)、線(LINE)などの属性に分割される。テキストブロックを比較する場合は、ベクトル化処理により文字コード、フォントが判別されているため、各文字の一致度からその文章の類似度を算出し、ブロック内部の類似率が算出される。また、写真画像ブロックでは、画像より抽出される特徴ベクトルを特徴空間上の誤差より類似率が算出される。ここでいう特徴ベクトルとは、色ヒストグラムや色モーメントのような色に関する特徴量、共起行列、コントラスト、エントロピ、GaBor変換等で表現されるテクスチャ特徴量、フーリエ記述子等の形状特徴量など複数挙げられ、このような複数の特徴量のうち最適な組み合わせを用いる。また、線画ブロックはベクトル化処理によりアウトライン線、もしくは罫線、曲線の集合として表現されるため、線画ブロックでは各線の始点、終点の位置、曲率などの誤差を算出することにより線画の類似度が算出される。また、表ブロックでは、表の格子数、各枠子のサイズ、各格子内のテキスト類似度などを算出することにより、表ブロック全体の類似率が算出できる。
【0069】
以上より、ブロック位置、サイズ、属性、ブロック内部の類似率を算出し、各類似率を合計することで入力ファイルの該ブロックに対しその類似率を算出することが可能であり、該ブロック類似率を記録する。入力ファイルのブロック全てについて、一連の処理を繰り返す。求められたブロック類似率は、全て統合することで、入力ファイルの類似率を求める(ステップS503)。統合処理について説明する。図4(b)の入力ファイルのブロックB1〜B9に対し、ブロック毎の類似率がn1〜n9と算出されたとする。このときファイル全体の総合類似率Nは、以下の式、
N=w1*n1+w2*n2+w3*n3+…+w9*n9+γ …(1)
で表現される。
【0070】
ここで、w1〜w9は、各ブロックの類似率を評価する重み係数である。γは補正項であり、例えば、図11のデータベースファイルの入力ファイルに対する対象ブロックとして選出されなかったブロックB10’の評価値などとする。また,重み係数w1〜w9は、ブロックのファイル内占有率により求める。例えばブロックnのサイズをSnとすると、ブロックkの占有率wkは、
wk=Sk/ΣSn (n=1〜9) …(2)
として算出できる。このような占有率を用いた重み付け処理により、ファイル内で大きな領域を占めるブロックの類似率がよりファイル全体の類似率に反映されるようになる。
【0071】
以上の計算の結果、類似率が閾値Thより高いデータベースファイルを候補として(ステップS505)保存し、これをサムネイル等で表示(ステップS128)する。複数の中から操作者の選択が必要なら操作者の入力操作よってファイルの特定を行う。そして、以上の処理をデータベース内の全ファイルについて実行する(ステップS506)。
【0072】
<アプリデータへの変換処理(S130)>
次に、ステップS130におけるアプリデータへの変換処理について、図14〜図17を参照して説明する。
【0073】
一頁分のイメージデータをブロックセレクション処理(ステップS121)し、ベクトル化処理(ステップS129)した結果は図14に示す様な中間データ形式のファイルとして変換されている。このようなデータ形式はドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
【0074】
図14はDAOFのデータ構造を示す図である。図14において、791はHeaderであり、処理対象の文書画像データに関する情報が保持される。レイアウト記述データ部792では、文書画像データ中のTEXT(文字)、TITLE(タイトル)、 CAPTION(キャプション)、LINEART(線画)、PHOTO(写真)、FRAME(枠表の一部(部分集合))、TABLE(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。文字認識記述データ部793では、TEXT、TITLE、CAPTION(TITLE、CAPTIONはテキストの一部)等のTEXTブロックを文字認識して得られる文字認識結果を保持する。表記述データ部794では、TABLEブロックの構造の詳細を格納する。画像記述データ部795は、PICTUREやLINEART等のブロックのイメージデータを文書画像データから切り出して保持する。
【0075】
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクトを再利用することは出来ない。そこで、次にこのDAOFからアプリデータに変換する処理(ステップS130)について詳説する。
【0076】
図15は、本実施形態によるアプリデータ作成の処理の全体の概略フローである。ステップS8000はDAOFデータの入力を行う。ステップS8002ではアプリデータの元となる文書構造ツリーを生成する。ステップS8004では、文書構造ツリーを元に、DAOF内の実データを流し込み、実際のアプリデータを生成する。
【0077】
図16は、ステップS8002における文書構造ツリー生成の詳細フローを示し、図17は、文書構造ツリーの例を示す図である。全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。なお、以後、ブロックとは、ミクロブロック、及びマクロブロック全体を指す。
【0078】
ステップS8100は、ブロック単位で縦方向の関連性を元に再グループ化する。スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどで定義することができる。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
【0079】
図17(a)は実際のページ構成、(b)はその文書構造ツリーである。ステップS8100の結果、T3、T4、T5を含む一つのグループV1と、T6、T7を含む一つのグループV2が同じ階層のグループとしてまず生成される。ステップS8102では、縦方向のセパレータの有無をチェックする。セパレータは、例えば物理的にはDAOF中でライン属性を持つオブジェクトである。また論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。ステップS8104では、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、縦方向のグループ長がページ高さとなっている場合は、文書構造ツリー生成は終了する。
【0080】
図17の場合は、セパレータもなく、グループ高さはページ高さではないのでステップS8106に進む。
【0081】
ステップS8106では、ブロック単位で横方向の関連性を元に再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。関連性、及びその判定情報の定義は、縦方向の場合と同じである。
【0082】
図17の場合は、T1,T2でH1、V1,V2でH2、がV1,V2の1つ上の同じ階層のグループとして生成される。
【0083】
ステップS8108は、横方向セパレータの有無をチェックする。図17では、S1があるので、これをツリーに登録し、H1、S1、H2という階層が生成される。ステップS8110は、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、横方向のグループ長がページ幅となっている場合は、文書構造ツリー生成は終了する。そうでない場合は、ステップS8102に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。
【0084】
図17の場合は、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。文書構造ツリーが完成した後、その情報を元にステップS8004においてアプリデータの生成を行う。図17の場合は、具体的には、以下のようになる。
【0085】
すなわち、H1は横方向に2つのブロックT1とT2があるので、2カラムとし、T1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力後、カラムを変え、T2の内部情報を出力し、その後S1を出力する。H2は横方向に2つのブロックV1とV2があるので、2カラムとして出力、V1はT3、T4、T5の順にその内部情報を出力、その後カラムを変え、V2のT6、T7の内部情報を出力する。以上によりアプリデータへの変換処理が行える。
【0086】
<ポインター情報の付加(S135)>
次に、ステップS135で示す、ポインター情報付加処理について図18を参照して説明する。
【0087】
今、処理すべき文書が検索処理で特定された場合、あるいはベクトル化によって元ファイルが再生できた場合において、該文書を記録処理する場合においては、紙への記録の際にポインター情報を付与する事で、この文書を用いて再度各種処理を行う場合に簡単に元ファイルデータを取得できる。
【0088】
図18はポインター情報としてのデータ文字列を2次元バーコード(QRコードシンボル:JIS X0510)311にて符号化して画像中に付加する過程を示すフローチャートである。
【0089】
2次元バーコード内に組み込むデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバ名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのURLや、対応するファイルの格納されているデータベース105内あるいはMFP100自体が有する記憶装置内で管理されるファイルID等で構成される。
【0090】
まず、符号化する種種の異なる文字を識別するため、入力データ列を分析する。また、誤り検出及び誤り訂正レベルを選択し、入力データが収容できる最小型番を選択する。 (ステップS900)。次に、入力データ列を所定のビット列に変換し、必要に応じてデータのモード(数字、英数字、8ビットバイト、漢字等)を表す指示子や、終端パターンを付加する。さらに所定のビットコード語に変換する(ステップS901)。この時、誤り訂正を行うため、コード語列を型番および誤り訂正レベルに応じて所定のブロック数に分割し、各ブロック毎に誤り訂正コード語を生成し、データコード語列の後に付加する(ステップS902)。
【0091】
該ステップS902で得られた各ブロックのデータコード語を接続し、各ブロックの誤り訂正コード語、必要に応じて剰余コード語を後続する。(ステップS903)。次に、マトリクスに位置検出パターン、分離パターン、タイミングパターンおよび位置合わせパターン等とともにコード語モジュールを配置する。 (ステップS904)。更に、シンボルの符号化領域に対して最適なマスクパターンを選択して、マスク処理パターンをステップS904で得られたモジュールにXOR演算により変換する(ステップS905)。最後に、ステップS905で得られたモジュールに形式情報および型番情報を生成して、2次元コードシンボルを完成する(ステップS906)。
【0092】
上記に説明した、アドレス情報の組み込まれた2次元バーコードは、例えば、クライアントPC102から電子ファイルをプリントデータとして記録装置112に紙上に記録画像として形成する場合に、データ処理装置115内で記録可能なラスターデータに変換された後にラスターデータ上の所定の個所に付加されて画像形成される。ここで画像形成された紙を配布されたユーザーは、画像読取り部110で読み取ることにより、前述したステップS123にてポインター情報からオリジナル電子ファイルの格納場所を検出することができる。
【0093】
尚、同様の目的で付加情報を付与する手段は、本実施形態で説明した2次元バーコードの他に、例えば、ポインター情報を直接文字列で文書に付加する方法、文書内の文字列、特に文字と文字の間隔を変調して情報を埋め込む方法、文書中の中間調画像中に埋め込む方法等、一般に電子透かしと呼ばれる方法が適用出来る。
【0094】
<ファイルアクセス権に関する別実施形態>
文書ファイルの中には、第3者による再利用を制限すべきものがある。先の実施形態ではファイルサーバに蓄積されたファイルは全て自由にアクセス出来、ファイル全体、或いはその一部のオブジェクトは全て再利用が可能な事を前提に説明した。そこで、先の実施形態でポインター情報からファイルを検索した際に、検索の結果特定出来たファイルにアクセス権の制限が有る場合についての別実施形態を図8を用いて説明する。ステップS403までは先の実施形態と同様の為説明は省略する。
【0095】
ファイルが特定された場合、ファイルサーバはそのファイルのアクセス権情報を調べ、アクセス制限がある場合(ステップS404)には、MFP100に対してパスワードの送信を要求する(ステップS405)。MFP100は操作者に対してパスワードの入力を促し、入力されたパスワードをファイルサーバに送信する(ステップS406)。ファイルサーバは送信されたパスワードを照合し(ステップS407)、一致した場合には図3で説明した様に、ファイルのアドレスを通知(ステップS134)すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、MFPに対してファイルを転送する(ステップS408)。
【0096】
尚、アクセス権の制御を行う為の認証の方法は、ステップS405、406に示したパスワードによる方法に限定されず、例えば指紋認証等の一般に広く用いられている生体認証、カードによる認証等全ての認証手段を用いることが出来る。
【0097】
又、本別実施形態例では紙文書に付加的に付与されたポインター情報によりファイルを特定した場合の実施形態を示したが、図3のステップS126〜S128で示す所謂検索処理でファイルを特定した場合においても同様の制御が可能である。
【0098】
一方、ファイルサーバ内からファイルを特定出来なかった場合、即ち図3のステップS129〜S132で説明したベクトル化処理に対しても制限を加えることが出来る。即ち、紙文書を走査して得られたイメージ情報から該文書に対してのアクセス権の制限の存在を検出した場合には、認証確認が取れた場合のみベクトル化処理を行うことで、機密性の高い文書の使用に制限をかけることが出来る。
【0099】
<ファイル検索における別実施形態(その1)>
先の実施形態では、ファイル検索において、入力ファイルとデータベースファイルを比較する際、全ての入力ファイルの全てのブロックについて、レイアウト情報とブロックの内部情報の比較を行った。しかし、ブロック内部情報の比較を行わずともレイアウトの情報を比較した段階である程度ファイルを選別することが可能である。すなわち、入力ファイルとレイアウトが全く異なるデータベースファイルはブロック内部情報の比較処理を省くことが可能である。
【0100】
図19にレイアウト情報によるファイル選別を実施した際のフローチャートである。まず、入力ファイルの全てのブロックに対し、位置、サイズ、属性の比較を行い、その類似率を求め、ファイル全体のレイアウト類似率を求める(ステップS522)。レイアウト類似率が閾値より低い場合は、ブロック内部情報比較は行わない(ステップS523)。閾値より高い場合、つまりレイアウトが似ている場合のみ、ブロック内部情報の比較(ステップS524)を行い、先に求めたレイアウト類似率とブロック内部の類似率より、ファイル全体の総合類似率が求まる(ステップS525)。ブロック毎の類似率からの総合類似率の求める手法は、図12のステップS503と同様の処理であり、説明を省略する。該類似率が閾値以上のファイルに関しては候補として保存する(ステップS526)。以上の処理をデータベースの全ファイルについて行なう(ステップS527)。ブロック内部情報の類似率を求める処理は特に写真ブロックの一致を調べるときなど、一般的に重い処理となる。よって、レイアウトである程度ファイルを絞り込むことで、検索処理量の軽減、処理の高速化が行え、効率よく所望のファイルを検索できる。
【0101】
<ファイル検索における別実施形態(その2)>
また、先の実施形態は全て、ファイル検索に関してはユーザが何も指定せずに検索を施した場合の検索処理実施形態である。しかし、ユーザに文書内の特徴となる部分(ブロックセレクションより求められるブロック)、を指定させる、もしくは無駄なブロックを省く、または文書内の特徴を指定させることで、ファイル検索をより最適化することが可能になる。
【0102】
図20は検索時、ユーザによる検索オプション指定のユーザインタフェース画面(1001)の例を示す図である。入力ファイルはブロックセレクション処理により、複数のブロックに分割されており、入力画面にはファイル上のテキスト、写真、表、線画など各ブロックがサムネイルとなり表示される(1011〜1017)。
【0103】
ユーザは表示されたブロック中から、特徴となるブロックを選択する。上述のようにタッチパネルで構成されているので、所望のブロックの位置に触れることでブロックを選択できる。このとき選択するブロックは複数であってもよい。例として、ブロック1014を選択したとする。ブロック1014が選択された状態で、「重視」ボタン1002を押すと、よりブロック1014を重視した検索処理を行うようにする。重視した検索とは、例えば、ブロック毎の類似率からファイル全体の類似率を求める演算式(1)の指定されたブロック1014の重み係数を大きくし、選択外のブロックの重み係数を小さくするようにするということで実現できる。複数回「重視」ボタン1002を押せば、選択されたブロックの重み係数を大きくし、よりブロックを重視した検索が行える。
【0104】
また、「除外」ボタン1003を押せば、選択されたブロック1014を省いた状態で検索処理を施す。ブロックが誤って認識された場合などには、無駄な検索処理を省略し、かつ誤った検索処理を防止できる。また、「詳細設定」ボタン1004によりブロックの属性の変更を実現可能とし、ブロックセレクション(ステップS121)での誤って属性を認識した場合でもユーザが修正することで、正確な検索できる。また、「詳細設定」ボタン1005では、ユーザにより、ブロックの検索優先する重みを細かく調節可能とする。このように、検索する際、ユーザが特徴となるブロックを指定、設定させることで、検索の最適化が行える。
【0105】
一方、ファイルによっては、レイアウトが特殊な場合も考えられる。このようなファイルに関しては、図20の「レイアウト優先」ボタン1005を選択することにより、レイアウトを重視したファイル検索を可能とする。この場合、レイアウトの類似率の結果をより重視するように、重み付けすることで実現する。また、「テキスト優先」ボタン1006では、テキストブロックのみの検索を実行し、処理の軽減を図れる。
【0106】
このように、ユーザに画像の特徴を選択させることで、ファイルの特徴を重視した検索が行える。また、ユーザという人為的手段を信頼する、すなわちユーザ指定により重みを変更する際に、それに伴い変更された重みが閾値以下になる選択外ブロックを検索処理しないなどの制限を加えれば、ユーザの簡単な操作で、無駄なブロックの検索処理を大幅に削減できることも可能である。
【0107】
〈第2実施形態〉
次に第2実施形態について図23、図24を用いて説明する。上述の第1実施形態では「原本出力」を行なうか「原稿出力」を行なうかを選択した。第2実施形態では更にデータベースへの原本登録の実行を設定可能とし、より細かいユーザ設定に対応する。なお、図24において図3と同じ処理には同一のステップ番号を付してある。
【0108】
ステップS2121では、図23のようなユーザインタフェースで設定された設定内容を判定する。ここで、原稿出力(原本登録しない)116cが設定されている場合にはステップS136へ処理を進め、その他の場合はステップS121へ処理を進める。また、ステップS2123では、ステップS2120で得られたイメージ情報に基づく新たな電子ファイルを登録するか否かを判定する。ステップS2123は図3で上述したステップS129の判定/分岐に加えて、原本登録116d或いは原稿出力(原本登録する)116eが設定されている場合には、ステップS130へ処理を分岐させる。ステップS2124では、上述のステップS134による判定/分岐に加えて、原稿出力(原本登録する)116eが設定されている場合にはステップS136へ処理を進める。この場合、出力対象のデータはステップS2120で取得したイメージデータとなる。また、図示していないが、原本登録116dが設定されていた場合には、ステップS136もスキップしてそのまま本処理を終了する。
【0109】
以上のような、ステップS2121、S2123、S2124の判定/分岐処理により、以下のような処理が実現される。まず、MFP100の画像読み取り部110を動作させ1枚の原稿をラスター状に走査し、イメージ情報入力処理ステップS2120で600DPI−8ビットの画像信号を得る。該画像信号をデータ処理部115で前処理を施し記憶装置111に1ページ分の画像データとして保存する。
【0110】
次に、図23のようなユーザインタフェースで原本出力116aが設定されていた場合は、ステップS2120で画像を入力した後、ステップS2121からステップS121へ進み、上記第1実施形態で説明した処理を実行する。原稿出力(原本登録しない)116cが設定されていた場合は、第1実施形態の原稿出力116bと同様の処理が実行される。すなわち、ステップS2120で入力した画像をそのまま、画像の編集/蓄積/伝達/記録に出力する(ステップS2121〜S136)。原稿出力(原本登録する)116eが設定されていた場合は、ステップS121〜S133の処理を実行し、ステップS2124からステップS136へ進み、ステップS2120で読み取った画像データを出力する。
【0111】
原本登録116dが設定されていた場合は、ステップS121〜S133が実行され、そのまま本処理を終了させる。
【0112】
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0113】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0114】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0115】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0116】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【発明の効果】
以上詳述したように本発明によれば、画像処理システムにおいて、ユーザの希望の処理をあらかじめ設定することで、文書の加工、蓄積、伝送、記録等を行うユーザの操作性を大幅に向上させることが可能になる。
【図面の簡単な説明】
【図1】本発明の実施形態に係るシステムの構成を示すブロック図である。
【図2】本発明の実施形態に係るMFPの構成を示すブロック図である。
【図3】本発明の実施形態に係る原本処理手順を示すフローチャートである。
【図4】本発明の実施形態に係るブロックセレクション処理の実施形態である。
【図5】本発明の実施形態に係るポインター情報の検出手順を示すフローチャートである。
【図6】本発明の実施形態に係るブロック情報である。
【図7】本発明の実施形態に係るポインター情報によるファイル検索手順を示すフローチャートである。
【図8】本発明のファイルアクセス権に関する別実施形態の処理手順を示すフローチャートである。
【図9】本発明の実施形態に係るベクトル化例を示す図である。
【図10】本発明の実施形態に係るベクトル化例を示す図である。
【図11】ブロック例を示す図である。
【図12】ファイル検索処理の処理手順を示すフローチャートである。
【図13】ファイル検索処理のブロック比較処理手順を示すフローチャートである。
【図14】DAOF例を示す図である。
【図15】アプリデータ変換処理手順を示すフローチャートである。
【図16】文書構造ツリー生成処理手順を示すフローチャートである。
【図17】文書構造ツリー説明図である。
【図18】バーコード付加処理手順を示すフローチャートである。
【図19】レイアウト情報によるファイル選別処理手順を示すフローチャートである。
【図20】ユーザインタフェース画面の例を示す図である。
【図21】ユーザインタフェース画面の例を示す図である。
【図22】図21のユーザインターフェースを用いた設定内容に基づいて処理を切り換える様子を説明するフローチャートである。
【図23】ユーザインタフェース画面の他の例を示す図である。
【図24】図23のユーザインターフェースを用いた設定内容に基づいて処理を切り換える様子を説明するフローチャートである。
【発明の属する技術分野】
本願発明は、光学的に原稿画像を読み取って得られた画像データを処理する画像処理技術に関する。
【0002】
【従来の技術】
近年、環境問題が叫ばれる中、オフィスでのペーパーレス化が急速に進んでいる。このような中、バインダー等で蓄積された紙文書、あるいは配付資料等をスキャナで読み取り、オリジナルの検索、あるいはオリジナルが存在しない場合は、所定のフォーマットに変換して画像記憶装置にデータベースとして蓄積するような文書管理システムが提案されている。この種のシステムにおいては、オリジナル文書は、テキスト、写真、線画など属性ごとにベクトル化されて保存されている。そこで、スキャナ読み取り画像からオリジナルの文書を検索する際には、スキャナ読み取り画像をテキスト、写真、線画などの属性ごとにベクトル化し、保存文書との間でテキストの一致度、写真画像一致度、線画一致度、そして各属性のレイアウト情報を用いたレイアウト一致度などを算出する。すなわち、これら複数の一致度を総合的に判断する複合検索によってオリジナル文書を特定できるのが大きな特徴である。
【0003】
例えば、この種の文書検索装置は特許文献1によって提案されている。特許文献1に記載された文書検索装置は、原稿をスキャンし、スキャンされた原稿から文字認識された文字列をユーザが指定して検索することにより、内容及び位置関係が一致する文書を検索する。
【0004】
【特許文献1】
特開平3−263512号公報
【0005】
【発明が解決しようとする課題】
しかしながら、スキャンした紙文書がオリジナル文書のデータベースに存在しないことがあらかじめわかっているような場合に、データベースの検索を行なうことは無駄な処理である。また、オリジナル文書のデータベースに登録する必要のないメモのコピーなどの場合に当該画像をデータベースに登録してしまうのは、無駄な処理時間を費やすとともに、メモリの浪費でもある。
【0006】
このような不具合を避けるためには、操作の都度これから行なう処理を指定する必要があるが、これはユーザにとって非常に煩わしい操作である。
【0007】
本発明は上記の課題に鑑みてなされたものであり、原稿画像の読み取りにおいてユーザの意図通りの処理を簡易な操作で実行可能とすることを目的とする。
【0008】
【課題を解決するための手段】
上記の目的を達成するための本発明による画像処理方法は、
複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法であって、
第1の動作モードもしくは第2の動作モードを設定する設定工程と、
原稿を光学的に読み取って画像信号を入力する画像入力工程と、
前記設定工程で前記第1の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号をそのまま出力する第1出力工程と、
前記設定工程で前記第2の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号に基づいて前記記憶手段を検索する検索工程と、
前記検索工程で得られた電子ファイルを出力する第2出力工程とを備える。
【0009】
また、上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。すなわち、
複数の画像や電子データを保持する記憶手段へのアクセスが可能な画像処理装置であって、
第1の動作モードもしくは第2の動作モードを設定する設定手段と、
原稿を光学的に読み取って画像信号を入力する画像入力手段と、
前記設定手段で前記第1の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号をそのまま出力する第1出力手段と、
前記設定手段で前記第2の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号に基づいて前記記憶手段を検索する検索手段と、
前記検索手段で得られた電子ファイルを出力する第2出力手段とを備える。
【0010】
【発明の実施形態】
以下、添付の図面を参照して本発明の好適な実施形態について説明する。
【0011】
〈第1実施形態〉
[システムの概要]
図1は本実施形態による画像処理システム構成例を示すブロック図である。この画像処理システムは、オフィス10とオフィス20とをインターネット104で接続された環境で実現する。オフィス10内に構築されたLAN107には、MFP100、MFP100を制御するマネージメントPC101、クライアントPC(外部記憶手段)102、文書管理サーバ106、そのデータベース105、およびプロキシサーバ103が接続されている。また、オフィス20内に構築されたLAN208には、文書管理サーバ206、そのデータベース205およびプロキシサーバ203が接続されている。オフィス10内のLAN107及びオフィス20内のLAN208はそれぞれプロキシサーバ103及び203を介してインターネット104に接続される。
【0012】
MFP100は本実施形態において紙文書の画像読み取りと、読み取った画像信号に対する画像処理の一部を担当する。画像信号はケーブル109を介してマネージメントPC101に入力する(LAN107を介してもよい)。マネージメントPC101は通常のPC(パーソナルコンピュータ)であり、画像記憶手段としてのメモリ、画像処理手段としてのCPUやソフトウエア、表示手段としてのCRT或いはLCD、入力手段としてのキーボードやポインティングデバイスを有するが、その一部をMFP100に一体化して構成されている。例えば、PCの一部であるLCDがMFPに一体化されて実装される。
【0013】
図2はMFP100の構成図である。図2においてオートドキュメントフィーダ(以降ADFと記す)を含む画像読み取り部110は、束状の或いは1枚の原稿画像を図示しない光源で照射し、原稿反射像を固体撮像素子上に結像させ、固体撮像素子からラスター状の画像読み取り信号を600DPIの密度のイメージ情報として得る。通常の複写機能はこの画像信号をデータ処理部115で画像処理して記録信号へ変換し、複数枚複写の場合は記録装置111に一旦一ページ分の記録データを記憶保持した後、記録装置112に順次出力することで紙上に画像を形成する。
【0014】
一方クライアントPC102から出力されるプリントデータはLAN107からネットワークIF114を経てデータ処理装置115に入力される。ここでプリントデータは記録可能なラスターデータに変換された後、記録装置112によって紙上に記録画像として形成される。
【0015】
MFP100への操作者の指示はMFP100に装備された操作キーを含む入力装置113から、或いはマネージメントPC101の入力装置であるキーボード及びマウスから行われる。一方 操作入力の状態表示及び処理中の画像データの表示は表示装置116で行われる。尚、記憶装置111はマネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの授受及び制御はネットワークIF117および直結した通信手段(ケーブル109)を介して行われる。
【0016】
以上の一連の動作はデータ処理装置115内の図示しない制御部で制御される。
【0017】
[処理概要]
次に本実施形態によるMFP100の処理動作の概要を図21及び図22を用いて説明する。
【0018】
図21は本実施形態によるMFP100のユーザインターフェース部を示す図であり、入力装置113と表示装置116の具体例が示されている。表示装置116上には入力装置113の一部としてのタッチパネルが設けられている。図21の状態では「原本出力」ボタン116aと「原稿出力」ボタン116bの操作が可能な処理設定画面が表示されている。ユーザは所定の操作によってこのような処理設定画面を表示させ、例えばSTARTキー113aを押したときの出力形態として原本出力か原稿出力のいずれかを指定することができる。なお、原稿出力とは画像読み取り部110で原稿を読み取って得られた画像データをそのまま出力するモードである。従って、例えばこのモードにおいて記録出力を行なえば、通常のコピー動作となる。また、原本出力とは、画像読み取り部110で原稿を読み取って得られた画像データに基づいてデータベース105等を検索し、得られた電子ファイル(読み取った画像に対応する電子ファイル)を出力するモードである。
【0019】
図22は本実施形態によるMFP100の概略の動作を説明するフローチャートである。まずステップS2001において、MFP100の画像読み取り部110を動作させ、1枚の原稿をラスター状に走査して600DPI−8ビットの画像信号を得る。次に、ステップS2002において、図21に示す処理設定画面において「原本出力」か「原稿出力」のいずれが設定されているかを判定する。
【0020】
原稿出力が設定されていると判定された場合はステップS2003をスキップしてステップS2004へ進み、ステップS2001で入力した画像をそのまま、画像編集/蓄積/伝達/記録等のために出力する。また、原本を検索する「原本出力」が設定されていた場合には、ステップS2003で原本処理を行なう。原本処理では、その詳細は後述するが、当該入力画像に対応する原本データをデータベース105等を検索して取得し、得られた原本データを画像編集/蓄積/伝達/記録等のために出力する。
【0021】
例えば原本画像がカラー画像であって、これに対応する原稿として白黒画像の原稿を持っていた場合、「原稿出力」がセットされた状態でSTARTキー113aを押せば通常通り白黒画像のコピー出力が得られるが、「原本出力」がセットされた状態でSTARTキー113aを押せばカラー画像の印刷出力(コピー)が得られるといったようにSTARTキーをカスタマイズできる。
【0022】
[原本処理概要]
次に本実施形態による原本処理(ステップS2003)の概要を図3を用いて説明する。
【0023】
原稿入力処理で入力した画像信号をデータ処理部115で前処理を施し記憶装置111に1ページ分の画像データとして保存する。マネージメントPC101のCPUは該格納された画像データについてブロックセレクション処理(BS処理)を実行し、まず文字/線画部分とハーフトーンの画像部分とに領域を分離する(ステップS121)。なお、文字部は更に段落で塊として纏まっているブロック毎に、或いは、線で構成された表、図形に分離し各々セグメント化する。一方、ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分、背景部等、所謂ブロック毎に独立したオブジェクトに分割する。
【0024】
このとき原稿画像中に付加情報として記録された2次元バーコード、或いはURLに該当するオブジェクトを検出し、URLを認識して当該原稿のオリジナルの電子ファイルが格納されている記憶装置(データベース105等)内のポインター情報を検出する(ステップS122、S123)。なお、URLが通常の文字で記述されている場合はこれをOCRで文字認識してURLを得る。或いはURLが2次元バーコードで記述されている場合には、該マークを解読して(OMR)URLを得る。
【0025】
尚、ポインター情報を付加する手段としては文字やバーコードに限られず、例えば文字と文字の間に情報を埋め込む方法、ハーフトーンの画像に埋め込む方法等、直接可視化されない所謂電子透かしによる方法等を用いてもよい。
【0026】
ポインター情報が検出された場合、処理はステップS125に分岐し、ポインターで示されたアドレスから元の電子ファイルを検索する。電子ファイルは図1においてクライアントPC102内のハードディスク内、或いはオフィス10或いは20のLAN107、208に接続された文書管理サーバ106内のデータベース107内、或いはMFP100自体が有する記憶装置111のいずれかに格納されている。そして、ステップS123で得られたアドレス情報に従ってこれらの記憶装置内を検索する。ステップS125で電子ファイルが見つからなかった場合、見つかったがPDFあるいはTIFFに代表される所謂イメージファイルであった場合、或いはポインター情報自体が存在しなかった場合はステップS126に進む。なお、ファイルの種類は拡張子により判断できる。
【0027】
ステップS126〜S128ではデータベース上のオリジナル電子ファイルを検索する。このため、まずステップS126において、原稿入力処理で入力した画像をベクトルデータへ変換する。ベクトル化処理(ステップS126)では、テキストブロックに対してOCRを施し、OCRされたテキストブロックに対しては、更に文字のサイズ、スタイル、字体が認識され、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線で構成される表、線画ブロックに対してはアウトライン化し、表など図形形状が認識できるものは、その形状を認識する。写真ブロックに対してはイメージデータとして個別のJPEGファイルとして処理する。以上のベクトル化処理はブロックセレクション処理によって得られた各オブジェクト毎に行う。
【0028】
以上のようにしてイメージをベクトル化したならば、ステップS127でデータベース105上の各ファイルとの類似度(ベクトルの類似度)を調べ、オリジナルを検索する。こうして、ステップS126により変換されたベクトルデータを用いて忠実にオリジナルファイルが検索される。より具体的には、オブジェクト毎に類似度を求め、オブジェクト毎の類似度をそのオブジェクトのファイル内占有率に応じてファイル全体の類似度へ反映させる。ファイル内で占めている割合の大きいオブジェクトの類似度が、ファイル全体の類似度へより大きく反映されるため、いかなるフォーマットのファイルにも適応的に対応することが可能である。
【0029】
以上のような検索処理の結果 類似度の高い電子ファイルが見つかった場合は、当該電子ファイルをサムネイル等で表示(ステップS128)する。複数の候補が見つかった場合は、複数のサムネイルが表示され、操作者の入力操作よってファイルが特定され、ステップS133でそのファイルの格納アドレスが通知される。尚、候補が1ファイルの場合は、自動的にステップS129からステップS133に分岐して検索されたファイルの格納アドレスを通知するようにしてもよい。一方、ステップS126の検索処理で電子ファイルが見つからなかった場合、或いは、見つかったがPDFあるいはTIFFに代表される所謂イメージファイルであった場合、処理はステップS129からステップS130に進む。
【0030】
これらのベクトル化処理は各オブジェクト毎に行い、更に各オブジェクトのレイアウト情報を保存して例えば、rtfに変換(ステップS130)して電子ファイルとして記憶装置111に格納(ステップS131)する。
【0031】
今、ベクトル化した原稿画像は以降同様の処理を行う際に直接電子ファイルとして検索出来るように、先ずステップS132において検索の為のインデックス情報を生成して検索用インデックスファイル(原本を検索するためのインデックスであり、全文検索インデックス或いは類似画像検索のインデックス等)に追加する。ステップS133では、生成した電子ファイルの格納アドレスを通知する。そして、ステップS134で、操作者が行いたい処理が記録であると判断されれば、ステップS135に分岐し、ポインター情報をイメージデータとしてファイルに付加する。なお、検索処理で電子ファイルが特定できた場合も同様である。すなわち、ステップS129からステップS133に分岐して格納アドレスを操作者に通知すると共に、紙に記録する場合にはポインター情報を電子ファイルに付加する。こうして、以降からは、その原稿のポインター情報によって直接電子ファイルを特定することが可能となる。
【0032】
尚、ステップS125でポインター情報から電子ファイルが特定できた場合、検索処理で電子ファイルが特定出来た場合、ベクトル化により電子ファイルに変換した場合には、ステップS133において該電子ファイルの格納アドレスが操作者に通知される。
【0033】
以上の処理によって得られた電子ファイル自体を用いて、例えば文書の加工、蓄積、伝送、記録をステップS136で行うことが可能になる。これらの処理はイメージデータを用いる場合に比べて情報量が削減され、蓄積効率が高まり、伝送時間が短縮され、又記録表示する際には高品位なデータとして非常に有利となる。以下各処理ブロックに対して詳細に説明する。
【0034】
<ブロックセレクション処理(S121)>
先ずステップS121で示すブロックセレクション処理について図4を参照して説明する。
【0035】
ブロックセレクション処理とは、画像読み取り部110によって光学的に原稿画像を読み取って得られた一頁のイメージデータ(例えば図4の(a))を各オブジェクト毎の塊として認識し、該ブロックの各々をテキスト/線画/写真/線/表等の属性に分類し、異なる属性を持つ領域に分割する(図4の(b))処理である。具体的には、本実施形態では以下の手順でブロックセレクション処理を実行する。
【0036】
先ず、入力画像を白黒に二値化し、輪郭線追跡をおこなって黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡をおこない白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
【0037】
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分をテキスト領域、扁平な画素塊を線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を線画領域、などとする。
【0038】
ブロックセレクション処理で得られた各ブロックに対するブロック情報の例を図4の(b)に示す。これらのブロック毎の情報は以降に説明するベクトル化、或いは検索の為の情報として用いる。
【0039】
<ポインター情報の検出(S122)>
次に、ステップS122で示す、ファイルの格納位置をイメージ情報から抽出する為のOCR/OMR処理について、図5及び図6を用いて説明する。
【0040】
図5は原稿画像中に付加された2次元バーコード(QRコードシンボル)を復号して、データ文字列を出力する過程を示すフローチャートである。また、図6は2次元バーコードの付加された原稿310の一例を示す。
【0041】
まず、データ処理装置115は、不図示のページメモリに格納された原稿310を表すイメージ画像を走査して、先に説明したブロックセレクション処理の結果から所定の2次元バーコードシンボル311の位置を検出する。QRコードの位置検出パターンは、シンボルの4隅のうちの3隅に配置される同一の位置検出要素パターンから構成される (ステップS300)。次に、位置検出パターンに隣接する形式情報を復元し、シンボルに適用されている誤り訂正レベルおよびマスクパターンを得る(ステップS301)。
【0042】
シンボルの型番を決定し(ステップS302)、形式情報で得られたマスクパターンを使って符号化領域ビットパターンをXOR演算することによってマスク処理を解除する(ステップS303)。モデルに対応する配置規則に従い、シンボルキャラクタを読み取り、メッセージのデータ及び誤り訂正コード語を復元する(ステップS304)。復元されたコード上に、誤りがあるかどうかの検出を行い(ステップS305)、誤りが検出された場合はステップS306に分岐してこれを訂正する。
【0043】
誤り訂正されたデータより、モード指示子および文字数指示子に基づいて、データコード語をセグメントに分割する(ステップS307)。最後に、仕様モードに基づいてデータ文字を復号し、結果を出力する(ステップS308)。
【0044】
尚、2次元バーコード内に組み込まれたデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバー名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのURLで構成される。
【0045】
また、本実施形態ではポインター情報が2次元バーコードを用いて付与された原稿310について説明したが、直接文字列でポインター情報が記録される場合は所定のルールに従った文字列のブロックを先のブロックセレクション処理で検出し、該ポインター情報を示す文字列の各文字を文字認識(OCR)することで、直接元ファイルのアドレス情報を得ることが可能である。
【0046】
或いは、図6の文書310のテキストブロック312、或いは313の文字列に対して隣接する文字と文字の間隔等に視認し難い程度の変調を加え、該文字間隔に情報を埋め込むことでもポインター情報を付与してもよい。このような、所謂透かし情報においては、後述する文字認識処理を行う際に各文字の間隔を測定することにより、ポインター情報を抽出することができる。また、写真314の中に電子透かしとしてポインター情報を付加することも可能である。
【0047】
<ポインター情報によるファイル検索(S125)>
次に、図3で先に説明したステップS125における、ポインター情報からの電子ファイルの検索について図7のフローチャートを使用して説明する。
【0048】
まず、ポインタ情報に含まれるアドレスに基づいて、ファイルサーバを特定する(ステップS400)。ここでファイルサーバとは、クライアントPC102や、データベース105を内蔵する文書管理サーバ106や、記憶装置111を内蔵するMFP100自身を指す。また、ここでアドレスとは、URLやサーバ名とファイル名からなるパス情報である。
【0049】
ファイルサーバが特定できたら、ファイルサーバに対してアドレスを転送する(ステップS401)。ファイルサーバはアドレスを受信すると、該当するファイルを検索する(ステップS402)。ファイルが存在しない場合(ステップS403でNO)には、MFP100に対してその旨通知する。一方、ファイルが存在した場合(ステップS403でYES)には、図3で説明した様に、当該ファイルのアドレスを通知(ステップS133)すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、MFP100に対してファイルを転送する(ステップS408)。
【0050】
<ベクトル化処理(S126)>
次にステップS126で示されるベクトル化について詳説する。ポインタ情報がない場合、或いはファイルサーバに元ファイルが存在しない場合は、読み込んだイメージデータをブロックセレクション処理で得られた各ブロック(オブジェクト)毎にベクトル化する。
【0051】
『文字認識』
テキストブロックに対しては各文字に対して文字認識処理を行う。
【0052】
文字認識部では、文字単位で切り出された画像に対し、パターンマッチの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には種々の公知手法があり、たとえば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
【0053】
ブロックセレクション(ステップS121)で抽出された文字領域に対して文字認識を行う場合は、まず該当領域に対し横書き、縦書きの判定をおこない、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことでおこなう。縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚この時文字のサイズが検出出来る。
【0054】
『フォント認識』
文字認識の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントが認識出来る。
【0055】
『文字のベクトル化』
前記文字認識およびフォント認識よって得られた、文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。なお、元原稿がカラーの場合はカラー画像から各文字の色を抽出してベクトルデータとともに記録する。
【0056】
以上の処理によりテキストブロックに属するイメージ情報をほぼ形状、大きさ、色に関して忠実なベクトルデータに変換出来る。
【0057】
『文字以外の部分のベクトル化』
ブロックセレクション処理(ステップS121)で、線画あるいは線、表領域とされた領域を対象に、中で抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図9に図示するように、任意点Piに対し左右k個の離れた点Pi−k,Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi−k,Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は3次スプライン関数などを用いてベクトル化することができる。
【0058】
また、対象が内輪郭を持つ場合、ブロックセレクションで抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
【0059】
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。元原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
【0060】
さらに、図10に示す様に、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、2つの輪郭線をひとまとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線あるいは曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記のような太さを持つ線の集合として効率よくベクトル表現することができる。
【0061】
尚、先にテキストブロックに対する文字認識処理を用いたベクトル化を説明したが、該文字認識処理の結果辞書からの距離が最も近い文字を認識結果として用いるが、この距離が所定値以上の場合は、必ずしも本来の文字に一致せず、形状が類似する文字に誤認識している場合が多い。従って本実施形態では、この様な文字に対しては、上記した様に、一般的な線画と同じに扱い、該文字をアウトライン化する。即ち従来文字認識処理で誤認識を起こす文字に対しても誤った文字にベクトル化されず、可視的にイメージデータに忠実なアウトライン化によるベクトル化が行える。
【0062】
又、写真と判定されたブロックに対しては本実施形態では、ベクトル化を行なわず、イメージデータのままとする(なお、後述の検索において利用する特徴ベクトルは算出し、保持しておく)。
【0063】
<ファイル検索(S127)>
次に、図2のステップS127で示すファイル検索処理の詳細について図4、図11〜図13を用いて説明する。
【0064】
ファイル検索は、前述したブロックセレクション処理により分割され、ベクトル化された各ブロック情報を利用し検索を行う。具体的には、検索は、各ブロックの属性とファイル中のブロック座標情報との比較、すなわちレイアウトによる比較と、ファイル内の各ブロックの属性により異なる比較方法が適用されるブロック毎の内部情報比較とを複合した複合検索を用いる。
【0065】
図12は、図2のステップS126でベクトル化されたスキャン画像データ(入力ファイル)を、既にベクトル化されデータベース上に保存されてある画像データ(データベースファイル)と順次比較し、一致するファイルを検索する処理を示すフローチャートである。まず、マネージメントPC101よりデータベースファイルへアクセスする(ステップS501)。入力ファイルの各ブロックとデータベースファイルの各ブロックを比較し、入力ファイルのブロック毎にデータベースファイルのブロックとの類似率を求める(ステップS502)。
【0066】
図4、図11及び図13を用いてステップS502のブロック比較について詳説する。図4(b)を入力ファイルとし図11にデータベースファイルの例を示す。図11のデータベースファイルの例では、ブロックB1’〜B10’に分割されかつそれぞれがベクトル化処理されている。図13は、入力ファイル中の一つのブロックをデータベースファイルのブロックと比較し、類似率を算出するフローチャートである。ブロック毎に類似率を算出する際、まず入力ファイルの該ブロックとレイアウト上一致すると推定されるデータベースファイルの対象ブロックを選出する。例えば、B1に対してはB1’が選出されるとし、また他の入力ブロックB2〜B9に対しては、B2’〜B9’が選出されるとする。この処理においては、入力ファイルの複数のブロックに対し、データベースファイルの対象ブロックが重複されて選出されてもよい。
【0067】
次に、該ブロックと対象ブロックとのレイアウト情報の類似率を求める。ブロックの位置、サイズ、属性を比較し(ステップS512、S513、S514)、その誤差からレイアウトの類似率を求める。次にブロック内部の比較を行うが、ブロック内部を比較する際は同じ属性として比較するため、属性が異なる場合は片方のブロックを一致する属性へ再ベクトル化するなど前処理を行う。前処理により同じ属性として扱われる入力ファイルのブロックとデータベースファイルの対象ブロックは、ブロックの内部比較を行う(ステップS515)。
【0068】
ブロック内部比較では、ブロックの属性に最適な比較手法をとるため、属性によりその比較手法は異なる。例えば、前述したブロックセレクション処理により、ブロックはテキスト(TEXT)、写真(PHOTO)、表(TABLE)、線画(LINE ART)、線(LINE)などの属性に分割される。テキストブロックを比較する場合は、ベクトル化処理により文字コード、フォントが判別されているため、各文字の一致度からその文章の類似度を算出し、ブロック内部の類似率が算出される。また、写真画像ブロックでは、画像より抽出される特徴ベクトルを特徴空間上の誤差より類似率が算出される。ここでいう特徴ベクトルとは、色ヒストグラムや色モーメントのような色に関する特徴量、共起行列、コントラスト、エントロピ、GaBor変換等で表現されるテクスチャ特徴量、フーリエ記述子等の形状特徴量など複数挙げられ、このような複数の特徴量のうち最適な組み合わせを用いる。また、線画ブロックはベクトル化処理によりアウトライン線、もしくは罫線、曲線の集合として表現されるため、線画ブロックでは各線の始点、終点の位置、曲率などの誤差を算出することにより線画の類似度が算出される。また、表ブロックでは、表の格子数、各枠子のサイズ、各格子内のテキスト類似度などを算出することにより、表ブロック全体の類似率が算出できる。
【0069】
以上より、ブロック位置、サイズ、属性、ブロック内部の類似率を算出し、各類似率を合計することで入力ファイルの該ブロックに対しその類似率を算出することが可能であり、該ブロック類似率を記録する。入力ファイルのブロック全てについて、一連の処理を繰り返す。求められたブロック類似率は、全て統合することで、入力ファイルの類似率を求める(ステップS503)。統合処理について説明する。図4(b)の入力ファイルのブロックB1〜B9に対し、ブロック毎の類似率がn1〜n9と算出されたとする。このときファイル全体の総合類似率Nは、以下の式、
N=w1*n1+w2*n2+w3*n3+…+w9*n9+γ …(1)
で表現される。
【0070】
ここで、w1〜w9は、各ブロックの類似率を評価する重み係数である。γは補正項であり、例えば、図11のデータベースファイルの入力ファイルに対する対象ブロックとして選出されなかったブロックB10’の評価値などとする。また,重み係数w1〜w9は、ブロックのファイル内占有率により求める。例えばブロックnのサイズをSnとすると、ブロックkの占有率wkは、
wk=Sk/ΣSn (n=1〜9) …(2)
として算出できる。このような占有率を用いた重み付け処理により、ファイル内で大きな領域を占めるブロックの類似率がよりファイル全体の類似率に反映されるようになる。
【0071】
以上の計算の結果、類似率が閾値Thより高いデータベースファイルを候補として(ステップS505)保存し、これをサムネイル等で表示(ステップS128)する。複数の中から操作者の選択が必要なら操作者の入力操作よってファイルの特定を行う。そして、以上の処理をデータベース内の全ファイルについて実行する(ステップS506)。
【0072】
<アプリデータへの変換処理(S130)>
次に、ステップS130におけるアプリデータへの変換処理について、図14〜図17を参照して説明する。
【0073】
一頁分のイメージデータをブロックセレクション処理(ステップS121)し、ベクトル化処理(ステップS129)した結果は図14に示す様な中間データ形式のファイルとして変換されている。このようなデータ形式はドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
【0074】
図14はDAOFのデータ構造を示す図である。図14において、791はHeaderであり、処理対象の文書画像データに関する情報が保持される。レイアウト記述データ部792では、文書画像データ中のTEXT(文字)、TITLE(タイトル)、 CAPTION(キャプション)、LINEART(線画)、PHOTO(写真)、FRAME(枠表の一部(部分集合))、TABLE(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。文字認識記述データ部793では、TEXT、TITLE、CAPTION(TITLE、CAPTIONはテキストの一部)等のTEXTブロックを文字認識して得られる文字認識結果を保持する。表記述データ部794では、TABLEブロックの構造の詳細を格納する。画像記述データ部795は、PICTUREやLINEART等のブロックのイメージデータを文書画像データから切り出して保持する。
【0075】
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクトを再利用することは出来ない。そこで、次にこのDAOFからアプリデータに変換する処理(ステップS130)について詳説する。
【0076】
図15は、本実施形態によるアプリデータ作成の処理の全体の概略フローである。ステップS8000はDAOFデータの入力を行う。ステップS8002ではアプリデータの元となる文書構造ツリーを生成する。ステップS8004では、文書構造ツリーを元に、DAOF内の実データを流し込み、実際のアプリデータを生成する。
【0077】
図16は、ステップS8002における文書構造ツリー生成の詳細フローを示し、図17は、文書構造ツリーの例を示す図である。全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。なお、以後、ブロックとは、ミクロブロック、及びマクロブロック全体を指す。
【0078】
ステップS8100は、ブロック単位で縦方向の関連性を元に再グループ化する。スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどで定義することができる。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
【0079】
図17(a)は実際のページ構成、(b)はその文書構造ツリーである。ステップS8100の結果、T3、T4、T5を含む一つのグループV1と、T6、T7を含む一つのグループV2が同じ階層のグループとしてまず生成される。ステップS8102では、縦方向のセパレータの有無をチェックする。セパレータは、例えば物理的にはDAOF中でライン属性を持つオブジェクトである。また論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。ステップS8104では、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、縦方向のグループ長がページ高さとなっている場合は、文書構造ツリー生成は終了する。
【0080】
図17の場合は、セパレータもなく、グループ高さはページ高さではないのでステップS8106に進む。
【0081】
ステップS8106では、ブロック単位で横方向の関連性を元に再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。関連性、及びその判定情報の定義は、縦方向の場合と同じである。
【0082】
図17の場合は、T1,T2でH1、V1,V2でH2、がV1,V2の1つ上の同じ階層のグループとして生成される。
【0083】
ステップS8108は、横方向セパレータの有無をチェックする。図17では、S1があるので、これをツリーに登録し、H1、S1、H2という階層が生成される。ステップS8110は、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、横方向のグループ長がページ幅となっている場合は、文書構造ツリー生成は終了する。そうでない場合は、ステップS8102に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。
【0084】
図17の場合は、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。文書構造ツリーが完成した後、その情報を元にステップS8004においてアプリデータの生成を行う。図17の場合は、具体的には、以下のようになる。
【0085】
すなわち、H1は横方向に2つのブロックT1とT2があるので、2カラムとし、T1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力後、カラムを変え、T2の内部情報を出力し、その後S1を出力する。H2は横方向に2つのブロックV1とV2があるので、2カラムとして出力、V1はT3、T4、T5の順にその内部情報を出力、その後カラムを変え、V2のT6、T7の内部情報を出力する。以上によりアプリデータへの変換処理が行える。
【0086】
<ポインター情報の付加(S135)>
次に、ステップS135で示す、ポインター情報付加処理について図18を参照して説明する。
【0087】
今、処理すべき文書が検索処理で特定された場合、あるいはベクトル化によって元ファイルが再生できた場合において、該文書を記録処理する場合においては、紙への記録の際にポインター情報を付与する事で、この文書を用いて再度各種処理を行う場合に簡単に元ファイルデータを取得できる。
【0088】
図18はポインター情報としてのデータ文字列を2次元バーコード(QRコードシンボル:JIS X0510)311にて符号化して画像中に付加する過程を示すフローチャートである。
【0089】
2次元バーコード内に組み込むデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバ名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのURLや、対応するファイルの格納されているデータベース105内あるいはMFP100自体が有する記憶装置内で管理されるファイルID等で構成される。
【0090】
まず、符号化する種種の異なる文字を識別するため、入力データ列を分析する。また、誤り検出及び誤り訂正レベルを選択し、入力データが収容できる最小型番を選択する。 (ステップS900)。次に、入力データ列を所定のビット列に変換し、必要に応じてデータのモード(数字、英数字、8ビットバイト、漢字等)を表す指示子や、終端パターンを付加する。さらに所定のビットコード語に変換する(ステップS901)。この時、誤り訂正を行うため、コード語列を型番および誤り訂正レベルに応じて所定のブロック数に分割し、各ブロック毎に誤り訂正コード語を生成し、データコード語列の後に付加する(ステップS902)。
【0091】
該ステップS902で得られた各ブロックのデータコード語を接続し、各ブロックの誤り訂正コード語、必要に応じて剰余コード語を後続する。(ステップS903)。次に、マトリクスに位置検出パターン、分離パターン、タイミングパターンおよび位置合わせパターン等とともにコード語モジュールを配置する。 (ステップS904)。更に、シンボルの符号化領域に対して最適なマスクパターンを選択して、マスク処理パターンをステップS904で得られたモジュールにXOR演算により変換する(ステップS905)。最後に、ステップS905で得られたモジュールに形式情報および型番情報を生成して、2次元コードシンボルを完成する(ステップS906)。
【0092】
上記に説明した、アドレス情報の組み込まれた2次元バーコードは、例えば、クライアントPC102から電子ファイルをプリントデータとして記録装置112に紙上に記録画像として形成する場合に、データ処理装置115内で記録可能なラスターデータに変換された後にラスターデータ上の所定の個所に付加されて画像形成される。ここで画像形成された紙を配布されたユーザーは、画像読取り部110で読み取ることにより、前述したステップS123にてポインター情報からオリジナル電子ファイルの格納場所を検出することができる。
【0093】
尚、同様の目的で付加情報を付与する手段は、本実施形態で説明した2次元バーコードの他に、例えば、ポインター情報を直接文字列で文書に付加する方法、文書内の文字列、特に文字と文字の間隔を変調して情報を埋め込む方法、文書中の中間調画像中に埋め込む方法等、一般に電子透かしと呼ばれる方法が適用出来る。
【0094】
<ファイルアクセス権に関する別実施形態>
文書ファイルの中には、第3者による再利用を制限すべきものがある。先の実施形態ではファイルサーバに蓄積されたファイルは全て自由にアクセス出来、ファイル全体、或いはその一部のオブジェクトは全て再利用が可能な事を前提に説明した。そこで、先の実施形態でポインター情報からファイルを検索した際に、検索の結果特定出来たファイルにアクセス権の制限が有る場合についての別実施形態を図8を用いて説明する。ステップS403までは先の実施形態と同様の為説明は省略する。
【0095】
ファイルが特定された場合、ファイルサーバはそのファイルのアクセス権情報を調べ、アクセス制限がある場合(ステップS404)には、MFP100に対してパスワードの送信を要求する(ステップS405)。MFP100は操作者に対してパスワードの入力を促し、入力されたパスワードをファイルサーバに送信する(ステップS406)。ファイルサーバは送信されたパスワードを照合し(ステップS407)、一致した場合には図3で説明した様に、ファイルのアドレスを通知(ステップS134)すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、MFPに対してファイルを転送する(ステップS408)。
【0096】
尚、アクセス権の制御を行う為の認証の方法は、ステップS405、406に示したパスワードによる方法に限定されず、例えば指紋認証等の一般に広く用いられている生体認証、カードによる認証等全ての認証手段を用いることが出来る。
【0097】
又、本別実施形態例では紙文書に付加的に付与されたポインター情報によりファイルを特定した場合の実施形態を示したが、図3のステップS126〜S128で示す所謂検索処理でファイルを特定した場合においても同様の制御が可能である。
【0098】
一方、ファイルサーバ内からファイルを特定出来なかった場合、即ち図3のステップS129〜S132で説明したベクトル化処理に対しても制限を加えることが出来る。即ち、紙文書を走査して得られたイメージ情報から該文書に対してのアクセス権の制限の存在を検出した場合には、認証確認が取れた場合のみベクトル化処理を行うことで、機密性の高い文書の使用に制限をかけることが出来る。
【0099】
<ファイル検索における別実施形態(その1)>
先の実施形態では、ファイル検索において、入力ファイルとデータベースファイルを比較する際、全ての入力ファイルの全てのブロックについて、レイアウト情報とブロックの内部情報の比較を行った。しかし、ブロック内部情報の比較を行わずともレイアウトの情報を比較した段階である程度ファイルを選別することが可能である。すなわち、入力ファイルとレイアウトが全く異なるデータベースファイルはブロック内部情報の比較処理を省くことが可能である。
【0100】
図19にレイアウト情報によるファイル選別を実施した際のフローチャートである。まず、入力ファイルの全てのブロックに対し、位置、サイズ、属性の比較を行い、その類似率を求め、ファイル全体のレイアウト類似率を求める(ステップS522)。レイアウト類似率が閾値より低い場合は、ブロック内部情報比較は行わない(ステップS523)。閾値より高い場合、つまりレイアウトが似ている場合のみ、ブロック内部情報の比較(ステップS524)を行い、先に求めたレイアウト類似率とブロック内部の類似率より、ファイル全体の総合類似率が求まる(ステップS525)。ブロック毎の類似率からの総合類似率の求める手法は、図12のステップS503と同様の処理であり、説明を省略する。該類似率が閾値以上のファイルに関しては候補として保存する(ステップS526)。以上の処理をデータベースの全ファイルについて行なう(ステップS527)。ブロック内部情報の類似率を求める処理は特に写真ブロックの一致を調べるときなど、一般的に重い処理となる。よって、レイアウトである程度ファイルを絞り込むことで、検索処理量の軽減、処理の高速化が行え、効率よく所望のファイルを検索できる。
【0101】
<ファイル検索における別実施形態(その2)>
また、先の実施形態は全て、ファイル検索に関してはユーザが何も指定せずに検索を施した場合の検索処理実施形態である。しかし、ユーザに文書内の特徴となる部分(ブロックセレクションより求められるブロック)、を指定させる、もしくは無駄なブロックを省く、または文書内の特徴を指定させることで、ファイル検索をより最適化することが可能になる。
【0102】
図20は検索時、ユーザによる検索オプション指定のユーザインタフェース画面(1001)の例を示す図である。入力ファイルはブロックセレクション処理により、複数のブロックに分割されており、入力画面にはファイル上のテキスト、写真、表、線画など各ブロックがサムネイルとなり表示される(1011〜1017)。
【0103】
ユーザは表示されたブロック中から、特徴となるブロックを選択する。上述のようにタッチパネルで構成されているので、所望のブロックの位置に触れることでブロックを選択できる。このとき選択するブロックは複数であってもよい。例として、ブロック1014を選択したとする。ブロック1014が選択された状態で、「重視」ボタン1002を押すと、よりブロック1014を重視した検索処理を行うようにする。重視した検索とは、例えば、ブロック毎の類似率からファイル全体の類似率を求める演算式(1)の指定されたブロック1014の重み係数を大きくし、選択外のブロックの重み係数を小さくするようにするということで実現できる。複数回「重視」ボタン1002を押せば、選択されたブロックの重み係数を大きくし、よりブロックを重視した検索が行える。
【0104】
また、「除外」ボタン1003を押せば、選択されたブロック1014を省いた状態で検索処理を施す。ブロックが誤って認識された場合などには、無駄な検索処理を省略し、かつ誤った検索処理を防止できる。また、「詳細設定」ボタン1004によりブロックの属性の変更を実現可能とし、ブロックセレクション(ステップS121)での誤って属性を認識した場合でもユーザが修正することで、正確な検索できる。また、「詳細設定」ボタン1005では、ユーザにより、ブロックの検索優先する重みを細かく調節可能とする。このように、検索する際、ユーザが特徴となるブロックを指定、設定させることで、検索の最適化が行える。
【0105】
一方、ファイルによっては、レイアウトが特殊な場合も考えられる。このようなファイルに関しては、図20の「レイアウト優先」ボタン1005を選択することにより、レイアウトを重視したファイル検索を可能とする。この場合、レイアウトの類似率の結果をより重視するように、重み付けすることで実現する。また、「テキスト優先」ボタン1006では、テキストブロックのみの検索を実行し、処理の軽減を図れる。
【0106】
このように、ユーザに画像の特徴を選択させることで、ファイルの特徴を重視した検索が行える。また、ユーザという人為的手段を信頼する、すなわちユーザ指定により重みを変更する際に、それに伴い変更された重みが閾値以下になる選択外ブロックを検索処理しないなどの制限を加えれば、ユーザの簡単な操作で、無駄なブロックの検索処理を大幅に削減できることも可能である。
【0107】
〈第2実施形態〉
次に第2実施形態について図23、図24を用いて説明する。上述の第1実施形態では「原本出力」を行なうか「原稿出力」を行なうかを選択した。第2実施形態では更にデータベースへの原本登録の実行を設定可能とし、より細かいユーザ設定に対応する。なお、図24において図3と同じ処理には同一のステップ番号を付してある。
【0108】
ステップS2121では、図23のようなユーザインタフェースで設定された設定内容を判定する。ここで、原稿出力(原本登録しない)116cが設定されている場合にはステップS136へ処理を進め、その他の場合はステップS121へ処理を進める。また、ステップS2123では、ステップS2120で得られたイメージ情報に基づく新たな電子ファイルを登録するか否かを判定する。ステップS2123は図3で上述したステップS129の判定/分岐に加えて、原本登録116d或いは原稿出力(原本登録する)116eが設定されている場合には、ステップS130へ処理を分岐させる。ステップS2124では、上述のステップS134による判定/分岐に加えて、原稿出力(原本登録する)116eが設定されている場合にはステップS136へ処理を進める。この場合、出力対象のデータはステップS2120で取得したイメージデータとなる。また、図示していないが、原本登録116dが設定されていた場合には、ステップS136もスキップしてそのまま本処理を終了する。
【0109】
以上のような、ステップS2121、S2123、S2124の判定/分岐処理により、以下のような処理が実現される。まず、MFP100の画像読み取り部110を動作させ1枚の原稿をラスター状に走査し、イメージ情報入力処理ステップS2120で600DPI−8ビットの画像信号を得る。該画像信号をデータ処理部115で前処理を施し記憶装置111に1ページ分の画像データとして保存する。
【0110】
次に、図23のようなユーザインタフェースで原本出力116aが設定されていた場合は、ステップS2120で画像を入力した後、ステップS2121からステップS121へ進み、上記第1実施形態で説明した処理を実行する。原稿出力(原本登録しない)116cが設定されていた場合は、第1実施形態の原稿出力116bと同様の処理が実行される。すなわち、ステップS2120で入力した画像をそのまま、画像の編集/蓄積/伝達/記録に出力する(ステップS2121〜S136)。原稿出力(原本登録する)116eが設定されていた場合は、ステップS121〜S133の処理を実行し、ステップS2124からステップS136へ進み、ステップS2120で読み取った画像データを出力する。
【0111】
原本登録116dが設定されていた場合は、ステップS121〜S133が実行され、そのまま本処理を終了させる。
【0112】
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0113】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0114】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0115】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0116】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【発明の効果】
以上詳述したように本発明によれば、画像処理システムにおいて、ユーザの希望の処理をあらかじめ設定することで、文書の加工、蓄積、伝送、記録等を行うユーザの操作性を大幅に向上させることが可能になる。
【図面の簡単な説明】
【図1】本発明の実施形態に係るシステムの構成を示すブロック図である。
【図2】本発明の実施形態に係るMFPの構成を示すブロック図である。
【図3】本発明の実施形態に係る原本処理手順を示すフローチャートである。
【図4】本発明の実施形態に係るブロックセレクション処理の実施形態である。
【図5】本発明の実施形態に係るポインター情報の検出手順を示すフローチャートである。
【図6】本発明の実施形態に係るブロック情報である。
【図7】本発明の実施形態に係るポインター情報によるファイル検索手順を示すフローチャートである。
【図8】本発明のファイルアクセス権に関する別実施形態の処理手順を示すフローチャートである。
【図9】本発明の実施形態に係るベクトル化例を示す図である。
【図10】本発明の実施形態に係るベクトル化例を示す図である。
【図11】ブロック例を示す図である。
【図12】ファイル検索処理の処理手順を示すフローチャートである。
【図13】ファイル検索処理のブロック比較処理手順を示すフローチャートである。
【図14】DAOF例を示す図である。
【図15】アプリデータ変換処理手順を示すフローチャートである。
【図16】文書構造ツリー生成処理手順を示すフローチャートである。
【図17】文書構造ツリー説明図である。
【図18】バーコード付加処理手順を示すフローチャートである。
【図19】レイアウト情報によるファイル選別処理手順を示すフローチャートである。
【図20】ユーザインタフェース画面の例を示す図である。
【図21】ユーザインタフェース画面の例を示す図である。
【図22】図21のユーザインターフェースを用いた設定内容に基づいて処理を切り換える様子を説明するフローチャートである。
【図23】ユーザインタフェース画面の他の例を示す図である。
【図24】図23のユーザインターフェースを用いた設定内容に基づいて処理を切り換える様子を説明するフローチャートである。
Claims (10)
- 複数の画像や電子データを保持する記憶手段へのアクセスが可能な環境における画像処理方法であって、
第1の動作モードもしくは第2の動作モードを設定する設定工程と、
原稿を光学的に読み取って画像信号を入力する画像入力工程と、
前記設定工程で前記第1の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号をそのまま出力する第1出力工程と、
前記設定工程で前記第2の動作モードが設定されていた場合、前記画像入力工程で得られた画像信号に基づいて前記記憶手段を検索する検索工程と、
前記検索工程で得られた電子ファイルを出力する第2出力工程とを備えることを特徴とする画像処理方法。 - 前記画像入力工程で得られた画像信号に基づいて電子ファイルを生成する生成工程と、
前記生成工程で生成された電子ファイルを登録する登録工程とを更に備えることを特徴とする請求項1に記載の画像処理方法。 - 前記生成工程及び前記登録工程は、前記検索工程において対応する電子ファイルが取得できなかった場合に実行されることを特徴とする請求項2に記載の画像処理方法。
- 前記設定工程は、前記第1モードの実行とともに前記生成工程及び前記登録工程を実行するか否かの指示を含むことを特徴とする請求項1に記載の画像処理方法。
- 複数の画像や電子データを保持する記憶手段へのアクセスが可能な画像処理装置であって、
第1の動作モードもしくは第2の動作モードを設定する設定手段と、
原稿を光学的に読み取って画像信号を入力する画像入力手段と、
前記設定手段で前記第1の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号をそのまま出力する第1出力手段と、
前記設定手段で前記第2の動作モードが設定されていた場合、前記画像入力手段で得られた画像信号に基づいて前記記憶手段を検索する検索手段と、
前記検索手段で得られた電子ファイルを出力する第2出力手段とを備えることを特徴とする画像処理装置。 - 前記画像入力手段で得られた画像信号に基づいて電子ファイルを生成する生成手段と、
前記生成手段で生成された電子ファイルを登録する登録手段とを更に備えることを特徴とする請求項5に記載の画像処理装置。 - 前記生成手段及び前記登録手段は、前記検索手段において対応する電子ファイルが取得できなかった場合に実行されることを特徴とする請求項6に記載の画像処理装置。
- 前記設定手段は、前記第1モードの実行とともに前記生成手段及び前記登録手段を実行するか否かの指示を含むことを特徴とする請求項5に記載の画像処理装置。
- 請求項1乃至4のいずれかに記載の画像処理方法をコンピュータに実行させるための制御プログラム。
- 請求項1乃至4のいずれかに記載の画像処理方法をコンピュータに実行させるための制御プログラムを格納する記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003125819A JP2004334340A (ja) | 2003-04-30 | 2003-04-30 | 画像処理方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003125819A JP2004334340A (ja) | 2003-04-30 | 2003-04-30 | 画像処理方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004334340A true JP2004334340A (ja) | 2004-11-25 |
Family
ID=33502973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003125819A Withdrawn JP2004334340A (ja) | 2003-04-30 | 2003-04-30 | 画像処理方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004334340A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006155381A (ja) * | 2004-11-30 | 2006-06-15 | Canon Inc | 画像処理装置およびその方法 |
JP2006243942A (ja) * | 2005-03-01 | 2006-09-14 | Canon Inc | 画像処理装置およびその方法 |
JP2007025814A (ja) * | 2005-07-12 | 2007-02-01 | Canon Inc | 画像処理装置、画像処理方法及びコンピュータプログラム |
JP2007158413A (ja) * | 2005-11-30 | 2007-06-21 | Canon Inc | 画像処理方法及び装置 |
JP2011134035A (ja) * | 2009-12-24 | 2011-07-07 | Canon Inc | 画像処理装置、画像処理装置の制御方法及びプログラム |
CN110674336A (zh) * | 2019-09-26 | 2020-01-10 | 湖北奕展光电有限公司 | 一种识别、检索影像文件的系统 |
-
2003
- 2003-04-30 JP JP2003125819A patent/JP2004334340A/ja not_active Withdrawn
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006155381A (ja) * | 2004-11-30 | 2006-06-15 | Canon Inc | 画像処理装置およびその方法 |
JP4502385B2 (ja) * | 2004-11-30 | 2010-07-14 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
JP2006243942A (ja) * | 2005-03-01 | 2006-09-14 | Canon Inc | 画像処理装置およびその方法 |
US7747108B2 (en) | 2005-03-01 | 2010-06-29 | Canon Kabushiki Kaisha | Image processing apparatus and its method |
JP4546291B2 (ja) * | 2005-03-01 | 2010-09-15 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
JP2007025814A (ja) * | 2005-07-12 | 2007-02-01 | Canon Inc | 画像処理装置、画像処理方法及びコンピュータプログラム |
JP4708888B2 (ja) * | 2005-07-12 | 2011-06-22 | キヤノン株式会社 | 画像処理装置、画像処理方法及びコンピュータプログラム |
JP2007158413A (ja) * | 2005-11-30 | 2007-06-21 | Canon Inc | 画像処理方法及び装置 |
JP4557875B2 (ja) * | 2005-11-30 | 2010-10-06 | キヤノン株式会社 | 画像処理方法及び装置 |
JP2011134035A (ja) * | 2009-12-24 | 2011-07-07 | Canon Inc | 画像処理装置、画像処理装置の制御方法及びプログラム |
CN110674336A (zh) * | 2019-09-26 | 2020-01-10 | 湖北奕展光电有限公司 | 一种识别、检索影像文件的系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4181892B2 (ja) | 画像処理方法 | |
US7593961B2 (en) | Information processing apparatus for retrieving image data similar to an entered image | |
JP4266784B2 (ja) | 画像処理システム及び画像処理方法 | |
US7681121B2 (en) | Image processing apparatus, control method therefor, and program | |
US7640269B2 (en) | Image processing system and image processing method | |
JP4393161B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4510535B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2004334339A (ja) | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム | |
JP2004265384A (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP4502385B2 (ja) | 画像処理装置およびその制御方法 | |
JP2004326491A (ja) | 画像処理方法 | |
JP2005157450A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4227432B2 (ja) | 画像処理方法 | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
JP4261988B2 (ja) | 画像処理装置及び方法 | |
JP2004334340A (ja) | 画像処理方法及び装置 | |
JP4185858B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2005149097A (ja) | 画像処理システム及び画像処理方法 | |
JP2005149210A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4323856B2 (ja) | 画像処理方法 | |
JP2007048057A (ja) | 画像処理装置 | |
JP2005208872A (ja) | 画像処理システム | |
JP2006146486A (ja) | 画像処理装置 | |
JP2006165783A (ja) | 画像処理システム | |
JP2005149098A (ja) | 画像処理システム及び画像処理装置並びに画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060704 |