JP2004246577A - 画像処理方法 - Google Patents
画像処理方法 Download PDFInfo
- Publication number
- JP2004246577A JP2004246577A JP2003035113A JP2003035113A JP2004246577A JP 2004246577 A JP2004246577 A JP 2004246577A JP 2003035113 A JP2003035113 A JP 2003035113A JP 2003035113 A JP2003035113 A JP 2003035113A JP 2004246577 A JP2004246577 A JP 2004246577A
- Authority
- JP
- Japan
- Prior art keywords
- information
- file
- image
- block
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】本発明によれば、入力されたイメージに基づいて、格納手段に格納されているオリジナル電子データを検索し、当該検索されたオリジナル電子データと前記入力されたイメージとを比較して差分情報を抽出し、該差分情報を前記オリジナル電子データと合成する。更に、合成されて生成された電子データは格納手段に格納される。
【選択図】 図3
Description
【発明の属する技術分野】
本発明は、スキャナーやデジタルカメラなどで読取った原稿の画像から、該画像中に追記された手書情報を抽出するような画像処理に関する。
【0002】
【従来の技術】
近年、環境問題が叫ばれる中、オフィスでのペーパーレス化が急速に進んでおり、電子文書を取り扱う各種技術が考え出されている。
【0003】
例えば、特許文献1では、紙文書をスキャナーで読み取り、電子文書フォーマット(JPEGやPDFなど)に変換して、画像記憶手段に格納させるものが記載されている。
【0004】
また、特許文献2では、文書画像内に含まれる属性毎の領域を検出し、該領域毎にコンテンツとして、文書を管理する文書管理システムが記載されている。
【0005】
また、特許文献3では、スキャンした入力画像に基づいて、対応する電子情報を同定する技術が開示され、さらに、該入力画像と電子情報との差分を抽出し、当該抽出した差分を前記同定した電子情報と合成する情報処理装置が記載されている。
【0006】
【特許文献1】
特開2001−358863号公報
【特許文献2】
特開平8−147445号公報
【特許文献3】
特開平10−063820号公報
【0007】
【発明が解決しようとする課題】
しかしながら、特許文献1の技術では、スキャナーで読み取った画像をコンパクトな情報量のJPEGファイルやPDFファイルとして保存可能であるが、プリントされた文書から保存されているファイルを検索することができないので、プリントとスキャンを繰り返すと、保存している文書の画像が劣化していってしまうという課題がある。
【0008】
また、特許文献2の技術では、画像を複数の領域に分割してコンテンツ毎に再利用可能としているが、ユーザの指示に基づいて、コンテンツを検索し、更にその中から使用するコンテンツを決めるため、格納されているコンテンツを利用して文書を作成する際、ユーザはどのコンテンツを用いるか決めなければならず非常に手間がかかってしまうという課題がある。
【0009】
また、特許文献3の技術では、出力された紙文書に対応するオリジナルの電子文書を検索して差分情報を抽出するので、紙文書に追記された追記情報を保持することができるが、前記差分情報はスキャンした画像をそのまま扱っているため、必要とされる記憶容量が大きくなってしまうという課題がある。
【0010】
本発明は、上記課題を解決し、紙文書上の情報を消失することなく、画像の劣化も最小限に抑え、必要とされる記憶容量も少なくて済むような画像処理方法・画像処理装置等を提供するものである。
【0011】
【課題を解決するための手段】
上記課題を解決するために、本発明の画像処理方法は、入力されたイメージに基づいて、格納手段に格納されているオリジナル電子データを検索する検索ステップと、前記検索ステップで検索されたオリジナル電子データと前記入力されたイメージとを比較して差分情報を抽出する抽出ステップと、前記抽出ステップで抽出された差分情報をベクトルデータ化するベクトル化ステップと、前記ベクトルデータ化された差分情報を前記オリジナル電子データと合成する合成ステップとを有する。
【0012】
【発明の実施の形態】
(実施形態1)
以下、本願発明の実施の形態について説明する。図1は本願発明にかかる画像処理システム構成例を示すブロック図である。この画像処理システムは、オフィス10とオフィス20とをインターネット104で接続された環境で実現する。オフィス10内に構築されたLAN107には、MFP(Multi Function Peripheral、デジタル複合機)100、該MFP100を制御するマネージメントPC101、クライアントPC102、文書管理サーバ106、そのデータベース105、およびプロキシサーバ103が接続されている。LAN107及びオフィス20内のLAN108はプロキシサーバ103を介してインターネット104に接続される。MFP100は紙文書の画像読み取り処理(スキャナー)と読み取った画像信号に対する画像処理の一部を担当し、画像信号はLAN109を用いてマネージメントPC101に入力する。マネージメントPCは通常のPCであり、内部に画像記憶手段、画像処理手段、表示手段、入力手段等を有するが、その一部はMFP100と一体化されて構成されているものとする。
【0013】
図2はMFP100の構成図である。図2においてオートドキュメントフィーダー(以降ADFと記す)を含む画像読み取り部110は束状の或いは1枚の原稿画像を図示しない光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスター状の画像読み取り信号を例えば600DPIの密度のイメージ情報として得る。通常の複写機能は、この画像信号をデータ処理部115で記録信号へ画像処理し、複数枚複写の場合は記憶装置111に一旦記録データを記憶保持した後、記録装置112に順次出力して紙上に画像を形成する。
【0014】
一方、クライアントPC102から出力されるプリントデータはLAN107からネットワークIF114を経てデータ処理装置115で記録可能なラスターデータに変換した後、前記記録装置で紙上に記録画像として形成される。
【0015】
MFP100への操作者の指示は、MFP100に装備されたキー操作部やマネージメントPCのキーボードやマウスなどを介して入力装置113から行われ、これら一連の動作はデータ処理装置115内の図示しない制御部で制御される。
【0016】
一方、操作入力の状態表示及び処理中の画像データの表示は表示装置116で行われる。尚記憶装置111はマネージメントPCからも制御され、これらMFPとマネージメントPCとのデータの授受及び制御はネットワークIF117および直結したLAN109を用いて行われる。
【0017】
なお、本発明は、図2に示した装置ないし図1に示したシステムにおいて実行されうるものであり、例えば、図2の記憶装置111に記憶されたコンピュータ実行可能な制御プログラム(なお、この場合、本発明を構成する制御プログラムは記憶装置111に記憶されていてもいいし、外部装置から通信回線等を介して読み込まれて実行されるものであってもよい。また記憶装置は内蔵型ハードディスクに限らずリムーバブルディスクなどであってもよい)を、データ処理装置115の制御部(CPU)が実行することにより、後述する本発明の処理が実行されるものであってもよいし、また、前記データ処理装置115の制御部の全部又は一部が電気回路のハードウェアで構成され該電気回路で信号を処理することにより本発明の処理を実行するものであってもよい。
【0018】
<<処理概要>>
次に本発明による画像処理全体の概要を図3を用いて説明する。
【0019】
図3においてまず、MFP100の画像読み取り部110を動作させ1枚の原稿をラスター状に走査し、イメージ情報入力処理ステップ120で600DPI−8ビットの画像信号を得る。該画像信号をデータ処理部115で前処理を施し、記憶装置111に1ページ分の画像データとして保存する。マネージメントPC101のCPUは、該格納された画像信号から先ず、文字/線画部分とハーフトーンの画像部分とに領域を分離し、文字部分は更に段落で塊として纏まっているブロック毎に分離し、また、線画部分は線で構成された表、図形毎に分離し、各々セグメント化する。一方、ハーフトーンで表現される画像部分は、ハーフトーン画像部分を含む矩形のブロックに分離し、ブロック毎に独立したオブジェクトとして分割する(ステップ121)。
【0020】
このとき原稿画像中に付加情報として記録された2次元バーコード、或いはURLに該当するオブジェクトを検出し、URLについては文字認識処理(OCR)を実行し、或いは2次元バーコードなら該マークを解読(OMR)して(ステップ122)、該原稿のオリジナル電子ファイルが格納されている記憶装置内のポインター情報を検出する(ステップ123)。尚、ポインター情報を付加する手法としては、他に文字と文字の間隔を微小に変化させることによって情報を埋め込む手法や、ハーフトーンの画像に電子透かしとして埋め込む手法等であってもよい。
【0021】
ポインター情報が検出された場合、ステップ125に分岐し、ポインターで示されたアドレスから元の電子ファイルを検索する。電子ファイルは図1においてクライアントPC内のハードディスク内、或いはオフィス10或いは20のLANに接続された文書管理サーバ106によって管理されるデータベース105内、或いはMFP100自体が有する記憶装置111のいずれかに格納されており、ステップ123で得られたアドレス情報に従ってこれらの記憶装置内を検索する。ステップ125で電子ファイルが見つからなかった場合、見つかったがJPEGやPDFあるいはtiffに代表される所謂イメージファイルであった場合、或いは、ステップ124でポインター情報自体が存在しなかった場合は、ステップ126に分岐する。125でポインター情報に基づく電子ファイルが見つかった場合、ステップ129へ分岐して電子ファイルの格納されているアドレスを通知する。
【0022】
ステップ126は所謂文書検索処理ルーチンである。まずステップ122で各文字ブロックに対して行ったOCRの結果から単語を抽出して電子ファイル内に含まれる単語と比較することにより全文検索を行うか、或いは、各オブジェクトの配列及び各オブジェクトの属性を電子ファイルのオブジェクト配列及びオブジェクト属性と比較することによりレイアウト検索を行う。検索の結果、類似度の高い電子ファイルが見つかった場合、サムネイル等で候補の電子ファイルを表示(ステップ127)し、複数の候補中から操作者の選択が必要なら操作者の入力操作によってファイルの特定を行う。尚、候補が1ファイルの場合、127をバイパスして自動的にステップ128に進んで電子ファイル有りと判定してステップ129に分岐し、候補ファイルの格納アドレスを通知する。ステップ126の検索処理で電子ファイルが見つからなかった場合、或いは、見つかったがJPEGやPDFあるいはtiffに代表される所謂イメージファイルであった場合、ステップ132に分岐する。
【0023】
ここで、120から入力されるイメージ情報は、以上の処理で検索、特定された電子ファイルをそのままプリント出力したものである場合だけでなく、プリント出力が資料として配付され、それを入手したユーザーが資料上に手書きで書き込みをした場合などの元の特定された電子ファイルには存在しない新規の情報が付加されている場合、なども想定している。
【0024】
そこで、ステップ125または128で電子ファイルが特定されたら、入力のイメージ情報と特定された電子ファイルとの差分情報を抽出して後から追記された新規情報を抽出するようにする。すなわちステップ129で特定された電子ファイルの存在場所のアドレスの通知によりステップ130で実際に電子ファイルを入手し、ステップ131で入力イメージ情報とオリジナルの電子ファイルとの差分情報を抽出する。
【0025】
抽出された差分情報はステップ132でベクトル化処理によりイメージデータからベクトルデータに変換される。これは差分情報が手書きで追記された文字情報等である場合は、OCRによるコード化もしくは輪郭を追跡してアウトライン化しベクトル情報に変換する。ベクトル化された差分情報はオリジナルの電子ファイルと合成され、新たな電子ファイルとして生成される。
【0026】
差分情報が検出されなかった場合はオリジナルの電子ファイルと同じものが生成されることになる。
【0027】
一方、ステップ128で、電子ファイルの特定ができなかった場合、または特定された電子ファイルが(ベクトル化/文字コード化が全くされていない)イメージファイルであった場合は、ステップ132で、入力されたイメージ情報全体に対してベクトル化処理を行ない、イメージデータをベクトル化した電子ファイルに変換する。先ずステップ122でOCRされた文字ブロックに対しては、更に文字のサイズ、スタイル、字体を認識し、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線で構成される表、図形ブロックに対してはアウトライン化する。写真などの自然画像ブロックに対してはイメージデータとして個別のJPEGファイルとして処理する。
【0028】
これらのベクトル化処理は各オブジェクト毎に行い、更に各オブジェクトのレイアウト情報を保存して、ステップ133で一般のアプリケーションで編集可能なアプリデータに変換され、ステップ135で電子ファイルとして記憶装置111に格納する。なお、汎用のファイル形式として、例えばRTF(Rich Text Format)形式に変換するようにしてもよい。
【0029】
このとき、ステップ134では電子ファイルの格納場所をポインタ情報として保存する電子ファイルに付加するようにする。こうすることにより、保存された文書が次回以降の検索対象となり、ファイルの印刷時にポインタ情報を2次元バーコードなどで印刷するようにすれば、印刷文書から、ここで保存された文書に容易にアクセスすることができるようになる。
【0030】
以上の手順によって得られた電子ファイルには、オリジナルの電子情報もしくはそれに非常に近いベクトル情報と、後から手書きなどで追記された情報とが編集可能な形式で全て含まれており、それらを直接加工、再利用したり、あるいは蓄積、伝送、再印刷を行う事が可能になる。
【0031】
また、単純に入力されたイメージ全体をそのままイメージデータとして扱う場合に比べて情報量が削減されるので、蓄積効率が高まり、伝送時間が短縮され、又記録表示する際には高品位なデータとして非常に優位となる。
【0032】
以下、各処理ブロックに対して詳細に説明する。
【0033】
<<ブロックセレクション処理>>
先ずステップ121で示すブロックセレクション処理(領域分割処理)について説明する。
【0034】
ブロックセレクション処理とは、図4の右に示すように、ステップ120で入力されたイメージデータ(図4左)を、各オブジェクト毎の塊として認識し、該ブロック各々を文字/図画/写真/線/表等の属性に判定し、異なる属性を持つ領域に分割する処理である。
【0035】
ブロックセレクション処理の実施例を以下に説明する。
【0036】
先ず、入力画像を白黒に二値化し、黒画素の輪郭線追跡をおこなって、黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡をおこない白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
【0037】
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊として、さらに近接する文字の画素塊が整列良くグループ化可能な領域を文字領域とし、また、扁平な画素塊を線領域とし、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域とし、不定形の画素塊が散在している領域を写真領域とし、それ以外の任意形状の画素塊を図画領域、などとする。
【0038】
ブロックセレクション処理で得られた各ブロックに対するブロック情報と、入力画像に含まれるブロックを管理するための入力ファイル情報とを図5に示す。これらのブロック毎の情報は以降に説明するベクトル化、或いは検索の為の情報として用いる。
【0039】
<<ポインター情報の検出>>
次に、ファイルの格納位置をイメージ情報から抽出する為のOCR/OMR処理(ステップ122)について説明する。
【0040】
図6は原稿画像中に付加された2次元バーコード(QRコードシンボル)を復号して、データ文字列を出力する過程を示すフローチャートである。2次元バーコードの付加された原稿310の一例を図7に示す。
【0041】
まず、データ処理装置115内のページメモリに格納された原稿310を表すイメージ画像をCPU(不図示)で走査して、先に説明したブロックセレクション処理の結果から、所定の2次元バーコードシンボル311の位置を検出する。QRコードの位置検出パターンは、シンボルの4隅のうちの3隅に配置される同一の位置検出要素パターンから構成される (ステップ300)。
【0042】
次に、位置検出パターンに隣接する形式情報を復元し、シンボルに適用されている誤り訂正レベルおよびマスクパターンを得る(ステップ301)。
【0043】
シンボルの型番を決定した(ステップ302)後、形式情報で得られたマスクパターンを使って符号化領域ビットパターンをXOR演算することによってマスク処理を解除する(ステップ303)。
【0044】
尚、モデルに対応する配置規則に従い、シンボルキャラクタを読取り、メッセージのデータ及び誤り訂正コード語を復元する(ステップ304)。
【0045】
復元されたコード上に、誤りがあるかどうかの検出を行い(ステップ305)、誤りが検出された場合、ステップ306に分岐し、これを訂正する。
【0046】
誤り訂正されたデータより、モード指示子および文字数指示子に基づいて、データコード語をセグメントに分割する(ステップ307)。
【0047】
最後に、仕様モードに基づいてデータ文字を復号し、結果を出力する(ステップ308)。
【0048】
尚、2次元バーコード内に組み込まれたデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバ名およびファイル名を含むパス情報で構成される。或いは、対応するファイルへのURLで構成されるものであってもよい。
【0049】
本実施例ではポインター情報が2次元バーコードを用いて付与された原稿310について説明したが、文字列でポインター情報が記録されるようにしてもよい。その場合は所定のルールに従った文字列のブロック(例えば予め決められた位置にある文字ブロック)を先のブロックセレクション処理で検出し、該ポインター情報を示す文字列ブロックの各文字を文字認識することで、元ファイルのアドレス情報を得る事が可能である。
【0050】
又、図7の文書310の文字ブロック312、或いは313の文字列に対して隣接する文字と文字の間隔等に微小な変調を加えるなどすることにより、該文字間隔に情報を埋め込むことでもポインター情報を付与できるので、例えば、後述する文字認識処理を行う際に各文字の間隔を検出すれば、ポインター情報が得られる。又、自然画314の中に不可視の電子透かしとしてポインター情報を付加する事も可能である。
【0051】
<<ポインター情報によるファイル検索>>
次に、図3のステップ125で示した、ポインター情報からの電子ファイルの検索について、図8のフローチャートを使用して説明する。
【0052】
まず、ポインター情報に含まれるアドレスに基づいて、ファイル・サーバを特定する(ステップ400)。
【0053】
ここでファイルサーバとは、クライアントPC102や、データベース105を内蔵する文書管理サーバ106や、記憶装置111を内蔵するMFP100自身を指す。また、ここでアドレスとは、URLや、サーバ名とファイル名とを含むパス情報である。
【0054】
ファイルサーバが特定できたら、ファイルサーバに対してアドレスを転送する。(ステップ401)ファイル・サーバは、アドレスを受信すると、該当するファイルを検索する。(ステップ402)ファイルが存在しない場合(ステップ403−N)には、MFPに対してその旨通知する。
【0055】
一方、ファイルが存在した場合(ステップ403−Y)には、図3で説明した様に、ファイルのアドレスを通知(ステップ129)すると共に、後段の差分情報抽出のために当該データファイルをMFPに対して転送する(ステップ408)。
【0056】
<<ファイル検索処理>>
次に、図3のステップ126で示すファイル検索処理の詳細について図5、図10を使用して説明を行う。
【0057】
ステップ126の処理は、前述したように、ステップ124で入力原稿(入力ファイル)にポインタ情報が存在しなかった場合、または、ステップ125でポインタ情報は在るが電子ファイルが見つからなかった場合、或いは電子ファイルがイメージファイルであった場合に行われる。
【0058】
ここでは、ステップ122の結果、抽出された各ブロック及び入力ファイルが、図5に示す情報(ブロック情報、入力ファイル情報)を備えるものとする。情報内容として、属性、座標位置、幅と高さのサイズ、OCR情報有無を例としてあげる。属性は、文字、線、写真、絵、表、その他に分類する。また簡単に説明を行うため、ブロックは座標Xの小さい順、即ち(例、X1<X2<X3<X4<X5<X6)にブロック1、ブロック2、ブロック3、ブロック4、ブロック5,ブロック6と名前をつけている。ブロック総数は、入力ファイル中の全ブロック数であり、図10の場合は、ブロック総数は6である。以下、これらの情報を使用して、データベース内から、入力ファイルに類似したファイルのレイアウト検索を行うフローチャートを図10に示す。ここで、データベースに格納されているファイルは、図5と同様の種類の情報(ブロック情報、ファイル情報)を備えることを前提とする。
【0059】
フローチャートの流れは、入力ファイルとデータベース中のファイルを順次比較するものである。まず、ステップ510にて、後述する類似率などの初期化を行う。次に、ステップ511にてブロック総数の比較を行い、ここで、真の場合、さらにファイル内のブロックの情報を順次比較する。ブロックの情報比較では、ステップ513、515、518にて、属性類似率、サイズ類似率、OCR類似率をそれぞれ算出し、ステップ522にてそれらをもとに総合類似率を算出する。各類似率の算出方法については、公知の技術を用いることができるので説明を省略する。ステップ523にて総合類似率が、予め設定された閾値Thより高ければステップ524にてそのファイルを類似候補としてあげる。但し、図中のN、W、Hは、入力ファイルのブロック総数、各ブロック幅、各ブロック高さとし、△N、△W、△Hは、入力ファイルのブロック情報を基準として誤差を考慮したものである。n、w、hは、データベースに格納されているファイルのブロック総数、各ブロック幅、各ブロック高さとする。また、不図示ではあるが、ステップ514にてサイズ比較時に、位置情報XYの比較などを行ってもよい。
【0060】
以上、検索の結果、類似度が閾値Thより高く、候補として保存されたデータベースファイル(ステップ524)をサムネイル等で表示(ステップ127)する。そして複数の候補が表示された場合、この中から操作者の入力操作によってファイルの特定を行う。
【0061】
<<差分抽出処理>>
次に図3のステップ131で示す差分情報抽出処理について説明する。
【0062】
図20は差分抽出の処理の概略を示すフローチャートである。
【0063】
図20において、入力画像とは図3のステップ120でイメージ情報として入力された入力画像を示し、電子ファイルとは図3のステップ125または128で得られたオリジナルの電子ファイルを示す。ここで入力画像は、図3のステップ121、122、123においてブロックセレクション処理、OCR/OMR処理、ポインター情報の検出が終わっているので、図4で示したブロックセレクション後のブロックレイアウト情報、また図5で示したブロック情報、図7で示したポインター情報がすでに得られている。
【0064】
図21は、差分抽出を説明するための、電子ファイルと入力画像のイメージデータの内容およびブロックセレクションの一例を示す図である。
【0065】
図21において、2110は電子ファイルの内容を示し、2111は電子ファイル2110に対してブロックセレクション処理を行った後のブロックレイアウト情報の模式図である。ここでは図示しないが、図5で示したようなブロック情報を別途持っている。また2114はポインタ情報を示す2次元バーコードであり、2115はブロックセレクション処理後の2次元バーコードのブロックである。
【0066】
2112は入力画像の内容を示し、2113は入力画像2112に対してブロックセレクション処理を行った後のブロックレイアウト情報の模式図である。ここでは図示しないが、図5で示したようなブロック情報を別途持っている。また2116はポインタ情報を示す2次元バーコードであり、2117はブロックセレクション処理後の2次元バーコードのブロックである。電子ファイル2110とは異なり、入力画像2112には、手書き文字2118が記入されており、それをブロックセレクション処理することで、手書き文字ブロック2119がブロックレイアウト情報2113に生成されている。
【0067】
以下に図20、図21を用いて、差分抽出に関して説明する。本実施例では図3のステップ134で説明したように、ポインター情報は印刷時にイメージデータとして電子ファイルに付加されるため、ステップ125で電子データを入手した段階では、まだ電子ファイルにポインター情報2114は付加されていない。そこで、まずステップ2001では、電子ファイル2110に対して該電子ファイルの格納アドレスに基づきポインター情報である2次元バーコード2114を付加する。
【0068】
ステップ2002では、ポインター情報である2次元バーコード2114がイメージデータとして付加された電子ファイル2110に対してブロックセレクション処理を行う。ブロックセレクション処理に関しては、図4で説明を行った内容と同様にして行う。図4では入力画像に対して、入力画像中の各オブジェクト毎を塊として認識し、該ブロック各々を文字/図画/写真/線/表等の属性に判定し、異なる属性を持つ領域に分割する処理を説明したが、ステップ2002では、これと同様の処理を電子ファイル2110に対して行うことになる。
【0069】
ステップ2003では、図3のステップ122と同様の処理であり、電子ファイル2110に対してブロックセレクション処理をされた後、各々のオブジェクトに対して、既知のOCR/OMR処理を行う。
【0070】
ステップ2004では、図3のステップ123と同様の処理であり、電子ファイル2110から、ステップ2001で付加したポインター情報である2次元バーコード2114を検出する。
【0071】
ステップ2005では、図3のステップ123において検出済みの入力画像2112のブロックレイアウト情報2113から得たポインター情報である2次元バーコード2117の座標と、ステップ2004で検出した電子ファイル2110のブロックレイアウト情報2111から得たポインター情報である2次元バーコード2115の座標とに基づいて、入力画像2112と電子ファイル2110の向き、大きさなどを比較する。
【0072】
ステップ2006では、ステップ2005での比較結果から、入力画像2112に対して回転、拡大縮小、傾き補正などを、必要に応じて行う。これらの処理は画像2112に対してだけ行うのではなく、ブロックセレクション後のブロックレイアウト情報2113(およびブロック情報、ポインター情報)などにも施す。
【0073】
またブロックレイアウト情報、ブロック情報、ポインター情報に関しては、回転、拡大縮小、傾き補正を行った入力画像2112に対して、一連のブロックセレクション処理、OCR/OMR処理、ポインター情報検出を再度行って更新しても構わない。
【0074】
いずれにしても、ステップ2006によって、入力画像2112は電子ファイル2110と向きや大きさが揃うことになる。図21の例では、同じ向き、等倍を示しているため、これらの処理を行う必要がない。
【0075】
ステップ2007では、入力画像2112と電子ファイル2110の各々ブロックセレクション処理結果のブロックレイアウト情報2113と2111において、分割されたブロックごとに同一内容であるか否かを判断する。判断は、各々のブロックレイアウト情報、ブロック情報、およびOCR/MCR情報から行う。図21では、手書き文字2118部分のブロック2119が入力画像2112と電子ファイル2110とで異なるブロックであると判断される。
【0076】
ステップ2008では、ステップ2007で同一と判断されたブロックを入力画像から消去を行う。図21では、手書き文字ブロック2119以外のブロックが消去される。
【0077】
ステップ2009では、ステップ2008で消去されずに残ったブロックを、入力画像2112と電子ファイル2110間の差分イメージデータとして抽出する。図21では手書き文字ブロック2119に対応するイメージデータ2118が差分抽出される。
【0078】
<<ベクトル化処理>>
次に、図3のステップ132で示されるベクトル化処理について詳説する。
【0079】
これは上記で抽出された差分情報のみをベクトル化する場合と、128で電子ファイルが特定できなかった場合にイメージ全体をベクトル化する処理の2通りが想定されるが、ここではまず後者のイメージ全体をベクトル化する場合について説明する。ここでは前述したブロックセレクション処理によりイメージ全体がブロックに分割され、ブロック毎にベクトル化していく。
【0080】
<文字ブロックのベクトル化>
まず、文字ブロックに対しては各文字に対して文字認識処理を行う。文字認識部では、文字単位で切り出された画像に対し、パターンマッチの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には種々の公知手法があり、たとえば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
【0081】
ブロックセレクション(ステップ121)で抽出された文字領域に対して文字認識を行う場合は、まず該当領域に対し横書き、縦書きの判定をおこない、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことでおこなう。縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚、この時文字のサイズが検出出来る。
【0082】
次に、該文字ブロック内の各文字のフォント種別を認識する。文字認識の際に用いる、字種数ぶんの辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントが認識出来る。
【0083】
前記文字認識およびフォント認識によって得られた、文字コードおよびフォント情報を用いて、文字コード及びフォント毎にあらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。なお、元原稿がカラーの場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
【0084】
以上の処理により、文字ブロックに属するイメージ情報をほぼ形状、大きさ、色が忠実なベクトルデータに変換出来る。
【0085】
<線画ブロック、図画ブロック等のベクトル化>
ブロックセレクション処理(ステップ121)で、線画、図画、あるいは表領域と判定された領域を対象に、該領域中で抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図11に図示するように、任意点Piに対し左右k個の離れた点Pi−kとPi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、(Pi−kとPi+kの間の弦の長さ/弧の長さ)をRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は3次スプライン関数などを用いてベクトル化することができる。
【0086】
また、対象が内輪郭を持つ場合、白画素の輪郭線追跡を行い、抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
【0087】
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。元原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
【0088】
さらに、図12に示す様に、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、2つの輪郭線をひとまとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線あるいは曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記のような太さを持つ線の集合として効率よくベクトル表現することができる。
【0089】
尚、先に文字ブロックに対する文字認識処理を用いたベクトル化を説明したが、該文字認識処理の結果、辞書からの距離が最も近い文字を認識結果として用いるが、この距離が所定値以上の場合は、必ずしも本来の文字に一致せず、形状が類似する文字に誤認識している場合が多い。従って、本実施形態では、この様な文字に対しては、上記した様に、一般的な線画と同じように扱い、該文字をアウトライン化するものとする。即ち、従来の文字認識処理で誤認識を起こす文字に対しても誤った文字にベクトル化されず、可視的にイメージデータに忠実なアウトライン化によるベクトル化が行える。
【0090】
なお、写真と判定されたブロックに対しては本実施形態では、ベクトル化出来ない為、イメージデータのままとする。
【0091】
上述したように任意形状の図形のアウトラインをベクトル化した後、これらベクトル化された区分線を図形オブジェクト毎にグループ化する処理について説明する。
【0092】
図13は、ベクトルデータを図形オブジェクト毎にグループ化するまでのフローチャートを示している。まず、各ベクトルデータの始点、終点を算出する(700)。次に各ベクトルの始点、終点情報を用いて、図形要素を検出する(701)。図形要素の検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用し、検出を行う。次に図形要素内に存在する他の図形要素、もしくは区分線をグループ化し、一つの図形オブジェクトとする(702)。また、図形要素内に他の図形要素、区分線が存在しない場合は図形要素を図形オブジェクトとする。
【0093】
図14は、図形要素を検出するフローチャートを示している。先ず、ベクトルデータより両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する(710)。次に閉図形構成ベクトルの中から該ベクトルの始点を開始点とし、時計回りに順にベクトルを追っていく。開始点に戻るまで行い、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する(711)。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。最後に、710で除去された不要ベクトルのうち、711で閉図形としてグループ化されたベクトルに接合しているものを検出し一つの図形要素としてグループ化する(712)。
【0094】
以上によって図形ブロックを個別に再利用可能な個別の図形オブジェクトとして扱う事が可能になる。
【0095】
<差分情報のベクトル化処理>
次にステップ132のベクトル化処理のうち、図20で抽出された差分情報のベクトル化処理について説明する。
【0096】
差分情報が文字画像を含む場合、先に説明を行った文字ブロックのベクトル化処理と同等な処理を行う。これにより、手書きされた文字、例えば図21で示した手書き文字2118は、文字認識された後、文字のベクトル化もしくはフォント化される。
【0097】
ところが手書き文字の場合、ブロックセレクションの結果、場合によってはテキストブロックと認識されずに細線と認識されラインブロックと判断される可能性がある。この場合には、先に説明を行った「線画ブロック、図画ブロック等のベクトル化処理」と同様に、輪郭を検出しアウトライン化することで、可視的にイメージデータに忠実なアウトラインによるベクトル化が行える。
【0098】
また、図21では手書き文字2118での例を示しているが、手書きの細線、図面などに関しても同様であり、線画や図画などはアウトラインによるベクトル化処理が行われてベクトル化される。
【0099】
<差分情報と電子ファイルとの合成処理>
図22は、差分部分のベクトル化が終了し、オリジナルの電子ファイルに合成した際の一例を示す図であり、図21の入力画像データ2112の手書き文字2118をベクトル化した様子を示した図である。
【0100】
図22において2200は、図21の電子ファイル2110に、手書き文字2118をベクトル化したベクトル文字2201を合成後の新たな電子ファイルデータである。
【0101】
図22に示したように手書き文字2118は、ベクトル化されて、ブロックレイアウト情報2113の座標に手書き文字に最も似たフォントおよびサイズでベクトル文字2201として元の電子ファイル2110に合成される。
【0102】
以上、入力された画像中に、手書き文字や、オリジナルの電子ファイルと異なる差分情報が含まれていた場合でも、入力画像と電子ファイルとの差分抽出を行い、その差分部分のベクトル化を行い、元の電子ファイルとの合成、保存、さらに格納アドレスの通知を行うことで、入力されたイメージデータの電子ファイル化を行うことができる。
【0103】
<<アプリデータへの変換処理>>
ところで、入力イメージデータのベクトル化処理(ステップ132)後の結果は、図15に示す様な中間データ形式のファイルとして変換されている。このようなデータ形式はドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
【0104】
図15はDAOFのデータ構造を示す図である。図15において、791はHeaderであり、処理対象の文書画像データに関する情報が保持される。レイアウト記述データ部792では、文書画像データ中のTEXT(文字)、TITLE(タイトル)、CAPTION(キャプション)、LINEART(線画)、PICTURE(自然画)、FRAME(枠)、TABLE(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。文字認識記述データ部793では、TEXT、TITLE、CAPTION等のTEXTブロックを文字認識して得られる文字認識結果を保持する。表記述データ部794では、TABLEブロックの構造の詳細を格納する。画像記述データ部795は、PICTURE等のブロックのイメージデータを文書画像データから切り出して保持する。
【0105】
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクトを再利用する事は出来ない。そこで、次に、図16を用いて、このDAOFからアプリデータに変換する処理(ステップ130)について詳説する。
【0106】
ステップ8000では、DAOFデータの入力を行う。
【0107】
ステップ8002では、アプリデータの元となる文書構造ツリー生成を行う。
【0108】
ステップ8004では、文書構造ツリーを元に、DAOF内の実データを流し込み、実際のアプリデータを生成する。
【0109】
図17は、ステップ8002での文書構造ツリー生成の詳細フロー、図18は、文書構造ツリーの説明図である。全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。ここでブロックとは、ミクロブロック、及びマクロブロックについて示すものとする。
【0110】
ステップ8100では、ブロック単位で縦方向の関連性を元に再グループ化する。スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離の近さや、ブロック幅(横方向の場合は高さ)がほぼ同一であるかどうかなどで定義することができる。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
【0111】
図18(a)はページ構成例、(b)はその文書構造ツリーである。ステップ8100の結果、T3、T4、T5が同じ階層のグループV1として生成され、T6、T7が同じ階層のグループV2としてまず生成される。
【0112】
ステップ8102では、縦方向のセパレータの有無をチェックする。セパレータは、例えば物理的にはDAOF中でライン属性を持つオブジェクトである。また論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
【0113】
ステップ8104は、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、縦方向のグループ長がページ高さ(該ページに存在する複数のブロックの最上端と最下端の距離)となっている場合は、文書構造ツリー生成は終了する。図18の場合は、グループV1,V2には、セパレータもなく、グループ高さはページ高さではないので、ステップ8106に進む。
【0114】
ステップ8106は、ブロック単位で横方向の関連性を元に再グループ化する。このときの関連性、及びその判定情報の定義は、縦方向の場合と同様である。
【0115】
図18の場合は、T1,T2でグループH1が生成され、また、V1,V2でグループH2が生成される。グループH1とH2は、V1,V2の1つ上の同じ階層のグループとして生成される。
【0116】
ステップ8108は、横方向セパレータの有無をチェックする。図18では、S1があるので、これをツリーに登録し、H1、S1、H2という階層が生成される。
【0117】
ステップ8110は、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。ここで、横方向のグループ長がページ幅となっている場合は、文書構造ツリー生成は終了する。
【0118】
そうでない場合は、8102に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。
【0119】
図18の場合は、分割幅がページ幅(該ページに存在する複数のブロックの最左端と最右端の距離)になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
【0120】
文書構造ツリーが完成した後、その情報を元にステップ8004においてアプリデータの生成を行う。図18の場合は、具体的には、以下のようになる。
【0121】
すなわち、H1は横方向に2つのブロックT1とT2があるので、2カラムとし、T1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力後、カラムを変え、T2の内部情報出力、その後S1を出力となる。
【0122】
H2は横方向に2つのブロックV1とV2があるので、2カラムとして出力、V1はT3、T4、T5の順にその内部情報を出力、その後カラムを変え、V2のT6、T7の内部情報を出力する。
【0123】
以上により出力された順番でアプリデータへの変換処理が行えるので、例えば文字領域の読み順などを正しい順番でアプリデータへ変換できる。
【0124】
<<ポインター情報の付加>>
次に、ステップ134で付加されたポインター情報をイメージデータにして印刷する際の処理について説明する。
【0125】
格納されている文書を紙に記録処理する場合、ポインター情報に基づくイメージデータを付与して記録する事で、この文書を用いて再度各種処理を行う場合に簡単に元ファイルデータを取得できるようになる。
【0126】
図19はポインター情報としてのデータ文字列を2次元バーコード(QRコードシンボル:JIS X0510)311にて符号化(イメージ化)して画像中に付加する過程を示すフローチャートである。
【0127】
2次元バーコード内に組み込むデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバ名およびファイル名を含むパス情報で構成される。或いは、対応するファイルへのURLや、対応するファイルの格納されているデータベース105内あるいはMFP100自体が有する記憶装置内で管理されるファイルID等で構成されるようにしても良い。
【0128】
まず、符号化する種種の異なる文字を識別するため、入力データ列を分析する。また、誤り検出及び誤り訂正レベルを選択し、入力データが収容できる最小型番を選択する(ステップ900)。
【0129】
次に、入力データ列を所定のビット列に変換し、必要に応じてデータのモード(数字、英数字、8ビットバイト、漢字等)を表す指示子や、終端パターンを付加する。さらに所定のビットコード語に変換する(ステップ901)。
【0130】
この時、誤り訂正を行うため、コード語列を型番および誤り訂正レベルに応じて所定のブロック数に分割し、各ブロック毎に誤り訂正コード語を生成し、データコード語列の後に付加する(ステップ902)。
【0131】
該ステップ902で得られた各ブロックのデータコード語を接続し、各ブロックの誤り訂正コード語、必要に応じて剰余コード語を後続する(ステップ903)。
【0132】
次に、マトリクスに位置検出パターン、分離パターン、タイミングパターンおよび位置合わせパターン等とともにコード語モジュールを配置する(ステップ904)。
【0133】
更に、シンボルの符号化領域に対して最適なマスクパターンを選択して、マスク処理パターンをステップ904で得られたモジュールにXOR演算により変換する(ステップ905)。
【0134】
最後に、ステップ905で得られたモジュールに形式情報および型番情報を生成して、2次元コードシンボルを完成する(ステップ906)。
【0135】
上記に説明した、アドレス情報の組み込まれた2次元バーコードは、例えば、クライアントPC102から電子ファイルをプリントデータとして記録装置112に紙上に記録画像として形成する場合に、データ処理装置115内で記録可能なラスターデータに変換された後にラスターデータ上の所定の個所に付加されて画像形成される。ここで画像形成された紙を配布されたユーザーは、画像読取り部110で読み取ることにより、前述したステップ123にてポインター情報からオリジナル電子ファイルの格納場所を検出することができる。
【0136】
尚、ポインター情報(アドレス情報)を付加する手法としては、本実施例で説明した2次元バーコードの他に、例えば、ポインター情報を直接文字列で文書に付加する方法や、文書内の文字列、特に文字と文字の間隔を変調して情報を埋め込む方法や、文書中の中間調画像中に埋め込む方法等、一般に電子透かしと呼ばれる方法が適用出来る。
【0137】
(その他の実施形態)
<差分情報生成に関する別実施形態>
上記説明において、抽出された差分情報をオリジナルの電子ファイルと合成して保存する場合を説明したが、オリジナル電子ファイルを差分抽出のための参照データとして利用することとし、差分情報を入力イメージ情報から分離してオリジナル電子ファイルと合成せずに別ファイルとして保存するような構成としても構わない。なお、差分情報は別ファイルとしてオリジナル電子ファイルと関連づけられて保存され、印刷出力時に合成して出力するようにしてもよい。
【0138】
このようにすればオリジナルの電子情報は改変されずにそのまま残り、差分情報のみがあらたな電子データとして保存されるため、ほぼ同じ内容の電子データが多数生成されてしまう、といった冗長性を回避することもできる。
【0139】
<差分情報の合成に関する別実施形態>
本別実施形態では、格納されているオリジナル電子ファイルについて、オリジナル電子ファイルに対する情報の追記/改変を禁止できるようにした場合について述べる。図3のステップ125あるいはステップ128において、オリジナル電子ファイルを特定できた場合、ステップ131では、該オリジナル電子ファイルを用いて入力イメージ情報から差分情報を抽出し、ステップ132では、該オリジナル電子ファイルが情報の追記/改変を禁止しているかどうか判断し、禁止していないと判断した場合は差分情報をベクトル化してオリジナル電子ファイルとを合成するものとする一方、禁止していると判断した場合は、差分情報をベクトル化するとともに入力イメージ情報の差分情報以外の画像部分もベクトル化して格納し、出力の際には、差分情報と入力イメージ情報の差分情報以外の画像とを合成して出力することとする。
【0140】
この場合もオリジナルの文書は差分抽出のために参照されるだけであり、生成される電子データは入力画像をベクトル化したものとなる。この場合、追記された差分情報をオリジナルを参照しながら確実に抽出できるため、差分情報を独立したオブジェクトとして扱うことができるようになり編集、再利用などでの有用性が高まることになる。
【0141】
<ファイルアクセス権に関する別実施形態>
我々が扱う文書ファイルの中には、第3者による再利用を制限すべき場合がある。先の実施例ではファイルサーバに蓄積されたファイルは全て自由にアクセス出来、ファイル全体、或いはその一部のオブジェクトは全て再利用が可能な事を前提に説明した。そこで、先の実施例でポインター情報からファイルを検索した際に、検索の結果、特定出来たファイルにアクセス権の制限が有る場合についての別実施例を図9を用いて説明する。ステップ403までは図8で示した先の実施例と同様の為、説明は省略する。ステップ403でファイルが特定された場合、ステップ404でファイルサーバはそのファイルのアクセス権情報を調べ、アクセス制限がある場合には、MFPに対してパスワードの送信を要求する(ステップ405)。
【0142】
MFPでは操作者に対してパスワードの入力を促し、入力されたパスワードをファイルサーバに送信する(ステップ406)。
【0143】
ファイルサーバは送信されてきたパスワードを照合して認証を行い(ステップ407)、認証成功した場合には、図3で説明した様に、ファイルのアドレスを通知(ステップ134)すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、MFPに対してファイルを転送する(ステップ408)。
【0144】
尚、アクセス権の制御を行う為の認証の方法は、ステップ405、406に示したパスワードによる方法に限定されず、例えば、指紋認証等の一般に広く用いられている生体認証、カードによる認証等、様々な認証手段を用いる事が出来る。
【0145】
又、本別実施例では紙文書に付加的に付与されたポインター情報によりファイルを特定した場合の実施例を示したが、図3のステップ126−128で示した検索処理でファイルを特定した場合においても同様のアクセス権制御が可能である。
【0146】
また、図3のステップ132で説明したベクトル化処理に対しても、アクセス制限を加える事が出来る。即ち紙文書を走査して得られたイメージ情報から、透かし等により該文書に対するアクセス権の制限の存在を検出した場合には、認証確認が取れた場合のみベクトル化処理を行う事で、機密性の高い文書の使用に制限をかける事が出来る。
【0147】
<ファイル特定に関する別実施形態>
先の実施例では原稿走査して得られるイメージ情報から元ファイルデータを特定する手段は、図3に示す様に、文書中に付与されたポインター情報に基づいて特定するか、或いは文書中に記載された各オブジェクト情報に基づいて対応する電子ファイルを検索するかのいずれかに依るが、より正確に元ファイルを特定するには、該両手段を満足する電子ファイルを特定すれば良い。即ち、原稿中から得られるポインター情報から元ファイルの存在が検出出来たとしても、更に該文書中のオブジェクト情報を使って、例えば、レイアウト情報に従うレイアウト検索、文字認識されたキーワードによる全文検索などを検出されたファイルに対して行い、高い一致が得られた場合に、該検出したファイルを、正式に元ファイルであると特定する。これは、例えば、ポインター情報の下位の部分が曖昧で有ったり、誤り訂正でも訂正できなかった場合に対して、検索の範囲を絞り込んでファイルを特定出来る為、より高速で、確度の高いファイル特定が行える。
【0148】
<ベクトル化の別実施形態>
先の実施例では検索手段で、元ファイルの特定が出来ない場合、イメージ画像全体に対してベクトル化処理を行うが、例えば、一般の文書の場合、文書中のオブジェクト全て新規に作成された物でなく、一部のオブジェクトは他のファイルから流用して作成される場合がある。例えば、背景オブジェクト(壁紙)は文書作成アプリケーションで幾つかのパターンを予め用意してあり、その中から選択して用いる場合がある。従って、このようなオブジェクトは文書ファイルデータベース中の他の文書ファイル中に存在している可能性が高く、又、再利用可能なベクトルデータとして存在する可能性が高い。
【0149】
そこで、図3のベクトル化処理129の別実施例として、ブロックセレクション処理で個別のオブジェクトに分割された各オブジェクトに対して、該オブジェクト単位でデータベース中から該一致するオブジェクトを含むファイルを検索し、一致したオブジェクトに対して、個別に該ファイルからオブジェクト単位でベクトルデータを取得する。これに依って、入力文書を、より高速にベクトル化出来、更に、ベクトル化による画質劣化を防止出来る。
【0150】
一方、図3において検索処理125−128で元ファイルがPDFとして特定できた場合、該PDFがその文書の文字オブジェクトに対して既に文字認識された文字コードを付加ファイルとして有している場合がある。このようなPDFファイルをベクトル化する際には、該文字コードファイルを用いれば、129以降のベクトル化処理の中の文字認識処理を省く事が出来る。即ち、ベクトル化処理をより高速に処理する事が可能に成る。
【0151】
上述した実施形態1及びその他の実施形態の記載に基づき、本発明を以下に総括する。
【0152】
(実施態様1)
入力されたイメージに基づいて、格納手段に格納されているオリジナル電子データを検索する検索ステップと、前記検索ステップで検索されたオリジナル電子データと前記入力されたイメージとを比較して差分情報を抽出する抽出ステップと、前記抽出ステップで抽出された差分情報をベクトルデータ化するベクトル化ステップと、前記ベクトルデータ化された差分情報を前記オリジナル電子データと合成する合成ステップとを有することを特徴とする画像処理方法。
【0153】
(実施態様2)
更に、前記合成ステップで合成されて生成された新たな電子データを格納手段に格納する格納ステップを有することを特徴とする実施態様1に記載の画像処理方法。
【0154】
(実施態様3)
前記検索ステップでは、前記入力されたイメージに付加されている、前記オリジナル電子データが格納されているアドレスを示す識別子を認識し、該識別子を認識した結果に基づいて前記オリジナル電子データを検索することを特徴とする実施態様1または2のいずれかに記載の画像処理方法。
【0155】
(実施態様4)
前記ベクトル化ステップでは、前記差分情報を文字認識した結果に基づいてベクトル化することを特徴とする実施態様1に記載の画像処理方法。
【0156】
(実施態様5)
前記ベクトル化ステップでは、前記差分情報の輪郭に基づいてアウトライン化してベクトル化することを特徴とする実施態様1に記載の画像処理方法。
【0157】
(実施態様6)
更に、前記検索されたオリジナル電子データに対しての情報の改変を禁止しているかどうか判断する判断ステップを有し、
前記判断ステップで禁止していないと判断した場合、前記ベクトル化ステップでは、前記抽出ステップで抽出された差分情報をベクトルデータ化して、前記合成ステップでは、該ベクトルデータ化された差分情報を前記オリジナル電子データと合成し、
前記判断ステップで禁止していると判断した場合、前記ベクトル化ステップでは、前記抽出ステップで抽出された差分情報と前記入力されたイメージに含まれる該差分情報以外の情報とをベクトル化することを特徴とする実施態様1に記載の画像処理装置。
【0158】
(実施態様7)
更に、前記格納ステップで格納された電子データに対し、該電子データの格納アドレスを示す情報を付加して印刷出力する印刷制御ステップを有することを特徴とする実施態様2に記載の画像処理方法。
【0159】
(実施態様8)
更に、前記抽出された差分情報を別ファイルとして格納手段に格納する格納ステップを有し、前記別ファイルとしての差分情報は、前記オリジナル電子データに関連づけられた形式で格納され、印刷出力時に前記合成ステップにより合成されて出力されることを特徴とする実施態様1に記載の画像処理方法。
【0160】
(実施態様9)
更に、前記合成ステップで合成されて生成された新たな電子データを、既存の文書作成アプリケーションで扱える既定のフォーマットに変換するフォーマット変換ステップを有することを特徴とする実施態様1に記載の画像処理方法。
【0161】
(実施態様10)
更に、前記検索ステップでオリジナル電子ファイルが検索できなかった場合、前記入力されたイメージ全体をベクトル化するベクトル化ステップを有することを特徴とする実施態様1に記載の画像処理方法。
【0162】
(実施態様11)
実施態様1乃至10のいずれかに記載の各ステップを、コンピュータに実行させるためのコンピュータプログラム、あるいは該コンピュータプログラムを格納した記憶媒体も本発明を実現しうる。
【0163】
(実施態様12)
入力されたイメージに基づいて、格納手段に格納されているオリジナル電子データを検索する検索手段と、前記検索手段で検索されたオリジナル電子データと前記入力されたイメージとを比較して差分情報を抽出する抽出手段と、前記抽出手段で抽出された差分情報をベクトルデータ化するベクトル化手段と、前記ベクトルデータ化された差分情報を前記オリジナル電子データと合成する合成手段とを有することを特徴とする画像処理システム。
【0164】
【発明の効果】
以上説明したように、本発明によれば、入力イメージ情報とオリジナル電子ファイルとの差分情報(オリジナルには存在しない追記情報)を抽出することができるようになる。
【0165】
また抽出された追記情報とオリジナルの電子ファイルを合成して保存することにより、オリジナルデータに追記情報を付加した高品位な電子ファイルを生成することができる。
【0166】
また追記された差分情報もベクトル化処理する事で追記情報も含めて再利用性、編集可能性を大きく高める事ができ、更に、必要とされる記憶容量も少なくて済むようにできる。
【図面の簡単な説明】
【図1】画像処理システム構成例
【図2】MFP構成例
【図3】画像処理の全体動作の概要を示すフローチャート
【図4】ブロックセレクション処理の例
【図5】ブロック情報および入力ファイル情報の構成例
【図6】2次元バーコードの復号処理フローチャート
【図7】2次元バーコードが付加された原稿の例
【図8】ポインター情報によるファイル検索フローチャート
【図9】アクセス制限つきのファイル検索フローチャート
【図10】ファイルのレイアウト検索処理フローチャート
【図11】ベクトル化処理の説明図
【図12】ベクトル化処理の説明図
【図13】ベクトルデータのグループ化処理フローチャート
【図14】図形要素検出フローチャート
【図15】DAOFのデータ構造
【図16】アプリデータ変換フローチャート
【図17】文書構造ツリー作成フローチャート
【図18】文書構造ツリー作成説明図
【図19】ポインター情報付加フローチャート
【図20】差分抽出処理フローチャート
【図21】差分抽出処理の説明図
【図22】差分部分のオリジナルファイルへの合成
Claims (1)
- 入力されたイメージに基づいて、格納手段に格納されているオリジナル電子データを検索する検索ステップと、
前記検索ステップで検索されたオリジナル電子データと前記入力されたイメージとを比較して差分情報を抽出する抽出ステップと、
前記抽出ステップで抽出された差分情報をベクトルデータ化するベクトル化ステップと、
前記ベクトルデータ化された差分情報を前記オリジナル電子データと合成する合成ステップと
を有することを特徴とする画像処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003035113A JP4227432B2 (ja) | 2003-02-13 | 2003-02-13 | 画像処理方法 |
US10/775,177 US7391917B2 (en) | 2003-02-13 | 2004-02-11 | Image processing method |
EP04250777A EP1447767A3 (en) | 2003-02-13 | 2004-02-13 | Image document administration method |
CNB2004100959058A CN100419782C (zh) | 2003-02-13 | 2004-02-13 | 图象处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003035113A JP4227432B2 (ja) | 2003-02-13 | 2003-02-13 | 画像処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004246577A true JP2004246577A (ja) | 2004-09-02 |
JP2004246577A5 JP2004246577A5 (ja) | 2006-06-22 |
JP4227432B2 JP4227432B2 (ja) | 2009-02-18 |
Family
ID=33020625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003035113A Expired - Fee Related JP4227432B2 (ja) | 2003-02-13 | 2003-02-13 | 画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4227432B2 (ja) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007033727A (ja) * | 2005-07-26 | 2007-02-08 | Fuji Xerox Co Ltd | 教材処理装置、教材処理方法および教材処理プログラム |
JP2007033726A (ja) * | 2005-07-26 | 2007-02-08 | Fuji Xerox Co Ltd | 教材処理装置、教材処理方法および教材処理プログラム |
JP2007102545A (ja) * | 2005-10-05 | 2007-04-19 | Ricoh Co Ltd | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム |
JP2007243729A (ja) * | 2006-03-09 | 2007-09-20 | Canon Inc | 画像処理装置およびその制御方法、および画像処理システム |
JP2008022529A (ja) * | 2006-06-12 | 2008-01-31 | Canon Inc | 画像処理装置、画像処理方法 |
JP2009100262A (ja) * | 2007-10-17 | 2009-05-07 | Fuji Xerox Co Ltd | コード情報処理装置およびコード情報処理プログラム |
JP2009165088A (ja) * | 2008-01-10 | 2009-07-23 | Murata Mach Ltd | 画像処理装置 |
JP2012226430A (ja) * | 2011-04-15 | 2012-11-15 | Hitachi Ltd | リモート監視制御システム、リモート監視制御方法、及びリモート監視制御プログラム |
US8314964B2 (en) | 2009-02-03 | 2012-11-20 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method |
JP5180412B1 (ja) * | 2012-09-12 | 2013-04-10 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
US8606049B2 (en) | 2009-12-01 | 2013-12-10 | Canon Kabushiki Kaisha | Image management apparatus, image management method, and storage medium |
US8693028B2 (en) | 2008-06-12 | 2014-04-08 | Canon Kabushiki Kaisha | Image processing apparatus, method, and medium storing program |
JP2015022534A (ja) * | 2013-07-19 | 2015-02-02 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
KR20170087357A (ko) * | 2016-01-20 | 2017-07-28 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
US11609484B2 (en) | 2018-09-27 | 2023-03-21 | Fujifilm Corporation | Lens unit and imaging device |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021124843A (ja) * | 2020-02-03 | 2021-08-30 | 富士フイルムビジネスイノベーション株式会社 | 文書処理装置およびプログラム |
-
2003
- 2003-02-13 JP JP2003035113A patent/JP4227432B2/ja not_active Expired - Fee Related
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007033727A (ja) * | 2005-07-26 | 2007-02-08 | Fuji Xerox Co Ltd | 教材処理装置、教材処理方法および教材処理プログラム |
JP2007033726A (ja) * | 2005-07-26 | 2007-02-08 | Fuji Xerox Co Ltd | 教材処理装置、教材処理方法および教材処理プログラム |
JP4736595B2 (ja) * | 2005-07-26 | 2011-07-27 | 富士ゼロックス株式会社 | 教材処理装置、教材処理方法および教材処理プログラム |
JP2007102545A (ja) * | 2005-10-05 | 2007-04-19 | Ricoh Co Ltd | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム |
JP2007243729A (ja) * | 2006-03-09 | 2007-09-20 | Canon Inc | 画像処理装置およびその制御方法、および画像処理システム |
JP4630836B2 (ja) * | 2006-03-09 | 2011-02-09 | キヤノン株式会社 | 画像処理装置、画像処理方法、およびプログラム |
JP2008022529A (ja) * | 2006-06-12 | 2008-01-31 | Canon Inc | 画像処理装置、画像処理方法 |
US7929757B2 (en) | 2006-06-12 | 2011-04-19 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method for gathering vector data from an image |
JP2009100262A (ja) * | 2007-10-17 | 2009-05-07 | Fuji Xerox Co Ltd | コード情報処理装置およびコード情報処理プログラム |
JP2009165088A (ja) * | 2008-01-10 | 2009-07-23 | Murata Mach Ltd | 画像処理装置 |
US8693028B2 (en) | 2008-06-12 | 2014-04-08 | Canon Kabushiki Kaisha | Image processing apparatus, method, and medium storing program |
US8314964B2 (en) | 2009-02-03 | 2012-11-20 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method |
US8606049B2 (en) | 2009-12-01 | 2013-12-10 | Canon Kabushiki Kaisha | Image management apparatus, image management method, and storage medium |
JP2012226430A (ja) * | 2011-04-15 | 2012-11-15 | Hitachi Ltd | リモート監視制御システム、リモート監視制御方法、及びリモート監視制御プログラム |
JP5180412B1 (ja) * | 2012-09-12 | 2013-04-10 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
WO2014041641A1 (ja) * | 2012-09-12 | 2014-03-20 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
US9007634B2 (en) | 2012-09-12 | 2015-04-14 | Kabushiki Kaisha Toshiba | Information processing device, information processing method, and computer program product |
JP2015022534A (ja) * | 2013-07-19 | 2015-02-02 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
KR20170087357A (ko) * | 2016-01-20 | 2017-07-28 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
KR102574900B1 (ko) | 2016-01-20 | 2023-09-06 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
US11609484B2 (en) | 2018-09-27 | 2023-03-21 | Fujifilm Corporation | Lens unit and imaging device |
Also Published As
Publication number | Publication date |
---|---|
JP4227432B2 (ja) | 2009-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7681121B2 (en) | Image processing apparatus, control method therefor, and program | |
JP4181892B2 (ja) | 画像処理方法 | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US7542605B2 (en) | Image processing apparatus, control method therefor, and program | |
US7391917B2 (en) | Image processing method | |
US8339619B2 (en) | System and image processing method and apparatus for re-using and re-editing images | |
US8520006B2 (en) | Image processing apparatus and method, and program | |
US7640269B2 (en) | Image processing system and image processing method | |
US7317833B2 (en) | Image processing apparatus and image processing method | |
US7596271B2 (en) | Image processing system and image processing method | |
JP4227432B2 (ja) | 画像処理方法 | |
US20050111052A1 (en) | Image processing apparatus, control method therefor, and program | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
JP2005149097A (ja) | 画像処理システム及び画像処理方法 | |
JP4310176B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2006134042A (ja) | 画像処理システム | |
JP2006146486A (ja) | 画像処理装置 | |
JP2005208872A (ja) | 画像処理システム | |
JP2005136729A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 | |
JP2006195886A (ja) | 画像処理システム | |
JP2005165674A (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
JP2008084127A (ja) | 画像形成装置 | |
JP2005174079A (ja) | 画像処理装置 | |
JP2006165783A (ja) | 画像処理システム | |
JP2006148663A (ja) | 画像処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060508 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080527 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081125 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081128 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111205 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121205 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131205 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |