JP2006023944A - 画像処理システム及び画像処理方法 - Google Patents

画像処理システム及び画像処理方法 Download PDF

Info

Publication number
JP2006023944A
JP2006023944A JP2004200806A JP2004200806A JP2006023944A JP 2006023944 A JP2006023944 A JP 2006023944A JP 2004200806 A JP2004200806 A JP 2004200806A JP 2004200806 A JP2004200806 A JP 2004200806A JP 2006023944 A JP2006023944 A JP 2006023944A
Authority
JP
Japan
Prior art keywords
information
input
image
keyword
vector data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004200806A
Other languages
English (en)
Other versions
JP2006023944A5 (ja
Inventor
Hiroyuki Yaguchi
博之 矢口
Shinichi Kato
進一 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004200806A priority Critical patent/JP2006023944A/ja
Priority to US11/174,570 priority patent/US7596271B2/en
Publication of JP2006023944A publication Critical patent/JP2006023944A/ja
Publication of JP2006023944A5 publication Critical patent/JP2006023944A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

【課題】 所定のパターンに合致する入力画像を特定して保存しておくことができ、また、その際の判定処理の簡略化も図ることができる画像処理システム及び画像処理方法を提供する。
【解決手段】 スキャナ等から入力されたイメージ情報からベクトルデータを生成し、再利用を禁止するイメージ情報に含まれるキーワード情報を入力する。そして、入力されたベクトルデータとキーワード情報との類似度を判定し、両者が類似していると判定された場合のみ生成されたベクトルデータを記憶装置に記憶する。
【選択図】 図2

Description

本発明は、入力されたイメージ情報を所定の形式に変換する画像処理システム及び画像処理方法に関する。
近年、環境問題に対する関心が高まっている中、オフィス等でのペーパーレス化が急速に進んでいる。これに伴って、従来からバインダー等で蓄積されていた紙文書をスキャナで読み取ってポータブルドキュメントフォーマット(以下、「PDF」と記す。)等の画像ファイルに変換して、画像記憶装置にデータベースとして蓄積するようにした文書管理システムが知られている。
このような状況において、本来は持ち出し等が禁止されているような原稿であってもコピー等によって容易に外部に持ち出されてしまうような場合がある。そこで、本来は印刷されては困る情報をいつ誰に印刷されたのかを知る手立てとして、入力された画像を画像データとして保存する方法が知られている(例えば、特許文献1参照。)。
また、入力されたイメージデータを所定のイメージと比較することによって、印刷されては困る情報であるか判定する方法が知られている(例えば、特許文献2参照。)。
特開平6−270477号公報 特開平6−178066号公報
しかしながら、前者の方法は、画像処理システムに1つ1つのデータ量が大きい画像データを蓄積するための膨大な容量の画像記憶領域を必要とする。また、後者の方法は種々の方向の変化には対応できるものの、例えば、あるキーワードに合致するものの印刷を禁止したいような場合等には、同じキーワードであっても種々の大きさ、サイズに対応するパターンを生成しなければならず、判定処理が煩雑となってしまうものであった。
本発明は、このような事情を考慮してなされたものであり、所定のパターンに合致する入力画像を特定して保存しておくことができ、また、その際の判定処理の簡略化も図ることができる画像処理システム及び画像処理方法を提供することを目的とする。
上記課題を解決するために、本発明に係る画像処理システムは、
イメージ情報を入力する入力手段と、
前記入力手段で入力された前記イメージ情報からベクトルデータを生成するベクトル化手段と、
所定のオブジェクト情報を入力するオブジェクト情報入力手段と、
前記ベクトル化手段で生成した前記ベクトルデータに前記オブジェクト情報入力手段で入力した前記オブジェクト情報に類似する情報が含まれているか否かを判定する判定手段と、
前記判定手段によって前記ベクトルデータに前記オブジェクト情報が含まれていると判定された場合に該ベクトルデータを特定の属性情報と対応付けて記憶する記憶手段と
を備えることを特徴とする。
また、上記課題を解決するために、本発明に係る画像処理方法は、
イメージ情報を入力する入力工程と、
前記入力工程で入力された前記イメージ情報からベクトルデータを生成するベクトル化工程と、
所定のオブジェクト情報を入力するオブジェクト情報入力工程と、
前記ベクトル化工程で生成した前記ベクトルデータに前記オブジェクト情報入力工程で入力した前記オブジェクト情報に類似する情報が含まれているか否かを判定する判定工程と、
前記判定工程によって前記ベクトルデータに前記オブジェクト情報が含まれていると判定された場合に該ベクトルデータを特定の属性情報と対応付けて記憶装置に記憶する記憶工程と
を有することを特徴とする。
さらに、上記課題を解決するために、本発明に係る画像処理システムは、
イメージ情報を入力する入力手段と、
所定のキーワードを保持する保持手段と、
前記入力手段で入力された前記イメージ情報に含まれるキーワード情報を識別する識別手段と、
前記保持手段で保持しているキーワードと前記識別手段で識別した前記キーワード情報とが一致するか否かを判定する判定手段と、
前記判定手段で一致すると判定された場合に前記入力手段で入力した前記イメージ情報を特定の属性情報と対応付けて記憶する記憶手段と
を備えることを特徴とする画像処理システム。
さらにまた、上記課題を解決するために、本発明に係る画像処理方法は、
イメージ情報を入力する入力工程と、
所定のキーワードを保持する保持工程と、
前記入力工程で入力された前記イメージ情報に含まれるキーワード情報を識別する識別工程と、
前記保持工程で保持しているキーワードと前記識別工程で識別した前記キーワード情報とが一致するか否かを判定する判定工程と、
前記判定工程で一致すると判定された場合に前記入力工程で入力した前記イメージ情報を特定の属性情報と対応付けて記憶装置に記憶する記憶工程と
を有することを特徴とする。
本発明によれば、入力画像がベクトル化された際に所定のオブジェクト情報を含むか否かを判定し、該当するものについてはベクトルデータとして記憶することで、所定のオブジェクトを含む入力画像を特定してベクトルデータとして保存でき、システムの省メモリ化を好適に実現することができるとともに、保存したデータからの追跡を容易にすることができる。
また、入力画像に含まれるキーワード情報が所定のキーワードと一致するか判定し、一致すると判定された場合に特定の属性情報と対応付けて記憶するので、画像パターン同士を含むものに比べ判定処理を簡略化することができる。
以下、図面を参照して、本発明の好適な実施形態に係る画像処理システム及び画像処理方法について説明する。
図1は、本発明の一実施形態に係る画像処理システムの構成を示すブロック図である。図1に示す画像処理システムは、一例として、オフィス10とオフィス20とをインターネット等のネットワーク104で接続された環境で実現される。
オフィス10内に構築されたLAN107には、MFP100と、MFP100を制御するマネージメントPC101と、クライアントPC102と、文書管理サーバ106aと、そのデータベース105a及びプロキシサーバ103aが接続されている。また、オフィス20内に構築されたLAN108には、文書管理サーバ106bと、そのデータベース105b及びプロキシサーバ103bが接続されている。尚、クライアントPC102は、外部記憶部、検索イメージ入力部及び検索結果出力部を備えている。また、LAN107及びオフィス20内のLAN108は、プロキシサーバ103a、103bを介してインターネット等のネットワーク104に接続されている。
MFP100は、本実施形態において紙文書を光学的に読み取って画像信号に変換する画像読み取り処理と、読み取った画像信号に対する画像処理の一部を担当し、画像信号はLAN109を用いてマネージメントPC101に入力する。尚、マネージメントPC101は、通常のPCでも実現可能であり、内部に画像記憶部、画像処理部、表示部及び入力部を備える。尚、マネージメントPC101は、その一部又は全部をMFP100と一体化して構成してもよい。
図2は、本発明の一実施形態に係るMFP100の構成を示すブロック図である。尚、MFP100に対する操作者の指示は、MFP100に装備されているキー等の入力装置113、或いはマネージメントPC101のキーボードやマウス等からなる入力装置から行われ、これら一連の動作はデータ処理装置115内の制御部で制御される。
図2において118は認証装置であり、ユーザに対して認証情報(例えば、個人IDやパスワード等)の入力を要求し、入力装置113等から入力されたユーザの個人ID及びパスワード等の認証情報に基づいて、当該操作者のMFP100に対するアクセス許可を行う。そして、認証装置118による認証結果を受けて、アクセスが許可されたユーザであることが識別されたことを条件として、オートドキュメントフィーダ(以下、「ADF」と略す。)を含む画像読み取り部110は、束状或いは1枚の原稿画像を内部に備える光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読み取り信号を例えば600dpiの密度のイメージ情報として得る。そして通常の複写機能を用いる場合は、この画像信号をデータ処理部115で記録信号へ画像処理し、複数毎複写の場合は記憶装置111に一旦1ページ分の記録データを保持した後、印刷装置112に順次出力して紙上に画像を形成する。
一方、クライアントPC102から出力されるプリントデータは、LAN107からMFP100に入力され、ネットワークI/F114を経てデータ処理装置115で記録可能なラスタデータに変換された後、印刷装置112に出力して紙上に記録画像として形成される。
一方、操作入力の状態表示及び処理中の画像データの表示は、MFP100の表示装置116又は、マネージメントPC101、クライアントPC102のモニタ等で行われる。尚、記憶装置111は、画像読み取り部110で読み取られ、データ処理装置115でデータ処理が施された画像データを記憶する。また、記憶装置111は、マネージメントPC101からも制御可能であって、MFP100とマネージメントPC101とのデータの授受及び制御は、ネットワークI/F114及び直結したLAN109を用いて行われる。
スキャンデータは同様にファクシミリ(FAX)I/F117を使って設定された送信先に送信することもできる。また、FAXI/F117からの受信データも印刷装置112を使用して印字することができる。さらに、当該FAX受信データは、ネットワークI/F114を介して設定されたあて先に転送することも可能である。また、ネットワークI/F117から受信したデータをFAXI/F117を使用して転送することもできる。
[読み取り処理の概要]
次に、本発明の一実施形態に係る画像処理システムによる画像処理全体の概要について説明する。図3は、本発明の一実施形態に係る画像処理システムによる画像処理の手順について説明するためのフローチャートである。ここでは、図3のフローチャートを用いて紙原稿を読み取ってイメージ情報を取得する処理について説明する。
まず、MFP100における画像読み取り部110を動作させて1枚の原稿をラスタ走査し、例えば、600dpi、8ビットの画像信号を得る(イメージ情報入力処理:ステップS301)。尚、当該画像信号は、データ処理装置115で前処理を施して記憶装置111に1ページ分の画像データとして保存する。
次に、データ処理装置115内のCPU、或いはマネージメントPC101のCPUにより、記憶装置111に記憶された画像信号から、まず文字/線画部分とハーフトーンの画像部分とに領域を分離する。そして、文字部分はさらに段落で塊として纏まっているブロック毎に、或いは、線で構成された表、図形に分離し各々セグメント化する。一方、ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分、背景部等のいわゆるブロック毎に独立したオブジェクトに分割する(BS処理:ステップS302)。
次に、OCR処理を行って、文字ブロックに対して、各文字の文字種、文字のサイズ、スタイル、字体等を認識し(ステップS303)、原稿を走査して読み取られた文字に可視的に忠実なフォントデータ(文字コードを含む)に変換することでベクトルデータを生成する(ステップS304)。一方、線で構成される表、図形ブロック等に対してはアウトライン化することでベクトルデータを生成する。また、画像ブロックに対しては、イメージ情報として個別のJPEGファイルとして処理する。尚、これらのベクトル化処理は各オブジェクト毎に行い、さらに各オブジェクトのレイアウト情報を保存しておく。このように、ステップS304の処理によって、イメージ情報からベクトルデータへの変換処理が行われ、オリジナル電子ファイルに近い電子ファイルに変換される。
そして、ベクトルデータの再利用が許可されているデータを、例えば、rtfファイル等の汎用の文書作成ソフトウェアで取り扱い可能なフォーマットを有するアプリデータに変換し(ステップS305)、電子ファイルとして記憶装置111に記憶する(ステップS306)。
以下、各処理ブロックに対して詳細に説明する。
まず、ステップS301で示すブロックセレクション(BS)処理について説明する。
[ブロックセレクション処理]
図4は、ブロックセレクション処理によって読み取った1枚のイメージデータを属性を判定し複数のブロックに分割する様子を示す図である。すなわち、ブロックセレクション処理とは、符号41に示すステップS301で読み取った一頁のイメージデータを、符号42に示すようにオブジェクト毎の塊として認識し、それぞれのブロックを文字(TEXT)、写真(PHOTO)、線(LINE)、表(TABLE)等の属性に判定し、異なる属性を持つ領域(ブロック)に分割する処理である。
ブロックセレクション処理の一実施形態を以下に説明する。
まず、入力画像を白黒に2値化して、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。そして、面積の大きい黒画素の塊については、内部にある白画素に対して同様に輪郭線追跡を行って白画素の塊を抽出する。さらに、一定面積以上の白画素の塊の内部からも再帰的に黒画素の塊を抽出する。尚、上記処理は、白地に黒字等で記載されている原稿の場合の処理であって、それ以外の場合は背景に相当する色を「白」、オブジェクトに相当する色を「黒」とすることにより同様に処理することができる。
このようにして得られた黒画素の塊を、大きさ及び形状等で分類し、異なる属性を持つ領域へ分類する。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字領域とする。また、扁平な画素塊を線領域、一定の大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域等とする。これにより、1枚の原稿を読み取って作成した電子データの再利用に対してより高度な制限等を設けることができる。
図5は、ブロックセレクション処理で得られた各ブロックに対するブロック情報の一例について示す図である。図5に示されるブロック毎の情報は、後述するベクトル化或いは検索のための情報として用いられる。
[ベクトル化処理]
次に、図3のステップS304で示されるベクトル化処理について説明する。まず、文字ブロックに対しては各文字に対して文字認識処理を行う。
《文字認識》
文字認識処理のため、本実施形態では文字単位で切り出された画像に対し、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。尚、特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法を用いることができる。
ブロックセレクション処理(ステップS302)で抽出された文字領域に対して文字認識を行う場合、まず該当領域に対して横書き、縦書きの判定を行い、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。
また、文字列及び文字への分解は、横書きの場合は水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出す。一方、縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚、文字のサイズは切り出した大きさに基づいて検出することができる。
《フォント認識》
文字認識の際に用いられる字種数分の辞書特徴ベクトルを、文字形状種、すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントを認識することができる。
《文字のベクトル化》
本実施形態では、文字のベクトル化に際して、前述した文字認識及びフォント認識よって得られた文字コード及びフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。尚、元の原稿がカラー原稿の場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
以上の処理により、文字ブロックに属するイメージ情報を形状、大きさ、色ともにほぼ忠実なベクトルデータに変換することができる。これにより、高品位な文字データを取り扱うことが可能になる。
《文字以外の部分のベクトル化》
ステップS302のブロックセレクション処理で、図画或いは線、表領域とされた領域を対象として、それぞれ抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭を成す画素の点列を角とみなされる点で区切って、各区間を部分的な直線或いは曲線で近似する。ここで、「角」とは、曲率が極大となる点である。
図6は、曲率が極大となる点を説明するための図である。図6に示すように、任意点Piに対して左右k個の離れた点Pi-k〜Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi-k〜Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法等を用いて、曲線は3次スプライン関数等を用いてベクトル化することができる。
また、対象が内輪郭を持つ場合、ブロックセレクション処理で抽出した白画素輪郭の点列を用いて、同様に部分的直線或いは曲線で近似する。
以上のように、輪郭の区分線近似を用いることによって、任意形状の図形のアウトラインをベクトル化することができる。尚、入力される原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
図7は、外輪郭が内輪郭又は別の外輪郭と近接している場合に太さを持った線として表現する例について説明するための図である。図7に示すように、ある区間で外輪郭が、内輪郭又は別の外輪郭が近接している場合、2つの輪郭線を一まとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線又は曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記したような太さを持つ線の集合として、効率よくベクトル表現することができる。
尚、文字ブロックに対する文字認識処理を用いたベクトル化については前述したように、当該文字認識処理の結果、辞書からの距離が最も近い文字を認識結果として用いる。ここで、この距離が所定値以上の場合は、必ずしも本来の文字に一致するとは限らず、形状が類似する文字に誤認識するような場合が多い。従って、本実施形態では、このような文字に対しては上記したように、一般的な線画と同様に扱って当該文字をアウトライン化する。すなわち、従来は文字認識処理で誤認識を起こしていたような文字でも、誤った文字にベクトル化されることなく、可視的にイメージデータに忠実なアウトライン化によるベクトル化を行うことができる。また、写真と判定されたブロックに対しては、本実施形態ではベクトル化せずに、イメージデータのままとする。
[図形認識]
ここでは、上述したように任意形状の図形のアウトラインをベクトル化した後、これらのベクトル化された区分線を図形オブジェクト毎にグループ化する処理について説明する。
図8は、ベクトルデータを図形オブジェクト毎にグループ化するまでの処理手順を説明するためのフローチャートである。まず、各ベクトルデータの始点、終点を算出する(ステップS801)。次に、各ベクトルの始点、終点情報を用いて、図形要素を検出する(ステップS802)。ここで、図形要素の検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用して検出を行う。
次に、図形要素内に存在する他の図形要素又は区分線をグループ化し、一つの図形オブジェクトとする(ステップS803)。尚、図形要素内に他の図形要素又は区分線が存在しない場合は、図形要素を図形オブジェクトとする。
図9は、図形要素を検出する処理手順を説明するためのフローチャートである。まず、ベクトルデータから両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する(ステップS901)。次に、閉図形構成ベクトルの中から当該ベクトルの始点を開始点とし、時計回りに順にベクトルを追っていく。そして、開始点に戻るまで追跡を行い、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する(ステップS902)。尚、この際に、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらに、まだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。最後に、ステップS901で除去された不要ベクトルのうち、ステップS902で閉図形としてグループ化されたベクトルに接合しているものを検出し、一つの図形要素としてグループ化する(ステップS903)。
以上の処理によって、図形ブロックを個別に再利用可能な個別の図形オブジェクトとして扱うことが可能になる。
[アプリデータへの変換処理]
図10は、一頁分のイメージデータをブロックセレクション処理(ステップS122)及びベクトル化処理(ステップS124)によって変換された結果として得られる中間データ形式のファイルのデータ構造を示す図である。図10に示すようなデータ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。すなわち、図10は、DAOFのデータ構造を示す図である。
図10において、1001はHeader(ヘッダ)であり、処理対象の文書画像データに関する情報が保持される。1002はレイアウト記述データ部であり、文書画像データ中のTEXT(文字)、TITLE(タイトル)、CAPTION(キャプション)、LINEART(線画)、PICTURE(自然画)、FRAME(枠)、TABLE(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、一般の文書作成アプリケーションで個々のオブジェクトを再利用することはできない。そこで、次に、DAOFからアプリデータに変換する処理(ステップS306)について詳説する。
図11は、アプリデータへの変換処理全体の概略手順を説明するためのフローチャートである。まず、DAOFデータを入力する(ステップS1101)。次いで、アプリデータの元となる文書構造ツリー生成を行う(ステップS1102)。そして、生成した文書構造ツリーに基づいて、DAOF内の実データを流し込み、実際のアプリデータを生成する(ステップS1103)。
図12は、文書構造ツリー生成処理(ステップS1102)の詳細な処理手順を説明するためのフローチャートである。また、図13は、文書構造ツリーの概要を説明するための図である。尚、全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行するものとする。また、以後の説明では、ブロックとは、ミクロブロック及びマクロブロック全体を指す。
まず、ブロック単位で縦方向の関連性を元に再グループ化する(ステップS1102a)。尚、スタート直後はミクロブロック単位での判定となる。ここで、関連性とは、距離が近く、ブロック幅(横方向の場合は高さ)がほぼ同一であること等で定義することができる。また、距離、幅、高さ等の情報はDAOFを参照して抽出する。
図13において、(a)は実際のページ構成、(b)はその文書構造ツリーを示している。ステップS802aのグループ化の結果、T3、T4、T5が一つのグループV1として、T6、T7が一つのグループV2として、それぞれ同じ階層のグループとして生成される。
次に、縦方向のセパレータの有無をチェックする(ステップS1102b)。セパレータは、例えば、物理的にはDAOF中でライン属性を持つオブジェクトである。また、論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
次いで、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する(ステップS1102c)。例えば、縦方向のグルーピング長がページ高さか否かを判定する。その結果、縦方向のグループ長がページ高さとなっている場合は(Yes)、文書構造ツリー生成は終了する。例えば、図13に示すような構造の場合は、セパレータもなく、グループ高さはページ高さではないので、Noと判定され、ステップS1102dに進む。
ステップS1102dでは、ブロック単位で横方向の関連性を元に再グループ化する。但し、この再グループ化においてもスタート直後の第1回目は、ミクロブロック単位で判定を行うことになる。また、関連性及びその判定情報の定義は、縦方向の場合と同じである。例えば、図13の構造の場合は、T1とT2でH1、V1とV2でH2が生成され、H1はT1、T2の一つ上、H2はV1、V2の1つ上の同じ階層のグループとして生成される。
次いで、横方向セパレータの有無をチェックする(ステップS1102e)。図13では、S1があるので、これをツリーに登録し、H1、S1、H2という階層が生成される。そして、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する(ステップS1102f)。例えば、横方向のグルーピング長がページ幅か否かを判定する。その結果、横方向のグループ長がページ幅となっている場合(Yes)、文書構造ツリー生成は終了する。一方、ページ幅となっていない場合(No)は、ステップS1102bに戻り、再度もう一段上の階層で、縦方向の関連性チェックから繰り返す。例えば、図13の構造の場合は、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
文書構造ツリーが完成した後、その情報に基づいて、ステップS1103においてアプリデータの生成を行う。図13の構造の場合は、具体的に以下のようになる。
すなわち、H1は横方向に2つのブロックT1、T2があるので、2カラムとし、T1の内部情報(DAOFを参照した文字認識結果の文章や画像等)を出力後、カラムを変えて、T2の内部情報出力し、その後S1を出力する。また、H2は横方向に2つのブロックV1、V2があるので、2カラムとして出力し、V1はT3、T4、T5の順にその内部情報を出力し、その後カラムを変えて、V2のT6、T7の内部情報を出力する。以上により、アプリデータへの変換処理を行うことができる。これにより、ベクトル化したオブジェクトを既存の文書作成アプリケーションソフトウェア等で再利用することが可能となる。
次に、検索結果に一致したベクトル画像の記憶処理の詳細について説明する。図14は、本実施形態のMFP100におけるデータ処理装置115の細部構成を示すブロック図である。図14に示すように、データ処理装置115にはCOU1401が備わっており、ROM1402に記憶されているプログラムに従って各種動作が行われる。
図14において、1403はその動作に必要なDRAMであり、プログラムを動作させるために必要なワークメモリや画像を記憶するための画像メモリとして使用するものである。また、1404はSRAMであり、バックアップすべきデータを記憶しておくものである。さらに、1405は多値を2値への変換、及び2値から多値への変換を行う画像変換処理部であり、DRAM1403からのデータバス1416を経由して画像データを入力し、変換処理後の画像データをDRAM1403に書き戻す。同様に、1406は回転処理部、1407は変倍処理部、1408は色空間変換処理部である。
さらに、ネットワークI/Fとして1409と1410が備わっており、それぞれネットワークI/F114とFAXI/F117に接続される。また、表示部I/F1411は表示装置116に接続される。さらに、入力部I/F1412は入力装置113に接続される。さらにまた、スキャナI/F1413は画像読み取り部110に接続される。さらにまた、プリンタI/F1414は印刷装置112に接続される。さらにまた、HDDI/F1415は記憶装置111に接続される。
画像読み取り部110から読み取られた画像は、スキャナI/F1414を介してDRAM1403に蓄積される。そして、画像処理を行うユニットである画像変換処理部1405、回転処理部1406、変倍処理部1407、色空間変換部1408及びCPU1401を使用して、DRAM1403上の画像を入力装置113で指示されたモードに合うよう加工し、ネットワークI/F1409を介してネットワークI/F114から送信、或いはプリンタI/F1414を介して印刷装置112から印字を行う。同時に、HDDI/F1415を介して記憶装置111への記憶も行う。
また、ネットワークI/F1409からのデータを受信し、DRAM1403及び記憶装置111に蓄積し、画像処理を行うユニットである画像変換処理部1405、回転処理部1406、変倍処理部1407、色空間変換部1408及びCPU1401を使用して、DRAM1403上の画像を変換した後、再度ネットワークI/F1409へ転送、或いはプリンタI/F1414へ転送してプリントする。
上述したブロックセレクション(BS)処理、ベクトル化処理、アプリケーション変換処理は、マネージメントPC101にアプリケーションプログラムとして入っており、MFP100と連携して動作する。すなわち、上述したスキャンデータやネットワークI/F117からの受信データをMFP100と連携して、記憶装置111から読み出し、ネットワークI/F114を介して受信し、受信した画像をアプリケーションプログラムで処理する。
図15は、本実施形態に係るMFP100におけるベクトル画像蓄積処理の詳細を説明するためのフローチャートである。まず、MFP100は、あらかじめマネージメントPC101に記憶しておいたキーワードを受信し、そのキーワードを表示装置116に表示する(ステップS1501)。次に、入力装置113を使って選択されたキーワードをマネージメントPC101に送信する(ステップS1502)。そして、ここからMFP100でのスキャン動作が開始する。
すなわち、MFP100は、1ページのスキャン動作及び記憶装置111への画像の記憶を行う(ステップS1503)。そして、マネージメント101へ送信可能であることを示すイベントを送信する(ステップS1504)。その後、マネージメントPC101が受信可能な状態であるか否かを判断する(ステップS1505)。その結果、マネージメントPC101が受信可能であれば(Yes)、1ページの画像を記憶装置111から読み出してマネージメントPC101に送信する(ステップS1506)。一方、マネージメントPC101が受信可能な状態ではない場合(No)、受信可能な状態になるまで待ち状態となり、ステップS1505の判断を続ける。
ステップS1506で画像を送信した後、次にスキャンできる画像があるかどうかを判断する(ステップS1507)。その結果、そのような画像がある場合(Yes)は、ステップS1503に戻って上述した動作を繰り返す。一方、画像がない場合(No)は本蓄積処理を終了する。
図16は、ステップS1501のキーワードの選択処理を行うための具体例を説明するための図である。このキーワードとは、コピー、印刷、送信、再利用等を原則禁止するための情報であり、例えば、禁止や機密等の文字、またはそれを表す画像やマーク等がそれに当たる。図16において、1601は表示画面に表示されたキーワード入力選択画面である。この画面から文字、自然画、フレーム、テーブル、ラインアートといったベクトル化されるオブジェクトのキーワードとなる文字列やファイルを選択することができる。また、1602はテキスト、タイトル、キャプションといった文字列を検索するためのキーワードを選択するためのチェックボックスである。さらに、1603はマネージメントPC101に登録されているキーワードが表示される表示ボックスである。尚、キーワードは選択せずに、入力装置113を使用して入力するようにしてもよい。また、キーワードとなるオブジェクトが自然画の場合は画像読み取り部110から読み取らせるなどして登録しておくことが可能である。
また、1604は自然画を検索するためのキーワードを選択するためのチェックボックスであり、1605はマネージメントPC101に記憶されているキーワードとなるファイルが表示される表示ボックスである。同様に、1607はフレームのためのチェックボックスであり、1608はそのキーワードファイルが表示される表示ボックスである。さらに、1609はテーブルのためのチェックボックスであり、151はそのキーワードファイルが表示される表示ボックスである。さらにまた、1611はラインアートのためのチェックボックスであり、1612はそのキーワードファイルが表示される表示ボックスである。
さらにまた、1613は類似度を入力するためのボックスであり、ここに表示された値以上であればキーワードが一致しているとみなす。さらにまた、1614は前述した選択したファイルのプレビュー表示のためのボタンである。さらにまた、1615は設定を有効にするためのOKボタンである。
図17は、ベクトルデータを保存するためのマネージメントPC101の動作手順を説明するためのフローチャートである。まず、マネージメントPC101は、前述した図15のステップS1507でMFP100から送信されたベクトル化された画像を記憶するための検索キーワードを受け取る(ステップS1701)。次に、マネージメントPC101は、当該検索キーワードを受け取ったと判定されるまで待ち状態を続ける(ステップS1702)。
そして、検索キーワードを受け取った後、画像データを受信できる状態であるか否かを判断する(ステップS1703)。その結果、画像データを受信できる状態である場合(Yes)はMFP100から送信されてきたページデータを受信する(ステップS1704)。そして、受信したページデータに対してブロックセレクション処理やベクトル化処理を行う(ステップS1705)。さらに、MFP100から受信したキーワードとの類似度を調べる(ステップS1706)。
その結果、類似度が設定された範囲内(例えば、設定した数値以上)であれば(Yes)、当該ベクトルデータの保存を行う(ステップS1707)。一方、類似度が設定した値を満たさない場合(No)は生成したベクトルデータを破棄する(ステップS1708)。
図18は、本実施形態における画像処理システムでのキーワードの生成手順を説明するためのフローチャートである。まず、MFP100において原稿のスキャンが行われる(ステップS1801)。次に、マネージメントPC101に対して、MFP100でスキャンによって取得されたラスタ画像を送信する(ステップS1802)。さらに、マネージメントPC101は、MFP100からベクトル化された情報を受信し(ステップS1803)、表示装置に表示する(ステップS1804)。
そして、マネージメントPC101は必要なキーワードを選択させ(ステップS1805)、1つ以上のキーワードがあるか否かを判定する(ステップS1806)。その結果、1つ以上のキーワードがある場合(Yes)はマネージメントPC101に対してキーワードの保存を依頼する(ステップS1807)。これによって、マネージメントPC101は、依頼されたキーワードを保存して、前述した図17のフローチャートで説明したキーワード選択の際に利用する。一方、キーワードがない場合(No)はそのまま終了する。
ここで、ステップS1706の判定処理におけるキーワードとの類似度が一致する場合の一例について説明する。本実施形態では、一致する文字数によって文字列の類似度を決める。例えば、「ABCD株式会社です」というキーワードに対して「ABCD株式会社だよ」という文字列が入力された場合は、10文字中8文字が一致しているので80パーセントの類似度になる。
また、自然画の場合には例えば式(1)に示すように、平均二乗誤差から類似度を演算することができる。尚、式(1)において、Keyはキーワードの画素値、Imageはスキャン画像の画素値を示す。
Figure 2006023944
尚、テーブル、フレーム、ラインアートは、列数や相対的に一致する場所に存在する線の相対長さから類似度を計算することができる。また、Keyとなるベクトル画像とスキャンしたImageのベクトル画像との比率分をImageに乗算してサイズを補正し、図19に示すように補正した上で差分ベクトル(Key−Image)を求め、式(1)を用いて平均二乗誤差から類似度を計算することができる。すなわち、図19は、Keyとなるベクトル画像とスキャンしたImageのベクトル画像との差分ベクトルを示す図である。
このように、本実施形態に係る画像処理システムによれば、マネージメントPC101には設定された類似度以上のキーワードに一致するものだけがベクトル画像として残るため、画像データを記憶する画像記憶領域は小さくてすむ上、さらに必要なデータだけを残すことができる。また、ベクトルデータを記憶するときにはユーザの部門管理データを参照したり、日付、時刻を合わせて記憶するようにすることで、誰がいつ記憶したものであるのかを後日容易に検索することができる。
また、キーワードとなるオブジェクトを所定の文字とする場合は、その文字コードに基づく文字種によって判定すればよく、その文字サイズ、文字の色、文字の形状には関わらないので、全てが画像パターン同士を比較するものに比べて判定処理が格段に簡略化できるし、その画像パターンを登録するメモリも無駄に使うことがない。
同じく、関数化された図形情報をキーワードとして用いる場合にもその関数の特徴(図形の大きさ、色等には関わらない)によって判定すればよく、文字の場合と同様の効果が得られる。
また、スキャンされたイメージ情報に含まれるオブジェクトのうち、少なくとも1つのオブジェクトが入力されたキーワード情報と類似していると判定された場合には、当該オブジェクトの部分だけでなく、当該イメージ情報から生成されたベクトルデータをそのまま記憶装置に記憶するようにしてもよい。これによって、原稿に「秘」の文字や会社等のロゴが入った原稿が許可なくコピー等された場合に文書全体をベクトルデータとして記憶しておくことが可能となる。尚、記憶装置の容量に余裕のある場合は、ベクトル化処理前のイメージ情報を残すようにしてもよいことは言うまでもない。
また、以上の説明ではスキャンされたイメージ情報についての処理について説明したが、これに限ることなく、ネットワーク上のデバイスから受信したイメージ情報、ファクシミリ受信したイメージ情報、メモリから読み出したイメージ情報などを印刷、送信、メモリへ蓄積する場合など種々の処理について適用可能であることは言うまでもない。
以上、本発明の一実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
本発明の一実施形態に係る画像処理システムの構成を示すブロック図である。 本発明の一実施形態に係るMFP100の構成を示すブロック図である。 本発明の一実施形態に係る画像処理システムによる画像処理の手順について説明するためのフローチャートである。 ブロックセレクション処理によって読み取った1枚のイメージデータを属性を判定し複数のブロックに分割する様子を示す図である。 ブロックセレクション処理で得られた各ブロックに対するブロック情報の一例について示す図である。 曲率が極大となる点を説明するための図である。 外輪郭が内輪郭又は別の外輪郭と近接している場合に太さを持った線として表現する例について説明するための図である。 ベクトルデータを図形オブジェクト毎にグループ化するまでの処理手順を説明するためのフローチャートである。 図形要素を検出する処理手順を説明するためのフローチャートである。 一頁分のイメージデータをブロックセレクション処理(ステップS122)及びベクトル化処理(ステップS124)によって変換された結果として得られる中間データ形式のファイルのデータ構造を示す図である。 アプリデータへの変換処理全体の概略手順を説明するためのフローチャートである。 文書構造ツリー生成処理(ステップS802)の詳細な処理手順を説明するためのフローチャートである。 文書構造ツリーの概要を説明するための図である。 本実施形態のMFP100におけるデータ処理装置115の細部構成を示すブロック図である。 本実施形態に係るMFP100におけるベクトル画像蓄積処理の詳細を説明するためのフローチャートである。 ステップS1501のキーワードの選択処理を行うための具体例を説明するための図である。 ベクトルデータを保存するためのマネージメントPC101の動作手順を説明するためのフローチャートである。 本実施形態における画像処理システムでのキーワードの生成手順を説明するためのフローチャートである。 Keyとなるベクトル画像とスキャンしたImageのベクトル画像との差分ベクトルを示す図である。
符号の説明
100 デジタル複合機(MFP)
101 マネージメントPC
102 クライアントPC
103a、103b プロキシサーバ
104 ネットワーク
105a、105b データベース
106a、106b 文書管理サーバ
107、108、109 LAN
110 画像読み取り部
111 記憶装置
112 印刷装置
113 入力装置
114 ネットワークI/F
115 データ処理装置
116 表示装置
117 ファクシミリI/F

Claims (18)

  1. イメージ情報を入力する入力手段と、
    前記入力手段で入力された前記イメージ情報からベクトルデータを生成するベクトル化手段と、
    所定のオブジェクト情報を入力するオブジェクト情報入力手段と、
    前記ベクトル化手段で生成した前記ベクトルデータに前記オブジェクト情報入力手段で入力した前記オブジェクト情報に類似する情報が含まれているか否かを判定する判定手段と、
    前記判定手段によって前記ベクトルデータに前記オブジェクト情報が含まれていると判定された場合に該ベクトルデータを特定の属性情報と対応付けて記憶する記憶手段と
    を備えることを特徴とする画像処理システム。
  2. ユーザを認証する認証手段をさらに備え、
    前記記憶手段が、前記認証手段によって認証されたユーザに関する情報を前記ベクトルデータに対応付けて記憶する
    ことを特徴とする請求項1に記載の画像処理システム。
  3. 前記ベクトルデータに含まれている情報と前記オブジェクト情報との類似度を判定するための判定値を設定する設定手段をさらに備え、
    前記判定手段は、前記類似度が前記判定値よりも大きい場合、前記ベクトルデータに前記オブジェクト情報に含まれているとみなすことを特徴とする請求項1又は2に記載の画像処理システム。
  4. 前記ベクトル化手段が、前記イメージ情報から抽出された文字情報を含むベクトルデータを生成し、
    前記オブジェクト情報入力手段が、文字情報をキーワード情報として入力し、
    前記判定手段が、前記ベクトル化手段によって生成された前記ベクトルデータに含まれる前記文字情報と前記オブジェクト情報入力手段によって入力された前記キーワード情報との類似度を判定する
    ことを特徴とする請求項1から3までのいずれか1項に記載の画像処理システム。
  5. 前記イメージ情報を複数のオブジェクトに分割する分割手段をさらに備え、
    前記判定手段が、前記分割手段によって分割されたそれぞれのオブジェクトごと独立にオブジェクト情報が含まれているか否かを判定する
    ことを特徴とする請求項1から4までのいずれか1項に記載の画像処理システム。
  6. 前記判定手段によって前記イメージ情報に含まれる少なくとも1つのオブジェクトが前記オブジェクト情報入力手段によって入力されたオブジェクト情報と類似している情報を含むと判定された場合、前記記憶手段は、前記ベクトル化手段によって前記イメージ情報をベクトル化した前記ベクトルデータを記憶することを特徴とする請求項5に記載の画像処理システム。
  7. 前記入力手段が、紙原稿を光学的に読み取って得られた前記イメージ情報を入力することを特徴とする請求項1から6までのいずれか1項に記載の画像処理システム。
  8. 前記入力手段が、他装置が保持しているイメージ情報を有線通信又は無線通信を介して取得して入力することを特徴とする請求項1から6までのいずれか1項に記載の画像処理システム。
  9. 前記イメージ情報を所定の文書作成ソフトウェアで取り扱い可能なフォーマットに変換するフォーマット変換手段をさらに備えることを特徴とする請求項1から8までのいずれか1項に記載の画像処理システム。
  10. イメージ情報を入力する入力工程と、
    前記入力工程で入力された前記イメージ情報からベクトルデータを生成するベクトル化工程と、
    所定のオブジェクト情報を入力するオブジェクト情報入力工程と、
    前記ベクトル化工程で生成した前記ベクトルデータに前記オブジェクト情報入力工程で入力した前記オブジェクト情報に類似する情報が含まれているか否かを判定する判定工程と、
    前記判定工程によって前記ベクトルデータに前記オブジェクト情報が含まれていると判定された場合に該ベクトルデータを特定の属性情報と対応付けて記憶装置に記憶する記憶工程と
    を有することを特徴とする画像処理方法。
  11. コンピュータに、
    イメージ情報を入力する入力手順と、
    前記入力手順で入力された前記イメージ情報からベクトルデータを生成するベクトル化手順と、
    所定のオブジェクト情報を入力するオブジェクト情報入力手順と、
    前記ベクトル化手順で生成した前記ベクトルデータに前記オブジェクト情報入力手順で入力した前記オブジェクト情報に類似する情報が含まれているか判定する判定手順と、
    前記判定手順によって前記ベクトルデータに前記オブジェクト情報が含まれていると判定された場合に該ベクトルデータを特定の属性情報と対応付けて記憶装置に記憶する記憶手順と
    を実行させるためのプログラム。
  12. イメージ情報を入力する入力手段と、
    所定のキーワードを保持する保持手段と、
    前記入力手段で入力された前記イメージ情報に含まれるキーワード情報を識別する識別手段と、
    前記保持手段で保持しているキーワードと前記識別手段で識別した前記キーワード情報とが一致するか否かを判定する判定手段と、
    前記判定手段で一致すると判定された場合に前記入力手段で入力した前記イメージ情報を特定の属性情報と対応付けて記憶する記憶手段と
    を備えることを特徴とする画像処理システム。
  13. 前記判定手段は前記保持手段が保持する前記キーワードの文字種と前記識別手段で識別した前記キーワード情報の文字種とが一致した場合に両者が一致すると判定することを特徴とする請求項12に記載の画像処理システム。
  14. ユーザを認証する認証手段をさらに備え、
    前記記憶手段が、前記認証手段によって認証されたユーザに関する情報を前記入力手段で入力した前記イメージ情報と対応付けて記憶する
    ことを特徴とする請求項12又は13に記載の画像処理システム。
  15. 前記入力手段で入力した前記イメージ情報をベクトル化するベクトル化手段をさらに備え、
    前記記憶手段は前記入力手段で入力した前記イメージ情報を前記ベクトル化手段でベクトル化した後に特定の属性情報と対応付けて記憶する
    ことを特徴とする請求項12から14までのいずれか1項に記載の画像処理システム。
  16. イメージ情報を入力する入力工程と、
    所定のキーワードを保持する保持工程と、
    前記入力工程で入力された前記イメージ情報に含まれるキーワード情報を識別する識別工程と、
    前記保持工程で保持しているキーワードと前記識別工程で識別した前記キーワード情報とが一致するか否かを判定する判定工程と、
    前記判定工程で一致すると判定された場合に前記入力工程で入力した前記イメージ情報を特定の属性情報と対応付けて記憶装置に記憶する記憶工程と
    を有することを特徴とする画像処理方法。
  17. コンピュータに、
    イメージ情報を入力する入力手順と、
    所定のキーワードを保持する保持手順と、
    前記入力手順で入力された前記イメージ情報に含まれるキーワード情報を識別する識別手順と、
    前記保持手順で保持しているキーワードと前記識別手順で識別した前記キーワード情報とが一致するか否かを判定する判定手順と、
    前記判定手順で一致すると判定された場合に前記入力手順で入力した前記イメージ情報を特定の属性情報と対応付けて記憶装置に記憶する記憶手順と
    を実行させるためのプログラム。
  18. 請求項11又は17に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2004200806A 2004-07-07 2004-07-07 画像処理システム及び画像処理方法 Pending JP2006023944A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004200806A JP2006023944A (ja) 2004-07-07 2004-07-07 画像処理システム及び画像処理方法
US11/174,570 US7596271B2 (en) 2004-07-07 2005-07-06 Image processing system and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004200806A JP2006023944A (ja) 2004-07-07 2004-07-07 画像処理システム及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2006023944A true JP2006023944A (ja) 2006-01-26
JP2006023944A5 JP2006023944A5 (ja) 2007-08-23

Family

ID=35542573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004200806A Pending JP2006023944A (ja) 2004-07-07 2004-07-07 画像処理システム及び画像処理方法

Country Status (2)

Country Link
US (1) US7596271B2 (ja)
JP (1) JP2006023944A (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4181892B2 (ja) * 2003-02-21 2008-11-19 キヤノン株式会社 画像処理方法
JP4208780B2 (ja) * 2004-07-07 2009-01-14 キヤノン株式会社 画像処理システム及び画像処理装置の制御方法並びにプログラム
JP2006023945A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP4227569B2 (ja) * 2004-07-07 2009-02-18 キヤノン株式会社 画像処理システム、画像処理装置の制御方法、プログラム及び記録媒体
JP2006025129A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP4829768B2 (ja) * 2006-12-19 2011-12-07 キヤノン株式会社 画像形成装置、画像形成装置の制御方法、画像形成装置を管理する管理装置、及び画像形成装置を管理する管理装置の制御方法
JP4873554B2 (ja) * 2006-12-25 2012-02-08 株式会社リコー 画像配信装置および画像配信方法
US10965480B2 (en) 2011-09-14 2021-03-30 Barco N.V. Electronic tool and methods for recording a meeting
US11258676B2 (en) 2011-09-14 2022-02-22 Barco N.V. Electronic tool and methods for meetings
US9083769B2 (en) 2011-09-14 2015-07-14 Barco N.V. Electronic tool and methods for meetings
US8756348B2 (en) 2011-09-14 2014-06-17 Barco N.V. Electronic tool and methods for meetings
US9769365B1 (en) 2013-02-15 2017-09-19 Red.Com, Inc. Dense field imaging
JP6000992B2 (ja) * 2014-01-24 2016-10-05 京セラドキュメントソリューションズ株式会社 文書ファイル生成装置及び文書ファイル生成方法

Family Cites Families (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4759075A (en) 1983-03-14 1988-07-19 Ana Tech Corporation Method and apparatus for vectorizing documents and symbol recognition
US4908873A (en) * 1983-05-13 1990-03-13 Philibert Alex C Document reproduction security system
US5062074A (en) * 1986-12-04 1991-10-29 Tnet, Inc. Information retrieval system and method
US4935821A (en) * 1987-08-13 1990-06-19 Ricoh Company, Ltd. Image processing apparatus for multi-media copying machine
JPH02184173A (ja) 1989-01-11 1990-07-18 Canon Inc 原稿読取装置
JP3064334B2 (ja) 1990-05-31 2000-07-12 株式会社東芝 図面処理方法および装置
US5761655A (en) * 1990-06-06 1998-06-02 Alphatronix, Inc. Image file storage and retrieval system
JPH04302073A (ja) 1991-03-29 1992-10-26 Meidensha Corp 文字認識装置
JPH05342408A (ja) 1991-04-04 1993-12-24 Fuji Xerox Co Ltd 文書画像ファイリング装置
JPH0512402A (ja) 1991-07-05 1993-01-22 Ricoh Co Ltd 電子フアイルシステムの文字編集処理方法
JP2775122B2 (ja) 1991-07-23 1998-07-16 三谷商事 株式会社 イラストデータの自動輪郭抽出ベクトル化処理方法,及びそれに使用する処理装置
US5251268A (en) 1991-08-09 1993-10-05 Electric Power Research Institute, Inc. Integrated method and apparatus for character and symbol recognition
JPH05303644A (ja) 1992-04-27 1993-11-16 Arumonikosu:Kk 画像処理装置の図形認識方法
JPH05334430A (ja) 1992-05-28 1993-12-17 Toshiba Corp 自動ベクトル化装置
JPH0646271A (ja) 1992-07-22 1994-02-18 Nec Corp ファクシミリ装置
JPH06119448A (ja) 1992-10-08 1994-04-28 Meidensha Corp 画像処理方法
JP3318993B2 (ja) 1992-11-30 2002-08-26 ミノルタ株式会社 画像形成装置
JPH06270477A (ja) 1993-03-19 1994-09-27 Fujitsu Ltd 画像形成装置
JPH06290264A (ja) 1993-03-31 1994-10-18 Nec Software Ltd 画像データの自動歪み補正システム
JPH0736433A (ja) 1993-07-22 1995-02-07 Fujitsu Ltd 文字データベース作成装置
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
JPH0785221A (ja) 1993-09-13 1995-03-31 Meidensha Corp 図面自動認識装置の文字とシンボルの分離・認識方法
US20040250083A1 (en) * 1994-03-03 2004-12-09 Barry Schwab Secure interactive digital system for displaying items to a user identified as having permission to access the system
US5761689A (en) * 1994-09-01 1998-06-02 Microsoft Corporation Autocorrecting text typed into a word processing document
US5642435A (en) * 1995-01-25 1997-06-24 Xerox Corporation Structured document processing with lexical classes as context
JP3160177B2 (ja) 1995-03-06 2001-04-23 松下電器産業株式会社 ファクシミリ型電子メール装置
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
JPH0950433A (ja) 1995-08-10 1997-02-18 Hitachi Ltd 手書き文字認識装置
US5848186A (en) * 1995-08-11 1998-12-08 Canon Kabushiki Kaisha Feature extraction system for identifying text within a table image
US5809171A (en) * 1996-01-05 1998-09-15 Mcdonnell Douglas Corporation Image processing method and apparatus for correlating a test image with a template
KR100209350B1 (ko) 1996-05-27 1999-07-15 이계철 유사도 함수를 이용한 전자지도 정밀도 검증방법
US6275610B1 (en) * 1996-10-16 2001-08-14 Convey Corporation File structure for scanned documents
JPH10293737A (ja) 1997-04-18 1998-11-04 Hitachi Ltd 分散db上の情報の融合、表示方法
US5995978A (en) * 1997-09-24 1999-11-30 Ricoh Company, Ltd. Navigation system for document image database
US6301586B1 (en) * 1997-10-06 2001-10-09 Canon Kabushiki Kaisha System for managing multimedia objects
US6343327B2 (en) 1997-11-12 2002-01-29 Pitney Bowes Inc. System and method for electronic and physical mass mailing
JP4071328B2 (ja) * 1997-11-18 2008-04-02 富士通株式会社 文書画像処理装置および方法
US6658145B1 (en) * 1997-12-31 2003-12-02 Cognex Corporation Fast high-accuracy multi-dimensional pattern inspection
JP4136044B2 (ja) 1997-12-24 2008-08-20 オリンパス株式会社 画像処理装置及びその画像処理方法
JPH11284835A (ja) 1998-01-30 1999-10-15 Konica Corp プリンタ
JP3589007B2 (ja) 1998-02-18 2004-11-17 三菱電機株式会社 文書ファイリングシステムおよび文書ファイリング方法
JPH11312244A (ja) 1998-04-28 1999-11-09 Hitachi Ltd テンプレートマッチング方法
US6104500A (en) * 1998-04-29 2000-08-15 Bcl, Computer Inc. Networked fax routing via email
US6275850B1 (en) * 1998-07-24 2001-08-14 Siemens Information And Communication Networks, Inc. Method and system for management of message attachments
US6741743B2 (en) * 1998-07-31 2004-05-25 Prc. Inc. Imaged document optical correlation and conversion system
US6138156A (en) * 1998-10-05 2000-10-24 International Business Machines Corporation Selecting and applying content-reducing filters based on dynamic environmental factors
JP3581265B2 (ja) * 1999-01-06 2004-10-27 シャープ株式会社 画像処理方法およびその装置
JP2000261574A (ja) 1999-01-08 2000-09-22 Daito Shinsha:Kk 携帯用端末装置およびデータ通信システム
US6434552B1 (en) * 1999-01-29 2002-08-13 Hewlett-Packard Company Method for data retrieval
DE60027637T2 (de) * 1999-05-06 2006-09-28 Seiko Epson Corp. Netzwerkverwaltungssystem
JP2000322425A (ja) 1999-05-10 2000-11-24 Canon Inc ドキュメントサーバ装置、文書処理方法、及び記憶媒体
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition
TW504619B (en) 1999-06-04 2002-10-01 Ibm Internet mail delivery agent with automatic caching of file attachments
US6580820B1 (en) 1999-06-09 2003-06-17 Xerox Corporation Digital imaging method and apparatus for detection of document security marks
JP3767667B2 (ja) 1999-08-18 2006-04-19 富士ゼロックス株式会社 画像処理装置
US6470336B1 (en) * 1999-08-25 2002-10-22 Matsushita Electric Industrial Co., Ltd. Document image search device and recording medium having document search program stored thereon
US6360252B1 (en) * 1999-09-20 2002-03-19 Fusionone, Inc. Managing the transfer of e-mail attachments to rendering devices other than an original e-mail recipient
US20040148274A1 (en) * 1999-10-15 2004-07-29 Warnock Christopher M. Method and apparatus for improved information transactions
US6707568B1 (en) * 1999-11-02 2004-03-16 Ricoh Company, Ltd. Printer driver filter and method of printing with the same
JP3756719B2 (ja) * 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置
JP2001218030A (ja) 2000-01-31 2001-08-10 Canon Inc 画像処理装置、画像処理方法及び記憶媒体
GB0005515D0 (en) * 2000-03-08 2000-04-26 Univ Glasgow Improved vector quantization of images
US6687741B1 (en) * 2000-05-24 2004-02-03 Microsoft Corporation Sending a file as a link and/or as an attachment
US6944344B2 (en) * 2000-06-06 2005-09-13 Matsushita Electric Industrial Co., Ltd. Document search and retrieval apparatus, recording medium and program
JP4261739B2 (ja) * 2000-06-15 2009-04-30 キヤノン株式会社 画像処理装置、画像処理方法、記憶媒体及び画像処理システム
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
JP3554271B2 (ja) * 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
US6944815B2 (en) * 2000-12-15 2005-09-13 International Business Machines Corporation Technique for content off-loading in a document processing system using stub documents
US6782144B2 (en) * 2001-03-12 2004-08-24 Multiscan Corp. Document scanner, system and method
JP4586281B2 (ja) * 2001-03-13 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 データ送信管理装置、データ送信管理方法、データ送信管理プログラムおよびデータ送信管理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3962635B2 (ja) * 2001-06-26 2007-08-22 キヤノン株式会社 画像処理装置およびその制御方法
JP2003022307A (ja) 2001-07-10 2003-01-24 Nec Fielding Ltd 販売システム
JP2003107119A (ja) 2001-07-26 2003-04-09 Nidec-Read Corp 配線の電気特性表示装置および配線検査方法
US6712265B2 (en) * 2001-07-30 2004-03-30 United Microelectronics, Corp. System and method for interlocking management in semiconductor material supply equipment
US20030031371A1 (en) * 2001-08-02 2003-02-13 Shinichi Kato Image encoding apparatus and image decoding apparatus
US7415664B2 (en) * 2001-08-09 2008-08-19 International Business Machines Corporation System and method in a spreadsheet for exporting-importing the content of input cells from a scalable template instance to another
US7117210B2 (en) * 2001-09-06 2006-10-03 Danger, Inc. System and method of distributing a file by email
US20030051044A1 (en) * 2001-09-12 2003-03-13 Parry Travis J. System and method for facilitating generation of hard copies
JP2003125401A (ja) * 2001-10-17 2003-04-25 Mitsubishi Electric Corp 映像データ再生方法
JP4147764B2 (ja) 2001-10-30 2008-09-10 富士ゼロックス株式会社 画像読取装置およびプログラム
US6796433B2 (en) * 2001-11-07 2004-09-28 Pitney Bowes Inc. Method of post processing OCR information obtained from mailpieces using a customer specific keyword database and a mailpiece sorting apparatus
JP2003169169A (ja) 2001-11-30 2003-06-13 Canon Inc 文書送信装置
JP3843829B2 (ja) * 2001-12-11 2006-11-08 コニカミノルタビジネステクノロジーズ株式会社 画像読取システム
JP2003248832A (ja) 2002-02-25 2003-09-05 Canon Inc 連続線分列の抽出方法、該連続線分列の抽出方法を実現するためのプログラムおよび連続線分列の抽出装置
US20040137416A1 (en) * 2002-04-05 2004-07-15 Yue Ma System and method using adaptive learning components to enhance target advertising and customize system behavior
JP2003312082A (ja) * 2002-04-22 2003-11-06 Toshiba Tec Corp 画像形成装置
US6799717B2 (en) * 2002-06-10 2004-10-05 Hewlett-Packard Development Company, L.P. Document auto-routing using a digital transmitter cover sheet
US20050144136A1 (en) * 2002-06-28 2005-06-30 Fujitsu Limited Content providing system and content reproducing apparatus
US20040010419A1 (en) * 2002-07-15 2004-01-15 Sinnott Timothy John Method and apparatus for facilitating acquistion of prospective payoff information on an existing loan account
JP2004096200A (ja) * 2002-08-29 2004-03-25 Canon Inc 画像処理システム及びその制御方法
US20040083434A1 (en) * 2002-10-24 2004-04-29 Catherine Fitch System and method for selectively formatting and outputting handwritten notes and drawings
US7145571B2 (en) * 2002-11-01 2006-12-05 Tenebraex Corporation Technique for enabling color blind persons to distinguish between various colors
US7240077B1 (en) * 2002-12-30 2007-07-03 Amazon.Com, Inc. Web site content change management
JP2004242287A (ja) * 2003-01-14 2004-08-26 Canon Inc 情報処理方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US20040151377A1 (en) * 2003-02-04 2004-08-05 Boose Molly L. Apparatus and methods for converting network drawings from raster format to vector format
US7339598B2 (en) * 2003-07-11 2008-03-04 Vistaprint Technologies Limited System and method for automated product design
US20050018237A1 (en) * 2003-07-22 2005-01-27 Cossel Travis M. Digital transmitter security
US7287698B2 (en) * 2003-07-28 2007-10-30 Ricoh Co., Ltd. Automatic cleanup of machine readable codes during image processing
US7412602B2 (en) * 2003-09-30 2008-08-12 Toshiba Corporation Method and system for storing document images in a network file system
JP2005149061A (ja) * 2003-11-14 2005-06-09 Ricoh Co Ltd 情報処理システム、プログラム、及び記憶媒体
JP3862694B2 (ja) 2003-11-20 2006-12-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP3796500B2 (ja) * 2003-11-21 2006-07-12 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP3997198B2 (ja) 2003-12-05 2007-10-24 キヤノン株式会社 画像処理システム及び画像処理方法
US7392533B2 (en) * 2004-05-19 2008-06-24 Microsoft Corporation System and method for management of a componentized electronic document retrievable over a network
US8477331B2 (en) * 2004-05-27 2013-07-02 Property Publications Pte Ltd. Apparatus and method for creating an electronic version of printed matter
JP4574235B2 (ja) * 2004-06-04 2010-11-04 キヤノン株式会社 画像処理装置、及びその制御方法、プログラム
JP4510535B2 (ja) 2004-06-24 2010-07-28 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4208780B2 (ja) 2004-07-07 2009-01-14 キヤノン株式会社 画像処理システム及び画像処理装置の制御方法並びにプログラム
JP2006025129A (ja) 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP2006023945A (ja) 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP4227569B2 (ja) 2004-07-07 2009-02-18 キヤノン株式会社 画像処理システム、画像処理装置の制御方法、プログラム及び記録媒体
JP2006150791A (ja) * 2004-11-30 2006-06-15 Kyocera Mita Corp 画像形成装置
JP2006189924A (ja) * 2004-12-28 2006-07-20 Kyocera Mita Corp 画像表示プログラム及び画像表示装置

Also Published As

Publication number Publication date
US20060010116A1 (en) 2006-01-12
US7596271B2 (en) 2009-09-29

Similar Documents

Publication Publication Date Title
JP4266784B2 (ja) 画像処理システム及び画像処理方法
US7551753B2 (en) Image processing apparatus and method therefor
US7681121B2 (en) Image processing apparatus, control method therefor, and program
US7596271B2 (en) Image processing system and image processing method
US7640269B2 (en) Image processing system and image processing method
US7876471B2 (en) Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document
JP4393161B2 (ja) 画像処理装置及び画像処理方法
JP4510535B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US20060008113A1 (en) Image processing system and image processing method
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
US20070133031A1 (en) Image processing apparatus and image processing method
JP2008109394A (ja) 画像処理装置及びその方法、プログラム
JP2005167937A (ja) 画像処理システム及び画像処理方法
JP4338189B2 (ja) 画像処理システム及び画像処理方法
JP4541770B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2007129557A (ja) 画像処理システム
JP4185858B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP4310176B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2006146486A (ja) 画像処理装置
JP2005208872A (ja) 画像処理システム
JP2005157447A (ja) 画像処理システム及び画像処理方法
JP2005165674A (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2005149098A (ja) 画像処理システム及び画像処理装置並びに画像処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070709

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070709

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070709

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090427