JP2007049388A - 画像処理装置及びその制御方法、プログラム - Google Patents

画像処理装置及びその制御方法、プログラム Download PDF

Info

Publication number
JP2007049388A
JP2007049388A JP2005231171A JP2005231171A JP2007049388A JP 2007049388 A JP2007049388 A JP 2007049388A JP 2005231171 A JP2005231171 A JP 2005231171A JP 2005231171 A JP2005231171 A JP 2005231171A JP 2007049388 A JP2007049388 A JP 2007049388A
Authority
JP
Japan
Prior art keywords
image
comparison
block information
block
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005231171A
Other languages
English (en)
Other versions
JP2007049388A5 (ja
JP4533273B2 (ja
Inventor
Masahiro Matsushita
昌弘 松下
Hiroshi Tojo
洋 東條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005231171A priority Critical patent/JP4533273B2/ja
Priority to US11/460,548 priority patent/US7746507B2/en
Priority to EP06254053A priority patent/EP1752895A1/en
Priority to CNB2006101148656A priority patent/CN100414550C/zh
Publication of JP2007049388A publication Critical patent/JP2007049388A/ja
Publication of JP2007049388A5 publication Critical patent/JP2007049388A5/ja
Application granted granted Critical
Publication of JP4533273B2 publication Critical patent/JP4533273B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Business, Economics & Management (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 オリジナル画像を用いて印刷された文書に、オリジナル画像にはない余白領域が文書領域の周りに生じているような場合でも、その文書のスキャン画像とオリジナル画像との高精度なレイアウト比較が可能となる画像処理装置及びその制御方法、プログラムを提供する。
【解決手段】 比較先画像となるオリジナル画像を入力する。オリジナル画像中のブロックに関するブロック情報を抽出する。オリジナル画像のサイズが所定サイズであるか否かを判定する。判定の結果、オリジナル画像のサイズが所定サイズではない場合、オリジナル画像を所定サイズの画像にマッピングした際のブロックに関するブロック情報を作成する。比較元画像を入力する。比較元画像中のブロックに関するブロック情報を抽出する。比較元画像のブロック情報と、比較先画像のブロック情報とを比較する。
【選択図】 図9

Description

本発明は、複写機などの画像入力装置で、読み取った紙文書に対応するオリジナルの電子データを検索し、オリジナルの電子データを印刷、配信、蓄積、編集などに活用することを可能とする画像処理装置及びその制御方法、プログラムに関するものである。
近年、デジタル化が進み、文書を電子ファイルとしてデータベースに格納されるようになっている。データベース上の電子ファイルを印刷された文書のスキャン画像で手軽に検索する要望が高まっている。これを実現する方法として、文書画像に含まれるテキスト領域や画像領域の位置関係を示すレイアウトを解析し、レイアウト同士を比較する方法が提案されている。特許文献1では、文書画像を領域分割し、その領域の数を絞込条件として領域数の一致する文書の特徴を比較する方法が開示されている。
特開平11−328417号公報
ここで、例えば、カタログ等では、A4やLetterサイズ等のいわゆる定形サイズの用紙ではないサイズの用紙に印刷されることも多々ある。この場合、それらの電子ファイルに設定されている印刷用紙サイズは、定形外のサイズとなっている。しかしながら、オフィス等の拠点でこれらの電子ファイルを印刷する際は、定形サイズの用紙に印刷して利用する機会が多い。より厳密には、標準的に使用されている用紙サイズは、A4もしくはLetterの1種類であり、国によって異なっている。
定形外サイズのものを定形サイズに印刷する際に、その大きさが定形サイズに収まる場合は、アスペクト比の違いから大きな余白部分が生じてしまう。一方、大きさが定形サイズに収まらない場合に、電子ファイルの文書領域全体を変形させることなく印刷するためには、印刷対象の画像の縮小を行う必要があり、その結果、やはり大きな余白部分が生じてしまう。
このような場合の一例について、図24を用いて説明する。
図24において、2401は用紙設定が不定形サイズになっている電子ファイルの1ページをラスタライズしたオリジナル画像であり、この中に文字または画像領域である2402,2403が存在している。
一方、2404は定形サイズの用紙に印刷されたオリジナル画像をスキャンして得られたスキャン画像である。ここで、用紙設定が不定形サイズであるので、オリジナル画像の文書領域を変形させることなく印刷するために、オリジナル画像は縮小されており、スキャン画像2404上での文書領域は2405で示した矩形領域に対応する。
また、オリジナル画像2401中の文字または画像領域2402及び2403に対応する領域も、それぞれスキャン画像2404中の2406,2407となり、その位置が大きく異なっていることがわかる。
特許文献1によれば、拡大縮小等の影響をさけるために、画像全体の大きさを用いて、各領域の正規化を行っている。しかしながら、前述のようにスキャン画像では文書領域のまわりに、オリジナル画像にはない余白領域があるために、画像全体の大きさを用いて正規化を行っても、各領域の位置は異なったままとなる。よって、このような場合にレイアウト比較を行っても、同一のレイアウトと判定することができない。
本発明は上記の課題に鑑みてなされたものであり、オリジナル画像を用いて印刷された文書に、オリジナル画像にはない余白領域が文書領域の周りに生じているような場合でも、その文書のスキャン画像とオリジナル画像との高精度なレイアウト比較が可能となる画像処理装置及びその制御方法、プログラムを提供することを目的とする。
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
画像の類似比較処理を実行する画像処理装置であって、
比較先画像となるオリジナル画像を入力する第1入力手段と、
前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出手段と、
前記オリジナル画像のサイズが所定サイズであるか否かを判定する第1判定手段と、
前記第1判定手段の判定の結果、前記オリジナル画像のサイズが所定サイズではない場合、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する作成手段と、
前記ブロック情報を記憶する記憶手段と、
比較元画像を入力する第2入力手段と、
前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出手段と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを比較する比較手段と
を備える。
また、好ましくは、前記作成手段は、前記オリジナル画像を所定サイズの画像にマッピングした画像を想定した場合のオリジナル画像中のブロックに基づいて、前記第1抽出手段で抽出したブロック情報を変更することで、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する。
また、好ましくは、前記作成手段は、
前記オリジナル画像を所定サイズの画像にマッピングしたマッピング画像を作成する画像作成手段と、
前記画像作成手段により作成されたマッピング画像中のブロックに関するブロック情報を抽出する第3抽出手段とを備え、
前記第3抽出手段で抽出したブロック情報を、前記オリジナル画像を所定サイズにマッピングした際の前記ブロックに関するブロック情報として作成する。
また、好ましくは、前記作成手段は、
前記オリジナル画像を変倍する変倍手段と、
前記オリジナル画像を加工する加工手段と、
前記オリジナル画像に余白画像を付加する付加手段とを備え、
前記オリジナル画像のサイズに基づいて、前記変倍手段、前記加工手段及び前記付加手段の少なくとも一方を用いて、前記オリジナル画像を、所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する。
また、好ましくは、前記作成手段は、
前記オリジナル画像を所定サイズの画像にマッピングする基準位置を決定する決定手段を備え、
前記オリジナル画像のサイズに基づいて、前記決定手段で決定した基準位置で、前記オリジナル画像を、所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する。
また、好ましくは、前記比較手段は、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較手段と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較手段と
を備える。
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
画像の類似比較処理を実行する画像処理装置であって、
比較先画像となるオリジナル画像を入力する第1入力手段と、
前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出手段と、
前記ブロック情報を記憶する記憶手段と、
比較元画像を入力する第2入力手段と、
前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出手段と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較手段と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較手段と
を備える。
また、好ましくは、前記比較元画像のサイズに基づいて、前記第1比較手段及び前記第2比較手段の少なくとも一方を実行する。
また、好ましくは、前記比較元画像のサイズが所定サイズであるか否かを判定する第2判定手段を更に備え、
前記第2判定手段の判定結果に基づいて、前記第1比較手段及び前記第2比較手段の少なくとも一方を実行する。
また、好ましくは、前記第2判定手段の判定の結果、前記比較元画像のサイズが所定サイズでない場合、前記第2比較手段を実行する。
また、好ましくは、前記第1および第2抽出手段で抽出するブロック情報は、絶対座標系のブロック情報と相対座標系のブロック情報である。
また、好ましくは、前記第1および第2抽出手段で抽出するブロック情報は、絶対座標系のブロック情報であり、
前記比較先画像のサイズ情報を記憶するサイズ情報記憶手段と、
前記絶対座標系のブロック情報と前記用紙サイズ情報に基づいて、相対座標系のブロック情報を作成するブロック情報作成手段と
を更に備える。
また、好ましくは、前記第1および第2抽出手段で抽出するブロック情報は、相対座標系のブロック情報であり、
前記比較先画像のサイズ情報を記憶するサイズ情報記憶手段と、
前記相対座標系のブロック情報と前記用紙サイズ情報に基づいて、絶対座標系のブロック情報を作成するブロック情報作成手段と
を更に備える。
また、好ましくは、前記所定サイズを指定する指定手段を更に備える。
上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
画像の類似比較処理を実行する画像処理装置の制御方法であって、
比較先画像となるオリジナル画像を入力する第1入力工程と、
前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
前記オリジナル画像のサイズが所定サイズであるか否かを判定する第1判定工程と、
前記第1判定工程の判定の結果、前記オリジナル画像のサイズが所定サイズではない場合、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する作成工程と、
比較元画像を入力する第2入力工程と、
前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを比較する比較工程と
を備える。
上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
画像の類似比較処理を実行する画像処理装置の制御方法であって、
比較先画像となるオリジナル画像を入力する第1入力工程と、
前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
比較元画像を入力する第2入力工程と、
前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較工程と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較工程と
を備える。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
画像の類似比較処理を実行する画像処理装置の制御をコンピュータに実行させるためのプログラムであって、
比較先画像となるオリジナル画像を入力する第1入力工程と、
前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
前記オリジナル画像のサイズが所定サイズであるか否かを判定する第1判定工程と、
前記第1判定工程の判定の結果、前記オリジナル画像のサイズが所定サイズではない場合、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する作成工程と、
比較元画像を入力する第2入力工程と、
前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを比較する比較工程と
をコンピュータに実行させることを特徴とする。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
画像の類似比較処理を実行する画像処理装置の制御をコンピュータに実行させるためのプログラムであって、
比較先画像となるオリジナル画像を入力する第1入力工程と、
前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
比較元画像を入力する第2入力工程と、
前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較工程と、
前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較工程と
をコンピュータに実行させることを特徴とする。
以上説明したように、本発明によれば、オリジナル画像を用いて印刷された文書に、オリジナル画像にはない余白領域が文書領域の周りに生じているような場合でも、その文書のスキャン画像とオリジナル画像との高精度なレイアウト比較が可能となる画像処理装置及びその制御方法、プログラムを提供できる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
図1は本発明の実施形態の画像処理システムの構成を示すブロック図である。
この画像処理システムは、オフィス1Aとオフィス1Bとをインターネット等のネットワーク104で接続された環境で実現する。
オフィス1A内に構築されたLAN107には、複数種類の機能を実現する複合機であるMFP(Multi Function Peripheral)100が接続されている。また、このLAN107には、MFP100を制御するマネージメントPC101、クライアントPC102、文書管理サーバ106a及びそのデータベース105a、及びプロキシサーバ103aが接続されている。
また、オフィス20内に構築されたLAN108には、文書管理サーバ106b及びそのデータベース105b、及びプロキシサーバ103bが接続されている。
オフィス1A内のLAN107及びオフィス1B内のLAN108は、双方のオフィスのプロキシサーバ103a及び103bを介してネットワーク104に接続されている。
MFP100は、特に、紙文書を電子的に読み取る画像読取部と、画像読取部から得られる画像信号に対する画像処理を実行する画像処理部を有し、この画像信号はLAN109を介してマネージメントPC101に送信することができる。
マネージメントPC101は、通常のPCであり、内部に画像記憶部、画像処理部、表示部、入力部等の各種構成要素を有するが、その構成要素の一部はMFP100に一体化して構成されている。
尚、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれかである。または、ネットワーク104は、これらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
また、マネージメントPC101、クライアントPC102、文書管理サーバ106a及び106b等の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素を有している。この標準的な構成要素には、例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等がある。
次に、MFP100の詳細構成について、図2を用いて説明する。
図2は本発明の実施形態のMFPの詳細構成を示すブロック図である。
図2において、原稿台とオートドキュメントフィーダ(ADF)を含む画像読取部200は、束状のあるいは1枚の原稿画像を光源(不図示)で照射し、原稿反射像をレンズで固体撮像素子上に結像する。これにより、画像読取部200は、その固体撮像素子からラスタ状の画像読取信号を所定密度(例えば、600DPI)のラスタ画像として得る。
尚、本実施形態では、画像読取部200で読み取られる印刷物として、紙文書を例に挙げて説明するが、紙以外の記録媒体(例えば、OHPシート、フィルム等の透過原稿、布等)からなる印刷物を画像読取部200の読取対象としても良い。
また、MFP100は、画像読取信号に対応する画像を印刷部202で記録媒体に印刷する複写機能を有する。特に、原稿画像を1つ複写する場合には、この画像読取信号をデータ処理部205で画像処理して記録信号を生成し、これを印刷部202によって記録媒体上に印刷させる。一方、原稿画像を複数複写する場合には、記憶部201に一旦一つ分の記録信号を記憶保持させた後、これを印刷部202に順次出力して記録媒体上に印刷させる。
一方、クライアントPC102から出力される記録信号は、LAN107及びネットワークI/F204を介してデータ処理部205が受信し、データ処理部205は、その記録信号を印刷部202で記録可能なラスターデータに変換する。その後、印刷部202によってそのラスターデータを記録媒体上に印刷させる。
MFP100への操作者の指示は、MFP100に装備されたキー操作部とマネージメントPC101に接続されたキーボード及びマウスからなる入力部203から行われ、これら一連の動作はデータ処理部205内の制御部(不図示)で制御される。また、操作入力の状態表示及び処理中の画像データの表示は、表示部206で行われる。
記憶部201は、マネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの送受信及び制御は、ネットワークI/F207及びLAN109を介して行われる。
データベース208は、画像読取部200で読み取った紙文書の文書画像、その文書画像に関する情報を登録、管理する。また、クライアントPC102内のハードディスク内、或いはオフィス1A、1B内の文書管理サーバ106a、bのデータベース105a、b内の電子文書の画像に関する情報を登録、管理する。
尚、MFP100では、後述する各種処理を実行するための各種操作・表示をユーザに提供するユーザインタフェースを、表示部206及び入力部203によって実現している。
本発明による画像処理システムで実行する処理としては、大きく分けて画像データを登録する登録処理と、所望の画像データを検索する検索処理の2つがある。
尚、実施形態では、画像処理システム全体の処理効率を向上するために、以下に説明する各種処理を、画像処理システムを構成する各種端末に分散させて実行するようにしているが、1つの端末(例えば、MFP100)上で実行するようにしても構わない。
まず、登録処理について説明する。
[登録処理の概要]
登録対象の画像データの登録方法としては、紙文書をスキャン入力して生成した画像データを登録する場合と、文書作成アプリケーション等で作成された電子文書をラスタ画像に展開した画像データを登録する場合がある。
そこで、オリジナル文書を登録する登録処理の概要について、図3を用いて説明する。
図3は本発明の実施形態の登録処理を示すフローチャートである。
尚、この処理は、画像読取部200のADFに、登録対象の紙文書がセットされ、入力部203の登録ボタンが操作された時点で開始される。また、登録対象の紙文書は、1枚でも複数枚でも可能であるが、複数枚の場合は、その紙文書から得られる画像データ群(ページ画像群)を1つのファイルとして管理することになる。
まず、ステップS301で、登録対象のオリジナル文書を入力する。また、この入力に伴って、オリジナル文書を管理するための各種情報を生成して記憶部201に記憶する。
尚、オリジナル文書を登録する際のオリジナル文書の入力方法には、2種類存在する。
オリジナル文書が電子データである場合は、クライアントPC102内のハードディスク内、あるいはオフィス1Aや1B内の文書管理サーバ106a、b内のデータベース105a、b内、あるいはMFP100の記憶部201のいずれかに格納されている。そして、これらの記憶元から登録対象のオリジナル文書の電子データを読み出してネットワークI/F204を介してデータ処理部205に入力し、データ処理部205でその電子データをラスタ画像に変換する。
一方、オリジナル文書が紙文書である場合は、MFP100の画像読取部200で、その紙文書をラスタ状に走査しラスタ画像を得る。
このように、実施形態では、登録対象のオリジナル文書に、電子データあるいは紙文書のどちらも扱うことが可能である。
次に、ステップS302で、ラスタ画像をデータ処理部205で前処理を施し記憶部201に保存する(尚、これ以降、紙文書のときはラスタ画像がオリジナル文書の電子データとなる)。このとき、登録対象のオリジナル文書毎に固有の文書IDを発行し、オリジナル文書の電子データの格納場所を示すアドレスと対応付けて、用紙サイズ(画像のピクセル値:入力画像サイズ)とともに、データベース208内の文書情報として登録する。
ここで、文書IDとは、データベース208内に格納される電子文書を識別するためのIDであり、電子文書を一つ登録する毎に、使用されていないIDが発行される。また、アドレスとは、URLや、サーバ名とディレクトリ、ファイル名からなる電子データの格納先を示すフルパス情報である。また、文書情報の一例を示すと、図4のようになる。また、文書情報の格納先は、データベース105a、bや記憶部201等が挙げられる。
尚、オリジナル文書が紙文書である場合の電子データのファイル形式は、例えば、BMP形式とするが、これに限定されるものではなく、色情報を保存しておくことが可能なファイル形式(例えば、GIF、JPEG)であればどのようなものでも良い。
一方、オリジナル文書が電子データである場合のその電子データのファイル形式は、その電子データを作成したアプリケーションで作成されたファイル形式となる。このファイル形式には、例えば、米マイクロソフト社のMS−Word(*.doc)や、米アドビシステムズ社のアクロバット(*.pdf)等)がある。
次に、ステップS303で、ブロックセレクション(BS)処理を行う。この処理は、マネージメントPC101の制御によって実行する。
具体的には、マネージメントPC101のCPUは、記憶部201に格納された処理対象のオリジナル文書のラスタ画像を、まず、文字/線画部分とハーフトーン画像部分とに領域分割する。次に、文字/線画部分は更に段落で塊として纏まっているブロック毎に、あるいは線で構成された表、図形毎に分割する。
一方、ハーフトーン画像部分は、矩形に分離されたブロックの画像部分、背景部分等のブロックに分割する。そして、処理対象のページのページ番号、そのページ中の各ブロックを特定するブロックIDを発行する。
そして、ステップS304で、これを、各ブロックの属性(画像、文字等)、サイズやオリジナル文書内の位置(ページ内の座標)と各ブロックを関連付けてデータベース208に、ブロック情報として記憶(登録)する。このブロック情報の一例を示すと、図5のようになる。
ステップS305で、入力画像サイズが所定サイズ(標準用紙サイズ)であるか否かを判定する。
ここで、標準用紙サイズとは、画像処理装置であるMFP100で通常使用される(最も多く使用される)用紙サイズのことである。本実施形態では、A4サイズを標準用紙サイズとしている。標準用紙サイズである場合(ステップS305でYES)、ステップS309に進む。一方、標準用紙サイズでない場合(ステップS305でNO)、ステップS306へ進み、登録対象のオリジナル文書に対して、新たな文書IDを発行し、かつその用紙サイズを標準用紙サイズとして、データベース208内に文書情報として登録する。この場合は、図4に示すように、同じ内容の画像に対し、2つ以上の文書IDが与えられることになる。
ステップS307で、標準用紙サイズに基づいて、オリジナル文書のブロック情報を変更して、登録する。
これは、入力画像を標準用紙サイズにマッピングした画像を想定し、ステップS303で作成したブロック情報を、標準用紙サイズにマッピングした画像のブロックセレクションを行ったときに得られるブロック情報と同等のブロック情報に変更する。
この入力画像を標準用紙サイズにマッピングした画像(マッピング画像)は、入力画像の左右/上下に余白を加えたり、入力画像を拡大縮小(変倍)したり、標準用紙サイズからはみ出した部分を切り取ったり(トリミング)することによって生成する。
ここで、マッピング画像の具体例について図6に示す。図6において、図6(B)〜図6(H)のマッピング画像は、標準用紙サイズより小さい用紙サイズの入力画像(図6(A))から生成した例を示している。一方、図6(J)及び図6(K)のマッピング画像は、標準用紙サイズより大きい用紙サイズの入力画像(図6(I))から生成した例を示している。
具体的には、図6(B)のマッピング画像は、入力画像(図6(A))の上下左右に余白を加えたものである。また、図6(C)のマッピング画像は、入力画像(図6(A))を拡大し、かつ左右に余白を加えたものである。図6(D)のマッピング画像は、入力画像(図6(A))を標準用紙サイズの画像に左上基準でマッピングしたものである。また、図6(E)のマッピング画像は、入力画像(図6(A))を拡大した上で、標準用紙サイズの画像に左上基準でマッピングしたものである。
また、図6(F)のマッピング画像は、拡大した入力画像(図6(A))の左右/上下に余白を加えたものである。図6(G)のマッピング画像は、入力画像(図6(A))を、標準用紙サイズの画像に左上基準で、かつ左右/上下に余白を加えてマッピングしたものである。図6(H)のマッピング画像は、入力画像(図6(A))を拡大した上で標準用紙サイズの画像に左上基準で、かつ左右/上下に余白を加えたものである。
更に、図6(J)のマッピング画像は、入力画像(図6(I))において、標準用紙サイズからはみ出した部分を切り取ったものである。図6(K)のマッピング画像は、入力画像(図6(I))を縮小したものである。
このように、本実施形態では、オリジナル画像を所定サイズ(標準用紙サイズ)の画像にマッピングするに際し、そのオリジナル画像を所定サイズの画像に等倍でマッピングし、必要に応じて余白を追加し、かつ/もしくは、はみ出している部分を切り取る。更には、オリジナル画像が標準用紙サイズにはみ出すことなく、かつ、余白が可能な限り少なくなるように変倍してマッピングし、必要に応じて余白を追加する。
これに加えて、オリジナル画像を標準用紙サイズに左上基準でマッピングしたり、中央基準でマッピングする。この基準は、これに限定されるものではなく、右上、右下等の任意の位置を基準にマッピングすることも可能である。
ステップS307では、ブロック情報を変更することにより標準用紙サイズにマッピングした画像におけるブロック情報を得ているが、これに限定されない。例えば、標準用紙サイズにマッピングした画像を作成し、その画像に対しブロックセレクション処理を行うことにより、標準用紙サイズにマッピングした画像におけるブロック情報を得てもよい。
このステップS307における、標準用紙サイズにマッピングした画像は、標準用紙サイズと異なる入力原稿を標準用紙サイズの用紙に印刷出力した際の出力結果を考慮したものである。
本実施形態では、入力画像を標準用紙の中央に配置し、用紙サイズ全体を使用することにより、標準用紙サイズにマッピングした画像を得たもので説明している。その他の配置で作成した画像もあり得るが、同様の方法で対応可能である。
例えば、アプリケーションの設定によっては、用紙の中央に印刷されずに用紙の左上に印刷されるものがあることから、左上を原点として配置(図6(D)、図6(E))したマッピング画像を想定している。更には、印刷機器によっては用紙の上下左右に印刷できない領域があることから、上下左右すべてに一定量の余白を設けるように配置(図6(F)、図6(G)、図6(H))したマッピング画像も想定している。
標準用紙サイズと異なる画像、特に、A形、B形、USレター形とは異なる画像は、オリジナル画像とは異なる印刷出力結果になりがちである。また、USレター形で作成された原稿をA4用紙に印刷したり、逆にA4形で作成された原稿をUSレター用紙に印刷したりした場合も、同様にオリジナル画像とは異なる印刷出力結果になる。
そこで、本実施形態では、オリジナル画像である入力画像(図6(A)や図6(I))だけでなく、図6(B)〜図6(H)、図6(J)、図6(K)の状態のマッピング画像におけるブロック情報を登録しておく。これにより、様々な印刷状態の印刷画像をオリジナル画像(比較元画像)としてレイアウト比較を行った際に、同一のレイアウトを有する文書であるとみなすことができる。
次に、ステップS308で、ステップS304と同様に、変更したブロックに対して、ブロックセレクション処理の処理対象の各ブロックを特定するブロックIDを発行する。そして、各ブロックの属性(画像、文字等)、サイズやオリジナル文書内の位置(座標)と各ブロックを関連付けてデータベース208にブロック情報として記憶(登録)する。
次に、ステップS309で、データ処理部205において、各ブロックの種別に応じて、各ブロックの特徴量情報を抽出する特徴量情報抽出処理を行う。
特に、文字ブロックについては、OCR処理を施して文字コードを抽出し、これを文字特徴量とする。また、画像ブロックについては、輝度や色に関する画像特徴量を抽出する。そして、ステップS310で、それぞれのブロックに対応する特徴量をオリジナル文書単位にまとめ、文書ID、ページ番号、ブロックIDに関連付けてデータベース208に特徴量情報として記憶(登録)する。この文字特徴量及び画像特徴量の一例を示すと、図7及び図8のようになる。
[検索処理の概要]
オリジナル文書の電子データを検索する検索処理の概要について、図9を用いて説明する。
図9は本発明の実施形態の検索処理を示すフローチャートである。
まず、ステップS901で、検索条件となる紙文書の入力を行う。この処理は、ステップS301の処理と同様であるので説明は省略する。但し、この処理によって生成するラスタ画像は一時保存するだけであり、その紙文書に対するアドレス情報を記憶部201に保存しておく必要はない。
次に、ステップS902で、ラスタ画像中の画像領域に対して、ブロックセレクション(BS)処理を行う。
尚、このブロックセレクション処理自体は、ステップS303のブロックセレクション処理と同様であるので説明は省略する。但し、このブロックセレクション処理によって生成する各ブロックの属性、サイズ、位置は一時保存するだけであり、その紙文書に対するブロック情報は記憶部201に保存しておく必要はない。
次に、ステップS903で、各ブロックの特徴量情報を抽出する特徴量情報抽出処理を行う。この処理は、ステップS309の処理と同様であるので説明は省略する。但し、この処理によって生成する各ブロックの特徴量は一時保存するだけであり、その紙文書に対する特徴量情報を記憶部201に保存しておく必要はない。
次に、ステップS904で、入力した紙文書(入力画像)の用紙サイズが標準用紙サイズであるか否かを判定する。標準用紙サイズである場合(ステップS904でYES)、ステップS906に進む。一方、標準用紙サイズでない場合(ステップS904でNO)、ステップS905に進む。
ステップS905で、入力した紙文書(入力画像)の用紙サイズを正規化し、対応するブロック情報の位置、サイズを正規化された用紙サイズに合わせることにより、正規化された(相対座標系での)ブロック情報を作成する。
次に、ステップS906で、入力した紙文書(比較元画像)のブロック情報及び特徴量情報と、データベース208に格納されている電子文書の文書IDに対応するオリジナル文書(比較先画像)のブロック情報及び特徴量情報とを比較する。
次に、ステップS907で、比較結果に基づいて、文書候補リストを作成する。尚、文書候補リストは、候補となるオリジナル文書の文書IDと類似度とを含むリストである。また、この類似度が所定閾値を下回る場合には、文書候補リストから削除される。また、文書候補リスト中の複数の文書IDが同じオリジナル文書を参照している場合は、類似度が最も高い文書IDのみを残し、その他の文書IDは削除する。図10は、本実施形態における文書候補リストの構成例を示す図である。
次に、ステップS908で、文書候補リスト中の候補数が1つであるか否かを判定する。候補数が1つである場合(ステップS908でYES)、ステップS910に進む。一方、候補数が2つ以上である場合(ステップS908でNO)、ステップS909に進む。
ステップS909で、文書候補リストに登録されている文書のサムネイル画像をオリジナル文書候補として表示する。具体的には、オリジナル文書候補群のサムネイル画像を含むユーザインタフェースを表示部206及び入力部203で実現する。このユーザインタフェースによって、オリジナル文書候補群の表示/選択を行う。
特に、この選択は、オリジナル文書候補のサムネイル画像を表示部206に表示し、複数のオリジナル文書候補の中からユーザが所望のオリジナル文書候補のサムネイル画像を選択させることで実現する。そして、このユーザインタフェースによってオリジナル文書が選択されると、そのオリジナル文書の文書IDを特定する。尚、このユーザインタフェースの構成の詳細については後述する。
最後に、ステップS910で、選択されたオリジナル文書の文書IDに対して、データベース208内のアドレス情報の文書IDに対応したアドレスを参照して、記憶部201に、オリジナル文書(電子ファイル若しくは画像データ)を読み込む。そして、オペレータの指示に基づいて、そのオリジナル文書の印刷、配信、蓄積、編集のいずれかの処理を実行する。
[各処理の詳細]
以下、各処理の詳細について説明する。
[ブロックセレクション処理の詳細]
まず、ステップS303及びステップS902のブロックセレクション処理の詳細について説明する。
ブロックセレクション処理とは、例えば、図11のラスタ画像11Aを、画像11Bに示すように、意味のあるブロック毎の塊として認識する。そして、そのブロック各々の属性(文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等)を判定し、異なる属性を持つブロックに分割する処理である。
ブロックセレクション処理の実施形態を以下に説明する。
まず、入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つブロックへ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のブロックは文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字ブロック、扁平な画素塊を線ブロックとする。また、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表ブロック、不定形の画素塊が散在している領域を写真ブロック、それ以外の任意形状の画素塊を図画ブロックとする。
[特徴量情報抽出処理の詳細]
次に、ステップS309及びステップS903の特徴量情報抽出処理の詳細について説明する。
尚、特徴量情報抽出処理は、画像ブロック及び文字ブロックで処理方法が異なるので、それぞれ別に説明する。
ここで、画像ブロックは、図11の11Bの例の場合、写真ブロックと図画ブロックとするが、用途や目的に応じて、画像ブロックを写真ブロック及び図画ブロックの少なくとも一方にすることも可能である。
[画像ブロックに対する特徴量情報抽出処理の詳細]
まず、画像ブロックに対する特徴量情報抽出処理について説明する。
尚、1文書に複数の画像ブロックが存在する場合は、その総数分、以下の処理を繰り返す。
実施形態では、一例として、画像の色に関する色特徴量を抽出する色特徴量情報抽出処理を行う。
この色特徴量情報抽出処理の詳細について、図12を用いて説明する。
図12は本発明の実施形態の色特徴量情報抽出処理の詳細を示すフローチャートである。
尚、この処理では、処理対象画像を複数のメッシュブロックに分割した各メッシュブロックの色ヒストグラム中の最頻色を有する色と各メッシュブロックの位置情報を対応づけた情報を色特徴情報として抽出する。
まず、ステップS1201で、画像を複数のメッシュブロックに分割する。本実施形態では、図13に示すように、画像を縦横をそれぞれ9メッシュブロックに分割する。特に、本実施形態では、表記の都合上9×9=81メッシュブロックに分割している例を示しているが、実際には、15×15=225メッシュブロック程度であることが好ましい。
次に、ステップS1202で、処理対象となる着目メッシュブロックを左上端のブロックに設定する。尚、この着目メッシュブロックの設定は、例えば、図14(3×3の例で示している)に示すように、予め処理順序が決定された順序決定テーブルを参照して行う。図14に示す例では、左上端から右へ走査し、その行を終えると次の行の左端から右へスキャンする走査例を示している。
ステップS1203で、未処理の着目メッシュブロックの有無を判定する。未処理の着目メッシュブロックがない場合(ステップS1203でNO)、処理を終了する。一方、未処理の着目メッシュブロックがある場合(ステップS1203でYES)、ステップS1204に進む。
ステップS1204で、着目メッシュブロックの全画素の各濃度値を、図15に示す色空間を分割して作った部分空間である色ビンへ射影し、色ビンに対する色ヒストグラムを生成する。
尚、本実施形態では、図15に示すように、RGB色空間を3×3×3=27に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影する場合を示しているが、これに限定されない。実際には、RGB色空間を6×6×6=216に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影するほうが好ましい。
ステップS1205で、色ヒストグラムの最頻色ビンの色ビンIDをその着目メッシュブロックの代表色と決定し、その着目メッシュブロックとその位置に対応づけて記憶部201に記憶する。
ステップS1206で、図14の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する。その後、ステップS1203に戻り、未処理の着目メッシュブロックがなくなるまで、ステップS1203〜ステップS1206の処理を再帰的に繰り返す。
以上の処理によって、処理対象画像(画像ブロック)のメッシュブロック毎の代表色と各メッシュブロックの位置情報が対応付けられた情報を色特徴量情報として抽出することができる。
[文字ブロックに対する特徴量情報抽出処理の詳細]
次に、文字ブロックに対する特徴量情報抽出処理について説明する。
尚、1文書に複数の文字ブロックが存在する場合は、その総数分、以下の処理を繰り返す。
文字ブロックに対する文字特徴量情報は、その文字ブロックにOCR(文字認識)処理を施して得られる文字コードとする。
OCR(文字認識)処理は、文字ブロックから文字単位で切り出された文字画像に対し、パターンマッチングの一手法を用いて文字認識を行い、対応する文字コードを取得する。
この文字認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とするものである。
特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュブロック内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
ブロックセレクション処理(ステップS309あるいはステップS903)で抽出された文字ブロックに対して文字認識を行う場合は、まず、該当文字ブロックに対し横書き/縦書きの判定を行う。その後、各々対応する方向に文字列を切り出し、その後、文字列から文字を切り出して文字画像を取得する。
横書き/縦書きの判定は、該当文字ブロック内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判定する。文字列及び文字への分解は、横書きの文字ブロックである場合には、その水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。一方、縦書きの文字ブロックに対しては、水平と垂直を逆にすれば良い。
[比較処理の詳細]
次に、ステップS906の比較処理の詳細について、図16を用いて説明する。
図16は本発明の実施形態の比較処理の詳細を示すフローチャートである。
まず、ステップS1601で、比較先文書を管理する文書候補リストの先頭から文書IDを順番に取得する。次に、ステップS1602で、全ての文書IDを取得したか否かを判定する。その結果、全ての文書IDを取得した場合(ステップS1602でYES)、本処理を終了する。一方、全ての文書IDを取得していない場合(ステップS1602でNO)、ステップS1603に進む。
ステップS1603で、比較先文書の文書IDがすでにページ比較した文書であるか否かを判定する。本実施形態では、ひとつの文書に対し複数の文書IDが割り当てられている場合がある。そして、それぞれの文書IDには、それぞれ異なったブロック情報が登録されているが、ブロック内の特徴は共通のものである。従って、既にページ比較を行った文書の別の文書IDのブロック情報を用いてページ比較処理を行っても、処理が冗長になるため、比較を行う必要はない。
既にページ比較している文書である場合(ステップS1603でYES)、ステップS1601に戻る。一方、ページ比較していない文書である場合(ステップS1603でNO)、ステップS1604に進む。
次に、ステップS1604で、相対座標系でレイアウト比較を実行する。ここで、レイアウトとは、ブロック情報にあるブロックの属性、サイズ、位置のことである。具体的には、各ブロックの属性、サイズ、位置と、ステップS1601で取得した文書ID及び現在処理中のページに対応したブロック情報中の各ブロックの属性、サイズ、位置を比較し、レイアウトが同じであるか否かを判定する。
本実施形態では、図5に示すブロック情報では、ブロックの位置、サイズはピクセル値を用いて絶対座標系で与えられている。そのため、図4の文書情報中の用紙サイズを用いて、処理対象画像を正規化し、相対座標系に変換する。相対座標系でレイアウト比較を行うことによって、単純に拡大もしくは縮小された画像を同じレイアウトとしてみなすことができる。即ち、図17(A)〜図17(D)で示すような、サイズの異なる画像のレイアウトは同じレイアウトとしてみなせるということになる。
ステップS1605で、ステップS1604のレイアウト比較処理に基づいて、レイアウトが同じであるか否かを判定する。比較元画像(紙文書)と比較先画像(オリジナル文書)のレイアウトが同じである場合(ステップS1605でYES)、ステップS1609に進む。一方、比較元画像と比較先画像のレイアウトが同じでない場合(ステップS1605でNO)、ステップS1606に進む。
ステップS1606で、比較元画像の用紙サイズが標準用紙サイズであるか否かを判定する。標準用紙サイズでない場合(ステップS1606でNO)、ステップS1607に進む。一方、標準用紙サイズである場合(ステップS1606でYES)、ステップS1601に戻る。
ステップS1607で、絶対座標系でレイアウト比較を実行する。これは、オリジナル画像の大きさは変えずに、大きめの用紙に印刷した場合、ステップS1604の相対座標系でのレイアウトの比較では、異なるレイアウトと判断されるが、本処理を行うことで、同じレイアウトと判断することが可能になる。即ち、図18(A)〜(C)で示すようなサイズの用紙に印刷された画像のレイアウトは同じレイアウトとしてみなせるということになる。
ステップS1608で、ステップS1607のレイアウト比較処理に基づいて、レイアウトが同じであるか否かを判定する。比較元画像(紙文書)と比較先画像(オリジナル文書)のレイアウトが同じである場合(ステップS1605でYES)、ステップS1609に進む。一方、比較元画像と比較先画像のレイアウトが同じでない場合(ステップS1605でNO)、ステップS1601に戻る。
ステップS1609で、比較元画像(紙文書)と比較先画像(オリジナル文書)のページ同士の比較を行うページ比較処理を実行する。この比較は、ブロックの属性に合わせ、文字、画像それぞれに応じた特徴量を用いて、複合的に比較を行い、類似度を算出する。尚、この処理の詳細については後述する。
次に、ステップS1610で、算出された類似度が所定の閾値以上であるか否かを判定する。類似度が所定の閾値未満である場合(ステップS1610でNO)、ステップS1601に戻る。一方、類似度が所定の閾値以上である場合(ステップS1610でYES)、ステップS1611に進む。
ステップS1611で、現在処理中の文書IDと類似度を検索結果リストに追加し、ステップS1601へ戻る。
[ページ比較処理の詳細]
次に、ステップS1609のページ比較処理の詳細について、図19を用いて説明する。
図19は本発明の実施形態のページ比較処理の詳細を示すフローチャートである。
まず、ステップS1901で、ブロック情報を参照し、処理対象となる文書ID、ページ番号に対応する電子データ中で、未比較のブロックの有無を判定する。未比較のブロックがない場合(ステップS1901でNO)、ステップS1905に進む。一方、未比較のブロックがある場合(ステップS1901でYES)、ステップS1902に進む。
次に、ステップS1902で、比較対象のブロックの属性を判定する。属性が画像ブロックである場合、ステップS1903に進む。一方、属性が文字ブロックである場合、ステップS1904に進む。
属性が画像ブロックである場合、ステップS1903で、色に関する特徴量情報で比較先ブロックとの類似比較である色特徴量情報比較処理を行う。この処理の詳細については後述する。これによって得られる類似度は、比較先の文書ID、ページ番号、ブロックIDに対応させて記憶部201に一時記憶する。
一方、属性が文字ブロックである場合、ステップS1904で、文字の特徴量情報での比較元ブロックと比較先ブロックとの類似比較である文字特徴量情報比較処理を行う。この処理の詳細については後述する。また、これによって得られる類似度は、比較先の文書ID、ページ番号、ブロックIDに対応させて記憶部201に一時記憶する。
次に、ステップS1901において、全てのブロックとの比較が終了した場合(ステップS1901でNO)、ステップS1905に進む。
ステップS1905で、検索条件(クエリ)である紙文書とオリジナル文書中のページとの類似度を算出する統合処理を行う。これは、ステップS1903及びステップS1904の処理によって記憶部201に記憶されている、比較先文書(オリジナル文書(電子データ))のページに含まれる全てのブロックの類似度を統合するものである。
[色特徴量情報比較処理の詳細]
次に、ステップS1903の色特徴量情報比較処理の詳細について、図20を用いて説明する。
図20は本発明の実施形態の色特徴量情報比較処理の詳細を示すフローチャートである。
まず、ステップS2001で、比較元画像ブロックと比較先画像ブロックの色特徴量を色特徴量情報から読み出す。
次に、ステップS2002で、処理対象とする画像ブロック中の着目メッシュブロックを先頭に設定する。ステップS2003で、比較元画像ブロックの色特徴量と、比較対象の色特徴量の類似度を示す類似距離を0にリセットする。
ステップS2004で、未比較の着目メッシュブロックの有無を判定する。未比較の着目メッシュブロックがない場合(ステップS2004でNO)、ステップS2008に進む。一方、未比較の着目メッシュブロックがある場合(ステップS2004でYES)、ステップS2005に進む。
ステップS2005で、比較元画像と比較先画像のそれぞれの色特徴量から、それぞれの着目メッシュブロックの色ビンIDを取得する。
ステップS2006で、図21に示す色ビンペナルティマトリックスを参照して、取得した色ビンID間に対応する着目メッシュブロックの局所的類似距離を取得し、これを直前の処理で取得している類似距離に累積加算する。そして、この類似距離は記憶部201に記憶する。
ここで、色ビンペナルティマトリックスについて、図21を用いて説明する。
図21は本発明の実施形態の色ビンペナルティマトリックスの構成を示す図である。
色ビンペナルティマトリックスは、色ビンID同士の局所的類似距離を管理するマトリックスである。図21によれば、色ビンペナルティマトリックスは、同一色ビンIDではその類似距離は0となり、色ビンID同士の差が大きくなるほど、つまり、類似度が低くなるほど、その類似距離は大きくなるように構成されている。また、同一色ビンIDの対角位置は全て、その類似距離は0で、それを境に対象性を持っている。
このように、本実施形態では、色ビンペナルティマトリックスを参照するだけで、色ビンID同士の類似距離を取得することができるので、処理の高速化を図ることができる。
そして、ステップS2007で、図14の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する。その後、ステップS2004に戻る。
そして、ステップS2004で、未比較の着目メッシュブロックがない場合(ステップS2004でNO)、ステップS2008に進み、記憶部201に記憶されている類似距離を類似度に変換し、ブロックIDと対にして出力する。
尚、類似度への変換は、例えば、類似距離が最小値のときを類似度100%、類似距離が最大値のときを類似度0%として、その範囲内の類似距離に対する類似度は、最小値あるいは最大値に対する差に基づいて算出するようにすれば良い。
[文字特徴量情報比較処理の詳細]
次に、ステップS1904の文字特徴量情報比較処理の詳細について説明する。
この処理では、比較元画像と比較先画像中のそれぞれの文字ブロック内の各文字コード同士の比較を行い、その一致度から類似度を算出する。
尚、検索条件とする紙文書とオリジナル文書との比較である場合、類似度は100%となるのが理想的である。しかしながら、実際には、検索条件となる紙文書中の文字ブロックに対するOCR処理では誤認識が発生する場合があるので、オリジナル文書との比較であっても、類似度は100%にならないことはあるが、かなり100%に近い値となる。そこで、このような場合には、同一の文書とみなす。
[統合処理の詳細]
次に、ステップS1905の統合処理の詳細について説明する。
この統合処理では、比較先画像であるオリジナル文書内で占めている割合の大きいブロックの類似度が、オリジナル文書全体の類似度としてより大きく反映されるような、算出されたブロック毎の類似度の統合を行う。
例えば、オリジナル文書中のブロックB1〜B6に対し、ブロック毎の類似率がn1〜n6と算出されたとする。このときオリジナル文書全体の総合類似率Nは、以下の式で表現される。
N=w1*n1+w2*n2+w3*n3+ ・・・ +w6*n6 (1)
ここで、w1〜W6は、各ブロックの類似率を評価する重み係数である。重み係数w1〜w6は、ブロックのオリジナル文書内の占有率により算出する。例えば、ブロック1〜6のサイズをS1〜S6とすると、ブロック1の占有率w1は、
w1=S1/(S1+S2+・・・+S6) (2)
として算出することができる。
このような占有率を用いた重み付け処理により、オリジナル文書内で大きな領域を占めるブロックの類似度がより、オリジナル文書全体の類似度に反映することができる。
[候補表示/選択処理のユーザインタフェース]
次に、ステップS910の候補表示/選択処理時のユーザインタフェースの一例について、図22を用いて説明する。
図22は本発明の実施形態のユーザインタフェースの一例を示す図である。
2201は表示領域であり、タッチパネルで構成され、ユーザが直接画面に触れることで選択指示が可能である。2202〜2211は、検索結果として出力するオリジナル文書(電子ファイル、または画像データ)候補のサムネイル画像群である。このサムネイル画像の表示は、2202から番号順に類似度の高い順で表示されている。
この例では、最大10のサムネイル画像が表示され、オリジナル文書候補が10以上である場合には、上位10までのサムネイル画像が表示される。そして、このサムネイル画像群2202〜2211から、所望するサムネイル画像を選択することで、所望のオリジナル文書を選択することが可能であり、その選択したオリジナル文書に対する各種処理を実行することが可能となる。
また、2212は文書中の何ページ目の候補が表示されているかを示すものである。また、これを選択することで、他のページの候補を切り替えて表示させることができる。
[標準用紙設定のユーザインタフェース]
本実施形態で処理判定に用いる標準用紙サイズは、一般的に最もよく使用されているA4もしくはLetter(US)サイズを自動的に画像処理装置に対して設定してもよいし、専用のユーザインタフェースを用いてユーザが設定できるようにしてもよい。
図23は本発明の実施形態における標準用紙サイズを設定するためのユーザインタフェースの一例を示す図である。
図23において、2301は表示領域であり、例えば、タッチパネルで構成されており、ユーザが直接画面に触れることで選択指示が可能である。また、2302〜2311は、標準用紙サイズ候補群である。この例では、最大10種類の用紙サイズが標準用紙サイズ候補として表示される。そして、この標準用紙サイズ候補群2202〜2211から、所望する標準用紙サイズをタッチ等することにより選択することで、標準用紙サイズを設定することが可能である。
これ以降、登録もしくは検索される際は、新たに設定された標準用紙サイズが用いられることになる。
また、図23において、2312は、標準用紙サイズ候補が10種類を超えるときに表示され、これを選択することで、次の候補を切り替えて表示させることができる。
以上説明したように、本実施形態によれば、オリジナル画像を用いて印刷された文書に、オリジナル画像にはない余白領域が文書領域の周りに生じているような場合でも、その文書のスキャン画像とオリジナル画像との高精度なレイアウト比較が可能となる。これにより、このレイアウト比較を利用した高精度な検索処理を実現することができる。
[その他の実施形態]
上記実施形態では、画像サイズとブロック情報をピクセル値で記憶しておき、相対座標系でレイアウト比較を行う際は、ピクセル値を正規化された相対的な座標に変換して比較を行っているが、これに限定されるものではない。
例えば、画像サイズをcmやインチ等の長さで記憶しておき、これをレイアウト比較に用いても良い。また、ブロック情報を正規化された相対的な座標で記憶しておき、相対座標系でレイアウト比較を行う際はそのままの値を用い、絶対座標系でレイアウト比較を行う際に絶対的な座標に変換して比較を行ってもよい。また、相対座標系でのブロック情報と絶対座標系でのブロック情報を記憶しておくことにより、用紙サイズの情報を持たないようにすることも可能である。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスクがある。また、更に、記録媒体としては、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、その接続先のホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。また、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施形態の画像処理システムの構成を示すブロック図である。 本発明の実施形態のMFPの詳細構成を示すブロック図である。 本発明の実施形態の登録処理を示すフローチャートである。 本発明の実施形態の文書情報の一例を示す図である。 本発明の実施形態のブロック情報の一例を示す図である。 本発明の実施形態の入力画像を標準用紙サイズにマッピングした画像の一例を示す図である。 本発明の実施形態の文字特徴量情報の一例を示す図である。 本発明の実施形態の画像特徴量情報の一例を示す図である。 本発明の実施形態の検索処理を示すフローチャートである。 本発明の実施形態の文書候補リストの構成例を示す図である。 本発明の実施形態の画像ブロック抽出の一例を示す図である。 本発明の実施形態の色特徴量情報抽出処理の詳細を示すフローチャートである。 本発明の実施形態の画像メッシュブロック分割の一例を示す図である。 本発明の実施形態の順序決定テーブルの一例を示す図である。 本発明の実施形態の色空間上の色ビンの構成の一例を示す図である。 本発明の実施形態の比較処理の詳細を示すフローチャートである。 本発明の実施形態のレイアウト検索可能な画像サイズの一例を示す図である。 本発明の実施形態のレイアウト検索可能な画像サイズの一例を示す図である。 本発明の実施形態のページ比較処理の詳細を示すフローチャートである。 本発明の実施形態の色特徴量情報比較処理の詳細を示すフローチャートである。 本発明の実施形態の色ビンペナルティマトリックスの構成の一例を示す図である。 本発明の実施形態のユーザインタフェースの一例を示す図である。 本発明の実施形態における標準用紙サイズを設定するためのユーザインタフェースの一例を示す図である。 本発明の課題を説明するための図である。
符号の説明
100 MFP
101 マネージメントPC
102 クライアントPC
103a、b プロキシサーバ
104 ネットワーク
105a、b データベース
106a、b 文書管理サーバ
107 LAN
200 画像読取部
201 記憶部
202 印刷部
203 入力部
204、207 ネットワークI/F
205 データ処理部
206 表示部
208 データベース

Claims (18)

  1. 画像の類似比較処理を実行する画像処理装置であって、
    比較先画像となるオリジナル画像を入力する第1入力手段と、
    前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出手段と、
    前記オリジナル画像のサイズが所定サイズであるか否かを判定する第1判定手段と、
    前記第1判定手段の判定の結果、前記オリジナル画像のサイズが所定サイズではない場合、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する作成手段と、
    前記ブロック情報を記憶する記憶手段と、
    比較元画像を入力する第2入力手段と、
    前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出手段と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを比較する比較手段と
    を備えることを特徴とする画像処理装置。
  2. 前記作成手段は、前記オリジナル画像を所定サイズの画像にマッピングした画像を想定した場合のオリジナル画像中のブロックに基づいて、前記第1抽出手段で抽出したブロック情報を変更することで、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記作成手段は、
    前記オリジナル画像を所定サイズの画像にマッピングしたマッピング画像を作成する画像作成手段と、
    前記画像作成手段により作成されたマッピング画像中のブロックに関するブロック情報を抽出する第3抽出手段とを備え、
    前記第3抽出手段で抽出したブロック情報を、前記オリジナル画像を所定サイズにマッピングした際の前記ブロックに関するブロック情報として作成する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記作成手段は、
    前記オリジナル画像を変倍する変倍手段と、
    前記オリジナル画像を加工する加工手段と、
    前記オリジナル画像に余白画像を付加する付加手段とを備え、
    前記オリジナル画像のサイズに基づいて、前記変倍手段、前記加工手段及び前記付加手段の少なくとも一方を用いて、前記オリジナル画像を、所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する
    ことを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
  5. 前記作成手段は、
    前記オリジナル画像を所定サイズの画像にマッピングする基準位置を決定する決定手段を備え、
    前記オリジナル画像のサイズに基づいて、前記決定手段で決定した基準位置で、前記オリジナル画像を、所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する
    ことを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
  6. 前記比較手段は、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較手段と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  7. 画像の類似比較処理を実行する画像処理装置であって、
    比較先画像となるオリジナル画像を入力する第1入力手段と、
    前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出手段と、
    前記ブロック情報を記憶する記憶手段と、
    比較元画像を入力する第2入力手段と、
    前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出手段と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較手段と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較手段と
    を備えることを特徴とする画像処理装置。
  8. 前記比較元画像のサイズに基づいて、前記第1比較手段及び前記第2比較手段の少なくとも一方を実行する
    ことを特徴とする請求項6または7に記載の画像処理装置。
  9. 前記比較元画像のサイズが所定サイズであるか否かを判定する第2判定手段を更に備え、
    前記第2判定手段の判定結果に基づいて、前記第1比較手段及び前記第2比較手段の少なくとも一方を実行する
    ことを特徴とする請求項6または7に記載の画像処理装置。
  10. 前記第2判定手段の判定の結果、前記比較元画像のサイズが所定サイズでない場合、前記第2比較手段を実行する
    ことを特徴とする請求項9に記載の画像処理装置。
  11. 前記第1および第2抽出手段で抽出するブロック情報は、絶対座標系のブロック情報と相対座標系のブロック情報である
    ことを特徴とする請求項1または7に記載の画像処理装置。
  12. 前記第1および第2抽出手段で抽出するブロック情報は、絶対座標系のブロック情報であり、
    前記比較先画像のサイズ情報を記憶するサイズ情報記憶手段と、
    前記絶対座標系のブロック情報と前記用紙サイズ情報に基づいて、相対座標系のブロック情報を作成するブロック情報作成手段と
    を更に備えることを特徴とする請求項1または7に記載の画像処理装置。
  13. 前記第1および第2抽出手段で抽出するブロック情報は、相対座標系のブロック情報であり、
    前記比較先画像のサイズ情報を記憶するサイズ情報記憶手段と、
    前記相対座標系のブロック情報と前記用紙サイズ情報に基づいて、絶対座標系のブロック情報を作成するブロック情報作成手段と
    を更に備えることを特徴とする請求項1または7に記載の画像処理装置。
  14. 前記所定サイズを指定する指定手段を更に備える
    ことを特徴とする請求項1または9に記載の画像処理装置。
  15. 画像の類似比較処理を実行する画像処理装置の制御方法であって、
    比較先画像となるオリジナル画像を入力する第1入力工程と、
    前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
    前記オリジナル画像のサイズが所定サイズであるか否かを判定する第1判定工程と、
    前記第1判定工程の判定の結果、前記オリジナル画像のサイズが所定サイズではない場合、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する作成工程と、
    比較元画像を入力する第2入力工程と、
    前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを比較する比較工程と
    を備えることを特徴とする画像処理装置の制御方法。
  16. 画像の類似比較処理を実行する画像処理装置の制御方法であって、
    比較先画像となるオリジナル画像を入力する第1入力工程と、
    前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
    比較元画像を入力する第2入力工程と、
    前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較工程と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較工程と
    を備えることを特徴とする画像処理装置の制御方法。
  17. 画像の類似比較処理を実行する画像処理装置の制御をコンピュータに実行させるためのプログラムであって、
    比較先画像となるオリジナル画像を入力する第1入力工程と、
    前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
    前記オリジナル画像のサイズが所定サイズであるか否かを判定する第1判定工程と、
    前記第1判定工程の判定の結果、前記オリジナル画像のサイズが所定サイズではない場合、前記オリジナル画像を所定サイズの画像にマッピングした際の前記ブロックに関するブロック情報を作成する作成工程と、
    比較元画像を入力する第2入力工程と、
    前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを比較する比較工程と
    をコンピュータに実行させることを特徴とするプログラム。
  18. 画像の類似比較処理を実行する画像処理装置の制御をコンピュータに実行させるためのプログラムであって、
    比較先画像となるオリジナル画像を入力する第1入力工程と、
    前記オリジナル画像中のブロックに関するブロック情報を抽出する第1抽出工程と、
    比較元画像を入力する第2入力工程と、
    前記比較元画像中のブロックに関するブロック情報を抽出する第2抽出工程と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを相対座標系で比較する第1比較工程と、
    前記比較元画像のブロック情報と、前記比較先画像のブロック情報とを絶対座標系で比較する第2比較工程と
    をコンピュータに実行させることを特徴とするプログラム。
JP2005231171A 2005-08-09 2005-08-09 画像処理装置及び画像処理方法、プログラム Expired - Fee Related JP4533273B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005231171A JP4533273B2 (ja) 2005-08-09 2005-08-09 画像処理装置及び画像処理方法、プログラム
US11/460,548 US7746507B2 (en) 2005-08-09 2006-07-27 Image processing apparatus for image retrieval and control method therefor
EP06254053A EP1752895A1 (en) 2005-08-09 2006-08-02 Image processing apparatus for image retrieval and control method therefor
CNB2006101148656A CN100414550C (zh) 2005-08-09 2006-08-09 用于图像检索的图像处理设备及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005231171A JP4533273B2 (ja) 2005-08-09 2005-08-09 画像処理装置及び画像処理方法、プログラム

Publications (3)

Publication Number Publication Date
JP2007049388A true JP2007049388A (ja) 2007-02-22
JP2007049388A5 JP2007049388A5 (ja) 2008-09-11
JP4533273B2 JP4533273B2 (ja) 2010-09-01

Family

ID=37395917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005231171A Expired - Fee Related JP4533273B2 (ja) 2005-08-09 2005-08-09 画像処理装置及び画像処理方法、プログラム

Country Status (4)

Country Link
US (1) US7746507B2 (ja)
EP (1) EP1752895A1 (ja)
JP (1) JP4533273B2 (ja)
CN (1) CN100414550C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020816A (ja) * 2007-07-13 2009-01-29 Canon Inc 文書認識装置、文書認識方法、コンピュータプログラム
JP2013251624A (ja) * 2012-05-30 2013-12-12 Brother Ind Ltd 画像読取装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4533273B2 (ja) * 2005-08-09 2010-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US8190634B2 (en) * 2006-10-10 2012-05-29 Canon Kabushiki Kaisha Image display controlling apparatus, method of controlling image display, and storage medium
US8726178B2 (en) * 2006-11-10 2014-05-13 Ricoh Company, Ltd. Device, method, and computer program product for information retrieval
JP4372188B2 (ja) * 2007-12-21 2009-11-25 株式会社東芝 情報処理装置および表示制御方法
JP2011008446A (ja) * 2009-06-24 2011-01-13 Fuji Xerox Co Ltd 画像処理装置
US8817052B2 (en) * 2009-11-02 2014-08-26 Sony Corporation Information processing apparatus, image enlargement processing method, and computer program product with visible data area enlargement features
JP5528081B2 (ja) * 2009-12-10 2014-06-25 キヤノン株式会社 情報処理装置の制御方法、情報処理装置、及び、プログラム
US8879117B2 (en) * 2010-05-26 2014-11-04 Hewlett-Packard Development Company, L.P. Margin adjustment
CN102156855A (zh) * 2011-03-30 2011-08-17 信雅达系统工程股份有限公司 基于影像切割的银行凭证数据采集方法
KR20130061604A (ko) * 2011-12-01 2013-06-11 삼성전자주식회사 화상형성장치, 화상형성방법 및 기록 매체
US9965695B1 (en) * 2016-12-30 2018-05-08 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method based on content type separation
WO2019054999A1 (en) * 2017-09-13 2019-03-21 Google Llc EFFICIENT AUGMENTATION OF IMAGES WITH RELATED CONTENT
JP7484198B2 (ja) * 2020-02-03 2024-05-16 富士フイルムビジネスイノベーション株式会社 文書処理装置およびプログラム
US11134171B1 (en) * 2020-06-30 2021-09-28 Kyocera Document Solutions Inc. Image reading apparatus, image forming apparatus, and image reading method that perform image processing for each area
US11212419B1 (en) * 2020-06-30 2021-12-28 Kyocera Document Solutions Inc. Image reading system, image forming system, and image reading method that perform image processing for each area
CN113487641A (zh) * 2021-08-03 2021-10-08 致真存储(北京)科技有限公司 一种基于stt-mram的图像边缘检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728977A (ja) * 1993-07-08 1995-01-31 Mitsubishi Electric Corp ファイリング装置
JPH11328417A (ja) * 1998-05-20 1999-11-30 Toshiba Corp 画像処理装置、画像処理方法及び画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002354220A (ja) * 2001-05-24 2002-12-06 Murata Mach Ltd 通信端末装置
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5579590A (en) * 1978-12-13 1980-06-16 Hitachi Ltd Video data processor
DE3413699A1 (de) * 1983-04-12 1984-10-18 Canon K.K., Tokio/Tokyo Bildverarbeitungssystem
FR2590431B1 (fr) * 1985-11-18 1996-11-15 Ricoh Kk Machine de reproduction en fac-simile avec impression de pages
JPH0623999B2 (ja) * 1986-07-28 1994-03-30 株式会社日立製作所 パタ−ン欠陥検出方法
DE3864637D1 (de) * 1987-09-11 1991-10-10 Dainippon Screen Mfg Geraet zum festhalten von empfindlich gemachtem material in einer kopierkamera, welche schlitzweise belichtet.
JP2835178B2 (ja) * 1990-11-28 1998-12-14 株式会社東芝 文書読取装置
US5751854A (en) * 1992-08-03 1998-05-12 Ricoh Company, Ltd. Original-discrimination system for discriminating special document, and image forming apparatus, image processing apparatus and duplicator using the original-discrimination system
US5611024A (en) * 1992-08-28 1997-03-11 Compaq Computer Corporation Data compression of bit map images
JPH0774918A (ja) * 1993-08-30 1995-03-17 Ricoh Co Ltd 画像形成装置
JP3478877B2 (ja) * 1994-09-30 2003-12-15 ミノルタ株式会社 画像形成装置
JP3494326B2 (ja) * 1994-10-19 2004-02-09 ミノルタ株式会社 画像形成装置
EP0724229B1 (en) * 1994-12-28 2001-10-10 Canon Kabushiki Kaisha Image processing apparatus and method
US5768481A (en) * 1995-06-05 1998-06-16 Apple Computer, Inc. Method and apparatus for compression of digitized image data using a dynamic band recompression scheme
EP0750428B1 (en) * 1995-06-22 2004-03-31 Canon Kabushiki Kaisha Image processing apparatus and method
JP3604467B2 (ja) * 1995-09-27 2004-12-22 株式会社東芝 心筋のねじれ補正方法
US5933823A (en) * 1996-03-01 1999-08-03 Ricoh Company Limited Image database browsing and query using texture analysis
US6314213B1 (en) * 1996-09-19 2001-11-06 Canon Kabushiki Kaisha Image processing apparatus and method which process image on the basis of direction of document
JPH10164291A (ja) * 1996-11-29 1998-06-19 Toshiba Corp 画像形成装置
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
KR100295225B1 (ko) * 1997-07-31 2001-07-12 윤종용 컴퓨터에서 영상정보 검색장치 및 방법
JP3722966B2 (ja) * 1997-11-13 2005-11-30 株式会社リコー 縮小画像作成装置
US6101291A (en) * 1998-02-11 2000-08-08 Lucent Technologies Inc. Platen-based image-aquisition apparatus having preview feature
US6272247B1 (en) * 1998-05-18 2001-08-07 Datacube, Inc. Rotation and scale invariant image finder
US6178417B1 (en) * 1998-06-29 2001-01-23 Xerox Corporation Method and means of matching documents based on text genre
US6765687B2 (en) * 1998-09-10 2004-07-20 Canon Kabushiki Kaisha Image processing method and apparatus
US6351556B1 (en) * 1998-11-20 2002-02-26 Eastman Kodak Company Method for automatically comparing content of images for classification into events
GB9903451D0 (en) 1999-02-16 1999-04-07 Hewlett Packard Co Similarity searching for documents
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US6747666B2 (en) * 2000-01-26 2004-06-08 New York University Method and system for facilitating wireless, full-body, real-time user interaction with digitally generated text data
US6694065B2 (en) * 2000-03-10 2004-02-17 Fujitsu Limited Image collating apparatus and image collating method
JP2001283216A (ja) * 2000-04-03 2001-10-12 Nec Corp 画像照合装置、画像照合方法、及びそのプログラムを記録した記録媒体
AU4747800A (en) * 2000-04-14 2001-10-30 Orlean Holding N.V. An improved system and method for digitally editing a composite image
JP2001326847A (ja) * 2000-05-16 2001-11-22 Fuji Photo Film Co Ltd 画像撮像装置
JP3742279B2 (ja) * 2000-06-09 2006-02-01 日本電信電話株式会社 画像照合装置、画像照合方法及び画像照合プログラムを記録した記録媒体
US7038795B2 (en) * 2000-06-12 2006-05-02 Canon Kabushiki Kaisha Image input/output apparatus, method of controlling image input/output apparatus, image input/output system, and storage media
JP2002183166A (ja) * 2000-12-19 2002-06-28 Nec Corp ドキュメントファイリングシステムおよび方法
JP2002208005A (ja) * 2001-01-12 2002-07-26 Minolta Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002290710A (ja) * 2001-03-28 2002-10-04 Fuji Photo Film Co Ltd 縮小画像作成方法及びプログラム
JP3882585B2 (ja) * 2001-11-07 2007-02-21 富士ゼロックス株式会社 画像処理装置およびプログラム
JP3973602B2 (ja) * 2002-07-10 2007-09-12 株式会社リコー 画像処理装置、画像処理方法及びソフトウェアプログラム
JP4135888B2 (ja) * 2002-09-18 2008-08-20 株式会社リコー 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP4375523B2 (ja) * 2002-12-20 2009-12-02 富士ゼロックス株式会社 画像処理装置、画像処理方法、画像処理プログラム、印刷物検査装置、印刷物検査方法、印刷物検査プログラム
JP4266695B2 (ja) * 2003-04-30 2009-05-20 キヤノン株式会社 画像処理装置及び画像処理方法
JP4405831B2 (ja) * 2003-05-20 2010-01-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7475061B2 (en) * 2004-01-15 2009-01-06 Microsoft Corporation Image-based document indexing and retrieval
JP4533273B2 (ja) * 2005-08-09 2010-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US8065321B2 (en) * 2007-06-20 2011-11-22 Ricoh Company, Ltd. Apparatus and method of searching document data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728977A (ja) * 1993-07-08 1995-01-31 Mitsubishi Electric Corp ファイリング装置
JPH11328417A (ja) * 1998-05-20 1999-11-30 Toshiba Corp 画像処理装置、画像処理方法及び画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002354220A (ja) * 2001-05-24 2002-12-06 Murata Mach Ltd 通信端末装置
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020816A (ja) * 2007-07-13 2009-01-29 Canon Inc 文書認識装置、文書認識方法、コンピュータプログラム
JP2013251624A (ja) * 2012-05-30 2013-12-12 Brother Ind Ltd 画像読取装置

Also Published As

Publication number Publication date
EP1752895A1 (en) 2007-02-14
US20070036468A1 (en) 2007-02-15
CN100414550C (zh) 2008-08-27
JP4533273B2 (ja) 2010-09-01
CN1913573A (zh) 2007-02-14
US7746507B2 (en) 2010-06-29

Similar Documents

Publication Publication Date Title
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4920928B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4181892B2 (ja) 画像処理方法
US7272269B2 (en) Image processing apparatus and method therefor
JP4371965B2 (ja) 画像処理装置、画像処理方法
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US7551753B2 (en) Image processing apparatus and method therefor
JP4785655B2 (ja) 文書処理装置及び文書処理方法
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP4261988B2 (ja) 画像処理装置及び方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
US8181108B2 (en) Device for editing metadata of divided object
JP2006031181A (ja) 画像検索装置、方法、記憶媒体及びプログラム
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
JP2005151455A (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2009303149A (ja) 画像処理装置、画像処理方法及びコンピュータ制御プログラム
JP2007048057A (ja) 画像処理装置
JP2008107901A (ja) 画像処理装置及びその制御方法、プログラム
JP2006018509A (ja) 文書管理支援装置
JP2021144673A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2006165783A (ja) 画像処理システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080729

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100607

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100611

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees