JP4405831B2 - 画像処理装置及びその制御方法、プログラム - Google Patents

画像処理装置及びその制御方法、プログラム Download PDF

Info

Publication number
JP4405831B2
JP4405831B2 JP2004069487A JP2004069487A JP4405831B2 JP 4405831 B2 JP4405831 B2 JP 4405831B2 JP 2004069487 A JP2004069487 A JP 2004069487A JP 2004069487 A JP2004069487 A JP 2004069487A JP 4405831 B2 JP4405831 B2 JP 4405831B2
Authority
JP
Japan
Prior art keywords
image
page
comparison
feature amount
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004069487A
Other languages
English (en)
Other versions
JP2005004724A5 (ja
JP2005004724A (ja
Inventor
洋 東條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004069487A priority Critical patent/JP4405831B2/ja
Priority to US10/847,573 priority patent/US8203748B2/en
Priority to EP04252925A priority patent/EP1480440B1/en
Priority to DE602004022103T priority patent/DE602004022103D1/de
Priority to CNB2004100453313A priority patent/CN1271505C/zh
Publication of JP2005004724A publication Critical patent/JP2005004724A/ja
Publication of JP2005004724A5 publication Critical patent/JP2005004724A5/ja
Application granted granted Critical
Publication of JP4405831B2 publication Critical patent/JP4405831B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32561Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using a programmed control device, e.g. a microprocessor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30144Printing quality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • H04N1/32122Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate device, e.g. in a memory or on a display separate from image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0081Image reader
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0082Image hardcopy reproducer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0087Image storage device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3232Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of a page, copy or picture number

Description

本発明は、複写機などの画像入力装置で、読み取った紙文書から対応するオリジナルの電子データを検索し、オリジナルの電子データを印刷、配信、蓄積、編集などに活用することを可能とする画像処理技術に関するものである。
近年、複写機のデジタル化及びネットワーク化が進んでいる。印刷機能も多様化しており、同一の、或いは、複数の文書に含まれる複数のページを、1枚の紙に配置して印刷することが可能となっている。
例えば、会議などで多用されている配布資料などは参照用であるため、1枚の紙に1文書の2ページ分、4ページ分といったように、Nページ分の文書を1枚の紙にレイアウトして印刷されたものであることが多い(以降、Nページ印刷と呼ぶ)。また、複数の文書のページを一度に参照する必要があるときは、結合させて印刷する場合もあり得る(以降、結合印刷と呼ぶ)。更に、印刷後に2つ折にして製本できるように、ページ番号が製本時の順に印刷される場合もあり得る(以降、製本印刷と呼ぶ)。
尚、以降、Nページ印刷、結合印刷、製本印刷等の1枚の紙にNページ分の文書をレイアウトして印刷する印刷を総称してNup印刷と呼ぶことにする。
一方、紙文書をスキャナで読み取り、その読み取った紙文書画像のオリジナルの電子データを検索し、オリジナルの電子データそのものから印刷したり、ネットワーク内の所望のPC(パーソンルコンピュータ)等の端末へ配信したり、ネットワーク内の所望の蓄積媒体へ保存したり、または編集したりすることを可能とするシステムが提案されはじめている。
これを実現するための方法として、例えば、特許文献1では、紙文書をスキャンしたスキャン電子データと、記憶媒体中の電子データをビット単位で比較することにより、スキャン電子データのオリジナルの電子データを検索することを可能としている。
また、例えば、特許文献2では、書類を電子データにする際に、その電子データに識別コードを付与して、その識別コードを含む印刷物を生成する。これにより、別途、印刷物に対応する電子データを検索したり印刷したりする場合には、その印刷物を読み込み、印刷されている識別コードを認識することで、所望の電子データの検索や印刷が可能となっている。
特許第3017851号 特開2001−257862号
しかしながら、特許文献1、2では、Nup印刷の文書については何ら考慮していないので、Nup印刷が使用されるような環境においては、次のような問題が生じる。
例えば、特許文献1では、Nup印刷された文書をスキャンして得た電子データを1ページ分と解釈する。これに対し、オリジナルの電子データは、1ページを単位とした電子データで記憶媒体に管理されているので、どの電子データと比較しても高い類似度が得らない。よって、オリジナルの電子データを検索できなくなる。
また、例えば、特許文献2では、識別コードは各ページに対して印字位置が決まっているので、Nup印刷した際には印字位置がずれてしまい、各識別コードが読み取れなくなってしまうので、やはりオリジナルの電子データを検索できなくなってしまう。
本発明は上記の課題に鑑みてなされたものであり、Nup印刷された紙文書から、オリジナルの電子データを検索し、活用することを可能とする画像処理装置及びその制御方法、プログラムを提供することを目的とする。
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
複数の電子データを比較先画像として記憶する記憶手段と、
印刷物を電子的に読み取り、その印刷物の電子データを比較元画像として入力する入力手段と、
前記比較元画像に含まれるページ画像の数に基づいて、前記比較元画像に含まれるページ画像を含む処理対象領域の特徴量を抽出する抽出手段と、
前記抽出手段で抽出した特徴量を用いて、前記比較元画像に対応する比較先画像を前記記憶手段から検索する検索手段と、
を備える。
また、好ましくは、前記検索手段の検索結果である画像に対して処理を行う処理手段と更に備える。
また、好ましくは、前記比較元画像に含まれるページ画像のページ数を指定する指定手段を更に備え、
前記抽出手段は、前記指定手段で指定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出する。
また、好ましくは、前記抽出手段は、前記処理対象領域の画像特徴量及び文字特徴量のいずれかまたは両方を抽出する。
また、好ましくは、前記画像特徴量は、色特徴量、輝度特徴量、テクスチャ特徴量、形状特徴量のいずれか1つ、或いは、任意の組み合わせである。
また、好ましくは、前記文字特徴量は、文字コードである。
また、好ましくは、前記検索手段による検索結果を表示する表示手段と、
前記検索手段による検索結果として、前記表示手段に複数の比較先画像が表示された場合、該複数の比較先画像から所望の画像を選択する選択手段と
を更に備える。
また、好ましくは、前記比較元画像が複数のページ画像から構成されている場合、該複数のページ画像から所望のページ画像を指定する指定手段を更に備え、
前記抽出手段は、前記指定手段で指定されたページ画像を含む処理対象領域の特徴量を抽出する。
また、好ましくは、前記処理手段は、前記検索手段で検索された画像を、指定された印刷条件で印刷する。
また、好ましくは、前記検索結果の画像に対する処理の種類を指示する指示手段を更に備え、
前記処理の種類は、印刷、配信、蓄積、編集のいずれかである。
また、好ましくは、前記比較元画像に複数のページ画像が存在するか否かを判定する第1判定手段と、
前記第1判定手段による判定の結果、前記比較元画像に複数のページ画像が存在する場合、前記比較元画像に含まれるページ画像とのページ数を判定する第2判定手段と、
前記抽出手段は、前記第2判定手段で判定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出する。
また、好ましくは、前記第1判定手段は、前記比較元画像中に含まれるページ番号を検出し、前記ページ番号が所定の領域内で等間隔に存在しているか否かを判定することで、前記比較元画像に複数のページ画像が存在するか否かを判定する。
また、好ましくは、前記第1判定手段は、前記比較元画像の最右端余白または最左端余白と、それ以外の中間余白を検出し、検出した中間余白が、前記最右端余白または前記最左端余白よりも大きいか否かを判定することで、前記比較元画像に複数のページ画像が存在するか否かを判定する。
また、好ましくは、前記第1判定手段の判定結果を表示する表示手段と、
前記判定結果を修正する修正手段と
を更に備える。
また、好ましくは、前記比較先画像を入力する入力手段と、
前記入力手段で入力される比較先画像に含まれるページ画像のページ数を指定する指定手段とを更に備え、
前記抽出手段は、前記指定手段で指定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出し、
前記記憶手段は、前記比較先画像と、前記抽出手段で抽出した特徴量とを対応づけて記憶する。
また、好ましくは、前記比較先画像を入力する入力手段と、
前記比較先画像に複数のページ画像が存在するか否かを判定する第1判定手段と、
前記第1判定手段による判定の結果、前記比較元画像に複数のページ画像が存在する場合、前記比較元画像に含まれるページ画像とのページ数を判定する第2判定手段とを更に備え、
前記抽出手段は、前記第2判定手段で判定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出し、
前記記憶手段は、前記比較先画像と、前記抽出手段で抽出した特徴量とを対応づけて記憶する。
上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
印刷物を電子的に読み取ることによって得た電子データを比較元画像として入力する入力工程と、
前記比較元画像に含まれるページ画像の数に基づいて、前記比較元画像に含まれるページ画像を含む処理対象領域の特徴量を抽出する抽出工程と、
前記抽出工程で抽出した特徴量を用いて、記憶媒体に比較先画像として記憶されている複数の電子データから、前記比較元画像に対応する比較先画像を検索する検索工程と
を備える。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
画像処理の制御をコンピュータで実現するプログラムであって、
印刷物を電子的に読み取ることによって得た電子データを比較元画像として入力する入力工程のプログラムコードと、
前記比較元画像に含まれるページ画像の数に基づいて、前記比較元画像に含まれるページ画像を含む処理対象領域の特徴量を抽出する抽出工程のプログラムコードと、
前記抽出工程で抽出した特徴量を用いて、記憶媒体に比較先画像として記憶されている複数の電子データから、前記比較元画像に対応する比較先画像を検索する検索工程のプログラムコードと、
を備える。
以上説明したように、本発明によれば、Nup印刷された紙文書から、オリジナルの電子データを検索し、活用することを可能とする画像処理装置及びその制御方法、プログラムを提供できる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
<<実施形態1>>
図1は本発明の実施形態1の画像処理システムの構成を示すブロック図である。
この画像処理システムは、オフィス10とオフィス20とをインターネット等のネットワーク104で接続された環境で実現する。
オフィス10内に構築されたLAN107には、複数種類の機能を実現する複合機であるMFP(Multi Function Peripheral)100、MFP100を制御するマネージメントPC101、クライアントPC102、文書管理サーバ106及びそのデータベース105、及びプロキシサーバ103が接続されている。
オフィス10内のLAN107及びオフィス20内のLAN108は、双方のオフィスのプロキシサーバ103を介してネットワーク104に接続されている。
MFP100は、特に、紙文書を電子的に読み取る画像読取部と、画像読取部から得られる画像信号に対する画像処理を実行する画像処理部を有し、この画像信号はLAN109を介してマネージメントPC101に送信することができる。
マネージメントPC101は、通常のPCであり、内部に画像記憶部、画像処理部、表示部、入力部等の各種構成要素を有するが、その構成要素の一部はMFP100に一体化して構成されている。
尚、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
また、マネージメントPC101、クライアントPC102、文書管理サーバ等の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
次に、MFP100の詳細構成について、図2を用いて説明する。
図2は本発明の実施形態1のMFPの詳細構成を示すブロック図である。
図2において、原稿台とオートドキュメントフィーダ(ADF)を含む画像読取部110は、束状のあるいは1枚の原稿画像を光源(不図示)で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読取信号を所定密度(例えば、600DPI)のラスタ画像として得る。
また、MFP100は、画像読取信号に対応する画像を印刷部112で記録媒体に印刷する複写機能を有し、原稿画像を1つ複写する場合には、この画像読取信号をデータ処理部115で画像処理して記録信号を生成し、これを印刷部112によって記録媒体上に印刷させる。一方、原稿画像を複数複写する場合には、記憶部111に一旦一つ分の記録信号を記憶保持させた後、これを印刷部112に順次出力して記録媒体上に印刷させる。
また、Nup印刷を行う場合は、データ処理部115で指定されたページ分の画像信号を縮小し、1枚の紙で印刷可能となるように各ページの画像信号をレイアウトする。その後、印刷部112に出力して記録媒体上に印刷させる。
一方、クライアントPC102から出力される記録信号は、LAN107及びネットワークIF114を介してデータ処理部115が受信し、データ処理部115は、その記録信号を印刷部112で記録可能なラスターデータに変換した後、印刷部112によって記録媒体上に印刷させる。
MFP100への操作者の指示は、MFP100に装備されたキー操作部とマネージメントPC101に接続されたキーボード及びマウスからなる入力部113から行われ、これら一連の動作はデータ処理部115内の制御部(不図示)で制御される。また、操作入力の状態表示及び処理中の画像データの表示は、表示部116で行われる。
記憶部111は、マネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの送受信及び制御は、ネットワークIF117及びLAN109を介して行われる。
尚、MFP100では、後述する各種処理を実行するための各種操作・表示をユーザに提供するユーザインタフェースを、表示部116及び入力部113によって実現している。
本発明による画像処理システムで実行する処理としては、大きく分けて画像データを登録する登録処理と、所望の画像データを検索する検索処理の2つがある。
尚、実施形態1では、画像処理システム全体の処理効率を向上するために、以下に説明する各種処理を、画像処理システムを構成する各種端末に分散させて実行するようにしているが、1つの端末(例えば、MFP100)上で実行するようにしても構わない。
まず、登録処理について説明する。
[登録処理の概要]
登録対象の画像データの登録方法としては、紙文書をスキャン入力して生成した画像データを登録する場合と、文書作成アプリケーション等で作成された電子文書をラスタ画像に展開した画像データを登録する場合がある。
そこで、オリジナル文書を登録する登録処理の概要について、図3Aを用いて説明する。
図3Aは本発明の実施形態1の登録処理を示すフローチャートである。
尚、この処理は、画像読取部110のADFに、登録対象の紙文書がセットされ、入力部113の登録ボタンが操作された時点で開始される。また、登録対象の紙文書は、1枚でも複数枚でも可能であるが、複数枚の場合は、その紙文書から得られる画像データ群(ページ画像群)を1つのファイルとして管理することになる。
まず、ステップS3010で、登録対象のオリジナル文書を入力する。また、この入力に伴って、オリジナル文書を管理するための各種情報を生成して記憶部111に記憶する。
尚、オリジナル文書を登録する際のオリジナル文書の入力方法には、2種類存在する。
オリジナル文書が電子データである場合は、クライアントPC102内のハードディスク内、あるいはオフィス10や20内の文書管理サーバ106内のデータベース105内、あるいはMFP100の記憶部111のいずれかに格納されており、これらの記憶元から登録対象のオリジナル文書の電子データを読み出してネットワークIF114を介してデータ処理部115に入力し、データ処理部115でその電子データをラスタ画像に変換する。
一方、オリジナル文書が紙文書である場合は、MFP100の画像読取部110で、その紙文書をラスタ状に走査しラスタ画像を得る。
このように、実施形態1では、登録対象のオリジナル文書に、電子データあるいは紙文書のどちらも扱うことが可能である。その後、ラスタ画像をデータ処理部115で前処理を施し記憶部111に保存する(尚、これ以降、紙文書のときはラスタ画像がオリジナル文書の電子データとなる)。このとき、登録対象のオリジナル文書毎に固有の文書IDを発行し、オリジナル文書の電子データのアドレスと対応付けて記憶部111にアドレス情報として保存する。
ここで、アドレスとは、URLや、サーバ名とディレクトリ、ファイル名からなる電子データの格納先を示すフルパス情報である。また、アドレス情報の一例を示すと、図4のようになる。また、アドレス情報の格納先は、データベース105や記憶部111等が挙げられる。
尚、オリジナル文書が紙文書である場合の電子データのファイル形式は、例えば、BMP形式とするが、これに限定されるものではなく、色情報を保存しておくことが可能なファイル形式(例えば、GIF、JPEG)であればどのようなものでも良い。
一方、オリジナル文書が電子データである場合のその電子データのファイル形式は、その電子データを作成したアプリケーション(例えば、マイクロソフト(登録商標)社のMS−Wordや、アドビシステム(登録商標)のアクロバット等)で作成されたファイル形式(*.docや*.pdf)となる。
次に、ステップS3011で、ステップS3010で入力された文書の数を入力文書数Pに設定する。次に、ステップS3012で、処理文書数を示す変数aと、処理対象の1文書中の処理ページ数を示す変数bにそれぞれ初期値として1を設定する。次に、ステップS3013で、1文書のページ数Qにa番目の文書中のページ数を設定する。
次に、終了判定として、Pがa以上であるか否かを判定する。a未満である場合(ステップS3014でNO)、処理を終了する。一方、a以上である場合(ステップS3014でYES)、未処理の文書が存在するので、処理を続行する。
次に、ステップS3015で、文書単位の終了判定として、Qがb以上であるか否かを判定する。b未満である場合(ステップS3015でNO)、ステップS3032へ進み、aを1インクリメントして、ステップS3014へ戻り、処理対象を次の文書に移す。一方、b以上である場合(ステップS3015でYES)、未処理のページが存在するので、処理を続行する。
次に、P番目の文書のQページに関して、ブロックセレクション(BS)処理を行う。この処理は、マネージメントPC101の制御によって実行する。
具体的には、マネージメントPC101のCPUは、記憶部111に格納された処理対象のオリジナル文書のラスタ画像を、まず、文字/線画部分とハーフトーン画像部分とに領域分割し、文字/線画部分は更に段落で塊として纏まっているブロック毎に、あるいは線で構成された表、図形毎に分割する。
一方、ハーフトーン画像部分は、矩形に分離されたブロックの画像部分、背景部分等のブロックに分割する。
そして、処理対象のページのページ番号、そのページ中の各ブロックを特定するブロックIDを発行し、各ブロックの属性(画像、文字等)、サイズやオリジナル文書内の位置(ページ内の座標)と各ブロックを関連付けて記憶部111にブロック情報として記憶する。このブロック情報の一例を示すと、図5のようになる。
次に、ステップS3030で、データ処理部115において、各ブロックの種別に応じて、各ブロックの特徴量情報を抽出する特徴量情報抽出処理を行う。
特に、文字ブロックについては、OCR処理を施して文字コードを抽出し、これを文字特徴量とする。また、画像ブロックについては、色に関する画像特徴量を抽出する。このとき、それぞれのブロックに対応する特徴量をオリジナル文書単位にまとめ、文書ID、ページ番号、ブロックIDに関連付けて記憶部111に特徴量情報として記憶する。この特徴量情報の一例を示すと、図6及び図7のようになる。
次に、ステップS3031で、bを1インクリメントし、ステップS3014へ戻り、処理対象の次のページに移す。
[検索処理の概要]
オリジナル文書の電子データを検索する検索処理の概要について、図3Bを用いて説明する。
図3Bは本発明の実施形態1の検索処理を示すフローチャートである。
まず、ステップS3110で、検索条件となる紙文書の入力を行う。この処理は、ステップS3010の処理と同様であるので説明は省略する。但し、この処理によって生成するラスタ画像は一時保存するだけであり、その紙文書に対するアドレス情報を記憶部111に保存しておく必要はない。
次に、ステップS3111で、ユーザによるNup印刷の指定の有無を判定する。Nup印刷の指定がある場合(ステップS3111でYES)、ステップS3112進み、ページ数Lにユーザが指定した1枚中のページ数を設定する。一方、Nup印刷の指定がない場合(ステップS3111でNO)、ステップS3115に進み、1枚中1ページとみなし、ページ数Lに1を設定する。
次に、ステップS3113で、処理対象の1文書中の処理ページ数を示す変数bに初期値として1を設定する。次に、比較処理の終了判定として、Lがb以上であるか否かを判定する。b未満である場合(ステップS3116でNO)、ステップS3150に進む。一方、b以上である場合(ステップS3116でYES)、未処理のページが存在するので、処理を続行するために、ステップS3120に進む。
次に、ステップS3120で、ラスタ画像中のbページ目の画像領域に対して、ブロックセレクション(BS)処理を行う。
この時のブロックセレクション処理の具体例については、図8を用いて説明する。
図8では、2ページ分をNup印刷した例を示している。図8において、810は1枚の紙全体の領域であり、811と812は各ページのページ画像を示している。813と814は各ページのページ番号である。ここで、b=1である場合、1ページ目のページ画像811を含む処理対象領域815に対してのみ、ブロックセレクション処理を行うことになる。そして、図8の例では、b=2の場合は、2ページ目のページ画像812を含む処理対象領域に対してブロックセレクション処理を行うことになる。
尚、このブロックセレクション処理自体は、ステップS3020のブロックセレクション処理と同様であるので説明は省略する。但し、このブロックセレクション処理によって生成する各ブロックの属性、サイズ、位置は一時保存するだけであり、その紙文書に対するブロック情報は記憶部111に保存しておく必要はない。
また、処理対象領域は、Lの値と、紙文書の向きに基づいて、1枚の紙文書をL個の領域に分割し、更に所定の処理順に基づいて決定される。
次に、ステップS3130で、各ブロックの特徴量情報を抽出する特徴量情報抽出処理を行う。この処理は、ステップS3030の処理と同様であるので説明は省略する。但し、この処理によって生成する各ブロックの特徴量は一時保存するだけであり、その紙文書に対する特徴量情報を記憶部111に保存しておく必要はない。
次に、ステップS3140で、入力した紙文書中のbページ目の画像(比較元画像)に対する特徴量情報と、クライアントPC102内のハードディスク内、あるいはオフィス10や20内の文書管理サーバ106内のデータベース105内、あるいはMFP100の記憶部111のいずれかに格納されている電子データ(比較先画像)の特徴量情報を比較して、その類似度を算出し、その類似度に基づいて、検索結果とするオリジナル文書候補を決定する。
次に、ステップS3141で、bを1インクリメントし、ステップS3116へ戻り、処理対象を次のページに移す。
そして、ステップS3116において、Lがb未満である場合(ステップS3116でNO)、ステップS3150に進み、ユーザ確認モードであるか否かを判定する。
尚、ユーザ確認モードとは、比較処理によって得られたオリジナル文書候補の中から、ユーザが所望するオリジナル文書が検索されたか否かを確認するモードである。具体的には、オリジナル文書候補群を含むユーザインタフェースを表示部116・入力部113で実現し、このユーザインタフェースによって、オリジナル文書候補群の内容をユーザが確認することができるモードである。また、このユーザインタフェースの構成の詳細については後述する。
ステップS3150において、ユーザ確認モードでない場合(ステップS3150でNO)、比較処理で最も類似していると判断された文書を自動的に選択して、ステップS3170に進む。一方、ユーザ確認モードである場合(ステップS3150でYES)、ステップS3160に進み、オリジナル文書候補の表示/選択を行う。特に、この選択は、オリジナル文書候補のサムネイル画像を表示部116に表示し、複数のオリジナル文書候補の中からユーザが所望のオリジナル文書候補のサムネイル画像を選択させることで実現する。
次に、ステップS3170では、選択されたオリジナル文書に対し、表示部106・入力部114で実現されるユーザインタフェースを介するユーザからの操作に基いて、そのオリジナル文書の印刷、配信、蓄積、編集のいずれかの処理を実行する。
以上説明したように、Nup印刷時は、1文書に含まれる各ページ毎に、ブロックセレクション処理、特徴量情報抽出処理を行い、これらを用いて、各ページ毎に順に類似画像検索を実行することで、各ページに対応する電子データを全て検索し、活用することができる。
[各処理の詳細]
以下、各処理の詳細について説明する。
まず、ステップS3020及びステップS3120のブロックセレクション処理の詳細について説明する。
ブロックセレクション処理とは、例えば、図9(a)のラスタ画像を、図9(b)のように、意味のあるブロック毎の塊として認識し、該ブロック各々の属性(文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等)を判定し、異なる属性を持つブロックに分割する処理である。
ブロックセレクション処理の実施形態を以下に説明する。
まず、入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つブロックへ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のブロックは文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字ブロック、扁平な画素塊を線ブロック、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表ブロック、不定形の画素塊が散在している領域を写真ブロック、それ以外の任意形状の画素塊を図画ブロックとする。
次に、ステップS3030及びステップS3130の特徴量情報抽出処理の詳細について説明する。
尚、特徴量情報抽出処理は、画像ブロック及び文字ブロックで処理方法が異なるので、それぞれ別に説明する。
ここで、画像ブロックは、図9(b)の例の場合、写真ブロックと図画ブロックとするが、用途や目的に応じて、画像ブロックを写真ブロック及び図画ブロックの少なくとも一方にすることも可能である。
まず、画像ブロックに対する特徴量情報抽出処理について説明する。
尚、1文書に複数の画像ブロックが存在する場合は、その総数分、以下の処理を繰り返す。
実施形態1では、一例として、画像の色に関する色特徴量を抽出する色特徴量情報抽出処理を行う。
この色特徴量情報抽出処理の詳細について、図10を用いて説明する。
図10は本発明の実施形態1の色特徴量情報抽出処理の詳細を示すフローチャートである。
尚、この処理では、処理対象画像を複数のメッシュブロックに分割した各メッシュブロックの色ヒストグラム中の最頻色を有する色と各メッシュブロックの位置情報を対応づけた情報を色特徴情報として抽出する。
まず、ステップS1020で、画像を複数のメッシュブロックに分割する。実施形態1では、図11に示すように、画像を縦横をそれぞれ9メッシュブロックに分割する。特に、実施形態1では、表記の都合上9×9=81メッシュブロックに分割している例を示しているが、実際には、15×15=225メッシュブロック程度であることが好ましい。
次に、ステップS1030で、処理対象となる着目メッシュブロックを左上端のブロックに設定する。尚、この着目メッシュブロックの設定は、例えば、図12に示すように、予め処理順序が決定された順序決定テーブルを参照して行う。
ステップS1040で、未処理の着目メッシュブロックの有無を判定する。未処理の着目メッシュブロックがない場合(ステップS1040でNO)、処理を終了する。一方、未処理の着目メッシュブロックがある場合(ステップS1040でYES)、ステップS1050に進む。
ステップS1050で、着目メッシュブロックの全画素の各濃度値を、図13の色空間を分割して作った部分空間である色ビンへ射影し、色ビンに対する色ヒストグラムを生成する。
尚、実施形態1では、図13に示すように、RGB色空間を3×3×3=27に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影する場合を示しているが、実際には、RGB色空間を6×6×6=216に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影するほうが好ましい。
ステップS1060で、色ヒストグラムの最頻色ビンの色ビンIDをその着目メッシュブロックの代表色と決定し、その着目メッシュブロックとその位置に対応づけて記憶部111に記憶する。
ステップS1070で、図12の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する。その後、ステップS1040に戻り、未処理の着目メッシュブロックがなくなるまで、ステップS1040〜ステップS1070の処理を再帰的に繰り返す。
以上の処理によって、処理対象画像(画像ブロック)のメッシュブロック毎の代表色と各メッシュブロックの位置情報が対応付けられた情報を色特徴量情報として抽出することができる。
次に、文字ブロックに対する特徴量情報抽出処理について説明する。
尚、1文書に複数の文字ブロックが存在する場合は、その総数分、以下の処理を繰り返す。
文字ブロックに対する文字特徴量情報は、その文字ブロックにOCR(文字認識)処理を施して得られる文字コードとする。
OCR(文字認識)処理は、文字ブロックから文字単位で切り出された文字画像に対し、パターンマッチングの一手法を用いて文字認識を行い、対応する文字コードを取得する。
この文字認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とするものである。
特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュブロック内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
ブロックセレクション処理(ステップS3020あるいはステップS3120)で抽出された文字ブロックに対して文字認識を行う場合は、まず、該当文字ブロックに対し横書き/縦書きの判定を行い、各々対応する方向に文字列を切り出し、その後、文字列から文字を切り出して文字画像を取得する。
横書き/縦書きの判定は、該当文字ブロック内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判定する。文字列及び文字への分解は、横書きの文字ブロックである場合には、その水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。一方、縦書きの文字ブロックに対しては、水平と垂直を逆にすれば良い。
次に、図3BのステップS3111のNup印刷の指定方法の詳細について説明する。
Nup印刷指定は、ユーザが、MFP100のユーザインタフェースを介して、Nup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数を指定するものである。
このユーザインタフェースの一例について、図14を用いて説明する。
図14は本発明の実施形態1のユーザインタフェースの一例を示す図である。
1411は表示・操作パネルである。1412〜1415は各種機能ボタンであり、それぞれの機能ボタン1412〜1415は、処理対象の画像の印刷指示、配信指示、蓄積指示及び編集指示を行うためのものである。
1416はスタートボタンであり、押下することで、機能ボタンで選択した機能を実行させることができる。1425はテンキーであり、印刷時の枚数の指定や、Nup印刷する場合の1枚の紙に含まれるページ数の指定を行うことが可能である。
1417は表示領域であり、タッチパネルで構成され、ユーザが直接画面に触れることで選択指示が可能である。1418は紙文書確認用領域であり、画像読取部110で読み取った紙文書画像を、領域内に収まるサイズに縮小して表示する。ユーザは紙文書画像の状態を、この領域1418で確認することが可能となる。
1419は入力原稿の種類を確認する領域であり、読み取った紙文書の種類の内容を確認することができる。この領域1419内において、1420はNup印刷の指定を行う指定領域である。また、Nup印刷が指定された場合には、その指定された状態を示すために、その表示形態が、例えば、色付き表示、ブリンク表示、ハイライト表示等の表示形態に変更される。
1424はNup印刷を指定する場合に、1枚の紙に含まれるページ数を表示する領域であり、特に、Nup印刷が指定されていない場合には、1が設定されている。ページ数の指定は、テンキー1425を使用する。
このようなユーザインタフェースを構成することで、読み取った紙文書に対するNup印刷の指定、Nup印刷である場合には、1枚の紙に何ページ分の文書を含まれるかを、その状態を表示しながら指定することができる。
次に、ステップS3140の比較処理の詳細について、図15を用いて説明する。
図15は本発明の実施形態1の比較処理の詳細を示すフローチャートである。
まず、ステップS1510で、アドレス情報を参照し、未比較のオリジナル文書の有無を判定する。未比較のオリジナル文書がない場合(ステップS1510でNO)、ステップS1550に進む。一方、未比較のオリジナル文書がある場合(ステップS1510でYES)、ステップS1520に進む。
次に、レイアウトの比較を行う。ここで、レイアウトとは、ブロック情報にあるブロックの属性、サイズ、位置のことである。比較元画像(紙文書)と比較先画像(電子データ)のレイアウトが同じである場合(ステップS1520でYES)、ステップS1530に進む。一方、比較元画像と比較先画像のレイアウトが同じでない場合(ステップS1520でNO)、ステップS1510に戻る。
次に、ステップS1530で、比較元画像(紙文書)と比較先画像(電子データ)のページ同士の比較を行うページ比較処理を実行する。この比較は、ブロックの属性に合わせ、文字、画像それぞれに応じた特徴量を用いて、複合的に比較を行い、類似度を算出する。この処理の詳細については後述する。
次に、ステップS1540で、比較先の文書ID、ページ番号に対応させて文書の類似度を記憶部111に一時記憶する。
ステップS1510において、全ての文書との比較が終了した場合(ステップS1510でNO)、ステップS1550に進み、類似度の降順に文書ID、ページ番号をソートし出力する。
次に、ステップS1530のページ比較処理の詳細について、図16を用いて説明する。
図16は本発明の実施形態1のページ比較処理の詳細を示すフローチャートである。
まず、ステップS1610で、ブロック情報を参照し、処理対象となる文書ID、ページ番号に対応する電子データ中で、未比較のブロックの有無を判定する。未比較のブロックがない場合(ステップS1610でNO)、ステップS1670に進む。一方、未比較のブロックがある場合(ステップS1610でYES)、ステップS1620に進む。
次に、ステップS1620で、比較対象のブロックの属性を判定する。属性が画像ブロックである場合、ステップS1640へ進む。一方、属性が文字ブロックである場合、ステップS1660へ進む。
属性が画像ブロックである場合、ステップS1640で、色に関する特徴量情報で比較先ブロックとの類似比較である色特徴量情報比較処理を行う。この処理の詳細については後述する。これによって得られる類似度は、比較先の文書ID、ページ番号、ブロックIDに対応させて記憶部111に一時記憶する。
一方、属性が文字ブロックである場合、ステップS1660で、文字の特徴量情報での比較元ブロックと比較先ブロックとの類似比較である文字特徴量情報比較処理を行う。この処理の詳細については後述する。また、これによって得られる類似度は、比較先の文書ID、ページ番号、ブロックIDに対応させて記憶部111に一時記憶する。
次に、ステップS1610において、全てのブロックとの比較が終了した場合(ステップS1610でNO)、ステップS1670に進み、ステップS1640及びステップS1660の処理によって記憶部111に記憶されている、比較先文書(電子データ)のページに含まれる全てのブロックの類似度を統合し、検索条件である紙文書とオリジナル文書中のページとの類似度を算出する統合処理を行う。この処理の詳細については後述する。
次に、ステップS1640の色特徴量情報比較処理の詳細について、図17を用いて説明する。
図17は本発明の実施形態1の色特徴量情報比較処理の詳細を示すフローチャートである。
まず、ステップS1710で、比較元画像ブロックと比較先画像ブロックの色特徴量を色特徴量情報から読み出す。
次に、ステップS1720で、処理対象とする画像ブロック中の着目メッシュブロックを先頭に設定する。ステップS1730で、比較元画像ブロックの色特徴量と、比較対象の色特徴量の類似度を示す類似距離を0にリセットする。
ステップS1740で、未比較の着目メッシュブロックの有無を判定する。未比較の着目メッシュブロックがない場合(ステップS1740でNO)、ステップS1780に進む。一方、未比較の着目メッシュブロックがある場合(ステップS1740でYES)、ステップS1750に進む。
ステップS1750で、比較元画像と比較先画像のそれぞれの色特徴量から、それぞれの着目メッシュブロックの色ビンIDを取得する。
ステップS1760で、図18の色ビンペナルティマトリックスを参照して、取得した色ビンID間に対応する着目メッシュブロックの局所的類似距離を取得し、これを直前の処理で取得している類似距離に累積加算する。そして、この類似距離は記憶部111に記憶する。
ここで、色ビンペナルティマトリックスについて、図18を用いて説明する。
図18は本発明の実施形態1の色ビンペナルティマトリックスの構成を示す図である。
色ビンペナルティマトリックスは、色ビンID同士の局所的類似距離を管理するマトリックスである。図18によれば、色ビンペナルティマトリックスは、同一色ビンIDではその類似距離は0となり、色ビンID同士の差が大きくなるほど、つまり、類似度が低くなるほど、その類似距離は大きくなるように構成されている。また、同一色ビンIDの対角位置は全て、その類似距離は0で、それを境に対象性を持っている。
このように、実施形態1では、色ビンペナルティマトリックスを参照するだけで、色ビンID同士の類似距離を取得することができるので、処理の高速化を図ることができる。
そして、ステップS1770で、図12の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する。その後、ステップS1740に戻る。
そして、ステップS1740で、未比較の着目メッシュブロックがない場合(ステップS1740でNO)、ステップS1780に進み、記憶部111に記憶されている類似距離を類似度に変換し、ブロックIDと対にして出力する。
尚、類似度への変換は、例えば、類似距離が最小値のときを類似度100%、類似距離が最大値のときを類似度0%として、その範囲内の類似距離に対する類似度は、最小値あるいは最大値に対する差に基づいて算出するようにすれば良い。
次に、ステップS1660の文字特徴量情報比較処理の詳細について説明する。
この処理では、比較元画像と比較先画像中のそれぞれの文字ブロック内の各文字コード同士の比較を行い、その一致度から類似度を算出する。
尚、検索条件とする紙文書とオリジナル文書との比較である場合、類似度は100%となるのが理想的であるが、実際には、検索条件となる紙文書中の文字ブロックに対するOCR処理では誤認識が発生する場合があるので、オリジナル文書との比較であっても、類似度は100%にならないことはあるが、かなり100%に近い値となる。
次に、ステップS1670の統合処理の詳細について説明する。
この統合処理では、比較先画像であるオリジナル文書内で占めている割合の大きいブロックの類似度が、オリジナル文書全体の類似度としてより大きく反映されるような、算出されたブロック毎の類似度の統合を行う。
例えば、オリジナル文書中のブロックB1〜B6に対し、ブロック毎の類似率がn1〜n6と算出されたとする。このときオリジナル文書全体の総合類似率Nは、以下の式で表現される。
N=w1*n1+w2*n2+w3*n3+ ・・・ +w6*n6 (1)
ここで、w1〜W6は、各ブロックの類似率を評価する重み係数である。重み係数w1〜w6は、ブロックのオリジナル文書内の占有率により算出する。例えば、ブロック1〜6のサイズをS1〜S6とすると、ブロック1の占有率w1は、
w1=S1/(S1+S2+・・・+S6) (2)
として算出することができる。
このような占有率を用いた重み付け処理により、オリジナル文書内で大きな領域を占めるブロックの類似度がより、オリジナル文書全体の類似度に反映することができる。
次に、ステップS3150及びステップS3160に示す確認モード時の処理の詳細について説明する。
確認モードは、ユーザが予めユーザインタフェースから指定してもよいし、確認モードにするべきか否かを自動で判定しても良い。自動判定の方法としては、次の方法がある。例えば、検索されたオリジナル文書候補が1つの場合、または、1位のオリジナル文書候補と2位以降のオリジナル文書候補のそれぞれ類似度の差が所定値以上で、1位のオリジナル文書候補が、所望とするオリジナル文書である可能性が高い場合は、「非確認モード」としてステップS3170に進み、そうでない場合は、「確認モード」とする。
但し、Nup印刷の紙文書をスキャンした場合は、スキャン画像中の各ページに対応するそれぞれの候補について、1つでも上記の条件を満足しない場合は、「確認モード」となり、上記の条件を満足しなかったページのみの確認を行う。
「確認モード」の際は、MFP100の表示部110と入力部113で実現されるユーザインタフェースに、オリジナル文書候補群を類似度の高い順に表示して、その中から所望のオリジナル文書の選択をユーザに行ってもらう。
このように、確認モードの実行の有無を自動判定する場合は、ユーザによるオリジナル文書の選択操作が不要となるので、操作工数を低減することができる。
ここで、確認モード時のユーザインタフェースの一例について、図19を用いて説明する。
図19は本発明の実施形態1のユーザインタフェースの一例を示す図である。
1917は表示領域であり、タッチパネルで構成され、ユーザが直接画面に触れることで選択指示が可能である。尚、この表示領域1917は、図14の表示領域1417と同様のものである。
1918はモード表示領域であり、図19では、確認モードであることを示している。通常は自動判定されたモードを表示する。また、これに触れることで、「確認モード」と「非確認モード」をユーザがサイクリックに指定することができる。
1919〜1928は、検索結果として出力するオリジナル文書候補のサムネイル画像群である。このサムネイル画像の表示は、1919から番号順に類似度の高い順で表示されている。
この例では、最大10のサムネイル画像が表示され、オリジナル文書候補が10以上である場合には、上位10までのサムネイル画像が表示される。そして、このサムネイル画像群1919〜1928から、所望するサムネイル画像を選択することで、所望のオリジナル文書を選択することが可能であり、その選択したオリジナル文書に対する各種処理を実行することが可能となる。
1929はNup印刷の紙文書をスキャンした時に表示され、文書中の何ページ目の候補が表示されているかを示すものである。また、これを選択することで、他のページの候補を切り替えて表示させることもできる。
次に、ステップS3170の印刷/配信/蓄積/編集処理の詳細について説明する。
例えば、Nup印刷した紙文書をスキャンして、これを用いて、類似画像検索を行った場合は、その文書中の各ページに対する複数ページ分の検索結果(オリジナル文書)が得られる。
そして、これらの複数ページ分の検索結果を用いて印刷を行う場合には、その印刷条件としては、例えば、1枚につき1ページ分を印刷してもよいし、もとのNup印刷とはレイアウトを変更したNup印刷を行ってもよいし、1枚の両面にそれぞれのページを印刷するようにしても良いし、各ページを1枚の紙に重ねて(オーバーレイして)印刷するようにしてもよいし、順番を変えて製本印刷するようにしてもよい。また、もちろん、ユーザが指定したページのみを1枚の紙に印刷してもよい。
また、印刷処理以外に、検索結果の全てについて、配信、蓄積、編集等の処理を行うようにしても、ユーザが指定したページのみを配信、蓄積、編集等の処理を行うようにしてもよい。
以上説明したように、実施形態1によれば、Nup印刷した紙文書に含まれる全てのページに対して、オリジナルの電子データを検索することができ、かつその検索した電子データを用いた様々な活用を実現することができる。
<<実施形態2>>
実施形態1では、入力する紙文書がNup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数の指定をユーザが行う構成としたが、実施形態2では、入力した紙文書の内容を解析して、その解析結果に基づいて、紙文書がNup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数を自動判定する構成について説明する。また、この自動判定のタイミングは、実施形態1の図3BのステップS3110の紙文書の入力後に実行する。
以下、実施形態2の検索処理について、図20を用いて説明する。
図20は本発明の実施形態2の検索処理を示すフローチャートである。
尚、図20において、実施形態1の図3Bの検索処理と同一の処理ステップには、同一のステップ番号を付加し、その詳細については省略する。
ステップS3110で、紙文書の入力後、ステップS2011で、入力されたスキャン画像がNup印刷であるか否かを判定するNup印刷判定処理を行う。そして、この判定結果に基づいて、ステップS3111の処理を実行することになる。
ここで、紙文書に1ページ分の文書が印刷されている通常印刷の場合には、紙文書の上端か下端にページ番号が印刷される。一方、Nup印刷の場合は、紙文書内に複数のページ番号が等間隔に印刷されることになる。そこで、実施形態2では、このことを利用して、処理対象のスキャン画像がNup印刷であるか否かを判定する。
例として、図21に示すような1枚の紙に4ページ分の文書をNup印刷した場合について説明する。
図21は本発明の実施形態2の1枚の紙に4ページ分の文書をNup印刷した例を示す図である。
図21において、2110はNup印刷時の紙全体の領域を示している。2111〜2114は各ページのページ画像を示している。2115〜2118は各ページに付与されたページ番号である。2119と2120の太枠内は、後述するページ番号探索領域である。
次に、ステップS2011のNup印刷判定処理の詳細について、図21及び図22を用いて説明する。
図22は本発明の実施形態2のNup印刷判定処理の詳細を示すフローチャートである。
まず、ステップS2210で、紙全体の領域2110の上端と下端の領域に対して、OCR処理を施す。次に、ステップS2220で、OCR処理の処理結果として、ページ番号(例えば、アラビア数字、もしくは英数字)が2個所以上、上端領域または下端領域の同じ領域内に等間隔で存在するか否かを判定する。ページ番号が2個所以上存在しない場合(ステップS2220でNO)、ステップS2260に進み、通常印刷であると判定する。一方、ページ番号が2個所以上存在する場合(ステップS2220でYES)、ステップS2230に進む。
図21の例では、ページ番号2117(「3」)と2118(「4」)が下端領域に2箇所検出されることになる。
ステップS2230で、検出されたページ番号に基づいて、他のページ番号を探索するためのページ番号探索領域を設定し、その設定したページ番号探索領域に対してOCR処理を施す。
図21の例では、ページ番号画像2117と2118で、それぞれのページ番号を含む紙全体の垂直方向にページ番号探索領域2119及び2120を設定する。そして、各ページ番号探索領域2119、2120に対してOCR処理を施す。
次に、ステップS2240で、各ページ番号探索領域でページ番号が検出され、各ページ番号探索領域中のページ番号同士の間隔が同一であるか否かを判定する。同一でない場合(ステップS2240でNO)、ステップS2260に進み、通常印刷であると判定する。一方、同一である場合(ステップS2240でYES)、ステップS2250に進み、Nup印刷であると判定する。
尚、ここでの間隔が同一であるか否かの判定は、ある程度の誤差を考慮した誤差範囲を含むページ番号同士の間隔に対して実行する。つまり、この誤差範囲内にページ番号同士の間隔が含まれる場合には、ページ番号同士の間隔が同一であると判定する。
図21の例では、ページ番号探索領域2119にページ番号2115(「1」)と2117(「3」)が検出され、ページ番号探索領域2120にページ番号2116(「2」)と2118(「4」)が検出される。そして、ページ番号探索領域2119とページ番号探索領域2120中のページ番号の間隔は、同じ間隔となっている。そのため、この場合は、Nup印刷と判定される。
また、この際、ステップS2210で検出されたページ番号の数と、ステップS2230の1つのページ番号探索領域で検出されたページ番号の数を乗算することで、1枚に含まれるページ数を算出することができ、このページ数を記憶部111に一時保存する。
以上説明したように、実施形態2によれば、実施形態1で説明した効果に加えて、スキャン画像がNup印刷であるか否かを自動的に判定することで、ユーザの手を煩わすことなく、Nup印刷であるか否か、また、Nup印刷である場合に何ページ分含んでいるかを判定することが可能となる。
尚、実施形態2において、ステップS2011のNup印刷判定処理の処理結果を、ユーザに一旦提示して確認させる構成としても良い。このときは、図14の紙文書確認用領域1418のように判定結果を縮小画像として表示すればよい。また、確認の結果、誤判定である場合には、領域1419を用いて判定内容を修正する機会を与えることが可能である。
このような構成にすることにより、Nup印刷判定判定処理に誤判定があっても、その判定内容を修正することができ、誤ったオリジナルの電子データが出力される、といったことを防止することができる。
<<実施形態3>>
実施形態2では、ステップS2011のNup印刷判定処理において、OCR処理を用いて、ページ番号を検出する方法について説明したが、これに限定されるものではない。例えば、次のようにして、ページ番号を検出するようにしても良い。
ここでは、図23に示すように、1枚の紙に4ページ分の文書をNup印刷した場合について説明する。
尚、2310は図21の2110と、以下同様に、2311は2111と、2312は2112と、2313は2113と、2314は2114と、2315は2115と、2316は2116と、2317は2117と、2318は2118に対応するので、その説明は省略する。
図23において、2320は左側の2つのページの左マージン(最左端余白)である。2321は右側の2つのページの右マージン(最右端余白)である。2319は左側の2つのページと右側の2つのページの中間マージン(中間余白)である。ここで、中間マージン2319は、左側の2つのページの右マージンと、右側の2つのページの左マージンとが連続しているので、左マージン2320や右マージン2321より長くなる。
そして、この中間マージン2319が検出される場合には、Nupページ印刷であると判定することができる。
尚、図23では、横方向のマージンに着目して説明したが、縦方向に関しても同様のことが言える。
次に、より詳細な具体例について、図24を用いて説明する。
2410は紙全体の領域である。まず、これに対してブロックセレクション処理を行うと、ブロック2411〜2421が、ブロックセレクション処理結果として得られる。まず、検出されたブロック群の最左端を検出し、紙全体領域の左端2310の差分である左マージン2422を算出する。そして、この左マージン2422が、図23の左マージン2320に相当する。
同様に、ブロック群の最右端を検出し、紙全体領域の右端2310の差分である右マージン2423を算出する。そして、この右マージン2423が、図23の右マージン2321に相当する。
その後、各ブロック群の横方向の間隔を算出し、中間マージン2319の中間マージン候補2424、2425を算出する。中間マージン候補2424、2425の中で、左マージン2422、右マージン2423よりも長い中間マージン候補2424を中間マージンとする。
このようにして検出した中間マージンの数+1が、横方向のページ数となる。同様の処理を縦方向にも行い、それぞれの結果を乗算することで、ページの総数を算出することができる。
以上説明したように、実施形態3によれば、実施形態2で説明した効果と同様に、スキャン画像がNup印刷であるか否かを自動的に判定することで、ユーザの手を煩わすことなく、Nup印刷であるか否か、また、Nup印刷である場合に何ページ分含んでいるかを判定することが可能となる。
尚、実施形態1において、図14の紙文書確認用領域1418で、ユーザが所望のページが表示されている範囲に触れて、ページを指定することで、処理対象のページを選択するようにしても構わない。このときは、ステップS3120からステップS3140の処理は、指定されたページ領域についてのみ処理が行われる。
また、実施形態2、3においても、Nup印刷判定結果をユーザに提示し、同様な手続きを行うことによって、指定されたページ領域についてのみ処理を行うようにしても構わない。こうすることによって、ユーザはNup印刷された紙文書中の特定のページについてのみ、印刷等の処理を行うことができる。
また、図10の色特徴量情報抽出処理では、処理対象画像の最頻色を色特徴情報として抽出する例を説明したが、これに限定されるものではなく、例えば、平均色を色特徴情報として抽出するようにしても良い。
また、画像特徴量として色特徴量を用いたが、これに限定されるものではなく、例えば、最頻輝度、平均輝度等の輝度特徴量、共起行列、コントラスト、エントロピ、Gabor変換等で表現されるテクスチャ特徴量、エッジ、フーリエ記述子等の形状特徴量等の複数種類の画像特徴量を1つ、或いは、任意に組み合わせた画像特徴量を用いても良い。
また、ブロックセレクション処理を行い、処理対象の文書を文字ブロックと画像ブロックに分割し、これらの各ブロックの特徴量を複合的に用いて検索を行ったが、文書全体を1つの画像とみなし、オリジナル文書の検索を行うようにしても構わない。また、精度が許容される範囲ならば、文書中の画像ブロックのみを利用して、オリジナル文書の検索を行うようにしても構わない。
また、電子データを、一旦、ラスタ画像に変換したが、電子データから直接、文字コードや画像を抜き出して比較してももちろん構わない。
また、文字特徴量としては文字コードを採用したが、例えば、単語辞書とのマッチングを予め行って単語の品詞を抽出しておき、名詞である単語を文字特徴量としても良い。
<<実施形態4>>
上記実施形態1では、登録対象のオリジナル文書は、Nup印刷された紙文書(あるいはその電子データ)でない、通常印刷された紙文書(あるいはその電子データ)としているが、Nup印刷された紙文書(あるいはその電子データ)を登録対象のオリジナル文書とすることもできる。この場合、実施形態1の検索処理と同様に、登録処理時に、ユーザがNup印刷の指定及び1枚の文書(あるいは電子データ)に含まれるページ数の指定を行えば良い。
この時の登録処理は、例えば、図25のようになる。但し、図25では、説明を簡単にするために、1枚のNup印刷された紙文書を登録する場合の登録処理を示している。
尚、図25の各ステップは、実施形態1の図3Aと図3Bの一部のステップとほぼ同様のステップの組み合わせで実現される。
簡単に説明すると、ステップS3010で、登録対象のオリジナル文書を入力する。ステップS3111で、ユーザによってオリジナル文書がNup印刷文書であるかどうかの指定がなされたかを判定する。
そして、Nup印刷文書の指定がなされたと判定した場合(ステップS3111でYES)、ステップS3112において、ページ数Lにユーザが指定した1枚中のページ数を設定する。一方、Nup印刷文書の指定がなされないと判定した場合(ステップS3111でNO)、ステップS3115において、ページ数Lに1を設定する。
次に、ステップS3113で、処理対象の1文書中の処理ページ数を示す変数bに初期値として1を設定する。次に、比較処理の終了判定として、Lがb以上であるか否かを判定する。Lがb未満である場合(ステップS3116でNO)、登録処理を終了する。
一方、Lがb以上である場合(ステップS3116でYES)、未処理のページが存在するので、ステップS3120に進み、Nupのオリジナル文書中のbページ目の領域に対してブロックセレクション処理を行う。次に、ステップS3130で、各ブロックの特徴量情報を抽出して記憶部111に記憶する。そして、ステップS3141で、bを1インクリメントし、ステップS3116に戻る。
もちろん、複数枚のNup印刷された紙文書を登録することも可能であり、この場合も、実施形態1の図3Aと図3Bのステップの内、必要なステップを組みあわせることで実現できる。
尚、Nup印刷された紙文書を登録する場合には、登録対象の文書画像に含まれているそれぞれのページ画像について、紙1枚に1ページを印刷したときと同じになるように解像度変換を行い、これを紙1枚に1ページを印刷された文書画像として登録しても良いし、Nup印刷された紙文書に対応する文書画像をそのまま登録するようにしても良い。
<<実施形態5>>
実施形態3のNup印刷の指定に代えて、Nup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数を自動判定して、登録処理を行うようにしてもよい。
この時の登録処理は、例えば、図26にようになる。但し、図26では、説明を簡単にするために、1枚のNup印刷された紙文書を登録する場合の登録処理を示している。
尚、図26の各ステップは、実施形態1の図3Aと実施形態2の図20の一部のステップとほぼ同様のステップの組み合わせで実現される。
簡単に説明すると、ステップS3010で登録対象のオリジナル文書を入力する。ステップS2011で、オリジナル文書がNup印刷文書であるかどうかを自動判定する。そして、Nup印刷文書であると判定した場合、ステップS3112において、判定されたページ数をページ数Lに設定する。一方、Nup印刷文書でないと判定した場合、ステップS3115において、ページ数Lに1を設定する。
次に、ステップS3113で、処理対象の1文書中の処理ページ数を示す変数bに初期値として1を設定する。次に、比較処理の終了判定として、Lがb以上であるか否かを判定する。Lがb未満である場合(ステップS3116でNO)、登録処理を終了する。
一方、Lがb以上である場合(ステップS3116でYES)、未処理のページが存在するので、ステップS3120に進み、Nupのオリジナル文書中のbページ目の領域に対してブロックセレクション処理を行う。次に、ステップS3130で、各ブロックの特徴量情報を抽出して記憶部111に記憶する。そして、ステップS3141で、bを1インクリメントし、ステップS3116に戻る。
もちろん、複数枚のNup印刷された紙文書を登録することも可能であり、この場合も、実施形態1の図3Aと実施形態2の図20のステップの内、必要なステップを組みあせることで実現できる。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施形態1の画像処理システムの構成を示すブロック図である。 本発明の実施形態1のMFPの詳細構成を示すブロック図である。 本発明の実施形態1の登録処理を示すフローチャートである。 本発明の実施形態1の検索処理を示すフローチャートである。 本発明の実施形態1のアドレス情報の一例を示す図である。 本発明の実施形態1のブロック情報の一例を示す図である。 本発明の実施形態1の特徴量情報の一例を示す図である。 本発明の実施形態1の特徴量情報の一例を示す図である。 本発明の実施形態1の2ページ分をNup印刷した例を示す図である。 本発明の実施形態1の画像ブロック抽出の一例を示す図である。 本発明の実施形態1の色特徴量情報抽出処理の詳細を示すフローチャートである。 本発明の実施形態1の画像メッシュブロック分割の一例を示す図である。 本発明の実施形態1の順序決定テーブルの一例を示す図である。 本発明の実施形態1の色空間上の色ビンの構成の一例を示す図である。 本発明の実施形態1のユーザインタフェースの一例を示す図である。 本発明の実施形態1の比較処理の詳細を示すフローチャートである。 本発明の実施形態1のページ比較処理の詳細を示すフローチャートである。 本発明の実施形態1の色特徴量情報比較処理の詳細を示すフローチャートである。 本発明の実施形態1の色ビンペナルティマトリックスの構成の一例を示す図である。 本発明の実施形態1のユーザインタフェースの一例を示す図である。 本発明の実施形態2の検索処理を示すフローチャートである。 本発明の実施形態2の1枚の紙に4ページ分の文書をNup印刷した例を示す図である。 本発明の実施形態2のNup印刷判定処理の詳細を示すフローチャートである。 本発明の実施形態3の1枚に4ページ分をNup印刷した例を示す図である。 本発明の実施形態3のNup印刷判定処理を説明するための図である。 本発明の実施形態4の登録処理を示すフローチャートである。 本発明の実施形態5の登録処理を示すフローチャートである。
符号の説明
100 MFP
101 マネージメントPC
102 クライアントPC
103 プロキシサーバ
104 ネットワーク
105 データベース
106 文書管理サーバ
107 LAN
110 画像読取部
111 記憶部
112 印刷部
113 入力部
114、117 ネットワークI/F
115 データ処理部
116 表示部

Claims (18)

  1. 複数の電子データを比較先画像として記憶する記憶手段と、
    印刷物を電子的に読み取り、その印刷物の電子データを比較元画像として入力する入力手段と、
    前記比較元画像に含まれるページ画像の数に基づいて、前記比較元画像に含まれるページ画像を含む処理対象領域の特徴量を抽出する抽出手段と、
    前記抽出手段で抽出した特徴量を用いて、前記比較元画像に対応する比較先画像を前記記憶手段から検索する検索手段と
    を備えることを特徴とする画像処理装置。
  2. 前記検索手段の検索結果である画像に対して処理を行う処理手段と
    を更に備えることを特徴とする請求項1に記載の画像処理装置。
  3. 前記比較元画像に含まれるページ画像のページ数を指定する指定手段を更に備え、
    前記抽出手段は、前記指定手段で指定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出する
    ことを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記抽出手段は、前記処理対象領域の画像特徴量及び文字特徴量のいずれかまたは両方を抽出する
    ことを特徴とする請求項1に記載の画像処理装置。
  5. 前記画像特徴量は、色特徴量、輝度特徴量、テクスチャ特徴量、形状特徴量のいずれか1つ、或いは、それらの組み合わせである
    ことを特徴とする請求項4に記載の画像処理装置。
  6. 前記文字特徴量は、文字コードである
    ことを特徴とする請求項4に記載の画像処理装置。
  7. 前記検索手段による検索結果を表示する表示手段と、
    前記検索手段による検索結果として、前記表示手段に複数の比較先画像が表示された場合、該複数の比較先画像から所望の画像を選択する選択手段と
    を更に備えることを特徴とする請求項1または2に記載の画像処理装置。
  8. 前記比較元画像が複数のページ画像から構成されている場合、該複数のページ画像から所望のページ画像を指定する指定手段を更に備え、
    前記抽出手段は、前記指定手段で指定されたページ画像を含む処理対象領域の特徴量を抽出する
    ことを特徴とする請求項1または2に記載の画像処理装置。
  9. 前記処理手段は、前記検索手段で検索された画像を、指定された印刷条件で印刷する
    ことを特徴とする請求項2に記載の画像処理装置。
  10. 前記検索結果の画像に対する処理の種類を指示する指示手段を更に備え、
    前記処理の種類は、印刷、配信、蓄積、編集のいずれかである
    ことを特徴とする請求項2に記載の画像処理装置。
  11. 前記比較元画像に複数のページ画像が存在するか否かを判定する第1判定手段と、
    前記第1判定手段による判定の結果、前記比較元画像に複数のページ画像が存在する場合、前記比較元画像に含まれるページ画像とのページ数を判定する第2判定手段とを更に備え、
    前記抽出手段は、前記第2判定手段で判定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出する
    ことを特徴とする請求項1または2に記載の画像処理装置。
  12. 前記第1判定手段は、前記比較元画像中に含まれるページ番号を検出し、前記ページ番号が特定領域内で等間隔に存在しているか否かを判定することで、前記比較元画像に複数のページ画像が存在するか否かを判定する
    ことを特徴とする請求項11に記載の画像処理装置。
  13. 前記第1判定手段は、前記比較元画像の最右端余白または最左端余白と、それ以外の中間余白を検出し、検出した中間余白が、前記最右端余白または前記最左端余白よりも大きいか否かを判定することで、前記比較元画像に複数のページ画像が存在するか否かを判定する
    ことを特徴とする請求項11に記載の画像処理装置。
  14. 前記第1判定手段の判定結果を表示する表示手段と、
    前記判定結果を修正する修正手段と
    を更に備えることを特徴とする請求項11に記載の画像処理装置。
  15. 前記比較先画像を入力する入力手段と、
    前記入力手段で入力される比較先画像に含まれるページ画像のページ数を指定する指定手段とを更に備え、
    前記抽出手段は、前記指定手段で指定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出し、
    前記記憶手段は、前記比較先画像と、前記抽出手段で抽出した特徴量とを対応づけて記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  16. 前記比較先画像を入力する入力手段と、
    前記比較先画像に複数のページ画像が存在するか否かを判定する第1判定手段と、
    前記第1判定手段による判定の結果、前記比較元画像に複数のページ画像が存在する場合、前記比較元画像に含まれるページ画像とのページ数を判定する第2判定手段とを更に備え、
    前記抽出手段は、前記第2判定手段で判定されたページ数に基づいて決定される処理対象領域毎に、その処理対象領域の特徴量を抽出し、
    前記記憶手段は、前記比較先画像と、前記抽出手段で抽出した特徴量とを対応づけて記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  17. 印刷物を電子的に読み取ることによって得た電子データを比較元画像として入力する入力工程と、
    前記比較元画像に含まれるページ画像の数に基づいて、前記比較元画像に含まれるページ画像を含む処理対象領域の特徴量を抽出する抽出工程と、
    前記抽出工程で抽出した特徴量を用いて、記憶媒体に比較先画像として記憶されている複数の電子データから、前記比較元画像に対応する比較先画像を検索する検索工程と、
    を備えることを特徴とする画像処理装置の制御方法。
  18. 画像処理の制御をコンピュータで実行させるためのコンピュータプログラムであって、
    印刷物を電子的に読み取ることによって得た電子データを比較元画像として入力する入力工程と、
    前記比較元画像に含まれるページ画像の数に基づいて、前記比較元画像に含まれるページ画像を含む処理対象領域の特徴量を抽出する抽出工程と、
    前記抽出工程で抽出した特徴量を用いて、記憶媒体に比較先画像として記憶されている複数の電子データから、前記比較元画像に対応する比較先画像を検索する検索工程と、
    を備えることを特徴とするコンピュータプログラム。
JP2004069487A 2003-05-20 2004-03-11 画像処理装置及びその制御方法、プログラム Expired - Fee Related JP4405831B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004069487A JP4405831B2 (ja) 2003-05-20 2004-03-11 画像処理装置及びその制御方法、プログラム
US10/847,573 US8203748B2 (en) 2003-05-20 2004-05-18 Image processing apparatus, control method therefor, and program
EP04252925A EP1480440B1 (en) 2003-05-20 2004-05-18 Image processing apparatus, control method therefor, and program
DE602004022103T DE602004022103D1 (de) 2003-05-20 2004-05-18 Bildverarbeitungsvorrichtung, Steuerungsverfahren dafür und Programm
CNB2004100453313A CN1271505C (zh) 2003-05-20 2004-05-20 用于进行图像检索的图像处理装置及方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003142408 2003-05-20
JP2004069487A JP4405831B2 (ja) 2003-05-20 2004-03-11 画像処理装置及びその制御方法、プログラム

Publications (3)

Publication Number Publication Date
JP2005004724A JP2005004724A (ja) 2005-01-06
JP2005004724A5 JP2005004724A5 (ja) 2007-02-08
JP4405831B2 true JP4405831B2 (ja) 2010-01-27

Family

ID=33100435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004069487A Expired - Fee Related JP4405831B2 (ja) 2003-05-20 2004-03-11 画像処理装置及びその制御方法、プログラム

Country Status (5)

Country Link
US (1) US8203748B2 (ja)
EP (1) EP1480440B1 (ja)
JP (1) JP4405831B2 (ja)
CN (1) CN1271505C (ja)
DE (1) DE602004022103D1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4720529B2 (ja) * 2005-03-10 2011-07-13 富士ゼロックス株式会社 画像処理装置、画像形成装置、画像処理方法及びプログラム
JP4682663B2 (ja) * 2005-03-28 2011-05-11 富士ゼロックス株式会社 ドキュメント処理装置
JP4788205B2 (ja) * 2005-06-22 2011-10-05 富士ゼロックス株式会社 文書検索装置及び文書検索プログラム
CN101010695A (zh) * 2005-06-30 2007-08-01 奥林巴斯株式会社 检索系统和检索方法
JP4920928B2 (ja) * 2005-08-08 2012-04-18 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4533273B2 (ja) * 2005-08-09 2010-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
JP4906044B2 (ja) * 2005-09-28 2012-03-28 キヤノン株式会社 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体
JP2007141159A (ja) * 2005-11-22 2007-06-07 Fuji Xerox Co Ltd 画像処理装置、画像処理方法、及び画像処理プログラム
JP2007201548A (ja) * 2006-01-23 2007-08-09 Sharp Corp 画像処理装置
JP2007316849A (ja) * 2006-05-24 2007-12-06 Canon Inc 情報処理装置、情報処理システム、及びその制御方法、プログラム、記憶媒体
JP4830721B2 (ja) * 2006-08-29 2011-12-07 富士ゼロックス株式会社 情報処理装置及びプログラム
US8261200B2 (en) * 2007-04-26 2012-09-04 Fuji Xerox Co., Ltd. Increasing retrieval performance of images by providing relevance feedback on word images contained in the images
US8384929B2 (en) * 2007-05-03 2013-02-26 Sharp Laboratories Of America, Inc. Systems and methods for efficiently handling image data
JP4469885B2 (ja) * 2007-09-07 2010-06-02 シャープ株式会社 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体
JP4362528B2 (ja) 2007-09-10 2009-11-11 シャープ株式会社 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体
US8260061B2 (en) 2007-09-21 2012-09-04 Sharp Kabushiki Kaisha Image data output processing apparatus and image data output processing method
JP5343190B2 (ja) * 2008-02-04 2013-11-13 株式会社日立情報通信エンジニアリング 画像処理装置及び画像処理プログラム
JP4588771B2 (ja) 2008-02-26 2010-12-01 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、プログラム及び記憶媒体
WO2010110181A1 (ja) * 2009-03-27 2010-09-30 日本電気株式会社 パターン照合装置、パターン照合方法及びパターン照合プログラム
JP5312164B2 (ja) * 2009-04-10 2013-10-09 キヤノン株式会社 画像形成システム、コンピュータプログラム、及び制御方法
US8467110B2 (en) * 2009-05-21 2013-06-18 Kyocera Document Solutions Inc. Image reading apparatus, image forming apparatus, and image reading method
US8854697B2 (en) * 2009-07-02 2014-10-07 Xerox Corporation System and method for scanning and enlarging user selected grid areas of a printed page
CN102023966B (zh) * 2009-09-16 2014-03-26 鸿富锦精密工业(深圳)有限公司 用于合约比较的计算机系统及合约比较方法
JP5570176B2 (ja) 2009-10-19 2014-08-13 キヤノン株式会社 画像処理システム及び情報処理方法
JP5763965B2 (ja) 2011-05-11 2015-08-12 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP2013168858A (ja) * 2012-02-16 2013-08-29 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP6070976B2 (ja) * 2012-02-28 2017-02-01 富士ゼロックス株式会社 画像処理装置、画像処理システム、及びプログラム
JP2014121043A (ja) * 2012-12-19 2014-06-30 Canon Inc 画像生成装置、方法およびプログラム
US20150161087A1 (en) * 2013-12-09 2015-06-11 Justin Khoo System and method for dynamic imagery link synchronization and simulating rendering and behavior of content across a multi-client platform
US9164874B1 (en) * 2013-12-20 2015-10-20 Amazon Technologies, Inc. Testing conversion and rendering of digital content
US10678488B2 (en) * 2016-01-20 2020-06-09 Ricoh Company, Ltd. Dynamic splitting of portable document format print jobs
JP6690340B2 (ja) * 2016-03-22 2020-04-28 富士ゼロックス株式会社 情報処理装置及びプログラム
US10282402B2 (en) 2017-01-06 2019-05-07 Justin Khoo System and method of proofing email content
US11102316B1 (en) 2018-03-21 2021-08-24 Justin Khoo System and method for tracking interactions in an email
JP2021193495A (ja) 2020-06-08 2021-12-23 コニカミノルタ株式会社 検索システム
JP2021193770A (ja) 2020-06-08 2021-12-23 コニカミノルタ株式会社 検索システム
CN112306433A (zh) * 2020-11-12 2021-02-02 深圳市华博创新科技有限公司 一种电子稿袋印刷处理方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0317851A (ja) 1989-06-14 1991-01-25 Hitachi Ltd 磁気記録再生装置
US5991466A (en) 1991-07-31 1999-11-23 Canon Kabushiki Kaisha Image retrieving apparatus
JP3234064B2 (ja) 1993-09-02 2001-12-04 キヤノン株式会社 画像検索方法並びにその装置
JP3026712B2 (ja) 1993-12-09 2000-03-27 キヤノン株式会社 画像検索方法及びその装置
EP0713186B1 (en) * 1994-11-15 2006-07-05 Canon Kabushiki Kaisha Method and apparatus for retrieving images from a database
US6785429B1 (en) * 1998-07-08 2004-08-31 Matsushita Electric Industrial Co., Ltd. Multimedia data retrieval device and method
US6813394B1 (en) 1998-08-31 2004-11-02 Canon Kabushiki Kaisha Image storage method and apparatus
JP3897476B2 (ja) 1999-02-15 2007-03-22 キヤノン株式会社 画像処理装置及びその方法、コンピュータ可読メモリ
JP2001043239A (ja) * 1999-07-30 2001-02-16 Canon Inc 画像記憶方法及び装置及び記憶媒体
JP2001257862A (ja) 2000-03-09 2001-09-21 Ricoh Co Ltd 画像形成装置
US7034951B1 (en) * 2000-05-10 2006-04-25 Hewlett-Packard Development Company, L.P. Printer collator facility and method
JP2002150306A (ja) * 2000-09-04 2002-05-24 Minolta Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP4785303B2 (ja) * 2000-10-31 2011-10-05 キヤノン株式会社 印刷制御装置、印刷制御方法およびプログラム
JP4672909B2 (ja) * 2001-06-07 2011-04-20 キヤノン株式会社 画像形成装置および画像形成制御方法
JP2003006643A (ja) 2001-06-25 2003-01-10 Canon Inc 画像処理装置及びその方法、プログラム
JP3962635B2 (ja) * 2001-06-26 2007-08-22 キヤノン株式会社 画像処理装置およびその制御方法
JP4266695B2 (ja) 2003-04-30 2009-05-20 キヤノン株式会社 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
US8203748B2 (en) 2012-06-19
CN1550971A (zh) 2004-12-01
DE602004022103D1 (de) 2009-09-03
JP2005004724A (ja) 2005-01-06
CN1271505C (zh) 2006-08-23
US20040234169A1 (en) 2004-11-25
EP1480440A2 (en) 2004-11-24
EP1480440A3 (en) 2005-05-11
EP1480440B1 (en) 2009-07-22

Similar Documents

Publication Publication Date Title
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4371965B2 (ja) 画像処理装置、画像処理方法
JP4920928B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4266695B2 (ja) 画像処理装置及び画像処理方法
JP4181892B2 (ja) 画像処理方法
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US8726178B2 (en) Device, method, and computer program product for information retrieval
US7640269B2 (en) Image processing system and image processing method
JP5063422B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US8194982B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP5298997B2 (ja) 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体
JP4047222B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
JP2006023946A (ja) 画像処理装置及びその制御方法、プログラム
JP2008107901A (ja) 画像処理装置及びその制御方法、プログラム
JP5652509B2 (ja) 編集装置、編集方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061207

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091105

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4405831

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131113

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees