JP2006333248A - 画像処理装置、画像処理方法、プログラム及び記憶媒体 - Google Patents
画像処理装置、画像処理方法、プログラム及び記憶媒体 Download PDFInfo
- Publication number
- JP2006333248A JP2006333248A JP2005156194A JP2005156194A JP2006333248A JP 2006333248 A JP2006333248 A JP 2006333248A JP 2005156194 A JP2005156194 A JP 2005156194A JP 2005156194 A JP2005156194 A JP 2005156194A JP 2006333248 A JP2006333248 A JP 2006333248A
- Authority
- JP
- Japan
- Prior art keywords
- image
- page
- processing
- feature amount
- configuration information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Facsimiles In General (AREA)
- Image Analysis (AREA)
- Record Information Processing For Printing (AREA)
Abstract
【課題】 Nup印刷された紙文書中の画像のNページ分のオリジナル電子データを好適に管理することができる画像処理装置、方法、プログラム及び記憶媒体を提供する。
【解決手段】 印刷物を電子的に読み取って得られた画像をMFP100に入力し、記憶部111に格納する。また、データ処理部115は、当該画像中の1又は複数のページ画像を含む処理対象領域の特徴量を抽出する。そして、MFP100では、画像の格納先情報と特徴量と1又は複数のページ画像の構成情報であるページ構成情報とを関連付けて管理する。ここで、新たな印刷物が読み取られた入力された新たな画像の特徴量がデータ処理部115で抽出されると、記憶部111から当該新たな画像に対応する画像を検索する。
【選択図】 図3A
【解決手段】 印刷物を電子的に読み取って得られた画像をMFP100に入力し、記憶部111に格納する。また、データ処理部115は、当該画像中の1又は複数のページ画像を含む処理対象領域の特徴量を抽出する。そして、MFP100では、画像の格納先情報と特徴量と1又は複数のページ画像の構成情報であるページ構成情報とを関連付けて管理する。ここで、新たな印刷物が読み取られた入力された新たな画像の特徴量がデータ処理部115で抽出されると、記憶部111から当該新たな画像に対応する画像を検索する。
【選択図】 図3A
Description
本発明は、複写機等で紙文書から電子データを入力し、当該電子データに対応するオリジナルの電子データを検索して印刷、配信、蓄積、編集等の処理を行う画像処理技術に関する。
近年、複写機等の画像入出力装置のデジタル化及びネットワーク化が進んでいる。また、このような画像入出力装置が保有する印刷機能も多様化しており、同一の、或いは、複数の文書に含まれる複数のページを、1枚の紙に配置して印刷することが可能となっている。
例えば、会議等で多用されている配布資料等は、参照用として用いられることが多いため、1枚の紙に1文書の2ページ分、或いは4ページ分をレイアウトするといったように、Nページ分の文書を1枚の紙にレイアウトして印刷されたものであることが多い。以降、このような印刷を「Nページ印刷」と呼ぶ。また、複数の文書のページを一度に参照する必要があるときは、結合させて印刷する場合もあり得る。以降、このような印刷を「結合印刷」と呼ぶ。さらに、印刷後に2つ折りにして製本することができるように、ページ番号が製本時の順に印刷される場合もあり得る。以降、このような印刷を「製本印刷」と呼ぶ。
尚、以下では、Nページ印刷、結合印刷、製本印刷等の1枚の紙にNページ分の文書をレイアウトして印刷する印刷を総称して、「Nup印刷」と呼ぶ。
一方で、紙文書をスキャナ等で読み取り、読み取られた画像(紙文書画像)に対応するオリジナルの電子データを検索して、紙文書画像からではなく、オリジナルの電子データそのものから印刷したり、ネットワーク内の所望のPC(パーソナルコンピュータ)等の端末へ配信したり、ネットワーク内の所望の蓄積媒体へ保存したり、又は編集したりすることを可能とするシステムが提案されている(例えば、特許文献1、2参照。)。
特許文献1では、紙文書をスキャンしたスキャン電子データと、記憶媒体中の電子データとをビット単位で比較することにより、スキャン電子データのオリジナルの電子データを検索することを可能としている。
また、特許文献2では、書類を電子データにする際に、その電子データに識別コードを付与して、その識別コードを含む印刷物を生成している。これにより、印刷物に対応する電子データを検索したり印刷したりする場合には、その印刷物を読み込んで印刷されている識別コードを認識することで、所望の電子データの検索や印刷が可能である。
特許第3017851号公報
特開2001−257862号公報
しかしながら、上記特許文献1、2では、Nup印刷の文書については何ら考慮されていないので、Nup印刷が使用されるような環境においては、次のような問題が生じる。
すなわち、特許文献1に記載の技術では、Nup印刷された文書をスキャンして得られた電子データは1ページ分と解釈されてしまう。この場合、オリジナルの電子データは、1ページを単位とした電子データで記憶媒体に管理されているため、Nup印刷された文書がスキャンされた電子データは、どのオリジナルの電子データと比較しても高い類似度が得らないものとなり、オリジナルの電子データを検索することができない。
また、特許文献2に記載の技術では、識別コードの印字位置が各ページに対して決まっているので、Nup印刷した際には識別コードの印字位置がずれてしまう。そのため、スキャンされた電子データから識別コードが読み取れなくなってしまい、オリジナルの電子データを検索することができない。
本発明は、このような事情を考慮してなされたものであり、Nup印刷された紙文書中の画像のNページ分のオリジナル電子データを好適に管理することができる画像処理装置、方法、プログラム及び記憶媒体を提供することを目的とする。
上記課題を解決するために、本発明に係る画像処理装置は、
印刷物を電子的に読み取って得られた画像を入力する入力手段と、
入力された前記画像を格納する格納手段と、
前記画像中の1又は複数のページ画像を含む処理対象領域の特徴量を抽出する抽出手段と、
前記画像の格納先情報と前記特徴量と前記1又は複数のページ画像の構成情報であるページ構成情報とを関連付けて管理する管理手段と
を備えることを特徴とする。
印刷物を電子的に読み取って得られた画像を入力する入力手段と、
入力された前記画像を格納する格納手段と、
前記画像中の1又は複数のページ画像を含む処理対象領域の特徴量を抽出する抽出手段と、
前記画像の格納先情報と前記特徴量と前記1又は複数のページ画像の構成情報であるページ構成情報とを関連付けて管理する管理手段と
を備えることを特徴とする。
また、本発明に係る上記画像処理装置は、
前記ページ構成情報を指定する指定手段をさらに備え、
前記抽出手段が、前記指定手段で指定された前記ページ構成情報に基づいて決定される前記処理対象領域に含まれるページ画像毎に、該処理対象領域の特徴量を抽出する
ことを特徴とする。
前記ページ構成情報を指定する指定手段をさらに備え、
前記抽出手段が、前記指定手段で指定された前記ページ構成情報に基づいて決定される前記処理対象領域に含まれるページ画像毎に、該処理対象領域の特徴量を抽出する
ことを特徴とする。
さらに、本発明に係る上記画像処理装置は、
前記画像に複数のページ画像が存在するか否かを判定する判定手段と、
前記画像に複数のページ画像が存在すると判定された場合、該画像に含まれるページ構成情報を推定する推定手段とをさらに備え、
前記抽出手段が、前記推定手段によって推定された前記ページ構成情報に基づいて決定される処理対象領域毎に、該処理対象領域の特徴量を抽出する
ことを特徴とする。
前記画像に複数のページ画像が存在するか否かを判定する判定手段と、
前記画像に複数のページ画像が存在すると判定された場合、該画像に含まれるページ構成情報を推定する推定手段とをさらに備え、
前記抽出手段が、前記推定手段によって推定された前記ページ構成情報に基づいて決定される処理対象領域毎に、該処理対象領域の特徴量を抽出する
ことを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記判定手段が、
前記画像中に含まれるページ番号を検出する手段と、
前記ページ番号が所定の領域内で等間隔に存在しているか否かを判定する手段とを備え、
該ページ番号の間隔の判定結果に基づいて前記画像に複数のページ画像が存在するか否かを判定することを特徴とする。
前記判定手段が、
前記画像中に含まれるページ番号を検出する手段と、
前記ページ番号が所定の領域内で等間隔に存在しているか否かを判定する手段とを備え、
該ページ番号の間隔の判定結果に基づいて前記画像に複数のページ画像が存在するか否かを判定することを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記判定手段が、
前記画像の最右端余白又は最左端余白と、それ以外の中間余白とを検出する手段と、
検出された前記中間余白が、前記最右端余白又は前記最左端余白よりも大きいか否かを判定する手段とを備え、
前記中間余白と前記最右端余白又は前記最左端余白との大きさの判定結果に基づいて前記画像に複数のページ画像が存在するか否かを判定することを特徴とする。
前記判定手段が、
前記画像の最右端余白又は最左端余白と、それ以外の中間余白とを検出する手段と、
検出された前記中間余白が、前記最右端余白又は前記最左端余白よりも大きいか否かを判定する手段とを備え、
前記中間余白と前記最右端余白又は前記最左端余白との大きさの判定結果に基づいて前記画像に複数のページ画像が存在するか否かを判定することを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記判定手段による判定結果を表示する表示手段と、
前記判定結果を修正する修正手段と
をさらに備えることを特徴とする。
前記判定手段による判定結果を表示する表示手段と、
前記判定結果を修正する修正手段と
をさらに備えることを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記格納手段に格納された前記画像を検索する検索手段をさらに備え、
前記入力手段が、新たな印刷物を電子的に読み取って得られた電子データを新たな画像として入力し、
前記抽出手段が、前記新たな画像の特徴量を抽出し、
前記検索手段が、前記特徴量を用いて、前記新たな画像に対応する画像を前記格納手段から検索する
ことを特徴とする。
前記格納手段に格納された前記画像を検索する検索手段をさらに備え、
前記入力手段が、新たな印刷物を電子的に読み取って得られた電子データを新たな画像として入力し、
前記抽出手段が、前記新たな画像の特徴量を抽出し、
前記検索手段が、前記特徴量を用いて、前記新たな画像に対応する画像を前記格納手段から検索する
ことを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記抽出手段が、前記画像又は前記新たな画像に含まれる処理対象領域の画像特徴量及び文字特徴量のいずれか又は両方を抽出することを特徴とする。
前記抽出手段が、前記画像又は前記新たな画像に含まれる処理対象領域の画像特徴量及び文字特徴量のいずれか又は両方を抽出することを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記画像特徴量が、色特徴量、輝度特徴量、テクスチャ特徴量、形状特徴量のいずれか1つ、或いは、任意の組み合わせであることを特徴とする。
前記画像特徴量が、色特徴量、輝度特徴量、テクスチャ特徴量、形状特徴量のいずれか1つ、或いは、任意の組み合わせであることを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、前記文字特徴量が、文字コードであることを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記検索手段による検索結果の画像を前記ページ構成情報を用いて表示用に加工する手段と、
前記加工手段によって加工された検索結果の画像結果の画像を表示する表示手段と、
前記検索手段による検索結果として、前記表示手段に複数の画像が表示された場合、該複数の画像から所望の画像を選択する選択手段と
をさらに備えることを特徴とする。
前記検索手段による検索結果の画像を前記ページ構成情報を用いて表示用に加工する手段と、
前記加工手段によって加工された検索結果の画像結果の画像を表示する表示手段と、
前記検索手段による検索結果として、前記表示手段に複数の画像が表示された場合、該複数の画像から所望の画像を選択する選択手段と
をさらに備えることを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、
前記検索手段によって検索された画像を処理する処理手段と、
前記画像の処理に対する処理の種類を指示する指示手段とをさらに備え、
前記処理の種類が、印刷、配信、蓄積、編集のいずれかであることを特徴とする。
前記検索手段によって検索された画像を処理する処理手段と、
前記画像の処理に対する処理の種類を指示する指示手段とをさらに備え、
前記処理の種類が、印刷、配信、蓄積、編集のいずれかであることを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、前記格納手段から検索された前記画像のページ構成情報と前記新たな画像のページ構成情報とが異なる場合、前記画像のページ構成情報を前記新たな画像のページ構成情報と同様になるように再構成する再構成手段をさらに備えることを特徴とする。
さらにまた、本発明に係る上記画像処理装置は、前記処理手段を行う際のページ構成情報を指定する手段と、前記格納手段から検索された前記画像のページ構成情報と前記指定されたページ構成情報とが異なる場合、前記画像のページ構成情報を前記指定されたページ構成情報と同様になるように再構成する再構成手段とをさらに備えることを特徴とする。
本発明によれば、Nup印刷された紙文書中の画像のNページ分のオリジナル電子データを好適に管理することができる。例えば、Nページ印刷、結合印刷、製本印刷等の1枚の紙にNページ分の文書をレイアウトして印刷するNup印刷や通常印刷された紙原稿を区別することなく、そのスキャン画像から1又は複数のオリジナル電子データを検索して活用することが可能となる。
以下、図面を参照して、本発明の一実施形態に係る画像処理システムにおける処理について詳細に説明する。
<第1の実施形態>
図1は、本発明の第1の実施形態に係る画像処理システムの構成を示すブロック図である。図1に示す画像処理システムは、一例として、オフィス10とオフィス20とをインターネット等のネットワーク104で接続された環境で実現される。
図1は、本発明の第1の実施形態に係る画像処理システムの構成を示すブロック図である。図1に示す画像処理システムは、一例として、オフィス10とオフィス20とをインターネット等のネットワーク104で接続された環境で実現される。
オフィス10内に構築されたLAN107には、MFP(Multi Function Peripheral:ネットワークプリンタとしても使用可能なコピー機)100と、MFP100を制御するマネージメントPC101と、クライアントPC102と、文書管理サーバ106aと、そのデータベース105a及びプロキシサーバ103aが接続されている。また、オフィス20内に構築されたLAN108には、文書管理サーバ106bと、そのデータベース105b及びプロキシサーバ103bが接続されている。尚、クライアントPC102は、外部記憶部、検索イメージ入力部及び検索結果出力部を備えている。また、LAN107及びオフィス20内のLAN108は、プロキシサーバ103a、103bを介してインターネット等のネットワーク104に接続されている。
MFP100は、本実施形態において紙文書を光学的に読み取って画像信号に変換する画像読み取り処理と、読み取った画像信号に対する画像処理の一部を担当し、また、画像信号をLAN109を用いてマネージメントPC101に入力する。尚、マネージメントPC101は、通常のPCでも実現可能であり、内部に画像記憶部、画像処理部、表示部及び入力部を備える。尚、マネージメントPC101は、その一部又は全部の機能をMFP100に組み込んで一体化して構成してもよい。
さらに、マネージメントPC101には、RAM(Random Access Memory)やハードディスク記憶装置等の各種記憶手段が内蔵可能である。これにより、マネージメントPC101は、入力された画像データ、当該画像データから生成されたベクトルデータ、或いはベクトル処理を行った結果に関する情報を保持することができる。
尚、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、又はこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
また、マネージメントPC101、クライアントPC102、文書管理サーバ等の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
次に、MFP100の詳細な構成について説明する。図2は、本発明の第1の実施形態に係るMFP100の細部構成を示すブロック図である。図2において、原稿台とオートドキュメントフィーダ(ADF)を含む画像読取部110は、束状の、或いは1枚の原稿画像を光源(不図示)で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読取信号を所定密度(例えば、600DPI)のラスタ画像として得る。
また、MFP100は、画像読取信号に対応する画像を印刷部112で記録媒体に印刷する複写機能を有する。そして、印刷部112で原稿画像を1つ複写する場合には、この画像読取信号をデータ処理部115で画像処理して記録信号を生成し、これを印刷部112によって記録媒体上に印刷させる。一方、原稿画像を複数枚複写する場合には、一旦、記憶部111に一つ分の記録信号を記憶保持させた後、これを印刷部112に順次出力して記録媒体上に印刷させる。
また、Nup印刷を行う場合は、データ処理部115で指定されたページ分の画像信号を縮小し、1枚の紙で印刷可能となるように各ページの画像信号をレイアウトする。その後、印刷部112に出力して記録媒体上に印刷させる。
一方、クライアントPC102から出力される記録信号は、LAN107及びネットワークIF114を介してデータ処理部115が受信する。そして、データ処理部115は、その記録信号を印刷部112で記録可能なラスターデータに変換した後、印刷部112によって記録媒体上に印刷させる。
MFP100への操作者の指示は、MFP100に装備されたキー操作部とマネージメントPC101に接続されたキーボード及びマウスからなる入力部113から行われる。尚、これらの一連の動作は、データ処理部115内の制御部(不図示)で制御される。また、操作入力の状態表示及び処理中の画像データの表示は、表示部116で行われる。
MFP100の記憶部111は、マネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの送受信及び制御は、ネットワークIF117及びLAN109を介して行われる。
尚、MFP100では、後述する各種処理を実行するための各種操作・表示をユーザに提供するユーザインタフェースを、表示部116及び入力部113によって実現している。
本発明の実施形態に係る画像処理システムで実行する処理としては、大きく分けて、画像データを登録する登録処理と、所望の画像データを検索する検索処理の2つがある。
尚、第1の実施形態では、画像処理システム全体の処理効率を向上するために、以下で説明する各種処理を、画像処理システムを構成する各種端末に分散させて実行するようにしているが、1つの端末(例えば、MFP100)上で実行するようにしても構わない。
まず、登録処理について説明する。
[登録処理の概要]
登録対象の画像データの登録方法としては、紙文書をスキャン入力して生成した画像データを登録する場合と、文書作成アプリケーション等で作成された電子文書をラスタ画像に展開した画像データを登録する場合とがある。そこで、オリジナル文書を登録する登録処理の概要について、図3Aを用いて説明する。
登録対象の画像データの登録方法としては、紙文書をスキャン入力して生成した画像データを登録する場合と、文書作成アプリケーション等で作成された電子文書をラスタ画像に展開した画像データを登録する場合とがある。そこで、オリジナル文書を登録する登録処理の概要について、図3Aを用いて説明する。
図3Aは、本発明の第1の実施形態に係る画像処理システムにおける画像データの登録処理を説明するためのフローチャートである。尚、この処理は、画像読取部110のADFに、登録対象の紙文書がセットされ、入力部113の登録ボタンが操作された時点で開始される。また、登録対象の紙文書は、1枚でも複数枚でも可能であるが、複数枚の場合は、その紙文書から得られる画像データ群(ページ画像群)を1つのファイルとして管理することになる。
まず、登録対象のオリジナル文書を入力する(ステップS3010)。また、この入力に伴って、オリジナル文書を管理するための各種情報を生成して記憶部111に記憶する。
尚、オリジナル文書を登録する際のオリジナル文書の入力方法には、2種類存在する。
まず、オリジナル文書が電子データである場合は、クライアントPC102内のハードディスク内、或いはオフィス10や20内の文書管理サーバ106内のデータベース105内、或いはMFP100の記憶部111のいずれかに格納されている。そして、これらの記憶元から登録対象のオリジナル文書の電子データを読み出して、ネットワークIF114を介してデータ処理部115に入力し、データ処理部115でその電子データをラスタ画像に変換する。
一方、オリジナル文書が紙文書である場合は、MFP100の画像読取部110で、その紙文書をラスタ状に走査しラスタ画像を得る。
このように、第1の実施形態では、登録対象のオリジナル文書に、電子データ或いは紙文書のどちらも扱うことが可能である。その後、ラスタ画像に対してデータ処理部115で前処理を施し、記憶部111に保存する。尚、これ以降、紙文書の場合には、ラスタ画像がオリジナル文書の電子データとなる。また、この場合、登録対象のオリジナル文書毎に固有の文書IDを発行し、オリジナル文書の電子データのアドレスと対応付けて記憶部111にアドレス情報として保存する。
ここで、アドレスとは、URLや、サーバ名とディレクトリ、ファイル名からなる電子データの格納先を示すフルパス情報である。図4は、本発明の一実施形態に係るアドレス情報の一例を示す図である。また、アドレス情報の格納先は、データベース105や記憶部111等が挙げられる。
尚、オリジナル文書が紙文書である場合の電子データのファイル形式は、例えば、BMP形式とするが、これに限定されるものではない。例えば、色情報を保存しておくことが可能なファイル形式(例えば、GIF、JPEG)であればどのようなものでも良い。一方、オリジナル文書が電子データである場合のその電子データのファイル形式は、その電子データを作成したアプリケーション(例えば、米マイクロソフト社のMS−Word(商標)や、米アドビシステム社のアクロバット(商標)等)で作成されたファイル形式(*.docや*.pdf)となる。
次に、ステップS3010で入力された文書の数を入力文書数Pに設定する(ステップS3011)。さらに、処理文書数を示す変数aと、処理対象の1文書中の論理ページ(文書で規定されているページ)数を示す変数bにそれぞれ初期値として1を設定する(ステップS3012)。そして、当該1文書の物理ページ(紙の枚数でカウントされるページ)数Qにa番目の文書中の紙の枚数に応じたページ数を設定する(ステップS3013)。
次に、終了判定として、Pがa以上であるか否かを判定する(ステップS3014)。その結果、Pがa未満である場合(NO)は処理を終了する。一方、Pがa以上である場合(YES)は未処理の文書が存在するので、処理を続行するためステップS3015に進む。
ステップS3015では、文書単位の終了判定として、Qがb以上であるか否かを判定する。その結果、Qがb未満である場合(NO)は、ステップS3032へ進み、aを1インクリメントして、ステップS3013へ戻り、処理対象を次の文書に移す。一方、Qがb以上である場合(YES)は、未処理のページが存在するため、ステップS3111に進んで処理を続ける。
ステップS3111では、ユーザによるNup印刷の指定の有無を判定する。その結果、Nup印刷の指定がある場合(YES)は、1枚中のページ数Lにユーザが指定した1枚中のページ数を設定する(ステップS3112)。そして、Nup印刷IDを発行し、1枚のページ数L(Nup数)と、Nupタイプ(Nup印刷の種別)とレイアウト順と、文書ID、ページ番号と関連付けてNup印刷情報(例えば、図25に示す情報)を記憶する。図25は、本発明の第1の実施形態におけるNup印刷情報の一例を示す図である。
尚、Nup印刷IDは、登録開始時を1として、Nup印刷された文書を登録するたびにインクリメントされた番号が発行される。また、Nupタイプは、Nup印刷の種別に対して予め付与された番号(例えば、1:Nページ印刷、2:結合印刷、3:製本印刷等)を設定する。さらに、レイアウト順は、1枚の中に各ページがどのような順番にレイアウトされているかを、予め付与された番号(例えば、1:左上から右向き、2:左上から下向き、3:右上向きから左向き、4:右上から下向き等)で設定する。
一方、ステップS3111でNupの指定がない場合(NO)は、1枚中に1ページとみなして、Lに1を設定する(ステップS3115)。
次に、ステップS3016又はS3115の処理後、処理対象の1文書中の処理ページ数を示す変数cに初期値として1を設定する(ステップS3113)。次に、終了判定として、Lがc以上であるか否かを判定する(ステップS3116)。その結果、c未満である場合(NO)は、ステップS3031に進む。ステップ3031ではbの値をインクリメントし、そして、次のページに処理を移すため、ステップS3015に戻る。一方、ステップS3116でc以上である場合(YES)は、未処理のページが存在するので、処理を続行するためにステップS3020に進む。
ステップS3120では、P番目の文書の論理ページbページであるラスタ画像中のcページ目の画像領域に対して、ブロックセレクション(BS)処理を行う。この処理は、マネージメントPC101の制御によって実行する。
図8は、本発明の第1の実施形態における1枚に2ページ分をNup印刷した例を示す図である。図8において、810は1枚の紙全体の領域であり、811と812は各ページのページ画像を示している。また、813と814は各ページのページ番号である。ここで、b=1である場合、1ページ目のページ画像811を含む処理対象領域815に対してのみ、ブロックセレクション処理を行うことになる。また、b=2の場合は、2ページ目のページ画像812を含む処理対象領域に対してのみブロックセレクション処理を行うことになる。
具体的には、マネージメントPC101のCPUは、記憶部111に格納された処理対象のオリジナル文書のラスタ画像を、まず、文字/線画部分とハーフトーン画像部分とに領域分割する。そして、文字/線画部分は、さらに段落で塊として纏まっているブロック毎に、或いは線で構成された表、図形毎に分割する。
一方、ハーフトーン画像部分は、矩形に分離されたブロックの画像部分、背景部分等のブロックに分割する。
また、処理対象領域は、Nup数(Lの値)と紙文書の向きに基づいて、1枚の紙文書をNup数の領域に分割し、さらにレイアウト順に基づいて決定される。
そして、処理対象のページのページ番号、そのページ中の各ブロックを特定するブロックIDを発行し、各ブロックの属性(画像、文字等)、サイズ(1ページに対する相対的なサイズ、オリジナル文書がNup印刷されていれば、その中の1ページ分に対する相対的なサイズとなる。)やオリジナル文書内の位置(1ページに対する相対的な座標であり、オリジナル文書がNup印刷されていればその中の1ページ分に対する相対的な座標となる。)と各ブロックを関連付けて、記憶部111にブロック情報として記憶する。図5は、ブロック情報の一例を示す図である。
次に、ステップS3030で、データ処理部115において、各ブロックの種別に応じて、各ブロックの特徴量情報を抽出する特徴量情報抽出処理を行う。特に、文字ブロックについては、OCR処理を施して文字コードを抽出し、これを文字特徴量とする(詳細は後述する)。また、画像ブロックについては、色に関する画像特徴量を抽出する(詳細は後述する)。この際、それぞれのブロックに対応する特徴量をオリジナル文書単位にまとめて、文書ID、ページ番号及びブロックIDに関連付けて、記憶部111に特徴量情報として記憶する。図6及び図7は、それぞれ、色特徴量情報及び文字特徴量情報の一例を示す図である。
次に、ステップS3141で、cの値を1インクリメントする。その後、ステップS3116へ戻って、処理対象を次のページに移す。
[検索処理の概要]
次に、オリジナル文書の電子データを検索する検索処理の概要について説明する。図3Bは、本発明の第1の実施形態に係る画像処理システムにおける検索処理の一例を説明するためのフローチャートである。
次に、オリジナル文書の電子データを検索する検索処理の概要について説明する。図3Bは、本発明の第1の実施形態に係る画像処理システムにおける検索処理の一例を説明するためのフローチャートである。
まず、検索条件となる紙文書の入力を行う(ステップS3110)。この処理は、前述したステップS3010の処理と同様であるので説明は省略する。但し、この処理によって生成するラスタ画像は一時保存するだけであり、その紙文書に対するアドレス情報を記憶部111に保存しておく必要はない。
次に、Nup印刷の指定の判定を行って、特徴量情報を抽出する(ステップS3111〜ステップS3130)。これらの処理は、前述した登録処理と同様であり、全く同じステップについては登録処理と同じステップ番号を付与し、その説明は省略する。但し、ステップS3116で条件を満たさないときは、そのままステップS3150へ進むようにする。
尚、ステップS3120のブロックセレクション処理によって生成する各ブロックの属性、サイズ、位置は一時保存するだけであり、その紙文書に対するブロック情報は記憶部111に保存しておく必要はない。
また、処理対象領域は、Nup数(Lの値)と紙文書の向きに基づいて、1枚の紙文書をNup数の領域に分割し、さらにレイアウト順に基づいて決定される。
尚、ステップS3130の処理によって生成する各ブロックの特徴量は一時保存するだけであり、その紙文書に対する特徴量情報を記憶部111に保存しておく必要はない。
次に、ステップS3140で、ブロック情報を参照して、登録されたオリジナル文書中の論理ページ毎に、特徴量情報を読み出し、入力した紙文書中のcページ目の画像(比較元画像)に対する特徴量情報と比較して、その類似度を算出し、その類似度に基づいて、検索結果とするオリジナル文書候補を決定する。この結果をNup数分(L分)、一時保存しておく。
次に、ステップS3141で、cの値を1インクリメントし、ステップS3116へ戻って、処理対象を次のページに移す。
一方、ステップS3116において、Lがc未満である場合(NO)は、ステップS3150に進み、ユーザ確認モードであるか否かを判定する。尚、ユーザ確認モードとは、比較処理によって得られたオリジナル文書候補の中から、ユーザが所望するオリジナル文書が検索されたか否かを確認するモードである。具体的には、オリジナル文書候補群を含むユーザインタフェースを表示部116、入力部113で実現し、このユーザインタフェースによってオリジナル文書候補群の内容をユーザが確認することができるモードである。尚、このユーザインタフェースの構成の詳細については後述する。
ステップS3150において、ユーザ確認モードでない場合(NO)は、比較処理で最も類似している判断された文書を自動的に選択してステップS3170に進む。一方、ユーザ確認モードである場合(YES)は、ステップS3160に進み、オリジナル文書候補の表示/選択を行う。特に、この選択は、オリジナル文書候補のサムネイル画像を表示部116に表示し、複数のオリジナル文書候補の中からユーザが所望のオリジナル文書候補のサムネイル画像を選択させることで実現する。尚、サムネイル画像を表示する際、候補となるオリジナル文書のページがNup印刷されたものである場合は、Nup印刷情報を参照することで、候補となるページのみをサムネイルにすることができる(詳細は後述する)。
次に、ステップS3170では、選択されたオリジナル文書に対し、表示部116、入力部113で実現されるユーザインタフェースを介したユーザからの操作に基いて、そのオリジナル文書の印刷、配信、蓄積、編集のいずれかの処理を実行する。ここで、例えば印刷の場合、選択されたオリジナル文書がNup印刷されたページを含むものである場合は、Nup印刷情報を参照し、1ページずつ印刷したり、登録時とは異なるレイアウトのNup印刷をしたりすることも可能である(詳細は後述する)。
以上説明したように、登録時にNup印刷されたものは、1文書に含まれる各ページ毎に、ブロックセレクション処理、特徴量情報抽出処理を行って、さらにNup印刷情報を関連付けて記憶しておくことで、各ページに対応する電子データを全て検索し、所定の条件のレイアウトに従った印刷等、柔軟な電子データの活用を行うことができる。
[各処理の詳細]
以下、各処理の詳細について説明する。
以下、各処理の詳細について説明する。
(ブロックセレクション処理)
まず、ステップS3020及びステップS3120のブロックセレクション処理の詳細について説明する。図9は、ブロックセレクション処理の具体例について示す図である。
まず、ステップS3020及びステップS3120のブロックセレクション処理の詳細について説明する。図9は、ブロックセレクション処理の具体例について示す図である。
ブロックセレクション処理とは、例えば、図9のラスタ画像910を、920に示すように、意味のあるブロック毎の塊として認識し、当該ブロック各々の属性(文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等)を判定し、異なる属性を持つブロックに分割する処理である。
ブロックセレクション処理の実施形態を以下で説明する。
まず、入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つブロックへ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のブロックは文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字ブロック、扁平な画素塊を線ブロック、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表ブロック、不定形の画素塊が散在している領域を写真ブロック、それ以外の任意形状の画素塊を図画ブロックとする。
(特徴量情報抽出処理)
次に、ステップS3030及びステップS3130の特徴量情報抽出処理の詳細について説明する。尚、特徴量情報抽出処理は、画像ブロック及び文字ブロックで処理方法が異なるため、それぞれ別に説明する。
次に、ステップS3030及びステップS3130の特徴量情報抽出処理の詳細について説明する。尚、特徴量情報抽出処理は、画像ブロック及び文字ブロックで処理方法が異なるため、それぞれ別に説明する。
ここで、画像ブロックは、図9の920に示す例の場合、写真ブロックと図画ブロックとするが、用途や目的に応じて、画像ブロックを写真ブロック及び図画ブロックの少なくとも一方にすることも可能である。
まず、画像ブロックに対する特徴量情報処理について説明する。尚、1文書に複数の画像ブロックが存在する場合は、その総数分だけ、以下で説明する処理を繰り返すことで適用可能である。第1の実施形態では、一例として、画像の色に関する色特徴量を抽出する色特徴量情報処理を行う。
そこで、以下では、色特徴量情報処理の詳細について説明する。図10は、本発明の第1の実施形態に係る色特徴量情報処理の詳細を説明するためのフローチャートである。尚、この処理では、処理対象画像を複数のメッシュブロックに分割した各メッシュブロックの色ヒストグラム中の最頻色を有する色と各メッシュブロックの位置情報を対応づけた情報を色特徴情報として抽出する。
まず、画像を複数のメッシュブロックに分割する(ステップS1020)。図11は、本発明の第1の実施形態における画像のメッシュブロック分割の一例を示す図である。本実施形態では、図11に示すように、画像を縦横をそれぞれ9メッシュブロックに分割する。尚、第1の実施形態では、表記の都合上、9×9=81メッシュブロックに分割している例を示しているが、実際には、15×15=225メッシュブロック程度であることが好ましい。
次に、処理対象となる着目メッシュブロックを左上端のブロックに設定する(ステップS1030)。尚、この着目メッシュブロックの設定は、例えば、図12に示すように、予め処理順序が決定された順序決定テーブルを参照して行う。すなわち、図12は、本発明の第1の実施形態における順序決定テーブルの一例を示す図である。
ステップS1030での設定後、未処理の着目メッシュブロックの有無を判定する(ステップS1040)。その結果、未処理の着目メッシュブロックがない場合(NO)は、処理を終了する。一方、未処理の着目メッシュブロックがある場合(YES)は、ステップS1050に進む。
ステップS1050では、着目メッシュブロックの全画素の各濃度値を、図13の色空間を分割して作った部分空間である色ビンへ射影し、色ビンに対する色ヒストグラムを生成する。すなわち、図13は、本発明の第1の実施形態における色空間上の色ビンの構成の一例を示す図である。
尚、実施形態1では、図13に示すように、RGB色空間を3×3×3=27に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影する場合を示しているが、実際には、RGB色空間を6×6×6=216に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影するほうが好ましい。
次いで、ステップS1060で、色ヒストグラムの最頻色ビンの色ビンIDをその着目メッシュブロックの代表色と決定し、その着目メッシュブロックとその位置に対応づけて記憶部111に記憶する。
さらに、ステップS1070で、図12の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する。その後、ステップS1040に戻り、未処理の着目メッシュブロックがなくなるまで、前述したステップS1040〜ステップS1070の処理を再帰的に繰り返す。
以上の処理によって、処理対象画像(画像ブロック)のメッシュブロック毎の代表色と各メッシュブロックの位置情報が対応付けられた情報を色特徴量情報として抽出することができる。
次に、文字ブロックに対する特徴量情報抽出処理について説明する。尚、1文書に複数の文字ブロックが存在する場合は、その総数分、以下の処理を繰り返す。
文字ブロックに対する文字特徴量情報は、その文字ブロックにOCR(文字認識)処理を施して得られる文字コードとする。OCR(文字認識)処理は、文字ブロックから文字単位で切り出された文字画像に対し、パターンマッチの一手法を用いて文字認識を行い、対応する文字コードを取得する。
この文字認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とするものである。
特徴ベクトルの抽出には種々の公知の手法が知られている。例えば、文字をメッシュ状に分割し、各メッシュブロック内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
ブロックセレクション処理(ステップS3020、或いはステップS3120)で抽出された文字ブロックに対して文字認識を行う場合は、まず、該当文字ブロックに対し横書き/縦書きの判定を行い、各々対応する方向に文字列を切り出し、その後、文字列から文字を切り出して文字画像を取得する。
横書き/縦書きの判定は、該当文字ブロック内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判定する。文字列及び文字への分解は、横書きの文字ブロックである場合には、その水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。一方、縦書きの文字ブロックに対しては、水平と垂直を逆にすれば良い。
(Nup印刷の指定方法)
次に、図3A、図3BのステップS3111のNup印刷の指定方法の詳細について説明する。Nup印刷指定は、ユーザが、MFP100のユーザインターフェースを介して、Nup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数を指定するものである。
次に、図3A、図3BのステップS3111のNup印刷の指定方法の詳細について説明する。Nup印刷指定は、ユーザが、MFP100のユーザインターフェースを介して、Nup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数を指定するものである。
このユーザインターフェースの一例について、図14を用いて説明する。図14は、本発明の第1の実施形態に係るユーザインターフェースの一例を示す図である。
図14において、1411は表示・操作パネルである。1412〜1415は各種機能ボタンであり、各機能ボタン1412〜1415は、処理対象の画像の印刷指示、配信指示、蓄積指示及び編集指示を行うためのものである。
また、1416はスタートボタンであり、押下することで、機能ボタンで選択した機能を実行させることができる。1425はテンキーであり、印刷時の枚数の指定や、Nup印刷する場合の1枚の紙に含まれるNup数、ページ番号の指定を行うことが可能である。
1417は表示領域であり、タッチパネルで構成され、ユーザが直接画面に触れることで選択指示が可能である。1418は紙文書確認用領域であり、画像読取部110で読み取った紙文書画像を、領域内に収まるサイズに縮小して表示する。ユーザは紙文書画像の状態を、この領域1418で確認することが可能となる。
1419は入力原稿の種類を確認する領域であり、読み取った紙文書の種類の内容を確認することができる。この領域1419内において、1420は印刷の種類(通常印刷かNup印刷であるNページ印刷、結合印刷、製本印刷等)の指定を行う領域である。尚、特に指定がされなければ、通常印刷が設定(及び表示)される。また、領域1420を指定すると、「通常印刷」、「Nページ印刷」、「結合印刷」、「製本印刷」等のリストが表示され、この中から選択することで指定できる。また、Nup印刷が指定された場合には、その指定された状態を示すために、その表示形態が、例えば、色付き表示、ブリンク表示、ハイライト表示等の表示形態に変更される。
領域1421は、Nup印刷を指定する場合にのみ表示され、1枚の紙に各ページがどのような順序でレイアウトされているかを指定するものである。これは1421の領域を指定すると、「左上から右向き」、「左上から下向き」、「右上から左向き」、「右上から下向き」等のリストが表示され、この中から選択することで指定できる。領域1422は、Nup印刷を指定する場合にのみ表示され、1枚の紙に含まれるページ数を指定する領域である。ページ数の指定は、テンキー1425を使用する。
領域1423は、Nup印刷を指定する場合にのみ表示され、1枚の紙に含まれる各ページのページ番号を指定する領域である。番号を指定する領域は1422で指定されたNup数に応じた数が表示される。例えば、領域1420で「Nページ印刷」、領域1421で「左上から右向き」が指定されており、Nup数が2の時に、左のページ番号を1等と指定すると、推測して自動的に右のページ番号が2等というように指定される。また、手動で右のページを修正することも可能である。尚、ページ番号の指定は、テンキー1425を使用する。
このようなユーザインターフェースを構成することで、読み取った紙文書に対するNup印刷の指定や、Nup印刷である場合には、Nup印刷の種類、レイアウト順、1枚の紙に何ページ分の文書を含まれるか、各ページのページ番号を、その状態を表示しながら指定することができる。
(比較処理)
次に、ステップS3140の比較処理の詳細について、図15を用いて説明する。図15は、本発明の第1の実施形態に係る画像処理システムにおける比較処理の詳細を説明するためのフローチャートである。
次に、ステップS3140の比較処理の詳細について、図15を用いて説明する。図15は、本発明の第1の実施形態に係る画像処理システムにおける比較処理の詳細を説明するためのフローチャートである。
まず、アドレス情報を参照して、未比較のオリジナル文書の有無を判定する(ステップS1510)。その結果、未比較のオリジナル文書がない場合(NO)は、ステップS1550に進む。一方、未比較のオリジナル文書がある場合(YES)は、ステップS1520に進む。
ステップS1520においては、レイアウトの比較を行う。ここで、レイアウトとは、ブロック情報にあるブロックの属性、サイズ、位置のことである。その結果、比較元画像(紙文書)と比較先画像(電子データ)のレイアウトが同じである場合(YES)は、ステップS1530に進む。一方、比較元画像と比較先画像のレイアウトが同じでない場合(NO)は、ステップS1510に戻る。
ステップS1530では、比較元画像(紙文書)と比較先画像(電子データ)のページ同士の比較を行うページ比較処理を実行する。この比較は、ブロックの属性に合わせ、文字、画像それぞれに応じた特徴量を用いて、複合的に比較を行い、類似度を算出する。この処理の詳細については後述する。
ページ比較処理(ステップS1530)の後、比較先の文書ID、ページ番号に対応させて文書の類似度を記憶部111に一時記憶する(ステップS1540)。そして、ステップS1510に戻る。
一方、ステップS1510において、全ての文書との比較が終了した場合(NO)は、ステップS1550に進む。ステップS1550では、類似度の降順に、文書ID、ページ番号をソートして出力する。
次に、ステップS1530のページ比較処理の詳細について、図16を用いて説明する。図16は、本発明の第1の実施形態におけるページ比較処理の詳細を説明するためのフローチャートである。
まず、ブロック情報を参照し、処理対象となる文書ID、ページ番号に対応する電子データ中で、未比較のブロックの有無を判定する(ステップS1610)。その結果、未比較のブロックがない場合(NO)は、ステップS1670に進む。一方、未比較のブロックがある場合(YES)は、ステップS1620に進む。
次に、ステップS1620で、比較対象のブロックの属性を判定する。属性が画像ブロックである場合、ステップS1640へ進む。一方、属性が文字ブロックである場合、ステップS1660へ進む。
ステップS1640では、属性が画像ブロックである場合について、色に関する特徴量情報で比較先ブロックとの類似比較である色特徴量情報比較処理を行う。この処理の詳細については後述する。これによって得られる類似度は、比較先の文書ID、ページ番号、ブロックIDに対応させて記憶部111に一時記憶する。
一方、ステップS1660では、属性が文字ブロックである場合について、文字の特徴量情報での比較元ブロックと比較先ブロックとの類似比較である文字特徴量情報比較処理を行う。この処理の詳細については後述する。また、これによって得られる類似度は、比較先の文書ID、ページ番号、ブロックIDに対応させて記憶部111に一時記憶する。
ステップS1640及びS1660の比較処理の後、ステップS1610に戻って、全てのブロックとの比較が終了したか否かを判断する。そして、全てのブロックの比較が終了した場合(NO)は、ステップS1670に進む。ステップS1670では、ステップS1640及びステップS1660の処理によって記憶部111に記憶されている比較先文書(電子データ)のページに含まれる全てのブロックの類似度を統合し、検索条件である紙文書とオリジナル文書中のページとの類似度を算出する統合処理を行う。この処理の詳細については後述する。
次に、ステップS1640の色特徴量情報比較処理の詳細について、図17を用いて説明する。図17は、本発明の第1の実施形態に係る色特徴量情報比較処理の詳細を説明するためのフローチャートである。
まず、比較元画像ブロックと比較先画像ブロックの色特徴量を色特徴量情報から読み出す(ステップS1710)。次に、処理対象とする画像ブロック中の着目メッシュブロックを先頭に設定する(ステップS1720)。そして、比較元画像ブロックの色特徴量と、比較対象の色特徴量の類似度を示す類似距離を0にリセットする(ステップS1730)。
次いで、未比較の着目メッシュブロックの有無を判定する(ステップS1740)。その結果、未比較の着目メッシュブロックがない場合(NO)は、ステップS1780に進む。一方、未比較の着目メッシュブロックがある場合(YES)は、ステップS1750に進む。
ステップS1750では、比較元画像と比較先画像のそれぞれの色特徴量から、それぞれの着目メッシュブロックの色ビンIDを取得する。そして、図18の色ビンペナルティマトリックスを参照して、取得した色ビンID間に対応する着目メッシュブロックの局所的類似距離を取得し、これを直前の処理で取得している類似距離に累積加算する(ステップS1760)。尚、この類似距離は、記憶部111に記憶する。
ここで、色ビンペナルティマトリックスについて、図18を用いて説明する。図18は、本発明の第1の実施形態における色ビンペナルティマトリックスの構成を示す図である。
色ビンペナルティマトリックスは、色ビンID同士の局所的類似距離を管理するマトリックスである。図18では、色ビンペナルティマトリックスは、同一色ビンIDではその類似距離は0となり、色ビンID同士の差が大きくなるほど、すなわち、類似度が低くなるほど、その類似距離は大きくなるように構成されている。また、同一色ビンIDの対角位置は全て、その類似距離は0で、それを境に対象性を持っている。
このように、第1の実施形態では、色ビンペナルティマトリックスを参照するだけで、色ビンID同士の類似距離を取得することができるので、処理の高速化を図ることができる。
上述したようなステップS1760の処理後、図12の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する(ステップS1770)。その後、ステップS1740に戻って上記処理を繰り返す。
そして、ステップS1740において未比較の着目メッシュブロックがない場合(NO)、記憶部111に記憶されている類似距離を類似度に変換し、ブロックIDと対にして出力する(ステップS1780)。尚、類似度への変換は、例えば、類似距離が最小値のときを類似度100%、類似距離が最大値のときを類似度0%として、その範囲内の類似距離に対する類似度は、最小値或いは最大値に対する差に基づいて算出するようにすれば良い。
次に、ステップS1660の文字特徴量情報比較処理の詳細について説明する。この処理では、比較元画像と比較先画像中のそれぞれの文字ブロック内の各文字コード同士の比較を行い、その一致度から類似度を算出する。
尚、検索条件とする紙文書とオリジナル文書との比較である場合、類似度は100%となるのが理想的であるが、実際には、検索条件となる紙文書中の文字ブロックに対するOCR処理では誤認識が発生する場合があるので、オリジナル文書との比較であっても、類似度は100%にならないことはあるが、かなり100%に近い値となる。
(統合処理)
次に、ステップS1670の統合処理の詳細について説明する。統合処理では、比較先画像であるオリジナル文書該当するページ内で占めている割合の大きいブロックの類似度が、オリジナル文書の該当するページ全体の類似度としてより大きく反映されるような、算出されたブロック毎の類似度の統合を行う。
次に、ステップS1670の統合処理の詳細について説明する。統合処理では、比較先画像であるオリジナル文書該当するページ内で占めている割合の大きいブロックの類似度が、オリジナル文書の該当するページ全体の類似度としてより大きく反映されるような、算出されたブロック毎の類似度の統合を行う。
例えば、オリジナル文書の該当するページ中のブロックB1〜B6に対し、ブロック毎の類似率がn1〜n6と算出されたとする。このときオリジナル文書の該当するページ全体の総合類似率Nは、以下の式で表現される。
N=w1×n1+w2×n2+w3×n3+ ・・・ +w6×n6 (1)
ここで、w1〜W6は、各ブロックの類似率を評価する重み係数である。重み係数w1〜w6は、ブロックのオリジナル文書の該当するページ内占有率により算出する。例えば、ブロック1〜6のサイズをS1〜S6とすると、ブロック1の占有率w1は、
w1=S1/(S1+S2+・・・+S6) (2)
として算出することができる。
ここで、w1〜W6は、各ブロックの類似率を評価する重み係数である。重み係数w1〜w6は、ブロックのオリジナル文書の該当するページ内占有率により算出する。例えば、ブロック1〜6のサイズをS1〜S6とすると、ブロック1の占有率w1は、
w1=S1/(S1+S2+・・・+S6) (2)
として算出することができる。
このような占有率を用いた重み付け処理により、オリジナル文書内で大きな領域を占めるブロックの類似度がより、オリジナル文書の該当するページ全体の類似度に反映することができる。
このようにして得られた類似度と文書ID、ページ番号を関連付けて、最終的な検索結果として一時保存する。
(確認モード時の処理)
次に、ステップS3150及びステップS3160に示す確認モード時の処理の詳細について説明する。尚、確認モードは、ユーザが予めユーザインタフェースから指定してもよいし、確認モードにするべきか否かを自動で判定しても良い。
次に、ステップS3150及びステップS3160に示す確認モード時の処理の詳細について説明する。尚、確認モードは、ユーザが予めユーザインタフェースから指定してもよいし、確認モードにするべきか否かを自動で判定しても良い。
自動判定の方法としては、次の方法がある。例えば、検索されたオリジナル文書候補が1つの場合、又は、1位のオリジナル文書候補と2位以降のオリジナル文書候補のそれぞれ類似度の差が所定値以上で、1位のオリジナル文書候補が、所望とするオリジナル文書である可能性が高い場合は、「非確認モード」としてステップS3170に進み、そうでない場合は、「確認モード」とする。
但し、Nup印刷の紙文書をスキャンした場合は、スキャン画像中の各ページに対応するそれぞれの候補について、1つでも上記の条件を満足しない場合は、「確認モード」となり、上記の条件を満足しなかったページのみの確認を行う。
また、「確認モード」の際は、MFP100の表示部116と入力部113で実現されるユーザインタフェースに、オリジナル文書候補群を類似度の高い順に表示して、その中から所望のオリジナル文書の選択をユーザに行ってもらう。
このように、確認モードの実行の有無を自動判定する場合は、ユーザによるオリジナル文書の選択操作が不要となるので、操作工程数を低減することができる。
ここで、確認モード時のユーザインタフェースの一例について、図19を用いて説明する。図19は、本発明の第1の実施形態に係るユーザインタフェースの一例を示す図である。
図19において、1917は表示領域であり、タッチパネルで構成され、ユーザが直接画面に触れることで選択指示が可能である。尚、この表示領域1917は、図14における表示領域1417と同様のものである。また、1918はモード表示領域であり、図19では、確認モードであることを示している。通常は自動判定されたモードを表示する。また、ユーザがこの領域に触れることで、「確認モード」と「非確認モード」をユーザがサイクリックに指定することができる。
図19において、1919〜1928は、検索結果として出力するオリジナル文書候補のサムネイル画像群である。このサムネイル画像の表示は、1919から番号順に類似度の高い順で表示されている。
この例では、最大10のサムネイル画像が表示され、オリジナル文書候補が10以上である場合には、上位10までのサムネイル画像が表示される。そして、このサムネイル画像群1919〜1928から、所望するサムネイル画像を選択することで、所望のオリジナル文書を選択することが可能であり、その選択したオリジナル文書に対する各種処理を実行することが可能となる。
また、1929はNup印刷の紙文書をスキャンした時に表示され、文書中の何ページ目の候補が表示されているかを示すものである。また、これを選択することで、他のページの候補を切り替えて表示させることもできる。
オリジナル文書候補を表示するときは、一時保存された検索結果を参照してそれぞれの文書ID、ページ番号に対応する文書のサムネイル画像を表示するが、このとき、Nup印刷情報を参照し、文書ID、ページ番号が、Nup印刷情報に存在する場合は、オリジナル文書はNup印刷されたものである。例えば、表示すべきページ番号が2,3であり、Nup印刷IDがどちらも1等となって同じである場合は、各ページ毎に分けて、2ページ目に対する候補、3ページ目に対する候補として表示してもよいし、そのままオリジナル文書を表示してもよい。
また、例えば、表示すべきページ番号が2,3であり、Nup印刷IDが1,2等となって異なっている場合は、2ページ、3ページは、オリジナル文書としては別の紙に印刷されたものをスキャンして登録されていることになる。例えば、1,2ページのNup印刷と3,4ページのNup印刷のものが登録されている。このようなときは、それぞれを分けて、2ページ目に対する候補、3ページ目に対する候補として表示してもよいし、2ページ目と3ページ目を1枚になるように再構成したものを表示するようにしてもよい。
このように、Nup印刷情報を参照することで、候補対象ではないページ(前記の例では、1、4ページ)を余分に表示させず、ユーザの確認作業を容易にすることが可能となる。
(印刷/配信/蓄積/編集処理)
次に、ステップS3170の印刷/配信/蓄積/編集処理の詳細について説明する。
次に、ステップS3170の印刷/配信/蓄積/編集処理の詳細について説明する。
Nup印刷情報に検索結果の文書ID、ページ番号が存在するときは、オリジナル文書はNup印刷されたページを含んでいる。これらの印刷を行う場合には、その印刷条件として、例えば、それぞれのページを解像度変換し、1枚につき1ページ分を印刷してもよい。また、検索元もNup印刷した紙文書をスキャンした場合、オリジナル文書のNup印刷とレイアウトが同じでページの構成も同じならば、そのままNup印刷を行ってもよいし、もとのNup印刷とレイアウトが同じでページの構成が異なるならば、検索元のNup印刷と同じなる用に再構成してNup印刷を行ってもよい。
また、検索元のNup印刷とはレイアウトを変更したNup印刷を行ってもよい。尚、Nup印刷のレイアウトの違いは、検索元のレイアウト(Nupタイプ、レイアウト順、Nup数)と、Nup印刷情報上のNupタイプ、レイアウト順、Nup数を比較することで判定できる。また、1枚の両面にそれぞれのページを解像度変換して印刷するようにしても良いし、各ページを解像度変換して1枚の紙に重ねて(オーバーレイして)印刷するようにしてもよいし、順番を変えて製本印刷するようにしてもよい。また、もちろん、Nup印刷情報を参照することで、ユーザが指定したページのみを解像度変換して1枚の紙に印刷してもよい。
また、印刷処理以外に、検索結果の全てについて、配信、蓄積、編集等の処理を行うようにしても、ユーザが指定したページのみを配信、蓄積、編集等の処理を行うようにしてもよい。
以上説明したように、第1の実施形態によれば、Nup印刷した紙文書に含まれる全てのページに対して、オリジナルの電子データを検索することができ、かつその検索した電子データが通常印刷されたものをスキャンした場合はもちろん、Nup印刷されたものをスキャンした場合であっても、その電子データを用いた様々な活用を実現することができる。
<第2の実施形態>
前述した第1の実施形態では、入力する紙文書がNup印刷であるか否か、さらに、Nup印刷の場合は、1枚の文書に含まれるページ数の指定をユーザが行う構成とした。これに対し、第2の実施形態では、入力した紙文書の内容を解析して、その解析結果に基づいて、紙文書がNup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数を自動判定する構成について説明する。また、この自動判定のタイミングは、実施形態1の図3AのステップS3015の後、図3BのステップS3110の紙文書の入力後に実行する。
前述した第1の実施形態では、入力する紙文書がNup印刷であるか否か、さらに、Nup印刷の場合は、1枚の文書に含まれるページ数の指定をユーザが行う構成とした。これに対し、第2の実施形態では、入力した紙文書の内容を解析して、その解析結果に基づいて、紙文書がNup印刷であるか否か、更に、Nup印刷の場合は、1枚の文書に含まれるページ数を自動判定する構成について説明する。また、この自動判定のタイミングは、実施形態1の図3AのステップS3015の後、図3BのステップS3110の紙文書の入力後に実行する。
以下、第2の実施形態に係る画像処理システムでの登録処理について、図20Aを用いて説明する。図20Aは、本発明の第2の実施形態に係る画像処理システムにおける登録処理手順を説明するためのフローチャートである。尚、図20Aにおいて、第1の実施形態の図3Aの登録処理と同一の処理ステップには、同一のステップ番号を付加し、その詳細については省略する。
図20Aに示すように、前述した図3Aのフローチャートと異なる点は、ステップS3110のNup印刷判定処理を有しているかいないかである。尚、Nup印刷判定処理の詳細については後述する。
次に、第2の実施形態における検索処理について、図20Bを用いて説明する。図20Bは、本発明の第2の実施形態に係る画像処理システムにおける検索処理手順を説明するためのフローチャートである。尚、図20Bにおいて、第1の実施形態の図3Bに示す検索処理と同一の処理ステップには、同一のステップ番号を付加し、その詳細については省略する。
図20Bに示すように、前述した図3Bのフローチャートと異なる点は、ステップS3110のNup印刷判定処理を有しているかいないかである。また、当該Nup印刷判定処理(ステップS3110)は、登録処理と同じである。
ここで、紙文書に1ページ分の文書が印刷されている通常印刷の場合には、紙文書の上端か下端にページ番号が印刷される。一方、Nup印刷の場合は、紙文書内に複数のページ番号が等間隔に印刷されることになる。そこで、第2の実施形態では、このことを利用して、処理対象のスキャン画像がNup印刷であるか否かを判定する。
例として、図21に示すような1枚の紙に4ページ分の文書をNup印刷した場合について説明する。図21は、本発明の第2の実施形態に係る画像処理システムにおいて1枚に4ページ分をNup印刷した例を示す図である。
図21において、2110はNup印刷時の紙全体の領域を示している。2111〜2114は各ページのページ画像を示している。2115〜2118は、各ページに付与されたページ番号である。2119と2120の太枠内は、後述するページ番号探索領域である。
次に、ステップS3110のNup印刷判定処理の詳細について、図21及び図22を用いて説明する。図22は、本発明の第2の実施形態に係る画像処理システムにおけるNup印刷判定処理の詳細を説明するためのフローチャートである。
まず、紙全体の領域2110の上端と下端の領域に対して、OCR処理を施す(ステップS2210)。次に、OCR処理の処理結果として、ページ番号(例えば、アラビア数字、もしくは英数字)が2個所以上、上端領域又は下端領域の所定の領域内(例えば、等間隔の領域)に存在するか否かを判定する(ステップS2220)。その結果、ページ番号が2個所以上存在しない場合(NO)は、通常印刷であると判定する(ステップS2260)。一方、ページ番号が2個所以上存在する場合(YES)は、ステップS2230に進む。
例えば、図21に示す場合では、ページ番号2117(「3」)と2118(「4」)が下端領域に2箇所検出されることになる。
ステップS2230では、検出されたページ番号に基づいて、他のページ番号を探索するためのページ番号探索領域を設定し、その設定したページ番号探索領域に対してOCR処理を施す。
図21に示す例では、ページ番号画像2117と2118で、それぞれのページ番号を含む紙全体の垂直方向にページ番号探索領域2119及び2120を設定する。そして、各ページ番号探索領域2119、2120に対してOCR処理を施す。
次に、ステップS2240で、各ページ番号探索領域でページ番号が検出され、各ページ番号探索領域中のページ番号同士の間隔が同一であるか否かを判断する。そして、ステップS2250において、ステップS2240の判断が同一でない場合は、1列のNup印刷であると判定し、一方、同一である場合は、マトリックス状のNup印刷であると判定する。
図21に示す例では、ページ番号探索領域2119にページ番号2115(「1」)と2117(「3」)が検出され、ページ番号探索領域2120にページ番号2116(「2」)と2118(「4」)が検出される。そして、ページ番号探索領域2119とページ番号探索領域2120中のページ番号の間隔は、同じ間隔となっている。そのため、この場合は、マトリックス状のNup印刷と判定される。
また、この際、ステップS2210で検出されたページ番号の数と、ステップS2230の1つのページ番号探索領域で検出されたページ番号の数を乗算することで、1枚に含まれるページ数を算出することができ、このページ数とページ番号を記憶部111に一時保存する。
ステップS2250でNup印刷と判定された後、ページ番号の並びから、レイアウト順序とNup印刷のタイプを推定し、記憶部111に一時保存する(ステップS2255)。尚、Nup印刷のタイプはページ番号が番号順になっていなければNページ印刷と推定し、ページ数が2でページ番号の番号順でなければ製本印刷というように推定できる。
以上説明したように、第2の実施形態に係る画像処理システムによれば、第1の実施形態で説明した効果に加えて、スキャン画像がNup印刷であるか否かを自動的に判定することで、ユーザの手を煩わすことなく、Nup印刷であるか否か、また、Nup印刷である場合に何ページ分含んでいるか、ページ番号、レイアウト順序、Nup印刷のタイプを判定することが可能となる。
尚、第2の実施形態において、ステップS3111のNup印刷判定処理の処理結果を、ユーザに一旦提示して確認させる構成としても良い。このときは、図14の紙文書確認用領域1418のように判定結果を縮小画像として表示すればよい。また、確認の結果、誤判定である場合には、領域1419を用いて判定内容を修正する機会を与えることが可能である。
このような構成にすることにより、Nup印刷判定判定処理に誤判定があっても、その判定内容を修正することができ、誤ったオリジナルの電子データが出力される、といったことを防止することができる。
<第3の実施形態>
前述した第2の実施形態では、ステップS3110のNup印刷判定処理において、OCR処理を用いて、ページ番号を検出する方法について説明したが、これに限定されるものではない。例えば、以下で説明するようにして、ページ番号を検出するようにしても良い。
前述した第2の実施形態では、ステップS3110のNup印刷判定処理において、OCR処理を用いて、ページ番号を検出する方法について説明したが、これに限定されるものではない。例えば、以下で説明するようにして、ページ番号を検出するようにしても良い。
ここでは、第3の実施形態として、図23に示すように、1枚に4ページ分をNup印刷した場合について説明する。すなわち、図23は、本発明の第3の実施形態における1枚に4ページ分をNup印刷した例を示す図である。
尚、2310は図21の2110と、以下同様に、2311は2111と、2312は2112と、2313は2113と、2314は2114と、2315は2115と、2316は2116と、2317は2117と、2318は2118に対応するので、その説明は省略する。
図23において、2320は左側の2つのページの左マージン(最左端余白)である。2321は右側の2つのページの右マージン(最右端余白)である。2319は左側の2つのページと右側の2つのページの中間マージン(中間余白)である。ここで、中間マージン2319は、左側の2つのページの右マージンと、右側の2つのページの左マージンとが連続しているので、左マージン2320や右マージン2321より長くなる。
そして、この中間マージン2319が検出される場合には、Nupページ印刷であると判定することができる。尚、図23では、横方向のマージンに着目して説明したが、縦方向に関しても同様のことが言える。
次に、より詳細な具体例について、図24を用いて説明する。すなわち、図24は、本発明の第3の実施形態におけるNup印刷判定処理を説明するための図である。
図24において、2410は紙全体の領域である。まず、これに対してブロックセレクション処理を行うと、ブロック2411〜2421が、ブロックセレクション処理結果として得られる。まず、検出されたブロック群の最左端を検出し、紙全体領域の左端2310の差分である左マージン2422を算出する。そして、この左マージン2422が、図23の左マージン2320に相当する。
同様に、ブロック群の最右端を検出し、紙全体領域の右端2310の差分である右マージン2423を算出する。そして、この右マージン2423が、図23の右マージン2321に相当する。
その後、各ブロック群の横方向の間隔を求め、中間マージン2319の中間マージン候補2424、2425を算出する。中間マージン候補2424、2425の中で、左マージン2422、右マージン2423よりも長い中間マージン候補2424を中間マージンとする。
このようにして検出した中間マージンの数+1が、横方向のページ数となる。同様の処理を縦方向にも行い、それぞれの結果を乗算することで、ページの総数を算出することができる。
以上のようにしてNup印刷に何ページ含まれているかがわかるので、これから、ページ番号の領域を推定する。その領域にOCR処理を施すことで、ページ番号を得ることができる。そして、第2の実施形態と同様の方法で、レイアウト順とNup印刷タイプを推定することができる。
以上説明したように、第3の実施形態によれば、第2の実施形態で説明した効果と同様に、ユーザの手を煩わすことなく、Nup印刷であるか否か、また、Nup印刷である場合に何ページ分含んでいるか、ページ番号、レイアウト順序、Nup印刷のタイプを判定することが可能となる。
<その他の実施形態>
また、その他の実施形態として、第1の実施形態において、図14の紙文書確認用領域1418で、ユーザが所望のページが表示されている範囲に触れることで、ページを指定することで、処理対象のページを選択するようにしても構わない。このときは、ステップS3120からステップS3140の処理は、指定されたページ領域についてのみ処理が行われる。また、第2、第3の実施形態においても、Nup印刷判定結果をユーザに提示し、同様な手続きを行うことによって、指定されたページ領域についてのみ処理を行うようにしても構わない。このようにすることによって、ユーザはNup印刷された紙文書中の特定のページについてのみ登録したり、印刷等の処理を行うことができる。
また、その他の実施形態として、第1の実施形態において、図14の紙文書確認用領域1418で、ユーザが所望のページが表示されている範囲に触れることで、ページを指定することで、処理対象のページを選択するようにしても構わない。このときは、ステップS3120からステップS3140の処理は、指定されたページ領域についてのみ処理が行われる。また、第2、第3の実施形態においても、Nup印刷判定結果をユーザに提示し、同様な手続きを行うことによって、指定されたページ領域についてのみ処理を行うようにしても構わない。このようにすることによって、ユーザはNup印刷された紙文書中の特定のページについてのみ登録したり、印刷等の処理を行うことができる。
また、図10の色特徴量情報抽出処理では、処理対象画像の最頻色を色特徴情報として抽出する例を説明したが、これに限定されるものではなく、例えば、平均色を色特徴情報として抽出するようにしても良い。
また、画像特徴量として色特徴量を用いたが、これに限定されるものではなく、例えば、最頻輝度、平均輝度等の輝度特徴量、共起行列、コントラスト、エントロピ、Gabor変換等で表現されるテクスチャ特徴量、エッジ、フーリエ記述子等の形状特徴量等の複数種類の画像特徴量を1つ、或いは、任意に組み合わせた画像特徴量を用いても良い。
また、ブロックセレクション処理を行い、処理対象の文書を文字ブロックと画像ブロックに分割し、これらの各ブロックの特徴量を複合的に用いて検索を行ったが、文書全体を1つの画像とみなし、画像の特徴量のみを用いて検索を行うようにしても構わない。また、精度が許容される範囲ならば、文書中の画像ブロックのみを利用して、オリジナル文書の検索を行うようにしても構わない。
また、電子データを、一旦、ラスタ画像に変換したが、電子データから直接、文字コードや画像を抜き出して比較してももちろん構わない。
また、文字特徴量としては文字コードを採用したが、例えば、単語辞書とのマッチングを予め行って単語の品詞を抽出しておき、名詞である単語を文字特徴量としても良い。
また、文字特徴量としては文字コードを採用したが、例えば、単語辞書とのマッチングを予め行って単語の品詞を抽出しておき、名詞である単語を文字特徴量としても良い。
また、アドレス情報、ブロック情報、Nup印刷情報、色特徴量情報、文字特徴量情報をバイナリ形式で表現したが、XML(Extensible Markup Language)のようなテキスト形式で記述するようにしても構わない。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
以上説明したように、本発明によれば、通常印刷、Nup印刷の区別無く、紙文書のスキャン画像をオリジナル電子データとして管理することができ、かつ、通常印刷、Nup印刷の区別無く、紙文書からオリジナル電子データの検索と活用を行うことができる。
Claims (17)
- 印刷物を電子的に読み取って得られた画像を入力する入力手段と、
入力された前記画像を格納する格納手段と、
前記画像中の1又は複数のページ画像を含む処理対象領域の特徴量を抽出する抽出手段と、
前記画像の格納先情報と前記特徴量と前記1又は複数のページ画像の構成情報であるページ構成情報とを関連付けて管理する管理手段と
を備えることを特徴とする画像処理装置。 - 前記ページ構成情報を指定する指定手段をさらに備え、
前記抽出手段が、前記指定手段で指定された前記ページ構成情報に基づいて決定される前記処理対象領域に含まれるページ画像毎に、該処理対象領域の特徴量を抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記画像に複数のページ画像が存在するか否かを判定する判定手段と、
前記画像に複数のページ画像が存在すると判定された場合、該画像に含まれるページ構成情報を推定する推定手段とをさらに備え、
前記抽出手段が、前記推定手段によって推定された前記ページ構成情報に基づいて決定される処理対象領域毎に、該処理対象領域の特徴量を抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記判定手段が、
前記画像中に含まれるページ番号を検出する手段と、
前記ページ番号が所定の領域内で等間隔に存在しているか否かを判定する手段とを備え、
該ページ番号の間隔の判定結果に基づいて前記画像に複数のページ画像が存在するか否かを判定することを特徴とする請求項3に記載の画像処理装置。 - 前記判定手段が、
前記画像の最右端余白又は最左端余白と、それ以外の中間余白とを検出する手段と、
検出された前記中間余白が、前記最右端余白又は前記最左端余白よりも大きいか否かを判定する手段とを備え、
前記中間余白と前記最右端余白又は前記最左端余白との大きさの判定結果に基づいて前記画像に複数のページ画像が存在するか否かを判定することを特徴とする請求項3に記載の画像処理装置。 - 前記判定手段による判定結果を表示する表示手段と、
前記判定結果を修正する修正手段と
をさらに備えることを特徴とする請求項3から5までのいずれか1項に記載の画像処理装置。 - 前記格納手段に格納された前記画像を検索する検索手段をさらに備え、
前記入力手段が、新たな印刷物を電子的に読み取って得られた電子データを新たな画像として入力し、
前記抽出手段が、前記新たな画像の特徴量を抽出し、
前記検索手段が、前記特徴量を用いて、前記新たな画像に対応する画像を前記格納手段から検索する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記抽出手段が、前記画像又は前記新たな画像に含まれる処理対象領域の画像特徴量及び文字特徴量のいずれか又は両方を抽出することを特徴とする請求項7に記載の画像処理装置。
- 前記画像特徴量が、色特徴量、輝度特徴量、テクスチャ特徴量、形状特徴量のいずれか1つ、或いは、任意の組み合わせであることを特徴とする請求項8に記載の画像処理装置。
- 前記文字特徴量が、文字コードであることを特徴とする請求項8に記載の画像処理装置。
- 前記検索手段による検索結果の画像を前記ページ構成情報を用いて表示用に加工する手段と、
前記加工手段によって加工された検索結果の画像を表示する表示手段と、
前記検索手段による検索結果として、前記表示手段に複数の画像が表示された場合、該複数の画像から所望の画像を選択する選択手段と
をさらに備えることを特徴とする請求項7に記載の画像処理装置。 - 前記検索手段によって検索された画像を処理する処理手段と、
前記画像の処理に対する処理の種類を指示する指示手段とをさらに備え、
前記処理の種類が、印刷、配信、蓄積、編集のいずれかであることを特徴とする請求項7に記載の画像処理装置。 - 前記格納手段から検索された前記画像のページ構成情報と前記新たな画像のページ構成情報とが異なる場合、前記画像のページ構成情報を前記新たな画像のページ構成情報と同様になるように再構成する再構成手段をさらに備えることを特徴とする請求項7に記載の画像処理装置。
- 前記処理手段を行う際のページ構成情報を指定する手段と、
前記格納手段から検索された前記画像のページ構成情報と前記指定されたページ構成情報とが異なる場合、前記画像のページ構成情報を前記指定されたページ構成情報と同様になるように再構成する再構成手段と
をさらに備えることを特徴とする請求項7に記載の画像処理装置。 - 印刷物を電子的に読み取って得られた画像を入力する入力工程と、
入力された前記画像を格納装置に格納する格納手段と、
前記画像中の1又は複数のページ画像を含む処理対象領域の特徴量を抽出する抽出工程と、
前記画像の格納先情報と前記特徴量と前記1又は複数のページ画像の構成情報であるページ構成情報とを関連付けて管理する管理工程と
を有することを特徴とする画像処理方法。 - コンピュータに、
印刷物を電子的に読み取って得られた画像を入力する入力手順と、
入力された前記画像を格納装置に格納する格納手順と、
前記画像中の1又は複数のページ画像を含む処理対象領域の特徴量を抽出する抽出手順と、
前記画像の格納先情報と前記特徴量と前記1又は複数のページ画像の構成情報であるページ構成情報とを関連付けて管理する管理手順と
を実行させるためのプログラム。 - 請求項16に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005156194A JP2006333248A (ja) | 2005-05-27 | 2005-05-27 | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005156194A JP2006333248A (ja) | 2005-05-27 | 2005-05-27 | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006333248A true JP2006333248A (ja) | 2006-12-07 |
Family
ID=37554433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005156194A Withdrawn JP2006333248A (ja) | 2005-05-27 | 2005-05-27 | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006333248A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090080783A1 (en) * | 2007-09-21 | 2009-03-26 | Hitoshi Hirohata | Image data output processing apparatus and image data output processing method |
CN101382770B (zh) * | 2007-09-07 | 2011-03-16 | 夏普株式会社 | 图像比对装置、图像比对方法和图像数据输出处理装置 |
US7986839B2 (en) | 2008-02-26 | 2011-07-26 | Sharp Kabushiki Kaisha | Image processing method, image processing apparatus, image forming apparatus, and storage medium |
US11328425B2 (en) | 2019-01-25 | 2022-05-10 | Fujifilm Business Innovation Corp. | Image processing apparatus and non-transitory computer readable medium |
-
2005
- 2005-05-27 JP JP2005156194A patent/JP2006333248A/ja not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101382770B (zh) * | 2007-09-07 | 2011-03-16 | 夏普株式会社 | 图像比对装置、图像比对方法和图像数据输出处理装置 |
US8050501B2 (en) | 2007-09-07 | 2011-11-01 | Sharp Kabushiki Kaisha | Image matching apparatus, image matching method, and image data output processing apparatus |
US20090080783A1 (en) * | 2007-09-21 | 2009-03-26 | Hitoshi Hirohata | Image data output processing apparatus and image data output processing method |
US8260061B2 (en) | 2007-09-21 | 2012-09-04 | Sharp Kabushiki Kaisha | Image data output processing apparatus and image data output processing method |
US7986839B2 (en) | 2008-02-26 | 2011-07-26 | Sharp Kabushiki Kaisha | Image processing method, image processing apparatus, image forming apparatus, and storage medium |
US11328425B2 (en) | 2019-01-25 | 2022-05-10 | Fujifilm Business Innovation Corp. | Image processing apparatus and non-transitory computer readable medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4405831B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4371965B2 (ja) | 画像処理装置、画像処理方法 | |
JP4266695B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4920928B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4181892B2 (ja) | 画像処理方法 | |
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
CN101178725B (zh) | 用于信息检索的设备和方法 | |
JP5063422B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
JP2006333248A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
US8194982B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
JP5298997B2 (ja) | 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体 | |
JP2004348467A (ja) | 画像検索装置及びその制御方法、プログラム | |
JP4047222B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2005149323A (ja) | 画像処理システム及び画像処理装置並びに画像処理方法 | |
JP6012700B2 (ja) | 情報処理装置、情報処理方法、情報処理システム、コンピュータプログラム | |
JP2006023946A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2008107901A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP5652509B2 (ja) | 編集装置、編集方法、及びプログラム | |
JP5420032B2 (ja) | 情報処理装置、情報処理方法、情報処理システム、コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080805 |