JP4257925B2

JP4257925B2 - 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体

Info

Publication number: JP4257925B2
Application number: JP2007207094A
Authority: JP
Inventors: 淳寿森本; 雅和大平
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2006-08-24
Filing date: 2007-08-08
Publication date: 2009-04-30
Anticipated expiration: 2027-08-08
Also published as: CN101136981B; CN101136981A; JP2008077641A; US20080049264A1; US7948664B2

Description

本発明は、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体に関する。

スキャナで原稿を読み取り、原稿を読み取って得られた入力画像からフォーマット情報を認識し、認識したフォーマット情報に基づいて要素毎のマッチング処理を行って入力画像を分類し、分類した結果に応じて入力画像をファイリングする技術が知られている。

例えば、入力画像に対して、線分抽出、文字枠抽出、文字認識又は枠抽出などの認識処理を行い、認識結果から枠データの中心座標、文字列枠の中心座標、連結枠情報などの情報を抽出する。次に、抽出した情報より不変量を算出し、テーブル管理に必要なデータ（不変量、モデル名、不変量を算出するのに用いたパラメータなど）を作成してハッシュテーブルに登録することにより、フォーマットの登録を行う。

フォーマットの識別を行う場合は、入力画像に対して認識処理を行い、認識結果から枠データの中心座標、文字列枠の中心座標、連結枠情報などの情報を抽出する。そして、各情報に対する不変量を算出し、算出した不変量を用いて、対応するハッシュテーブルのエリアを検索し、検索したエリア内の登録帳票名ごとに投票を行う。これらの処理を入力画像の特徴点毎に繰り返し、ヒストグラムの最も大きいモデルを認識結果として類似度を計算する。入力画像が登録されていると確認された場合、入力画像に識別子を付与して保存する。このような処理を行うことにより、フォーマット情報に基づいて要素毎のマッチングを自動的に行ってユーザの処理工程を軽減することができる画像のファイリング装置が提案されている（特許文献１参照）。
特許第３４６９３４５号公報

しかしながら、特許文献１の装置にあっては、予めフォーマット情報を登録する作業が必要であり、様々な原稿を精度良く分類するためには、膨大な量のフォーマット情報を登録しておく必要があり、フォーマット情報を記憶するための記憶容量が増大するという問題があった。また、入力画像に識別子を付与し、付与した識別子に基づいて分類した原稿を電子データとしてファイリングすることは可能であるものの、紙媒体である原稿自身を分類することはできず、原稿自身を分類するためには、ユーザの目視による分類作業を要し、特に多くの原稿を分類する場合にはユーザの作業量は膨大となり、ユーザの利便性の向上が望まれていた。

本発明は、斯かる事情に鑑みてなされたものであり、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、画像の類似度を算出し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する。そして、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定し、付与された識別子に基づいて原稿を分類することにより、予め原稿のフォーマット情報などを登録することなく、所定の分類数に分類できない原稿がある場合であっても、分類できた原稿と分類できない原稿とを区別することができる画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することを目的とする。

また、本発明の他の目的は、最初に入力された画像データ（例えば、電子データ、電子化データなど）の特徴量及び該画像データを分類するために付与された識別子を記憶し、最初に入力された画像データの後に順次入力された画像データに対して、該画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、画像の類似度を算出し、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する。そして、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定し、付与された識別子に基づいて画像データを分類することにより、電子データ又は電子化データに対して、所定の分類数に分類できない場合であっても、分類できた画像データと分類できない画像データとを順次区別しながら分類（ファイリング等）を行うことができる画像処理方法、画像処理装置、該画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することにある。

また、本発明の他の目的は、記憶された識別子の数が所定数に達しない場合、投票で得られた得票数に基づいて画像の類似度を算出し、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することにより、所定の分類数に応じて原稿又は画像データを分類することができる画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することにある。

また、本発明の他の目的は、非類似として分類された原稿（又は画像データ）がある場合、記憶された特徴量及び識別子を消去するとともに、非類似として分類された原稿（又は画像データ）を再度順次読み取り（又は順次入力し）、最初に読み取られた原稿の画像（又は最初に入力された画像データ）の特徴量及び該原稿を分類するために付与された識別子を記憶し、最初に読み取られた原稿（又は最初に入力された画像データ）の後に順次読み取られた原稿（又は順次入力された画像データ）に対して、該原稿の画像（又は画像データ）の特徴量と記憶された識別子で分類された原稿の画像（又は最初に入力された画像データ）の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で獲られた得票数に基づいて、前記順次読み取られた原稿（又は順次入力された画像データ）に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像（又は画像データ）の特徴量及び該識別子を記憶する処理を少なくとも１回繰り返すことにより、一旦非類似として分類された原稿（又は画像データ）であっても、該原稿（又は該画像データ）の中でお互いに類似する原稿（又は画像データ）を再度分類することができる画像処理方法、原稿読取装置、該原稿読取装置を備える画像形成装置、コンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することにある。

また、本発明の他の目的は、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与することにより、所定の分類数で原稿を分類することができる画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置を提供することにある。

また、本発明の他の目的は、分類毎に原稿の排出位置を変位する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる原稿読取装置及び該原稿読取装置を備える画像形成装置を提供することにある。

また、本発明の他の目的は、分類毎に原稿を異なる排出トレイに排出する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる原稿読取装置及び該原稿読取装置を備える画像形成装置を提供することにある。

また、本発明の他の目的は、順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定し、決定された分類毎に原稿を分類して排出する分類排出手段を備え、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与することにより、所定の分類数で原稿を分類することができる原稿読取装置及び該原稿読取装置を備える画像形成装置を提供することにある。

本発明に係る画像処理方法は、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置による画像処理方法において、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶手段に記憶する第１記憶ステップと、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定手段で判定する判定ステップと、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶手段に記憶する第２記憶ステップとを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定し、さらに、付与された識別子に基づいて原稿を分類手段で分類するステップを備えることを特徴とする。

本発明に係る画像処理方法は、複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置による画像処理方法において、最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶手段に記憶する第１記憶ステップと、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定手段で判定する判定ステップと、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶手段に記憶する第２記憶ステップとを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定し、さらに、付与された識別子に基づいて画像データを分類手段で分類するステップを備えることを特徴とする。

本発明に係る画像処理方法は、前記決定手段は、記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することを特徴とする。

本発明に係る画像処理方法は、前記画像処理装置は、非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去ステップ、前記原稿を読み取り又は画像データを入力し、前記第１記憶ステップ、判定ステップ、投票ステップ、算出ステップ、決定ステップ、及び第２記憶ステップの各ステップを少なくとも１回繰り返すことを特徴とする。

本発明に係る画像処理装置は、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置において、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する手段と、付与された識別子に基づいて原稿を分類する手段とを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする。

本発明に係る画像処理装置は、複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置において、最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶する記憶手段と、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、該投票手段で投票されて得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する手段と、付与された識別子に基づいて画像データを分類する手段とを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、順次入力された画像データに、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する画像データの識別子を付与すべく構成してあることを特徴とする。

本発明に係る画像処理装置は、前記投票手段で投票されて得られた得票数に基づいて、画像の類似度を算出する算出手段を備え、前記決定手段は、記憶された識別子の数が所定数に達しない場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定すべく構成してあることを特徴とする。

本発明に係る画像処理装置は、前記決定手段は、記憶された識別子の数が所定数に達した場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は前記原稿若しくは前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とする。

本発明に係る原稿読取装置は、前述の本発明に係るいずれか１つの画像処理装置を備え、原稿を読み取る原稿読取装置であって、前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段を備えることを特徴とする。

本発明に係る原稿読取装置は、前述の本発明に係る画像処理装置を備え、原稿を読み取る原稿読取装置であって、前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段と、非類似として分類された原稿を再度読み取るため、該原稿を搬送する搬送手段とを備え、前記原稿を再度読み取る場合、記憶された特徴量及び識別子を消去すべく構成してあることを特徴とする。

本発明に係る原稿読取装置は、前記分類排出手段は、分類毎に原稿の排出位置を変位するように構成してあることを特徴とする。

本発明に係る原稿読取装置は、原稿を排出する排出トレイを複数備え、前記分類排出手段は、分類毎に原稿を異なる排出トレイに排出するように構成してあることを特徴とする。

本発明に係る原稿読取装置は、原稿を読み取る原稿読取装置において、原稿の画像の複数の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、順次読み取られた原稿に対して、該原稿の画像に基づいて抽出された複数の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する決定手段と、該決定手段で決定された識別子毎に原稿を分類して排出する分類排出手段とを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする。

本発明に係る画像形成装置は、前述の本発明に係るいずれか１つの原稿読取装置と、該原稿読取装置で原稿を読み取って得られた画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする。

本発明に係るコンピュータプログラムは、コンピュータに、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出させ、抽出した特徴量に基づいて原稿を分類するための処理を行わせるためのコンピュータプログラムにおいて、コンピュータを、最初に読み取られた原稿の画像の特徴量を抽出し、抽出した特徴量及び前記原稿を分類するために付与された識別子を記憶する第１記憶手段と、コンピュータを、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、コンピュータを、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、コンピュータを、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する第２記憶手段と、付与された識別子に基づいて原稿を分類する手段として機能させ、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定すべく構成してあることを特徴とする。

本発明に係るコンピュータプログラムは、コンピュータに、複数の画像データより順次各画像データの特徴量を複数抽出させ、抽出した特徴量に基づいて画像データを分類するための処理を行わせるためのコンピュータプログラムにおいて、コンピュータを、最初に入力された画像データの特徴量を抽出し、抽出した特徴量及び前記画像データを分類するために付与された識別子を記憶する第１記憶手段と、コンピュータを、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、コンピュータを、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、コンピュータを、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する第２記憶手段と、付与された識別子に基づいて画像データを分類する手段として機能させ、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とする。

本発明に係るコンピュータプログラムは、コンピュータを、記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段として機能させることを特徴とする。

本発明に係るコンピュータプログラムは、コンピュータを、非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去手段、前記原稿を読み取り又は画像データを入力し、前記第１記憶手段、判定手段、投票手段、算出手段、決定手段、及び第２記憶手段の各手段として少なくとも１回繰り返すよう機能させることを特徴とする。

本発明に係るコンピュータでの読み取りが可能な記録媒体は、前述の本発明に係るいずれか１つのコンピュータプログラムを記録してあることを特徴とする。

本発明にあっては、複数の原稿を順次読み取る場合、最初に読み取られた原稿の画像の特徴量（例えば、画像を二値化した二値化画像で連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点の中から複数の特徴点を選択して、不変量として算出されたハッシュ値）及び該原稿を分類するために付与された識別子（例えば、原稿のカテゴリ）を記憶する。最初の原稿の後に順次読み取られた原稿に対して、抽出された特徴量と識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。例えば、類似度を最大得票数に対する得票数の比率として定義することができる。この場合、最大得票数は、画像に基づいて抽出される特徴点の数に、１つの特徴点で算出され得る特徴量（例えば、ハッシュ値）の数を乗算することにより算出することができる。投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。例えば、得票数が所定の閾値以上である場合、その得票数を得た画像に対応する原稿の識別子を読み取った原稿に付与し、得票数が所定の閾値より少ない場合、記憶された識別子と異なる新たな識別子を読み取った原稿に付与する。新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定する。これにより、まず、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、その後順次読み取られた原稿を、分類することができた原稿と所定の分類数の範囲内で分類することができない原稿とに区別する。

本発明にあっては、複数の画像データ（例えば、電子データ、電子化データなど）を順次入力する場合、最初に入力された画像データの特徴量（例えば、画像を二値化した二値化画像で連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点の中から複数の特徴点を選択して、不変量として算出されたハッシュ値）及び該画像データを分類するために付与された識別子（例えば、画像データのカテゴリ）を記憶する。最初に入力された画像データの後に順次入力された画像データに対して、抽出された特徴量と識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。例えば、類似度を最大得票数に対する得票数の比率として定義することができる。この場合、最大得票数は、画像に基づいて抽出される特徴点の数に、１つの特徴点で算出され得る特徴量（例えば、ハッシュ値）の数を乗算することにより算出することができる。投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。例えば、得票数が所定の閾値以上である場合、その得票数を得た画像に対応する画像データの識別子を入力された画像データに付与し、得票数が所定の閾値より少ない場合、記憶された識別子と異なる新たな識別子を入力された画像データに付与する。新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定する。これにより、まず、最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶し、その後順次入力された画像データを、分類することができた画像データと所定の分類数の範囲内で分類することができない画像データとに区別する。

また、本発明にあっては、記憶された識別子の数が所定数（例えば、デフォルトの分類数又はユーザが指定した分類数など）に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿（又は順次入力された画像データ）に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。これにより、所定の分類数に応じて原稿（又は画像データ）を分類する。

また、本発明にあっては、非類似として分類された原稿（又は画像データ）がある場合、記憶された特徴量及び識別子を消去する。これにより、すでに分類された原稿（又は画像データ）に関する特徴量及び識別子を初期化する。非類似として分類された原稿を順次読み取り（又は画像データを順次入力し）、最初に読み取られた原稿の画像（又は最初に入力された画像データ）の特徴量及び該原稿（又は該画像データ）を分類するために付与された識別子を記憶し、その後順次読み取られた原稿（又は順次入力された画像データ）に対して、抽出された特徴量と識別子で分類された原稿の画像（又は画像データ）の特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿（又は順次入力された画像データ）に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。新たな識別子を付与する場合、該識別子で分類される原稿の画像（又は画像データ）の特徴量及び該識別子を記憶する。これにより、非類似として分類された原稿（又は画像データ）を再度読み取り（又は入力し）、最初に読み取られた原稿の画像（又は最初に入力された画像データ）の特徴量及び該原稿（又は画像データ）を分類するために付与された識別子を記憶し、その後順次読み取られた原稿（又は順次入力された画像データ）に、得票数に基づいて先に付与された識別子を付与するか又は新たな識別子を付与する処理を少なくとも１回繰り返す。

また、本発明にあっては、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与する。これにより、所定の分類数の範囲内で原稿を分類する。

また、本発明にあっては、分類排出手段は、決定された分類毎に原稿を分類して排出する。

また、本発明にあっては、分類排出手段は、決定された分類毎に原稿を分類して排出し、搬送手段は、非類似として分類された原稿を再度読み取るため、該原稿を搬送する。該原稿を再度読み取る場合、記憶された特徴量及び識別子を消去する。これにより、すでに分類された原稿に関する特徴量及び識別子を初期化する。非類似として分類された原稿を再度読み取ることにより、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、その後順次読み取られた原稿に、得票数に基づいて先に付与された識別子を付与するか又は新たな識別子を付与する。

また、本発明にあっては、分類排出手段は、分類毎に原稿の排出位置を変位する。

また、本発明にあっては、分類排出手段は、分類毎に原稿を異なる排出トレイに排出する。

また、本発明にあっては、順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する。このとき、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく決定する。分類排出手段は、決定された分類毎に原稿を分類して排出する。

本発明にあっては、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定する。これにより、所定の分類数に分類できない原稿がある場合であっても、分類できた原稿と分類できない原稿とを区別することができる。

本発明にあっては、最初に入力された画像データ（電子データ、電子化データなど）の特徴量及び該画像データを分類するために付与された識別子を記憶し、最初に入力された画像データの後に順次入力された画像データに対して、該画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定する。これにより、電子データ又は電子化データについても、所定の分類数に分類できない原稿（又は画像データ）がある場合であっても、分類できた画像データと分類できない画像データとを順次区別することができる。

また、本発明にあっては、記憶された識別子の数が所定数に達しない場合、投票で得られた得票数に基づいて画像の類似度を算出し、算出された画像の類似度に基づいて、順次読み取られた原稿（又は順次入力された画像データ）に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することにより、所定の分類数に応じて原稿（又は画像データ）を分類することができる。

また、本発明にあっては、非類似として分類された原稿（又は画像データ）がある場合、記憶された特徴量及び識別子を消去するとともに、非類似として分類された原稿（又は画像データ）を再度順次読み取り（又は順次入力し）、最初に読み取られた原稿の画像（又は最初に入力された画像データ）の特徴量及び該原稿（又は画像データ）を分類するために付与された識別子を記憶し、最初に読み取られた原稿（又は最初に入力された画像データ）の後に順次読み取られた原稿（又は順次入力された画像データ）に対して、該原稿の画像（又は画像データ）の特徴量と記憶された識別子で分類された原稿の画像（又は画像データ）の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で獲られた得票数に基づいて、前記順次読み取られた原稿（又は順次入力された画像データ）に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像（又は画像データ）の特徴量及び該識別子を記憶する処理を少なくとも１回繰り返すことにより、一旦非類似として分類された原稿（又は画像データ）であっても、該原稿（又は画像データ）の中でお互いに類似する原稿（又は画像データ）を再度分類することができる。

また、本発明にあっては、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与することにより、所定の分類数で原稿を分類することができる。

また、本発明にあっては、分類毎に原稿の排出位置を変位する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる。

また、本発明にあっては、分類毎に原稿を異なる排出トレイに排出する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる。

また、本発明にあっては、順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する。このとき、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく決定する。決定された分類毎に原稿を分類して排出する分類排出手段を備えることにより、所定の分類数の範囲内で原稿自身を分類することができる。

実施の形態１
以下、本発明を実施の形態を示す図面に基づいて説明する。図１は本発明に係る画像処理装置を備える画像形成装置１００の構成を示すブロック図である。画像形成装置１００（例えば、デジタルカラー複写機や複合機能、プリンタ機能、ファックスや電子メール配信機能を備えた複合機）は、カラー画像入力装置１、カラー画像処理装置２（画像処理装置）、画像形成手段としてのカラー画像出力装置３、各種操作を行うための操作パネル４などを備える。カラー画像入力装置１で原稿を読み取ることにより得られたＲＧＢ（Ｒ：赤、Ｇ：緑、Ｂ：青）のアナログ信号の画像データは、カラー画像処理装置２へ出力され、カラー画像処理装置２で所定の処理が行われ、ＣＭＹＫ（Ｃ：シアン、Ｍ：マゼンタ、Ｙ：イエロー、Ｋ：黒）のデジタルカラー信号としてカラー画像出力装置３へ出力される。

カラー画像入力装置１は、例えば、ＣＣＤ（Charged Coupled Device）を備えたスキャナであり、原稿画像からの反射光像をＲＧＢのアナログ信号として読み取り、読み取ったＲＧＢ信号をカラー画像処理装置２へ出力する。また、カラー画像出力装置３は、原稿画像の画像データを記録紙上に出力する電子写真方式やインクジェット方式などを用いた画像形成手段である。また、カラー画像出力装置３は、ディスプレイ等の表示装置であってもよい。

カラー画像処理装置２は、後述する各処理部を備え、ＡＳＩＣ（Application Specific Integrated Circuit）などにより構成される。

Ａ／Ｄ変換部２０は、カラー画像入力装置１から入力されたＲＧＢ信号を、例えば、１０ビットのデジタル信号に変換し、変換後のＲＧＢ信号をシェーディング補正部２１へ出力する。

シェーディング補正部２１は、入力されたＲＧＢ信号に対して、カラー画像入力装置１の照明系、結像系、撮像系などで生じた各種の歪みを取り除く補正処理を行う。また、シェーディング補正部２１は、濃度信号などカラー画像処理装置２で採用されている画像処理システムが扱い易い信号に変換する処理を行うとともにカラーバランスを整える処理を行い、補正後のＲＧＢ信号を文書照合処理部２２へ出力する。

文書照合処理部２２は、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点（例えば、重心）を算出し、算出した特徴点の中から複数の特徴点を選択し、選択した特徴点に基づいて不変量としての特徴量（例えば、ハッシュ値）を算出する。文書照合処理部２２は、算出した特徴量に基づいて画像が類似するか否かを判定し、類似する画像に対応する原稿同士を１つのカテゴリに分類し、分類信号を出力する。また、文書照合処理部２２は、入力されたＲＧＢ信号をそのまま後段の入力階調補正部２３へ出力する。

入力階調補正部２３は、下地濃度の除去又はコントラストなど画質調整処理を施し、処理後のＲＧＢ信号を領域分離処理部２４へ出力する。

領域分離処理部２４は、入力されたＲＧＢ信号に基づき、入力された画像中の各画素が、文字領域、網点領域、写真領域の何れであるかを分離する。領域分離処理部２４は、分離結果に基づいて、各画素がどの領域に属しているかを示す領域識別信号を黒生成下色除去部２６、空間フィルタ処理部２７、階調再現処理部２９へ出力する。また、領域分離処理部２４は、入力されたＲＧＢ信号をそのまま後段の色補正部２５へ出力する。

色補正部２５は、入力されたＲＧＢ信号をＣＭＹの色空間に変換し、カラー画像出力装置３の特性に合わせて色補正を行い、補正後のＣＭＹ信号を黒生成下色除去部２６へ出力する。具体的には、色補正部２５は、色再現の忠実化のため、不要吸収成分を含むＣＭＹ色材の分光特性に基づいた色濁りを取り除く処理を行う。

黒生成下色除去部２６は、色補正部２５から入力されたＣＭＹ信号に基づいて、Ｋ（黒）信号を生成するとともに、入力されたＣＭＹ信号からＫ信号を差し引いて新たなＣＭＹ信号を生成し、生成したＣＭＹＫ信号を空間フィルタ処理部２７へ出力する。

黒生成下色除去部２６における処理の一例を示す。例えば、スケルトンブラックによる黒生成を行う処理の場合、スケルトンカーブの入出力特性をｙ＝ｆ（ｘ）とし、入力されるデータをＣ、Ｍ、Ｙとし、出力されるデータをＣ′、Ｍ′、Ｙ′、Ｋ′とし、ＵＣＲ（Under Color Removal）率をα（０＜α＜１）とすると、黒生成下色除去処理により出力
されるデータ夫々は、Ｋ′＝ｆ｛ｍｉｎ（Ｃ、Ｍ、Ｙ）｝、Ｃ′＝Ｃ−αＫ′、Ｍ′＝Ｍ−αＫ′、Ｙ′＝Ｙ−αＫ′で表される。

空間フィルタ処理部２７は、黒生成下色除去部２６から入力されたＣＭＹＫ信号に対して、領域識別信号に基づいたデジタルフィルタによる空間フィルタ処理を行う。これにより、画像データの空間周波数特性が補正され、カラー画像出力装置３における出力画像のぼやけ、又は粒状性劣化を防止する。例えば、空間フィルタ処理部２７は、領域分離処理部２４において文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、鮮鋭強調処理を施し高周波成分を強調する。また、空間フィルタ処理部２７は、領域分離処理部２４において網点領域に分離された領域を、入力網点成分を除去するためのローパス・フィルタ処理を施す。空間フィルタ処理部２７は、処理後のＣＭＹＫ信号を出力階調補正部２８へ出力する。

出力階調補正部２８は、空間フィルタ処理部２７から入力されたＣＭＹＫ信号に対して、カラー画像出力装置３の特性値である網点面積率に変換する出力階調補正処理を行い、出力階調補正処理後のＣＭＹＫ信号を階調再現処理部２９へ出力する。

階調再現処理部２９は、領域分離処理部２４から入力された領域識別信号に基づいて、出力階調補正部２８から入力されたＣＭＹＫ信号に対して所定の処理を行う。例えば、階調再現処理部２９は、文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、カラー画像出力装置３における高周波成分の再現に適するように二値化処理又は多値化処理を行う。

また、階調再現処理部２９は、領域分離処理部２４において網点領域に分離された領域を、最終的に画像を画素に分離して、それぞれの階調を再現できるように階調再現処理（中間調生成）を行う。さらに、階調再現処理部２９は、領域分離処理部２４において写真領域に分離された領域を、カラー画像出力装置３における階調再現性に適するように二値化処理又は多値化処理を行う。

カラー画像処理装置２は、階調再現処理部２９で処理された画像データ（ＣＭＹＫ信号）を記憶部（不図示）に一旦記憶し、画像形成をする所定のタイミングで記憶部に記憶した画像データを読み出し、読み出した画像データをカラー画像出力装置３へ出力する。これらの制御は、例えば、ＣＰＵ（不図示）により行われる。

図２は文書照合処理部２２の構成を示すブロック図である。文書照合処理部２２は、特徴点算出部２２１、特徴量算出部２２２、投票処理部２２３、類似度判定処理部２２４、メモリ２２５、前記各部を制御する制御部２２６などを備えている。

特徴点算出部２２１は、入力された画像（画像データ）に対して後述する所定の処理を行うとともに、入力画像を二値化し、二値画像に基づいて特定された連結領域の特徴点（例えば、連結領域を構成する各画素の二値画像における座標値を累積加算し、累積加算した座標値を連結領域に含まれる画素数で除算した値）を抽出（算出）し、抽出した特徴点を特徴量算出部２２２へ出力する。

図３は特徴点算出部２２１の構成を示すブロック図である。特徴点算出部２２１は、無彩化処理部２２１０、解像度変換部２２１１、フィルタ処理部２２１２、二値化処理部２２１３、重心算出部２２１４などを備えている。

無彩化処理部２２１０は、入力された画像（画像データ）がカラー画像である場合、カラー画像を無彩化して、輝度信号又は明度信号に変換し、変換後の画像を解像度変換部２２１１へ出力する。例えば、輝度信号Ｙは、各画素ＲＧＢの色成分を夫々Ｒｊ、Ｇｊ、Ｂｊとし、各画素の輝度信号をＹｊとして、Ｙｊ＝０．３０×Ｒｊ＋０．５９×Ｇｊ＋０．１１×Ｂｊで表すことができる。なお、上式に限らず、ＲＧＢ信号をＣＩＥ１９７６Ｌ* ａ* ｂ* 信号に変換することもできる。

解像度変換部２２１１は、入力された画像がカラー画像入力装置１で光学的に変倍された場合であっても、所定の解像度になるように入力された画像を再度変倍し、変倍された画像をフィルタ処理部２２１２へ出力する。これにより、カラー画像入力装置１で変倍処理が行われ解像度が変化した場合であっても、その影響を受けることなく特徴点の抽出を行うことができ、精度良く原稿を分類することができる。特に、縮小された文字などの場合、二値化処理を行って連結領域を特定するとき、文字が潰れているために本来離れている領域が繋がった状態で特定され、算出される重心がずれる虞を防止できる。また、解像度変換部２２１１は、カラー画像入力装置１で等倍時に読み込まれる解像度よりも小さい解像度に変換する。例えば、カラー画像入力装置１において６００ｄｐｉ（dot per inch）で読み込まれた画像を３００ｄｐｉに変換する。これにより、後段における処理量を低減することができる。

フィルタ処理部２２１２は、入力された画像が有する空間周波数特性を補正し（例えば、画像の強調化処理及び平滑化処理など）、補正後の画像を二値化処理部２２１３へ出力する。フィルタ処理部２２１２は、カラー画像入力装置１の空間周波数特性が機種ごとに異なるため、異なる空間周波数特性を所要の特性に補正する。カラー画像入力装置１が出力する画像（例えば、画像信号）には、レンズ又はミラーなどの光学系部品、ＣＣＤの受光面のアパーチャ開口度、転送効率、残像、物理的な走査による積分効果及び走査むら等に起因して画像のぼけなどの劣化が生ずる。フィルタ処理部２２１２は、境界又はエッジなどの強調処理を行うことにより、画像に生じたぼけなどの劣化を修復する。また、フィルタ処理部２２１２は、後段で処理される特徴点の抽出処理に不要な高周波成分を抑制するための平滑化処理を行う。これにより、特徴点を精度良く抽出することができ、結果として画像の類似度の判定を精度良く行うことが可能となる。なお、フィルタ処理部２２１２で使用するフィルタ係数は、使用されるカラー画像入力装置１の機種又は特性などに応じて適宜設定することができる。

二値化処理部２２１３は、入力された画像の輝度値（輝度信号）又は明度値（明度信号）を閾値と比較することにより画像を二値化し、二値化した二値画像を重心算出部２２１４へ出力する。

重心算出部２２１４は、二値化処理部２２１３から入力された二値画像の各画素の二値化情報（例えば、「１」、「０」で表される）に基づいて、各画素に対してラベリング（ラベル付け処理）を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点を特徴量算出部２２２へ出力する。なお、特徴点は、二値画像における座標値（ｘ座標、ｙ座標）で表すことができる。

図４は連結領域の特徴点の例を示す説明図である。図において、特定された連結領域は、文字「Ａ」であり、同一ラベルが付された画素の集合として特定される。この文字「Ａ」の特徴点（重心）は、図中黒丸で示される位置（ｘ座標、ｙ座標）となる。

図５は文字列に対する特徴点の抽出結果の例を示す説明図である。複数の文字から構成される文字列の場合、文字の種類により夫々異なる座標を有する特徴点が複数抽出される。

特徴量算出部２２２は、特徴点算出部２２１から入力された特徴点（すなわち、連結領域の重心の座標値）夫々を注目特徴点とし、例えば、注目特徴点からの距離が小さい順に周辺の他の特徴点を４つ抽出する。

図６は注目特徴点と周辺の特徴点を示す説明図である。図に示すように、注目特徴点Ｐ１に対して、例えば、閉曲線Ｓ１で囲まれる４つの特徴点を抽出する（注目特徴点Ｐ１に対しては、注目特徴点Ｐ２も１つの特徴点として抽出されている）。また、注目特徴点Ｐ２に対して、例えば、閉曲線Ｓ２で囲まれる４つの特徴点を抽出する（注目特徴点Ｐ２に対しては、注目特徴点Ｐ１も１つの特徴点として抽出されている）。

特徴量算出部２２２は、抽出した４つの特徴点の中から３つの特徴点を選択して、不変量を算出する。なお、選択する特徴点は３つに限られるものではなく、４つ、５つなどの特徴点を選択することもできる。求めたい不変量の種類によって選択すべき特徴点の数が異なる。例えば、３点から求められる不変量は相似不変量となる。

図７は注目特徴点Ｐ１による不変量の算出例を示す説明図であり、図８は注目特徴点Ｐ２による不変量の算出例を示す説明図である。図７に示すように、注目特徴点Ｐ１の周辺の４つの特徴点から３つの特徴点を選択し、３通りの不変量夫々をＨ１ｊ（ｊ＝１、２、３）とする。不変量Ｈ１ｊは、Ｈ１ｊ＝（Ａ１ｊ／Ｂ１ｊ）で表される式で算出する。ここで、Ａ１ｊ、Ｂ１ｊ夫々は特徴点間の距離を示している。これにより、例えば、原稿が回転、移動、傾いた場合であっても、不変量Ｈ１ｊは変化せず、画像の類似度の判定を精度良く行うことができ、類似する原稿を精度良く分類することができる。

同様に、図８に示すように、注目特徴点Ｐ２の周辺の４つの特徴点から３つの特徴点を選択し、３通りの不変量夫々をＨ２ｊ（ｊ＝１、２、３）とする。不変量Ｈ２ｊは、Ｈ２ｊ＝（Ａ２ｊ／Ｂ２ｊ）で表される式で算出する。ここで、Ａ２ｊ、Ｂ２ｊ夫々は特徴点間の距離を示している。以下同様に、他の注目特徴点に対して不変量を算出することができる。

特徴量算出部２２２は、夫々の注目特徴点により算出された不変量に基づいて、ハッシュ値（特徴量）Ｈｉを算出する。注目特徴点Ｐｉのハッシュ値Ｈｉは、Ｈｉ＝（Ｈｉ１×１０²＋Ｈｉ２×１０¹ ＋Ｈｉ３×１０⁰）／Ｅで表される。ここで、Ｅは余りをどの程度設定するかにより決定される定数であり、例えば、「１０」とした場合には、余りは「０」〜「９」となり、これが算出するハッシュ値の取り得る範囲となる。また、ｉは自然数であり特徴点の数を表している。

図９は注目特徴点Ｐ３による不変量の算出の他の例を示す説明図であり、図１０は注目特徴点Ｐ４による不変量の算出の他の例を示す説明図である。図９に示すように、注目特徴点Ｐ３の周辺特徴点Ｐ１、Ｐ２、Ｐ４、Ｐ５の４点より４通りの組み合わせを選択し、不変量Ｈ３ｊ（ｊ＝１、２、３、４）を前述の場合と同様に、Ｈ３ｊ＝（Ａ３ｊ／Ｂ３ｊ）により算出してもよい。

また、図１０に示すように、注目特徴点Ｐ４の周辺特徴点Ｐ２、Ｐ３、Ｐ５、Ｐ６の４点より４通りの組み合わせを選択し、不変量Ｈ４ｊ（ｊ＝１、２、３、４）を前述の場合と同様に、Ｈ４ｊ＝（Ａ３ｊ／Ｂ３ｊ）により算出してもよい。図９及び図１０の例の場合、注目特徴点Ｐｉのハッシュ値Ｈｉは、Ｈｉ＝（Ｈｉ１×１０³＋Ｈｉ２×１０²＋Ｈｉ３×１０¹＋Ｈｉ４×１０⁰）／Ｅで算出することができる。なお、特徴量としての上記ハッシュ値は一例であって、これに限定されるものではなく、他のハッシュ関数を用いることができる。上記では、周辺の他の特徴点として４点を抽出する例を示しているが、４点に限定されるものではない。例えば、６点抽出するようにしても良い。この場合、６点の特徴点から５点を抽出し、５点を抽出する６通りそれぞれの方法について、５点から３点を抽出して不変量を求め、ハッシュ値を算出するようにしても良い。

特徴量算出部２２２は、複数の原稿が順次読み取られた場合、最初の原稿を読み取って得られた画像に対して、上述の各処理を行ってハッシュ値を算出し、算出したハッシュ値（例えば、Ｈ１、Ｈ２、…）と原稿を表すインデックス（例えば、ＩＤ１）をハッシュテーブルに登録する。

また、特徴量算出部２２２は、最初の原稿の後に順次読み取られた原稿の画像に対しても、同様に上述の各処理を行ってハッシュ値を算出し、類似度判定処理部２２４が行う原稿の分類処理（すなわち、順次読み取られる原稿を原稿のカテゴリ毎に分類する処理）において、新たなカテゴリに原稿を分類する場合、その原稿を表すインデックス（例えば、ＩＤ２、ＩＤ３、…）をハッシュテーブルに登録する。

これにより、複数の原稿を読み取る都度ハッシュテーブルは初期化されるとともに、最初に読み取られた原稿の画像に基づいて算出されたハッシュ値とその原稿を表すインデックスをハッシュテーブルに登録し、この登録されたハッシュ値及び原稿を表すインデックスをもとに順次ハッシュテーブルを更新するため、予め種々の原稿のフォーマット情報に相当するハッシュ値をハッシュテーブルに登録しておく必要がなく、記憶容量を削減することができる。

図１１はハッシュテーブルの構造を示す説明図である。図に示すように、ハッシュテーブルの構造は、ハッシュ値及び原稿を表すインデックスの各欄により構成されている。より具体的には、原稿を示すインデックスに対応して、原稿中の位置を示すポイントインデックス、及び不変量（いずれも不図示）が登録されている。画像の類似度を判定するため、予め照合する画像・文書画像などをハッシュテーブルに登録しておく。ハッシュテーブルはメモリ２２５に記憶してある。なお、図１１（ｂ）に示すように、ハッシュ値が等しい場合（Ｈ１＝Ｈ５）、ハッシュテーブルの２つのエントリを１つにまとめることもできる。

投票処理部２２３は、複数の原稿を読み取る都度、最初に読み取られた原稿の後に順次読み取られた原稿の画像に対して、特徴量算出部２２２が算出したハッシュ値（特徴量）に基づいて、メモリ２２５に記憶されたハッシュテーブルを検索し、ハッシュ値が一致する場合、該ハッシュ値に登録されている原稿を表すインデックス（すなわち、一致するハッシュ値が算出された画像）に投票する。投票を累積加算した結果を得票数として類似度判定処理部２２４へ出力する。

類似度判定処理部２２４は、複数の原稿を読み取る都度、最初に読み取られた原稿の画像に対して抽出された特徴点の数と１つの特徴点から算出され得るハッシュ値とを乗算して得られる最大得票数（例えば、Ｍ１）、原稿を表すインデックス（例えば、ＩＤ１）、原稿のカテゴリ（例えば、Ｃ１）をカテゴリテーブルに登録する。

類似度判定処理部２２４は、複数の原稿を読み取る都度、最初に読み取られた原稿の後に順次読み取られた原稿の画像に対して、投票処理部２２３から入力された投票結果に基づいて、原稿（画像、文書画像）の類似度を判定し、判定結果（分類信号）を出力する。より具体的には、類似度判定処理部２２４は、投票処理部２２３から入力された得票数を原稿毎の最大得票数で得票数を除算して正規化した類似度を算出し、算出した類似度と予め定めた閾値（例えば、０．８）とを比較し、類似度が閾値以上である場合、その類似度が算出された原稿の画像に類似すると判定し、その原稿のカテゴリに分類する（すなわち、原稿のカテゴリを付与する）。

また、類似度判定処理部２２４は、複数の原稿を読み取る都度、最初に読み取られた原稿の後に順次読み取られた原稿の画像に対して、算出した類似度と予め定めた閾値（例えば、０．８）とを比較し、類似度が閾値より小さい場合には、カテゴリテーブルに登録された原稿の画像に類似しないと判定し、原稿を表すインデックス（例えば、ＩＤ２、ＩＤ３、…）、最大得票数（例えば、Ｍ２、Ｍ３、…）、新たなカテゴリ（例えば、Ｃ２、Ｃ３、…）をカテゴリテーブルに登録する。

これにより、複数の原稿を読み取る都度カテゴリテーブルは初期化されるとともに、最初に読み取られた原稿の画像に基づいて算出された最大得票数、原稿を表すインデックス及び原稿のカテゴリをカテゴリテーブルに登録し、最初に読み取られた原稿の後に順次読み取られた原稿に対して、新たなカテゴリに分類する場合には、最大得票数、原稿を表すインデックス及び原稿のカテゴリ（新たに付与されたカテゴリ）を追加する。

図１２はカテゴリテーブルの構造を示す説明図である。図に示すように、カテゴリテーブルの構造は、原稿を表すインデックス、最大得票数、カテゴリの各欄により構成されている。

原稿のカテゴリの数、すなわち分類数Ｓは、予めその最大値（例えば、３、４、…など）が設定されてあり、操作パネル４でユーザがその最大値の範囲内で分類数Ｓを指定するようにしてある。

類似度判定処理部２２４は、原稿を分類する場合、カテゴリの数が分類数Ｓを超えたときには、投票処理部２２３から入力された得票数のうち、最も得票数が多い原稿のカテゴリに分類する。これにより、読み取られた原稿を分類数Ｓの範囲内で分類することができる。なお、カテゴリの数が分類数Ｓを超えた場合、算出された類似度が閾値より小さいときには、分類された原稿のいずれにも類似しないと判定し、非類似として分類することもできる。これにより、非類似として分類された原稿を再度読み取ることにより、一旦非類似として分類された原稿であっても、該原稿の中でお互いに類似する原稿を再度分類することができる。

類似度判定処理部２２４から出力される分類信号に基づいて、順次読み取られた原稿は、そのカテゴリ毎に仕分けされて排出される。例えば、原稿がカテゴリＣ１、Ｃ２、Ｃ３の３通りに分類された場合、順次読み取った原稿をその都度分類し、カテゴリ毎に対応する分類信号を出力することにより、排出される原稿を３通りに仕分けて排出する。

次に文書照合処理部２２の動作について説明する。一例として、４枚の原稿を順次読み取る場合について説明するが、原稿の枚数はこれに限定されるものではない。また、分類数Ｓを「３」として説明するが、分類数Ｓはこれに限定されるものではない。

図１３は最初の原稿を読み取った場合のハッシュテーブル及びカテゴリテーブルの例を示す説明図であり、図１４は２枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図であり、図１５は３枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図であり、図１６は４枚目の原稿を読み取った場合の得票数の例を示す説明図である。

図１３（ａ）に示すように、最初の原稿を読み取ることにより、ハッシュテーブルにハッシュ値（Ｈ１、Ｈ２、Ｈ３、…）及び原稿を表すインデックスＩＤ１が登録される。この場合、算出され得るハッシュ値（Ｈ１、Ｈ２、Ｈ３、…）のうち、最初の原稿（原稿を表すインデックスＩＤ１）の画像に基づいて実際に算出されるハッシュ値（図では、Ｈ１、Ｈ２、Ｈ３、Ｈ５）に対応する欄に原稿を表すインデクッスＩＤ１が登録される。

また、図１３（ｂ）に示すように、最初の原稿を読み取ることにより、原稿を表すインデックスＩＤ１、最大得票数Ｍ１、カテゴリＣ１が夫々登録される。最大得票数Ｍ１は、原稿ＩＤ１の画像から抽出される特徴点の数と１つの特徴点から算出され得るハッシュ値の数との乗算値である。

図１４（ａ）に示すように、２枚目の原稿を読み取ることにより、読み取って得られた画像に基づいて算出されたハッシュ値に基づいて、ハッシュテーブルを検索し、ハッシュ値が一致する場合、一致するハッシュ値に登録されているインデックス（この場合は、ＩＤ１）の原稿について投票し、投票を累積加算した結果を得票数Ｎ２１として算出する。なお、得票数Ｎｋｌにおいて、ｋは読み取る原稿が何枚目であるかを示し、ｌはハッシュテーブルに登録されている原稿を表すインデックスＩＤｌに相当する。

得票数Ｎ２１により、類似度Ｒ２１をＲ２１＝Ｎ２１／Ｍ１を算出し、類似度Ｒ２１が所定の閾値（例えば、０．８）以上であるか否かを判定する。類似度Ｒ２１が閾値より小さい場合には、読み取った原稿がカテゴリＣ１には類似しないとして、図１４（ｂ）に示すように、投票されたハッシュ値に対応して原稿を表すインデックスＩＤ２が更新される。また、図１４（ｃ）に示すように、新たなカテゴリＣ２を設定し、原稿を表すインデックスＩＤ２、最大得票数Ｍ２、カテゴリＣ２をカテゴリテーブルに登録する。

類似度Ｒ２１が閾値以上である場合には、読み取った原稿がカテゴリＣ１に類似するとしてカテゴリＣ１に分類する。この場合には、ハッシュテーブル、カテゴリテーブルに対する登録は行わない。なお、図１４では、２枚目の原稿が最初の原稿に類似しないとして説明している。

図１５（ａ）に示すように、３枚目の原稿を読み取ることにより、読み取って得られた画像に基づいて算出されたハッシュ値に基づいて、ハッシュテーブルを検索し、ハッシュ値が一致する場合、一致するハッシュ値に登録されているインデックス（この場合は、ＩＤ１、ＩＤ２）の原稿について投票し、投票を累積加算した結果を得票数Ｎ３１、Ｎ３２として算出する。なお、得票数Ｎｋｌにおいて、ｋは読み取る原稿が何枚目であるかを示し、ｌはハッシュテーブルに登録されている原稿を表すインデックスＩＤｌに相当する。

得票数Ｎ３１により、類似度Ｒ３１をＲ３１＝Ｎ３１／Ｍ１を算出し、得票数Ｎ３２により、類似度Ｒ３２をＲ３２＝Ｎ３２／Ｍ１を算出し、類似度Ｒ３１、Ｒ３２夫々が所定の閾値（例えば、０．８）以上であるか否かを判定する。類似度Ｒ３１、Ｒ３２が閾値より小さい場合には、読み取った原稿がカテゴリＣ１、Ｃ２のいずれにも類似しないとして、図１５（ｂ）に示すように、投票されたハッシュ値に対応して原稿を表すインデックスＩＤ３が更新される。また、図１５（ｃ）に示すように、新たなカテゴリＣ３を設定し、原稿を表すインデックスＩＤ３、最大得票数Ｍ３、カテゴリＣ３をカテゴリテーブルに登録する。

類似度Ｒ３１、Ｒ３２のいずれかが閾値以上である場合には、読み取った原稿がカテゴリＣ１又はＣ２に類似するとしてカテゴリＣ１又はＣ２に分類する。この場合には、ハッシュテーブル、カテゴリテーブルに対する登録は行わない。なお、類似度Ｒ３１、Ｒ３２の両者が閾値以上である場合には、大きい方の類似度を採用することができる。また、図１５では、３枚目の原稿が先に分類されたいずれの原稿にも類似しないとして説明している。

図１６に示すように、４枚目の原稿を読み取ることにより、読み取って得られた画像に基づいて算出されたハッシュ値に基づいて、ハッシュテーブルを検索し、ハッシュ値が一致する場合、一致するハッシュ値に登録されているインデックス（この場合は、ＩＤ１、ＩＤ２、ＩＤ３）の原稿について投票し、投票を累積加算した結果を得票数Ｎ４１、Ｎ４２、Ｎ４３として算出する。この場合、すでにカテゴリがＣ１、Ｃ２、Ｃ３と分類数Ｓである３に達しているため、読み取った原稿を、算出された得票数のうち最も大きい得票数（この場合、Ｎ４３）が算出された原稿ＩＤ３、すなわち、カテゴリＣ３に分類する。これにより、読み取られる原稿の枚数に拘わらず、所定の分類数で原稿を分類することができる。

図１７乃至図１９はカラー画像処理装置２（以下、処理部という）の原稿分類処理の手順を示すフローチャートである。なお、原稿分類処理は、専用のハードウエア回路で構成するだけでなく、ＣＰＵ、ＲＡＭ、ＲＯＭなどを備えたパーソナルコンピュータに、原稿分類処理の手順を定めたコンピュータプログラムをロードすることによりＣＰＵでコンピュータプログラムを実行させることにより行うこともできる。

処理部は、ユーザからの操作の有無を判定し（Ｓ１１）、操作がない場合（Ｓ１１でＮＯ）、ステップＳ１１の処理を続け、ユーザからの操作があるまで待機する。ユーザからの操作があった場合（Ｓ１１でＹＥＳ）、処理部は、分類数の指定の有無を判定する（Ｓ１２）。

分類数の指定がある場合（Ｓ１２でＹＥＳ）、処理部は、指定された分類数を分類数Ｓとし（Ｓ１３）、原稿のカテゴリの数を示す指標Ｗを１に、処理回数を示す回数Ｎを１に設定する（Ｓ１５）。分類数の指定がない場合（Ｓ１２でＮＯ）、処理部は、デフォルトの分類数を分類数Ｓとし（Ｓ１４）、ステップＳ１５の処理を続ける。

処理部は、ハッシュテーブル、カテゴリテーブルを初期化し（Ｓ１６）、原稿を読み取る（Ｓ１７）。処理部は、原稿を読み取って得られた画像に基づいて、特徴点を算出し（Ｓ１８）、算出した特徴点に基づいてハッシュ値（特徴量）を算出する（Ｓ１９）。処理部は、Ｎが１であるか否かを判定し（Ｓ２０）、Ｎが１であると判定した場合（Ｓ２０でＹＥＳ）、算出したハッシュ値に基づいて、ハッシュテーブルに原稿を表すインデックスを登録する（Ｓ２１）。

処理部は、カテゴリテーブルに原稿を表すインデックス、最大得票数、カテゴリを登録し（Ｓ２２）、すべての原稿の読み取りが終了したか否かを判定する（Ｓ２３）。すべての原稿の読み取りが終了していない場合（Ｓ２３でＮＯ）、処理部は、処理回数を示す回数Ｎに１を加算し（Ｓ２４）、新たな処理回数として、ステップＳ１７以降の処理を続ける。

一方、ステップＳ２０で、Ｎが１でないと判定した場合（Ｓ２０でＮＯ）、処理部は、投票処理を行い（Ｓ２５）、類似度を算出する（Ｓ２６）。処理部は、Ｗが分類数Ｓに等しいか否かを判定し（Ｓ２７）、Ｗが分類数Ｓに等しい場合（Ｓ２７でＹＥＳ）、読み取った原稿を得票数が最大の原稿のカテゴリに分類し（Ｓ２８）、ステップＳ２３以降の処理を続ける。

Ｗが分類数Ｓに等しくない場合（Ｓ２７でＮＯ）、処理部は、算出した類似度が閾値以上であるか否かを判定し（Ｓ２９）、類似度が閾値以上である場合（Ｓ２９でＹＥＳ）、読み取った原稿を類似度が大きい原稿のカテゴリに分類し（Ｓ３０）、ステップＳ２３以降の処理を続ける。類似度が閾値以上でない場合（Ｓ２９でＮＯ）、処理部は、Ｗに１を加算し（Ｓ３１）、ステップＳ２１以降の処理を続ける。すべての原稿の読み取りが終了した場合（Ｓ２３でＹＥＳ）、処理部は、処理を終了する。

なお、文書照合処理部２２における上述の処理は、原稿を順次読み取って原稿を分類する場合に限定されるものではなく、順次入力された画像データを分類する場合も同様に行うことができる。

図２０は本発明に係る原稿読取装置５００の構成を示すブロック図である。図に示すように、原稿読取装置５００は、カラー画像入力装置１、Ａ／Ｄ変換部２０、シェーディング補正部２１、文書照合処理部２２、原稿シフター機構５０などを備えている。カラー画像入力装置１、Ａ／Ｄ変換部２０、シェーディング補正部２１、文書照合処理部２２は、上述の画像形成装置１００の場合と同様であるので説明は省略する。

原稿シフター機構５０は、文書照合処理部２２から出力される分類信号を取得し、順次読み取った原稿を分類信号に応じて分類して排出する。詳細は後述する。

図２１は本発明に係る原稿読取装置５００の構成を示す模式図である。原稿読取装置５００は、上部筐体５１０で構成される原稿搬送部、下部筐体５６０で構成されるスキャナ部などを備える。

上部筐体５１０には、原稿トレイ５１１に載置された原稿を１枚ずつ搬送するための呼込みローラ５１２、原稿上の画像を読み取るために原稿を搬送する搬送ローラ５１３ａ、５１３ｂ、原稿を排出する際に、文書照合処理部２２から入力される分類信号に基づいて、原稿のカテゴリ毎に原稿を搬送方向（排出方向）に対して排出位置をシフトさせる原稿シフター機構５０、排出される原稿を検知する原稿排出センサ５６７などを設けている。なお、原稿シフター機構５０は、上下２つに分離することができるように構成されている。

下部筐体５６０には、載置台５６１の下面に沿って平行に往復移動する走査ユニット５６２、５６３、結像レンズ５６４、及び光電変換素子であるＣＣＤラインセンサ５６５、原稿シフター機構５０、排出トレイ５６６などが設けてある。走査ユニット５６２は、原稿トレイ５１１から搬送される原稿、あるいは、載置台５６１に載置された原稿に光を照射するための光源５６２ａ（例えば、ハロゲンランプなど）、原稿で反射された光を所定の光路に導くためのミラー５６２ｂなどを備えている。また、走査ユニット５６３は、原稿で反射された光を所定の光路に導くためのミラー５６３ａ、５６３ｂなどを備えている。

結像レンズ５６４は、走査ユニット５６３から導かれた反射光をＣＣＤラインセンサ５６５上の所定の位置に結像させる。ＣＣＤラインセンサ５６５は、結像された光像を光電変換して電気信号を出力する。すなわち、原稿（例えば、原稿の表面）から読み取ったカラー画像に基づいて、Ｒ（赤）、Ｇ（緑）、Ｂ（青）の各色成分に色分解したデータをカラー画像処理装置２へ出力する。

図２２及び図２３は原稿シフター機構５０の構成を示す横断面図である。原稿シフター機構５０は、上下に分離可能な横断面が矩形状の筐体５１、５２を備え、筐体５１は下部筐体５６０に支持され、筐体５２は上部筐体５１０に支持されている。筐体５２には、オフセット部材６０、回転駆動源６５、駆動伝達部材７０、オフセット用駆動源７５、オフセット用駆動伝達部材８０などを設けてある。

オフセット部材６０は、水平方向（図中、Ｙ方向、すなわち原稿排出方向に直交する方向）に移動可能であり、筐体５２の内側に配置された横断面が矩形状の筐体６１、筐体６１の長手方向に沿って適長離隔したオフセットローラ６２、…などを備えている。オフセット部材６０は、水平方向に移動することにより、原稿をオフセット排出（原稿のカテゴリ毎に原稿を水平方向にシフトして排出）する。筐体６１は、原稿を搬送方向に排出するようにオフセットローラ６２、…を回転自在に支持する。オフセットローラ６２、…は、原稿を排出する際に原稿をチャックして排出トレイ５６６に排出する。

駆動伝達部材７０は、回転駆動源６５に接続された駆動ギア７１、駆動ギア７１の中央部に嵌合されたシャフト７２、シャフト７２上に配置された連結ギア７３ａ、スライド部材７４、連結ギア７３ａに螺合する連結ギア７３ｂなどを備え、連結ギア７３ｂの中央部には、棒状の支持部材６３を嵌合してあり、支持部材６３上には、適長離隔してオフセットローラ６２、…を固定してある。これにより、回転駆動源６５からの駆動力をオフセットローラ６２、…に伝達する。

シャフト７２は、水平方向に回転自在に支持され、スライド部材７４は、シャフト７２上を摺動することができる。また、シャフト７２は、スライド部材７４、連結ギア７３ａ、７３ｂを介してオフセット部材６０を原稿の排出（搬送）方向に直交する方向（水平方向）に移動させることができる。また、シャフト７２は、連結ギア７３ａ、７３ｂ、オフセット部材６０の水平方向の移動範囲を規制するため、スライド部材７４に設けられた軸方向に長い孔７４ａに係合する規制部材７２ａを設けている。規制部材７２ａが孔７４ａの内側に沿って移動する際に孔７４ａの両端部に当接することにより、連結ギア７３ａ、７３ｂ、オフセット部材６０の水平方向の移動範囲を規制する。

回転駆動源６５からの駆動力は、駆動ギア７１に伝わり、駆動ギア７１が回転することにより、シャフト７２が回転し、シャフト７２の回転に伴って、連結ギア７３ａ、７３ｂに回転が伝わり、連結ギア７３ｂの回転により支持部材６３が回転してオフセットローラ６２が回転する。オフセットローラ６２、…夫々に当接してオフセットローラ６２、…の回転に従動して回転するオフセットローラ６４、…が支持部材６３に並行に配置された支持部材６８上に配置してある。

上部筐体５１０、下部筐体５６０夫々に配置されたオフセット用駆動源７５、７５夫々には、ピニオンギア８１、ラックギア８２から構成されるオフセット用駆動伝達部材８０、８０を接続してあり、ラックギア８２、８２には、筐体６１、６１を固定してある。ピニオンギア８１の回転に応じて、ラックギア８２を水平方向（図中、Ｙ方向）に移動させる。これにより、ラックギア８２、８２は、筐体６１、６１を水平方向に移動させる。オフセット用駆動源７５、７５は、文書照合処理部２２から出力される分類信号に応じて同期して制御され、筐体６１、６１の水平方向に異なる位置に移動させる。これにより、オフセットローラ６２、…、及びオフセットローラ６４、…が同時に同じ方向にオフセット（シフト）されて原稿の排出位置が制御される。

図２３では図２２の場合に比較してオフセットローラ６２、…、及びオフセットローラ６４、…がオフセットされている。

図２４は原稿の排出位置を示す説明図である。図では、原稿を３つのカテゴリに分類する場合を示す。例えば、カテゴリＣ１、Ｃ２、Ｃ３に応じて、原稿の排出（搬送）方向に直交する方向（Ｙ方向）に原稿の排出位置をＹ１、Ｙ２、Ｙ３の如く、例えば、１インチ程度オフセット（シフト）させる。これにより、ユーザが多数の原稿を目視で分類する作業を行う必要がなくなり、原稿を原稿読取装置で読み取らせるだけで従来に比較して容易に原稿を分類することができる。なお、原稿のオフセット量（シフト量）は、１インチに限定されるものではない。

上述の実施の形態においては、複数の原稿を読み取る都度、ハッシュテーブル、カテゴリテーブルを初期化して、その内容を消去する構成であったが、これに限定されるものではなく、搭載するメモリの最大容量に応じて、登録された情報をすべて消去せずに残しておく構成とすることもできる。この場合には、所定の記憶容量を決めておき、古い情報から削除するようにしてメモリ容量が増大することを防止できる。また、この場合には、最初に読み取った原稿の画像に基づいてハッシュテーブル、カテゴリテーブルの登録を行う必要はなく、すでに記憶されているハッシュテーブル、カテゴリテーブルを用いて、最初に読み取られる原稿の画像に基づいて類似度を算出して原稿を分類することができる。

上述の実施の形態においては、分類したカテゴリの数が所定の分類数Ｓに達した場合、その後に順次読み取られる原稿は、得票数が最大の原稿のカテゴリに分類される構成であったが、これに限定されるものではない。例えば、分類したカテゴリの数が所定の分類数Ｓに達した場合、その後に順次読み取られる原稿は、類似度が閾値以上であれば、その原稿のカテゴリに分類し、類似度が閾値より小さい場合には、類似する原稿がない（非類似）として、まとめて分類するように構成することもできる。非類似として分類された原稿を再度読み取って、同様の処理を繰り返すことにより、一旦非類似として分類された原稿であっても、その原稿の中でお互いに類似する原稿を再度分類することができる。

上述の実施の形態においては、原稿の片面を読み取る構成であったが、これに限定されるものではなく、原稿の両面を読み取る構成にすることもできる。この場合、原稿の各面の画像の類似度夫々が閾値以上であるときに類似する原稿であると判定するように構成することができる。

上述の実施の形態においては、文書照合処理を原稿読取装置５００で行う構成であったが、これに限定されるものではなく、外部のパーソナルコンピュータで文書照合処理を行い、処理結果を原稿読取装置へ転送することにより、原稿を分類する構成にすることもできる。

実施の形態２
上述の実施の形態１では、原稿シフター機構を設ける構成を示したが、原稿シフター機構は、原稿を排出する際にオフセットする構成に限定されるものではなく、排出トレイを原稿の排出（搬送）方向に直交する方向に可動させるように構成してもよい。この場合、原稿シフター機構において原稿をシフトさせる必要はなく、原稿を排出（搬送）させる機構があればよい。

図２５は排出トレイを可動させる場合の原稿シフター機構３００の構成を示す模式図であり、図２６は原稿シフター機構３００の構成を示す横断面図である。原稿シフター機構３００は、原稿読取装置本体に固定される支持トレイ部材３０１及び支持トレイ部材３０１の上側に配置される可動トレイ部材３０２などを備えている。なお、原稿読取装置５００の構成については、実施の形態１と同様であるので、同一箇所には同一符号を付し、説明を省略する。

支持トレイ部材３０１の上面には、外形寸法よりやや小さい矩形状の凹部３０３を設けてあり、凹部３０３に収容される形で、金属製の二本の互いに略平行な棒状の案内シャフト３０４、３０５が適長離隔して取り付けられている。具体的には、案内シャフト３０４、３０５夫々は、支持トレイ部材３０１の側壁に形成された貫通孔３１０、３１１、３１２、３１３、凹部３０３の底面から適長離隔して立設された軸受３０６、３０７、３０８、３０９に挿通されるとともに、軸受３０６、３０７、３０８、３０９で支承されている。

凹部３０３中央部には、モータ、歯車列が内蔵された減速ギアボックス（不図示）、ピニオン３１４などを備える駆動ユニット（不図示）を設けてあり、モータの回転は、歯車列により減速されてピニオン３１４に伝達される。可動トレイ部材３０２の上面内側には、案内シャフト３０４、３０５と平行に配置され、ピニオン３１４と噛合するラック３１５が取り付けられている。ピニオン３１４が回転することにより、ラック３１５が案内シャフト３０４、３０５の軸方向に移動する。

また、可動トレイ部材３０２の側縁部には、側縁辺に沿って（原稿の搬送方向に沿って）突条部３１６、３１７が形成されてあり、各突条部３１６、３１７には、案内シャフト３０４、３０５の端部が挿入され案内シャフト３０４、３０５を支承する軸受３２０、３２１、３２２、３２３を設けてある。以上の構成により、モータを駆動してピニオン３１４が回転すると、ピニオン３１４の回転がラック３１５に伝達されて、可動トレイ部材３０２は案内シャフト３０４、３０５に案内されて支持トレイ部材３０１に対してシートの搬送方向に直交する方向（図中矢印方向）に移動する。なお、可動トレイ部材３０２を移動させる手段としては、ラック及びピニオン機構に限定されるものではなく、エンドレスベルト機構又はリニアモータなどの他の機構を用いることもできる。

原稿の排出（搬送）方向に直交する方向に可動トレイ部材３０２を移動させる場合、例えば、実施の形態１と同様に、１インチ程度移動させることができる。これにより、ユーザが多数の原稿を目視で分類する作業を行う必要がなくなり、原稿を原稿読取装置で読み取らせるだけで従来に比較して容易に原稿を分類することができる。なお、原稿のオフセット量（シフト量）は、１インチに限定されるものではない。

実施の形態３
上述の実施の形態１及び２では、原稿を排出する際にオフセットする構成であったが、原稿を分類する方法は、これに限定されるものではなく、排出トレイを複数設けておき、分類信号に応じて原稿を排出する排出トレイを切替える構成とすることもできる。

図２７は実施の形態３の原稿読取装置５０１の構成を示す模式図である。原稿搬送部５２０は、原稿トレイ５２１、回動可能であって原稿トレイ５２１に積層して載置された原稿を１枚ずつ搬送するための呼込みローラ５２２ａ及び捌きローラ５２２ｂ、搬送された原稿を排出トレイ５２７ａ、５２７ｂ、５２７ｃまで搬送するための搬送路５２５、搬送路５２５の中途に適宜設けられたレジストローラ５２４ａ、搬送ローラ５２４ｂ、及び排出ローラ５２４ｃなどを備える。

排出ローラ５２４ｃの下流側には、原稿を排出する排出トレイを切替えるためのゲート５２３ｂ、５２３ｄ（可撓性又は自重により下方向に位置する）、５２３ｃが設けられ、ゲート５２３ｄとゲート５２３ｃとの間には、搬送ローラ５２４ｄを配置している。原稿を排出する場合、分類信号に基づいて、ゲート５２３ｂ、５２３ｄ、５２３ｃを駆動して、カテゴリＣ１の原稿は排出トレイ５２７ａに排出し、カテゴリＣ２の原稿は排出トレイ５２７ｂに排出し、カテゴリＣ１、Ｃ２のいずれにも分類できない原稿は非類似として排出トレイ５２７ｃに排出する。

すなわち、カテゴリＣ１の原稿を排出する場合、ゲート５２３ｂを上方向に駆動することにより、原稿を排出トレイ５２７ａに排出する。また、カテゴリＣ２の原稿を排出する場合、ゲート５２３ｂを下方向に、ゲート５２３ｃを上方向に駆動することにより、原稿を排出トレイ５２７ｂに排出する。また、カテゴリＣ１、Ｃ２のいずれにも非類似として原稿を排出する場合、ゲート５２３ｂを下方向に、ゲート５２３ｃを下方向に駆動することにより、原稿を排出トレイ５２７ｃに排出する。なお、排出トレイの数を増加することにより、分類するカテゴリの数を増加することができる。

原稿トレイ５２１の原稿載置面には、原稿の有無を検出する原稿センサ５２１ａを設けている。原稿センサ５２１ａは、原稿トレイ５２１に載置された原稿がすべて搬送された場合、原稿が存在しないことを示す信号を出力する。これにより、原稿の搬送がすべて終了したか否かを判定することができる。

捌きローラ５２２ｂの下流側には、搬送路５２５と分離され、略１８０度湾曲した原稿搬送路５２６を設けている。原稿搬送路５２６の中途には、回動可能な原稿ローラ５２４ｅを設けてあり、原稿搬送路５２６に繋がるように排出トレイ５２７ｃが取付けられている。呼込みローラ５２２ａ、捌きローラ５２２ｂ、及び原稿ローラ５２４ｅは、ローラ駆動部（不図示）により、正回転及び反転回転する。

搬送路５２５と原稿搬送路５２６との分岐点には、ゲート駆動部（不図示）により揺動可能なゲート５２３ａが配置され、ゲート５２３ａが下方向に駆動されることにより、原稿トレイ５２１に載置された原稿は、搬送路５２５側に搬送される。一方、ゲート５２３ａが上方向に駆動されることにより、一旦排出トレイ５２７ｃに排出された原稿を原稿トレイ５２１へ搬送する。すなわち、本実施の形態においては、カテゴリＣ１、Ｃ２のいずれにも分類できない非類似原稿として排出トレイ５２７ｃに排出された原稿に対して、新たに原稿をセットすることなく、引き続き原稿の分類を行うことができる。

下部筐体で構成されるスキャナ部５６０は、実施の形態１及び２と同様であるので、同一箇所には同一符号を付して説明は省略する。

実施の形態４
実施の形態３では、原稿読取装置５０１に複数の排出トレイを内蔵する構成であったが、原稿を分類して排出する方法は、これに限定されるものではなく、他の構成であってもよい。例えば、排出トレイに代えて、複数段の排出トレイを備えたオプション機構を追加する構成であってもよい。

図２８は実施の形態４の原稿読取装置５０２の構成を示す模式図である。図に示すように、原稿を分類して排出するためのオプション機構５３０を設けている。オプション機構５３０は、排出トレイ５３４ａ、５３４ｂ、５３４ｃ、５３４ｄ、各排出トレイに分けて原稿を排出するため原稿の搬送路を切替えるゲート５３３、…、排出ローラ５３２、…などを備えている。なお、原稿の排出は、実施の形態２と同様であるので説明は省略する。

実施の形態５
上述の本発明を電子データ又は電子化データ等の画像データに対して適用することもできる。例えば、電子データ又は電子化データ等の画像データの形態で提出されたデータをサーバに格納しておき、これらのデータに対して、本発明をアプリケーションソフトウェアとして適用することができる。なお、上記データは、電子データ、ファイルフォーマット毎に格納されているのが好ましい。

ここで、電子データとは、例えば、アプリケーションソフトウェアで作成されたデータ、ワードプロセッサなどのツールで生成されるフォント又はグラフなどのベクタデータ、符号化されたデータとラスタ画像データとで構成されたデータなどを意味している。また、電子化データとは、例えば、スキャナで読み込まれたデータをＪＰＥＧ又はＰＤＦなど所定のファイルフォーマットに変換したデータなどを意味している。電子データの場合には、上述のようにベクタデータや符号化されたデータを含むために、スキャナなどの画像読取装置から入力されたデータを対象とした処理とは異なる構成が必要になる。すなわち、電子データ又は電子化データに対して所要の変換処理が必要となる。

図２９は電子データ又は電子化データに対する変換処理を行うデータ変換部の構成を示すブロック図である。図２９において、４０はデータ変換部である。データ変換部４０は、フォーマット判別部４０１、フォーマット解析部４０２、ラスタ画像データ生成部４０３、復号化部４０４、画像データ合成部４０５などを備えている。なお、データ変換部４０は、専用のハードウエア回路で構成するだけでなく、ＣＰＵ、ＲＡＭ、ＲＯＭなどを備えたパーソナルコンピュータに、データ変換処理の手順を定めたコンピュータプログラムをロードすることによりＣＰＵでコンピュータプログラムを実行させることにより行うこともできる。また、データ変換部４０は、カラー画像処理装置２に組み込むことができる。

データ変換部４０で変換されたデータは、文書照合処理部２２へ出力される。文書照合処理部２２では、入力された画像データ（電子データ、電子化データ）に対して、実施の形態１の場合と同様に、文書照合処理を行い、電子データ又は電子化データについて、順次登録を行いながら分類（ファイリングなど）を行う。

フォーマット判別部４０１は、入力された電子データ又は電子化データのヘッダーの情報やファイルの拡張子によりデータのフォーマットを判別する。

フォーマット解析部４０２は、判別されたフォーマットの記述規則に従って、データのフォーマットを解析し、電子データに含まれるデータをベクタデータ、ラスタデータ、符号化データに分解する。ここで、記述規則は、例えば、オブジェクトの情報（テキスト、図又は写真等）毎の情報をタグとして保有するなどファイルの記述規則である。この場合タグの情報を参照するによりフォーマットを解析することができる。

ラスタ画像データ生成部４０３は、ベクタデータをラスタ画像に変換してＲＧＢのビットマップデータに変換する。例えば、ＲＩＰ（ラスター・イメージ・プロセッサー）を用いて、ＰＤＬ（ページ記述言語）を解釈しラスタ画像に変換しても良いし、ベクタデータのフォーマットごとに変換ツール（例えば、記述言語に応じて変換するソフトウェア）を準備して変換しても良い。

復号化部４０４は、符号化データをそれぞれの符号化の方法に基づいて復号化して、ＲＧＢのビットマップデータに変換する。例えば、ＪＰＥＧフォーマットの場合、一旦、復号処理を行い、さらに、ＹＣＣ信号をＲＧＢ信号に変換する。ラスタデータに対しては、特に変換を行わない。

画像データ合成部４０５は、ラスタ画像データ生成部４０３、及び復号化部４０４から入力されたデータを合成してＲＧＢのビットマップデータを作成し、作成したビットマップデータ（画像データ）を文書照合処理部２２へ出力する。

文書照合処理部２２は、実施の形態１の例のような方法で類似度を判定し、その判定結果を用いて、本発明に提案する方法で電子データを登録しながら分類（例えば、所定のフォルダへのファイリング）を行う。実施の形態５においても、所定のフォルダに分類されない電子データ（非類似として分類された電子データ）を１つのフォルダ（例えば、非類似として分類するための他のフォルダ）に格納し、これらのデータを再度用いて、登録しながら分類するようにしても良い。ＪＰＥＧやＧＩＦなどのように符号化された電子化データについては、ラスタ画像データ生成部４０３のみを用いて、例えば、ＪＰＥＧやＧＩＦなどの符号化された画像フォーマットの場合は、一旦、復号化部４０４で復号処理を行い、さらに、必要に応じてＹＣＣ信号をＲＧＢ信号に変換すれば良い。

図３０は実施の形態５の分類処理の手順を示すフローチャートである。データ変換部４０は、入力された画像データ（電子データ、電子化データ）のフォーマットを判別し（Ｓ４１）、判別されたフォーマットの記述規則に従って、いずれのデータフォーマットであるか解析する（Ｓ４２）。

データフォーマットがベクタデータである場合（Ｓ４２でベクタデータ）、データ変換部４０は、ベクタデータをラスタ画像データに変換する（Ｓ４３）。データフォーマットが符号化データである場合（Ｓ４２で符号化データ）、データ変換部４０は、符号化データに対して復号化処理を行う（Ｓ４４）。データフォーマットがラスタデータである場合（Ｓ４２でラスタデータ）、データ変換部４０は、データの変換を行わずに後述のステップＳ４５の処理を行う。

データ変換部４０は、画像データを合成する（Ｓ４５）。文書照合処理部２２は、電子データを登録しながら分類（例えば、所定のフォルダへのファイリング）する文書照合処理を行い（Ｓ４６）、処理を終了する。なお、文書照合処理は、上述の図１７乃至図１９の例と同様である。

以上説明したように、本発明にあっては、予め原稿のフォーマット情報などを登録することなく、原稿を分類することができる。また、電子データ又は電子化データについても、順次登録を行いながら分類（ファイリングなど）を行うことができる。また、所定の分類数に応じて原稿（又は画像データ）を分類することができる。また、所定の分類数に分類できない原稿（又は画像データ）がある場合であっても、分類できた原稿（又は画像データ）と分類できない原稿（又は画像データ）とを区別することができる。また、一旦非類似として分類された原稿（又は画像データ）であっても、該原稿（又は該画像データ）の中でお互いに類似する原稿（又は画像データ）を再度分類することができる。さらに、ユーザが手作業で原稿を分類する必要がなく、原稿読取装置で原稿を読み取るだけで自動的に原稿を分類することができ、ユーザの利便性が著しく向上する。また、読み込まれた画像データを分類信号に基づいて、予め定められたフォルダに格納（ファイル）するようにしても良い。ファイルは画像形成装置内のメモリに格納するようにしても良く、あるいは、ネットワークを介して接続されている外部記憶装置、サーバに格納するようにしても良い。

上述の実施の形態において、カラー画像入力装置１としては、例えば、フラットベッドスキャナ、フィルムスキャナ、デジタルカメラ、携帯電話機などが用いられる。また、カラー画像出力装置３としては、例えば、ＣＲＴディスプレイ、液晶ディスプレイなどの画像表示装置、処理結果を記録紙などに出力する電子写真方式又はインクジェット方式のプリンタなどが用いられる。さらに画像形成装置１００としては、ネットワークを介してサーバ装置などに接続するための通信手段としてのモデムなどを備えることもできる。また、カラー画像入力装置１からカラー画像データを取得する代わりに、ネットワークを介して外部記憶装置、サーバ装置などからカラー画像データを取得する構成であってもよい。

上述の実施の形態では、文書照合処理部２２の中にメモリ２２５、制御部２２６を備える構成であるが、これに限定されるものではなく、メモリ２２５、制御部２２６を文書照合処理部２２の外部に設ける構成であってもよい。

本発明はコンピュータに実行させるためのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）を記録したコンピュータでの読み取り可能な記録媒体に、原稿分類処理を行うプログラムコードを記録することもできる。この結果、上記原稿分類処理を行うプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。記録媒体としては、マイクロコンピュータで処理が行われるために図示しないメモリ、例えばＲＯＭのようなプログラムメディアであってもよく、図示しない外部記憶装置としてのプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。

いずれの場合においても、格納されているプログラムコードはマイクロプロセッサがアクセスして実行させる構成であってもよいし、プログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。この場合、ダウンロード用のコンピュータプログラムは予め本体装置に格納されているものとする。

ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フロッピー（登録商標）ディスクやハードディスク等の磁気ディスク並びにＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモリカードを含む）／光カード等のカード系、あるいはマスクＲＯＭ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）、フラッシュＲＯＭ等による半導体メ
モリを含めた固定的にプログラムコードを担持する媒体であってもよい。

また、この場合、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のコンピュータプログラムは予め本体装置に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

本発明に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。文書照合処理部の構成を示すブロック図である。特徴点算出部の構成を示すブロック図である。連結領域の特徴点の例を示す説明図である。文字列に対する特徴点の抽出結果の例を示す説明図である。注目特徴点と周辺の特徴点を示す説明図である。注目特徴点による不変量の算出例を示す説明図である。注目特徴点による不変量の算出例を示す説明図である。注目特徴点による不変量の算出の他の例を示す説明図である。注目特徴点による不変量の算出の他の例を示す説明図である。ハッシュテーブルの構造を示す説明図である。カテゴリテーブルの構造を示す説明図である。最初の原稿を読み取った場合のハッシュテーブル及びカテゴリテーブルの例を示す説明図である。２枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図である。３枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図である。４枚目の原稿を読み取った場合の得票数の例を示す説明図である。カラー画像処理装置の原稿分類処理の手順を示すフローチャートである。カラー画像処理装置の原稿分類処理の手順を示すフローチャートである。カラー画像処理装置の原稿分類処理の手順を示すフローチャートである。本発明に係る原稿読取装置の構成を示すブロック図である。本発明に係る原稿読取装置の構成を示す模式図である。原稿シフター機構の構成を示す横断面図である。原稿シフター機構の構成を示す横断面図である。原稿の排出位置を示す説明図である。排出トレイを可動させる場合の原稿シフター機構の構成を示す模式図である。原稿シフター機構の構成を示す横断面図である。実施の形態３の原稿読取装置の構成を示す模式図である。実施の形態４の原稿読取装置の構成を示す模式図である。電子データ又は電子化データに対する変換処理を行うデータ変換部の構成を示すブロック図である。実施の形態５の分類処理の手順を示すフローチャートである。

符号の説明

１カラー画像入力装置
２カラー画像処理装置
３カラー画像出力装置
２２文書照合処理部
４０データ変換部
４０１フォーマット判別部
４０２フォーマット解析部
４０３ラスタ画像データ生成部
４０４復号化部
４０５画像データ合成部
５０、３００原稿シフター機構
２２１特徴点算出部
２２２特徴量算出部
２２３投票処理部
２２４類似度判定処理部
２２５メモリ
２２６制御部
２２１１解像度変換部
２２１２フィルタ処理部
２２１３二値化処理部
２２１４重心算出部

Claims

複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置による画像処理方法において、
最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶手段に記憶する第１記憶ステップと、
最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定手段で判定する判定ステップと、
特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、
投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、
投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、
新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶手段に記憶する第２記憶ステップと
を備え、
前記決定手段は、
記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定し、
さらに、付与された識別子に基づいて原稿を分類手段で分類するステップを備えることを特徴とする画像処理方法。
複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置による画像処理方法において、
最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶手段に記憶する第１記憶ステップと、
最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定手段で判定する判定ステップと、
特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、
投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、
投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、
新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶手段に記憶する第２記憶ステップと
を備え、
前記決定手段は、
記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定し、
さらに、付与された識別子に基づいて画像データを分類手段で分類するステップを備えることを特徴とする画像処理方法。
前記決定手段は、
記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することを特徴とする請求項１又は請求項２に記載の画像処理方法。
前記画像処理装置は、
非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去ステップ、前記原稿を読み取り又は画像データを入力し、前記第１記憶ステップ、判定ステップ、投票ステップ、算出ステップ、決定ステップ、及び第２記憶ステップの各ステップを少なくとも１回繰り返すことを特徴とする請求項１乃至請求項３のいずれか１つに記載の画像処理方法。
複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置において、
最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、
最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、
該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する手段と、
付与された識別子に基づいて原稿を分類する手段と
を備え、
前記決定手段は、
記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする画像処理装置。
複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置において、
最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶する記憶手段と、
最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、
該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
該投票手段で投票されて得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する手段と、
付与された識別子に基づいて画像データを分類する手段と
を備え、
前記決定手段は、
記憶された識別子の数が所定数に達した場合、順次入力された画像データに、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する画像データの識別子を付与すべく構成してあることを特徴とする画像処理装置。
前記投票手段で投票されて得られた得票数に基づいて、画像の類似度を算出する算出手段を備え、
前記決定手段は、
記憶された識別子の数が所定数に達しない場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定すべく構成してあることを特徴とする請求項５又は請求項６に記載の画像処理装置。
前記決定手段は、
記憶された識別子の数が所定数に達した場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は前記原稿若しくは前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とする請求項５乃至請求項７のいずれか１つに記載の画像処理装置。
請求項５、請求項７又は請求項８のいずれか１つに記載の画像処理装置を備え、原稿を読み取る原稿読取装置であって、
前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段を備えることを特徴とする原稿読取装置。
請求項８に記載の画像処理装置を備え、原稿を読み取る原稿読取装置であって、
前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段と、
非類似として分類された原稿を再度読み取るため、該原稿を搬送する搬送手段と
を備え、
前記原稿を再度読み取る場合、記憶された特徴量及び識別子を消去すべく構成してあることを特徴とする原稿読取装置。
前記分類排出手段は、
分類毎に原稿の排出位置を変位するように構成してあることを特徴とする請求項９又は請求項１０に記載の原稿読取装置。
原稿を排出する排出トレイを複数備え、
前記分類排出手段は、
分類毎に原稿を異なる排出トレイに排出するように構成してあることを特徴とする請求項９又は請求項１０に記載の原稿読取装置。
原稿を読み取る原稿読取装置において、
原稿の画像の複数の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、
順次読み取られた原稿に対して、該原稿の画像に基づいて抽出された複数の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、
該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する決定手段と、
該決定手段で決定された識別子毎に原稿を分類して排出する分類排出手段と
を備え、
前記決定手段は、
記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする原稿読取装置。
請求項９乃至請求項１３のいずれか１つに記載の原稿読取装置と、該原稿読取装置で原稿を読み取って得られた画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする画像形成装置。
コンピュータに、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出させ、抽出した特徴量に基づいて原稿を分類するための処理を行わせるためのコンピュータプログラムにおいて、
コンピュータを、最初に読み取られた原稿の画像の特徴量を抽出し、抽出した特徴量及び前記原稿を分類するために付与された識別子を記憶する第１記憶手段と、
コンピュータを、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、
コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、
コンピュータを、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
コンピュータを、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する第２記憶手段と、
付与された識別子に基づいて原稿を分類する手段と
して機能させ、
前記決定手段は、
記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定すべく構成してあることを特徴とするコンピュータプログラム。
コンピュータに、複数の画像データより順次各画像データの特徴量を複数抽出させ、抽出した特徴量に基づいて画像データを分類するための処理を行わせるためのコンピュータプログラムにおいて、
コンピュータを、最初に入力された画像データの特徴量を抽出し、抽出した特徴量及び前記画像データを分類するために付与された識別子を記憶する第１記憶手段と、
コンピュータを、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、
コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、
コンピュータを、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
コンピュータを、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する第２記憶手段と、
付与された識別子に基づいて画像データを分類する手段と
して機能させ、
前記決定手段は、
記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とするコンピュータプログラム。
コンピュータを、記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と
して機能させることを特徴とする請求項１５又は請求項１６に記載のコンピュータプログラム。
コンピュータを、非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去手段、前記原稿を読み取り又は画像データを入力し、前記第１記憶手段、判定手段、投票手段、算出手段、決定手段、及び第２記憶手段の各手段として少なくとも１回繰り返すよう機能させることを特徴とする請求項１５乃至請求項１７のいずれか１つに記載のコンピュータプログラム。
請求項１５乃至請求項１８のいずれか１つに記載のコンピュータプログラムを記録してあることを特徴とするコンピュータでの読み取りが可能な記録媒体。