JP4257925B2 - 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体 - Google Patents

画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体 Download PDF

Info

Publication number
JP4257925B2
JP4257925B2 JP2007207094A JP2007207094A JP4257925B2 JP 4257925 B2 JP4257925 B2 JP 4257925B2 JP 2007207094 A JP2007207094 A JP 2007207094A JP 2007207094 A JP2007207094 A JP 2007207094A JP 4257925 B2 JP4257925 B2 JP 4257925B2
Authority
JP
Japan
Prior art keywords
document
image
identifier
image data
voting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007207094A
Other languages
English (en)
Other versions
JP2008077641A (ja
Inventor
淳寿 森本
雅和 大平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007207094A priority Critical patent/JP4257925B2/ja
Priority to US11/892,392 priority patent/US7948664B2/en
Priority to CN2007101676045A priority patent/CN101136981B/zh
Publication of JP2008077641A publication Critical patent/JP2008077641A/ja
Application granted granted Critical
Publication of JP4257925B2 publication Critical patent/JP4257925B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Facsimiles In General (AREA)
  • Image Input (AREA)
  • Processing Or Creating Images (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体に関する。
スキャナで原稿を読み取り、原稿を読み取って得られた入力画像からフォーマット情報を認識し、認識したフォーマット情報に基づいて要素毎のマッチング処理を行って入力画像を分類し、分類した結果に応じて入力画像をファイリングする技術が知られている。
例えば、入力画像に対して、線分抽出、文字枠抽出、文字認識又は枠抽出などの認識処理を行い、認識結果から枠データの中心座標、文字列枠の中心座標、連結枠情報などの情報を抽出する。次に、抽出した情報より不変量を算出し、テーブル管理に必要なデータ(不変量、モデル名、不変量を算出するのに用いたパラメータなど)を作成してハッシュテーブルに登録することにより、フォーマットの登録を行う。
フォーマットの識別を行う場合は、入力画像に対して認識処理を行い、認識結果から枠データの中心座標、文字列枠の中心座標、連結枠情報などの情報を抽出する。そして、各情報に対する不変量を算出し、算出した不変量を用いて、対応するハッシュテーブルのエリアを検索し、検索したエリア内の登録帳票名ごとに投票を行う。これらの処理を入力画像の特徴点毎に繰り返し、ヒストグラムの最も大きいモデルを認識結果として類似度を計算する。入力画像が登録されていると確認された場合、入力画像に識別子を付与して保存する。このような処理を行うことにより、フォーマット情報に基づいて要素毎のマッチングを自動的に行ってユーザの処理工程を軽減することができる画像のファイリング装置が提案されている(特許文献1参照)。
特許第3469345号公報
しかしながら、特許文献1の装置にあっては、予めフォーマット情報を登録する作業が必要であり、様々な原稿を精度良く分類するためには、膨大な量のフォーマット情報を登録しておく必要があり、フォーマット情報を記憶するための記憶容量が増大するという問題があった。また、入力画像に識別子を付与し、付与した識別子に基づいて分類した原稿を電子データとしてファイリングすることは可能であるものの、紙媒体である原稿自身を分類することはできず、原稿自身を分類するためには、ユーザの目視による分類作業を要し、特に多くの原稿を分類する場合にはユーザの作業量は膨大となり、ユーザの利便性の向上が望まれていた。
本発明は、斯かる事情に鑑みてなされたものであり、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、画像の類似度を算出し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する。そして、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定し、付与された識別子に基づいて原稿を分類することにより、予め原稿のフォーマット情報などを登録することなく、所定の分類数に分類できない原稿がある場合であっても、分類できた原稿と分類できない原稿とを区別することができる画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することを目的とする。
また、本発明の他の目的は、最初に入力された画像データ(例えば、電子データ、電子化データなど)の特徴量及び該画像データを分類するために付与された識別子を記憶し、最初に入力された画像データの後に順次入力された画像データに対して、該画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、画像の類似度を算出し、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する。そして、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定し、付与された識別子に基づいて画像データを分類することにより、電子データ又は電子化データに対して、所定の分類数に分類できない場合であっても、分類できた画像データと分類できない画像データとを順次区別しながら分類(ファイリング等)を行うことができる画像処理方法、画像処理装置、該画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することにある。
また、本発明の他の目的は、記憶された識別子の数が所定数に達しない場合、投票で得られた得票数に基づいて画像の類似度を算出し、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することにより、所定の分類数に応じて原稿又は画像データを分類することができる画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することにある。
また、本発明の他の目的は、非類似として分類された原稿(又は画像データ)がある場合、記憶された特徴量及び識別子を消去するとともに、非類似として分類された原稿(又は画像データ)を再度順次読み取り(又は順次入力し)、最初に読み取られた原稿の画像(又は最初に入力された画像データ)の特徴量及び該原稿を分類するために付与された識別子を記憶し、最初に読み取られた原稿(又は最初に入力された画像データ)の後に順次読み取られた原稿(又は順次入力された画像データ)に対して、該原稿の画像(又は画像データ)の特徴量と記憶された識別子で分類された原稿の画像(又は最初に入力された画像データ)の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で獲られた得票数に基づいて、前記順次読み取られた原稿(又は順次入力された画像データ)に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像(又は画像データ)の特徴量及び該識別子を記憶する処理を少なくとも1回繰り返すことにより、一旦非類似として分類された原稿(又は画像データ)であっても、該原稿(又は該画像データ)の中でお互いに類似する原稿(又は画像データ)を再度分類することができる画像処理方法、原稿読取装置、該原稿読取装置を備える画像形成装置、コンピュータプログラム、及び該コンピュータプログラムを記録した記録媒体を提供することにある。
また、本発明の他の目的は、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与することにより、所定の分類数で原稿を分類することができる画像処理装置、該画像処理装置を備える原稿読取装置、該原稿読取装置を備える画像形成装置を提供することにある。
また、本発明の他の目的は、分類毎に原稿の排出位置を変位する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる原稿読取装置及び該原稿読取装置を備える画像形成装置を提供することにある。
また、本発明の他の目的は、分類毎に原稿を異なる排出トレイに排出する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる原稿読取装置及び該原稿読取装置を備える画像形成装置を提供することにある。
また、本発明の他の目的は、順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定し、決定された分類毎に原稿を分類して排出する分類排出手段を備え、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与することにより、所定の分類数で原稿を分類することができる原稿読取装置及び該原稿読取装置を備える画像形成装置を提供することにある。
本発明に係る画像処理方法は、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置による画像処理方法において、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶手段に記憶する第1記憶ステップと、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定手段で判定する判定ステップと、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶手段に記憶する第2記憶ステップとを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定し、さらに、付与された識別子に基づいて原稿を分類手段で分類するステップを備えることを特徴とする。
本発明に係る画像処理方法は、複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置による画像処理方法において、最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶手段に記憶する第1記憶ステップと、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定手段で判定する判定ステップと、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶手段に記憶する第2記憶ステップとを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定し、さらに、付与された識別子に基づいて画像データを分類手段で分類するステップを備えることを特徴とする。
本発明に係る画像処理方法は、前記決定手段は、記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することを特徴とする。
本発明に係る画像処理方法は、前記画像処理装置は、非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去ステップ、前記原稿を読み取り又は画像データを入力し、前記第1記憶ステップ、判定ステップ、投票ステップ、算出ステップ、決定ステップ、及び第2記憶ステップの各ステップを少なくとも1回繰り返すことを特徴とする。
本発明に係る画像処理装置は、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置において、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する手段と、付与された識別子に基づいて原稿を分類する手段とを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする。
本発明に係る画像処理装置は、複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置において、最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶する記憶手段と、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、該投票手段で投票されて得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する手段と、付与された識別子に基づいて画像データを分類する手段とを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、順次入力された画像データに、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する画像データの識別子を付与すべく構成してあることを特徴とする。
本発明に係る画像処理装置は、前記投票手段で投票されて得られた得票数に基づいて、画像の類似度を算出する算出手段を備え、前記決定手段は、記憶された識別子の数が所定数に達しない場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定すべく構成してあることを特徴とする。
本発明に係る画像処理装置は、前記決定手段は、記憶された識別子の数が所定数に達した場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は前記原稿若しくは前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とする。
本発明に係る原稿読取装置は、前述の本発明に係るいずれか1つの画像処理装置を備え、原稿を読み取る原稿読取装置であって、前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段を備えることを特徴とする。
本発明に係る原稿読取装置は、前述の本発明に係る画像処理装置を備え、原稿を読み取る原稿読取装置であって、前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段と、非類似として分類された原稿を再度読み取るため、該原稿を搬送する搬送手段とを備え、前記原稿を再度読み取る場合、記憶された特徴量及び識別子を消去すべく構成してあることを特徴とする。
本発明に係る原稿読取装置は、前記分類排出手段は、分類毎に原稿の排出位置を変位するように構成してあることを特徴とする。
本発明に係る原稿読取装置は、原稿を排出する排出トレイを複数備え、前記分類排出手段は、分類毎に原稿を異なる排出トレイに排出するように構成してあることを特徴とする。
本発明に係る原稿読取装置は、原稿を読み取る原稿読取装置において、原稿の画像の複数の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、順次読み取られた原稿に対して、該原稿の画像に基づいて抽出された複数の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する決定手段と、該決定手段で決定された識別子毎に原稿を分類して排出する分類排出手段とを備え、前記決定手段は、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする。
本発明に係る画像形成装置は、前述の本発明に係るいずれか1つの原稿読取装置と、該原稿読取装置で原稿を読み取って得られた画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータに、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出させ、抽出した特徴量に基づいて原稿を分類するための処理を行わせるためのコンピュータプログラムにおいて、コンピュータを、最初に読み取られた原稿の画像の特徴量を抽出し、抽出した特徴量及び前記原稿を分類するために付与された識別子を記憶する第1記憶手段と、コンピュータを、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、コンピュータを、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、コンピュータを、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する第2記憶手段と、付与された識別子に基づいて原稿を分類する手段として機能させ、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定すべく構成してあることを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータに、複数の画像データより順次各画像データの特徴量を複数抽出させ、抽出した特徴量に基づいて画像データを分類するための処理を行わせるためのコンピュータプログラムにおいて、コンピュータを、最初に入力された画像データの特徴量を抽出し、抽出した特徴量及び前記画像データを分類するために付与された識別子を記憶する第1記憶手段と、コンピュータを、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、コンピュータを、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、コンピュータを、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する第2記憶手段と、付与された識別子に基づいて画像データを分類する手段として機能させ、前記決定手段は、記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータを、記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段として機能させることを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータを、非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去手段、前記原稿を読み取り又は画像データを入力し、前記第1記憶手段、判定手段、投票手段、算出手段、決定手段、及び第2記憶手段の各手段として少なくとも1回繰り返すよう機能させることを特徴とする。
本発明に係るコンピュータでの読み取りが可能な記録媒体は、前述の本発明に係るいずれか1つのコンピュータプログラムを記録してあることを特徴とする。
本発明にあっては、複数の原稿を順次読み取る場合、最初に読み取られた原稿の画像の特徴量(例えば、画像を二値化した二値化画像で連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点の中から複数の特徴点を選択して、不変量として算出されたハッシュ値)及び該原稿を分類するために付与された識別子(例えば、原稿のカテゴリ)を記憶する。最初の原稿の後に順次読み取られた原稿に対して、抽出された特徴量と識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。例えば、類似度を最大得票数に対する得票数の比率として定義することができる。この場合、最大得票数は、画像に基づいて抽出される特徴点の数に、1つの特徴点で算出され得る特徴量(例えば、ハッシュ値)の数を乗算することにより算出することができる。投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。例えば、得票数が所定の閾値以上である場合、その得票数を得た画像に対応する原稿の識別子を読み取った原稿に付与し、得票数が所定の閾値より少ない場合、記憶された識別子と異なる新たな識別子を読み取った原稿に付与する。新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定する。これにより、まず、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、その後順次読み取られた原稿を、分類することができた原稿と所定の分類数の範囲内で分類することができない原稿とに区別する。
本発明にあっては、複数の画像データ(例えば、電子データ、電子化データなど)を順次入力する場合、最初に入力された画像データの特徴量(例えば、画像を二値化した二値化画像で連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点の中から複数の特徴点を選択して、不変量として算出されたハッシュ値)及び該画像データを分類するために付与された識別子(例えば、画像データのカテゴリ)を記憶する。最初に入力された画像データの後に順次入力された画像データに対して、抽出された特徴量と識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。例えば、類似度を最大得票数に対する得票数の比率として定義することができる。この場合、最大得票数は、画像に基づいて抽出される特徴点の数に、1つの特徴点で算出され得る特徴量(例えば、ハッシュ値)の数を乗算することにより算出することができる。投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。例えば、得票数が所定の閾値以上である場合、その得票数を得た画像に対応する画像データの識別子を入力された画像データに付与し、得票数が所定の閾値より少ない場合、記憶された識別子と異なる新たな識別子を入力された画像データに付与する。新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定する。これにより、まず、最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶し、その後順次入力された画像データを、分類することができた画像データと所定の分類数の範囲内で分類することができない画像データとに区別する。
また、本発明にあっては、記憶された識別子の数が所定数(例えば、デフォルトの分類数又はユーザが指定した分類数など)に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿(又は順次入力された画像データ)に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。これにより、所定の分類数に応じて原稿(又は画像データ)を分類する。
また、本発明にあっては、非類似として分類された原稿(又は画像データ)がある場合、記憶された特徴量及び識別子を消去する。これにより、すでに分類された原稿(又は画像データ)に関する特徴量及び識別子を初期化する。非類似として分類された原稿を順次読み取り(又は画像データを順次入力し)、最初に読み取られた原稿の画像(又は最初に入力された画像データ)の特徴量及び該原稿(又は該画像データ)を分類するために付与された識別子を記憶し、その後順次読み取られた原稿(又は順次入力された画像データ)に対して、抽出された特徴量と識別子で分類された原稿の画像(又は画像データ)の特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿(又は順次入力された画像データ)に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する。新たな識別子を付与する場合、該識別子で分類される原稿の画像(又は画像データ)の特徴量及び該識別子を記憶する。これにより、非類似として分類された原稿(又は画像データ)を再度読み取り(又は入力し)、最初に読み取られた原稿の画像(又は最初に入力された画像データ)の特徴量及び該原稿(又は画像データ)を分類するために付与された識別子を記憶し、その後順次読み取られた原稿(又は順次入力された画像データ)に、得票数に基づいて先に付与された識別子を付与するか又は新たな識別子を付与する処理を少なくとも1回繰り返す。
また、本発明にあっては、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与する。これにより、所定の分類数の範囲内で原稿を分類する。
また、本発明にあっては、分類排出手段は、決定された分類毎に原稿を分類して排出する。
また、本発明にあっては、分類排出手段は、決定された分類毎に原稿を分類して排出し、搬送手段は、非類似として分類された原稿を再度読み取るため、該原稿を搬送する。該原稿を再度読み取る場合、記憶された特徴量及び識別子を消去する。これにより、すでに分類された原稿に関する特徴量及び識別子を初期化する。非類似として分類された原稿を再度読み取ることにより、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、その後順次読み取られた原稿に、得票数に基づいて先に付与された識別子を付与するか又は新たな識別子を付与する。
また、本発明にあっては、分類排出手段は、分類毎に原稿の排出位置を変位する。
また、本発明にあっては、分類排出手段は、分類毎に原稿を異なる排出トレイに排出する。
また、本発明にあっては、順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する。特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する。このとき、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく決定する。分類排出手段は、決定された分類毎に原稿を分類して排出する。
本発明にあっては、最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶し、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定する。これにより、所定の分類数に分類できない原稿がある場合であっても、分類できた原稿と分類できない原稿とを区別することができる。
本発明にあっては、最初に入力された画像データ(電子データ、電子化データなど)の特徴量及び該画像データを分類するために付与された識別子を記憶し、最初に入力された画像データの後に順次入力された画像データに対して、該画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票する。そして、投票で得られた得票数に基づいて、画像の類似度を算出する。投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する。記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定する。これにより、電子データ又は電子化データについても、所定の分類数に分類できない原稿(又は画像データ)がある場合であっても、分類できた画像データと分類できない画像データとを順次区別することができる。
また、本発明にあっては、記憶された識別子の数が所定数に達しない場合、投票で得られた得票数に基づいて画像の類似度を算出し、算出された画像の類似度に基づいて、順次読み取られた原稿(又は順次入力された画像データ)に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することにより、所定の分類数に応じて原稿(又は画像データ)を分類することができる。
また、本発明にあっては、非類似として分類された原稿(又は画像データ)がある場合、記憶された特徴量及び識別子を消去するとともに、非類似として分類された原稿(又は画像データ)を再度順次読み取り(又は順次入力し)、最初に読み取られた原稿の画像(又は最初に入力された画像データ)の特徴量及び該原稿(又は画像データ)を分類するために付与された識別子を記憶し、最初に読み取られた原稿(又は最初に入力された画像データ)の後に順次読み取られた原稿(又は順次入力された画像データ)に対して、該原稿の画像(又は画像データ)の特徴量と記憶された識別子で分類された原稿の画像(又は画像データ)の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で獲られた得票数に基づいて、前記順次読み取られた原稿(又は順次入力された画像データ)に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定し、新たな識別子を付与する場合、該識別子で分類される原稿の画像(又は画像データ)の特徴量及び該識別子を記憶する処理を少なくとも1回繰り返すことにより、一旦非類似として分類された原稿(又は画像データ)であっても、該原稿(又は画像データ)の中でお互いに類似する原稿(又は画像データ)を再度分類することができる。
また、本発明にあっては、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与することにより、所定の分類数で原稿を分類することができる。
また、本発明にあっては、分類毎に原稿の排出位置を変位する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる。
また、本発明にあっては、分類毎に原稿を異なる排出トレイに排出する原稿排出手段を備えることにより、分類された原稿を容易に仕分けることができる。
また、本発明にあっては、順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定し、一致した特徴量毎に該特徴量が抽出された画像に投票し、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する。このとき、記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく決定する。決定された分類毎に原稿を分類して排出する分類排出手段を備えることにより、所定の分類数の範囲内で原稿自身を分類することができる。
実施の形態1
以下、本発明を実施の形態を示す図面に基づいて説明する。図1は本発明に係る画像処理装置を備える画像形成装置100の構成を示すブロック図である。画像形成装置100(例えば、デジタルカラー複写機や複合機能、プリンタ機能、ファックスや電子メール配信機能を備えた複合機)は、カラー画像入力装置1、カラー画像処理装置2(画像処理装置)、画像形成手段としてのカラー画像出力装置3、各種操作を行うための操作パネル4などを備える。カラー画像入力装置1で原稿を読み取ることにより得られたRGB(R:赤、G:緑、B:青)のアナログ信号の画像データは、カラー画像処理装置2へ出力され、カラー画像処理装置2で所定の処理が行われ、CMYK(C:シアン、M:マゼンタ、Y:イエロー、K:黒)のデジタルカラー信号としてカラー画像出力装置3へ出力される。
カラー画像入力装置1は、例えば、CCD(Charged Coupled Device)を備えたスキャナであり、原稿画像からの反射光像をRGBのアナログ信号として読み取り、読み取ったRGB信号をカラー画像処理装置2へ出力する。また、カラー画像出力装置3は、原稿画像の画像データを記録紙上に出力する電子写真方式やインクジェット方式などを用いた画像形成手段である。また、カラー画像出力装置3は、ディスプレイ等の表示装置であってもよい。
カラー画像処理装置2は、後述する各処理部を備え、ASIC(Application Specific Integrated Circuit)などにより構成される。
A/D変換部20は、カラー画像入力装置1から入力されたRGB信号を、例えば、10ビットのデジタル信号に変換し、変換後のRGB信号をシェーディング補正部21へ出力する。
シェーディング補正部21は、入力されたRGB信号に対して、カラー画像入力装置1の照明系、結像系、撮像系などで生じた各種の歪みを取り除く補正処理を行う。また、シェーディング補正部21は、濃度信号などカラー画像処理装置2で採用されている画像処理システムが扱い易い信号に変換する処理を行うとともにカラーバランスを整える処理を行い、補正後のRGB信号を文書照合処理部22へ出力する。
文書照合処理部22は、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点(例えば、重心)を算出し、算出した特徴点の中から複数の特徴点を選択し、選択した特徴点に基づいて不変量としての特徴量(例えば、ハッシュ値)を算出する。文書照合処理部22は、算出した特徴量に基づいて画像が類似するか否かを判定し、類似する画像に対応する原稿同士を1つのカテゴリに分類し、分類信号を出力する。また、文書照合処理部22は、入力されたRGB信号をそのまま後段の入力階調補正部23へ出力する。
入力階調補正部23は、下地濃度の除去又はコントラストなど画質調整処理を施し、処理後のRGB信号を領域分離処理部24へ出力する。
領域分離処理部24は、入力されたRGB信号に基づき、入力された画像中の各画素が、文字領域、網点領域、写真領域の何れであるかを分離する。領域分離処理部24は、分離結果に基づいて、各画素がどの領域に属しているかを示す領域識別信号を黒生成下色除去部26、空間フィルタ処理部27、階調再現処理部29へ出力する。また、領域分離処理部24は、入力されたRGB信号をそのまま後段の色補正部25へ出力する。
色補正部25は、入力されたRGB信号をCMYの色空間に変換し、カラー画像出力装置3の特性に合わせて色補正を行い、補正後のCMY信号を黒生成下色除去部26へ出力する。具体的には、色補正部25は、色再現の忠実化のため、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りを取り除く処理を行う。
黒生成下色除去部26は、色補正部25から入力されたCMY信号に基づいて、K(黒)信号を生成するとともに、入力されたCMY信号からK信号を差し引いて新たなCMY信号を生成し、生成したCMYK信号を空間フィルタ処理部27へ出力する。
黒生成下色除去部26における処理の一例を示す。例えば、スケルトンブラックによる黒生成を行う処理の場合、スケルトンカーブの入出力特性をy=f(x)とし、入力されるデータをC、M、Yとし、出力されるデータをC′、M′、Y′、K′とし、UCR(Under Color Removal)率をα(0<α<1)とすると、黒生成下色除去処理により出力
されるデータ夫々は、K′=f{min(C、M、Y)}、C′=C−αK′、M′=M−αK′、Y′=Y−αK′で表される。
空間フィルタ処理部27は、黒生成下色除去部26から入力されたCMYK信号に対して、領域識別信号に基づいたデジタルフィルタによる空間フィルタ処理を行う。これにより、画像データの空間周波数特性が補正され、カラー画像出力装置3における出力画像のぼやけ、又は粒状性劣化を防止する。例えば、空間フィルタ処理部27は、領域分離処理部24において文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、鮮鋭強調処理を施し高周波成分を強調する。また、空間フィルタ処理部27は、領域分離処理部24において網点領域に分離された領域を、入力網点成分を除去するためのローパス・フィルタ処理を施す。空間フィルタ処理部27は、処理後のCMYK信号を出力階調補正部28へ出力する。
出力階調補正部28は、空間フィルタ処理部27から入力されたCMYK信号に対して、カラー画像出力装置3の特性値である網点面積率に変換する出力階調補正処理を行い、出力階調補正処理後のCMYK信号を階調再現処理部29へ出力する。
階調再現処理部29は、領域分離処理部24から入力された領域識別信号に基づいて、出力階調補正部28から入力されたCMYK信号に対して所定の処理を行う。例えば、階調再現処理部29は、文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、カラー画像出力装置3における高周波成分の再現に適するように二値化処理又は多値化処理を行う。
また、階調再現処理部29は、領域分離処理部24において網点領域に分離された領域を、最終的に画像を画素に分離して、それぞれの階調を再現できるように階調再現処理(中間調生成)を行う。さらに、階調再現処理部29は、領域分離処理部24において写真領域に分離された領域を、カラー画像出力装置3における階調再現性に適するように二値化処理又は多値化処理を行う。
カラー画像処理装置2は、階調再現処理部29で処理された画像データ(CMYK信号)を記憶部(不図示)に一旦記憶し、画像形成をする所定のタイミングで記憶部に記憶した画像データを読み出し、読み出した画像データをカラー画像出力装置3へ出力する。これらの制御は、例えば、CPU(不図示)により行われる。
図2は文書照合処理部22の構成を示すブロック図である。文書照合処理部22は、特徴点算出部221、特徴量算出部222、投票処理部223、類似度判定処理部224、メモリ225、前記各部を制御する制御部226などを備えている。
特徴点算出部221は、入力された画像(画像データ)に対して後述する所定の処理を行うとともに、入力画像を二値化し、二値画像に基づいて特定された連結領域の特徴点(例えば、連結領域を構成する各画素の二値画像における座標値を累積加算し、累積加算した座標値を連結領域に含まれる画素数で除算した値)を抽出(算出)し、抽出した特徴点を特徴量算出部222へ出力する。
図3は特徴点算出部221の構成を示すブロック図である。特徴点算出部221は、無彩化処理部2210、解像度変換部2211、フィルタ処理部2212、二値化処理部2213、重心算出部2214などを備えている。
無彩化処理部2210は、入力された画像(画像データ)がカラー画像である場合、カラー画像を無彩化して、輝度信号又は明度信号に変換し、変換後の画像を解像度変換部2211へ出力する。例えば、輝度信号Yは、各画素RGBの色成分を夫々Rj、Gj、Bjとし、各画素の輝度信号をYjとして、Yj=0.30×Rj+0.59×Gj+0.11×Bjで表すことができる。なお、上式に限らず、RGB信号をCIE1976L* a* b* 信号に変換することもできる。
解像度変換部2211は、入力された画像がカラー画像入力装置1で光学的に変倍された場合であっても、所定の解像度になるように入力された画像を再度変倍し、変倍された画像をフィルタ処理部2212へ出力する。これにより、カラー画像入力装置1で変倍処理が行われ解像度が変化した場合であっても、その影響を受けることなく特徴点の抽出を行うことができ、精度良く原稿を分類することができる。特に、縮小された文字などの場合、二値化処理を行って連結領域を特定するとき、文字が潰れているために本来離れている領域が繋がった状態で特定され、算出される重心がずれる虞を防止できる。また、解像度変換部2211は、カラー画像入力装置1で等倍時に読み込まれる解像度よりも小さい解像度に変換する。例えば、カラー画像入力装置1において600dpi(dot per inch)で読み込まれた画像を300dpiに変換する。これにより、後段における処理量を低減することができる。
フィルタ処理部2212は、入力された画像が有する空間周波数特性を補正し(例えば、画像の強調化処理及び平滑化処理など)、補正後の画像を二値化処理部2213へ出力する。フィルタ処理部2212は、カラー画像入力装置1の空間周波数特性が機種ごとに異なるため、異なる空間周波数特性を所要の特性に補正する。カラー画像入力装置1が出力する画像(例えば、画像信号)には、レンズ又はミラーなどの光学系部品、CCDの受光面のアパーチャ開口度、転送効率、残像、物理的な走査による積分効果及び走査むら等に起因して画像のぼけなどの劣化が生ずる。フィルタ処理部2212は、境界又はエッジなどの強調処理を行うことにより、画像に生じたぼけなどの劣化を修復する。また、フィルタ処理部2212は、後段で処理される特徴点の抽出処理に不要な高周波成分を抑制するための平滑化処理を行う。これにより、特徴点を精度良く抽出することができ、結果として画像の類似度の判定を精度良く行うことが可能となる。なお、フィルタ処理部2212で使用するフィルタ係数は、使用されるカラー画像入力装置1の機種又は特性などに応じて適宜設定することができる。
二値化処理部2213は、入力された画像の輝度値(輝度信号)又は明度値(明度信号)を閾値と比較することにより画像を二値化し、二値化した二値画像を重心算出部2214へ出力する。
重心算出部2214は、二値化処理部2213から入力された二値画像の各画素の二値化情報(例えば、「1」、「0」で表される)に基づいて、各画素に対してラベリング(ラベル付け処理)を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点を特徴量算出部222へ出力する。なお、特徴点は、二値画像における座標値(x座標、y座標)で表すことができる。
図4は連結領域の特徴点の例を示す説明図である。図において、特定された連結領域は、文字「A」であり、同一ラベルが付された画素の集合として特定される。この文字「A」の特徴点(重心)は、図中黒丸で示される位置(x座標、y座標)となる。
図5は文字列に対する特徴点の抽出結果の例を示す説明図である。複数の文字から構成される文字列の場合、文字の種類により夫々異なる座標を有する特徴点が複数抽出される。
特徴量算出部222は、特徴点算出部221から入力された特徴点(すなわち、連結領域の重心の座標値)夫々を注目特徴点とし、例えば、注目特徴点からの距離が小さい順に周辺の他の特徴点を4つ抽出する。
図6は注目特徴点と周辺の特徴点を示す説明図である。図に示すように、注目特徴点P1に対して、例えば、閉曲線S1で囲まれる4つの特徴点を抽出する(注目特徴点P1に対しては、注目特徴点P2も1つの特徴点として抽出されている)。また、注目特徴点P2に対して、例えば、閉曲線S2で囲まれる4つの特徴点を抽出する(注目特徴点P2に対しては、注目特徴点P1も1つの特徴点として抽出されている)。
特徴量算出部222は、抽出した4つの特徴点の中から3つの特徴点を選択して、不変量を算出する。なお、選択する特徴点は3つに限られるものではなく、4つ、5つなどの特徴点を選択することもできる。求めたい不変量の種類によって選択すべき特徴点の数が異なる。例えば、3点から求められる不変量は相似不変量となる。
図7は注目特徴点P1による不変量の算出例を示す説明図であり、図8は注目特徴点P2による不変量の算出例を示す説明図である。図7に示すように、注目特徴点P1の周辺の4つの特徴点から3つの特徴点を選択し、3通りの不変量夫々をH1j(j=1、2、3)とする。不変量H1jは、H1j=(A1j/B1j)で表される式で算出する。ここで、A1j、B1j夫々は特徴点間の距離を示している。これにより、例えば、原稿が回転、移動、傾いた場合であっても、不変量H1jは変化せず、画像の類似度の判定を精度良く行うことができ、類似する原稿を精度良く分類することができる。
同様に、図8に示すように、注目特徴点P2の周辺の4つの特徴点から3つの特徴点を選択し、3通りの不変量夫々をH2j(j=1、2、3)とする。不変量H2jは、H2j=(A2j/B2j)で表される式で算出する。ここで、A2j、B2j夫々は特徴点間の距離を示している。以下同様に、他の注目特徴点に対して不変量を算出することができる。
特徴量算出部222は、夫々の注目特徴点により算出された不変量に基づいて、ハッシュ値(特徴量)Hiを算出する。注目特徴点Piのハッシュ値Hiは、Hi=(Hi1×102 +Hi2×101 +Hi3×100 )/Eで表される。ここで、Eは余りをどの程度設定するかにより決定される定数であり、例えば、「10」とした場合には、余りは「0」〜「9」となり、これが算出するハッシュ値の取り得る範囲となる。また、iは自然数であり特徴点の数を表している。
図9は注目特徴点P3による不変量の算出の他の例を示す説明図であり、図10は注目特徴点P4による不変量の算出の他の例を示す説明図である。図9に示すように、注目特徴点P3の周辺特徴点P1、P2、P4、P5の4点より4通りの組み合わせを選択し、不変量H3j(j=1、2、3、4)を前述の場合と同様に、H3j=(A3j/B3j)により算出してもよい。
また、図10に示すように、注目特徴点P4の周辺特徴点P2、P3、P5、P6の4点より4通りの組み合わせを選択し、不変量H4j(j=1、2、3、4)を前述の場合と同様に、H4j=(A3j/B3j)により算出してもよい。図9及び図10の例の場合、注目特徴点Piのハッシュ値Hiは、Hi=(Hi1×103 +Hi2×102 +Hi3×101 +Hi4×100 )/Eで算出することができる。なお、特徴量としての上記ハッシュ値は一例であって、これに限定されるものではなく、他のハッシュ関数を用いることができる。上記では、周辺の他の特徴点として4点を抽出する例を示しているが、4点に限定されるものではない。例えば、6点抽出するようにしても良い。この場合、6点の特徴点から5点を抽出し、5点を抽出する6通りそれぞれの方法について、5点から3点を抽出して不変量を求め、ハッシュ値を算出するようにしても良い。
特徴量算出部222は、複数の原稿が順次読み取られた場合、最初の原稿を読み取って得られた画像に対して、上述の各処理を行ってハッシュ値を算出し、算出したハッシュ値(例えば、H1、H2、…)と原稿を表すインデックス(例えば、ID1)をハッシュテーブルに登録する。
また、特徴量算出部222は、最初の原稿の後に順次読み取られた原稿の画像に対しても、同様に上述の各処理を行ってハッシュ値を算出し、類似度判定処理部224が行う原稿の分類処理(すなわち、順次読み取られる原稿を原稿のカテゴリ毎に分類する処理)において、新たなカテゴリに原稿を分類する場合、その原稿を表すインデックス(例えば、ID2、ID3、…)をハッシュテーブルに登録する。
これにより、複数の原稿を読み取る都度ハッシュテーブルは初期化されるとともに、最初に読み取られた原稿の画像に基づいて算出されたハッシュ値とその原稿を表すインデックスをハッシュテーブルに登録し、この登録されたハッシュ値及び原稿を表すインデックスをもとに順次ハッシュテーブルを更新するため、予め種々の原稿のフォーマット情報に相当するハッシュ値をハッシュテーブルに登録しておく必要がなく、記憶容量を削減することができる。
図11はハッシュテーブルの構造を示す説明図である。図に示すように、ハッシュテーブルの構造は、ハッシュ値及び原稿を表すインデックスの各欄により構成されている。より具体的には、原稿を示すインデックスに対応して、原稿中の位置を示すポイントインデックス、及び不変量(いずれも不図示)が登録されている。画像の類似度を判定するため、予め照合する画像・文書画像などをハッシュテーブルに登録しておく。ハッシュテーブルはメモリ225に記憶してある。なお、図11(b)に示すように、ハッシュ値が等しい場合(H1=H5)、ハッシュテーブルの2つのエントリを1つにまとめることもできる。
投票処理部223は、複数の原稿を読み取る都度、最初に読み取られた原稿の後に順次読み取られた原稿の画像に対して、特徴量算出部222が算出したハッシュ値(特徴量)に基づいて、メモリ225に記憶されたハッシュテーブルを検索し、ハッシュ値が一致する場合、該ハッシュ値に登録されている原稿を表すインデックス(すなわち、一致するハッシュ値が算出された画像)に投票する。投票を累積加算した結果を得票数として類似度判定処理部224へ出力する。
類似度判定処理部224は、複数の原稿を読み取る都度、最初に読み取られた原稿の画像に対して抽出された特徴点の数と1つの特徴点から算出され得るハッシュ値とを乗算して得られる最大得票数(例えば、M1)、原稿を表すインデックス(例えば、ID1)、原稿のカテゴリ(例えば、C1)をカテゴリテーブルに登録する。
類似度判定処理部224は、複数の原稿を読み取る都度、最初に読み取られた原稿の後に順次読み取られた原稿の画像に対して、投票処理部223から入力された投票結果に基づいて、原稿(画像、文書画像)の類似度を判定し、判定結果(分類信号)を出力する。より具体的には、類似度判定処理部224は、投票処理部223から入力された得票数を原稿毎の最大得票数で得票数を除算して正規化した類似度を算出し、算出した類似度と予め定めた閾値(例えば、0.8)とを比較し、類似度が閾値以上である場合、その類似度が算出された原稿の画像に類似すると判定し、その原稿のカテゴリに分類する(すなわち、原稿のカテゴリを付与する)。
また、類似度判定処理部224は、複数の原稿を読み取る都度、最初に読み取られた原稿の後に順次読み取られた原稿の画像に対して、算出した類似度と予め定めた閾値(例えば、0.8)とを比較し、類似度が閾値より小さい場合には、カテゴリテーブルに登録された原稿の画像に類似しないと判定し、原稿を表すインデックス(例えば、ID2、ID3、…)、最大得票数(例えば、M2、M3、…)、新たなカテゴリ(例えば、C2、C3、…)をカテゴリテーブルに登録する。
これにより、複数の原稿を読み取る都度カテゴリテーブルは初期化されるとともに、最初に読み取られた原稿の画像に基づいて算出された最大得票数、原稿を表すインデックス及び原稿のカテゴリをカテゴリテーブルに登録し、最初に読み取られた原稿の後に順次読み取られた原稿に対して、新たなカテゴリに分類する場合には、最大得票数、原稿を表すインデックス及び原稿のカテゴリ(新たに付与されたカテゴリ)を追加する。
図12はカテゴリテーブルの構造を示す説明図である。図に示すように、カテゴリテーブルの構造は、原稿を表すインデックス、最大得票数、カテゴリの各欄により構成されている。
原稿のカテゴリの数、すなわち分類数Sは、予めその最大値(例えば、3、4、…など)が設定されてあり、操作パネル4でユーザがその最大値の範囲内で分類数Sを指定するようにしてある。
類似度判定処理部224は、原稿を分類する場合、カテゴリの数が分類数Sを超えたときには、投票処理部223から入力された得票数のうち、最も得票数が多い原稿のカテゴリに分類する。これにより、読み取られた原稿を分類数Sの範囲内で分類することができる。なお、カテゴリの数が分類数Sを超えた場合、算出された類似度が閾値より小さいときには、分類された原稿のいずれにも類似しないと判定し、非類似として分類することもできる。これにより、非類似として分類された原稿を再度読み取ることにより、一旦非類似として分類された原稿であっても、該原稿の中でお互いに類似する原稿を再度分類することができる。
類似度判定処理部224から出力される分類信号に基づいて、順次読み取られた原稿は、そのカテゴリ毎に仕分けされて排出される。例えば、原稿がカテゴリC1、C2、C3の3通りに分類された場合、順次読み取った原稿をその都度分類し、カテゴリ毎に対応する分類信号を出力することにより、排出される原稿を3通りに仕分けて排出する。
次に文書照合処理部22の動作について説明する。一例として、4枚の原稿を順次読み取る場合について説明するが、原稿の枚数はこれに限定されるものではない。また、分類数Sを「3」として説明するが、分類数Sはこれに限定されるものではない。
図13は最初の原稿を読み取った場合のハッシュテーブル及びカテゴリテーブルの例を示す説明図であり、図14は2枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図であり、図15は3枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図であり、図16は4枚目の原稿を読み取った場合の得票数の例を示す説明図である。
図13(a)に示すように、最初の原稿を読み取ることにより、ハッシュテーブルにハッシュ値(H1、H2、H3、…)及び原稿を表すインデックスID1が登録される。この場合、算出され得るハッシュ値(H1、H2、H3、…)のうち、最初の原稿(原稿を表すインデックスID1)の画像に基づいて実際に算出されるハッシュ値(図では、H1、H2、H3、H5)に対応する欄に原稿を表すインデクッスID1が登録される。
また、図13(b)に示すように、最初の原稿を読み取ることにより、原稿を表すインデックスID1、最大得票数M1、カテゴリC1が夫々登録される。最大得票数M1は、原稿ID1の画像から抽出される特徴点の数と1つの特徴点から算出され得るハッシュ値の数との乗算値である。
図14(a)に示すように、2枚目の原稿を読み取ることにより、読み取って得られた画像に基づいて算出されたハッシュ値に基づいて、ハッシュテーブルを検索し、ハッシュ値が一致する場合、一致するハッシュ値に登録されているインデックス(この場合は、ID1)の原稿について投票し、投票を累積加算した結果を得票数N21として算出する。なお、得票数Nklにおいて、kは読み取る原稿が何枚目であるかを示し、lはハッシュテーブルに登録されている原稿を表すインデックスIDlに相当する。
得票数N21により、類似度R21をR21=N21/M1を算出し、類似度R21が所定の閾値(例えば、0.8)以上であるか否かを判定する。類似度R21が閾値より小さい場合には、読み取った原稿がカテゴリC1には類似しないとして、図14(b)に示すように、投票されたハッシュ値に対応して原稿を表すインデックスID2が更新される。また、図14(c)に示すように、新たなカテゴリC2を設定し、原稿を表すインデックスID2、最大得票数M2、カテゴリC2をカテゴリテーブルに登録する。
類似度R21が閾値以上である場合には、読み取った原稿がカテゴリC1に類似するとしてカテゴリC1に分類する。この場合には、ハッシュテーブル、カテゴリテーブルに対する登録は行わない。なお、図14では、2枚目の原稿が最初の原稿に類似しないとして説明している。
図15(a)に示すように、3枚目の原稿を読み取ることにより、読み取って得られた画像に基づいて算出されたハッシュ値に基づいて、ハッシュテーブルを検索し、ハッシュ値が一致する場合、一致するハッシュ値に登録されているインデックス(この場合は、ID1、ID2)の原稿について投票し、投票を累積加算した結果を得票数N31、N32として算出する。なお、得票数Nklにおいて、kは読み取る原稿が何枚目であるかを示し、lはハッシュテーブルに登録されている原稿を表すインデックスIDlに相当する。
得票数N31により、類似度R31をR31=N31/M1を算出し、得票数N32により、類似度R32をR32=N32/M1を算出し、類似度R31、R32夫々が所定の閾値(例えば、0.8)以上であるか否かを判定する。類似度R31、R32が閾値より小さい場合には、読み取った原稿がカテゴリC1、C2のいずれにも類似しないとして、図15(b)に示すように、投票されたハッシュ値に対応して原稿を表すインデックスID3が更新される。また、図15(c)に示すように、新たなカテゴリC3を設定し、原稿を表すインデックスID3、最大得票数M3、カテゴリC3をカテゴリテーブルに登録する。
類似度R31、R32のいずれかが閾値以上である場合には、読み取った原稿がカテゴリC1又はC2に類似するとしてカテゴリC1又はC2に分類する。この場合には、ハッシュテーブル、カテゴリテーブルに対する登録は行わない。なお、類似度R31、R32の両者が閾値以上である場合には、大きい方の類似度を採用することができる。また、図15では、3枚目の原稿が先に分類されたいずれの原稿にも類似しないとして説明している。
図16に示すように、4枚目の原稿を読み取ることにより、読み取って得られた画像に基づいて算出されたハッシュ値に基づいて、ハッシュテーブルを検索し、ハッシュ値が一致する場合、一致するハッシュ値に登録されているインデックス(この場合は、ID1、ID2、ID3)の原稿について投票し、投票を累積加算した結果を得票数N41、N42、N43として算出する。この場合、すでにカテゴリがC1、C2、C3と分類数Sである3に達しているため、読み取った原稿を、算出された得票数のうち最も大きい得票数(この場合、N43)が算出された原稿ID3、すなわち、カテゴリC3に分類する。これにより、読み取られる原稿の枚数に拘わらず、所定の分類数で原稿を分類することができる。
図17乃至図19はカラー画像処理装置2(以下、処理部という)の原稿分類処理の手順を示すフローチャートである。なお、原稿分類処理は、専用のハードウエア回路で構成するだけでなく、CPU、RAM、ROMなどを備えたパーソナルコンピュータに、原稿分類処理の手順を定めたコンピュータプログラムをロードすることによりCPUでコンピュータプログラムを実行させることにより行うこともできる。
処理部は、ユーザからの操作の有無を判定し(S11)、操作がない場合(S11でNO)、ステップS11の処理を続け、ユーザからの操作があるまで待機する。ユーザからの操作があった場合(S11でYES)、処理部は、分類数の指定の有無を判定する(S12)。
分類数の指定がある場合(S12でYES)、処理部は、指定された分類数を分類数Sとし(S13)、原稿のカテゴリの数を示す指標Wを1に、処理回数を示す回数Nを1に設定する(S15)。分類数の指定がない場合(S12でNO)、処理部は、デフォルトの分類数を分類数Sとし(S14)、ステップS15の処理を続ける。
処理部は、ハッシュテーブル、カテゴリテーブルを初期化し(S16)、原稿を読み取る(S17)。処理部は、原稿を読み取って得られた画像に基づいて、特徴点を算出し(S18)、算出した特徴点に基づいてハッシュ値(特徴量)を算出する(S19)。処理部は、Nが1であるか否かを判定し(S20)、Nが1であると判定した場合(S20でYES)、算出したハッシュ値に基づいて、ハッシュテーブルに原稿を表すインデックスを登録する(S21)。
処理部は、カテゴリテーブルに原稿を表すインデックス、最大得票数、カテゴリを登録し(S22)、すべての原稿の読み取りが終了したか否かを判定する(S23)。すべての原稿の読み取りが終了していない場合(S23でNO)、処理部は、処理回数を示す回数Nに1を加算し(S24)、新たな処理回数として、ステップS17以降の処理を続ける。
一方、ステップS20で、Nが1でないと判定した場合(S20でNO)、処理部は、投票処理を行い(S25)、類似度を算出する(S26)。処理部は、Wが分類数Sに等しいか否かを判定し(S27)、Wが分類数Sに等しい場合(S27でYES)、読み取った原稿を得票数が最大の原稿のカテゴリに分類し(S28)、ステップS23以降の処理を続ける。
Wが分類数Sに等しくない場合(S27でNO)、処理部は、算出した類似度が閾値以上であるか否かを判定し(S29)、類似度が閾値以上である場合(S29でYES)、読み取った原稿を類似度が大きい原稿のカテゴリに分類し(S30)、ステップS23以降の処理を続ける。類似度が閾値以上でない場合(S29でNO)、処理部は、Wに1を加算し(S31)、ステップS21以降の処理を続ける。すべての原稿の読み取りが終了した場合(S23でYES)、処理部は、処理を終了する。
なお、文書照合処理部22における上述の処理は、原稿を順次読み取って原稿を分類する場合に限定されるものではなく、順次入力された画像データを分類する場合も同様に行うことができる。
図20は本発明に係る原稿読取装置500の構成を示すブロック図である。図に示すように、原稿読取装置500は、カラー画像入力装置1、A/D変換部20、シェーディング補正部21、文書照合処理部22、原稿シフター機構50などを備えている。カラー画像入力装置1、A/D変換部20、シェーディング補正部21、文書照合処理部22は、上述の画像形成装置100の場合と同様であるので説明は省略する。
原稿シフター機構50は、文書照合処理部22から出力される分類信号を取得し、順次読み取った原稿を分類信号に応じて分類して排出する。詳細は後述する。
図21は本発明に係る原稿読取装置500の構成を示す模式図である。原稿読取装置500は、上部筐体510で構成される原稿搬送部、下部筐体560で構成されるスキャナ部などを備える。
上部筐体510には、原稿トレイ511に載置された原稿を1枚ずつ搬送するための呼込みローラ512、原稿上の画像を読み取るために原稿を搬送する搬送ローラ513a、513b、原稿を排出する際に、文書照合処理部22から入力される分類信号に基づいて、原稿のカテゴリ毎に原稿を搬送方向(排出方向)に対して排出位置をシフトさせる原稿シフター機構50、排出される原稿を検知する原稿排出センサ567などを設けている。なお、原稿シフター機構50は、上下2つに分離することができるように構成されている。
下部筐体560には、載置台561の下面に沿って平行に往復移動する走査ユニット562、563、結像レンズ564、及び光電変換素子であるCCDラインセンサ565、原稿シフター機構50、排出トレイ566などが設けてある。走査ユニット562は、原稿トレイ511から搬送される原稿、あるいは、載置台561に載置された原稿に光を照射するための光源562a(例えば、ハロゲンランプなど)、原稿で反射された光を所定の光路に導くためのミラー562bなどを備えている。また、走査ユニット563は、原稿で反射された光を所定の光路に導くためのミラー563a、563bなどを備えている。
結像レンズ564は、走査ユニット563から導かれた反射光をCCDラインセンサ565上の所定の位置に結像させる。CCDラインセンサ565は、結像された光像を光電変換して電気信号を出力する。すなわち、原稿(例えば、原稿の表面)から読み取ったカラー画像に基づいて、R(赤)、G(緑)、B(青)の各色成分に色分解したデータをカラー画像処理装置2へ出力する。
図22及び図23は原稿シフター機構50の構成を示す横断面図である。原稿シフター機構50は、上下に分離可能な横断面が矩形状の筐体51、52を備え、筐体51は下部筐体560に支持され、筐体52は上部筐体510に支持されている。筐体52には、オフセット部材60、回転駆動源65、駆動伝達部材70、オフセット用駆動源75、オフセット用駆動伝達部材80などを設けてある。
オフセット部材60は、水平方向(図中、Y方向、すなわち原稿排出方向に直交する方向)に移動可能であり、筐体52の内側に配置された横断面が矩形状の筐体61、筐体61の長手方向に沿って適長離隔したオフセットローラ62、…などを備えている。オフセット部材60は、水平方向に移動することにより、原稿をオフセット排出(原稿のカテゴリ毎に原稿を水平方向にシフトして排出)する。筐体61は、原稿を搬送方向に排出するようにオフセットローラ62、…を回転自在に支持する。オフセットローラ62、…は、原稿を排出する際に原稿をチャックして排出トレイ566に排出する。
駆動伝達部材70は、回転駆動源65に接続された駆動ギア71、駆動ギア71の中央部に嵌合されたシャフト72、シャフト72上に配置された連結ギア73a、スライド部材74、連結ギア73aに螺合する連結ギア73bなどを備え、連結ギア73bの中央部には、棒状の支持部材63を嵌合してあり、支持部材63上には、適長離隔してオフセットローラ62、…を固定してある。これにより、回転駆動源65からの駆動力をオフセットローラ62、…に伝達する。
シャフト72は、水平方向に回転自在に支持され、スライド部材74は、シャフト72上を摺動することができる。また、シャフト72は、スライド部材74、連結ギア73a、73bを介してオフセット部材60を原稿の排出(搬送)方向に直交する方向(水平方向)に移動させることができる。また、シャフト72は、連結ギア73a、73b、オフセット部材60の水平方向の移動範囲を規制するため、スライド部材74に設けられた軸方向に長い孔74aに係合する規制部材72aを設けている。規制部材72aが孔74aの内側に沿って移動する際に孔74aの両端部に当接することにより、連結ギア73a、73b、オフセット部材60の水平方向の移動範囲を規制する。
回転駆動源65からの駆動力は、駆動ギア71に伝わり、駆動ギア71が回転することにより、シャフト72が回転し、シャフト72の回転に伴って、連結ギア73a、73bに回転が伝わり、連結ギア73bの回転により支持部材63が回転してオフセットローラ62が回転する。オフセットローラ62、…夫々に当接してオフセットローラ62、…の回転に従動して回転するオフセットローラ64、…が支持部材63に並行に配置された支持部材68上に配置してある。
上部筐体510、下部筐体560夫々に配置されたオフセット用駆動源75、75夫々には、ピニオンギア81、ラックギア82から構成されるオフセット用駆動伝達部材80、80を接続してあり、ラックギア82、82には、筐体61、61を固定してある。ピニオンギア81の回転に応じて、ラックギア82を水平方向(図中、Y方向)に移動させる。これにより、ラックギア82、82は、筐体61、61を水平方向に移動させる。オフセット用駆動源75、75は、文書照合処理部22から出力される分類信号に応じて同期して制御され、筐体61、61の水平方向に異なる位置に移動させる。これにより、オフセットローラ62、…、及びオフセットローラ64、…が同時に同じ方向にオフセット(シフト)されて原稿の排出位置が制御される。
図23では図22の場合に比較してオフセットローラ62、…、及びオフセットローラ64、…がオフセットされている。
図24は原稿の排出位置を示す説明図である。図では、原稿を3つのカテゴリに分類する場合を示す。例えば、カテゴリC1、C2、C3に応じて、原稿の排出(搬送)方向に直交する方向(Y方向)に原稿の排出位置をY1、Y2、Y3の如く、例えば、1インチ程度オフセット(シフト)させる。これにより、ユーザが多数の原稿を目視で分類する作業を行う必要がなくなり、原稿を原稿読取装置で読み取らせるだけで従来に比較して容易に原稿を分類することができる。なお、原稿のオフセット量(シフト量)は、1インチに限定されるものではない。
上述の実施の形態においては、複数の原稿を読み取る都度、ハッシュテーブル、カテゴリテーブルを初期化して、その内容を消去する構成であったが、これに限定されるものではなく、搭載するメモリの最大容量に応じて、登録された情報をすべて消去せずに残しておく構成とすることもできる。この場合には、所定の記憶容量を決めておき、古い情報から削除するようにしてメモリ容量が増大することを防止できる。また、この場合には、最初に読み取った原稿の画像に基づいてハッシュテーブル、カテゴリテーブルの登録を行う必要はなく、すでに記憶されているハッシュテーブル、カテゴリテーブルを用いて、最初に読み取られる原稿の画像に基づいて類似度を算出して原稿を分類することができる。
上述の実施の形態においては、分類したカテゴリの数が所定の分類数Sに達した場合、その後に順次読み取られる原稿は、得票数が最大の原稿のカテゴリに分類される構成であったが、これに限定されるものではない。例えば、分類したカテゴリの数が所定の分類数Sに達した場合、その後に順次読み取られる原稿は、類似度が閾値以上であれば、その原稿のカテゴリに分類し、類似度が閾値より小さい場合には、類似する原稿がない(非類似)として、まとめて分類するように構成することもできる。非類似として分類された原稿を再度読み取って、同様の処理を繰り返すことにより、一旦非類似として分類された原稿であっても、その原稿の中でお互いに類似する原稿を再度分類することができる。
上述の実施の形態においては、原稿の片面を読み取る構成であったが、これに限定されるものではなく、原稿の両面を読み取る構成にすることもできる。この場合、原稿の各面の画像の類似度夫々が閾値以上であるときに類似する原稿であると判定するように構成することができる。
上述の実施の形態においては、文書照合処理を原稿読取装置500で行う構成であったが、これに限定されるものではなく、外部のパーソナルコンピュータで文書照合処理を行い、処理結果を原稿読取装置へ転送することにより、原稿を分類する構成にすることもできる。
実施の形態2
上述の実施の形態1では、原稿シフター機構を設ける構成を示したが、原稿シフター機構は、原稿を排出する際にオフセットする構成に限定されるものではなく、排出トレイを原稿の排出(搬送)方向に直交する方向に可動させるように構成してもよい。この場合、原稿シフター機構において原稿をシフトさせる必要はなく、原稿を排出(搬送)させる機構があればよい。
図25は排出トレイを可動させる場合の原稿シフター機構300の構成を示す模式図であり、図26は原稿シフター機構300の構成を示す横断面図である。原稿シフター機構300は、原稿読取装置本体に固定される支持トレイ部材301及び支持トレイ部材301の上側に配置される可動トレイ部材302などを備えている。なお、原稿読取装置500の構成については、実施の形態1と同様であるので、同一箇所には同一符号を付し、説明を省略する。
支持トレイ部材301の上面には、外形寸法よりやや小さい矩形状の凹部303を設けてあり、凹部303に収容される形で、金属製の二本の互いに略平行な棒状の案内シャフト304、305が適長離隔して取り付けられている。具体的には、案内シャフト304、305夫々は、支持トレイ部材301の側壁に形成された貫通孔310、311、312、313、凹部303の底面から適長離隔して立設された軸受306、307、308、309に挿通されるとともに、軸受306、307、308、309で支承されている。
凹部303中央部には、モータ、歯車列が内蔵された減速ギアボックス(不図示)、ピニオン314などを備える駆動ユニット(不図示)を設けてあり、モータの回転は、歯車列により減速されてピニオン314に伝達される。可動トレイ部材302の上面内側には、案内シャフト304、305と平行に配置され、ピニオン314と噛合するラック315が取り付けられている。ピニオン314が回転することにより、ラック315が案内シャフト304、305の軸方向に移動する。
また、可動トレイ部材302の側縁部には、側縁辺に沿って(原稿の搬送方向に沿って)突条部316、317が形成されてあり、各突条部316、317には、案内シャフト304、305の端部が挿入され案内シャフト304、305を支承する軸受320、321、322、323を設けてある。以上の構成により、モータを駆動してピニオン314が回転すると、ピニオン314の回転がラック315に伝達されて、可動トレイ部材302は案内シャフト304、305に案内されて支持トレイ部材301に対してシートの搬送方向に直交する方向(図中矢印方向)に移動する。なお、可動トレイ部材302を移動させる手段としては、ラック及びピニオン機構に限定されるものではなく、エンドレスベルト機構又はリニアモータなどの他の機構を用いることもできる。
原稿の排出(搬送)方向に直交する方向に可動トレイ部材302を移動させる場合、例えば、実施の形態1と同様に、1インチ程度移動させることができる。これにより、ユーザが多数の原稿を目視で分類する作業を行う必要がなくなり、原稿を原稿読取装置で読み取らせるだけで従来に比較して容易に原稿を分類することができる。なお、原稿のオフセット量(シフト量)は、1インチに限定されるものではない。
実施の形態3
上述の実施の形態1及び2では、原稿を排出する際にオフセットする構成であったが、原稿を分類する方法は、これに限定されるものではなく、排出トレイを複数設けておき、分類信号に応じて原稿を排出する排出トレイを切替える構成とすることもできる。
図27は実施の形態3の原稿読取装置501の構成を示す模式図である。原稿搬送部520は、原稿トレイ521、回動可能であって原稿トレイ521に積層して載置された原稿を1枚ずつ搬送するための呼込みローラ522a及び捌きローラ522b、搬送された原稿を排出トレイ527a、527b、527cまで搬送するための搬送路525、搬送路525の中途に適宜設けられたレジストローラ524a、搬送ローラ524b、及び排出ローラ524cなどを備える。
排出ローラ524cの下流側には、原稿を排出する排出トレイを切替えるためのゲート523b、523d(可撓性又は自重により下方向に位置する)、523cが設けられ、ゲート523dとゲート523cとの間には、搬送ローラ524dを配置している。原稿を排出する場合、分類信号に基づいて、ゲート523b、523d、523cを駆動して、カテゴリC1の原稿は排出トレイ527aに排出し、カテゴリC2の原稿は排出トレイ527bに排出し、カテゴリC1、C2のいずれにも分類できない原稿は非類似として排出トレイ527cに排出する。
すなわち、カテゴリC1の原稿を排出する場合、ゲート523bを上方向に駆動することにより、原稿を排出トレイ527aに排出する。また、カテゴリC2の原稿を排出する場合、ゲート523bを下方向に、ゲート523cを上方向に駆動することにより、原稿を排出トレイ527bに排出する。また、カテゴリC1、C2のいずれにも非類似として原稿を排出する場合、ゲート523bを下方向に、ゲート523cを下方向に駆動することにより、原稿を排出トレイ527cに排出する。なお、排出トレイの数を増加することにより、分類するカテゴリの数を増加することができる。
原稿トレイ521の原稿載置面には、原稿の有無を検出する原稿センサ521aを設けている。原稿センサ521aは、原稿トレイ521に載置された原稿がすべて搬送された場合、原稿が存在しないことを示す信号を出力する。これにより、原稿の搬送がすべて終了したか否かを判定することができる。
捌きローラ522bの下流側には、搬送路525と分離され、略180度湾曲した原稿搬送路526を設けている。原稿搬送路526の中途には、回動可能な原稿ローラ524eを設けてあり、原稿搬送路526に繋がるように排出トレイ527cが取付けられている。呼込みローラ522a、捌きローラ522b、及び原稿ローラ524eは、ローラ駆動部(不図示)により、正回転及び反転回転する。
搬送路525と原稿搬送路526との分岐点には、ゲート駆動部(不図示)により揺動可能なゲート523aが配置され、ゲート523aが下方向に駆動されることにより、原稿トレイ521に載置された原稿は、搬送路525側に搬送される。一方、ゲート523aが上方向に駆動されることにより、一旦排出トレイ527cに排出された原稿を原稿トレイ521へ搬送する。すなわち、本実施の形態においては、カテゴリC1、C2のいずれにも分類できない非類似原稿として排出トレイ527cに排出された原稿に対して、新たに原稿をセットすることなく、引き続き原稿の分類を行うことができる。
下部筐体で構成されるスキャナ部560は、実施の形態1及び2と同様であるので、同一箇所には同一符号を付して説明は省略する。
実施の形態4
実施の形態3では、原稿読取装置501に複数の排出トレイを内蔵する構成であったが、原稿を分類して排出する方法は、これに限定されるものではなく、他の構成であってもよい。例えば、排出トレイに代えて、複数段の排出トレイを備えたオプション機構を追加する構成であってもよい。
図28は実施の形態4の原稿読取装置502の構成を示す模式図である。図に示すように、原稿を分類して排出するためのオプション機構530を設けている。オプション機構530は、排出トレイ534a、534b、534c、534d、各排出トレイに分けて原稿を排出するため原稿の搬送路を切替えるゲート533、…、排出ローラ532、…などを備えている。なお、原稿の排出は、実施の形態2と同様であるので説明は省略する。
実施の形態5
上述の本発明を電子データ又は電子化データ等の画像データに対して適用することもできる。例えば、電子データ又は電子化データ等の画像データの形態で提出されたデータをサーバに格納しておき、これらのデータに対して、本発明をアプリケーションソフトウェアとして適用することができる。なお、上記データは、電子データ、ファイルフォーマット毎に格納されているのが好ましい。
ここで、電子データとは、例えば、アプリケーションソフトウェアで作成されたデータ、ワードプロセッサなどのツールで生成されるフォント又はグラフなどのベクタデータ、符号化されたデータとラスタ画像データとで構成されたデータなどを意味している。また、電子化データとは、例えば、スキャナで読み込まれたデータをJPEG又はPDFなど所定のファイルフォーマットに変換したデータなどを意味している。電子データの場合には、上述のようにベクタデータや符号化されたデータを含むために、スキャナなどの画像読取装置から入力されたデータを対象とした処理とは異なる構成が必要になる。すなわち、電子データ又は電子化データに対して所要の変換処理が必要となる。
図29は電子データ又は電子化データに対する変換処理を行うデータ変換部の構成を示すブロック図である。図29において、40はデータ変換部である。データ変換部40は、フォーマット判別部401、フォーマット解析部402、ラスタ画像データ生成部403、復号化部404、画像データ合成部405などを備えている。なお、データ変換部40は、専用のハードウエア回路で構成するだけでなく、CPU、RAM、ROMなどを備えたパーソナルコンピュータに、データ変換処理の手順を定めたコンピュータプログラムをロードすることによりCPUでコンピュータプログラムを実行させることにより行うこともできる。また、データ変換部40は、カラー画像処理装置2に組み込むことができる。
データ変換部40で変換されたデータは、文書照合処理部22へ出力される。文書照合処理部22では、入力された画像データ(電子データ、電子化データ)に対して、実施の形態1の場合と同様に、文書照合処理を行い、電子データ又は電子化データについて、順次登録を行いながら分類(ファイリングなど)を行う。
フォーマット判別部401は、入力された電子データ又は電子化データのヘッダーの情報やファイルの拡張子によりデータのフォーマットを判別する。
フォーマット解析部402は、判別されたフォーマットの記述規則に従って、データのフォーマットを解析し、電子データに含まれるデータをベクタデータ、ラスタデータ、符号化データに分解する。ここで、記述規則は、例えば、オブジェクトの情報(テキスト、図又は写真等)毎の情報をタグとして保有するなどファイルの記述規則である。この場合タグの情報を参照するによりフォーマットを解析することができる。
ラスタ画像データ生成部403は、ベクタデータをラスタ画像に変換してRGBのビットマップデータに変換する。例えば、RIP(ラスター・イメージ・プロセッサー)を用いて、PDL(ページ記述言語)を解釈しラスタ画像に変換しても良いし、ベクタデータのフォーマットごとに変換ツール(例えば、記述言語に応じて変換するソフトウェア)を準備して変換しても良い。
復号化部404は、符号化データをそれぞれの符号化の方法に基づいて復号化して、RGBのビットマップデータに変換する。例えば、JPEGフォーマットの場合、一旦、復号処理を行い、さらに、YCC信号をRGB信号に変換する。ラスタデータに対しては、特に変換を行わない。
画像データ合成部405は、ラスタ画像データ生成部403、及び復号化部404から入力されたデータを合成してRGBのビットマップデータを作成し、作成したビットマップデータ(画像データ)を文書照合処理部22へ出力する。
文書照合処理部22は、実施の形態1の例のような方法で類似度を判定し、その判定結果を用いて、本発明に提案する方法で電子データを登録しながら分類(例えば、所定のフォルダへのファイリング)を行う。実施の形態5においても、所定のフォルダに分類されない電子データ(非類似として分類された電子データ)を1つのフォルダ(例えば、非類似として分類するための他のフォルダ)に格納し、これらのデータを再度用いて、登録しながら分類するようにしても良い。JPEGやGIFなどのように符号化された電子化データについては、ラスタ画像データ生成部403のみを用いて、例えば、JPEGやGIFなどの符号化された画像フォーマットの場合は、一旦、復号化部404で復号処理を行い、さらに、必要に応じてYCC信号をRGB信号に変換すれば良い。
図30は実施の形態5の分類処理の手順を示すフローチャートである。データ変換部40は、入力された画像データ(電子データ、電子化データ)のフォーマットを判別し(S41)、判別されたフォーマットの記述規則に従って、いずれのデータフォーマットであるか解析する(S42)。
データフォーマットがベクタデータである場合(S42でベクタデータ)、データ変換部40は、ベクタデータをラスタ画像データに変換する(S43)。データフォーマットが符号化データである場合(S42で符号化データ)、データ変換部40は、符号化データに対して復号化処理を行う(S44)。データフォーマットがラスタデータである場合(S42でラスタデータ)、データ変換部40は、データの変換を行わずに後述のステップS45の処理を行う。
データ変換部40は、画像データを合成する(S45)。文書照合処理部22は、電子データを登録しながら分類(例えば、所定のフォルダへのファイリング)する文書照合処理を行い(S46)、処理を終了する。なお、文書照合処理は、上述の図17乃至図19の例と同様である。
以上説明したように、本発明にあっては、予め原稿のフォーマット情報などを登録することなく、原稿を分類することができる。また、電子データ又は電子化データについても、順次登録を行いながら分類(ファイリングなど)を行うことができる。また、所定の分類数に応じて原稿(又は画像データ)を分類することができる。また、所定の分類数に分類できない原稿(又は画像データ)がある場合であっても、分類できた原稿(又は画像データ)と分類できない原稿(又は画像データ)とを区別することができる。また、一旦非類似として分類された原稿(又は画像データ)であっても、該原稿(又は該画像データ)の中でお互いに類似する原稿(又は画像データ)を再度分類することができる。さらに、ユーザが手作業で原稿を分類する必要がなく、原稿読取装置で原稿を読み取るだけで自動的に原稿を分類することができ、ユーザの利便性が著しく向上する。また、読み込まれた画像データを分類信号に基づいて、予め定められたフォルダに格納(ファイル)するようにしても良い。ファイルは画像形成装置内のメモリに格納するようにしても良く、あるいは、ネットワークを介して接続されている外部記憶装置、サーバに格納するようにしても良い。
上述の実施の形態において、カラー画像入力装置1としては、例えば、フラットベッドスキャナ、フィルムスキャナ、デジタルカメラ、携帯電話機などが用いられる。また、カラー画像出力装置3としては、例えば、CRTディスプレイ、液晶ディスプレイなどの画像表示装置、処理結果を記録紙などに出力する電子写真方式又はインクジェット方式のプリンタなどが用いられる。さらに画像形成装置100としては、ネットワークを介してサーバ装置などに接続するための通信手段としてのモデムなどを備えることもできる。また、カラー画像入力装置1からカラー画像データを取得する代わりに、ネットワークを介して外部記憶装置、サーバ装置などからカラー画像データを取得する構成であってもよい。
上述の実施の形態では、文書照合処理部22の中にメモリ225、制御部226を備える構成であるが、これに限定されるものではなく、メモリ225、制御部226を文書照合処理部22の外部に設ける構成であってもよい。
本発明はコンピュータに実行させるためのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータでの読み取り可能な記録媒体に、原稿分類処理を行うプログラムコードを記録することもできる。この結果、上記原稿分類処理を行うプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。記録媒体としては、マイクロコンピュータで処理が行われるために図示しないメモリ、例えばROMのようなプログラムメディアであってもよく、図示しない外部記憶装置としてのプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。
いずれの場合においても、格納されているプログラムコードはマイクロプロセッサがアクセスして実行させる構成であってもよいし、プログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。この場合、ダウンロード用のコンピュータプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスクやハードディスク等の磁気ディスク並びにCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メ
モリを含めた固定的にプログラムコードを担持する媒体であってもよい。
また、この場合、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のコンピュータプログラムは予め本体装置に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。 文書照合処理部の構成を示すブロック図である。 特徴点算出部の構成を示すブロック図である。 連結領域の特徴点の例を示す説明図である。 文字列に対する特徴点の抽出結果の例を示す説明図である。 注目特徴点と周辺の特徴点を示す説明図である。 注目特徴点による不変量の算出例を示す説明図である。 注目特徴点による不変量の算出例を示す説明図である。 注目特徴点による不変量の算出の他の例を示す説明図である。 注目特徴点による不変量の算出の他の例を示す説明図である。 ハッシュテーブルの構造を示す説明図である。 カテゴリテーブルの構造を示す説明図である。 最初の原稿を読み取った場合のハッシュテーブル及びカテゴリテーブルの例を示す説明図である。 2枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図である。 3枚目の原稿を読み取った場合のハッシュテーブル、得票数及びカテゴリテーブルの例を示す説明図である。 4枚目の原稿を読み取った場合の得票数の例を示す説明図である。 カラー画像処理装置の原稿分類処理の手順を示すフローチャートである。 カラー画像処理装置の原稿分類処理の手順を示すフローチャートである。 カラー画像処理装置の原稿分類処理の手順を示すフローチャートである。 本発明に係る原稿読取装置の構成を示すブロック図である。 本発明に係る原稿読取装置の構成を示す模式図である。 原稿シフター機構の構成を示す横断面図である。 原稿シフター機構の構成を示す横断面図である。 原稿の排出位置を示す説明図である。 排出トレイを可動させる場合の原稿シフター機構の構成を示す模式図である。 原稿シフター機構の構成を示す横断面図である。 実施の形態3の原稿読取装置の構成を示す模式図である。 実施の形態4の原稿読取装置の構成を示す模式図である。 電子データ又は電子化データに対する変換処理を行うデータ変換部の構成を示すブロック図である。 実施の形態5の分類処理の手順を示すフローチャートである。
符号の説明
1 カラー画像入力装置
2 カラー画像処理装置
3 カラー画像出力装置
22 文書照合処理部
40 データ変換部
401 フォーマット判別部
402 フォーマット解析部
403 ラスタ画像データ生成部
404 復号化部
405 画像データ合成部
50、300 原稿シフター機構
221 特徴点算出部
222 特徴量算出部
223 投票処理部
224 類似度判定処理部
225 メモリ
226 制御部
2211 解像度変換部
2212 フィルタ処理部
2213 二値化処理部
2214 重心算出部

Claims (19)

  1. 複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置による画像処理方法において、
    最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶手段に記憶する第1記憶ステップと、
    最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定手段で判定する判定ステップと、
    特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、
    投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、
    投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、
    新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶手段に記憶する第2記憶ステップと
    を備え
    前記決定手段は、
    記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定し、
    さらに、付与された識別子に基づいて原稿を分類手段で分類するステップを備えることを特徴とする画像処理方法。
  2. 複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置による画像処理方法において、
    最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶手段に記憶する第1記憶ステップと、
    最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定手段で判定する判定ステップと、
    特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票手段で投票する投票ステップと、
    投票で得られた得票数に基づいて、画像の類似度を算出手段で算出する算出ステップと、
    投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定手段で決定する決定ステップと、
    新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶手段に記憶する第2記憶ステップと
    を備え
    前記決定手段は、
    記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定し
    さらに、付与された識別子に基づいて画像データを分類手段で分類するステップを備えることを特徴とする画像処理方法。
  3. 記決定手段は、
    記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定することを特徴とする請求項1又は請求項2に記載の画像処理方法。
  4. 前記画像処理装置は、
    非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去ステップ、前記原稿を読み取り又は画像データを入力し、前記第1記憶ステップ、判定ステップ、投票ステップ、算出ステップ、決定ステップ、及び第2記憶ステップの各ステップを少なくとも1回繰り返すことを特徴とする請求項1乃至請求項3のいずれか1つに記載の画像処理方法。
  5. 複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出し、抽出した特徴量に基づいて原稿を分類するための処理を行う画像処理装置において、
    最初に読み取られた原稿の画像の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、
    最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、
    該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
    該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
    新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する手段と、
    付与された識別子に基づいて原稿を分類する手段と
    を備え
    前記決定手段は、
    記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする画像処理装置。
  6. 複数の画像データより順次各画像データの特徴量を複数抽出し、抽出した特徴量に基づいて画像データを分類するための処理を行う画像処理装置において、
    最初に入力された画像データの特徴量及び該画像データを分類するために付与された識別子を記憶する記憶手段と、
    最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、
    該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
    該投票手段で投票されて得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
    新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する手段と、
    付与された識別子に基づいて画像データを分類する手段と
    を備え
    前記決定手段は、
    記憶された識別子の数が所定数に達した場合、順次入力された画像データに、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する画像データの識別子を付与すべく構成してあることを特徴とする画像処理装置。
  7. 前記投票手段で投票されて得られた得票数に基づいて、画像の類似度を算出する算出手段を備え、
    前記決定手段は、
    記憶された識別子の数が所定数に達しない場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定すべく構成してあることを特徴とする請求項5又は請求項6に記載の画像処理装置。
  8. 前記決定手段は、
    記憶された識別子の数が所定数に達した場合、前記算出手段で算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は前記原稿若しくは前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とする請求項5乃至請求項7のいずれか1つに記載の画像処理装置。
  9. 請求項、請求項7又は請求項のいずれか1つに記載の画像処理装置を備え、原稿を読み取る原稿読取装置であって、
    前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段を備えることを特徴とする原稿読取装置。
  10. 請求項に記載の画像処理装置を備え、原稿を読み取る原稿読取装置であって、
    前記画像処理装置で決定された分類毎に原稿を分類して排出する分類排出手段と、
    非類似として分類された原稿を再度読み取るため、該原稿を搬送する搬送手段と
    を備え、
    前記原稿を再度読み取る場合、記憶された特徴量及び識別子を消去すべく構成してあることを特徴とする原稿読取装置。
  11. 前記分類排出手段は、
    分類毎に原稿の排出位置を変位するように構成してあることを特徴とする請求項又は請求項10に記載の原稿読取装置。
  12. 原稿を排出する排出トレイを複数備え、
    前記分類排出手段は、
    分類毎に原稿を異なる排出トレイに排出するように構成してあることを特徴とする請求項又は請求項10に記載の原稿読取装置。
  13. 原稿を読み取る原稿読取装置において、
    原稿の画像の複数の特徴量及び該原稿を分類するために付与された識別子を記憶する記憶手段と、
    順次読み取られた原稿に対して、該原稿の画像に基づいて抽出された複数の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、
    該判定手段で特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
    該投票手段で投票されて得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか否かを決定する決定手段と、
    該決定手段で決定された識別子毎に原稿を分類して排出する分類排出手段と
    を備え
    前記決定手段は、
    記憶された識別子の数が所定数に達した場合、順次読み取られた原稿に、記憶された識別子のうち、投票で得られた得票数が最大である画像に対応する原稿の識別子を付与すべく構成してあることを特徴とする原稿読取装置。
  14. 請求項乃至請求項13のいずれか1つに記載の原稿読取装置と、該原稿読取装置で原稿を読み取って得られた画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする画像形成装置。
  15. コンピュータに、複数の原稿を順次読み取って得られた各画像の特徴量を複数抽出させ、抽出した特徴量に基づいて原稿を分類するための処理を行わせるためのコンピュータプログラムにおいて、
    コンピュータを、最初に読み取られた原稿の画像の特徴量を抽出し、抽出した特徴量及び前記原稿を分類するために付与された識別子を記憶する第1記憶手段と、
    コンピュータを、最初に読み取られた原稿の後に順次読み取られた原稿に対して、該原稿の画像の特徴量と記憶された識別子で分類された原稿の画像の特徴量とが一致するか否かを判定する判定手段と、
    コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
    コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、
    コンピュータを、投票で得られた得票数に基づいて、前記順次読み取られた原稿に、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
    コンピュータを、新たな識別子を付与する場合、該識別子で分類される原稿の画像の特徴量及び該識別子を記憶する第2記憶手段と、
    付与された識別子に基づいて原稿を分類する手段と
    して機能させ
    前記決定手段は、
    記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次読み取られた原稿に、記憶された識別子を付与するか又は前記原稿を非類似として分類するかを決定すべく構成してあることを特徴とするコンピュータプログラム。
  16. コンピュータに、複数の画像データより順次各画像データの特徴量を複数抽出させ、抽出した特徴量に基づいて画像データを分類するための処理を行わせるためのコンピュータプログラムにおいて、
    コンピュータを、最初に入力された画像データの特徴量を抽出し、抽出した特徴量及び前記画像データを分類するために付与された識別子を記憶する第1記憶手段と、
    コンピュータを、最初に入力された画像データの後に順次入力された画像データに対して、該順次入力された画像データの特徴量と記憶された識別子で分類された最初に入力された画像データの特徴量とが一致するか否かを判定する判定手段と、
    コンピュータを、特徴量が一致すると判定された場合、一致した特徴量毎に該特徴量が抽出された画像に投票する投票手段と、
    コンピュータを、投票で得られた得票数に基づいて、画像の類似度を算出する算出手段と、
    コンピュータを、投票で得られた得票数に基づいて、前記順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と、
    コンピュータを、新たな識別子を付与する場合、該識別子で分類される画像データの特徴量及び該識別子を記憶する第2記憶手段と、
    付与された識別子に基づいて画像データを分類する手段と
    して機能させ
    前記決定手段は、
    記憶された識別子の数が所定数に達した場合、算出された画像の類似度に基づいて、順次入力された画像データに、記憶された識別子を付与するか又は前記画像データを非類似として分類するかを決定すべく構成してあることを特徴とするコンピュータプログラム。
  17. ンピュータを、記憶された識別子の数が所定数に達しない場合、算出された画像の類似度に基づいて、順次読み取られた原稿又は順次入力された画像データに、記憶された識別子を付与するか又は新たな識別子を付与するかを決定する決定手段と
    して機能させることを特徴とする請求項15又は請求項16に記載のコンピュータプログラム。
  18. コンピュータを、非類似として分類された原稿又は画像データがある場合、記憶された特徴量及び識別子を消去する消去手段、前記原稿を読み取り又は画像データを入力し、前記第1記憶手段、判定手段、投票手段、算出手段、決定手段、及び第2記憶手段の各手段として少なくとも1回繰り返すよう機能させることを特徴とする請求項15乃至請求項17のいずれか1つに記載のコンピュータプログラム。
  19. 請求項15乃至請求項18のいずれか1つに記載のコンピュータプログラムを記録してあることを特徴とするコンピュータでの読み取りが可能な記録媒体。
JP2007207094A 2006-08-24 2007-08-08 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体 Expired - Fee Related JP4257925B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007207094A JP4257925B2 (ja) 2006-08-24 2007-08-08 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体
US11/892,392 US7948664B2 (en) 2006-08-24 2007-08-22 Image processing method, image processing apparatus, document reading apparatus, image forming apparatus, computer program and recording medium
CN2007101676045A CN101136981B (zh) 2006-08-24 2007-08-24 图像处理方法和装置、文档读取装置和图像形成装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006228354 2006-08-24
JP2007207094A JP4257925B2 (ja) 2006-08-24 2007-08-08 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2008077641A JP2008077641A (ja) 2008-04-03
JP4257925B2 true JP4257925B2 (ja) 2009-04-30

Family

ID=39113105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007207094A Expired - Fee Related JP4257925B2 (ja) 2006-08-24 2007-08-08 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体

Country Status (3)

Country Link
US (1) US7948664B2 (ja)
JP (1) JP4257925B2 (ja)
CN (1) CN101136981B (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102907A (ja) * 2006-09-19 2008-05-01 Sharp Corp 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体
JP4482590B2 (ja) * 2008-03-21 2010-06-16 シャープ株式会社 画像読取装置、画像読取方法、画像形成装置およびプログラム
EP2141651B1 (en) * 2008-04-08 2018-06-13 Avid Technology, Inc. Framework to integrate and abstract processing of multiple hardware domains, data types and format
JP2009271831A (ja) * 2008-05-09 2009-11-19 Sharp Corp 画像データ処理装置
JP2009278363A (ja) * 2008-05-14 2009-11-26 Canon Inc 画像処理装置及び画像処理方法
JP4565015B2 (ja) * 2008-05-15 2010-10-20 シャープ株式会社 画像処理装置、画像形成装置、画像処理システム、画像処理プログラムおよびその記録媒体
CN101635763A (zh) * 2008-07-23 2010-01-27 深圳富泰宏精密工业有限公司 图片分类系统及方法
FR2953043A1 (fr) * 2009-11-23 2011-05-27 Sagem Comm Procede de traitement d'un document a associer a un service, et scanner associe
US8611674B1 (en) * 2010-01-18 2013-12-17 Disney Enterprises, Inc. System and method for invariant-based normal estimation
JP5073773B2 (ja) * 2010-04-08 2012-11-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法及びプログラム
JP5505182B2 (ja) * 2010-08-09 2014-05-28 富士ゼロックス株式会社 画像判定装置及びプログラム
JP5179559B2 (ja) 2010-11-12 2013-04-10 シャープ株式会社 画像処理システムを制御する制御装置、画像形成装置、画像読取装置、制御方法、画像処理プログラム及びコンピュータ読み取り可能な記録媒体
CN104126287B (zh) * 2011-12-29 2017-10-27 施耐德电器工业公司 更新网络中的参数
US9569440B2 (en) * 2013-02-22 2017-02-14 Sony Corporation Method and apparatus for content manipulation
CN104636325B (zh) * 2015-02-06 2015-09-30 中南大学 一种基于极大似然估计确定文档相似度的方法
CN104866822B (zh) * 2015-05-06 2018-08-24 南京信息工程大学 一种基于sivv特征的文档图像粗分类方法
US9659214B1 (en) * 2015-11-30 2017-05-23 Yahoo! Inc. Locally optimized feature space encoding of digital data and retrieval using such encoding
CN108269110B (zh) * 2016-12-30 2021-10-26 华为技术有限公司 基于社区问答的物品推荐方法、系统及用户设备
CN111796830B (zh) * 2020-06-08 2023-09-19 成都数之联科技股份有限公司 一种协议解析处理方法、装置、设备及介质
US11755445B2 (en) * 2021-02-17 2023-09-12 Microsoft Technology Licensing, Llc Distributed virtual data tank for cross service quota management

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5465353A (en) 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
JP3469345B2 (ja) 1995-03-16 2003-11-25 株式会社東芝 画像のファイリング装置及びファイリング方法
JPH10198705A (ja) 1997-01-14 1998-07-31 Ricoh Co Ltd 文書画像処理装置および文書画像処理方法および情報記録媒体
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
JP4199549B2 (ja) 2003-01-14 2008-12-17 シャープ株式会社 排出用紙シフター機構
JP4375235B2 (ja) * 2004-05-20 2009-12-02 セイコーエプソン株式会社 複数画素ずつコード化しながら画像を出力する画像出力システム
WO2006019165A1 (ja) * 2004-08-20 2006-02-23 Ipflex Inc. ラベルイメージの生成方法および画像処理システム
US7639387B2 (en) * 2005-08-23 2009-12-29 Ricoh Co., Ltd. Authoring tools using a mixed media environment
US9171202B2 (en) * 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US7991778B2 (en) * 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
CN101133429B (zh) 2005-03-01 2010-10-06 公立大学法人大阪府立大学 文档和/或图像检索方法、文档和/或图像存储设备和检索设备
JP2006251902A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
US7715620B2 (en) * 2006-01-27 2010-05-11 Lockheed Martin Corporation Color form dropout using dynamic geometric solid thresholding
US20080068641A1 (en) * 2006-09-19 2008-03-20 Xerox Corporation Document processing system
US7725499B1 (en) * 2007-02-01 2010-05-25 Star Ag Semantic architecture for managing information through structured storage and retrieval
JP5288824B2 (ja) * 2008-02-20 2013-09-11 キヤノン株式会社 カラー画像形成装置、画像形成装置、カラー画像処理方法、画像処理方法、及びプログラム
JP4981000B2 (ja) * 2008-09-01 2012-07-18 株式会社リコー 画像の秘匿方法および画像形成装置

Also Published As

Publication number Publication date
CN101136981B (zh) 2010-07-28
CN101136981A (zh) 2008-03-05
JP2008077641A (ja) 2008-04-03
US20080049264A1 (en) 2008-02-28
US7948664B2 (en) 2011-05-24

Similar Documents

Publication Publication Date Title
JP4257925B2 (ja) 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体
CN101149793B (zh) 图像处理方法和装置、原稿读取装置及图像形成装置
JP4310356B2 (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体
US8055079B2 (en) Image processing method, image processing apparatus, and image forming apparatus
US6640009B2 (en) Identification, separation and compression of multiple forms with mutants
US20040218838A1 (en) Image processing apparatus and method therefor
JP4324628B2 (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体
US20080212115A1 (en) Image processing method, image processing apparatus, image reading apparatus, and image forming apparatus
US8238614B2 (en) Image data output processing apparatus and image data output processing method excelling in similarity determination of duplex document
US8363963B2 (en) Apparatus, method and computer readable medium that associates a plurality of possible word recognition results with an image
US8300944B2 (en) Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, image processing system, and storage medium
US20080031549A1 (en) Image processing apparatus, image reading apparatus, image forming apparatus, image processing method, and recording medium
JP4913094B2 (ja) 画像照合方法、画像照合装置、画像データ出力処理装置、プログラム及び記憶媒体
US8107738B2 (en) Image processing method, image processing apparatus, image forming apparatus, image reading apparatus and memory product
EP3252669B1 (en) Method and device for classifying scanned documents
US8184912B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
JP4588771B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラム及び記憶媒体
CN111126273B (zh) 图像处理方法、装置、电子设备以及存储介质
JP4393556B2 (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体
CN101246326A (zh) 图像处理方法与装置、图像形成装置、和图像读取装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130213

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees