JP2008102907A

JP2008102907A - 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体

Info

Publication number: JP2008102907A
Application number: JP2007218864A
Authority: JP
Inventors: Masanori Minami; 雅範南; Masakazu Ohira; 雅和大平
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2006-09-19
Filing date: 2007-08-24
Publication date: 2008-05-01
Also published as: CN101149793B; CN101149793A; US8116513B2; US20080069450A1

Abstract

【課題】原稿画像の類似を判定する際に原稿画像の記載漏れを精度よく判定することができる画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置及び画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、並びに該コンピュータプログラムを記録した記録媒体を提供する。
【解決手段】文書照合処理部２２は、入力された原稿画像に基づいて特徴点（例えば、重心）を算出し、算出した特徴点の中から複数の特徴点を選択し、選択した特徴点に基づいてハッシュ値を算出する。文書照合処理部２２は、算出した特徴量に基づいて、原稿画像が予め記憶されている登録フォーマット（登録画像）に類似するか否かを判定し、類似すると判定した場合、原稿画像の登録画像に対して定められた箇所に対応する箇所に記載漏れがあるか否かを判定し、判定結果を出力する。
【選択図】図１

Description

本発明は、取得した原稿画像が予め記憶してある登録画像に類似するか否かの判定処理を行う画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置及び画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、並びに該コンピュータプログラムを記録した記録媒体に関する。

スキャナで原稿を読み取り、読み取った原稿画像が予め登録されたフォーマットに類似するか否か判定する処理としては、ＯＣＲで読み取った画像からキーワードを抽出し、抽出したキーワードによりパターンマッチングを行う方法、あるいは判定を行う原稿を罫線がある帳票原稿に限定し、読み取った原稿から抽出した罫線に関する情報によりパターンマッチングを行う方法などが提案されている。

類似判定に用いるフォーマットを登録するには、登録用に入力された入力画像に対して、線分抽出、文字枠抽出、文字認識又は枠抽出などの認識処理を行い、認識結果から枠データの中心座標、文字列枠の中心座標、連結枠情報などの情報（例えば、特徴点）を抽出する。次に、抽出した情報より特徴量（例えば、ハッシュ値）を算出し、テーブル管理に必要なデータ（特徴量、モデル名、特徴量を算出するのに用いたパラメータなど）を作成してハッシュテーブルに登録することにより、フォーマットの登録を行う。

原稿の類似判定を行う場合には、入力された原稿画像に対して認識処理を行い、認識結果から枠データの中心座標、文字列枠の中心座標、連結枠情報などの情報（例えば、特徴点）を抽出する。そして、各情報に対する特徴量（例えば、ハッシュ値）を算出し、算出した特徴量を用いて、予め登録されたハッシュテーブルのエリアを検索し、検索したエリア内の登録帳票名ごとに投票を行う。これらの処理を入力された原稿画像の特徴点毎に繰り返し、ヒストグラムの最も大きいモデルを認識結果として類似度を計算する。原稿画像が登録されたフォーマットに類似すると確認された場合、原稿画像に識別子を付与して保存する。このような処理を行うことにより、原稿画像と登録されたフォーマットとのマッチングを自動的に行ってユーザの処理工程を軽減することができる画像（原稿画像）のファイリング装置が提案されている（特許文献１参照）。
特許第３４６９３４５号公報

しかしながら、特許文献１の装置にあっては、原稿画像の類似判定に用いられる登録されたフォーマットは、書式（枠、罫線、記載項目を示す文字列など）が定められた原稿であって、原稿の記載欄には何も記入されていない原稿であるため、登録されたフォーマットから抽出される特徴量（例えば、ハッシュ値）は、記載項目に記載される事項（例えば、文字列、図形、記号等）に関する情報（例えば、特徴点）は含まれていない。したがって、入力された原稿画像の記載欄に必要事項が記載されていない記載漏れの原稿画像であっても、登録されたフォーマットに類似すると判定され、原稿画像に記載漏れがあるにもかかわらず、入力された原稿画像がそのままファイリングされてしまうという問題があった。このため、原稿画像の記載漏れを精度よく判定することが望まれていた。

本発明は、斯かる事情に鑑みてなされたものであり、登録画像の１又は複数の箇所を予め定めておき、原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して定められた箇所に対応する箇所に記載漏れがあるか否かを判定し、判定結果を出力することにより、原稿画像の類似判定を行う際に、原稿画像の記載漏れを精度よく判定することができる画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置及び画像形成装置、前記画像処理装置を実現するためのコンピュータプログラム、並びに該コンピュータプログラムを記録した記録媒体を提供することを目的とする。

また、本発明の他の目的は、記載漏れがあると判定された原稿画像の該記載漏れの箇所を報知することにより、記載漏れの箇所を容易に判断することができる画像処理方法、画像処理装置、該画像処理装置を備える原稿読取装置及び画像形成装置を提供することにある。

また、本発明の他の目的は、下地除去した原稿画像に基づいて、記載漏れがあるか否かを判定することにより、さらに精度良く記載漏れを判定することができる画像処理装置、該画像処理装置を備える原稿読取装置及び画像形成装置を提供することにある。

また、本発明の他の目的は、取得した原稿画像の注目画素を含む第１の画素ブロック内の各画素の画素値それぞれを、該画素を含む第２の画素ブロック内の各画素の画素値に基づいて算出し、算出した前記第１の画素ブロック内の各画素の画素値の分布に応じて、注目画素がエッジ画素であるか否かを判定し、判定したエッジ画素の多少に基づいて、取得した原稿画像に記載漏れがあるか否かを判定することにより、原稿画像と登録画像の画素値を比較することなく原稿画像の記載漏れを精度よく判定することができる画像処理方法、該画像処理装置を備える原稿読取装置及び画像形成装置を提供することにある。

また、本発明の他の目的は、色成分毎に注目画素を含む第１の画素ブロック内の各画素の画素値の算出及び注目画素がエッジ画素であるか否かの判定を行うことにより、記載漏れの判定精度を向上させることができる画像処理方法、該画像処理装置を備える原稿読取装置及び画像形成装置を提供することにある。

また、本発明の他の目的は、取得した原稿画像に記載漏れがあると判定された場合、記載漏れ原稿を仕分けて排出する排出手段を備えることにより、記載漏れ原稿と記載漏れのない原稿とに仕分けることができる原稿読取装置を提供することにある。

また、本発明の他の目的は、排出手段は、記載漏れ原稿の排出位置を変位するように構成してあることにより、記載漏れ原稿を記載漏れのない原稿と容易に区別することができる原稿読取装置を提供することにある。

本発明に係る画像処理方法は、取得した原稿画像の記載漏れの有無を判定する画像処理方法であって、取得した原稿画像が予め記憶してある登録画像に類似するか否かを判定し、原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して定められた１又は複数の箇所に対応する箇所に記載漏れがあるか否かを判定し、判定結果を出力することを特徴とする。

本発明に係る画像処理方法は、記載漏れがあると判定された原稿画像の該記載漏れの箇所を報知することを特徴とする。

本発明に係る画像処理装置は、取得した原稿画像の記載漏れの有無を判定する画像処理装置であって、取得した原稿画像が予め記憶してある登録画像に類似するか否かを判定する手段と、原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して定められた１又は複数の箇所に対応する箇所に記載漏れがあるか否かを判定する判定手段と、該判定手段の判定結果を出力する出力手段とを備えることを特徴とする。

本発明に係る画像処理装置は、記載漏れがあると判定された原稿画像の該記載漏れの箇所を報知する報知手段を備えることを特徴とする。

本発明に係る画像処理装置は、取得した原稿画像に対して下地除去を行う下地除去手段を備え、前記判定手段は、前記下地除去手段で下地除去された原稿画像に基づいて記載漏れがあるか否かを判定するように構成してあることを特徴とする。

本発明に係る画像処理装置は、取得した原稿画像の注目画素を含む第１の画素ブロック内の各画素の画素値それぞれを、該画素を含む第２の画素ブロック内の各画素の画素値に基づいて算出する画素値算出手段と、該画素値算出手段で算出した前記第１の画素ブロック内の各画素の画素値の分布に応じて、前記注目画素がエッジ画素であるか否かを判定するエッジ判定手段とを備え、前記判定手段は、前記エッジ判定手段で判定したエッジ画素の多少に基づいて、取得した原稿画像に記載漏れがあるか否かを判定するように構成してあることを特徴とする。

本発明に係る画像処理装置は、取得した原稿画像がカラー画像である場合、前記画素値算出手段及びエッジ判定手段それぞれは、色成分毎に処理を行うように構成してあることを特徴とする。

本発明に係る原稿読取装置は、前述の発明のいずれかに係る画像処理装置を備え、原稿を読み取る原稿読取装置であって、取得した原稿画像に記載漏れがあると判定された場合、記載漏れ原稿を仕分けて排出する排出手段を備えることを特徴とする。

本発明に係る原稿読取装置は、前記排出手段は、記載漏れ原稿の排出位置を変位するように構成してあることを特徴とする。

本発明に係る画像形成装置は、前述の発明のいずれかに係る画像処理装置と、該画像処理装置で処理された画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする。

本発明に係るコンピュータプログラムは、コンピュータに、取得した原稿画像の記載漏れの有無の判定を行わせるためのコンピュータプログラムであって、コンピュータを、取得した原稿画像が予め記憶してある登録画像に類似するか否かを判定する手段と、コンピュータを、原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して予め定められた１又は複数の箇所に対応する箇所に記載漏れがあるか否かを判定する手段として機能させることを特徴とする。

本発明に係るコンピュータでの読み取りが可能な記録媒体は、前述の発明に係るコンピュータプログラムを記録してあることを特徴とする。

本発明にあっては、取得した原稿画像が予め記憶してある登録画像に類似するか否かを判定する。原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の該原稿画像に類似する登録画像に対して予め定められた１又は複数の箇所に対応する箇所に記載漏れがあるか否かを判定し、判定結果（記載漏れの有無）を出力する。予め定められた箇所は、例えば、書式（枠、罫線、記載項目を示す文字列など）が定められた書類（フォーマット）の記載欄、すなわち、記載項目として、文字、図形、記号等が記載される箇所である。予め文字等が記載される箇所を登録画像上で定めておくことにより、取得した原稿画像の中から、文字等が記載される箇所のみの記載漏れを判定することにより、原稿画像に記載漏れ（記入漏れ）があるか否かを精度良く判定することができる。なお、本発明において、取得した原稿画像とは、スキャナで原稿画像を読みとって得られた原稿画像、コンピュータを用いて所定書式のデータに必要事項を書き込んで作成した電子データ形式の原稿画像、スキャナで読みとられたデータをＪＰＥＧ等の所定のファイルフォーマットに変換して作成した電子化データを意味している。

また、本発明にあっては、記載漏れがあると判定された原稿画像の該記載漏れの箇所を報知する。例えば、原稿画像の記載漏れの箇所を表示することにより、原稿に記載漏れがあることだけでなく、原稿のどの箇所に記載漏れがあるかを容易に知ることができる。特に、１枚の原稿で記載項目が多数ある場合、あるいは、多数の原稿を読み取る場合など、記載漏れを簡単に見分けることができ、ユーザの利便性を向上させることができる。

また、本発明にあっては、取得した原稿画像に対して下地除去を行い、下地除去された原稿画像に基づいて記載漏れがあるか否かを判定する。これにより、読み取られる原稿の用紙が再生紙、あるいは薄く着色された用紙など、登録画像と異なる場合であっても、精度良く記載漏れの有無を判定することができる。

また、本発明にあっては、取得した原稿画像の注目画素を含む第１の画素ブロック内の各画素の画素値それぞれを、該画素を含む第２の画素ブロック内の各画素の画素値に基づいて算出する。算出した前記第１の画素ブロック内の各画素の画素値の分布に応じて、注目画素がエッジ画素であるか否かを判定し、判定したエッジ画素の多少に基づいて、取得した原稿画像に記載漏れがあるか否かを判定する。これにより、原稿画像と登録画像の画素値を比較する必要がなく、取得した原稿画像のみで原稿画像の記載漏れ（記入漏れ）を精度よく判定することができる。なお、本発明において、取得した原稿画像とは、スキャナで原稿画像を読みとって得られた原稿画像、コンピュータを用いて所定書式のデータに必要事項を書き込んで作成した電子データ形式の原稿画像、スキャナで読みとられたデータをＪＰＥＧ等の所定のファイルフォーマットに変換して作成した電子化データを意味している。

また、本発明にあっては、取得した原稿画像がカラー画像である場合、色成分毎に注目画素を含む第１の画素ブロック内の各画素の画素値の算出及び注目画素がエッジ画素であるか否かの判定を行う。これにより、原稿画像での孤立点、読み取り時のノイズの影響、あるいは、原稿の地肌部の汚れ又は地肌部に付着しているダストの影響を抑制することができ、記載漏れの判定精度をさらに向上させることができる。

また、本発明にあっては、排出手段は、取得した原稿画像に記載漏れがあると判定された場合、記載漏れ原稿を仕分けて排出する。これにより、例えば、多数の原稿を読み取る場合、記載漏れ原稿を記載漏れのない原稿と仕分けて排出することができ、ユーザは排出された多くの原稿の中から記載漏れ原稿だけを簡単に仕分けることができる。

また、本発明にあっては、排出手段は、記載漏れ原稿の排出位置を変位する。これにより、排出された原稿の中から記載漏れ原稿を容易に区別することができる。

本発明にあっては、登録画像の１又は複数の箇所を予め定め、原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して定められた箇所に対応する箇所に記載漏れがあるか否かを判定し、判定結果を出力することにより、原稿画像の類似判定を行う際に、原稿画像の記載漏れを精度良く判定することができる。

また、本発明にあっては、記載漏れがあると判定された原稿画像の該記載漏れの箇所を報知することにより、記載漏れの箇所を容易に判断することができる。

また、本発明にあっては、取得した原稿画像に記載漏れがあるか否かを判定する前段で原稿画像の下地除去を行うことにより、読み取られる原稿の用紙が再生紙、あるいは薄く着色された用紙など、登録画像と異なる場合であっても、精度良く記載漏れの有無を判定することができる。

また、本発明にあっては、取得した原稿画像の注目画素を含む第１の画素ブロック内の各画素の画素値それぞれを、該画素を含む第２の画素ブロック内の各画素の画素値に基づいて算出し、算出した前記第１の画素ブロック内の各画素の画素値の分布に応じて、注目画素がエッジ画素であるか否かを判定し、判定したエッジ画素の多少に基づいて、取得した原稿画像に記載漏れがあるか否かを判定する。これにより、原稿画像と登録画像の画素値を比較する必要がなく、取得した原稿画像のみで原稿画像の記載漏れを精度よく判定することができる。

また、本発明にあっては、取得した原稿画像がカラー画像である場合、色成分毎に注目画素を含む第１の画素ブロック内の各画素の画素値の算出及び注目画素がエッジ画素であるか否かの判定を行うことにより、原稿画像での孤立点、読み取り時のノイズの影響、あるいは、原稿の地肌部の汚れ又は地肌部に付着しているダストの影響を抑制することができ、記載漏れの判定精度をさらに向上させることができる。

また、本発明にあっては、取得した原稿画像に記載漏れがあると判定された場合、記載漏れ原稿を仕分けて排出する排出手段を備えることにより、記載漏れ原稿と記載漏れのない原稿とに仕分けることができる。特に、多数の原稿を読み取る場合、排出される多くの原稿の中から記載漏れ原稿だけを簡単に仕分けることができ、ユーザの利便性を向上させることができる。

また、本発明にあっては、排出手段は、記載漏れ原稿の排出位置を変位するように構成してあることにより、記載漏れ原稿を容易に区別することができる。

実施の形態１
以下、本発明を実施の形態を示す図面に基づいて説明する。図１は本発明に係る画像処理装置を備える画像形成装置１００の構成を示すブロック図である。画像形成装置１００（例えば、デジタルカラー複写機や複合機能、プリンタ機能、ファイリング機能、ファックスや電子メール配信機能を備えた複合機）は、カラー画像入力装置１、カラー画像処理装置２（画像処理装置）、画像形成手段としてのカラー画像出力装置３、各種操作を行うための操作パネル４などを備える。

カラー画像入力装置１で原稿を読み取ることにより得られたＲＧＢ（Ｒ：赤、Ｇ：緑、Ｂ：青）のアナログ信号の画像データは、カラー画像処理装置２へ出力され、カラー画像処理装置２で所定の処理が行われ、ＣＭＹＫ（Ｃ：シアン、Ｍ：マゼンタ、Ｙ：イエロー、Ｋ：黒）のデジタルカラー信号としてカラー画像出力装置３へ出力される。

カラー画像入力装置１は、例えば、ＣＣＤ（Charged Coupled Device）を備えたスキャナであり、原稿画像からの反射光像をＲＧＢのアナログ信号として読み取り、読み取ったＲＧＢ信号をカラー画像処理装置２へ出力する。また、カラー画像出力装置３は、原稿画像の画像データを記録紙上に出力する電子写真方式やインクジェット方式などを用いた画像形成手段である。また、カラー画像出力装置３は、ディスプレイ等の表示装置であってもよい。

カラー画像処理装置２は、ＣＰＵ、ＡＳＩＣ（Application Specific Integrated Circuit）などにより構成される。

Ａ／Ｄ変換部２０は、カラー画像入力装置１から入力されたＲＧＢ信号を、例えば、１０ビットのデジタル信号に変換し、変換後のＲＧＢ信号をシェーディング補正部２１へ出力する。

シェーディング補正部２１は、入力されたＲＧＢ信号に対して、カラー画像入力装置１の照明系、結像系、撮像系などで生じた各種の歪みを取り除く補正処理を行う。また、シェーディング補正部２１は、濃度信号などカラー画像処理装置２で採用されている画像処理システムが扱い易い信号に変換する処理を行い、補正後のＲＧＢ信号（画像）を文書照合処理部２２へ出力する。

文書照合処理部２２は、入力された画像（画像データ）を二値化し、二値画像に基づいて特定された連結領域の特徴点（例えば、重心）を算出し、算出した特徴点の中から複数の特徴点を選択し、選択した特徴点に基づいて不変量を求め、該不変量に基づいて特徴量（例えば、ハッシュ値）を算出する。文書照合処理部２２は、算出した特徴量に基づいて入力された画像（原稿画像）が予め記憶されている登録フォーマット（登録画像）に類似するか否かを判定し、類似すると判定した場合、入力画像（原稿画像）に記入漏れ（記載漏れ）があるか否かを判定し、判定信号（記入漏れの有無を示す判定結果）を出力する。また、文書照合処理部２２は、入力されたＲＧＢ信号をそのまま後段の入力階調補正部２３へ出力する。

入力階調補正部２３は、入力されたＲＧＢ信号（ＲＧＢの反射率信号）に対して、カラーバランスを整える処理を行うとともに、下地濃度の除去又はコントラストなど画質調整処理を施し、処理後のＲＧＢ信号を領域分離処理部２４へ出力する。

領域分離処理部２４は、入力されたＲＧＢ信号に基づき、入力された画像中の各画素が、文字領域、網点領域、写真領域の何れであるかを分離する。領域分離処理部２４は、分離結果に基づいて、各画素がどの領域に属しているかを示す領域識別信号を黒生成下色除去部２６、空間フィルタ処理部２７、出力階調補正部２８、階調再現処理部２９へ出力する。また、領域分離処理部２４は、入力されたＲＧＢ信号をそのまま後段の色補正部２５へ出力する。

色補正部２５は、入力されたＲＧＢ信号をＣＭＹの色空間に変換し、カラー画像出力装置３の特性に合わせて色補正を行い、補正後のＣＭＹ信号を黒生成下色除去部２６へ出力する。具体的には、色補正部２５は、色再現の忠実化のため、不要吸収成分を含むＣＭＹ色材の分光特性に基づいた色濁りを取り除く処理を行う。

黒生成下色除去部２６は、色補正部２５から入力されたＣＭＹ信号に基づいて、Ｋ（黒）信号を生成するとともに、入力されたＣＭＹ信号からＫ信号を差し引いて新たなＣＭＹ信号を生成し、生成したＣＭＹＫ信号を空間フィルタ処理部２７へ出力する。

黒生成下色除去部２６における処理の一例を示す。例えば、スケルトンブラックによる黒生成を行う処理の場合、スケルトンカーブの入出力特性をｙ＝ｆ（ｘ）とし、入力されるデータをＣ、Ｍ、Ｙとし、出力されるデータをＣ′、Ｍ′、Ｙ′、Ｋ′とし、ＵＣＲ（Under Color Removal）率をα（０＜α＜１）とすると、黒生成下色除去処理により出力
されるデータ夫々は、Ｋ′＝ｆ｛ｍｉｎ（Ｃ、Ｍ、Ｙ）｝、Ｃ′＝Ｃ−αＫ′、Ｍ′＝Ｍ−αＫ′、Ｙ′＝Ｙ−αＫ′で表される。

空間フィルタ処理部２７は、黒生成下色除去部２６から入力されたＣＭＹＫ信号に対して、領域識別信号に基づいたデジタルフィルタによる空間フィルタ処理を行う。これにより、画像データの空間周波数特性が補正され、カラー画像出力装置３における出力画像のぼやけ、又は粒状性劣化を防止する。例えば、空間フィルタ処理部２７は、領域分離処理部２４において文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、鮮鋭強調処理を施し高周波成分を強調する。また、空間フィルタ処理部２７は、領域分離処理部２４において網点領域に分離された領域を、入力網点成分を除去するためのローパス・フィルタ処理を施す。空間フィルタ処理部２７は、処理後のＣＭＹＫ信号を出力階調補正部２８へ出力する。

出力階調補正部２８は、空間フィルタ処理部２７から入力されたＣＭＹＫ信号に対して、カラー画像出力装置３の特性値である網点面積率に変換する出力階調補正処理を行い、出力階調補正処理後のＣＭＹＫ信号を階調再現処理部２９へ出力する。

階調再現処理部２９は、領域分離処理部２４から入力された領域識別信号に基づいて、出力階調補正部２８から入力されたＣＭＹＫ信号に対して所定の処理を行う。例えば、階調再現処理部２９は、文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、カラー画像出力装置３における高周波成分の再現に適するように二値化処理又は多値化処理を行う。

また、階調再現処理部２９は、領域分離処理部２４において網点領域に分離された領域を、最終的に画像を画素に分離して、それぞれの階調を再現できるように階調再現処理（中間調生成）を行う。さらに、階調再現処理部２９は、領域分離処理部２４において写真領域に分離された領域を、カラー画像出力装置３における階調再現性に適するように二値化処理又は多値化処理を行う。

カラー画像処理装置２は、階調再現処理部２９で処理された画像データ（ＣＭＹＫ信号）を記憶部（不図示）に一旦記憶し、画像形成をする所定のタイミングで記憶部に記憶した画像データを読み出し、読み出した画像データをカラー画像出力装置３へ出力する。これらの制御は、例えば、ＣＰＵ（不図示）により行われる。また、カラー画像処理装置２内のＣＰＵ（不図示）は、文書照合処理部２２から出力された判定信号に基づいて、原稿画像に対して所定の処理（例えば、記入漏れの報知、記載漏れ原稿の排出など）を行うように制御する。

図２は文書照合処理部２２の構成を示すブロック図である。文書照合処理部２２は、特徴点算出部２２１、特徴量算出部２２２、投票処理部２２３、類似度判定処理部２２４、記入事項判定処理部２２５、メモリ２２６、前述の各部を制御する制御部２２７などを備えている。

特徴点算出部２２１は、入力された画像データ（原稿画像）に対して後述する所定の処理を行うとともに、入力画像の文字列あるいは罫線の連結領域を抽出し、連結領域の特徴点（例えば、重心）を算出する。より具体的には、特徴点算出部２２１は、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点（例えば、連結領域を構成する各画素の二値画像における座標値を累積加算し、累積加算した座標値を連結領域に含まれる画素数で除算した値）を抽出（算出）し、抽出した特徴点を特徴量算出部２２２へ出力する。

図３は特徴点算出部２２１の構成を示すブロック図である。特徴点算出部２２１は、無彩化処理部２２１０、解像度変換部２２１１、フィルタ処理部２２１２、二値化処理部２２１３、重心算出部２２１４などを備えている。

無彩化処理部２２１０は、入力された画像（画像データ）がカラー画像である場合、カラー画像を無彩化して、輝度信号又は明度信号に変換し、変換後の画像を解像度変換部２２１１へ出力する。例えば、輝度信号Ｙｊは、各画素ＲＧＢの色成分を夫々Ｒｊ、Ｇｊ、Ｂｊとし、Ｙｊ＝０．３０×Ｒｊ＋０．５９×Ｇｊ＋０．１１×Ｂｊで表すことができる。なお、上式に限らず、ＲＧＢ信号をＣＩＥ１９７６Ｌ* ａ* ｂ* 信号に変換することもできる。

解像度変換部２２１１は、入力された画像がカラー画像入力装置１で光学的に変倍された場合であっても、所定の解像度になるように入力された画像を再度変倍し、変倍された画像をフィルタ処理部２２１２へ出力する。これにより、カラー画像入力装置１で変倍処理が行われ解像度が変化した場合であっても、その影響を受けることなく特徴点の抽出を行うことができ、精度良く原稿を分類することができる。特に、縮小された文字などの場合、二値化処理を行って連結領域を特定するとき、文字が潰れているために本来離れている領域が繋がった状態で特定され、算出される重心がずれる虞を防止できる。また、解像度変換部２２１１は、カラー画像入力装置１で等倍時に読み込まれる解像度よりも小さい解像度に変換する。例えば、カラー画像入力装置１において６００ｄｐｉ（dot per inch）で読み込まれた画像を３００ｄｐｉに変換する。これにより、後段における処理量を低減することができる。

フィルタ処理部２２１２は、入力された画像が有する空間周波数特性を補正し（例えば、画像の強調化処理及び平滑化処理など）、補正後の画像を二値化処理部２２１３へ出力する。フィルタ処理部２２１２は、カラー画像入力装置１の空間周波数特性が機種ごとに異なるため、異なる空間周波数特性を所要の特性に補正する。カラー画像入力装置１が出力する画像（例えば、画像信号）には、レンズ又はミラーなどの光学系部品、ＣＣＤの受光面のアパーチャ開口度、転送効率、残像、物理的な走査による積分効果及び走査むら等に起因して画像のぼけなどの劣化が生ずる。フィルタ処理部２２１２は、境界又はエッジなどの強調処理を行うことにより、画像に生じたぼけなどの劣化を修復する。また、フィルタ処理部２２１２は、後段で処理される特徴点の抽出処理に不要な高周波成分を抑制するための平滑化処理を行う。これにより、特徴点を精度良く抽出することができ、結果として画像の類似度の判定を精度良く行うことが可能となる。なお、フィルタ処理部２２１２で使用するフィルタ係数は、使用されるカラー画像入力装置１の機種又は特性などに応じて適宜設定することができる。

図４はフィルタ処理部２２１２のフィルタ係数の例を示す説明図である。図に示すように、空間フィルタは、例えば、７×７（７行、７列）の大きさを有し、強調処理及び平滑化処理を行う混合フィルタである。入力された画像の画素を走査し、空間フィルタによる演算処理をすべての画素に対して行う。なお、空間フィルタの大きさは、７×７の大きさに限定されるものではなく、３×３、５×５などの大きさであってもよい。また、フィルタ係数の数値は一例であって、これに限定されるものではなく、使用されるカラー画像入力装置１の機種又は特性などに応じて適宜設定することができる。

二値化処理部２２１３は、入力された画像の輝度値（輝度信号）又は明度値（明度信号）を閾値と比較することにより画像を二値化し、二値化した二値画像を重心算出部２２１４へ出力する。

重心算出部２２１４は、二値化処理部２２１３から入力された二値画像の各画素の二値化情報（例えば、「１」、「０」で表される）に基づいて、各画素に対してラベリング（ラベル付け処理）を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点を特徴量算出部２２２へ出力する。なお、特徴点は、二値画像（原稿画像）における座標（ｘ′、ｙ′）で表すことができる。

図５は連結領域の特徴点の例を示す説明図である。図において、特定された連結領域は、文字「Ａ」であり、同一ラベルが付された画素の集合として特定される。この文字「Ａ」の特徴点（重心）は、図中黒丸で示される位置（ｘ′座標、ｙ′座標）となる。

図６は文字列に対する特徴点の抽出結果の例を示す説明図である。複数の文字から構成される文字列の場合、文字の種類により夫々異なる座標を有する特徴点が複数抽出される。

特徴量算出部２２２は、特徴点算出部２２１から入力された特徴点を用いて、回転、拡大、縮小などの処理に対する不変量を求め、該不変量に基づいて特徴量（例えば、ハッシュ値）を算出する。より具体的には、特徴量算出部２２２は、特徴点算出部２２１から入力された特徴点（すなわち、連結領域の重心の座標値）夫々を注目特徴点とし、例えば、注目特徴点からの距離が小さい周辺の他の特徴点を４つ抽出する。

図７は注目特徴点と周辺の特徴点を示す説明図である。図に示すように、注目特徴点Ｐ１に対して、例えば、注目特徴点Ｐ１からの距離が近い順に、閉曲線Ｓ１で囲まれる４つの特徴点を抽出する（注目特徴点Ｐ１に対しては、注目特徴点Ｐ２も１つの特徴点として抽出されている）。また、注目特徴点Ｐ２に対して、例えば、上記と同様に注目特徴点Ｐ２からの距離が近い順に、閉曲線Ｓ２で囲まれる４つの特徴点を抽出する（注目特徴点Ｐ２に対しては、注目特徴点Ｐ１も１つの特徴点として抽出されている）。

特徴量算出部２２２は、抽出した４つの特徴点の中から３つの特徴点を選択して、不変量を算出する。なお、選択する特徴点は３つに限られるものではなく、４つ、５つなどの特徴点を選択することもできる。求めたい不変量の種類によって選択すべき特徴点の数が異なる。例えば、３点から求められる不変量は相似不変量となる。

図８は注目特徴点Ｐ１による不変量の算出例を示す説明図であり、図９は注目特徴点Ｐ２による不変量の算出例を示す説明図である。図８に示すように、注目特徴点Ｐ１の周辺の４つの特徴点から３つの特徴点を選択し、３通りの不変量夫々をＨ１ｊ（ｊ＝１、２、３）とする。不変量Ｈ１ｊは、Ｈ１ｊ＝Ａ１ｊ／Ｂ１ｊで表される式で算出する。ここで、Ａ１ｊ、Ｂ１ｊ夫々は特徴点間の距離を示しており、特徴点間の距離は、各周辺特徴点の座標値に基づいて算出される。これにより、例えば、原稿が回転、移動、傾いた場合であっても、不変量Ｈ１ｊは変化せず、画像の類似度の判定を精度良く行うことができ、類似する原稿を精度良く判定することができる。

同様に、図９に示すように、注目特徴点Ｐ２の周辺の４つの特徴点から３つの特徴点を選択し、３通りの不変量夫々をＨ２ｊ（ｊ＝１、２、３）とする。不変量Ｈ２ｊは、Ｈ２ｊ＝Ａ２ｊ／Ｂ２ｊで表される式で算出する。ここで、Ａ２ｊ、Ｂ２ｊ夫々は特徴点間の距離を示しており、上記と同様に特徴点間の距離は、各周辺特徴点の座標値に基づいて算出される。以下同様に、他の注目特徴点に対して不変量を算出することができる。

特徴量算出部２２２は、夫々の注目特徴点により算出された不変量に基づいて、ハッシュ値（特徴量）Ｈｉを算出する。注目特徴点Ｐｉのハッシュ値Ｈｉは、Ｈｉ＝（Ｈｉ１×１０²＋Ｈｉ２×１０¹＋Ｈｉ３×１０⁰）／Ｅで表される。ここで、Ｅは余りをどの程
度設定するかにより決定される定数であり、例えば、「１０」とした場合には、余りは「０」〜「９」となり、これが算出するハッシュ値の取り得る範囲となる。また、ｉは自然数であり特徴点の数を表している。

図１０は注目特徴点Ｐ３による不変量の算出の他の例を示す説明図であり、図１１は注目特徴点Ｐ４による不変量の算出の他の例を示す説明図である。図１０に示すように、注目特徴点Ｐ３の周辺特徴点Ｐ１、Ｐ２、Ｐ４、Ｐ５の４点より４通りの組み合わせを選択し、不変量Ｈ３ｊ（ｊ＝１、２、３、４）を前述の場合と同様に、Ｈ３ｊ＝Ａ３ｊ／Ｂ３ｊにより算出してもよい。

また、図１１に示すように、注目特徴点Ｐ４の周辺特徴点Ｐ２、Ｐ３、Ｐ５、Ｐ６の４点より４通りの組み合わせを選択し、不変量Ｈ４ｊ（ｊ＝１、２、３、４）を前述の場合と同様に、Ｈ４ｊ＝Ａ３ｊ／Ｂ３ｊにより算出してもよい。図１０及び図１１の例の場合、注目特徴点Ｐｉのハッシュ値Ｈｉは、Ｈｉ＝（Ｈｉ１×１０³＋Ｈｉ２×１０² ＋Ｈｉ３×１０¹＋Ｈｉ４×１０⁰）／Ｅで算出することができる。

なお、特徴量としての上記ハッシュ値は一例であって、これに限定されるものではなく、他のハッシュ関数を用いることができる。上記では、周辺の他の特徴点として４点を抽出する例を示しているが、４点に限定されるものではない。例えば、６点抽出するようにしても良い。この場合、６点の特徴点から５点を抽出し、５点を抽出する６通りそれぞれの方法について、５点から３点を抽出して不変量を求め、ハッシュ値を算出するようにしても良い。これにより、１つの特徴点から１つのハッシュ値を算出することも、１つの特徴点から複数のハッシュ値を算出することもできる。

特徴量算出部２２２は、原稿画像の特徴点を表すインデックスと、該特徴点に基づいて算出されたハッシュ値と、該特徴点の原稿画像上の座標とを原稿画像の特徴点座標テーブルとしてメモリ２２６に記憶する。

原稿画像の登録を行う場合は、例えば、画像形成装置１００の操作パネル４より原稿登録モードを選択して行う。原稿登録モードが選択されているか否かは制御部２２７により判定される。原稿登録モードが選択されていない場合は、通常の複写、ファイリング、電子メール送信動作等を行う。なお、原稿登録処理は、文書照合処理部２２などの専用のハードウエア回路で構成するだけでなく、ＣＰＵ、ＲＡＭ、ＲＯＭなどを備えたパーソナルコンピュータに、原稿登録処理の手順を定めたコンピュータプログラムをロードすることによりＣＰＵでコンピュータプログラムを実行させることにより行うこともできる。

図１２は原稿画像の特徴点座標テーブル２２６１の構造を示す説明図である。原稿画像の特徴点座標テーブル２２６１は、原稿画像の特徴点を表すインデックス、特徴点に基づいて算出されたハッシュ値、特徴点の原稿画像上の座標（ｘ′座標、ｙ′座標）の各欄により構成されている。

図１２に示すように、例えば、原稿画像の特徴点を表すインデックスがｐ１である特徴点に基づいて算出されたハッシュ値はＨ１、特徴点の座標は（ｘ１１′、ｙ１１′）である。また、同様に、原稿画像の特徴点を表すインデックスがｐ２である特徴点に基づいて算出されたハッシュ値はＨ８、特徴点の座標は（ｘ３２′、ｙ３２′）である。

図１３は登録フォーマットのハッシュテーブル２２６２の構造を示す説明図である。図１３（ａ）に示すように、ハッシュテーブル２２６２の構造は、ハッシュ値及び原稿（登録フォーマット）を表すインデックスの各欄により構成されている。より具体的には、原稿を示すインデックスに対応して、原稿中の位置を示すポイントインデックス、及び不変量（いずれも不図示）が登録されている。ハッシュテーブル２２６２はメモリ２２６に記憶してある。また、画像の類似度を判定するため、予め登録フォーマット（照合する画像・文書画像）をメモリ２２６に記憶してある。なお、図１３（ｂ）に示すように、ハッシュ値が等しい場合（Ｈ１＝Ｈ５）、ハッシュテーブル２２６２の２つのエントリを１つにまとめることもできる。

図１４は登録フォーマットの特徴点座標テーブル２２６３の構造を示す説明図である。登録フォーマットの特徴点座標テーブル２２６３は、メモリ２２６に記憶してあり、各登録フォーマットを識別するための原稿を表すインデックス、各登録フォーマットにおいて算出された特徴点を識別するための特徴点を表すインデックス、各特徴点の登録フォーマット上の座標（ｘ座標、ｙ座標）の各欄により構成されている。

図１４に示すように、例えば、原稿を表すインデックスがＩＤ１の登録フォーマットは、特徴点ｆ１１、ｆ１２、ｆ１３、ｆ１４、…を有し、それぞれの登録フォーマット上の特徴点の座標は、（ｘ１１、ｙ１１）、（ｘ１２、ｙ１２）、（ｘ１３、ｙ１３）、（ｘ１４、ｙ１４）、…である。他の登録フォーマットＩＤ２、…についても同様である。

投票処理部２２３は、特徴量算出部２２２が算出したハッシュ値（特徴量）に基づいて、メモリ２２６に記憶された登録フォーマットのハッシュテーブル２２６２を検索し、ハッシュ値が一致する場合、該ハッシュ値に登録されている原稿を表すインデックス（すなわち、一致するハッシュ値が算出された画像）に投票する。投票を累積加算した結果を得票数として類似度判定処理部２２４へ出力する。

また、投票処理部２２３は、原稿画像のハッシュ値と登録フォーマットのハッシュ値とが一致する場合、原稿画像の特徴点がどの登録フォーマットの何れの特徴点に投票したかを判定し、判定結果を特徴点投票テーブル２２６４としてメモリ２２６に記憶する。

図１５は特徴点投票テーブル２２６４の構造を示す説明図である。特徴点投票テーブル２２６４は、登録フォーマットの原稿を表すインデックスＩＤ１、ＩＤ２、ＩＤ３、ＩＤ４、…、ＩＤｎに対応して登録フォーマットの特徴点を表すインデックスｆ１１、ｆ２１、…、ｆｎ１（以下「ｆｎ１」と示す。）、ｆ１２、ｆ２２、…、ｆｎ２（以下「ｆｎ２」と示す）、以下同様に、ｆｎ３、ｆｎ４、ｆｎ５、ｆｎ６、ｆｎ７、…で構成されるマトリクスの各要素に原稿画像の特徴点を表すインデックスｐ１、ｐ２、…が記録されたものである。

図１５に示すように、例えば、インデックスｐ１で表される原稿画像の特徴点に対して算出されたハッシュ値が、登録フォーマットの原稿を表すインデックスＩＤ１の特徴点ｆ１１のハッシュ値と一致すると判定されている。また、インデックスｐ２で表される原稿画像の特徴点に対して算出されたハッシュ値が、登録フォーマットの原稿を表すインデックスＩＤ３の特徴点ｆ３２のハッシュ値と一致すると判定されている。さらに、インデックスｐ３で表される原稿画像の特徴点に対して算出されたハッシュ値が、登録フォーマットの原稿を表すインデックスＩＤ１の特徴点ｆ１３のハッシュ値と一致すると判定されている。以下、インデックスｐ４、ｐ５、ｐ６、ｐ７、…についても同様である。

類似度判定処理部２２４は、投票処理部２２３から入力された投票結果に基づいて、読み取られた原稿画像がいずれの登録フォーマットに類似するかを判定し、判定結果を記入事項判定処理部２２５へ出力する。より具体的には、類似度判定処理部２２４は、投票処理部２２３から入力された得票数を原稿画像の最大得票数（特徴点の数×１つの特徴点から算出されるハッシュ値の数で表される）で除算して正規化した類似度を算出する。類似度判定処理部２２４は、算出した類似度と予め定めた閾値Ｔｈ（例えば、０．８）とを比較し、類似度が閾値Ｔｈ以上である場合には、その類似度が算出された登録フォーマットに類似すると判定し、類似度が閾値Ｔｈより小さい場合には、原稿画像に類似する登録フォーマットはないと判定して、その判定結果を記入事項判定処理部２２５へ出力する。なお、投票処理部２２３から入力された得票数を予め定めた閾値と比較し、得票数が閾値以上であれば、原稿画像が予め登録された登録フォーマットに類似すると判定し、さらに類似と判定された中で最も得票数の高い登録フォーマットが原稿画像に一致すると判定することもできる。

図１６は投票結果に基づく類似判定の一例を示す説明図である。図１６に示すように、読み取った原稿画像から算出されたハッシュ値毎にハッシュテーブル２２６２を検索して投票した結果、原稿を表すインデックスがＩＤ１、ＩＤ２、ＩＤ３で示される登録フォーマットに対して投票されたとする。投票の結果得られたそれぞれの得票数を原稿画像の最大得票数で除算して正規化した類似度Ｎ１、Ｎ２、Ｎ３を算出する。算出した類似度が閾値Ｔｈ以上であるのは、原稿を表すインデックスがＩＤ１で示される登録フォーマットであるため、原稿画像は、原稿を表すインデックスＩＤ１の登録フォーマットに類似すると判定される。

記入事項判定処理部２２５は、類似度判定処理部２２４から原稿画像が登録フォーマットに類似するとの判定結果が出力された場合、原稿画像に記入漏れがあるか否かを判定し、記入漏れの有無を示す判定信号を出力する。より具体的には、記入事項判定処理部２２５は、原稿画像と登録フォーマットとの位置合わせを行う位置合わせ処理、記入漏れの判定領域を特定する処理、原稿画像及び登録フォーマットそれぞれの各画素が有する画素値（例えば、輝度値）の差分を算出する差分処理、算出された差分に基づいて原稿画像に記入漏れがあるか否かを判定する判定処理などを行う。

次に、登録フォーマットの座標系を原稿画像の座標系に変換して画像の位置合わせを行う位置合わせ処理について説明する。なお、以下の説明においては、原稿画像は、原稿を表すインデックスがＩＤ１の登録フォーマットに類似していると判定されたものとする。

記入事項判定処理部２２５は、メモリ２２６にアクセスして、特徴点投票テーブル２２６４から原稿を表すインデックスがＩＤ１に投票された原稿画像の特徴点を抽出する。図１５の例では、原稿画像の特徴点を表すインデックスは、ｐ１、ｐ３、ｐ４、ｐ７である。

記入事項判定処理部２２５は、抽出した原稿画像の特徴点を表すインデックスｐ１、ｐ３、ｐ４、ｐ７に対応（ハッシュ値が一致）する登録フォーマットの特徴点を表すインデックスｆ１１、ｆ１３、ｆ１４、ｆ１７を特定する。記入事項判定処理部２２５は、登録フォーマットの特徴点座標テーブル２２６３及び原稿画像の特徴点座標テーブル２２６１を参照して、式（１）で示される登録フォーマットの特徴点の座標についての行列Ｊｉｎ、式（２）で示される原稿画像の特徴点の座標についての行列Ｊｏｕｔを求め、変換行列Ｗの変換係数を式（３）と仮定する。

記入事項判定処理部２２５は、式（４）により変換行列Ｗを算出する。この場合、式（４）の両辺にＪｉｎの転置行列Ｊｉｎ^Tを乗算して式（５）を求め、さらに、式（５）の両辺にＪｉｎ^TＪｉｎの逆行列を乗算して式（６）を求めることにより、変換係数を算出
する。記入事項判定処理部２２５は、算出した変換係数で示される変換行列Ｗを用いて、式（７）で示す如く、登録フォーマット上の任意の座標（ｘ、ｙ）を、原稿画像上の座標（ｘ′、ｙ′）に変換する。

図１７は原稿画像及び登録フォーマットの位置合わせを示す説明図である。図１７に示すように、登録フォーマットの特徴点ｆ１１、ｆ１３、ｆ１４、ｆ１７と、原稿画像の特徴点ｐ１、ｐ３、ｐ４、ｐ７をそれぞれ対応付けることにより、登録フォーマットの原点（画像の左上の画素）と原稿画像の左上の画素の位置がずれている場合であっても、両画像の原点を一致させることができ、登録フォーマットと原稿画像との位置合わせを行うことができる。なお、各画像の特徴点の数は、４つに限定されるものではない。また、登録フォーマットの書式によっては、多数の特徴点が存在する場合、その中からいくつかの特徴点を選択することもできる。

次に、記入漏れの有無を判定する判定領域（判定箇所）の特定について説明する。図１８は登録フォーマットの一例を示す説明図である。図１８に示すように、登録フォーマット（すなわち、所定の書式の書類）には、一例として、日付、氏名、住所、電話番号、内容の各項目名に対する記載欄が設けられている。また、各記載欄のうち、記入漏れの判定を行う箇所は、日付、氏名、住所、電話番号の各項目名に対する記載欄（図中模様入りの領域）が予め定められている。

図１９は記入漏れ判定領域を示す判定領域テーブル２２６５の一例を示す説明図である。図１９（ａ）に示すように、判定領域テーブル２２６５は、登録フォーマットの原稿を表すインデックス、登録フォーマットの項目名、項目名に対する記載欄の対角座標により構成され、さらに、図１９（ｂ）に示すように、各項目名に対する記載欄の登録フォーマット上の位置は、記載欄の各四隅の座標で特定されている。図１９（ｂ）では、一例として原稿を表すインデックスがＩＤ１の登録フォーマットの記載欄のうち日付欄の座標（ｘ１、ｙ１）、（ｘ２、ｙ１）、（ｘ１、ｙ２）、（ｘ２、ｙ２）を示している。

図１９（ａ）に示すように、例えば、原稿を表すインデックスがＩＤ１の登録フォーマットでは、日付の記載欄は、記載欄の対角座標である座標（ｘ１、ｙ１）及び（ｘ２、ｙ２）で特定され、同様に氏名の記載欄は、座標（ｘ３、ｙ３）及び（ｘ４、ｙ４）で特定され、住所の記載欄は、座標（ｘ５、ｙ５）及び（ｘ６、ｙ６）で特定され、電話番号の記載欄は、座標（ｘ７、ｙ７）及び（ｘ８、ｙ８）で特定されている。他の登録フォーマット（原稿を表すインデックスがＩＤ２、ＩＤ３、…）についても同様である。

図２０は登録フォーマットの他の例を示す説明図であり、図２１は記入漏れ判定領域を示す判定領域テーブル２２６５の他の例を示す説明図である。図２０に示すように、登録フォーマットには、日付、氏名、住所、電話番号、内容の各項目名に加えて、捺印の項目名に対する記載欄が設けられている。また、各記載欄のうち、記入漏れの判定を行う箇所は、日付、氏名、住所、電話番号、捺印の各項目名に対する記載欄（図中模様入りの領域）が予め定められている。

図２１に示すように、原稿を表すインデックスがＩＤ１の登録フォーマットでは、日付の記載欄は、記載欄の対角座標である座標（ｘ１、ｙ１）及び（ｘ２、ｙ２）で特定され、同様に氏名の記載欄は、座標（ｘ３、ｙ３）及び（ｘ４、ｙ４）で特定され、捺印の記載欄は、座標（ｘ０、ｙ０）及び（ｘ９、ｙ９）で特定され、住所の記載欄は、座標（ｘ５、ｙ５）及び（ｘ６、ｙ６）で特定され、電話番号の記載欄は、座標（ｘ７、ｙ７）及び（ｘ８、ｙ８）で特定されている。

記入事項判定処理部２２５は、原稿画像が登録フォーマットに類似すると判定した場合、類似と判定された登録フォーマットの原稿を表すインデックスに基づいて、判定領域テーブル２２６５を検索し、類似する登録フォーマットの項目名及び座標値を取得し、取得した座標値に基づいて、項目名毎に記入漏れの判定領域を特定し、特定した判定領域に対応する原稿画像の領域内の記入漏れを判定する。

次に、原稿画像及び登録フォーマットそれぞれの各画素が有する画素値の差分を算出する差分処理について説明する。記入事項判定処理部２２５は、位置合わせが行われた原稿画像と登録フォーマットそれぞれの判定領域内の画素を、例えば、両画像の左上から右下に順次走査することにより、両画像で対応する注目画素の輝度値の差分を算出する。この場合、原稿を読み取る際の画素値の再現性などを考慮して、画像が２５６階調で表されているようなときには、両画像の対応する画素の輝度値の差分が５〜１０程度の範囲内（差分閾値Ｔｇ）位置であれば、注目画素は同じである判定する。例えば、原稿画像のある注目画素の輝度値が２１０であり、登録フォーマットの対応する注目画素の輝度値が２１５であれば、両注目画素は同じである判定する。また、例えば、原稿画像のある注目画素の輝度値が２１０であり、登録フォーマットの対応する注目画素の輝度値が２３５であれば、両注目画素は同じでないと判定する。

記入事項判定処理部２２５は、画素値（例えば、輝度値）が略同じであると判定された画素数（判定画素数Ｍ）を、判定領域内の登録フォーマットが有する画素数で除算した比率が比率閾値Ｔｓ（例えば、０．９９）より大きいか否かを判定し、算出された比率が比率閾値Ｔｓより大きい場合には、原稿画像に記入漏れがあると判定し、判定信号を出力する。また、算出された比率が比率閾値Ｔｓ以下である場合には、原稿画像に記入漏れがないと判定し、判定信号を出力する。なお、画素値が略同じでないと判定された画素数を登録フォーマットが有する画素数で除算した比率が比率閾値Ｔｄ（例えば、０．０１）より小さいか否かを判定し、算出された比率が比率閾値Ｔｄより小さい場合には、原稿画像に記入漏れがあると判定し、算出された比率が比率閾値Ｔｄ以上である場合には、原稿画像に記入漏れがないと判定することもできる。

すなわち、記入事項判定処理は、判定領域（判定箇所）において、取得した原稿画像及び登録フォーマット（登録画像）が有する画素値の差分を算出し、算出された差分値を所定の閾値（差分閾値）と比較して画素値が略同一である画素の画素数（判定画素数）を算出し、算出された判定画素数を判定領域における登録フォーマットが有する全画素数で除算した比率を算出し、算出された比率を所定の閾値（比率閾値）と比較（大小の比較）し、比較結果に応じて記入漏れの有無の判定を行う。

登録フォーマットの座標系を原稿画像の座標系に変換して画像の位置合わせを行う場合、上述の如く、登録フォーマット全体を座標変換することもでき、あるいは、登録フォーマットの記載欄毎に座標変換を行う箇所を予め定めておき、定められた一部の箇所だけを座標変換することもできる。この場合、座標変換を行う箇所を記入漏れの判定を行う判定領域に合わせることができる。これにより、記入漏れの有無を判定する箇所だけを座標変換して記入漏れ判定処理をすることができ、画像全体の処理を行う場合に比べて、処理労力の低減を図ることができ、記入事項判定処理を高速に実現することができる。

次に、画像形成装置１００の動作について説明する。図２２は文書照合処理の手順を示すフローチャートである。なお、文書照合処理は、専用のハードウエア回路で構成するだけでなく、ＣＰＵ、ＲＡＭ、ＲＯＭなどを備えたパーソナルコンピュータに、文書照合処理の手順を定めたコンピュータプログラムをロードしてＣＰＵでコンピュータプログラムを実行させることにより行うこともできる。また、コンピュータプログラムに、文書照合処理に加えて、文書照合処理で判定された結果に応じて判定結果の報知、原稿の排出等を制御する制御処理を加えることもできる。

制御部２２７は、ユーザによる操作（原稿の読み取り操作）の有無を判定し（Ｓ１１）、操作がない場合（Ｓ１１でＮＯ）、ステップＳ１１の処理を続け、ユーザによる操作があるまで待機する。ユーザによる操作があった場合（Ｓ１１でＹＥＳ）、制御部２２７は、カラー画像入力装置１で読み取られた原稿により得られた原稿画像を取得する（Ｓ１２）。

制御部２２７は、取得した原稿画像に基づいて、特徴点を算出し（Ｓ１３）、算出した特徴点に基づいてハッシュ値（特徴量）を算出する（Ｓ１４）。制御部２２７は、算出したハッシュ値（特徴量）に基づいて、登録フォーマットのハッシュテーブル２２６２を検索し、ハッシュ値が一致する原稿を表すインデックスに投票する（Ｓ１５）。なお、この場合、制御部２２７は、原稿画像の特徴点がどの登録フォーマットの何れの特徴点に投票したかを判定し、判定結果を記憶する。

制御部２２７は、原稿画像の最大得票数で得票数を除算して類似度を算出し（Ｓ１６）、算出した類似度が閾値Ｔｈより大きいか否かを判定する（Ｓ１７）。類似度が閾値Ｔｈより大きい場合（Ｓ１７でＹＥＳ）、制御部２２７は、記入事項判定処理を行う（Ｓ１８）。なお、記入事項判定処理の詳細は後述する。制御部２２７は、記入事項判定処理で得られた判定結果を出力する（Ｓ１９）。なお、カラー画像処理装置２内のＣＰＵ（不図示）は、判定結果に応じて、後述する所定の制御処理を行う。

制御部２２７は、すべての原稿画像を取得したか否かを判定し（Ｓ２０）、すべての原稿画像を取得していない場合（Ｓ２０でＮＯ）、ステップＳ１２以降の処理を続ける。一方、類似度が閾値Ｔｈより大きくない場合（Ｓ１７でＮＯ）、制御部２２７は、ステップＳ２０以降の処理を続ける。すべての原稿画像を取得した場合（Ｓ２０でＹＥＳ）、制御部２２７は、処理を終了する。

図２３及び図２４は記入事項判定処理の手順を示すフローチャートである。制御部２２７は、原稿画像と類似すると判定された登録フォーマットの座標系（座標）を原稿画像の座標系（座標）に変換する（Ｓ１０１）。なお、この場合、登録フォーマットの全体を座標変換してもよく、あるいは登録フォーマットの予め定められた記載欄のみの座標変換を行ってもよい。

制御部２２７は、判定領域テーブル２２６５を検索して原稿画像と類似すると判定された登録フォーマットの項目名、各項目名の座標値を取得し（Ｓ１０２）、取得した座標値に基づいて、記入漏れを判定するための記入事項判定領域を原稿画像上及び登録フォーマット上に特定する（Ｓ１０３）。

制御部２２７は、原稿画像と登録フォーマットの各画素のうち同じ画素値（例えば、輝度値）を有する画素数を示す判定画素数Ｍを「０」にし（Ｓ１０４）、記入事項判定領域における原稿画像と登録フォーマットの注目画素を走査することにより、各注目画素の画素値の差分を算出する（Ｓ１０５）。

制御部２２７は、算出した差分が差分閾値Ｔｇより小さいか否かを判定し（Ｓ１０６）、差分が差分閾値Ｔｇより小さい場合（Ｓ１０６でＹＥＳ）、判定画素数Ｍに「１」を加算する（Ｓ１０７）。制御部２２７は、記入事項判定領域における原稿画像及び登録フォーマットのすべての画素について処理が終了したか否かを判定し（Ｓ１０８）、すべての画素について処理が終了していない場合（Ｓ１０８でＮＯ）、ステップＳ１０５以降の処理を続ける。

制御部２２７は、差分が差分閾値Ｔｇより小さくない場合（Ｓ１０６でＮＯ）、ステップＳ１０８以降の処理を続ける。すべての画素について処理が終了した場合（Ｓ１０８でＹＥＳ）、制御部２２７は、（判定画素数Ｍ／登録フォーマットの画素数）で表される比率が比率閾値Ｔｓより大きいか否かを判定する（Ｓ１０９）。

制御部２２７は、比率が比率閾値Ｔｓより大きい場合（Ｓ１０９でＹＥＳ）、記入漏れありと判定し（Ｓ１１０）、記入漏れの項目名を記録し（Ｓ１１１）、すべての判定領域の処理が終了したか否かを判定する（Ｓ１１２）。一方、制御部２２７は、比率が比率閾値Ｔｓより大きくない場合（Ｓ１０９でＮＯ）、記入漏れなしと判定し（Ｓ１１３）、ステップＳ１１２以降の処理を続ける。

制御部２２７は、すべての判定領域の処理が終了していないと判定した場合（Ｓ１１２でＮＯ）、ステップＳ１０４以降の処理を続け、すべての判定領域の処理が終了したと判定した場合（Ｓ１１２でＹＥＳ）、処理を終了する。

上述の如く、記入事項判定処理を行う場合に、原稿画像及び登録フォーマットで同じ画素値を有する画素数と登録フォーマットの画素数との比率で判定することにより、ノイズにより原稿画像上の画素が本来有する画素値と異なる画素値となった場合であっても、登録フォーマットの画素数で除算することでノイズの影響を小さくすることができるという利点がある。

カラー画像処理装置２のＣＰＵ（不図示）は、記入事項判定処理の判定結果に応じて、記入漏れがある場合、記入漏れがある旨及び原稿の項目名のうち、いずれの項目名に記入漏れがあるかを操作パネル４に表示し、あるいは、画像形成装置１００に接続されたパーソナルコンピュータのディスプレイ等に表示することができる。また、原稿を複数枚連続して読み取った場合に、読み取った原稿のいずれかに記入漏れがあるときには、読み取った原稿の何頁目の原稿に記入漏れがあるかを表示させることもできる。

また、記入漏れがあると判定された場合は、複写、ファイリング、電子メール送信、ファクシミリ送信等処理は行われない。尚、原稿が複数枚よりなる場合、ファイリング、電子メール配信、ファクシミリ送信の処理においては、１枚でも記入漏れの原稿があるとこれらの処理を行わないようにしても良い。

図２５は本発明に係る原稿読取装置５００の構成を示すブロック図である。図に示すように、原稿読取装置５００は、カラー画像入力装置１、Ａ／Ｄ変換部２０、シェーディング補正部２１、文書照合処理部２２、原稿シフター機構５０などを備えている。カラー画像入力装置１、Ａ／Ｄ変換部２０、シェーディング補正部２１、文書照合処理部２２は、上述の画像形成装置１００の場合と同様であるので説明は省略する。

原稿シフター機構５０は、文書照合処理部２２から出力される判定信号を取得し、取得した判定信号に応じて、記入漏れがある原稿と記入漏れのない原稿を仕分けして排出する。詳細は後述する。

図２６は本発明に係る原稿読取装置５００の構成を示す模式図である。原稿読取装置５００は、上部筐体５１０で構成される原稿搬送部、下部筐体５６０で構成されるスキャナ部などを備える。

上部筐体５１０には、原稿トレイ５１１に載置された原稿を１枚ずつ搬送するための呼込みローラ５１２、原稿上の画像を読み取るために原稿を搬送する搬送ローラ５１３ａ、５１３ｂ、原稿を排出する際に、文書照合処理部２２から入力される判定信号に基づいて、原稿の搬送方向（排出方向）に対して原稿の排出位置をシフトさせる原稿シフター機構５０、排出される原稿を検知する原稿排出センサ５６７などを設けている。なお、原稿シフター機構５０は、上下２つに分離することができるように構成されている。

下部筐体５６０には、載置台５６１の下面に沿って平行に往復移動する走査ユニット５６２、５６３、結像レンズ５６４、及び光電変換素子であるＣＣＤラインセンサ５６５、原稿シフター機構５０、排出トレイ５６６などが設けてある。走査ユニット５６２は、原稿トレイ５１１から搬送される原稿、あるいは、載置台５６１に載置された原稿に光を照射するための光源５６２ａ（例えば、ハロゲンランプなど）、原稿で反射された光を所定の光路に導くためのミラー５６２ｂなどを備えている。また、走査ユニット５６３は、原稿で反射された光を所定の光路に導くためのミラー５６３ａ、５６３ｂなどを備えている。

結像レンズ５６４は、走査ユニット５６３から導かれた反射光をＣＣＤラインセンサ５６５上の所定の位置に結像させる。ＣＣＤラインセンサ５６５は、結像された光像を光電変換して電気信号を出力する。すなわち、原稿（例えば、原稿の表面）から読み取ったカラー画像に基づいて、Ｒ（赤）、Ｇ（緑）、Ｂ（青）の各色成分に色分解したデータをカラー画像処理装置２へ出力する。

図２７及び図２８は原稿シフター機構５０の構成を示す横断面図である。原稿シフター機構５０は、上下に分離可能な横断面が矩形状の筐体５１、５２を備え、筐体５１は下部筐体５６０に支持され、筐体５２は上部筐体５１０に支持されている。筐体５２には、オフセット部材６０、回転駆動源６５、駆動伝達部材７０、オフセット用駆動源７５、オフセット用駆動伝達部材８０などを設けてある。

オフセット部材６０は、水平方向（図中、Ｙ方向、すなわち原稿排出方向に直交する方向）に移動可能であり、筐体５２の内側に配置された横断面が矩形状の筐体６１、筐体６１の長手方向に沿って適長離隔したオフセットローラ６２、…などを備えている。オフセット部材６０は、水平方向に移動することにより、原稿をオフセット排出（原稿のカテゴリ毎に原稿を水平方向にシフトして排出）する。筐体６１は、原稿を搬送方向に排出するようにオフセットローラ６２、…を回転自在に支持する。オフセットローラ６２、…は、原稿を排出する際に原稿をチャックして排出トレイ５６６に排出する。

駆動伝達部材７０は、回転駆動源６５に接続された駆動ギア７１、駆動ギア７１の中央部に嵌合されたシャフト７２、シャフト７２上に配置された連結ギア７３ａ、スライド部材７４、連結ギア７３ａに螺合する連結ギア７３ｂなどを備え、連結ギア７３ｂの中央部には、棒状の支持部材６３を嵌合してあり、支持部材６３上には、適長離隔してオフセットローラ６２、…を固定してある。これにより、回転駆動源６５からの駆動力をオフセットローラ６２、…に伝達する。

シャフト７２は、水平方向に回転自在に支持され、スライド部材７４は、シャフト７２上を摺動することができる。また、シャフト７２は、スライド部材７４、連結ギア７３ａ、７３ｂを介してオフセット部材６０を原稿の排出（搬送）方向に直交する方向（水平方向）に移動させることができる。また、シャフト７２は、連結ギア７３ａ、７３ｂ、オフセット部材６０の水平方向の移動範囲を規制するため、スライド部材７４に設けられた軸方向に長い孔７４ａに係合する規制部材７２ａを設けている。規制部材７２ａが孔７４ａの内側に沿って移動する際に孔７４ａの両端部に当接することにより、連結ギア７３ａ、７３ｂ、オフセット部材６０の水平方向の移動範囲を規制する。

回転駆動源６５からの駆動力は、駆動ギア７１に伝わり、駆動ギア７１が回転することにより、シャフト７２が回転し、シャフト７２の回転に伴って、連結ギア７３ａ、７３ｂに回転が伝わり、連結ギア７３ｂの回転により支持部材６３が回転してオフセットローラ６２が回転する。オフセットローラ６２、…夫々に当接してオフセットローラ６２、…の回転に従動して回転するオフセットローラ６４、…が支持部材６３に並行に配置された支持部材６８上に配置してある。

上部筐体５１０、下部筐体５６０夫々に配置されたオフセット用駆動源７５、７５夫々には、ピニオンギア８１、ラックギア８２から構成されるオフセット用駆動伝達部材８０、８０を接続してあり、ラックギア８２、８２には、筐体６１、６１が固定してある。ピニオンギア８１の回転に応じて、ラックギア８２を水平方向（図中、Ｙ方向）に移動させる。これにより、ラックギア８２、８２は、筐体６１、６１を水平方向に移動させる。オフセット用駆動源７５、７５は、文書照合処理部２２から出力される判定信号に応じて同期して制御され、筐体６１、６１を水平方向の異なる位置に移動させる。これにより、オフセットローラ６２、…、及びオフセットローラ６４、…が同時に同じ方向にオフセット（シフト）されて原稿の排出位置が制御される。

図２８では図２７の場合に比較してオフセットローラ６２、…、及びオフセットローラ６４、…がオフセットされている。

図２９は原稿の排出位置を示す説明図である。図では、一例として、読み取った原稿が登録フォーマットに類似する原稿（カテゴリＣ１）、登録フォーマットに類似しない原稿（カテゴリＣ２）、及び登録フォーマットに類似し、かつ記入漏れがある原稿（カテゴリＣ３）の３つに仕分ける場合を示す。例えば、カテゴリＣ１、Ｃ２、Ｃ３に応じて、原稿の排出（搬送）方向に直交する方向（Ｙ方向）に原稿の排出位置をＹ１、Ｙ２、Ｙ３の如く、例えば、１インチ程度オフセット（シフト）させる。これにより、ユーザが多数の原稿を読み取る場合、登録フォーマットに類似する原稿を従来に比較して容易に分類することができるのみならず、記入漏れがある原稿も仕分けて分類することができ、ユーザの利便性が向上する。なお、原稿のオフセット量（シフト量）は、１インチに限定されるものではない。

図３０は記入漏れを報知する画面表示例を示す説明図である。図３０に示すように、記入漏れがある場合の画面表示としては、記入漏れがある旨を示す「原稿（書類名×××）に記入漏れがあります。」、記入漏れ箇所も知らせるために「原稿（書類名×××）の氏名欄が記入されていません。」、多数の原稿を読み取った場合に記入漏れがある原稿の頁を示す「ＯＯページ目の原稿に記入漏れがあります。」、記入漏れがある原稿を仕分けて排出したことを示す「原稿の×××に記入漏れがあります。他の原稿と仕分けて排出しました。」などがある。なお、画面表示例は、これらに限定されるものではない。

実施の形態２
読み取られる原稿の用紙としては、白色の用紙であるとは限らず、再生紙、あるいは薄く着色された用紙を用いることもある。このような場合であっても、原稿画像の下地除去処理を行うことにより精度良く記入漏れの有無を判定することができる。この場合、文書照合処理部２２で下地除去処理を行うことができる（文書照合処理部２２に下地除去処理部を設ける）。あるいは、シェーディング補正部２１の後段に入力階調補正部２３を設け、入力階調補正部２３の後段に文書照合処理部２２を設けて、入力階調補正部２３で下地除去処理を行うようにすることもできる。

原稿画像に対して下地除去を行う場合、登録フォーマットについても下地除去処理を施して登録しておく。あるいは、原稿画像に対して、登録フォーマットの下地と同じレベルの下地となるように下地除去を行う。これは、下地除去を行う際の濃度補正テーブルを適切に設定することにより可能である。

文書照合処理部２２は、シェーディング補正部２１から入力されたＲＧＢ信号のうちＧ信号を補正反転した信号を抽出し、例えば、２５６段階の濃度を１６の区分に分割して原稿画像の濃度ヒストグラムを作成する。

また、下地であると判断される濃度値の最大値を予め第１の閾値としてメモリ２２６に記憶しておくとともに、どれだけの画素数以上であれば下地であると判断するか、すなわち、下地であると判断される画素数の最小値を予め第２の閾値としてメモリ２２６に記憶しておく。また、下地であると判断された濃度区分に対応して下地を除去するための濃度補正テーブルをメモリ２２６に記憶しておく。

文書照合処理部２２は、作成した濃度ヒストグラムの高濃度側から検索することにより、下地であると判断される第１の閾値以下の濃度区分にあって、画素数が第２の閾値以上の濃度区分を下地として抽出する。文書照合処理部２２は、下地として抽出した濃度区分に対応する濃度補正テーブルにより下地除去処理を行う。なお、Ｇ信号に代えて、輝度信号（２５５−Ｙｊ）を用いることもできる。ここで、Ｙｊは各画素ＲＧＢの色成分を夫々Ｒｊ、Ｇｊ、Ｂｊとし、Ｙｊ＝０．３０×Ｒｊ＋０．５９×Ｇｊ＋０．１１×Ｂｊで表される。

図３１及び図３２は実施の形態２の記入事項判定処理の手順を示すフローチャートである。制御部２２７は、原稿画像と類似すると判定された登録フォーマットの座標系（座標）を原稿画像の座標系（座標）に変換する（Ｓ１２１）。なお、この場合、実施の形態１と同様に登録フォーマットの全体を座標変換してもよく、あるいは登録フォーマットの設定された記載欄のみの座標変換を行ってもよい。

制御部２２７は、原稿画像から抽出したＧ信号を補正反転した信号に基づいて、原稿画像の濃度ヒストグラムを作成し（Ｓ１２２）、作成した濃度ヒストグラムの高濃度側から検索することにより、下地を抽出する（Ｓ１２３）。制御部２２７は、下地として抽出した濃度区分に対応する濃度補正テーブルを用いて原稿画像の下地を除去する（Ｓ１２４）。

制御部２２７は、判定領域テーブル２２６５を検索して原稿画像と類似すると判定された登録フォーマットの項目名、各項目名の座標値を取得し（Ｓ１２５）、取得した座標値に基づいて、記入漏れを判定するための記入事項判定領域を原稿画像上及び登録フォーマット上に特定する（Ｓ１２６）。

制御部２２７は、原稿画像と登録フォーマットの各画素のうち同じ画素値（例えば、輝度値）を有する画素数を示す判定画素数Ｍを「０」にし（Ｓ１２７）、記入事項判定領域における原稿画像と登録フォーマットの注目画素を走査することにより、各注目画素の画素値の差分を算出する（Ｓ１２８）。

制御部２２７は、算出した差分が差分閾値Ｔｇより小さいか否かを判定し（Ｓ１２９）、差分が差分閾値Ｔｇより小さい場合（Ｓ１２９でＹＥＳ）、判定画素数Ｍに「１」を加算する（Ｓ１３０）。制御部２２７は、記入事項判定領域における原稿画像及び登録フォーマットのすべての画素について処理が終了したか否かを判定し（Ｓ１３１）、すべての画素について処理が終了していない場合（Ｓ１３１でＮＯ）、ステップＳ１２８以降の処理を続ける。

制御部２２７は、差分が差分閾値Ｔｇより小さくない場合（Ｓ１２９でＮＯ）、ステップＳ１３１以降の処理を続ける。すべての画素について処理が終了した場合（Ｓ１３１でＹＥＳ）、制御部２２７は、（判定画素数Ｍ／登録フォーマットの画素数）で表される比率が比率閾値Ｔｓより大きいか否かを判定する（Ｓ１３２）。

制御部２２７は、比率が比率閾値Ｔｓより大きい場合（Ｓ１３２でＹＥＳ）、記入漏れありと判定し（Ｓ１３３）、記入漏れの項目名を記録し（Ｓ１３４）、すべての判定領域の処理が終了したか否かを判定する（Ｓ１３５）。一方、制御部２２７は、比率が比率閾値Ｔｓより大きくない場合（Ｓ１３２でＮＯ）、記入漏れなしと判定し（Ｓ１３６）、ステップＳ１３５以降の処理を続ける。

制御部２２７は、すべての判定領域の処理が終了していないと判定した場合（Ｓ１３５でＮＯ）、ステップＳ１２７以降の処理を続け、すべての判定領域の処理が終了したと判定した場合（Ｓ１３５でＹＥＳ）、処理を終了する。

これにより、読み取られる原稿の用紙が再生紙、あるいは薄く着色された用紙であっても、精度良く記入漏れの有無を判定することができる。

実施の形態３
実施の形態１、２においては、記入漏れの有無を判定する場合に、（判定画素数Ｍ／登録フォーマットの画素数）で表される比率を用いる構成であったが、記入漏れ判定処理は、これに限定されるものではなく、文書照合処理部２２で画素数を算出することにより実現することができる。

図３３及び図３４は実施の形態３の記入事項判定処理の手順を示すフローチャートである。制御部２２７は、原稿画像と類似すると判定された登録フォーマットの座標系（座標）を原稿画像の座標系（座標）に変換する（Ｓ１４１）。なお、この場合、登録フォーマットの全体を座標変換してもよく、あるいは登録フォーマットの予め定められた記載欄のみの座標変換を行ってもよい。

制御部２２７は、判定領域テーブル２２６５を検索して原稿画像と類似すると判定された登録フォーマットの項目名、各項目名の座標値を取得し（Ｓ１４２）、取得した座標値に基づいて、記入漏れを判定するための記入事項判定領域を原稿画像上及び登録フォーマット上に特定する（Ｓ１４３）。

制御部２２７は、原稿画像と登録フォーマットの各画素のうち同じ画素値（例えば、輝度値）を有する画素数を示す判定画素数Ｍを「０」にし（Ｓ１４４）、記入事項判定領域における原稿画像と登録フォーマットの注目画素を走査することにより、各注目画素の画素値の差分を算出する（Ｓ１４５）。

制御部２２７は、算出した差分が差分閾値Ｔｇより小さいか否かを判定し（Ｓ１４６）、差分が差分閾値Ｔｇより小さい場合（Ｓ１４６でＹＥＳ）、判定画素数Ｍに「１」を加算する（Ｓ１４７）。制御部２２７は、記入事項判定領域における原稿画像及び登録フォーマットのすべての画素について処理が終了したか否かを判定し（Ｓ１４８）、すべての画素について処理が終了していない場合（Ｓ１４８でＮＯ）、ステップＳ１４５以降の処理を続ける。

制御部２２７は、差分が差分閾値Ｔｇより小さくない場合（Ｓ１４６でＮＯ）、ステップＳ１４８以降の処理を続ける。すべての画素について処理が終了した場合（Ｓ１４８でＹＥＳ）、制御部２２７は、判定画素数Ｍが画素数閾値より大きいか否かを判定する（Ｓ１４９）。

制御部２２７は、判定画素数Ｍが画素数閾値より大きい場合（Ｓ１４９でＹＥＳ）、記入漏れありと判定し（Ｓ１５０）、記入漏れの項目名を記録し（Ｓ１５１）、すべての判定領域の処理が終了したか否かを判定する（Ｓ１５２）。一方、制御部２２７は、判定画素数Ｍが画素数閾値より大きくない場合（Ｓ１４９でＮＯ）、記入漏れなしと判定し（Ｓ１５３）、ステップＳ１５２以降の処理を続ける。

制御部２２７は、すべての判定領域の処理が終了していないと判定した場合（Ｓ１５２でＮＯ）、ステップＳ１４４以降の処理を続け、すべての判定領域の処理が終了したと判定した場合（Ｓ１５２でＹＥＳ）、処理を終了する。

画素数を算出する構成とすることにより、原稿の記載欄の面積の大小にかかわらず、わずかな記入漏れがある場合でも、記入漏れの有無を精度よく判定することができる。

この場合、記入事項判定処理は、判定領域（判定箇所）において、取得した原稿画像及び登録フォーマット（登録画像）が有する画素値の差分を算出し、算出された差分値を所定の閾値（差分閾値）と比較して画素値が略同一である画素の画素数（判定画素数）を算出し、算出された判定画素数を所定の閾値と比較（大小の比較）し、比較結果に応じて記入漏れの有無の判定を行う。

上述の実施の形態３では、原稿画像と登録フォーマットの注目画素の画素値が略等しい画素の数に基づいて、記入漏れの有無を判定する構成であったが、これに限定されるものではなく、例えば、記入漏れ判定領域内の原稿画像と登録フォーマットの注目画素の画素値が異なる画素数を算出し、算出した画素数と所定の閾値とを比較することにより、記入漏れの有無を判定することもできる。この場合、画素値が異なる画素数が、所定の閾値より小さいか否かを判定し、画素値が異なる画素数が所定の閾値より小さい場合には、記入漏れがあると判定し、画素値が異なる画素数が所定の閾値より小さくない場合には、記入漏れがないと判定することができる。

また、記入漏れ判定領域内の原稿画像及び登録フォーマットを所定の二値化閾値で二値化し、二値化後の画素数を算出し、算出された画素数の差異の大小に応じて記入漏れを判定することもできる。この場合、例えば、原稿画像の画素数と登録フォーマットの画素数との差分が所定の画素数閾値より小さい場合には、記入漏れありと判定し、差分が所定の画素数閾値より小さくない場合には、記入漏れなしと判定することができる。また、二値化後の画素数を算出する構成に代えて、原稿画像の黒画素の数を算出することもできる。

さらに、図２３及び図２４（又は図３１及び図３２）で示した比率により記入漏れの有無を判定する処理と図３３及び図３４で示した画素数を算出して記入漏れの有無を判定する処理を併用することもできる。この場合、制御部２２７は、（判定画素数Ｍ／登録フォーマットの画素数）で表される比率が比率閾値Ｔｓより大きく、かつ判定画素数Ｍが画素数閾値より大きい場合に、記入漏れありと判定し、（判定画素数Ｍ／登録フォーマットの画素数）で表される比率が比率閾値Ｔｓより大きくなく、かつ判定画素数Ｍが画素数閾値より大きくない場合に、記入漏れなしと判定する。なお、いずれか一方の判定条件を満たさない場合には、原稿の種類等に応じて、いずれかの判定結果を優先することができる。

比率による記入漏れ判定と画素数による記入漏れ判定とを併用することにより、記入漏れの有無の判定精度をさらに向上させることが可能になる。

実施の形態４
上述の実施の形態１〜３では、原稿シフター機構５０を設ける構成を示したが、原稿シフター機構は、原稿を排出する際にオフセットする構成に限定されるものではなく、排出トレイを原稿の排出（搬送）方向に直交する方向に可動させるように構成してもよい。この場合、原稿シフター機構において原稿をシフトさせる必要はなく、原稿を排出（搬送）させる機構があればよい。

図３５は排出トレイを可動させる場合の原稿シフター機構３００の構成を示す模式図であり、図３６は原稿シフター機構３００の構成を示す横断面図である。原稿シフター機構３００は、原稿読取装置本体に固定される支持トレイ部材３０１及び支持トレイ部材３０１の上側に配置される可動トレイ部材３０２などを備えている。なお、原稿読取装置５００の構成については、実施の形態１と同様であるので、同一箇所には同一符号を付し、説明を省略する。

支持トレイ部材３０１には、外形寸法よりやや小さい平面視矩形状の凹部３０３を設けてあり、凹部３０３に収容される形で、金属製の二本の互いに略平行な棒状の案内シャフト３０４、３０５が適長離隔して取り付けられている。具体的には、案内シャフト３０４、３０５夫々は、支持トレイ部材３０１の側壁に形成された貫通孔３１０、３１１、３１２、３１３、凹部３０３の底面から適長離隔して立設された軸受３０６、３０７、３０８、３０９に挿通されるとともに、軸受３０６、３０７、３０８、３０９で支承されている。

凹部３０３中央部には、モータ、歯車列が内蔵された減速ギアボックス（不図示）、ピニオン３１４などを備える駆動ユニット（不図示）を設けてあり、モータの回転は、歯車列により減速されてピニオン３１４に伝達される。可動トレイ部材３０２の上面内側には、案内シャフト３０４、３０５と平行に配置され、ピニオン３１４と噛合するラック３１５が取り付けられている。ピニオン３１４が回転することにより、ラック３１５が案内シャフト３０４、３０５の軸方向に移動する。

また、可動トレイ部材３０２の側縁部には、側縁辺に沿って（原稿の搬送方向に沿って）突条部３１６、３１７が形成されてあり、各突条部３１６、３１７には、案内シャフト３０４、３０５の端部が挿入され案内シャフト３０４、３０５を支承する軸受３２０、３２１、３２２、３２３を設けてある。以上の構成により、モータを駆動してピニオン３１４が回転すると、ピニオン３１４の回転がラック３１５に伝達されて、可動トレイ部材３０２は案内シャフト３０４、３０５に案内されて支持トレイ部材３０１に対してシートの搬送方向に直交する方向（図中矢印方向）に移動する。なお、可動トレイ部材３０２を移動させる手段としては、ラック及びピニオン機構に限定されるものではなく、エンドレスベルト機構又はリニアモータなどの他の機構を用いることもできる。

原稿の排出（搬送）方向に直交する方向に可動トレイ部材３０２を移動させる場合、例えば、実施の形態１と同様に、１インチ程度移動させることができる。これにより、ユーザが多数の原稿を読み取る場合、登録フォーマットに類似する原稿を従来に比較して容易に分類することができるのみならず、記入漏れがある原稿も仕分けて分類することができ、ユーザの利便性が向上する。なお、原稿のオフセット量（シフト量）は、１インチに限定されるものではない。

実施の形態５
上述の実施の形態１〜４では、原稿を排出する際にオフセットする構成であったが、原稿を仕分けて排出する方法は、これに限定されるものではなく、排出トレイを複数設けておき、判定信号に応じて原稿を排出する排出トレイを切替える構成とすることもできる。

図３７は実施の形態５の原稿読取装置５０１の構成を示す模式図である。原稿搬送部５２０は、原稿トレイ５２１、回動可能であって原稿トレイ５２１に積層して載置された原稿を１枚ずつ搬送するための呼込みローラ５２２ａ及び捌きローラ５２２ｂ、搬送された原稿を排出トレイ５２７ａ、５２７ｂ、５２７ｃまで搬送するための搬送路５２５、搬送路５２５の中途に適宜設けられたレジストローラ５２４ａ、搬送ローラ５２４ｂ、及び排出ローラ５２４ｃなどを備える。

排出ローラ５２４ｃの下流側には、原稿を排出する排出トレイを切替えるためのゲート５２３ｂ、５２３ｄ（可撓性又は自重により下方向に位置する）、５２３ｃが設けられ、ゲート５２３ｄとゲート５２３ｃとの間には、搬送ローラ５２４ｄを配置している。原稿を排出する場合、判定信号に基づいて、ゲート５２３ｂ、５２３ｄ、５２３ｃを駆動して、読み取った原稿が登録フォーマットに類似する原稿（カテゴリＣ１）は排出トレイ５２７ａに排出し、登録フォーマットに類似しない原稿（カテゴリＣ２）排出トレイ５２７ｂに排出し、登録フォーマットに類似し、かつ記入漏れがある原稿（カテゴリＣ３）は排出トレイ５２７ｃに排出する。

すなわち、カテゴリＣ１の原稿を排出する場合、ゲート５２３ｂを上方向に駆動することにより、原稿を排出トレイ５２７ａに排出する。また、カテゴリＣ２の原稿を排出する場合、ゲート５２３ｂを下方向に、ゲート５２３ｃを上方向に駆動することにより、原稿を排出トレイ５２７ｂに排出する。また、カテゴリＣ３の原稿を排出する場合、ゲート５２３ｂを下方向に、ゲート５２３ｃを下方向に駆動することにより、排出トレイ５２７ｃに排出する。

原稿トレイ５２１の原稿載置面には、原稿の有無を検出する原稿センサ５２１ａを設けている。原稿センサ５２１ａは、原稿トレイ５２１に載置された原稿がすべて搬送された場合、原稿が存在しないことを示す信号を出力する。これにより、原稿の搬送がすべて終了したか否かを判定することができる。

捌きローラ５２２ｂの下流側には、搬送路５２５と分離され、略１８０度湾曲した原稿搬送路５２６を設けている。原稿搬送路５２６の中途には、回動可能な原稿ローラ５２４ｅを設けてあり、原稿搬送路５２６に繋がるように排出トレイ５２７ｃが取付けられている。呼込みローラ５２２ａ、捌きローラ５２２ｂ、及び原稿ローラ５２４ｅは、ローラ駆動部（不図示）により、正回転及び反転回転する。

搬送路５２５と原稿搬送路５２６との分岐点には、ゲート駆動部（不図示）により揺動可能なゲート５２３ａが配置され、ゲート５２３ａが下方向に駆動されることにより、原稿トレイ５２１に載置された原稿は、搬送路５２５側に搬送される。一方、ゲート５２３ａが上方向に駆動されることにより、一旦排出トレイ５２７ｃに排出された原稿を原稿トレイ５２１へ搬送する。すなわち、本実施の形態においては、記入漏れのある原稿を引き続き読み取る必要があるような場合に、自動的に再度読み取りを行うこともできる。

下部筐体５６０で構成されるスキャナ部は、実施の形態１〜４と同様であるので、同一箇所には同一符号を付して説明は省略する。

実施の形態６
実施の形態５では、原稿読取装置５０１に複数の排出トレイを内蔵する構成であったが、原稿を分類して排出する方法は、これに限定されるものではなく、他の構成であってもよい。例えば、排出トレイに代えて、複数段の排出トレイを備えたオプション機構を追加する構成であってもよい。

図３８は実施の形態６の原稿読取装置５０２の構成を示す模式図である。図に示すように、原稿を分類して排出するためのオプション機構５３０を設けている。オプション機構５３０は、排出トレイ５３４ａ、５３４ｂ、５３４ｃ、５３４ｄ、各排出トレイに分けて原稿を排出するため原稿の搬送路を切替えるゲート５３３、…、排出ローラ５３２、…などを備えている。

実施の形態７
上述の各実施の形態では、記入漏れの有無を判定する場合に原稿画像と登録フォーマットの画素値を比較する構成であったが、記入漏れの有無の判定は、これに限定されるものではなく、登録フォーマットの画素値と比較することなく原稿画像のみで原稿画像の記入漏れの有無を判定することもできる。

図３９は実施の形態７の記入事項判定処理部２２８の構成を示すブロック図である。記入事項判定処理部２２８は、画素値算出部２２８１、分布算出部２２８２、エッジ画素判定部２２８３、判定部２２８４などを備えている。前述の各部の処理は制御部２２７により制御される。また、前述の各部で求められたデータはメモリ２２６に記憶される。記入事項判定処理部２２８は、実施の形態１と同様に、原稿画像に記入漏れがあるか否かの判定処理を行う前に、原稿画像と登録フォーマットとの位置合わせを行う位置合わせ処理および記入漏れの判定領域を特定する処理を行う。これらの処理内容については、実施の形態１と同様であるので、説明は省略する。

画素値算出部２２８１は、入力された原稿画像（画像データ）の注目画素を含む複数の画素よりなる画素ブロック（例えば、７×７画素で構成される第１の画素ブロック）内の画素それぞれに対して、その画素を含む複数の画素よりなる画素ブロック（例えば、７×７画素で構成される第２の画素ブロック）内の各画素の濃度値の平均値を算出し、算出した平均値を、その画素の画素値とする。これにより、注目画素を含む第１の画素ブロック内の各画素（上述の例では、４９個の画素）の平均値を求めることができる。なお、算出する画素値は、平均値に限定されるものではなく、第２の画素ブロック内の各画素の濃度値の中心値など、他の値を求めることもできる。

分布算出部２２８２は、注目画素を含む複数の画素よりなる第１の画素ブロック内の各画素の平均値を探索し、第１の画素ブロック内の最大濃度差を算出する。なお、算出する値は最大濃度差に限定されるものではなく、第１の画素ブロック内の画素値の分布を把握することができるものであれば、分散値などを算出することもできる。

エッジ画素判定部２２８３は、分布算出部２２８２で算出した最大濃度差と予め定められたエッジ判定閾値（例えば、３０）とを比較し、最大濃度差がエッジ判定閾値より大きい場合、第１の画素ブロック内の注目画素がエッジ画素であると判定するとともに、エッジ画素数に１を加算して、エッジ画素数を計数する。

なお、上述の画素値算出、分布算出、エッジ画素判定の各処理は、原稿画像のすべての注目画素について繰り返し行う。

判定部２２８４は、原稿画像毎に、エッジ画素判定部２２８３で計数したエッジ画素数と所定の第１判定閾値（例えば、５０００）とを比較し、エッジ画素数が第１判定閾値より大きい場合、原稿画像に記入漏れが無い、すなわち、書込みがあると判定し、エッジ画素数が第１判定閾値より小さい場合、原稿画像に記入漏れがある、すなわち、書込みが無いと判定する。

記入事項判定処理部２２８は、原稿画像がカラー原稿である場合、ＲＧＢのプレーン毎（色成分毎）に上述の各処理を行うことができる。また、複数の色成分のうち、何れかの色成分の最大濃度差がエッジ判定閾値より大きい場合、注目画素をエッジ画素であると判定することにより、必ずしも下地除去を行う必要はない。なお、一部の色成分のみに対して上述の各処理を行ってよい。この場合、処理労力を軽減することができる。

図４０は実施の形態７の記入事項判定処理部２２８の処理手順を示すフローチャートである。なお、文書照合処理は、上述の実施の形態と同様に専用のハードウエア回路で構成するだけでなく、ＣＰＵ、ＲＡＭ、ＲＯＭなどを備えたパーソナルコンピュータに、文書照合処理の手順を定めたコンピュータプログラムをロードしてＣＰＵでコンピュータプログラムを実行させることにより行うこともできる。

制御部２２７は、原稿画像と類似すると判定された登録フォーマットの座標系（座標）を原稿画像の座標系（座標）に変換する（Ｓ１６１）。なお、この場合、登録フォーマットの全体を座標変換してもよく、あるいは登録フォーマットの予め定められた記載欄のみの座標変換を行ってもよい。

制御部２２７は、判定領域テーブル２２６５を検索して原稿画像と類似すると判定された登録フォーマットの項目名、各項目名の座標値を取得し（Ｓ１６２）、取得した座標値に基づいて、記入漏れを判定するための記入事項判定領域を原稿画像上に特定する（Ｓ１６３）。

制御部２２７は、注目画素を含む画素ブロック（第１の画素ブロック）内の各画素の平均値を算出し（Ｓ１６４）、算出した平均値を探索して第１の画素ブロックの最大濃度差を算出する（Ｓ１６５）。

制御部２２７は、算出した最大濃度差がエッジ判定閾値（例えば、３０）より大きいか否かを判定し（Ｓ１６６）、最大濃度差がエッジ判定閾値より大きい場合（Ｓ１６６でＹＥＳ）、注目画素がエッジ画素であるとして、エッジ画素を計数する（Ｓ１６７）。この場合、エッジ画素であると判定される都度、エッジ画素数に１を加算することにより、エッジ画素を計数する。最大濃度差がエッジ判定閾値より大きくない場合（Ｓ１６６でＮＯ）、制御部２２７は、エッジ数を計数することなく後述のステップＳ１６８の処理を行う。

制御部２２７は、原稿画像のすべての画素の処理が終了したか否かを判定し（Ｓ１６８）、すべての画素の処理が終了していない場合（Ｓ１６８でＮＯ）、次の注目画素に移り、ステップＳ１６４以降の処理を続ける。すべての画素の処理が終了した場合（Ｓ１６８でＹＥＳ）、すなわち、原稿画像内のすべての画素について処理が終了した場合、制御部２２７は、計数したエッジ画素数が第１判定閾値（例えば、５０００）より大きいか否かを判定する（Ｓ１６９）。

エッジ画素数が第１判定閾値より大きい場合（Ｓ１６９でＹＥＳ）、制御部２２７は、原稿画像に記入漏れがないと判定し（Ｓ１７０）、処理を終了する。また、エッジ画素数が第１判定閾値より大きくない場合（Ｓ１６９でＮＯ）、制御部２２７は、原稿画像に記入漏れがあると判定し（Ｓ１７１）、処理を終了する。

実施の形態７では、登録フォーマットの画像データを用いずに、原稿画像の画像データのみで記入漏れの有無の判定を行うことができる。また、色成分毎に、注目画素を含む複数の画素よりなる画素ブロック（第１の画素ブロック）内の濃度値の平均値を算出することにより、孤立点、読み取り時のノイズの影響、さらには、原稿の地肌部の汚れ、原稿の地肌部に付着しているダストの影響を抑制することができ、記入漏れの有無の判定精度を上げることができる。

実施の形態８
上述の各実施の形態では、原稿画像に対して記入漏れの有無を判定するものであったが、本発明は原稿画像に限定されるものではなく、電子データ（アプリケーションソフトウェアで作成されたデータ）や電子化データ（スキャナで読み込まれたデータをＪＰＥＧやＰＤＦなど所定のファイルフォーマットに変換されたデータ）に対して適用することもできる。

例えば、電子データや電子化データの形態で提出されたデータをサーバに格納しておき、これらのデータに対して、本発明をアプリケーションソフトウェアとして適用することができる。上記データは、電子データ、ファイルフォーマット毎に格納されているのが好ましい。

電子データについては、数種類のソフトウェアが使用され得るので、例えば、ＲＩＰ（ラスター・イメージ・プロセッサー）を用いて、ＰＤＬ（ページ記述言語）を解釈し、ラスター・イメージ（ＲＧＢデータ）に変換して本発明の方法を適用すれば良い。

また、電子化データについては、例えば、ＪＰＥＧやＧＩＦなどの符号化された画像フォーマットの場合には、一旦復号処理を行い、さらに、必要に応じてＹＣＣ信号をＲＧＢ信号に変換するなどの色変換処理の後に本発明の方法を適用すれば良い。

ＰＤＦフォーマットの場合は、画像データがＪＰＥＧなどの符号化された画像フォーマットで保存されているときは、復号処理を実施してＲＧＢ信号に変換した上で本発明の方法を適用すればよく、フォントなどのベクタデータ部分に関しては、ＲＩＰなどを介してＲＧＢの画像データに変換した上で本発明の方法を適用すればよい。ＰＤＦフォーマットの場合、オブジェクト（テキスト、図や写真等）毎の情報をタグとして保有しており、この情報を参考してデータの変換を行うことができる。オブジェクトの情報は、例えば、テキストの場合、フォント、ポイント数、色、表示位置等であり、写真の場合、符号化の方法、サイズ、表示位置などである。

以上説明したように、本発明にあっては、原稿画像の類似判定を行う際に、原稿画像の記入漏れ（記載漏れ）を精度良く判定することができる。また、記入漏れがある場合、記入漏れの箇所を容易に判断することができる。

また、原稿画像に記入漏れがあるか否かを判定する前段で原稿画像の下地除去を行うことにより、読み取られる原稿の用紙が再生紙、あるいは薄く着色された用紙など、登録画像と異なる場合であっても、精度良く記入漏れの有無を判定することができる。

また、原稿画像と登録画像の画素値を比較する必要がなく、取得した原稿画像のみで原稿画像の記入漏れを精度よく判定することができる。また、原稿画像での孤立点、読み取り時のノイズの影響、あるいは、原稿の地肌部の汚れ又は地肌部に付着しているダストの影響を抑制することができ、記入漏れの判定精度をさらに向上させることができる。

また、原稿を排出する際に、記入漏れ原稿と記入漏れのない原稿とに仕分けることができる。特に、多数の原稿を読み取る場合、排出される多くの原稿の中から記入漏れ原稿だけを簡単に仕分けることができ、ユーザの利便性を向上させることができる。さらに、記入漏れ原稿を容易に区別することができる。

上述の実施の形態では、登録フォーマット、ハッシュテーブル２２６２を予めメモリ２２６に記憶しておく構成であるが、これに限定されるものではなく、画像形成装置１００と通信回線（ネットワーク）を通じて接続されたサーバ装置の記憶部に登録フォーマットを記憶しておき、ハッシュテーブル２２６２はメモリ２２６に分散して記憶させてもよい。

上述の実施の形態において、カラー画像入力装置１としては、例えば、フラットベッドスキャナ、フィルムスキャナ、デジタルカメラ、携帯電話機などが用いられる。また、カラー画像出力装置３としては、例えば、ＣＲＴディスプレイ、液晶ディスプレイなどの画像表示装置、処理結果を記録紙などに出力する電子写真方式又はインクジェット方式のプリンタなどが用いられる。さらに画像形成装置１００としては、ネットワークを介してサーバ装置などに接続するための通信手段としてのモデムなどを備えることもできる。また、カラー画像入力装置１からカラー画像データを取得する代わりに、ネットワークを介して外部記憶装置、サーバ装置などからカラー画像データを取得する構成であってもよい。

上述の実施の形態では、文書照合処理部２２の中にメモリ２２６、制御部２２７を備える構成であるが、これに限定されるものではなく、メモリ２２６、制御部２２７を文書照合処理部２２の外部に設ける構成であってもよい。

本発明はコンピュータに実行させるためのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）を記録したコンピュータでの読み取り可能な記録媒体に、文書照合処理、記入漏れ報知処理、原稿の排出制御処理などを行うプログラムコードを記録することもできる。この結果、上記処理を行うプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。記録媒体としては、マイクロコンピュータで処理が行われるために図示しないメモリ、例えばＲＯＭのようなプログラムメディアであってもよく、図示しない外部記憶装置としてのプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。

いずれの場合においても、格納されているプログラムコードはマイクロプロセッサがアクセスして実行させる構成であってもよいし、プログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。この場合、ダウンロード用のコンピュータプログラムは予め本体装置に格納されているものとする。

ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスク並びにＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモリカードを含む）／光カード等のカード系、あるいはマスクＲＯＭ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）、フラッシュＲＯＭ等による半導体メ
モリを含めた固定的にプログラムコードを担持する媒体であってもよい。

また、この場合、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のコンピュータプログラムは予め本体装置に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

本発明に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。文書照合処理部の構成を示すブロック図である。特徴点算出部の構成を示すブロック図である。フィルタ処理部のフィルタ係数の例を示す説明図である。連結領域の特徴点の例を示す説明図である。文字列に対する特徴点の抽出結果の例を示す説明図である。注目特徴点と周辺の特徴点を示す説明図である。注目特徴点による不変量の算出例を示す説明図である。注目特徴点による不変量の算出例を示す説明図である。注目特徴点による不変量の算出の他の例を示す説明図である。注目特徴点による不変量の算出の他の例を示す説明図である。原稿画像の特徴点座標テーブルの構造を示す説明図である。登録フォーマットのハッシュテーブルの構造を示す説明図である。登録フォーマットの特徴点座標テーブルの構造を示す説明図である。特徴点投票テーブルの構造を示す説明図である。投票結果に基づく類似判定の一例を示す説明図である。原稿画像及び登録フォーマットの位置合わせを示す説明図である。登録フォーマットの一例を示す説明図である。記入漏れ判定領域を示す判定領域テーブルの一例を示す説明図である。登録フォーマットの他の例を示す説明図である。記入漏れ判定領域を示す判定領域テーブルの他の例を示す説明図である。文書照合処理の手順を示すフローチャートである。記入事項判定処理の手順を示すフローチャートである。記入事項判定処理の手順を示すフローチャートである。本発明に係る原稿読取装置の構成を示すブロック図である。本発明に係る原稿読取装置の構成を示す模式図である。原稿シフター機構の構成を示す横断面図である。原稿シフター機構の構成を示す横断面図である。原稿の排出位置を示す説明図である。記入漏れを報知する画面表示例を示す説明図である。実施の形態２の記入事項判定処理の手順を示すフローチャートである。実施の形態２の記入事項判定処理の手順を示すフローチャートである。実施の形態３の記入事項判定処理の手順を示すフローチャートである。実施の形態３の記入事項判定処理の手順を示すフローチャートである。排出トレイを可動させる場合の原稿シフター機構の構成を示す模式図である。原稿シフター機構の構成を示す横断面図である。実施の形態５の原稿読取装置の構成を示す模式図である。実施の形態６の原稿読取装置の構成を示す模式図である。実施の形態７の記入事項判定処理部の構成を示すブロック図である。実施の形態７の記入事項判定処理部の処理手順を示すフローチャートである。

符号の説明

１カラー画像入力装置
２カラー画像処理装置
３カラー画像出力装置
２２文書照合処理部
２２１特徴点算出部
２２２特徴量算出部
２２３投票処理部
２２４類似度判定処理部
２２５、２２８記入事項判定処理部
２２６メモリ
２２７制御部
２２１０無彩化処理部
２２１１解像度変換部
２２１２フィルタ処理部
２２１３二値化処理部
２２１４重心算出部
２２８１画素値算出部
２２８２分布算出部
２２８３エッジ画素判定部
２２８４判定部

Claims

取得した原稿画像の記載漏れの有無を判定する画像処理方法であって、
取得した原稿画像が予め記憶してある登録画像に類似するか否かを判定し、
原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して定められた１又は複数の箇所に対応する箇所に記載漏れがあるか否かを判定し、
判定結果を出力することを特徴とする画像処理方法。
記載漏れがあると判定された原稿画像の該記載漏れの箇所を報知することを特徴とする請求項１に記載の画像処理方法。
取得した原稿画像の記載漏れの有無を判定する画像処理装置であって、
取得した原稿画像が予め記憶してある登録画像に類似するか否かを判定する手段と、
原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して定められた１又は複数の箇所に対応する箇所に記載漏れがあるか否かを判定する判定手段と、
該判定手段の判定結果を出力する出力手段と
を備えることを特徴とする画像処理装置。
記載漏れがあると判定された原稿画像の該記載漏れの箇所を報知する報知手段を備えることを特徴とする請求項３に記載の画像処理装置。
取得した原稿画像に対して下地除去を行う下地除去手段を備え、
前記判定手段は、
前記下地除去手段で下地除去された原稿画像に基づいて記載漏れがあるか否かを判定するように構成してあることを特徴とする請求項３又は請求項４に記載の画像処理装置。
取得した原稿画像の注目画素を含む第１の画素ブロック内の各画素の画素値それぞれを、該画素を含む第２の画素ブロック内の各画素の画素値に基づいて算出する画素値算出手段と、
該画素値算出手段で算出した前記第１の画素ブロック内の各画素の画素値の分布に応じて、前記注目画素がエッジ画素であるか否かを判定するエッジ判定手段と
を備え、
前記判定手段は、
前記エッジ判定手段で判定したエッジ画素の多少に基づいて、取得した原稿画像に記載漏れがあるか否かを判定するように構成してあることを特徴とする請求項３又は請求項４に記載の画像処理装置。
取得した原稿画像がカラー画像である場合、前記画素値算出手段及びエッジ判定手段それぞれは、色成分毎に処理を行うように構成してあることを特徴とする請求項６に記載の画像処理装置。
請求項３乃至請求項７のいずれかに記載の画像処理装置を備え、原稿を読み取る原稿読取装置であって、
取得した原稿画像に記載漏れがあると判定された場合、記載漏れ原稿を仕分けて排出する排出手段を備えることを特徴とする原稿読取装置。
前記排出手段は、
記載漏れ原稿の排出位置を変位するように構成してあることを特徴とする請求項８に記載の原稿読取装置。
請求項３乃至請求項７のいずれかに記載の画像処理装置と、該画像処理装置で処理された画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする画像形成装置。
コンピュータに、取得した原稿画像の記載漏れの有無の判定を行わせるためのコンピュータプログラムであって、
コンピュータを、取得した原稿画像が予め記憶してある登録画像に類似するか否かを判定する手段と、
コンピュータを、原稿画像が登録画像に類似すると判定された場合、取得した原稿画像の前記登録画像に対して予め定められた１又は複数の箇所に対応する箇所に記載漏れがあるか否かを判定する手段と
して機能させることを特徴とするコンピュータプログラム。
請求項１１に記載のコンピュータプログラムを記録してあることを特徴とするコンピュータでの読み取りが可能な記録媒体。