JP2010191941A - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2010191941A
JP2010191941A JP2009252187A JP2009252187A JP2010191941A JP 2010191941 A JP2010191941 A JP 2010191941A JP 2009252187 A JP2009252187 A JP 2009252187A JP 2009252187 A JP2009252187 A JP 2009252187A JP 2010191941 A JP2010191941 A JP 2010191941A
Authority
JP
Japan
Prior art keywords
color
image data
blank
determination
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009252187A
Other languages
English (en)
Other versions
JP5299225B2 (ja
Inventor
Toshio Akiyama
敏雄 穐山
Yasushi Yamaguchi
泰史 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2009252187A priority Critical patent/JP5299225B2/ja
Priority to US12/641,943 priority patent/US8223411B2/en
Publication of JP2010191941A publication Critical patent/JP2010191941A/ja
Application granted granted Critical
Publication of JP5299225B2 publication Critical patent/JP5299225B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00801Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to characteristics of the original
    • H04N1/00803Presence or absence of information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】画像データの多様性に適切に対応することにより、白紙の検出率を向上させること。
【解決手段】画像データを取得して画像データを処理する画像処理システムであって、画像データを取得する取得手段と、取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定手段302と、第1決定手段により決定されたみなし背景色に基づいて背景色を決定する第2決定手段303と、第2決定手段により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数手段304と、計数手段によりカウントされた文字色の画素数が画像データの画素数に占める割合を求め、該割合が所定値未満であれば白紙と判定する判定手段305とを備える。
【選択図】図3

Description

本発明は、白紙判定を行う画像処理システム、画像処理装置、画像処理方法、プログラム、及び記録媒体に関する。
従来から、画像処理機能を用いて、原稿の正しい面が読み取られているか否かを判定する方法として「白紙検知」と呼ばれる方法が一般的に用いられている。白紙検知により、白紙と判定された画像データを除去し、無駄な領域、処理時間の削減などのリソースを軽減することができる。また、白紙検知を応用して、白紙を仕切りとした文書分割、片面、両面スキャン、印刷の効率化、ページ揃えなど、様々な技術にも適用できるため、白紙検知の技術はこれまで多くの方法が提案されている。
例えば、特開2008−219820号公報(特許文献1)には、画像データを複数の領域に分割し、ブロック毎に画素を読み取って一定の濃度レベル閾値を超えた画素をカウントすることで白紙検知を行う技術が開示されている。
また、特開2002−077669号公報(特許文献2)には、画像の各色についてヒストグラムを作成し、ヒストグラムの最大値と最小値との差が所定値未満の場合に白紙と判定する技術が開示されている。
しかしながら、スキャンしたりして読み込む原稿には様々な内容があり、文字がわずかしか存在しないが白紙と判定されては困るものや、文字は存在せず白紙と判定して欲しいが、模様やノイズが入っているため白紙と判定されてしまうなど、従来技術では的確に白紙が判定できないという課題があった。また、原稿の色の多様性(白紙、黒紙、色紙、反転色、文字と背景色を多様に組み合わせた紙など)にも十分に対応できていなかった。
そこで本発明は上記問題に鑑みてなされたものであって、画像データの多様性に適切に対応することにより、白紙の検出率を向上させることができる画像処理システム、画像処理装置、画像処理方法、プログラム、及び記録媒体を提供することを目的とする。
本発明における一局面の画像処理システムは、画像データを取得して前記画像データを処理する画像処理システムであって、前記画像データを取得する取得手段と、取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定手段と、前記第1決定手段により決定されたみなし背景色に基づいて背景色を決定する決定手段と、前記第2決定手段により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数手段と、前記計数手段によりカウントされた文字色の画素数が前記画像データの画素数に占める割合を求め、該割合が所定値未満であれば白紙と判定する判定手段とを備える。
また、本発明における他の局面の画像処理装置は、前記画像データを取得する取得手段と、取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定手段と、前記第1決定手段により決定されたみなし背景色に基づいて背景色を決定する第2決定手段と、前記第2決定手段により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数手段と、前記計数手段によりカウントされた文字色の画素数が前記画像データの画素数に占める割合を求め、該割合が所定値未満であれば白紙と判定する判定手段とを備える。
また、本発明における他の局面の画像処理方法は、前記画像データを取得する取得段階と、取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定段階と、前記第1決定段階により決定されたみなし背景色に基づいて背景色を決定する第2決定段階と、前記第2決定段階により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数段階と、前記計数段階によりカウントされた文字色の画素数が前記画像データの画素数に占める割合を求め、該割合が所定値未満であれば白紙と判定する判定段階とを有する。
また、本発明の画像処理システム、画像処理装置、及び画像処理方法は、コンピュータにより実行可能なプログラムにより実現することができ、また、プログラムを記録した記録媒体をコンピュータに読み取らせて実現することも可能である。
本発明によれば、画像データの多様性に適切に対応することにより、白紙の検出率を向上させることができる。
実施例1に係る画像処理システムの一例を示す図。 実施例1に係る画像処理サーバのハードウェア構成の一例を示す図。 実施例1におけるMFPと画像処理サーバの主要機能構成の一例を示すブロック図。 みなし背景色決定手段の詳細機能構成の一例を示すブロック図。 白紙判定に用いる画像の例を示す図。 画像1のヒストグラムを示す図。 画像2のヒストグラムを示す図。 画像3のヒストグラムを示す図。 画像4のヒストグラムを示す図。 実施例1による白紙検出の実験結果1を示す図。 実施例1による白紙検出の実験結果2を示す図。 実施例1における処理概念を説明するための図。 実施例1における白紙判定処理の一例を示すフローチャート。 実施例2におけるMFP10と画像処理サーバ50の主要機能構成の一例を示すブロック図。 ライン単位にスキャンする場合の一例を示す図。 実施例2における白紙判定処理の一例を示すフローチャート。 実施例3におけるMFPと画像処理サーバの主要機能構成の一例を示すブロック図。 実施例4におけるMFPと画像処理サーバの主要機能構成の一例を示すブロック図。 ワークフローの例を示す図。 データ処理手段の機能構成の一例を示すブロック図。 実施例5におけるMFPと画像処理サーバの主要機能構成の一例を示すブロック図。 白紙検出エラーの確認画面の一例を示す図。 実施例6におけるMFPと画像処理サーバの主要機能構成の一例を示すブロック図。 変形例に係る画像処理装置の機能構成の一例を示すブロック図。
以下に添付図面を参照して、この発明にかかる画像処理システム、画像処理装置(画像処理サーバ)、画像処理方法、プログラム及び記録媒体の最良な実施形態を詳細に説明する。
また、以下に示す実施例では、画像データを入力する画像形成装置として、プリンタ機能、スキャナ機能、コピー機能、ファクシミリ機能を一つの筐体に搭載した複合機を例にあげて説明しているが、これに限定されるものではなく、画像データを入力可能な画像形成装置であれば、スキャナ装置、ファクシミリ装置、コピー装置などいずれにも適用することができる。
[実施例1]
<システム構成とハードウェア構成>
図1は、実施例1に係る画像処理システムの一例を示す図である。図1に示すように、画像処理システムは、ネットワークを介してMFP(Multifunction Peripheral)10、MFP20、画像処理サーバ30、情報処理端末(例えば、PC(Personal Computer)、PDA(Personal Data Assistance)など)40が接続されている。
MFP10、20は、スキャン機能、コピー機能、プリンタ機能、ファクシミリ機能などを一つの筐体に搭載したものである。MFP10、20は、スキャナ機能により紙媒体等をスキャン処理して画像データを生成し、生成された画像データを画像処理サーバ30に送信する。MFPの詳細については後述する。
画像処理サーバ30は、各MFPでスキャンされた画像データを受信して、指定された配信設定に従って種々の処理や配信処理を実行するワークステーション等のコンピュータである。配信設定には、メール送信、FAX送信、フォルダ配信などがある。画像処理サーバ30は、配信先に応じて、メールサーバやファイルサーバなどに画像データを配信する。また、画像処理サーバ30は、取得した画像データに対して白紙判定を行ない、無駄なデータを配信したり、記憶したりすることを防止する。
また、画像処理サーバ30は、入力された画像情報に基づいてワークフローを実行するサーバであり、ユーザーによって構築されたワークフローに従って文書の蓄積又は配信処理を実行する。即ち、画像を処理するという観点において、画像処理サーバ30も画像処理装置として機能する。画像処理サーバ30の詳細については後述する。
情報処理端末40は、管理者によりデータ配信に関する管理ツールが起動され、入力、画像変換、出力の各プラグインが順に選択されることで配信設定を作成する。
実施例1に係る画像処理サーバ30のハードウェア構成について説明する。図2は、実施例1に係る画像処理サーバ30のハードウェア構成の一例を示す図である。
図2に示すように、画像処理サーバ30は、制御部31、主記憶部32、補助記憶部33、外部記憶装置I/F部34、ネットワークI/F部36、入力部37、表示部38を含む。
制御部31は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。制御部31は、主記憶部32に記憶されたプログラムを実行する演算装置で、入力装置や記憶装置からデータを受け取り、演算、加工した上で、出力装置や記憶装置に出力する。
主記憶部32は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部301が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
補助記憶部33は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
外部記憶装置I/F部34は、USB(Universal Serial Bus)などのデータ伝送路を介して接続された記憶媒体35(例えば、フラッシュメモリなど)と当該画像処理サーバとのインタフェースである。
また、記憶媒体35に、所定のプログラムを格納し、この記憶媒体35に格納されたプログラムは外部記憶装置I/F部34を介して画像処理サーバ30にインストールされ、インストールされた所定のプログラムは画像処理サーバ30により実行可能となる。
ネットワークI/F部36は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と当該画像処理サーバとのインタフェースである。
入力部37は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部28の表示画面上でキーの選択等を行うためのマウスやスライスパット等からなる。また、入力部37は、ユーザーが制御部31に操作指示を与えたり、データを入力したりするためのユーザインタフェースである。
表示部38は、CRTやLCD等により構成され、制御部31から入力される表示データに応じた表示が行われる。
<機能構成>
図3は、実施例1におけるMFP10と画像処理サーバ30の主要機能構成の一例を示すブロック図である。まず、MFP10の主要機能構成について説明する。MFP10は、画像読込手段101、通信手段102、配信設定DB103を含む。その他一般的なMFPが有するプリンタ機能やコピー機能やFAX機能等については図示していない。
画像読込手段101は、スキャン機能により原稿を読み込んで画像データを取得する。画像データの取得については、FAXで受信したり、情報処理端末40から取得したりしてもよい。
通信手段102は、機器情報や画像データなどの送受信を行う。特に、通信手段102は、画像データの配信処理要求や白紙検知要求などがユーザーから指示された場合、画像データと当該要求とを画像処理サーバ30に送信する。
配信設定DB103は、入力、画像変換、出力の各プラグインを格納し、また、各プラグインが組み合わされたワークフローを1又は複数格納する。なお、配信設定DB103は、画像処理サーバ30に備えられてもよく、配信設定DB103が画像処理サーバ30に備えられる場合は、MFP10に備えられなくてもよい。
次に、画像処理サーバ30の主要機能構成について説明する。画像処理サーバ30は、通信手段301、みなし背景色決定手段302、背景色決定手段303、画像計数手段304、白紙判定手段305、画像DB306を含む。
通信手段301は、機器情報や画像データなどの送受信を行う。特に、MFP10から画像データを受信したり、配信設定の宛先に対し、画像処理した画像データを送信したりする。
みなし背景色決定手段302は、通信手段301が取得した画像データの色(R、G、B)毎にヒストグラムを作成し、ヒストグラムを用いて所定範囲内の色をみなし背景色とする。つまり、画像データ内で頻度の高い色付近をみなし背景色とする。みなし背景色決定手段302の詳細については図4を用いて説明する。
図4は、みなし背景色決定手段302の詳細機能構成の一例を示すブロック図である。図4に示すように、みなし背景色決定手段302は、分布作成手段321、算出手段322、みなし手段323、選択手段324、変換手段325を含む。
分布作成手段321は、画像データの全ピクセルの色成分(R、G、B)毎のヒストグラムを作成する。画像データがカラー画像の場合は、RGBそれぞれの輝度で256階調のヒストグラムが作成される。また、画像データがグレースケールの場合は、輝度のヒストグラムを1つ作成する。なお、ここではヒストグラムを作成すると説明しているが、各階調の度数をカウントすることでもよい。
算出手段322は、分布作成手段321により作成された各ヒストグラムに対し、平均xと標準偏差σとを算出する。
このとき、RGBの各ヒストグラムに単一色しか出現しない場合には、画像データは白紙であると判定して以降の処理を行なわない。また、ここでいう白紙とは、色が均一な用紙であり(少々のノイズを許容する)、特徴的な画像や文字がない画像のことを言う。また、通常白紙の標準偏差σは、3〜5になることが実験により分かっており、この時点で標準偏差σが10以上なら白紙ではないと判定してもよい。また、各ヒストグラムの最大値と最小値が一致すれば単一色であることを表すので、この時点で白紙であると判定してもよい。
みなし手段323は、算出手段322により算出された平均x±標準偏差σ内の色をみなし背景色として決定する。これより、ヒストグラムにおいて頻度の高い色付近をみなし背景色とすることができる。
なお、みなし背景色の決定の仕方としては、平均x±標準偏差σの範囲以外にも、頻度の高い方から上位の数十(所定値)%とするなどして、みなし背景色の色範囲を設定してもよい。
次に、選択手段324と変換手段325とを説明するが、選択手段324と変換手段325とを備えていなくても本発明の目的を達成することはできる。以降の説明では、選択手段321と変換手段325とを有するとして説明する。
選択手段324は、分布作成手段321により作成された各ヒストグラムから、一番標準偏差σの大きいヒストグラムを代表ヒストグラムとして選択する。この選択は、カラー画像で背景と文字との輝度差が小さい場合に有効となる。
なお、選択手段324により代表ヒストグラムが選択された場合、みなし手段323は、代表ヒストグラムのみにおいてみなし背景色を決定する。
変換手段325は、分布作成手段321においてヒストグラムを作成する際、画像データが4bit、8bit画像データである場合は、ピクセルに対応するパレットからフルカラー変換に相当する処理(フルカラー変換相当の処理ともいう)を行う。フルカラー変換相当の処理とは、パレット値からフルカラー値でヒストグラムを作成することができるようにする処理のことを言う。例えば、完全にフルカラー変換を行ってフルカラーのデータを作成してもよいし、フルカラーのデータを作成しなくても、ヒストグラムが作成できるフルカラー値を取得するまでの処理を行ってもよい。これより、分布作成手段321は、パレットカラーである場合でも色成分(R、G、B)毎にヒストグラムを作成することができる。
なお、分布作成手段321は、各ヒストグラムを作成する際、4ピクセルの平均値をカウントするようにすればよい。このようにして平滑化することにより、ノイズの影響を小さくすることができる。また、分布作成手段321は、点在する黒点、白点をカウントしないようにすればよい。これより、文字と判断される可能性が低いものを除外することができる。また、分布作成手段321は、画像データの周辺(縁)に行くほど影響度を小さくしてカウントするようにすればよい。例えば、文字が記載される確率が低い周辺部の重みを0.2倍にしてカウントするようにすればよい。これより、周辺部の影響を小さくすることができる。
また、分布作成手段321は、副走査方向(縦方向)に対して濃い色が連続する場合、スキャンノイズとみなして、その部分のみ小さい係数をかけてカウントするようにすればよい。これより、CCD上にゴミが乗っているなどの原因で発生するスキャンノイズの影響を小さくすることができる。
なお、ヒストグラムでRGBを用いる理由としては、様々な色の用紙に対応するためである。YCrCbやYUV、HSVなどのヒストグラムをとる場合、ほとんどの場合輝度(Y)の偏差が大きくなるので、選択手段324により選択される代表ヒストグラムは、輝度のヒストグラムとなる。この場合、色差成分(Cr、Cb)などが選択されないので色原稿に対して適切に白紙検知を行うことができなくなってしまう可能性がある。
図3に戻り、背景色決定手段303は、みなし背景色決定手段302により決定されたみなし背景色に基づいて背景色を決定する。具体的には、背景色決定手段303は、みなし背景色の平均y±ばらつき値zの範囲内の色を背景色に決定する。ここで、ばらつき値zについては、標準偏差σと所定値との大きい方をばらつき値zとする。所定値は0〜100の範囲で設定可能とし、実験結果により50くらいの値が妥当であることが分かっている。なお、所定値を0とした場合は、標準偏差σをばらつき値zとする。
画素計数手段304は、背景色決定手段303により決定された背景色以外の色を文字色として、文字色を有する画素をカウントする。次に、画素計数手段304は、文字色の画素をカウントしたら、文字色の画素数が全体の画素数に占める割合(以下、文字出現割合ともいう)を算出する。なお、文字出現割合は後述する白紙判定手段305により算出されるようにしてもよい。
ここで、画像データが長尺である場合は、標準的な尺(縦横比≦1.5)に換算する。具体的には、実際の尺sが所定の縦横比t(t=1.5)以上の場合は、s/tを文字出現割合に乗算し、文字出現割合の値を大きくする。これは、縦横比が大きいと面積が大きくなるので相対的に文字出現割合が小さくなってしまうことによる誤判定を防ぐためである。つまり、画像全体に占める文字が少なくても、文字を重視することができる。
また、長尺の場合の他の方法としては、A4の比率毎に画像データを分割して、分割単位毎に文字出現割合を算出する。次に、算出した文字出現割合の中から一番大きな値を白紙判定に用いる。これより、分割した単位で文字出現割合を求めることができ、面積が大きいことにより文字出現割合が小さくなることを防ぐことができる。
白紙判定手段305は、画素計数手段304により算出された全体に占める文字の割合が所定値未満の場合は白紙と判定し、所定値以上の場合は、白紙ではないと判定する。ここで、所定値は0.001%、0.05%、0.1%などの値であり、これらは設定変更可能とする。例えば、最初は0.05%に設定しておき、誤判定が多いようであれば、判定を厳しくするため0.001%に変更する。実際にプログラムで処理するときは、少数点の演算は時間がかかるため、所定倍(例えば1000000倍)して整数で白紙判定ができるようにしておく。
画像DB306は、白紙判定手段305により白紙と判定された画像データを除去して、白紙ではない画像データのみを格納したりする。
以上、かかる構成を有する画像処理システムでは、画像データの多様性に適切に対応することにより、白紙の検出率を向上させることができる。
なお、背景色の別の決定方法としては次の方法がある。みなし背景色決定手段302は、RGB三次元空間上の重心を求め、求めた重心から所定距離内にある色をみなし背景色と決定する。次に、背景色決定手段303は、みなし背景色からRGB三次元空間上の重心を求め、重心から所定距離内にある色を背景色として決定する。これより、背景に対する文字方向のベクトルを求めることができるので、単純に距離で背景と文字とを切り分けるのではなく、ベクトルに直交する面で分離すれば余計なノイズを除去することができる。
また、みなし背景色決定手段302は、みなし背景色を決定する際に平均値を算出しているが、平均値ではなく、ヒストグラムの最大度数(最大の山)に対応する階調を用いてもよい。また、平均値ではなく、中央値を用いてもよい。
<ヒストグラム>
次に、分布作成手段321により作成されるヒストグラムについて図5〜9を用いて説明する。図5は、白紙判定に用いる画像の例を示す図である。図5(a)は、カラフルな文字にカラフルな図形が入っている画像(画像1という)を示す図である。図5(b)は、白紙の画像を(画像2という)示す図である。図5(c)は、黒文字が入っている画像(画像3という)を示す図である。図5(d)は、カラー画像であり、かつ、文字や図形がない画像(画像4という)を示す図である。図5に示す画像をカラースキャンやグレースケールでスキャンするなどしてヒストグラムを作成した場合、図6〜9に示すヒストグラムとなる。
図6は、画像1のヒストグラムを示す図である。図6(a)は、カラースキャンした場合の色成分(R、G、B)毎のヒストグラムである。図6(b)は、グレースケールでスキャンした場合のヒストグラムである。図6に示すように、ヒストグラムには、図形部分に相当する山が散在する。
図7は、画像2のヒストグラムを示す図である。図7(a)は、カラースキャンした場合の色成分(R、G、B)毎のヒストグラムである。図7(b)は、グレースケールでスキャンした場合のヒストグラムである。図7に示すように、ヒストグラムは、分散が小さく、ある階調における度数の山がかなり大きくなっている。
図8は、画像3のヒストグラムを示す図である。図8(a)は、カラースキャンした場合の色成分(R、G、B)毎のヒストグラムである。図8(b)は、グレースケールでスキャンした場合のヒストグラムである。図8に示すように、ヒストグラムには、文字部分に相当する山が散在する。
図9は、画像4のヒストグラムを示す図である。図9(a)は、カラースキャンした場合の色成分(R、G、B)毎のヒストグラムである。図9(b)は、グレースケールでスキャンした場合のヒストグラムである。図9に示すように、ヒストグラムは、画像の色に相当する階調で度数が計数されている。本発明では、図6〜図9に示したようなヒストグラムを用いてまずはみなし背景色を決定し、次にみなし背景色から背景色を決定する。
<実験結果>
図10は、実施例1による白紙検出の実験結果1を示す図である。まず、白紙検出に用いた画像について説明する。
画像A:水色の無地画像
画像B:画像Aの中央部に小さな文字が入った画像
画像C:グレーの無地画像
画像D:青字の画像に背景処理も少し濃い青字でASCという文字が入った画像
画像E:背景と文字との輝度が同じ画像
画像F:画像Eを反転させた画像
画像G:赤色の背景の上部に小さな文字が入った画像
次に、実験に用いた白紙判定方法について説明する。
本発明:前述した実施例1の白紙判定方法(代表ヒストグラム選択有、背景色を決定するのに用いる所定値50、白紙判定に用いる所定値0.05%)
従来1:Ridoc Document Router(既存の白紙判定方法)
従来2:
(1)基準色とそこからの振れ幅、および判定閾値(%)、外周部無視領域(%)を指定する(パラメータファイルなどに保存しておく)。
例)RGB=0x000000(真っ黒)から ±128の範囲、判定閾値(%)=0.05%、外周部=3%は無視する。
(2)画像の外周部を除く中心部の画素の色を(1)で指定した色+範囲の収まるかどうかをチェックし、色+範囲に収まった画素の数をカウントしていく。
(3)処理対象の全画素数と色+範囲に収まった画素の数の比率を算出する。
(4)判定閾値(%)を越えたかどうかで白紙かどうかを判断する。
なお、従来2では、色も指定できるが、色への感度はあまりよくなく、特に中間色への反応がよくない。例えば、文字と背景が色は違うが同じ輝度だった場合にはうまく識別できない。そこで、本出願の発明者は、従来2の問題点を解決すべく以下の方式のように従来2を改良した。
従来2の改良:
従来2で白紙と判定された場合に以下の処理を行う。
(5)色差(Cb,Cr)のヒストグラムをとり標準偏差を求める。
(6)色差(Cb,Cr)どちらか一方のヒストグラムの標準偏差値が、
・ある閾値(例えば=8)より大きければ白紙ではない(色のバラツキが多い)
・ある閾値(例えば=8)より小さければ白紙(色のバラツキが少ない)
これにより、従来2に比べて色感度はよくなった。しかし、従来2の改良方式では、文字の面積が極端に少ない場合などには誤動作する可能性がある。
図10に示すように、網掛け部が誤判定を行った箇所である。図10によれば、従来1、2、従来2の改良方式は誤判定を行った画像が存在する。一方、本発明の方法では誤判定を行った画像はなく、適切に白紙を検出していることが分かる。また、処理時間においても、本発明の方法の方が従来の方法や従来の改良方法よりも早く白紙判定を行なうことができる。
また、別の実験結果を図11に示す。図11は、実施例1による白紙検出の実験結果2を示す図である。図11に示す実験の内容について説明する。
実験画像:A4−200dpiで両面スキャンした20ページの原稿(半分が白紙)
本発明:前述した実施例1の白紙判定方法(代表ヒストグラム選択有、背景色を決定するのに用いる所定値50、白紙判定に用いる所定値0.05%)
従来3:AutoStore(NSi)
実験条件:縦向き、又は横向きスキャンして、本発明による方法と従来3による方法とで白紙判定を行ない比較する
ここで、図11(a)は、本発明と従来3との白紙判定結果を示す図である。また、図11(b)は、本発明と従来3との処理時間を示す図である。図11(a)に示すように、本発明による白紙判定では、縦向きスキャン、横向きスキャンの両方において適切に白紙判定を行うことができている。一方、従来3による白紙判定では、縦向きスキャン、横向きスキャンのいずれも誤判定を行っている。また、図11(b)に示すように、処理時間においても、本願による白紙判定の方が、従来3による白紙判定よりも早く判定することができるという結果が得られた。
以上、図10及び図11に示すように、本発明に係る白紙判定を行なうことにより白紙の検出率を向上させることができ、また、処理時間を短縮させることができる。
<処理概念>
次に、図12を用いて実施例1における処理概念について説明する。図12は、実施例1における処理概念を説明するための図である。図12に示すように、まず始めに画像データに対してRGB毎に3つのヒストグラムが作成される。
次に、RGB3つのヒストグラムの中から一番分散が大きい(標準偏差σが大きい)成分を選択する。図12に示す例では、Rのヒストグラムの標準偏差σが一番大きいとする。次に、Rのヒストグラムの平均xと標準偏差σとを用いてみなし背景色の範囲を決定する。図12に示す例では、みなし背景色の範囲は平均x±標準偏差σ(180±60)の範囲である。
次に、みなし背景色の平均yを算出する。図12に示す例ではy=220とする。ここで、ばらつきに関する所定値を50とすると、標準偏差σ=60と所定値50とを比較し、大きい方をばらつき値とする。ばらつき値が決まった場合、背景色の範囲を決定する。図12に示す例では、背景色の範囲は平均y±ばらつき値(220±60)の範囲である。ただし、最大値は255である。
よって、図12に示す例では、背景色の範囲は160〜255の範囲となり、背景色の以外の範囲を文字色の範囲とするため、文字色の範囲は0〜159となる。この文字色の範囲のピクセル数をカウントし(背景色のピクセル数をカウントし全体から差し引いてもよい)、文字の出現割合が算出される。
最後に、文字の出現割合が、白紙判定に用いる所定値(0.05%など)と比較され、所定値よりも大きければ白紙ではないと判定される。
<動作>
図13は、実施例1における白紙判定処理の一例を示すフローチャートである。図13に示すように、ステップS11において、分布作成手段321は、取得された画像データのRGB毎のヒストグラムを作成する。
ステップS12において、分布作成手段321は、作成したRGB全てのヒストグラムが単一色であるか否かを判定する。判定方法は、ヒストグラムの最小値=最大値であるか否かで判定する。最小値=最大値であれば画像データは単一色であることを示す。ステップS12の判定結果がYES(単一色である)であればステップS22に進み、判定結果がNO(単一色ではない)であればステップS13に進む。
ステップS13において、選択手段324は、RGB3つのヒストグラムの中から標準偏差σが一番大きいヒストグラムを選択する。ステップS14において、算出手段322は、選択手段324により選択されたヒストグラムの平均xと標準偏差σを算出する。
ステップS15において、みなし手段323は、算出手段322により算出された平均xと標準偏差σからみなし背景色(x±σ)を決定する。
ステップS16において、背景色決定手段303は、みなし手段323により決定されたみなし背景色の平均yを算出する。ステップS17において、背景色決定手段303は、標準偏差σと所定値(例えば50)とを比較し、大きい方をばらつき値とする。次に、背景色決定手段303は、平均y±ばらつき値を背景色として決定する。ここで、みなし背景色、背景色ともに最小値は0、最大値は255とする。
ステップS18において、画素計数手段304は、背景色以外の色を文字色として、文字色の画素数をカウントする。なお、画素計数手段304は、背景色の画素数をカウントし、画像全体の画素数から差し引くことで文字色の画素数を算出するようにしてもよい。
ステップS19において、白紙判定手段305は、画素計数手段304によりカウントされた文字色の画素数が画像全体の画素数に占める割合を算出する。
ステップS20において、白紙判定手段305は、算出した文字出現割合が所定値未満か否かを判定する。ステップS20による判定結果がYES(所定値未満)であればステップS22に進み、判定結果がNO(所定値以上)であればステップS21に進む。
ステップS21において、白紙判定手段305は、取得された画像データを白紙ではないと判定し、白紙判定処理を終了する。ステップS22において、白紙判定手段305は、取得された画像データは白紙であると判定し、白紙判定処理を終了する。
以上実施例1によれば、画像データの多様性に適切に対応することにより、白紙の検出率を向上させることができる。
[実施例2]
次に、実施例2に係る画像処理システムについて説明する。実施例2では、画像データを分割して、分割単位で白紙判定を行なうことで高速に白紙判定を行なうことができるようにする。
<機能構成>
図14は、実施例2におけるMFP10と画像処理サーバ50の主要機能構成の一例を示すブロック図である。図14に示す機能において、図3と同様の機能のものは同じ符号を付し、その説明を省略する。
図14に示すように、画像処理サーバ50は、通信手段301、分割手段501、みなし背景色決定手段502、背景色決定手段503、画像係数手段504、白紙判定手段505、画像DB306を含む。
分割手段501は、通信手段301により取得された画像データを所定の領域に分割する。所定の領域とは、ライン単位であってもよいし、矩形の領域単位であってもよい。以下、11ライン毎に分割する例について説明する。11ラインとする理由は、決まった規則のラインをスキャンしないように、素数かつ所定の大きさをもつ値が本発明には適切だからである。ただし、必ずしも11ライン毎にスキャンする必要はないことは言うまでもない。
みなし背景色決定手段502は、分割手段501が分割したライン毎の分割単位の画像データを順に読み込んで、色(R、G、B)毎にヒストグラムを更新し、更新したヒストグラムを用いて所定範囲内の色をみなし背景色とする。つまり、画像データ内で頻度の高い色付近をみなし背景色とする。
背景色決定手段503は、みなし背景色決定手段502により決定された分割単位のみなし背景色に基づいて背景色を決定する。背景色の決定の仕方は実施例1と同様であるため、その説明を省略する。
画素計数手段504は、背景色決定手段503により決定された背景色以外の色を文字色として、文字色を有する画素をカウントする。次に、画素計数手段504は、文字色の画素をカウントしたら、文字色の画素数がライン単位で一回目にスキャンした画素数に占める文字出現割合を算出する。
白紙判定手段505は、画素計数手段504により算出された文字出現割合が所定値未満の場合は白紙と判定し、所定値以上の場合は、白紙ではないと判定する。ここで、所定値は実施例1同様、0.001%、0.05%、0.1%などの値であり、これらは設定変更可能とする。
また、白紙判定手段505は、白紙であると判定された場合は、次のラインをスキャンしてヒストグラムを更新するようみなし背景色決定手段502に指示する。実施例2では、前述した処理を白紙と判定されるまで、又は、画像全体をスキャンするまで繰り返し白紙判定を行う。
ここで、図15は、ライン単位にスキャンする場合の一例を示す図である。図15に示すように、11ライン飛ばしでスキャンした分割単位毎にヒストグラムを更新する場合は、まず、1回目のスキャンで1、12、23・・・のラインを読み込み、読み込んだ画素によりヒストグラムを作成する。次に、白紙判定手段505は、作成されたヒストグラムを用いて白紙判定を行ない、白紙判定された場合は2回目のスキャンを行う。2回目のスキャンで2、13、24・・・のラインを読み込み、読み込んだ画素によりヒストグラムを更新する。以下、白紙ではないと判定されるまで、又は画像データ全体をスキャンするまで前述した処理が繰り返される。
また、白紙判定手段505は、判定に用いる所定値に係数を乗算して白紙判定を行なう。例えば、11ライン毎にスキャンする場合は、1回目の白紙判定の際には係数を10にし、2回目のスキャンの場合には係数を9にし、3回目のスキャンの場合には係数を8にし、以下回数が増える毎に係数を減算して小さくする。つまり、スキャンした画素数が少ないことで文字出現割合が大きくなり誤判定される場合があるため、白紙判定に用いる所定値を大きくして白紙ではないと判定される条件を厳しくする。スキャン回数が増えれば、スキャンした画素数が増えるため、係数を徐々に小さくしてもとの所定値に近づけて白紙判定を行うようにする。
以上より、スキャン回数が少ない段階で白紙ではないと判定された場合には、白紙判定処理を終了することができるため、白紙判定処理に係る時間を削減することができる。
<動作>
図16は、実施例2における白紙判定処理の一例を示すフローチャートである。図16に示すように、ステップS21において、分割手段501は、11ライン毎に画像データを分割し、分割単位でスキャンを行う。
ステップS22において、スキャンした画素分に対して、図13に示した白紙判定処理を行う。ステップS23において、白紙判定手段505は、スキャン分の画素に対して白紙であるか否かを判定する。ステップS23の判定結果がNOである(白紙ではない)場合処理を終了し、判定結果がYESである(白紙である)場合ステップS24に進む。
ステップS24において、白紙判定手段505は、画像データ全体をスキャンしたか否か判定する。ステップS24の判定結果がYESである(画像全体をスキャン終了)場合処理を終了し、判定結果がNOである(画像全体をスキャンしていない)場合ステップS21に戻り、次のラインをスキャンする。
以上、実施例2によれば、画像データを分割して、分割単位で順に白紙判定を行なうことで高速に白紙判定を行なうことができる。
[実施例3]
次に、実施例3に係る画像処理システムについて説明する。実施例3では、ヒストグラムを作成する前にノイズを除去する処理(前処理)を行うことで、白紙判定の精度を上げる。
<機能構成>
図17は、実施例3におけるMFP10と画像処理サーバ60の主要機能構成の一例を示すブロック図である。図17に示す機能において、図3と同様の機能のものは同じ符号を付し、その説明を省略する。図17に示すように、実施例3では、実施例1の機能構成に前処理手段601が追加されている。
前処理手段601は、みなし背景色決定手段302の処理を行う前に、通信手段301により取得された画像データに対して画像処理を行う。画像処理は、例えば、ノイズ除去、パンチ穴除去、周辺ノイズ除去などである。ここで、周辺ノイズ除去とは、スキャン時に用紙の歪みや、読取装置の仕組み上、画像の周辺部分に生じた黒スジや影などのノイズを除去する処理である。
また、前処理手段601は、画像データがカラー又はグレースケールである場合に、平滑化、地肌除去、裏写り除去などの画像処理を行うようにしてもよい。これらの画像処理はユーザーに選択されて事前に設定されたり、白紙判定をする度に選択されたりするようにすればよい。
以上、実施例3によれば、ユーザー好みの前処理を行うことで白紙判定処理の精度を向上させることができる。
[実施例4]
次に、実施例4に係る画像処理システムについて説明する。実施例4では、白紙判定を行った後の画像データを配信する処理について説明する。
<機能構成>
図18は、実施例4におけるMFP15と画像処理サーバ70の主要機能構成の一例を示すブロック図である。図18に示す機能において、図3と同様の機能のものは同じ符号を付し、その説明を省略する。図18に示すように、実施例4では、MFP15は、配信設定手段151を含み、画像処理サーバ70には判定手段701、ジョブ実行・管理手段702、ワークフロー実行手段703、データ処理手段704、配信設定DB705を含む。
判定手段701は、図3に示すみなし背景色決定手段302〜白紙判定手段305までの機能を有し、白紙判定を行う。なお、判定手段701は、実施例1で説明した白紙判定だけではなく、実施例2、又は実施例3で説明した白紙判定を行ってもよい。
MFP15の配信設定手段151は、オペレーションパネルにワークフロー選択画面を表示し、選択されたワークフローを検出する。また、配信設定手段151は、ワークフローにおける配信パラメータを取得する。配信パラメータの取得は、設定画面からユーザーに入力及び/又は選択させて取得したりする。配信パラメータとは、例えば、宛先のメールアドレスや画像変換に伴う設定値などのことをいう。
また、配信設定手段151は、画像読込手段101により読み込まれた画像データに対して、章分けを行う章分けモードが選択されたか否かを検知する。また、配信設定手段151は、前述した白紙判定を行うか否かを検知してもよいし、白紙判定は読み込んだ画像データに対してデフォルトで設定されていてもよい。以下、白紙判定は、デフォルトで設定されているとする。
配信設定手段151は、選択されたワークフローの識別情報や、このワークフローにかかる配信パラメータや、章分けモードが検知された場合は章分けモードを示す情報を、読み込まれた画像データとともに、通信手段102を介して画像処理サーバ70に送信する。
ここで、ワークフローについて説明する。図19は、ワークフローの例を示す図である。図19に示すワークフロー1は、OMR(Optical Mark Recognition)処理を行うワークフローを示す。また、ワークフロー2は、画像変換を行って、SMTP送信するワークフローを示す。また、ワークフロー3は、OCR処理を行って、フォルダ配信するワークフローを示す。ワークフロー4は、フォルダ配信を行って、さらにSMTP送信を行うワークフローを示す。つまり、ワークフローは、入力、画像変換、出力(配信)の各プラグインのうち、1又は複数の処理(プラグイン)を組み合わせた配信処理を言う。
図18に戻り、画像処理サーバ70について説明する。ジョブ実行・管理手段702は、MFP15から受信した配信パラメータや画像データをジョブとして画像DB306に記憶し、ワークフロー実行手段703にジョブの処理を依頼する。このとき、ジョブ実行・管理手段702は、取得した画像データに対し、判定手段701による白紙判定を行ってから画像DB306に画像データを記憶する。
ワークフロー実行手段703は、ジョブ実行・管理手段702からジョブの処理要求を受けた場合、ワークフローに含まれる各処理の実行を制御する。具体的には、ワークフロー実行手段703は、画像DB306から取得した画像データに対し、ジョブに含まれるワークフローの各処理を配信設定DB705から特定し、ワークフローに含まれる各処理を順に行うようデータ処理手段704を制御する。
データ処理手段704は、ワークフロー実行手段703から処理実行の指示を受けると、この指示に従って画像データに対して配信処理を行う。つまり、データ処理手段704は、ワークフローに含まれる各処理をフロー順に実行し、配信先(ファイルサーバや、SMTPサーバなど)へ画像データを配信する。
配信設定DB705は、入力、画像変換、出力の各プラグインを格納し、また、各プラグインが組み合わされたワークフローを1又は複数格納する。配信設定DB705は、ワークフローに係るデフォルトの配信パラメータや、ワークフローの設定画面情報や配信パラメータの設定画面情報などを記憶する。
次に、データ処理手段704について図20を用いて詳しく説明する。図20は、データ処理手段の機能構成の一例を示すブロック図である。データ処理手段704は、画像認識手段741、画像変換手段742、フォルダ配信手段743、メール送信手段744、章分け手段745を含む。データ処理手段704に含まれる各手段は、プラグインで実装されてもよい。
画像認識手段741は、例えばOCR(Optical Character Recognition)処理及び/又はOMR(Optical Mark Recognition)処理の画像認識処理を行う。画像変換手段742は、PDF、TIFF、GIF、JPEG、JPEG2000などのフォーマットを他のフォーマットに変換する処理を行う。フォルダ配信手段743は、指定されたサーバのフォルダに配信する処理を行う。メール送信手段744は、SMTPサーバなどを用いてメール配信処理を行う。
章分け手段745は、判定手段701により白紙と判定されるまでを一つの章として画像データを章分けする。章分け手段745は、1つの章毎に画像DB306に記憶したり、1つの章毎に分けなくても、1章、2章、・・・と白紙に章番号を付加して画像DB306に記憶したりしてもよい。
章分け手段745は、MFP15から章分けを行う情報をジョブ実行・管理手段702が取得した場合に、その旨通知される。通知を受けた章分け手段745は、判定手段701により白紙と判定される度に章分けを行うか、又は、判定手段701による白紙判定が終わった後に、一括して章分けを行なう。その後、白紙判定、章分けが行われた画像データに対して配信処理が行われる。
以上、実施例4によれば、白紙判定を行った画像データに対してワークフローに伴う配信処理を実行することができる。つまり、スキャンした画像データを配信するスキャンソリューションの中に白紙判定を含めることができる。また、実施例4によれば、白紙と判定されるまでを1つの章とする章分けを行うことができ、章分けされた画像データを配信することができる。
[実施例5]
次に、実施例5に係る画像処理システムについて説明する。実施例5では、配信処理を行う画像データに白紙が多く含まれる場合は、ユーザーに配信処理を続行してもよいか確認することができる。
<機能構成>
図21は、実施例5におけるMFP15と画像処理サーバ75の主要機能構成の一例を示すブロック図である。図21に示す機能において、図3及び図18と同様の機能のものは同じ符号を付し、その説明を省略する。図21に示すように、実施例5では、画像処理サーバ75にエラー判定手段751が含まれている。
エラー判定手段751は、判定手段701による白紙判定で、白紙の割合が所定値以上である場合は、エラーと判断する。例えば、エラー判定手段751は、判定した画像データの総枚数のうち20%以上が白紙である場合に、エラーと判定する。
エラー判定手段751は、エラーと判定した場合には、MFP15に確認画面情報を送信する。確認画面情報は、画像DB306、又は配信設定DB705に記憶されていればよい。
図22は、白紙検出エラーの確認画面の一例を示す図である。図22に示す確認画面は、エラー判定手段751によりエラーと判定された場合に、MFP15のオペレーションパネルに表示される。MFP15は、ユーザーによる図22に示す「YES」ボタンの押下を検知すると、その旨を画像処理サーバ75に通知し、画像処理サーバ75は配信処理を続行する。また、MFP15は、図22に示す「NO」ボタンの押下を検知すると、MFP15は、画像データを再度スキャンするようユーザーに促す。
なお、図22に示す確認画面には、配信処理を続行するかしないかの選択肢しかないが、白紙を除去して配信処理を続行する処理を選択肢に含めてもよい。白紙を除去して配信処理を続行する処理がユーザーにより選択された場合は、ワークフロー実行手段703は、画像DB306から画像データを取得する際に、白紙を除いて、又は削除して画像データを取得する。以降の処理は実施例4と同様である。
以上、実施例5によれば、配信処理を行う画像データに白紙が多く含まれる場合は、ユーザーに配信処理を続行してもよいか確認することができる。また、実施例5によれば、配信処理を続行する際、白紙以外の画像データのみを配信することもできる。
[実施例6]
次に、実施例6に係る画像処理システムについて説明する。実施例6では、判定手段701により白紙と判定された画像データを削除して、白紙と判定されなかった画像データを配信することができる。
<機能構成>
図23は、実施例6におけるMFP15と画像処理サーバ80の主要機能構成の一例を示すブロック図である。図23に示す機能において、図3及び図18と同様の機能のものは同じ符号を付し、その説明を省略する。図23に示すように、実施例6では、画像処理サーバ80に白紙除去手段801が含まれている。
以下、配信設定手段151が白紙除去モードを検知して、白紙除去を示す情報をジョブに含めて画像処理サーバ80に送信する場合を想定する。なお、白紙除去処理はデフォルトで設定されたり、あるワークフローについてのみ実行するよう設定されたりしてもよい。
ジョブ実行・管理手段702は、ジョブに白紙除去を示す情報が含まれている場合には、白紙除去手段801にその旨通知し、判定手段701に画像データを出力する。
白紙除去手段801は、判定手段701による白紙と判定された画像データを削除する。白紙除去手段801は、判定手段701による白紙判定と連動して白紙と判定されるたびに白紙を削除してもよいし、白紙判定が全て終了した後に一括して白紙を削除してもよい。これより、画像DB306には、白紙が除去された画像データが記憶される。以降の処理は実施例4と同様である。
以上、実施例6によれば、判定手段701により白紙と判定された画像データを削除して、白紙と判定されなかった画像データを配信することができる。
[変形例]
次に前述した各実施形態の変形例について説明する。以下、変形例は、前述したサーバ30が組み込まれたMFP90について説明する。なお、変形例ではMFPを画像処理装置と呼ぶことにする。図24は、変形例に係る画像処理装置90の機能構成の一例を示すブロック図である。図24に示すように、白紙判定を行なう機能が画像処理装置90に組み込まれている。
画像処理装置90の各機能は、基本的には図3に示す機能と同様である。ただし、みなし背景色決定手段302は、画像読込手段101によりスキャンされた画像データに対して処理を行うところが異なる。
以上より、変形例に係る画像処理装置90によれば、スキャンした画像に対して白紙判定を行ない、白紙と判定された画像を保存しないなどの処理を行うことで機器のリソースを有効に活用することができる。なお、実施例2〜6に係る各画像処理サーバをMFPに組み込むようにしてもよい。
また、変形例における画像処理装置90は、読み込んだ画像データから白紙を除去して印刷することもできる。また、画像処理装置90は、読み込んだ画像データから白紙検出を行って、白紙までを章分けすることで章分けされた画像データを印刷することもできる。
なお、実施例1〜6の画像処理サーバは、CPUなどの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、HDD、CDドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、ワークステーションや通常のコンピュータを利用したハードウェア構成となっている。
実施例1〜6の画像処理サーバで実行される画像処理制御プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、実施例1〜3の画像処理サーバで実行される画像処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、実施例1〜3の画像処理サーバで実行される画像処理プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、実施例1〜6の画像処理サーバで実行される画像処理プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
実施例1〜6の画像処理サーバで実行される画像処理プログラムは、前述した各手段を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から画像処理プログラムを読み出して実行することにより上記各手段が主記憶装置上にロードされ、みなし背景色決定手段、背景色決定手段、画像計数手段、白紙判定手段が主記憶装置上に生成されるようになっている。
また、変形例のMFPで実行される画像処理プログラムは、ROM等に予め組み込まれて提供される。
変形例のMFPで実行される画像処理プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
さらに、変形例のMFPで実行される画像処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、変形例のMFPで実行される画像処理プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
変形例のMFPで実行される画像処理プログラムは、前述した各手段を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記ROMから画像処理プログラムを読み出して実行することにより上記各手段が主記憶装置上にロードされ、画像読込手段、みなし背景色決定手段、背景色決定手段、画像計数手段、白紙判定手段が主記憶装置上に生成されるようになっている。
なお、本発明は、上記実施例そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施例に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施例に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施例にわたる構成要素を適宜組み合わせても良い。
10、20、70 MFP
30、50、60 画像処理サーバ
40 情報処理端末
101 画像読込手段
102 通信手段
103 配信設定DB
301 通信手段
302,502 みなし背景色決定手段
303、503 背景色決定手段
304、504 画像計数手段
305、505 白紙判定手段
306 画像DB
321 分布作成手段
322 算出手段
323 みなし手段
324 選択手段
325 変換手段
501 分割手段
601 前処理手段
701 判定手段
702 ジョブ実行・管理手段
703 ワークフロー実行手段
704 データ処理手段
705 配信設定DB
751 エラー判定手段
801 白紙除去手段
特開2008−219820号公報 特開2002−077669号公報

Claims (15)

  1. 画像データを取得して前記画像データを処理する画像処理システムであって、
    前記画像データを取得する取得手段と、
    取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定手段と、
    前記第1決定手段により決定されたみなし背景色に基づいて背景色を決定する第2決定手段と、
    前記第2決定手段により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数手段と、
    前記計数手段によりカウントされた文字色の画素数が前記画像データの画素数に占める割合を求め、該割合が第1所定値未満であれば白紙と判定する判定手段と
    を備える画像処理システム。
  2. 前記第1決定手段は、
    前記ヒストグラムの平均値と標準偏差とを算出し、前記平均値±前記標準偏差の範囲内の色を前記みなし背景色とする請求項1記載の画像処理システム。
  3. 前記第2決定手段は、
    前記みなし背景色の平均値を算出し、算出した平均値から所定範囲内の色を前記背景色とする請求項1又は2記載の画像処理システム。
  4. 前記第2決定手段は、
    前記標準偏差と第2所定値との大きい方をばらつき値とし、前記平均値±前記ばらつき値の範囲内の色を前記背景色とする請求項3記載の画像処理システム。
  5. 前記第1決定手段は、
    各色のヒストグラムの中から一番標準偏差が大きいヒストグラムを選択し、選択したヒストグラムから前記みなし背景色を決定する請求項1乃至4いずれか一項に記載の画像処理システム。
  6. 前記画像データをライン単位及び/又は複数の領域単位に分割する分割手段を備え、
    前記第1決定手段は、
    前記分割手段により分割された分割単位の画像データを順に読み込んで各色のヒストグラムを更新し、
    前記判定手段は、
    判定に用いる前記第1所定値に係数を乗算して白紙判定を順に行ない、前記白紙判定で白紙と判定される度に前記係数を小さくする請求項1乃至5いずれか一項に記載の画像処理システム。
  7. 前記判定手段は、
    前記白紙判定により白紙ではないと判定した場合、次の分割単位の画像データを読み込む指示を前記第1決定手段にせず、前記白紙判定の処理を終了する請求項6記載の画像処理システム。
  8. 前記画像データに対し、ノイズ除去、パンチ穴除去、ヘッダー及び/又はフッター除去、裏写り除去、周辺ノイズ除去のいずれか一つ又は複数の前処理を行う前処理手段を備え、
    前記第1決定手段は、
    前記前処理手段により前処理された画像データの各色のヒストグラムを作成する請求項1乃至7いずれか一項に記載の画像処理システム。
  9. 前記第1決定手段は、
    前記画像データがパレットカラーの場合、フルカラー変換相当の処理を行って各色のヒストグラムを作成する請求項1乃至8いずれか一項に記載の画像処理システム。
  10. 1又は複数の処理を規定し、少なくとも配信処理を含むワークフローを1又は複数記憶する記憶手段と、
    前記判定手段により白紙判定が行なわれた後の画像データを、前記ワークフローに従って配信処理する配信手段とをさらに備える請求項1乃至9いずれか一項に記載の画像処理システム。
  11. 前記判定手段により白紙と判定されるまでの画像データを1つの章とする章分け手段をさらに備え、
    前記配信手段は、
    前記章分け手段により章分けされた画像データを、前記ワークフローに従って配信処理する請求項10記載の画像処理システム。
  12. 前記画像データを取得する取得手段と、
    取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定手段と、
    前記第1決定手段により決定されたみなし背景色に基づいて背景色を決定する第2決定手段と、
    前記第2決定手段により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数手段と、
    前記計数手段によりカウントされた文字色の画素数が前記画像データの画素数に占める割合を求め、該割合が所定値未満であれば白紙と判定する判定手段と
    を備える画像処理装置。
  13. 前記画像データを取得する取得段階と、
    取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定段階と、
    前記第1決定段階により決定されたみなし背景色に基づいて背景色を決定する第2決定段階と、
    前記第2決定段階により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数段階と、
    前記計数段階によりカウントされた文字色の画素数が前記画像データの画素数に占める割合を求め、該割合が所定値未満であれば白紙と判定する判定段階と
    を有する画像処理方法。
  14. コンピュータを、
    前記画像データを取得する取得手段と、
    取得した画像データの各色のヒストグラムを作成し、該ヒストグラムを用いてみなし背景色を決定する第1決定手段と、
    前記第1決定手段により決定されたみなし背景色に基づいて背景色決定する第2決定手段と、
    前記第2決定手段により決定された背景色以外の色を文字色とし、該文字色の画素数をカウントする計数手段と、
    前記計数手段によりカウントされた文字色の画素数が前記画像データの画素数に占める割合を求め、該割合が所定値未満であれば白紙と判定する判定手段として機能させるためのプログラム。
  15. 請求項14記載のプログラムを記憶するコンピュータ読み取り可能な記録媒体。
JP2009252187A 2009-01-20 2009-11-02 情報処理装置、情報処理方法、及びプログラム Expired - Fee Related JP5299225B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009252187A JP5299225B2 (ja) 2009-01-20 2009-11-02 情報処理装置、情報処理方法、及びプログラム
US12/641,943 US8223411B2 (en) 2009-01-20 2009-12-18 Image processing system, image processing apparatus, image processing method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009010340 2009-01-20
JP2009010340 2009-01-20
JP2009252187A JP5299225B2 (ja) 2009-01-20 2009-11-02 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2010191941A true JP2010191941A (ja) 2010-09-02
JP5299225B2 JP5299225B2 (ja) 2013-09-25

Family

ID=42336731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009252187A Expired - Fee Related JP5299225B2 (ja) 2009-01-20 2009-11-02 情報処理装置、情報処理方法、及びプログラム

Country Status (2)

Country Link
US (1) US8223411B2 (ja)
JP (1) JP5299225B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014168175A (ja) * 2013-02-28 2014-09-11 Brother Ind Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2015026994A (ja) * 2013-07-26 2015-02-05 株式会社沖データ 画像読み取り装置
JP2017017659A (ja) * 2015-07-06 2017-01-19 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US9973653B2 (en) 2013-04-24 2018-05-15 Canon Kabushiki Kaisha Image processing apparatus and image processing method

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711193B2 (en) * 2006-11-07 2010-05-04 Aol Inc. Recognizing blank and nearly blank images
JP5404251B2 (ja) * 2009-08-26 2014-01-29 キヤノン株式会社 画像処理装置及びその制御方法
FR2949889A1 (fr) * 2009-09-10 2011-03-11 Sagem Comm Procede de detection de pages blanches et machine multifonction correspondante
JP5216799B2 (ja) * 2010-03-17 2013-06-19 京セラドキュメントソリューションズ株式会社 画像処理装置,画像形成装置
JP4952821B2 (ja) * 2010-05-17 2012-06-13 コニカミノルタビジネステクノロジーズ株式会社 画像形成システム、画像形成装置、画像形成方法および画像形成プログラム
US8743139B2 (en) * 2010-07-20 2014-06-03 Apple Inc. Automatically keying an image
JP2012034004A (ja) * 2010-07-28 2012-02-16 Kyocera Mita Corp 画像処理装置,画像形成装置
JP2015198327A (ja) * 2014-04-01 2015-11-09 キヤノン株式会社 画像読取装置、画像読取方法、及びコンピュータプログラム
US10795618B2 (en) 2018-01-05 2020-10-06 Datamax-O'neil Corporation Methods, apparatuses, and systems for verifying printed image and improving print quality
US10834283B2 (en) 2018-01-05 2020-11-10 Datamax-O'neil Corporation Methods, apparatuses, and systems for detecting printing defects and contaminated components of a printer
US10803264B2 (en) 2018-01-05 2020-10-13 Datamax-O'neil Corporation Method, apparatus, and system for characterizing an optical system
US10546160B2 (en) 2018-01-05 2020-01-28 Datamax-O'neil Corporation Methods, apparatuses, and systems for providing print quality feedback and controlling print quality of machine-readable indicia
US11099862B1 (en) * 2018-11-30 2021-08-24 Snap Inc. Interface to configure media content
US11308492B2 (en) * 2019-07-03 2022-04-19 Sap Se Anomaly and fraud detection with fake event detection using pixel intensity testing
CN112040087B (zh) * 2020-09-10 2022-08-09 珠海奔图电子有限公司 空白图像识别方法、装置、设备及存储介质
TWI830999B (zh) * 2021-04-16 2024-02-01 虹光精密工業股份有限公司 具有節費功能的電子裝置及文件處理系統

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10257323A (ja) * 1997-03-14 1998-09-25 Minolta Co Ltd 画像読取り装置
JPH1188669A (ja) * 1997-09-12 1999-03-30 Canon Inc 画像読み取り装置、画像読み取り方法、コンピュータ読み取り可能な記憶媒体及び発光物質の検出装置
JP2010035074A (ja) * 2008-07-31 2010-02-12 Canon Electronics Inc 画像処理装置および画像処理方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2615051B2 (ja) 1987-05-28 1997-05-28 株式会社リコー 文書画像の領域分割及び識別方式
JP3343367B2 (ja) 1992-02-24 2002-11-11 株式会社リコー 縦横方向データを利用した画像方向性判定方法および装置
JP3244768B2 (ja) 1992-05-18 2002-01-07 株式会社リコー 画像方向指定機能付き複写機
JP3253356B2 (ja) 1992-07-06 2002-02-04 株式会社リコー 文書画像の領域識別方法
US6721066B2 (en) * 1994-11-18 2004-04-13 Minolta Co., Ltd. Image processor
JP4713715B2 (ja) 2000-08-25 2011-06-29 キヤノン電子株式会社 原稿撮像装置、その制御方法及び記憶媒体
JP4558232B2 (ja) 2001-03-26 2010-10-06 株式会社リコー 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4118749B2 (ja) 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
JP3955515B2 (ja) 2002-09-09 2007-08-08 株式会社リコー 画像読み取り方法、画像読み取り装置およびネットワークシステム
US7433524B2 (en) 2003-05-08 2008-10-07 Ricoh Company, Ltd. Processing system with frame rate and image quality optimized
JP4471202B2 (ja) 2004-04-12 2010-06-02 株式会社リコー 画像処理装置、画像処理方法及び同方法に用いるプログラム
JP2006128987A (ja) 2004-10-28 2006-05-18 Matsushita Electric Ind Co Ltd 画像判別装置
JP4607633B2 (ja) 2005-03-17 2011-01-05 株式会社リコー 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
JP2007018158A (ja) 2005-07-06 2007-01-25 Canon Inc 文字処理装置、文字処理方法及び記録媒体
JP2007089136A (ja) 2005-08-23 2007-04-05 Ricoh Co Ltd 画像処理方法、画像処理プログラム、記録媒体及び複合装置
JP5183941B2 (ja) 2007-03-07 2013-04-17 ローム株式会社 リモコン、及び、テレビ
JP4315209B2 (ja) * 2007-03-26 2009-08-19 村田機械株式会社 画像処理装置および地色検出方法
JP4496239B2 (ja) * 2007-07-31 2010-07-07 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム、及び記録媒体
JP2009070188A (ja) 2007-09-13 2009-04-02 Ricoh Co Ltd メニュー配信システム、メニューサーバ、読書装置、方法、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10257323A (ja) * 1997-03-14 1998-09-25 Minolta Co Ltd 画像読取り装置
JPH1188669A (ja) * 1997-09-12 1999-03-30 Canon Inc 画像読み取り装置、画像読み取り方法、コンピュータ読み取り可能な記憶媒体及び発光物質の検出装置
JP2010035074A (ja) * 2008-07-31 2010-02-12 Canon Electronics Inc 画像処理装置および画像処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014168175A (ja) * 2013-02-28 2014-09-11 Brother Ind Ltd 画像処理装置、画像処理方法および画像処理プログラム
US9191548B2 (en) 2013-02-28 2015-11-17 Brother Kogyo Kabushiki Kaisha Image processing device determining whether image is blank image
US9973653B2 (en) 2013-04-24 2018-05-15 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2015026994A (ja) * 2013-07-26 2015-02-05 株式会社沖データ 画像読み取り装置
JP2017017659A (ja) * 2015-07-06 2017-01-19 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US9924046B2 (en) 2015-07-06 2018-03-20 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium

Also Published As

Publication number Publication date
US20100182618A1 (en) 2010-07-22
US8223411B2 (en) 2012-07-17
JP5299225B2 (ja) 2013-09-25

Similar Documents

Publication Publication Date Title
JP5299225B2 (ja) 情報処理装置、情報処理方法、及びプログラム
EP3367656B1 (en) Image processing apparatus, image processing method, and recording medium
JP4725645B2 (ja) 画像処理装置、データ量削減方法およびデータ量削減プログラム
JP6344064B2 (ja) 画像処理装置およびコンピュータプログラム
JP2007251518A (ja) 画像処理装置、画像形成装置、プログラムおよび画像処理方法
JP6808325B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2007043698A (ja) 画像処理方法、画像出力方法、画像処理システム及び画像出力装置。
JP2020010163A (ja) 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体
EP3058548B1 (en) Image processing apparatus, image processing system, image processing method, and recording medium
JP6923037B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2009075751A (ja) 画像処理装置、画像処理方法、そのプログラムおよびコンピュータ読み取り可能な記憶媒体
US9277074B2 (en) Image processing apparatus, method, and medium determining whether image data of a page to be processed is blank and contains a foreground object and transmitting the foreground object obtained by removing a background object
US11223743B2 (en) Image processing system, image processing apparatus, method of controlling the image processing apparatus, and storage medium
US8284460B2 (en) Image processing apparatus directed to image outline processing, image processing method of the same, and computer-readable storage medium storing instructions for performing image processing
KR20190011038A (ko) 화상형성장치, 이의 제어 방법 및 컴퓨터 판독가능 기록 매체
JP2017135690A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2020093494A (ja) 画像出力装置、画像出力方法および出力画像データ生産方法
JP7317557B2 (ja) 画像処理装置、画像処理方法、プログラム、記録媒体及び画像形成装置
US12041213B2 (en) Image processing apparatus in which full color document images are printed in monochrome, image processing method, and storage medium
US11405525B2 (en) Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode
US10587775B2 (en) Image processing apparatus, image processing method, and storage medium for edge enhancement based on plural conditions
JP7077925B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4412339B2 (ja) 画像形成装置および画像データの補正方法
KR102130815B1 (ko) 가는 선 검출 방법 및 이를 위한 장치
US20120201461A1 (en) Character detection apparatus, character detection method, and computer-readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130603

R151 Written notification of patent or utility model registration

Ref document number: 5299225

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees