JP5819378B2 - 画像判定装置、画像処理システム、プログラム及び記録媒体 - Google Patents

画像判定装置、画像処理システム、プログラム及び記録媒体 Download PDF

Info

Publication number
JP5819378B2
JP5819378B2 JP2013205548A JP2013205548A JP5819378B2 JP 5819378 B2 JP5819378 B2 JP 5819378B2 JP 2013205548 A JP2013205548 A JP 2013205548A JP 2013205548 A JP2013205548 A JP 2013205548A JP 5819378 B2 JP5819378 B2 JP 5819378B2
Authority
JP
Japan
Prior art keywords
image
unit
determination
determined
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013205548A
Other languages
English (en)
Other versions
JP2015070565A (ja
Inventor
小西 陽介
陽介 小西
淳寿 森本
淳寿 森本
松岡 輝彦
輝彦 松岡
今泉 大作
大作 今泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013205548A priority Critical patent/JP5819378B2/ja
Priority to CN201410515525.9A priority patent/CN104519227B/zh
Priority to US14/500,159 priority patent/US9268998B2/en
Publication of JP2015070565A publication Critical patent/JP2015070565A/ja
Application granted granted Critical
Publication of JP5819378B2 publication Critical patent/JP5819378B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Description

本発明は、画像が高圧縮PDFファイルへの変換に適しているか否かを判定する画像判定装置、画像処理システム、プログラム及び記録媒体に関する。
携帯端末装置等で収集した画像データを、ネットワークを介してサーバへ送信し、サーバでユーザ所望のファイルフォーマットに変換する技術がある。例えば、特許文献1には、端末から、端末で生成されたデジタル画像データと、その関連データと、データ加工に関する指示情報とをネットワークを経由して受信したサーバが、指示情報に基づいて、デジタル画像データ及び関連データを所定のフォーマットで加工してドキュメントを作成するシステムが開示されている。作成されたドキュメントは、特定用途の報告書として記録媒体に保存されたり、紙ドキュメントとして印刷されたり、あるいは、ネットワークを介して特定のサーバ装置に送信されたりする。
特開2002−41502号公報(2002年2月8日公開)
しかしながら、携帯端末装置等で収集した画像データをサーバ側に送信し、所定のフォーマットとして高圧縮PDFファイルを生成する場合、次のような問題がある。画像データが、カメラにて撮像されたものである場合は、撮像時のぼやけ等の要因で、MFP(複合機)等からスキャナによりスキャンされたものである場合は、スキャン解像度(読取解像度)が低い等の要因で、高圧縮PDFファイルの表示品質が著しく低下することがある。これは、送信した画像が、高圧縮PDFファイルを生成するのに適したものであるかが判定されていないために発生する。ここで、高圧縮PDFファイルを生成するのに適しているかをユーザにて判定させると、ユーザへの負担がかかってしまう。
そこで、上記課題に鑑み、本発明の目的は、ユーザの手間を省いて、画像が圧縮された環境非依存型文書書式の画像への変換に適しているか否かの判定ができる画像判定装置を提供することにある。
上記の課題を解決するために、本発明の一態様に係る画像判定装置は、入力画像が、スキャナにより読み取られた読取画像であるか、あるいは、撮像装置により撮像された撮像画像であるかを判定する画像種別判定手段と、上記画像種別判定手段による判定結果に基づいて、上記入力画像が圧縮された環境非依存型文書書式の画像への変換に適しているか否かを判定する書式変換判定手段と、を備え、上記書式変換判定手段は、上記読取画像と判定された入力画像からは解像度に関する特徴量を、上記撮像画像と判定された入力画像からはぼやけに関する特徴量を抽出し、上記特徴量に基づき上記判定を行うことを特徴とする。
上記構成によると、ユーザの手間を省いて、画像が高圧縮の環境非依存型文書書式の画像への変換に適しているか否かの判定ができるという効果を奏する。
実施の一形態の携帯端末装置の構成を示すブロック図である。 上記携帯端末装置の有する第1画像処理部の構成を示すブロック図である。 上記携帯端末装置の有する処理判定部の構成を示すブロック図である。 上記処理判定部の処理を示すフローチャートである。 選択画像サイズのアスペクト比の例を示す図である。 選択画像サイズのアスペクト比の別の例を示す図である。 実施の一形態の画像形成装置の構成を示すブロック図である。 上記画像形成装置の有する第2画像処理部の構成を示すブロック図である。 上記第2画像処理部の有する原稿検知部の構成を示すブロック図である。 上記第2画像処理部の有するファイル生成部の構成を示すブロック図である。 ファイルのファイルフォーマットを認識する方法のフローチャートである。 (a)〜(c)は、実施の一形態の画像処理システムでの処理を示すフローチャートである。 実施の一形態のサーバ装置のブロック図である。 別の実施の形態の携帯端末装置の構成を示すブロック図である。 1次微分フィルタ例を示す図である。 (a)〜(d)は、補間画素の画素値の決定方法の例を示す図である。 エッジ方向補間処理の一例を示すフローチャートである。 JPEGデータを含むPDFファイル内の一部を示す図である。
以下に、本発明の実施の形態について、図を参照に詳細に説明する。
〔実施の形態1〕
1.画像処理システム
本実施の形態の画像処理システム(図示せず)は、携帯端末装置(画像判定装置)1と画像形成装置(MFP、複合機)50とがネットワーク接続して構成される。携帯端末装置1からユーザにより選択された画像データ(画像)を、ネットワークを介して画像形成装置50に送信し、画像形成装置50にて出力する。ネットワークは、無線でも有線でもよく、通信形態を問わない。
ここで、携帯端末装置1から送信する画像データは、ユーザが選択した画像データであり、携帯端末装置1の後述する撮像部4により撮像した画像データあるいはネットワークを介してサーバ装置(図示せず)から取得した画像データである。よって、ユーザにより選択された画像データには、撮像部4を含む撮像装置を用いて撮像された撮像画像データ(撮像画像)、スキャナ(画像形成装置のスキャン機能を含む)を用いて読み取られたスキャン画像データ(プラテンガラスに置かれた原稿を読み取って得られるスキャン画像、読取画像)が含まれている。なお、撮像画像データは、幾何学補正等が施されていないもの、すなわち、撮像後、何ら画像処理が施されていないものとする。また、以下では、携帯端末装置1の撮像部4にて撮像した撮像画像データは、携帯端末装置1に格納されているものとして説明するが、記憶部3に格納されている撮像画像データを送信するのではなく、撮像部4にて撮像した撮像画像データをそのまま(選択して)送信してもよい。
本実施の形態では、特に、携帯端末装置1は、画像データ(入力画像)が圧縮された環境非依存型文書書式の画像への変換(画像の生成)に適しているか否を判定し、この判定情報も一緒に画像形成装置50に送信する。以下では、圧縮された環境非依存型文書書式の画像として、高圧縮PDFファイルを用いて説明するが、高圧縮PDFファイルに限定されることはない。
画像形成装置50は、受信した画像データに画像処理を施し、画像処理後の画像データを出力する。画像形成装置50は、高圧縮PDFファイルへの変換(高圧縮PDFファイルの生成)を指示する設定情報(出力ファイル形式として高圧縮PDFファイルを指定する情報)、かつ、受信した画像データが、高圧縮PDFファイルへの変換に適と判定された情報を、受信した場合には、受信した画像データを高圧縮PDFファイルに変換して出力する。画像形成装置50で実行される出力処理としては、画像データを印刷して出力する印刷処理、サーバ装置やUSBメモリなどの記憶装置へ画像を格納するファイリング処理、電子メールに画像データを添付して送信するメール送信処理などがある。
2.携帯端末装置の構成
携帯端末装置1について図1を参照に説明する。図1は、携帯端末装置1の構成を示すブロック図である。図1に示すように、携帯端末装置1は、制御部2、記憶部3、撮像部(撮像装置)4、通信部5、表示部6、入力部7、記録媒体アクセス部8を備えている。携帯端末装置1は、例えば、スマートフォン、タブレット端末、携帯電話等である。
制御部2は、携帯端末装置1の各ブロックの制御を行う。また、制御部2は、記憶部3に保存されたファイルのヘッダを解析して、ファイルフォーマットの認識を行う。ファイルフォーマットの認識については後述する。
制御部2は、ユーザにより選択された画像データを画像形成装置50にて出力させる旨の指示が入力部7から入力された場合、画像形成装置50での出力処理の種類(印刷処理、ファイリング処理、メール送信処理など)の選択指示、ならびに、選択した出力処理を実行するための設定条件(印刷枚数などの印刷条件、ファイリング先のサーバのアドレス、メールの送信先アドレスなど)の入力を促す画面を表示部6に表示する。そして、制御部2は、入力部7から、出力処理の種類および出力処理の設定条件を示す設定情報を取得する。
制御部2は、入力部7から送信指示が入力されると、選択された画像データを画像形成装置50に送信する送信処理を通信部5に実行させる。このとき、通信部5は、画像データとともに画像データに対応付けられた設定情報を画像形成装置50に送信する。さらにこのとき、記憶部3に格納されている携帯端末装置1の機種情報、ユーザ情報を併せて送信する。
記憶部3は、携帯端末装置1の各処理を行うためのプログラムやデータを記憶する。また、画像データを記憶する。この画像データには、撮像部4が撮像して得られた撮像画像データ、外部装置(サーバ装置、画像形成装置を含む)から受信した撮像画像データおよびスキャン画像が含まれる。
さらに、記憶部3は、携帯端末装置1の機種情報、ユーザ情報や処理を行う際に必要なデータを格納する。なお、ユーザ情報とは、携帯端末装置1のユーザを識別する情報であり、例えば、ユーザIDおよびパスワードなどである。
撮像部4は、CCDセンサ、CMOSセンサを用いて、対象物の撮像を行い、撮像画像データを生成する。なお、撮像部4は、予め設定された解像度で撮像対象物の撮像を行う。
通信部5は、本実施の形態では、USB(Universal Serial Bus)1.1またはUSB2.0の規格に基づく、シリアル転送/パラレル転送、無線データ通信機能を有するものである。通信部5は、ユーザからの入力に従って画像データを画像形成装置50またはサーバ装置に送信する。
表示部6は、例えば、液晶ディスプレイ等より構成され、各種画像や各種情報の表示を行う。入力部7は、複数のボタンを有しており、ユーザが携帯端末装置1に対する入力等を行うためのものである。ボタンの例としては、シャッターボタンオートフォーカス設定ボタン、露出調整バー、画像読み出しボタン(画像データを記憶部3から読み出すボタン)、条件設定ボタン等である。本実施の形態では、表示部56と入力部57とが一体となったタッチパネルとして構成されている。
記録媒体アクセス部8は、携帯端末装置1の各処理を行うためのプログラムが記録された記録媒体13からプログラムを読み出すブロックである。
さらに、制御部2は、撮像画像判定部21、第1画像処理部22、処理判定部23、表示制御部(表示制御手段)24として機能する。
第1画像処理部22は、図2に示すように、A/D変換処理部61、幾何学的配置検出部62、撮像条件検知部63を備える。A/D変換処理部61は、撮像部4が撮像した撮像画像データに対してA/D変換処理を行う。
幾何学的配置検出部62は、撮像部4が撮像した撮像画像データ、または、ユーザにより選択された記憶部3に記憶されている撮像画像データに対して、エッジ検出・線分抽出・線分の交点算出を行う。具体的には、対象物が矩形状であると仮定して、対象物と背景との境界となるエッジ画素群を抽出することにより、対象物の幾何学的配置(幾何学的歪み)を検出する。このために、幾何学的配置検出部62は、撮像画像データにおける、エッジ検出、線分抽出、線分の交点算出を行う。
撮像条件検知部63は、撮像部4が撮像した撮像画像データ、または、ユーザにより選択された記憶部3に記憶されている撮像画像データに対して、撮像画像の位置判定を行う。具体的には、幾何学的配置検出部62により算出された線分の交点情報より、撮像画像データ内の対象物がすべて撮像画像データ内に収まっているかの位置判定を行う。
撮像画像判定部21は、第1画像処理部22の検出結果に基づいて、撮像部4が撮像した撮像画像データ、または、ユーザからの選択指示入力により選択された記憶部3に記憶されている撮像画像データが、適切なデータか否か判定を行う。具体的には、撮像条件検知部63の判定結果をもとに、撮像画像データ内に、原稿領域を形成する4交点が存在し、幾何学補正が可能であるかを判定する。幾何学補正可能な交点が撮像画像データ内に存在する場合に、該当する撮像画像データは適切であると判定する。
処理判定部23は、図3に示すように、画像種別判定部(画像種別判定手段)81および高圧縮PDFファイル生成判定部(書式変換判定手段)82を備える。
画像種別判定部81は、ユーザにより選択された画像データ(入力画像)が、撮像画像であるかスキャン画像であるかを判定する画像種別判処理を実行する。そして、判定結果を画像種別判定信号として出力する。画像種別判定信号は、「撮像画像」、「スキャン画像」、「判定不能」を示す信号のいずれかである。画像種別判処理の詳細については後述する。
高圧縮PDFファイル生成判定部82は、選択された画像データが高圧縮PDFファイル生成(高圧縮PDFファイルへの変換)に適しているか(可能か)否かを判定する高圧縮PDFファイル生成判定処理を実行する。そして、結果として、高圧縮PDFファイル生成判定信号を出力する。
高圧縮PDFファイル生成判定部82は、解像度判定部83および画像判定部84を備えている。解像度判定部83は、スキャン画像と判定された画像に対して、解像度に関する特徴量を抽出し、当該特徴量が、解像度が相対的に高いと判定される所定範囲内にあるかを判定する解像度判定処理を実行する。抽出した特徴量が、解像度が相対的に高いと判定される所定範囲内にある場合、スキャン画像と判定された画像データは、高圧縮PDFファイルの生成に適していると判定する。本実施の形態では、後述のように、解像度に関する特徴量として解像度そのもの用い、解像度が所定閾値より高い場合に、高圧縮PDFファイルの生成に適していると判定する。
また、画像判定部84は、撮像画像と判定された画像に対して、ぼやけに関する特徴量を抽出し、当該特徴量がぼやけの程度が相対的に低いと判定される所定範囲内にある場合、撮像画像と判定された画像は、高圧縮PDFファイルの生成に適していると判定する。
高圧縮PDFファイル生成判定処理、解像度判定処理、画像判定処理の詳細については後述する。
図4は、処理判定部23での処理を示すフローチャートである。図4に示すように、処理判定部23では、ユーザが選択した画像データ、つまり、画像形成装置50に送信する画像データに対して、画像種別判定処理を実行する(ステップ1、以下はS1のように省略する)。画像種別判定処理の結果である画像種別判定信号を判定し(S2)、画像種別判定信号が「撮像画像」である場合には、解像度判定処理を実行し(S3)、画像種別判定信号が「スキャン画像」である場合には、画像判定処理を実行し(S4)、高圧縮PDFファイル生成判定信号を判定する(S6)。画像種別判定信号が判定不能である場合そのまま、高圧縮PDFファイル生成判定信号を判定する(S6)。高圧縮PDFファイル生成判定信号が有効の場合には、処理を終了し、高圧縮PDFファイル生成判定信号が無効の場合には、高圧縮PDFファイル生成機能の設定を無効にして処理を終了する。なお、画像形成装置50は、画像データと共に、高圧縮PDFファイル生成機能の設定を有効にした情報を受信すると、受信した画像データから高圧縮PDFファイル生成する。
図1に戻り、表示制御部24は、表示部6での各種情報、各種画像データ等の表示を制御するブロックである。また、表示制御部24は、記憶部3に格納されている画像データから、ユーザにより選択された画像データを読み出し表示部6に表示し、(i)検出された画像の外枠を表す指示マーク(原稿の外縁を示す線分)と、(ii)画像が適切に撮像されるか(画像の一部が切り取られることがないか)否かの指示マークとを表示する。なお、(ii)は、記憶部3に記憶されている撮像画像データが選択された場合は、その撮像画像データが適切に撮像されているか否かの指示マークである。他方、撮像部4にて撮像する場合は、これから撮像される画像に対して適切に撮像される否かの指示マークである。これは、撮像部4からの画像データが、幾何学補正可能である状態の時に、ユーザ操作により撮像を行ったり、一定時間、幾何学補正可能である状態であると判断された時に、自動的に撮像を行ったりする場合もあるからである。
ここで、表示制御部24は、記憶部3から選択された画像データを表示する場合は、処理判定部23の画像種別判定部81より出力される画像種別判定信号が、「スキャン画像」である場合には、上記(i)および(ii)の表示を行わないように制御する。上記(i)および(ii)は、撮像画像データの撮像時に検出された結果を用いる。上記(i)あるいは(ii)に関する情報を有していない撮像画像データについては算出して求めるが、この算出については後述する。
<ファイルフォーマットの認識>
上記した制御部2のファイルフォーマットの認識について説明する。制御部2は、記憶部3に保存されたファイルのヘッダを解析して、ファイルフォーマットの認識を行う。PDFファイルの場合、ファイル内にJPEGデータが含まれているかを、ファイル内にDCTDecodeモードで圧縮されているオブジェクトが存在するかを確認することで行う。存在する場合は、そのオブジェクトのsteramコマンドで指定されたバイナリデータを、JPEGデータとして、処理判定部23での処理、高圧縮PDFファイル生成判定部82での処理を行うように制御する。参考として、図18に、JPEGデータを含むPDFファイル内の一部を示す。
図11は、記憶部に保存されたファイルのファイルフォーマットを認識する方法のフローチャートである。各種フォーマットはファイル先頭部に特徴的なバイト列を有していることが多いため、ファイルの先頭のバイト列を確認することによりファイル種別を簡易的に認識することができる。
図11に示すように、制御部2は、ファイル先頭のバイト列を取得し(S11)、ファイルが十六進数0x49、0x49、0x2A、0x00で始まっているかを判定する(S12)。S12にてYESの場合、TIFF画像ファイルと判定し(S13)、S12にてNOの場合、ファイルが十六進数0x4D、0x4D、0x00、0x2Aで始まっているかを判定する(S14)。S14にてYESの場合、TIFF画像ファイルと判定(S13)、S14にてNOの場合、ファイルが十六進数0xFF、0xD8で始まっているかを判定する(S15)。S15にてYESの場合、JPEG画像ファイルと判定し(S16)、S15にてNOの場合、ファイルが十六進数0x25、0x50、0x44、0x46で始まっているかを判定する(S17)。S17にてYESの場合、PDFファイルと判定し(S18)、S17にてNOの場合、処理付加ファイルと判定する(S19)。
つまり、
(1)ファイルが十六進数0x49、0x49、0x2A、0x00で始まっている場合、TIFF画像ファイルと判断
(2)ファイルが十六進数0x4D、0x4D、0x00、0x2Aで始まっている場合、TIFF画像ファイルと判断
(3)ファイルが十六進数0xFF、0xD8で始まっている場合、JPEG画像ファイルと判断
(4)ファイルが十六進数0x25、0x50、0x44、0x46で始まっている場合、PDFファイルと判断
(5)上記(1)〜(4)のいずれでもない場合、処理不可ファイルと判断
するということである。
<画像種別判定処理>
上記した画像種別判定部81による画像種別判定処理について具体的に説明する。画像種別判定処理は、以下の(1)〜(4)に従い実行される。
(1)選択された画像データの縦横サイズを取得し、長辺サイズ÷短辺サイズによりアスペクト比を取得する。選択された画像データの縦横サイズは、画像データのヘッダに格納されている画素数より算出する。
(2)一般的なカメラ撮像画像のアスペクト比(16:9または、4:3)と比較を行う。ここで、選択画像サイズのアスペクト比が、図5に示すアスペクト比の範囲内の場合は、カメラ撮像画像と判断する。
(3)上記(2)にてカメラ撮像画像と判断されなかった場合は、一般的な複合機やスキャナで用いられる画像サイズのアスペクト比と比較を行う。ここで、選択画像サイズのアスペクト比が図6に示すアスペクト比の範囲内の場合は、スキャン画像と判断する。
(4)上記(2)および(3)のいずれの条件も満たさない場合は、判定不能信号を出力する。
<高圧縮PDFファイル生成判定処理>
上記した高圧縮PDFファイル生成判定部82による高圧縮PDFファイル生成判定処理について具体的に説明する。高圧縮PDFファイル生成判定処理は、画像種別判定部81による画像種別判定の結果、「スキャン画像」、「撮像画像」、「判定不能」に応じて以下のように実施される。
(1)スキャン画像の場合
画像種別判定の結果が「スキャン画像」の場合、解像度判定部83が以下のように解像度判定処理を実行する。
(1−1)選択された画像データ(入力画像)より解像度情報(解像度)を取得する。画像データがTIFFファイル(画像データのファイルフォーマットがTIFFファイル)の場合は、TIFFファイル内のXResolutionタグ(解像度単位)、YResolutionタグ(横方向解像度)、ResolutionUnitタグ(縦方向解像度)を参照し、JPEGファイルの場合は、ファイル内に含まれるJFIF情報より、units(解像度単位)、Xdensity(横方向解像度)、Ydensity(縦方向解像度)情報を参照することによって、解像度情報を取得することが可能である。
(TIFFファイルの場合)
(i)ResolutionUnitタグ=1or2である場合、XResolution、YResolutionをそのまま解像度情報とする。
(ii)ResolutionUnitタグ=3(解像度単位がdpcm(dot per centimeter)のため、変換が必要)である場合、XResolution×2.54、YResolution×2.54を解像度情報とする。
(JPEGファイルの場合)
(i)units=0or1である場合、Xdensity、Ydensityをそのまま解像度情報とする。
(ii)units=2(解像度単位がdpcmのため、変換が必要)である場合、Xdensity×2.54、Ydensity×2.54を解像度情報とする。
縦方向と横方向とで解像度情報が異なる場合は、解像度が小さいほど、高圧縮PDFファイル生成に不適な画像であると考えられるため、小さいほうの解像度情報を用いて、以下の判定処理を行う。
(1−2)解像度情報が、例えば、200dpi未満の場合は、高圧縮PDFファイル生成に不適な画像であると判断し、高圧縮PDFファイル生成判定信号を出力する。200dpi以上の場合は、高圧縮PDFファイル生成可能な画像であると判断し、高圧縮PDFファイル生成判定信号を出力する。低解像度画像の場合に、高圧縮PDFファイル生成に不適であると判定しているのは、次の理由からである。高圧縮PDFファイル生成処理において、解像度が低くなるほど、文字部を前景マスクとして抽出する精度が低下し、それに伴い、文字部が背景レイヤーと判定されやすくなる。背景レイヤーは高圧縮率で圧縮処理されため、背景レイヤーと判定された文字部の画質が、解像度が高い画像と比較して、劣化してしまう。よって、不適であると判定する。また、処理不可ファイル(上記の制御部2の説明を参照)の場合、解像度情報を取得することができないため、判定不能とする。
(2)撮像画像の場合
画像種別判定の結果が「撮像画像」の場合、画像判定部84が以下のように画像判定処理を実行する。
(2−1)RGBの画像データを輝度データに変換し、隣接画素の差分値の絶対値を求める。RGBの画像データの輝度データへの変換は後述する信号変換部と同様である。輝度データの代わりに、明度データ、あるいは、Gデータを用いてもよい。差分値の絶対値は、画素毎に求める。
(2−2)差分値の絶対値の平均値を求める。
(2−3)差分値の絶対値の平均値が閾値(例えば、64)より大きい場合、画像のぼやけは少ないと判断する。
画像にぼやけが生じるとエッジがぼやけるため、隣接画素の差分値の絶対値は小さくなり、隣接画素の差分値の絶対値の平均値も小さくなる。よって、隣接画素の差分値の絶対値の平均値を閾値処理することにより、画像のぼやけを判断することができる。画像のぼやけは、携帯端末装置で撮像する際の、手ぶれや撮像対象物に焦点が合っていない場合に発生する。
ここで、画像のぼやけが少ないと判断された場合は、高圧縮PDFファイル生成可能な画像であると判定し、高圧縮PDFファイル生成判定信号を出力する。そうでない場合は、高圧縮PDFファイル生成に不適な画像であると判定し、高圧縮PDFファイル生成判定信号を出力する。画像がぼやけていると、高圧縮PDFファイル生成に不適であると判定しているのは、次の理由からである。高圧縮PDFファイル生成処理において、画像がぼやけていると、文字部を前景マスクとして抽出する精度が低下し、それに伴い、文字部が背景レイヤーと判定されやすくなる。背景レイヤーは高圧縮率で圧縮処理されため、背景レイヤーと判定された文字部の画質がぼやけていない画像と比較して、劣化してしまう。よって、不適であると判定する。
(3)判定不能の場合
画像種別判定の結果が「判定不能」の場合、高圧縮PDFファイル生成判定行うことができない。そのため、ユーザ設定に基づいて、高圧縮PDFファイル生成処理を実行するために、高圧縮PDFファイル生成可能な画像であると判断し、高圧縮PDFファイル生成判定信号を出力する。判定不能の場合、ファイルフォーマットとして、PDFファイルあるいは高圧縮PDFファイルの何れを選択するかを、ユーザに促す画面を表示部6に表示する。
<検出された画像の外枠を表す指示マーク、および、画像が適切に撮像されるか否かの指示マークの情報の取得>
上記した表示制御部24は、(i)検出された画像の外枠を表す指示マークと、(ii)画像が適切に撮像されるか否かの指示マークとについて、これらの情報を下記(1)〜(6)に示す方法を用いて算出する。下記方法は、撮像部4による撮像時に実施される処理である。
(1)選択された画像より、エッジ画素の抽出を行う。エッジ画素の抽出には、例えば、Cannyフィルタを適用して抽出し、エッジ画素を「1」とし、非エッジ画素を「0」とするエッジ画像を生成する。
(2)連結したエッジ画素の領域(連結エッジ領域)ごとに異なるラベルを付すラベリング処理を行う。
(3)ラベル付けがされた連結エッジ領域の中から、撮像対象物(例えば、原稿)と背景との境界を含む領域の候補(特徴領域、撮像対象物が原稿の場合には、原稿を示す領域)を抽出する。
(4)画像によっては、撮像対象物と背景との境界以外のエッジ画素が特徴領域として抽出される場合もあるため、特徴領域の中から、矩形の撮像対象物と背景との境界となる四角形の上辺、左辺、右辺、下辺を構成する、線分状に連なるエッジ画素群を抽出し、エッジ画素群の近似直線を特定する処理(直線抽出処理)を行う。
(5)上記(4)で求めた直線の式に基づいて、交点座標を求める。
(6)上記4つの頂点座標を結ぶ四角形の線を撮像対象物の輪郭線として画像に重ねて表示する。ここで、4つの辺に対する情報が全て抽出され、3つの頂点座標が撮像範囲内であり、1つの頂点座標が撮像範囲外である場合、撮像対象物の一部(一角)が撮像できないことを示す第1欠落情報(第1のアイコン)を表示する。さらに、抽出結果が4つの頂点座標を含み、辺を抽出することができなかったことを表す抽出不可情報を含む場合、4つの頂点座標が撮像範囲内であるか否かを判断し、全ての頂点座標が撮像範囲内であれば、撮像対象物の一部(一辺)が撮像できないことを示す第2欠落情報(第2のアイコン)を表示する。ここで、「第1のアイコン」および「第2のアイコン」の両方とも、画像が適切に撮像されないことを意味する指示マークとなるものである。全ての頂点座標が撮像範囲内であれば、撮像対象物が撮像範囲内であることを示す情報(例えば、「OK」)を表示する。
3.画像形成装置
画像形成装置50の構成について説明する。本実施の形態では、画像形成装置50は、スキャナ、プリンタ、複写機等の機能を備えた複合機である。
図7は、画像形成装置50の構成を示すブロック図である。図7に示すように、画像形成装置50は、制御部52、記憶部53、画像読取部54、画像形成部55、表示部56、入力部57、第1通信部58、第2通信部59、および記録媒体アクセス部60を備えている。
制御部52は、画像形成装置50が有する各ブロックを統括的に制御する。制御部52は、携帯端末装置1における制御部同様、記憶部53に保存されたファイルのヘッダを解析して、ファイルフォーマットの認識を行う。TIFFファイルの場合、タグを調べることにより、2値であるか多値であるかを判定し、2値である場合は、後述の、高圧縮PDFファイル生成処理を行わないように制御する。
また、制御部52は、受信した画像データに対して所定の画像処理を行う第2画像処理部(画像処理手段)14と、認証部15として機能する。第2画像処理部14ついては、後述する。
認証部15は、携帯端末装置1から受信した画像データの出力処理を行う際に、ユーザ認証を行う。具体的には、認証部15は、携帯端末装置1から受信したユーザ情報と、入力部57から入力されたユーザ情報(ユーザIDおよびパスワード)とを照合してユーザ認証を行う。
記憶部53は、画像形成装置50で使用される各種プログラムや各種データ等を記憶する。
画像読取部(スキャナ)54は、原稿を読み取るブロックである。画像読取部54は、CCD(Charge Coupled Device)を備え、原稿からの反射光を、RGBに色分解された電気信号(アナログの画像信号)に変換し、この電気信号を出力する。
画像形成部55は、例えば電子写真方式やインクジェット方式を用いて、紙などの記録用紙上に画像を形成するブロックである。すなわち、画像形成部204は、出力処理の一つとして、補正済の画像データで示される画像を用紙やシートなどの記録紙に印刷する印刷処理を実行するブロックである。
表示部56は、例えば、液晶ディスプレイ等より構成され、各種画像や各種情報の表示を行うブロックである。入力部57は、複数のボタンを有しており、ユーザがデータの入力等を行うためのものである。表示部56と入力部57とが一体となったタッチパネルとして構成されていてもよい。
第1通信部58は、本実施の形態では、USB1.1またはUSB2.0の規格に基づく、シリアル転送やパラレル転送、無線データ通信機能を有するものである。第1通信部58は、携帯端末装置1から、設定情報が付加された画像データを受信する。
第2通信部59は、(a)無線LANの規格である、IEEE802.11a、IEEE802.11bおよびIEEE802.11gのいずれかに基づく無線技術を利用したデータ通信、(b)イーサネット(登録商標)を利用した通信用インターフェースの機能を有し、LANケーブルを介した、ネットワークとのデータ通信、(c)無線通信規格である、IEEE802.15.1(いわゆるBluetooth(登録商標))やIrSimpleなどの赤外線通信規格、Felica(登録商標)などの通信方式のいずれかに基づく無線技術を利用したデータ通信の機能を有するものである。
第2通信部59は、出力処理として、第2画像処理部14により所定の画像処理が施された画像データをサーバ装置に格納するファイリング処理、もしくは、当該所定の画像処理が施された画像データを添付したメールをメールサーバ装置に送信するメール送信処理を実行する。
記録媒体アクセス部60は、プログラムが記録された記録媒体130から、プログラムを読み出すブロックである。
3−1.第2画像処理部
第2画像処理部について説明する。第2画像処理部14は、受信した画像データに対して所定の画像処理を行う。第2画像処理部14は、図8に示すように、画質調整部64、幾何学補正部65、レンズ歪み補正部66、高解像化処理部67、原稿検知部68、原稿補正部69、ファイル生成部70、出力処理部71を備える。
画質調整部64は、入力された画像データに対して、カラーバランス、コントラストおよび明るさの補正を行う。
幾何学補正部65は、ユーザにより幾何学補正が設定(選択)された場合に、画像データに対して幾何学補正を行う。具体的には、ポスターや原稿用紙のような矩形状の画像データ内の対象物に対して、文書画像が形成された平面の法線方向とは異なる方向から撮像することによる画像データ内の対象物の歪み(すなわち、画像が形成された矩形状の平面の歪み)を補正する。
レンズ歪み補正部66は、ユーザにより幾何学補正が設定された場合に、画像データのレンズ歪みを補正する。例えば、画像データにおける画像データ内の対象物のエッジ画素をラスター走査によって順次検出し、検出されたエッジ画素を曲線近似し、その曲線の式からレンズひずみ補正を行う。
高解像化処理部67は、出力対象となる1つの画像データに基づいて、出力対象となる画像データに対する高解像化補正を行う。1つの画像からの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008)にいくつかの方法が紹介されている。一般的には、画像パターンのエッジ方向性を検知・推定し、その向きに合わせた補間(エッジ方向補間処理)を行うとともに、補間によるひずみや入力画像に存在したノイズ成分の影響などの除去を目的とした高画質化処理からなる。エッジ方向補間処理については後述する。
原稿検知部68は、画像データについて、原稿の傾きや天地方向の検知を行う。原稿検知部68は、図9に示すように、信号変換部641、2値化処理部642、解像度変換部643、原稿傾き検知部644、天地方向検知部645を備える。
信号変換部641は、RGBのカラー画像データを輝度信号に変換する。変換の式は次の通りである。
Yi=0.30Ri+0.59Gi+0.11Bi
ここで、Y:各画素の輝度信号、R,G,B:各画素の各色成分の値、i:画素毎に付与された値(iは1以上の整数)、である。
信号変換部641は、または、RGB信号をCIE1976L***信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換してもよく、あるいは、G信号を用いてもよい。
2値化処理部642は、画像データを2値化する。画像データが8ビットの場合、例えば、閾値を128とする。あるいは、複数の画素(例えば、5×5)よりなるブロックも濃度(画素値)の平均値を閾値とする。
解像度変換部643は、2値化された画像データの解像度を低解像度化する。例えば、1200dpi、600dpiで読み込まれた画像データを300dpiに変換する。解像度変換の方法は、公知のニアレストネイバー法、バイリニア法、バイキュービック法等を用いて行う。原稿傾き判定部には、300dpiの画像データを出力する。
原稿傾き検知部644は、原稿の傾きを検知する。なお、上記幾何学補正が実行される際には、本処理は実施されない。傾き検知方法の例は、後述する。天地方向検知部645は、原稿の天地方向を検知する。天地方向の検知方法の例は、後述する。
図8に戻り、原稿補正部69は、画像データについて、原稿の傾き補正および天地方向補正を行う。原点を中心に、反時計まわりに角度θだけ、傾き補正した場合の補正前後の座標の関係は以下の式で表される。そこで、原稿補正部69は、以下の式を用いて原稿の傾き補正を行う。なお、補正前座標(X,Y)、補正後座標(X’,Y’)である。
Figure 0005819378
原点を中心に、反時計まわりに角度90°、180°、270°回転する場合の回転前後の座標の関係は、以下の式で表される。そこで、原稿補正部69は、以下の式を用いて原稿の天地方向補正を行う。なお、回転前座標(X,Y)、回転後座標(X’,Y’)である。
(90°回転時)
X’=オリジナル画像Y方向サイズ−1−Y
Y’=X
(180°回転時)
X’=オリジナル画像X方向サイズ−1−X
Y’=オリジナル画像Y方向サイズ−1−Y
(270°回転時)
X’=Y
Y’=オリジナル画像X方向サイズ−1−X
ファイル生成部70は、画像データからPDFファイルを生成する(画像データをPDFファイルに変換する)処理を行うブロックである。ファイル生成部70は、図10に示すように、文字認識部701、描画コマンド生成部702、フォーマット化処理部703を備える。
文字認識部701は、原稿検知部68から出力された、低解像度(例えば、300dpi)の白黒2値データを用いて、画像データの特徴量を抽出し、辞書データ(文字データベース)と比較して文字認識を行う。
描画コマンド生成部702は、文字認識部701の文字認識結果を透明テキストとし、配置するための命令を生成する。
フォーマット化処理部703は、表示用の画像処理が施された画像データをPDFファイル形式に変更するとともに、描画コマンドに基づいて、透明テキストを画像データに埋め込む。なお、携帯端末装置1から受信した設定情報に通常のPDFファイルを指定する情報が含まれている場合、つまり、出力ファイル形式が通常のPDFファイルの場合には、ページ毎の画像データは、全体を一つのJPEG画像として圧縮され、PDF形式のファイルに埋め込まれる。また、携帯端末装置1から受信した設定情報に高圧縮PDFファイル生成機能の設定が有効になった情報が含まれている場合、つまり、出力ファイル形式が高圧縮PDFファイルの場合には、文字領域の画像データは文字が判読しやすい解像度(たとえば300dpi)のMMR圧縮画像として色毎に圧縮され、文字領域以外の画像データは文字領域よりも低い解像度(たとえば150dpi)のJPEG画像として圧縮され、PDF形式のファイルに埋め込まれる。
フォーマット生成部702で処理された高圧縮PDFファイルあるいはPDFファイルは、記憶部53に記憶される。
出力処理部71は、画像データを出力(印刷、ファクシミリ送信、e-mail等のイメージ送信、ファイリング等)する際、領域分離処理、色補正、黒生成下色除去処理、空間フィルタ処理、中間調処理部等の出力処理を実行するブロックである。
なお、画像形成装置50は、認証部15、高解像化処理部67は備えていなくてもよい。また、携帯端末装置1はユーザにより選択された画像データを図示しない画像表示装置(ディスプレイ)に送信し、画像表示装置にて上記で説明した画像形成装置50での処理を行うようにしてもよい。上記処理を画像表示装置で実現する場合は、画像形成装置50は、図7の画像形成部55および画像読取部54を備えていなくてもよい。
<エッジ方向補間処理>
上記した高解像化処理部67にて行うエッジ方向補間処理について、図15〜17を用いて説明する。図17は、エッジ方向補間処理の一例を示すフローチャートである。
まず、入力画像のエッジ画像を生成する(S51)。例えば、図15の1次微分フィルタを用いてエッジ抽出を行い、2値化処理を行う。そして、着目画素がエッジか否かを判定する(S52)。上記した2値化処理により生成された2値化画像で画素値が1であればエッジとする。エッジと判定されない場合は(S52にてNO)、一般的な補間法(バイリニア・バイキュービックなど)を用いて補間画素値を演算により求める(S54)。エッジと判定された場合は(S52にてYES)、着目画像を含む部分画像N×N(N>1)を用いて、エッジの向きを抽出し(S53)、この結果に応じて補間するべき画素値の演算を行う(S54)。補間画素値の演算後には、補間画像データを出力する(S55)。
図16は、補間画素の画素値の決定方法の例を示す図である。図16に基づき、エッジ方向に応じた補間画素の演算について説明する。図16に示す例では、N=3で左上〜右下にかけて(i)から(ix)が入力画素であるとし、中央が着目画素(v)で、水平・垂直方向に各々2倍の解像度変換をする事例である。そして、着目画素の左上の画素A、着目画素の上の画素B、着目画素の左の画素Cが、求めるべき補間画素である。図16において、エッジ方向は点線で示されている。図16の(a)は、左上から右下方向のエッジが存在する場合であり、(b)は水平方向のエッジ、(c)は右上から左下方向のエッジ、(d)は垂直方向のエッジが存在する場合である。それぞれの場合において、エッジ方向に沿った画素のみを用いて、補間するべきA、B、Cの位置の画素値を算出する。例えば、図16の(a)の場合、基準画素(i)、(v)、(ix)がエッジ画素であり、これらの画素を結ぶ線がエッジ線となる。そして、エッジ線上の補間画素Aの画素値VA(図中では「V」の表記を省略している。以下同じ)について、補間画素Aに隣施するエッジ線上の基準画素(i)(画素値V(i))および基準画素(v)(画素値V(v))の画素値を用いて、以下の式
VA=(V(i)+V(v))/2
により求める。
一方、エッジ線上ではない補間画素B、Cについては、エッジ線上の基準画素を除く基準画素のうちの、当該補間画素に最も近い基準画素(最近接基準画素)を含み、エッジ方向に平行な線上の基準画素を用いて補間する。例えば、図16の(a)では、補間画素Bについては、最近接基準画素である基準画素(ii)を含み、エッジ方向に平行な線は、基準画素(ii)と(vi)とを結ぶ線である。そして、補間画素Bから当該線に垂直に下した点は、基準画素(ii)と(vi)とを結ぶ線分を内分する。そのため、補間画素Bの画素値VBは、以下の式
VB=(9×V(ii)+4×V(vi))/13
を用いて求める。
同様に、補間画素Cの画素値VCは、最近接基準画素である基準画素(iv)と、当該基準画素(iv)を含みエッジ方向に平行な線上の基準画素(viii)との画素値を用いて、以下の式
VC=(9×V(iv)+4×V(viii))/13
により求める。水平方向のエッジ、右上から左下方向のエッジ、垂直方向のエッジについても、上記と同様の考え方で補間画素を求めることができる。上記各エッジの方向に対して補間画素A、B、Cを算出する式を図16の(b)〜(d)に示す。
なお、図16では、エッジ方向が直線状である場合のみ示している。しかしながら、エッジは、N×Nの部分画像内において曲がる場合もある。例えば、エッジが基準画素(ii)−(v)−(iv)のように曲がる場合、補間画素Aについては図16の(d)と同様に、補間画素Bについては図16の(b)と同様に、補間画素Cについては図16の(d)と同様の計算式を用いて演算を行う。また、エッジが基準画素(i)−(v)−(vii)のように曲がる場合、補間画素Aについては図16の(a)と同様に、補間画素Bについては図16の(a)と同様に、補間画素Cについては図16の(c)と同様の計算式を用いて演算を行う。このようにして、エッジ画素と判定された基準画素の周囲に位置する補間画素の画素値を求める。
着目画素がエッジでない場合は、当該着目画素の左上に隣接する補間画素A,当該着目画素の上に隣接する補間画素B,当該着目画素の左の補間画素Cの画素値を、一般的な補間演算法(バイリニア・バイキュービックなど)により求める。
上記した処理を、一つの画像データに含まれる全ての基準画素について実行することで、基準画素と補間画素との両方を備える補間画像データを生成する。
その後、生成した補間画像データに対して高画質化処理を行う。例えば、ノイズ除去フィルタや鮮鋭化フィルタなどを補間画像データに適用して、高解像度画像データを生成する。例えば、従来からあるアンシャープマスクや、図15の中央の係数を5とした鮮鋭化フィルタを使用することができる。また、ノイズ除去としてはメディアンフィルタなどが広く知られている。より高度な手法として、上記エッジ保存性と高画質化を併せ持つ手法としてBilateralフィルタ[Proceedings of the 1998 IEEE International Conference on Computer Vision,]などが報告されている。
なお、上述した方法に限定されず、映像情報メディア学会誌Vol.62、No.2、pp.181〜189(2008)に記載されているような種々の方法を用いて、1つの撮像画像データから高解像度画像データを生成してもよい。
<原稿傾き検知>
上記した原稿検知部68の原稿傾き検知部644での原稿の傾きを検知する処理の一例について説明する。本実施の形態では、特開平7−192086号公報に記載の方法を用いる。まず、2値化された画像データより、黒画素と白画素との境界点を複数個抽出し、各境界点の点列の座標データを求める。黒画素と白画素との境界は、例えば、各文字の上端における白/黒境界点の座標を求め記憶する。そして、点列座標データを参照して、この点列座標から回帰直線を求め、その回帰係数bを以下の式にて計算して記憶する。
Figure 0005819378
ここでSx,Syはそれぞれ変量xとyの残差平方和で、Sxyはxの残差とyの残差との積の和である。すなわち、以下の式にて表わされる。
Figure 0005819378
回帰係数bより画像の傾き角度(θ)を、以下の式によって算出する。
tanθ=b
<原稿天地方向検知>
上記した原稿検知部68の天地方向検知部645での原稿の天地方向を検知する処理の一例について説明する。本実施の形態では、特開平6−189083号公報に記載の方法を用いる。まず、文字認識を行い、原稿内の一文字、一文字を切り出し、その文字をパターン化する。処理は、白黒2値、300dpiのデータを用いて行う。次に、文字パターンの特徴とデータベース化された文字パターン情報を比較する。マッチングの方法としては、データベース化された文字パターンに切り出された文字パターンを重ね合わせ、画素ごとの白黒を比較し、全てが合致したときのデータベース化された文字パターンを入力パターンの文字であると判別する。全てが合致する文字パターンがない場合、マッチングする画素が最も多い文字パターンの文字であると判別する。なお、所定のマッチング割合に達しなければ判別不能と判断する。そして、切り出された文字パターンを90°、180°、270°回転させ、上記の処理を繰り帰す。また、上記で得られた文字パターンの回転角毎の判別可能な文字数の比較を行い、判別可能な文字数が最も多い回転角を文字の方向とし原稿の天地判断を判定する。
<高圧縮PDFファイル生成処理>
上記したファイル生成部70のフォーマット化処理部703にて実行される高圧縮PDFファイル生成処理について説明する。高圧縮PDFファイル生成処理として、以下の(1)〜(4)が実行される。
(1)入力画像から文字画素を表す前景マスクを抽出する前景マスク生成処理を行う。この処理としては、領域分離処理において、文字領域であると判定された画素を2値化し文字画素を抽出する。
(2)前景画素色をインデックス化し、インデックス画像を表す前景レイヤーと、前景レイヤーの各文字色、および各文字色領域の最大・最小座標、各インデックスに属する画素数を格納した前景インデックスカラーテーブルを生成する前景色インデックス化処理を行う。この処理としては、特開2002−94805号公報に記載されている方法を用いることができる。これは、前景色のインデックス化処理に関する方法であり、前景レイヤー生成時に全ての前景画素を限られた色数で表す方法である。詳細には、前景画素について、前景インデックスカラーテーブルを更新していくことで、最終的に前景画像のインデックス化を行う。各前景画素について、前景画素色が既に前景インデックスカラーテーブルに登録されていると判断された場合、前景インデックスカラーテーブル内で、最も近い色を有するインデックス値を割り当てる。前景画素色が前景インデックスカラーテーブルに登録されていないと判断された場合は、新規インデックス値を割り当て、前景インデックスカラーテーブルに登録する。上記処理を繰り返すことにより、前景画像をインデックス化する。
(3)入力画像から前景画素を取り除いて、背景レイヤーを生成する処理である背景レイヤー生成処理を行う。背景レイヤーの圧縮率を向上するために、前景画素周辺の前景画素でない周辺背景レイヤー画素を用いて穴埋め処理を行う。前景画素周辺の前景画素でない背景画素を参照し、その背景画素の平均値を用いて、背景レイヤー前景画素部を穴埋めする。また、近傍に前景画素でない背景画素が存在しない場合、近傍穴埋め処理結果を用いる。また、穴埋め処理が施された画像に対して、単純間引き、ニアレストネイバー、バイリニアまたはバイキュービック等の補間処理を行うことにより、背景画像の低解像度化処理を行うようにしても良い。例えば、入力画像の解像度を1/2の解像度にする。
(4)入力される前景レイヤーと、前景色インデックス化処理にて生成された座標情報を用いて、各インデックスの2値化画像を出力する2値画像生成処理を行う。
各レイヤーに適切な圧縮処理を適用する。前述の通り、前景レイヤーは、MMR(Modified Modified Read、可逆圧縮技術)を用いて圧縮する。一方、背景レイヤーはJPEG(Joint Photographic Experts Group、非可逆圧縮技術)を用いて圧縮する。
4.画像処理システムでの処理の流れ
次に、本実施の形態の画像処理システムでの処理の流れについて説明する。
入力部7からのユーザによる指示入力により、携帯端末装置1の記憶部3に格納されている画像データを、表示部6にてサムネイル表示、あるいは、1枚ずつ表示する。または、撮像部4で撮像された画像データを表示部6にて表示する。入力部7からのユーザによる指示入力により表示された画像データが選択され、送信先のアドレスが設定される(記憶部3に記憶されているアドレスが選択される、あるいは、アドレスが直接入力される)と、通信部5から送信先に送信される。選択された画像データは、記憶部3に格納されている画像データ、あるいは撮像部4で撮像した画像データである。送信先としては、画像形成装置50、あるいは、図示しない、サーバ装置、画像表示装置等がある。
上記選択された画像データ(選択画像)に対する処理を説明する。図12の(a)は、画像処理システム全体での処理、(b)は、携帯端末装置1での処理、(c)は、画像形成装置50での処理を示すフローチャートである。
始めに、処理が開始されると、携帯端末装置1は、下記の各処理(A)〜(E)を行うか否かの設定を行い、設定情報を作成する(S21)。ここでは、ユーザが携帯端末装置1の入力部7から、下記の各処理(A)〜(E)を行うか否か選択入力することで、設定が行われる。
(A)高圧縮PDFファイル生成
(B)サーチャブルPDFファイル生成
(C)幾何学補正、または、傾き補正
(D)高画質化
(E)天地方向補正
各処理の設定が行われ設定情報が作成されると、携帯端末装置1での処理が実行される(S22)。具体的には、図12の(b)に示すように、携帯端末装置1は、順次、画像を選択し(S31)、選択画像の画像種別を判定し、画像種別に応じた高圧縮PDFファイル生成判定処理を行うことで、選択画像が高圧縮PDFファイル生成に適しているか否かを判定する(S32)。高圧縮PDFファイル生成に不適と判定された場合は(S32にてNO)、S21の設定にて高圧縮PDFファイル生成機能が設定されている場合には、設定情報における高圧縮PDFファイル生成機能の設定を無効(OFF)とし(S33)、選択画像と各種情報(幾何学補正情報、携帯端末装置の機種情報、ユーザ情報、設定情報)とを画像形成装置50に送信する(S34)。
ここで、幾何学補正情報は、前述した4個の交点座標の情報である。設定情報は、上記したように、例えば、高圧縮PDFファイル生成機能の設定のONまたはOFF等の、ユーザにより設定される情報である。また、携帯端末装置1の機種情報は、画像形成装置50の第2画像処理部14の画質調整部等でのパラメータの切り替え等、撮像された端末毎に処理またはパラメータを切り替えるために使用される。
高圧縮PDFファイル生成に適していると判定された場合は(S32にてYES)、そのまま、選択画像と各種情報(幾何学補正情報、携帯端末装置の機種情報、ユーザ情報、設定情報)とを画像形成装置50に送信する(S34)。そして、全ての選択画像についての処理が完了したかを判定し(S35)、完了していない場合には(S35にてNO)、S32から繰り返す。完了した場合には(S35にてYES)、携帯端末装置1での処理を終了し、図12の(a)のS23に進む。
S23では、画像形成装置50での処理が実行される。具体的には、図12の(c)に示すように、画像形成装置50は、携帯端末装置1より選択画像を受信する(S41)。このとき、設定情報を含む各種情報についても受信する。次に、ユーザ設定に応じて、カラーバランス、コントラスト、明るさ補正を行う(S42)。そして、設定情報に含まれている情報が幾何学補正であるか傾き補正であるかを判定し(S43)、幾何学補正である場合は、幾何学補正を行い(S44)、傾き補正である場合は、傾き検知及び補正を行う(S45)。その後、高解像化補正を行い(S46)、補正後の画像を記憶部53に格納する。その後、図12の(a)のS24に進む。
図12の図12の(a)に戻り、S23が終了すると、画像形成装置50は、補正後の画像に対して、設定情報に基づき、天地方向補正処理(S24)、文字認識処理(S25)、描画コマンド生成処理(S26)、高圧縮PDFファイル生成処理(S27)およびフォーマット化処理(S28)を行い、PDFファイルを生成する。なお、S27の高圧縮PDFファイル生成処理は、設定情報に高圧縮PDFファイル生成機能の設定が有効(ON)になった情報含まれている場合に実行する。
以上により本実施の形態での画像処理システムでの処理が終了する。
〔実施の形態2〕
本実施の形態では、携帯端末装置1の画像データの送信先が、実施の形態1の画像形成装置50の代わりにサーバ装置である場合について説明する。つまり、本実施の形態では、携帯端末装置1とサーバ装置とが本発明に係る画像処理システムを構成する。なお、上述の実施の形態1の説明に用いた図面に記載されている部材と同じ機能を有する部材については、以下の説明においても同じ符号を付記する。それらの各部材の詳細な説明はここでは繰り返さない。
本実施の形態では、実施の形態1の画像形成装置50の代わりに、サーバ装置が第2画像処理部14の構成を構築する。図13に、本実施の形態のサーバ装置100のブロック図を示す。サーバ装置100は、コンピュータから成る装置である。サーバ装置100は、第2画像処理部14を備えた画像処理部110を有する。また、サーバ装置100は、制御部101、入力装置102、ディスプレイ103、送受信部105、記憶部104を有する。これらは、それぞれ、図7に示した画像形成装置50の、制御部52、入力部57、表示部56、第1通信部58および第2通信部59、記憶部53に相当するため、説明は省略する。
また、サーバ装置100の代わりに、携帯端末装置1の画像データの送信先が、第2画像処理部14を備える画像表示装置等であってもよい。
〔実施の形態3〕
実施の形態1では画像形成装置50が第2画像処理部14を有していたが、本実施の形態では、携帯端末装置が第2画像処理部14を有する構成について説明する。つまり、本実施の形態では、携帯端末装置そのもので、本発明に係る画像処理システムを構成する。なお、上述の実施の形態1の説明に用いた図面に記載されている部材と同じ機能を有する部材については、以下の説明においても同じ符号を付記する。それらの各部材の詳細な説明はここでは繰り返さない。
図14に、本実施の形態の携帯端末装置1bのブロック図を示す。携帯端末装置1bは、図1に示す携帯端末装置1の構成に加え、第2画像処理部14を備える。
本実施の形態では、携帯端末装置1bが第2画像処理部14を備えるため、携帯端末装置1bにて高圧縮PDFファイルを形成することができる。第2画像処理部14にて高圧縮PDFファイルを形成後には、記憶部3に保存しておいても、画像形成装置50に送信して印刷しても、サーバ装置に送信してもよい。
〔実施の形態4〕
携帯端末装置1,1b、画像形成装置50、サーバ装置100は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、携帯端末装置1,1b、画像形成装置50、サーバ装置100は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
本発明は上述した各実施の形態に限定されるものではなく、種々の変更が可能である。すなわち、本発明の要旨を逸脱しない範囲内において適宜変更した技術的手段を組み合わせて得られる実施の形態についても本発明の技術的範囲に含まれる。
〔まとめ〕
本発明の態様1に係る画像判定装置(携帯端末装置1)は、入力画像が、スキャナにより読み取られた読取画像であるか、あるいは、撮像装置により撮像された撮像画像であるかを判定する画像種別判定手段(画像種別判定部81)と、上記画像種別判定手段による判定結果に基づいて、上記入力画像が圧縮された環境非依存型文書書式の画像への変換に適しているか否かを判定する書式変換判定手段(高圧縮PDFファイル生成判定部82)と、を備え、上記書式変換判定手段は、上記読取画像と判定された入力画像からは解像度に関する特徴量を、上記撮像画像と判定された入力画像からはぼやけに関する特徴量を抽出し、上記特徴量に基づき上記判定を行う。
上記構成によると、入力画像が撮像画像であるか読取画像であるかの判定、および、圧縮された環境非依存型文書書式の画像(例えば,高圧縮PDFファイル)への変換(生成)の適否の判定を画像判定装置にて行う。そのため、ユーザが入力画像種別や、入力画像状態を確認して、圧縮された環境非依存型文書書式の画像への変換に適しているか判断する必要がなくなる。よって、ユーザが圧縮された環境非依存型文書書式の画像の変換(生成)機能を切り替える手間を省くことができる。また、圧縮された環境非依存型文書書式の画像への変換の適否の判定を、撮像画像と読取画像とでそれぞれに対応した特徴量を抽出して行うため、適切な判定を行うことができる。
本発明の態様2に係る画像判定装置は、態様1に係る画像判定装置において、上記書式変換判定手段は、上記解像度に関する特徴量が、当該解像度が相対的に高いと判定される所定範囲内にある場合、上記読取画像と判定された入力画像は、圧縮された環境非依存型文書書式の画像への変換に適していると判定してもよい。
上記構成によると、圧縮された環境非依存型文書書式の画像への変換に適した高解像度の入力画像(撮像画像)の場合のみ、圧縮された環境非依存型文書書式の画像への変換が実施される。よって、低解像度であることが要因となる圧縮された環境非依存型文書書式の画像の画質劣化を回避することが可能となる。
ここで、上記解像度に関する特徴量が、当該解像度が相対的に高いと判定される所定範囲内にある場合とは、上記解像度が所定閾値以上である場合であってもよい。
本発明の態様3に係る画像判定装置は、態様1または2に係る画像判定装置において、上記書式変換判定手段は、上記ぼやけに関する特徴量が、当該ぼやけの程度が相対的に低いと判定される所定範囲内にある場合に、当該撮像画像と判定された入力画像は、圧縮された環境非依存型文書書式の画像への変換に適していると判定してもよい。
上記構成によると、圧縮された環境非依存型文書書式の画像への変換に適したぼやけがない入画像(読取画像)の場合のみ、圧縮された環境非依存型文書書式の画像への変換が実施される。よって、撮像画像生成(撮像)時に発生したぼやけが要因となる圧縮された環境非依存型文書書式の画像の画質劣化を回避することが可能となる。
ここで、上記ぼやけに関する特徴量が、当該ぼやけの程度が相対的に低いと判定される所定範囲内にある場合とは、上記ぼやけに関する特徴量から上記撮像画像と判定された入力画像がぼやけていないと判定できる場合であってもよい。
本発明の態様4に係る画像判定装置は、態様1から3のいずれか1つに係る画像判定装置において、表示部と、上記入力画像を上記表示部に表示する制御を行う表示制御手段と、をさらに備え、上記表示制御手段は、上記撮像画像と判定された入力画像から原稿を示す領域を抽出し、少なくとも当該原稿の外縁を示す線分の表示を行ってもよい。
上記構成によると、入力画像が撮像画像である場合にのみ入力画像から原稿を示す領域を抽出して表示、いわゆる画像切り出し表示する。そのため、入力画像の表示時に、原稿エッジ等を含まない形で保存された読取画像に対して誤った切り出し表示することを、ユーザに負担をかけること無く、回避することが可能となる。
本発明の態様5に係る画像処理システムは、態様1から4のいずれか1つに係る画像判定装置と、上記画像判定装置の上記書式変換判定手段の判定結果に基づき、上記入力画像を、環境非依存型文書書式の画像へ変換する画像処理手段と、を備える。
上記構成によると、圧縮された環境非依存型文書書式の画像への変換の適否の判定結果を基に、環境非依存型文書書式の画像へ変換する。よって、ユーザは入力画像が撮像画像であっても読取画像であってもタイプを意識せずに、圧縮された環境非依存型文書書式の画像あるいは、環境非依存型文書の画像を生成することができる。
なお、本発明に係る画像判定装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより上記画像判定装置をコンピュータにて実現させるプログラム、およびそのプログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は、画像が高圧縮PDFファイルへの変換に適しているか否かを判定する画像判定装置等に利用することができる。
1 携帯端末装置(画像判定装置)
14 第2画像処理部(画像処理手段)
23 処理判定部
50 画像形成装置
81 画像種別判定部(画像種別判定手段)
82 高圧縮PDFファイル生成判定部(書式変換判定手段)
83 解像度判定部
84 画像判定部
100 サーバ装置
703 フォーマット化処理部

Claims (7)

  1. 入力画像が、スキャナにより読み取られた読取画像であるか、あるいは、撮像装置により撮像された撮像画像であるかを判定する画像種別判定手段と、
    上記画像種別判定手段による判定結果に基づいて、上記入力画像が圧縮された環境非依存型文書書式の画像への変換に適しているか否かを判定する書式変換判定手段と、を備え、
    上記書式変換判定手段は、上記読取画像と判定された入力画像からは解像度に関する特徴量を、上記撮像画像と判定された入力画像からはぼやけに関する特徴量を抽出し、上記特徴量に基づき上記判定を行うことを特徴とする画像判定装置。
  2. 上記書式変換判定手段は、上記解像度に関する特徴量が、当該解像度が相対的に高いと判定される所定範囲内にある場合、上記読取画像と判定された入力画像は、圧縮された環境非依存型文書書式の画像への変換に適していると判定することを特徴とする請求項1に記載の画像判定装置。
  3. 上記書式変換判定手段は、上記ぼやけに関する特徴量が、当該ぼやけの程度が相対的に低いと判定される所定範囲内にある場合、当該撮像画像と判定された入力画像は、圧縮された環境非依存型文書書式の画像への変換に適していると判定することを特徴とする請求項1または2に記載の画像判定装置。
  4. 表示部と、
    上記入力画像を上記表示部に表示する制御を行う表示制御手段と、をさらに備え、
    上記表示制御手段は、上記撮像画像と判定された入力画像から原稿を示す領域を抽出し、少なくとも当該原稿の外縁を示す線分の表示を行うことを特徴とする請求項1から3のいずれか1項に記載の画像判定装置。
  5. 請求項1から4の何れか1項に記載の画像判定装置と、
    上記画像判定装置の上記書式変換判定手段の判定結果に基づき、上記入力画像を、環境非依存型文書書式の画像へ変換する画像処理手段と、を備えたことを特徴とする画像処理システム。
  6. 請求項1から4の何れか1項に記載の画像判定装置を動作させるためのプログラムであって、コンピュータを上記の各手段として機能させるための画像判定プログラム。
  7. 請求項6に記載の画像判定プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2013205548A 2013-09-30 2013-09-30 画像判定装置、画像処理システム、プログラム及び記録媒体 Active JP5819378B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013205548A JP5819378B2 (ja) 2013-09-30 2013-09-30 画像判定装置、画像処理システム、プログラム及び記録媒体
CN201410515525.9A CN104519227B (zh) 2013-09-30 2014-09-29 图像判定装置以及图像处理系统
US14/500,159 US9268998B2 (en) 2013-09-30 2014-09-29 Image determining apparatus, image processing system, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013205548A JP5819378B2 (ja) 2013-09-30 2013-09-30 画像判定装置、画像処理システム、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2015070565A JP2015070565A (ja) 2015-04-13
JP5819378B2 true JP5819378B2 (ja) 2015-11-24

Family

ID=52740247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013205548A Active JP5819378B2 (ja) 2013-09-30 2013-09-30 画像判定装置、画像処理システム、プログラム及び記録媒体

Country Status (3)

Country Link
US (1) US9268998B2 (ja)
JP (1) JP5819378B2 (ja)
CN (1) CN104519227B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104243759B (zh) * 2013-06-19 2018-07-13 英华达(上海)科技有限公司 扫描处理系统及其方法
JP5886265B2 (ja) * 2013-11-28 2016-03-16 シャープ株式会社 携帯端末装置、プログラム、及び記録媒体
TW201801513A (zh) * 2016-06-15 2018-01-01 半導體能源研究所股份有限公司 顯示裝置及其動作方法,以及電子機器

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0488176B1 (en) * 1990-11-27 1999-03-03 Canon Kabushiki Kaisha Color image processing apparatus
JPH06189083A (ja) 1992-02-13 1994-07-08 Ricoh Co Ltd 画像方向認識装置および画像方向認識方法
JP3338537B2 (ja) 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
US6069706A (en) * 1995-07-31 2000-05-30 Canon Kabushiki Kaisha Image reading device and image processing method utilizing the same
ATE333189T1 (de) * 1997-07-17 2006-08-15 Canon Kk Bildverarbeitungsvorrichtung und -verfahren und aufzeichnungsmedium dafür
US6701012B1 (en) 2000-07-24 2004-03-02 Sharp Laboratories Of America, Inc. Out-of-layer pixel generation for a decomposed-image layer
JP2002041502A (ja) 2000-07-28 2002-02-08 Olympus Optical Co Ltd ドキュメント作成システム及びドキュメント作成方法
US7469057B2 (en) * 2003-02-26 2008-12-23 Taiwan Semiconductor Manufacturing Corp System and method for inspecting errors on a wafer
JP2004362091A (ja) * 2003-06-03 2004-12-24 Toshiba Corp データ変換装置、データ変換システム及びデータ格納制御プログラム
US7710599B2 (en) * 2005-03-22 2010-05-04 Ricoh Company, Ltd. Image processing apparatus, image processing method, and image processing program
JP4861711B2 (ja) * 2005-07-27 2012-01-25 株式会社リコー 画像処理装置、画像圧縮方法、画像圧縮プログラム及び記録媒体
US7941002B2 (en) * 2006-12-01 2011-05-10 Hewlett-Packard Development Company, L.P. Apparatus and methods of producing photorealistic image thumbnails
JP4708460B2 (ja) * 2008-08-27 2011-06-22 シャープ株式会社 表示制御装置、画像形成装置、表示装置の制御方法、制御プログラム、記録媒体
JP4772894B2 (ja) * 2009-08-03 2011-09-14 シャープ株式会社 画像出力装置、携帯端末装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP2012074852A (ja) * 2010-09-28 2012-04-12 Sharp Corp 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体
JP5951367B2 (ja) * 2012-01-17 2016-07-13 シャープ株式会社 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
US20140253957A1 (en) * 2013-03-11 2014-09-11 Dell Products L.P. Systems and methods for extending capability of an imaging device

Also Published As

Publication number Publication date
US9268998B2 (en) 2016-02-23
CN104519227B (zh) 2017-11-28
US20150093031A1 (en) 2015-04-02
JP2015070565A (ja) 2015-04-13
CN104519227A (zh) 2015-04-15

Similar Documents

Publication Publication Date Title
JP5886265B2 (ja) 携帯端末装置、プログラム、及び記録媒体
JP4758502B2 (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5547243B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP5951367B2 (ja) 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
US8634650B2 (en) Image processing apparatus, image forming apparatus, image reading apparatus, and image processing method
JP4886053B2 (ja) 制御装置、画像読取装置、画像形成装置、画像読取装置の制御方法、プログラム、記録媒体
US8165402B2 (en) Image processing method, image processing apparatus, image forming apparatus and storage medium
JP5026484B2 (ja) 携帯端末装置、画像出力装置、撮像画像処理システム、携帯端末装置の制御方法、画像出力方法、プログラム、および記録媒体
JP4772889B2 (ja) 携帯端末装置、撮像画像処理システム、プログラムおよび記録媒体
JP4758493B2 (ja) 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体
JP2011055467A (ja) 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
WO2018010547A1 (zh) 一种图像处理方法、装置及图像形成设备
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2019040617A (ja) 画像処理装置および画像処理方法
JP6628279B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP4487000B2 (ja) 画像処理装置、画像形成装置、画像処理方法、画像処理システム、画像処理プログラムおよびその記録媒体
JP5819378B2 (ja) 画像判定装置、画像処理システム、プログラム及び記録媒体
JP2009296150A (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
US10896344B2 (en) Information processing apparatus, information processing method, and computer program
JP6262102B2 (ja) 画像処理装置、画像処理システム、コンピュータプログラム及び記録媒体
JP2010161745A (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP2022189063A (ja) 画像データ生成装置および画像データ生成方法
JP6137998B2 (ja) 画像処理装置、画像形成装置、プログラムおよび記録媒体
US20090316998A1 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150930

R150 Certificate of patent or registration of utility model

Ref document number: 5819378

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150