JP6191256B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP6191256B2
JP6191256B2 JP2013122150A JP2013122150A JP6191256B2 JP 6191256 B2 JP6191256 B2 JP 6191256B2 JP 2013122150 A JP2013122150 A JP 2013122150A JP 2013122150 A JP2013122150 A JP 2013122150A JP 6191256 B2 JP6191256 B2 JP 6191256B2
Authority
JP
Japan
Prior art keywords
image
file format
unit
character
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013122150A
Other languages
English (en)
Other versions
JP2014238787A (ja
Inventor
上條 裕義
裕義 上條
和宏 大谷
和宏 大谷
征 天谷
征 天谷
新治 花岡
新治 花岡
岡田 茂
茂 岡田
稔 袖浦
稔 袖浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2013122150A priority Critical patent/JP6191256B2/ja
Publication of JP2014238787A publication Critical patent/JP2014238787A/ja
Application granted granted Critical
Publication of JP6191256B2 publication Critical patent/JP6191256B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Character Input (AREA)

Description

本発明は、画像処理装置及びプログラムに関する。
画像を解析して、画像の構成要素や構造を認識する技術が知られている。例えば、特許文献1には、複数ページの文書構造を認識する技術が記載されている。特許文献2には、画像の特徴量に基づいて、画像に含まれる物体を認識する技術が記載されている。特許文献3には、パターン認識により、撮影された画像に含まれる対象物を認識する技術が記載されている。
特開平11−250041号公報 特開2012−203634号公報 特開2006−252162号公報
本発明は、入力された画像データをその内容に応じたファイル形式のデータに変換することを目的とする。
請求項1に係る発明は、入力された画像データが表す、複数のページにより構成される原稿の画像から当該画像を構成する各要素の領域を抽出する抽出部と、前記抽出部により抽出された前記領域に文字領域が含まれる場合には、当該文字領域に対して文字認識処理を施す文字認識部と、前記複数のページの各々について、前記抽出部により当該ページから抽出された各々の前記領域の当該ページ全体に占める割合及び当該ページに含まれる前記文字領域に対して前記文字認識部により施された前記文字認識処理の結果に応じて、ファイル形式を決定する第1決定部と、前記第1決定部により各ファイル形式が決定されたページの総数を計数し、前記計数された総数が最も多いファイル形式を決定する第2決定部と、前記入力された画像データを前記第2決定部により決定された前記ファイル形式のデータに変換する変換部と、前記変換部により変換された前記データを出力する出力部とを備える画像処理装置を提供する。
請求項2に係る発明は、請求項1に記載の画像処理装置において、前記文字認識部は、前記文字認識処理により認識された文字の数を計算し、前記第1決定部は、前記ページ全体に占める前記文字領域の割合が閾値より大きく、且つ、前記文字認識部により計算された前記文字の数が閾値より多い場合には、前記ファイル形式として文書用のファイル形式を決定する。
請求項3に係る発明は、請求項1又は2に記載の画像処理装置において、前記文字認識部は、前記文字認識処理により認識された文字の大きさ及び位置を計算し、前記第1決定部は、前記文字認識部により計算された前記文字の位置が予め設定された位置であり、前記文字認識部により計算された当該文字の大きさが閾値より大きい場合には、前記ファイル形式としてプレゼンテーション用のファイル形式を決定する。
請求項4に係る発明は、請求項1から3のいずれか1項に記載の画像処理装置において、前記第1決定部は、前記割合、前記文字認識処理の結果及び前記画像の色数に応じて、前記ファイル形式を決定する。
請求項5に係る発明は、請求項1から4のいずれか1項に記載の画像処理装置において、前記抽出部により抽出された前記領域には、図領域が含まれ、前記第1決定部は、前記ページ全体に占める前記図領域の割合が閾値より大きい場合には、前記ファイル形式としてプレゼンテーション用のファイル形式を決定する。
請求項6に係る発明は、請求項1から5のいずれか1項に記載の画像処理装置において、前記抽出部により抽出された前記領域には、表領域が含まれ、前記第1決定部は、前記ページ全体に占める前記表領域の割合が閾値より大きい場合には、前記ファイル形式として表計算用のファイル形式を決定する。
請求項7に係る発明は、請求項1から6のいずれか1項に記載の画像処理装置において、前記第1決定部は、前記文字認識処理により認識された文字に特定の文字が含まれる場合には、前記ファイル形式として編集が制限されるファイル形式を決定する。
請求項8に係る発明は、請求項1から7のいずれか1項に記載の画像処理装置において、前記割合及び前記文字認識処理の結果に応じて、前記画像の種別を判別する判別部と、前記入力された画像データに対して、前記判別部により判別された前記画像の種別に対応する画質調整処理を施す画質調整部とをさらに備え、前記出力部は、前記変換部によるファイル形式の変換を要しない出力指示が入力された場合には、前記画質調整部により前記画質調整処理が施された前記画像データを出力する。
請求項9に係る発明は、請求項8に記載の画像処理装置において、前記出力部により出力された前記画像データに応じた画像を形成する画像形成部をさらに備える。
請求項10に係る発明は、コンピュータに、入力された画像データが表す、複数のページにより構成される原稿の画像を構成する各要素の領域を抽出するステップと、前記抽出された領域に文字領域が含まれる場合には、当該文字領域に対して文字認識処理を施すステップと、前記複数のページの各々について、当該ページから抽出された各々の前記領域の当該ページ全体に占める割合及び当該ページに含まれる前記文字領域に対して施された前記文字認識処理の結果に応じて、ファイル形式を決定する第1決定ステップと、前記第1決定ステップにおいて各ファイル形式が決定されたページの総数を計数し、前記計数された総数が最も多いファイル形式を決定する第2決定ステップと、前記入力された画像データを前記第2決定ステップにおいて決定されたファイル形式のデータに変換するステップと、前記変換されたデータを出力するステップとを実行させるためのプログラムを提供する。
請求項1に係る発明によれば、入力された画像データをその内容に応じたファイル形式のデータに変換することができる。
請求項2に係る発明によれば、文書の特徴を有する画像データを文書用のファイル形式のデータに変換することができる。
請求項3に係る発明によれば、プレゼンテーション用の資料の特徴を有する画像データをプレゼンテーション用のファイル形式のデータに変換することができる。
請求項4に係る発明によれば、画像の色数を考慮しない場合に比べて、画像データの内容に適したファイル形式を精度よく決定することができる。
請求項5に係る発明によれば、プレゼンテーション用の資料の特徴を有する画像データをプレゼンテーション用のファイル形式のデータに変換することができる。
請求項6に係る発明によれば、表の特徴を有する画像データを表計算用のファイル形式のデータに変換することができる。
請求項7に係る発明によれば、画像に特定の文字が含まれる場合には、その画像を表すデータの編集を制限することができる。
請求項8に係る発明によれば、入力された画像データに対して、その画像の種別に対応する画質調整処理を施すことができる。
請求項9に係る発明によれば、画像の種別に対応する画質調整処理が施された画像データに応じて画像を形成することができる。
請求項10に係る発明によれば、入力された画像データをその内容に応じたファイル形式の画像データに変換することができる。
第1実施形態に係る画像処理装置のハードウェア構成を示す図である。 第1実施形態に係る画像処理部の機能構成を示す図である。 文字領域の周辺分布の一例を示す図である。 表領域の連結成分の一例を示す図である。 図領域の連結成分の一例を示す図である。 変換出力処理を示すフローチャートである。 原稿の画像の一例を示す図である。 原稿の画像の別の例を示す図である。 原稿の画像の別の例を示す図である。 ファイル形式を決定する条件の一例を示す図である。 第2実施形態に係る画像処理部の機能構成を示す図である。 画像の種別を判別する条件の一例を示す図である。 階調再現特性の一例を示す図である。
[第1実施形態]
1.構成
図1は、第1実施形態に係る画像処理装置1のハードウェア構成を示す図である。画像処理装置1は、スキャン機能、コピー機能、ファクシミリ機能等の複数の機能を有する装置である。画像処理装置1は、制御部11と、通信部12と、操作部13と、表示部14と、画像読取部15と、画像処理部16と、画像形成部17と、記憶部18とを備える。
制御部11は、例えばCPU(Central Processing Unit)とメモリとを備え、画像処理装置1の各部を制御する。CPUは、メモリ又は記憶部18に記憶されたプログラムを実行する。メモリは、例えばROM(Read Only Memory)とRAM(Random Access Memory)とを備える。ROMは、予めプログラムやデータを記憶する。RAMは、プログラムやデータを一時的に記憶し、CPUがプログラムを実行する際の作業領域として用いられる。
通信部12は、通信回線に接続される通信用のインタフェースである。通信部12は、ユーザが使用する端末装置や他の画像処理装置(いずれも図示せず)と通信回線を介して通信を行う。操作部13は、例えばタッチパネルと各種のキーとを備え、ユーザの操作に応じた情報を制御部11に入力する。表示部14は、例えば液晶ディスプレイであり、各種の情報を表示する。
画像読取部15は、例えばイメージスキャナであり、原稿の画像を読み取って画像データを生成する。画像処理部16は、画像データに各種の画像処理を施す。画像処理部16は、例えばCPUとメモリにより構成される。画像形成部17は、画像データに応じた画像を用紙等のシートに形成する。画像形成部17は、電子写真方式により画像を形成してもよいし、その他の方式により画像を形成してもよい。記憶部18は、例えばハードディスクであり、制御部11により用いられる各種のプログラムやデータを記憶する。
図2は、画像処理部16の機能構成を示す図である。画像処理部16は、前処理部161と、抽出部162と、文字認識部163と、決定部164と、変換部165と、出力部166とを備える。これらの機能は、例えば画像処理部16のCPUが1又は複数のプログラムを実行することにより実現される。
前処理部161は、画像読取部15により生成された画像データに対して前処理を施す。この前処理には、例えば画像データの色空間を変換する処理や、背景のかぶり(本来白抜けとなるべき背景部分が黒くなる現象)を除去する処理が含まれる。
抽出部162は、前処理部161により前処理が施された画像データが表す画像から、この画像を構成する文字、表、図等の各要素の領域を抽出する。なお、ここでは、写真、絵及び図形は、いずれも図に含まれるものとする。
ここで、各要素の領域を抽出する方法の一例について説明する。画像に文字が含まれる場合には、例えば周辺分布の特徴に基づいて、文字領域が抽出される。この周辺分布は、例えば画像データを二値化し、解像度を低下させた後、黒画素の数をx軸方向及びy軸方向に投射することにより得られる。
図3は、文字領域の周辺分布の一例を示す図である。図3に示すように、文字領域には、文字列と行間とが交互に配置されるため、文字列方向(x軸方向)の周辺分布には、周期的に山と谷とが現れる。したがって、このような特徴を有する領域の外接矩形の位置座標を計算することにより、文字領域が抽出される。
画像に表又は図が含まれる場合には、例えば黒画素の連結成分の特徴に基づいて、表領域又は図領域が抽出される。この黒画素の連結成分は、例えば画像データを二値化し、解像度を低下させた後、黒画素の連結している部分を抽出することにより得られる。
図4は、表領域の連結成分の一例を示す図である。表領域は、文字領域より黒画素の連結成分が大きいという特徴がある。また、表領域の黒画素の連結成分は、図4に示すように、罫線で矩形枠が構成され、その矩形枠の中に孔が存在するような形状になる。したがって、このような特徴を有する領域の外接矩形の位置座標を計算することにより、表領域が抽出される。
図5は、図領域の連結成分の一例を示す図である。図領域は、文字領域より黒画素の連結成分が大きいという特徴がある。また、図領域の黒画素の連結成分は、図5に示すように、上述した表領域の黒画素の連結成分とは異なる形状を有する。したがって、このような特徴を有する領域の外接矩形の位置座標を計算することにより、図領域が抽出される。
文字認識部163は、抽出部162により抽出された領域に文字領域が含まれる場合には、この文字領域に対してOCR(Optical Character Recognition)等の文字認識処理を施す。また、文字認識部163は、文字認識処理により認識された文字の数、文字の大きさ、及び文字の位置を計算する。文字の大きさは、例えば各文字の外接矩形枠の大きさに基づいて計算される。文字の位置は、例えば各文字の座標位置を計算することにより得られる。
決定部164は、抽出部162によって抽出された各要素の領域の画像全体に占める割合、文字認識部163により施された文字認識処理の結果、及び入力された画像データが表す画像の色数に基づいて、画像データのファイル形式を決定する。各要素の領域の割合は、例えば各要素の領域の座標位置に基づいて各要素の領域の面積を計算し、画像全体の面積に対する各要素の領域の面積の割合を計算することにより得られる。文字認識処理の結果には、文字認識部163により計算された文字の数、文字の大きさ、文字の位置、文字認識部163により認識された文字が含まれる。画像の色数は、入力された画像データの各画素の色数を計算することにより得られる。
決定部164により決定されるファイル形式には、大きく分けて編集可能なファイル形式と編集が制限されるファイル形式とがある。編集可能なファイル形式としては、例えば文書用のファイル形式、表計算用のファイル形式、プレゼンテーション用のファイル形式がある。文書用のファイル形式とは、文書の編集や保存に適したファイル形式をいい、例えばWordファイルのファイル形式(.doc)である。表計算用のファイル形式とは、表計算に適したファイル形式をいい、例えばExcelファイルのファイル形式(.xls)である。プレゼンテーション用のファイル形式とは、プレゼンテーション用の資料の編集や保存に適したファイル形式をいい、例えばPowerPointファイルのファイル形式(.ppt)である。編集が制限されるファイル形式とは、編集を禁止することが可能なファイル形式をいい、例えばPDF(Portable Document Format)やSeachable PDF(以下、「S−PDF」という)である。このS−PDFとは、PDFの一種であり、検索が可能なファイル形式である。
例えば、決定部164は、ユーザによりファイル形式の変換を要する出力指示が入力された場合には、基本的には、画像データの内容に適した編集可能なファイル形式を決定する。ただし、決定部164は、ユーザにより出力データの用途として編集以外の用途が選択された場合、又は文字認識部163により認識された文字に、編集が禁止されていることを表す特定の文字が含まれている場合には、編集が制限されるファイル形式を決定する。これは、前者の場合には、編集可能なファイル形式に変換する必要がないからであり、後者の場合には、ユーザが、編集が禁止されている原稿を不正に編集しようとしていると考えられるため、このような不正な編集を防止するためである。
変換部165は、前処理部161により前処理が施された画像データを、決定部164により決定されたファイル形式のデータに変換する。このファイル形式の変換は、変換前の画像データの形式と変換後のデータのファイル形式とに応じて予め決められたアルゴリズムに従って行われる。ファイル形式を変換する方法としては、例えば特開2011−188293号公報に開示された方法を用いてもよい。出力部166は、変換部165により変換されたデータを出力する。
2.動作
画像処理装置1は、原稿の画像を画像読取部15で読み取って、コンピュータで処理可能なファイル形式のデータに変換して出力する変換出力処理を行う。図6は、変換出力処理を示すフローチャートである。まず、ユーザは、画像読取部15に原稿をセットし、操作部13を介して、ファイル形式の変換を要するスキャンの実行指示を入力する。このスキャンの実行指示が入力されると、ステップS101の処理が開始される。
ステップS101において、画像読取部15は、原稿の画像を読み取って画像データを生成する。画像読取部15により生成された画像データは、画像処理部16に入力される。なお、原稿が複数のページで構成される場合には、画像データは1ページずつ入力される。ステップS102において、前処理部161は、入力された画像データに対して前処理を施す。この前処理には、例えば画像データの色空間を変換する処理や、背景のかぶりを除去する処理が含まれる。
ステップS103において、決定部164は、ユーザにより出力データの用途として「編集」が選択されたか否かを判断する。例えば、操作部13を用いて「編集」以外の用途(例えば「閲覧」)を選択する操作が行われた場合には、ステップS104に進む。
ステップS104において、決定部164は、入力された画像データのファイル形式として、編集が制限される第1のファイル形式を決定する。この第1のファイル形式は、例えばPDFである。一方、操作部13を用いて「編集」という用途を選択する操作が行われた場合には、ステップS105に進む。
ステップS105において、抽出部162は、ステップS102で前処理が施された画像データが表す画像から、この画像を構成する各要素の領域を抽出する。例えば、図7(a)に示す画像20には、文字21が含まれている。この場合には、図3に示すような周辺分布の特徴に基づいて、文字21のかたまりである段落の外接矩形の座標位置を計算することにより、図7(b)に示すような文字領域22が抽出される。
図8(a)に示す画像30には、表31が含まれている。この場合には、図4に示すような連結成分の特徴に基づいて、表31の外接矩形の座標位置を計算することにより、図8(b)に示すような表領域32が抽出される。
図9(a)に示す画像40には、文字41及び42と図形43とが含まれている。この場合、まず図3に示すような周辺分布の特徴に基づいて、文字41のかたまりであるタイトル及び文字42のかたまりである段落の外接矩形の座標位置を計算することにより、図9(b)に示すような文字領域44及び45が抽出される。また、図5に示すような連結成分の特徴に基づいて、図形43の外接矩形の座標位置を計算することにより、図9(b)に示すような図領域46が抽出される。
ステップS106において、文字認識部163は、ステップS105で抽出された文字領域に文字認識処理を施すことにより、文字領域に含まれる文字を認識する。また、文字認識部163は、文字認識処理により認識された文字の数、文字の大きさ、及び文字の位置を計算する。
ステップS107において、決定部164は、ステップS106で認識された文字に、編集が禁止されていることを表す特定の文字が含まれるか否かを判断する。この特定の文字とは、例えば「改変禁止」のように、編集が禁止された原稿に付加される文字である。ステップS106で認識された文字に特定の文字が含まれる場合には、ステップS108に進む。
ステップS108において、決定部164は、入力された画像データのファイル形式として、編集が制限される第2のファイル形式を決定する。この第2のファイル形式は、例えばS−PDFである。一方、文字認識処理により認識された文字に特定の文字が含まれていない場合には、ステップS109に進む。
ステップS109において、決定部164は、入力された画像データの内容に適した編集可能なファイル形式を決定する。具体的には、決定部164は、まず画像全体に占める各要素の領域の割合と、入力された画像データが表す画像の色数とを計算する。続いて、決定部164は、計算により得られた各要素の領域の割合及び画像の色数と、ステップS106で計算された文字の数、文字の大きさ、文字の位置とに基づいて、画像データのファイル形式を決定する。
図10は、ファイル形式を決定する条件の一例を示す図である。図10に示す例では、文書用のファイル形式について、文字領域の割合が閾値T1より大きく、文字の数が閾値T2より多く、画像の色数が閾値T4以下であるという条件が定められている。これは、このような条件を満たす場合には、原稿が文書であると考えられるからである。また、表計算用のファイル形式について、表領域の割合が閾値T1より大きいという条件が定められている。これは、このような条件を満たす場合には、原稿が表であると考えられるからである。
また、プレゼンテーション用のファイル形式について、図領域の割合が閾値T1より大きいという条件と、文字の位置が画像の上方であり、この文字の大きさが閾値T3より大きく、画像の色数が閾値T4より多いという条件とが定められている。この上方の位置は、例えばプレゼンテーション用の資料のフォーマットにおいてタイトルが記載される位置座標に基づいて予め設定される。これは、このような条件のいずれかを満たす場合には、原稿がプレゼンテーション用の資料であると考えられるからである。
ここでは、領域の割合についての閾値T1が30%であり、文字の数についての閾値T2が500であり、文字の大きさについての閾値T3が20ポイントであり、色数についての閾値T4が2である場合を例に挙げて説明する。
図7に示す例では、画像20から文字領域22が抽出される。例えば、画像20全体に占める文字領域22の割合が70%であり、文字領域22に含まれる文字21の数が700であり、画像20の色数が2である場合には、文字領域22の割合が閾値T1「30%」より大きく、文字21の数が閾値T2「500」より多く、画像20の色数が閾値T4「2」以下であるため、文書用のファイル形式についての条件を満たす。したがって、画像データのファイル形式として、文書用のファイル形式が決定される。
図8に示す例では、画像30から表領域32が抽出される。例えば、画像30全体に占める表領域32の割合が70%である場合には、表領域32の割合が閾値T1「30%」より大きいため、表計算用のファイル形式についての条件を満たす。したがって、画像データのファイル形式として、表計算用のファイル形式が決定される。
図9に示す例では、画像40から文字領域44及び45と図領域46とが抽出される。例えば、文字領域44に含まれる文字41の位置が画像40の上方であり、この文字41の大きさが24ポイントであり、画像40の色数が5である場合には、文字41の位置が画像40の上方であり、この文字41の大きさが閾値T3「20ポイント」より大きく、画像40の色数が閾値T4「2」より多いため、プレゼンテーション用のファイル形式についての条件を満たす。したがって、画像データのファイル形式として、プレゼンテーション用のファイル形式が決定される。
なお、画像データが図10に示すいずれの条件も満たさない場合には、決定部164は、画像データのファイル形式として、予め設定されたファイル形式を決定する。
ステップS110において、変換部165は、ステップS102で前処理が施された画像データを、ステップS104、108又はS109で決定されたファイル形式のデータに変換する。図7に示す例では、ステップS109で文書用のファイル形式が決定されるため、画像データが文書用のファイル形式のデータに変換される。図8に示す例では、ステップS109で表計算用のファイル形式が決定されるため、画像データが表計算用のファイル形式のデータに変換される。図9に示す例では、ステップS109でプレゼンテーション用のファイル形式が決定されるため、画像データがプレゼンテーション用のファイル形式のデータに変換される。
なお、ステップS104で編集が制限される第1のファイル形式に決定された場合には、画像データがこの第1のファイル形式のデータに変換される。あるいは、ステップS108で編集が制限される第2のファイル形式が決定された場合には、画像データがこの第2のファイル形式のデータに変換される。
ステップS111において、出力部166は、変換部165により変換されたデータを出力する。例えば、ユーザにより出力先として端末装置が指定された場合には、出力部166は、指定された端末装置に通信部12を介してデータを送信する。出力されたデータのファイル形式が文書用のファイル形式、表計算用のファイル形式、プレゼンテーション用のファイル形式のように、編集可能なファイル形式である場合には、ユーザは、このデータを編集して利用してもよい。
従来、原稿の画像を画像読取部15で読み取って、コンピュータで処理可能なファイル形式のデータに変換して出力する場合には、ユーザが自ら適切なファイル形式を判断し、そのファイル形式を指定する操作を行う必要があった。しかし、上述した第1実施形態によれば、ユーザがこのような操作を行わなくても、文書の特徴を有する画像データは文書用のファイル形式のデータに変換され、表の特徴を有する画像データは表計算用のファイル形式のデータに変換され、プレゼンテーション用の資料の特徴を有する画像データはプレゼンテーション用のファイル形式のデータに変換される。つまり、第1実施形態によれば、入力された画像データが、その内容に応じたファイル形式の画像データに変換される。
また、第1実施形態によれば、画像に特定の文字が含まれる場合には、その画像を表す画像データが、編集が制限されるファイル形式のデータに変換される。これにより、特定の文字を含む画像を表すデータの編集が制限される。
[第2実施形態]
次に、本発明の第2実施形態について説明する。上述した第1実施形態では、ユーザによりファイル形式の変換を要するスキャンの実行指示が入力されたときに、画像読取部15を介して入力された画像データを、その内容に応じたファイル形式のデータに変換して出力する例について説明した。これに対し、第2実施形態では、変換部165によるファイル形式の変換を要しない出力指示が入力されたときに、画像読取部15を介して入力された画像データに対して、その画像の種別に対応する画質調整処理を施して出力する。第2実施形態に係る画像処理装置1の構成は、基本的には、第1実施形態で説明した構成と同じである。ただし、第2実施形態に係る画像処理部16は、第1実施形態に係る画像処理部16とは異なる機能構成を有する。以下、第1実施形態との相違点を中心に説明する。
図11は、第2実施形態に係る画像処理部16の機能構成を示す図である。画像処理部16は、第1実施形態で説明した機能構成に加えて、判別部167と、画質調整部168とを有する。判別部167及び画質調整部168は、変換部165によるファイル形式の変換を要しない出力指示が入力されたときに動作する。なお、決定部164及び変換部165は、このような出力指示が入力されたときは動作しない。
判別部167は、入力された画像データが表す画像の種別を判別する。具体的には、判別部167は、第1実施形態で説明した決定部164と同様に、まず画像全体に占める各要素の領域の割合と、入力された画像データが表す画像の色数とを計算する。続いて、判別部167は、計算により得られた各要素の領域の割合及び画像の色数と、文字認識部163で計算された文字の大きさとに基づいて、画像の種別を判別する。
図12は、画像の種別を判別する条件の一例を示す図である。図12に示す例では、「文字」という画像の種別について、文字領域の割合が閾値T11より大きいという条件と、文字領域の割合が閾値T11以下であり、文字の大きさが閾値T13より小さいという条件とが定められている。これは、このような条件のいずれかを満たす場合には、原稿の画像が文字画像であると考えられるからである。
また、「地図」という画像の種別について、図領域の割合が閾値T11より大きく、画像の色数が閾値範囲T14内であるという条件が定められている。これは、このような条件を満たす場合には、原稿の画像が地図画像であると考えられるからである。また、「写真」という画像の種別について、図領域の割合が閾値T11より大きく、画像の色数が閾値T15より多いことが定められている。これは、このような条件のいずれかを満たす場合には、原稿の画像が写真画像であると考えられるからである。
また、「文字と写真の混在」という画像の種別について、図領域の割合が閾値T12より大きく閾値T11以下であり、文字領域の割合が閾値T12より大きく閾値T11以下であるという条件が定められている。これは、このような条件を満たす場合には、原稿の画像が文字と写真の混在画像であると考えられるからである。
ここでは、領域の割合についての閾値T11が50%、閾値T12が30%であり、文字の大きさについての閾値T13が10ポイントであり、色数についての閾値範囲T14が12から24、閾値T15が24である場合を例に挙げて説明する。
図7に示す例では、画像20から文字領域22が抽出される。例えば、画像20全体に占める文字領域22の割合が70%である場合には、文字領域22の割合が閾値T11「50%」より大きいため、「文字」という画像の種別について定められた条件を満たす。したがって、「文字」という画像の種別が判別される。
図9に示す例では、画像40から文字領域44及び45と図領域46とが抽出される。例えば、画像40全体に占める文字領域45の割合が40%であり、図領域46の割合が40%である場合には、文字領域45の割合が閾値T12「30%」より大きく閾値T11「50%」以下であり、図領域46の割合が閾値T12「30%」より大きく閾値T11「50%」以下であるため、「文字と写真の混在」という画像の種別について定められた条件を満たす。したがって、「文字と写真の混在」という画像の種別が判別される。
画質調整部168は、前処理部161により前処理が施された画像データに対して、判別部167により判別された画像の種別に対応する画質調整処理を施す。この画像調整処理には、例えば空間フィルタ処理や階調補正が含まれる。
例えば、「文字」という画像の種別が判別された場合には、先鋭化フィルタを用いてエッジを強調する処理が施される。また、コントラストが高くなるように、図13(a)に示すような階調再現特性C1に基づいて階調補正が行われる。これにより、文字の輪郭がくっきりとし、文字が読み易くなる。
「地図」という画像の種別が判別された場合には、平滑化フィルタを用いてスムージング処理が施される。また、コントラストがあまり高くならないように、図13(b)に示すような階調再現特性C2に基づいて階調補正が行われる。これにより、モアレが抑制される。
「写真」という画像の種別が判別された場合には、平滑化フィルタを用いてスムージング処理が施される。また、コントラストがあまり高くならないように、図13(b)に示すような階調再現特性C2に基づいて階調補正が行われる。これにより、モアレが抑制される。
「文字と写真の混在」という画像の種別が判別された場合には、文字領域に対しては、先鋭化フィルタを用いてエッジを強調する処理が施されるとともに、コントラストが高くなるように、図13(a)に示すような階調再現特性C1に基づいて階調補正が行われる。これにより、文字領域においては、文字の輪郭がくっきりとし、文字が読み易くなる。一方、図領域に対しては、平滑化フィルタを用いてスムージング処理が施されるとともに、コントラストがあまり高くならないように、図13(b)に示すような階調再現特性C2に基づいて階調補正が行われる。これにより、図領域においてはモアレが抑制される。
なお、判別部167により「文字」、「地図」、「写真」、「文字と写真の混在」のいずれの画像の種別も判別されなかった場合、画質調整部168は、画像データに対して予め設定された画質調整処理を施す。
出力部166は、ユーザにより変換部165によるファイル形式の変換を要しない出力指示が入力された場合には、画質調整部168により画質調整処理が施された画像データを出力する。この出力指示は、例えばコピーの実行指示、ファクシミリの送信指示、変換部165によるファイル形式の変換を要しないスキャンの実行指示である。
例えば、操作部13を介してコピーの実行指示が入力された場合には、出力部166は、画質調整部168により画質調整処理が施された画像データを画像形成部17に出力する。このとき、制御部11は、画像処理部16により計算された画像の色数に基づいてカラーモードを選択し、選択したカラーモードに応じた画像を画像形成部17に形成させる。例えば、画像の色数が2である場合には、モノクロモードが選択される。この場合、画像形成部17では、白黒の画像が形成される。画像の色数が3である場合には、3色モードが選択される。この場合、画像形成部17では、3色の画像が形成される。画像の色数が3より大きい場合には、フルカラーモードが選択される。この場合、画像形成部17では、カラーの画像が形成される。
操作部13を介してファクシミリの送信指示が入力された場合には、出力部166は、画質調整部168により画質調整処理が施された画像データを、通信部12を介してファクシミリで送信する。
操作部13を介して変換部165によるファイル形式の変換を要しないスキャンの実行指示が入力された場合には、出力部166は、画質調整部168により画質調整処理が施された画像データを記憶部18に出力する。これにより、記憶部18において画像データが記憶される。
従来、出力画像の種別に適した画質の画像を形成するためには、ユーザが自ら原稿の画像の種別を判断し、画像の種別を指定する操作を行う必要があった。しかし、上述した第2実施形態によれば、ユーザがこのような操作を行わなくても、入力された画像データに対して、その画像の種別に対応する画質調整処理が施されるため、出力画像の画質が向上する。
[変形例]
上述した第1実施形態及び第2実施形態は、本発明の一例である。これらの実施形態は、以下のように変形してもよい。また、以下の変形例は、互いに組み合わせてもよい。
(1)上述した第1実施形態及び第2実施形態において、抽出部162は、図領域からさらに設計図面等の図面を含む図面領域を抽出してもよい。具体的には、抽出部162は、例えば画像の濃淡の変化を解析することにより、図面領域を抽出する。この場合、決定部164は、画像全体に占める図面領域の割合が閾値より大きい場合には、図面ファイルのファイル形式を決定してもよい。この図面ファイルのファイル形式とは、図面ファイルの編集や保存に適したファイル形式をいい、例えばCAD(computer aided design)図面のファイル形式である。
(2)上述した第1実施形態では、画像データの内容によっては、複数のファイル形式が決定される場合がある。この場合には、予め決められた方法により単一のファイル形式が決定されてもよい。
例えば、予め各々のファイル形式に設定された優先順位に基づいて、単一のファイル形式が決定されてもよい。ここでは、プレゼンテーション用のファイル形式の優先順位が1であり、文書用のファイル形式の優先順位が2であり、表計算用のファイル形式の優先順位が3である例を挙げて説明する。例えば、図10に示すプレゼンテーション用のファイル形式を決定する条件と、表計算用のファイル形式を決定する条件とが両方とも満たされる場合には、プレゼンテーション用のファイル形式の優先順位「1」が表計算用のファイル形式の優先順位「3」より高いため、プレゼンテーション用のファイル形式が決定される。
または、ユーザの選択に従って、単一のファイル形式が選択されてもよい。例えば、プレゼンテーション用のファイル形式を決定する条件と、表計算用のファイル形式を決定する条件とが両方とも満たされる場合には、これらのファイル形式の情報が表示部14に表示される。このとき、例えば操作部13を用いて表計算用のファイル形式が選択する操作が行われた場合には、表計算用のファイル形式が決定される。
第2実施形態で説明した画像の種別の判別についても、同様に、複数の画像の種別が判別される場合には、予め決められた方法で単一の画像の種別が決定されてもよい。
(3)上述した第1実施形態において、原稿が複数のページで構成される場合には、ページによって異なるファイル形式が決定される場合がある。この場合には、各々のファイル形式が決定されたページ数に基づいて、単一のファイル形式が決定されてもよい。例えば、プレゼンテーション用のファイル形式が決定されたページ数が9であり、表計算用のファイル形式が決定されたページ数が1である場合には、ページ数の多いプレゼンテーション用のファイル形式が決定される。または、変形例(2)で説明したように、予め各々のファイル形式に設定された優先順位に基づいて、単一のファイル形式が決定されてもよい。
(4)上述した第1実施形態において、第2実施形態のように画像の種別に対応する画像調整処理を施した後、画像データのファイル形式を変換してもよい。この場合、画像処理部16は、第2実施形態で説明した判別部167及び画質調整部168を有する。変換部165は、画質調整部168により画像調整処理が施された画像データを決定部164により決定されたファイル形式のデータに変換する。
(5)上述した第1実施形態において、ファイル形式を決定する条件は、図10に示す条件に限定されない。例えば、図10に示す例では、画像の色数についての条件が含まれているが、必ずしも画像の色数についての条件が含まれなくてもよい。また、図10に示す例では、プレゼンテーション用のファイル形式について、文字の位置が画像の上方であるという条件が定められているが、この条件に含まれる文字の位置は、画像の上方に限定されない。例えば、プレゼンテーション用の資料のフォーマットにおいて、画像の真ん中にタイトルが記載される場合には、文字の位置が画像の真ん中であるという条件であってもよい。
つまり、文書用のファイル形式を決定する条件は、少なくとも画像全体に占める文字領域の割合又は文字認識処理の結果が、文書らしい特徴を有するような条件であればよい。同様に、表計算用のファイル形式を決定する条件は、少なくとも画像全体に占める表領域の割合が、表らしい特徴を有するような条件であればよい。プレゼンテーション用のファイル形式を決定する条件は、少なくとも画像全体に占める図領域の割合又は文字認識処理の結果が、プレゼンテーションの資料らしい特徴を有するような条件であればよい。
(6)上述した第2実施形態において、画像の種別を判別する条件は、図12に示す条件に限定されない。例えば、図12に示す例では、画像の色数についての条件が含まれているが、必ずしも画像の色数についての条件が含まれなくてもよい。また、図12に示す例では、文字認識部163で計算された文字の数及び文字の位置についての条件が含まれていなかったが、これらの条件が含まれてもよい。さらに、図12に示す条件に加えて、画像解析により得られる画像の濃淡の変化についての条件が含まれてもよい。これは、例えば「地図」という画像の種別を判別する条件として有効である。
つまり、「文字」という画像の種別を判別する条件は、少なくとも画像全体に占める文字領域の割合、文字認識処理の結果又は画像の色数が、文字画像らしい特徴を有するような条件であればよい。同様に、「地図」という画像の種別を判別する条件は、少なくとも画像全体に占める図領域の割合が、地図画像らしい特徴を有するような条件であればよい。「写真」という画像の種別を判別する条件は、少なくとも画像全体に占める図領域の割合が、写真画像らしい特徴を有するような条件であればよい。「文字と写真の混合」という画像の種別を判別する条件は、少なくとも画像全体に占める文字領域の割合又は文字認識処理の結果が、文字と写真の混合画像らしい特徴を有するような条件であればよい。
(7)上述した第1実施形態及び第2実施形態では、周辺分布の特徴又は黒画素の連結成分の特徴に基づいて、各要素の領域を抽出する例について説明した。しかし、各要素の領域を抽出する方法は、これに限定されない。各要素の領域は、周知の他の方法により抽出されてもよい。
(8)上述した第2実施形態では、画質調整処理には、空間フィルタ処理や階調補正が含まれる例について説明した。しかし、画質調整処理は、空間フィルタ処理及び階調補正に限定されない。例えば、画質調整処理において、画像の種別に対応する中間調処理が施されてもよい。
(9)上述した第1実施形態及び第2実施形態で説明した文書用のファイル形式は、Wordファイルのファイル形式に限定されない。文書用のファイル形式は、文書の編集や保存に適したファイル形式であれば、Wordファイルのファイル形式以外のファイル形式であってもよい。同様に、表計算用のファイル形式は、Excelファイルのファイル形式に限定されない。表計算用のファイル形式は、表計算に適したファイル形式であれば、Excelファイルのファイル形式以外のファイル形式であってもよい。プレゼンテーション用のファイル形式も、PowerPointファイルのファイル形式に限定されない。プレゼンテーション用のファイル形式は、プレゼンテーション用の資料の編集や保存に適したファイル形式であれば、PowerPointファイルのファイル形式以外のファイル形式であってもよい。
また、編集が制限されるファイル形式は、PDFやS−PDFに限定されない。編集が制限されるファイル形式は、編集を禁止する機能を有していれば、PDFやS−PDF以外のファイル形式であってもよい。
(10)上述した第1実施形態及び第2実施形態では、画像処理部16がCPUとメモリにより構成される例について説明した。しかし、画像処理部16は、ASIC(application specific integrated circuit)を用いて構成されてもよい。この場合、画像処理部16の一部又は全ての機能構成がASICにより実現されてもよい。
(11)上述した第1実施形態及び第2実施形態において、画像処理部16において実行されるプログラムは、インターネットなどの通信回線を介してダウンロードされてもよい。また、このプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供されてもよい。
1…画像処理装置、11…制御部、12…通信部、13…操作部、14…表示部、15…画像読取部、16…画像処理部、17…画像形成部、18…記憶部、161…前処理部、162…抽出部、163…文字認識部、164…決定部、165…変換部、166…出力部、167…判別部、168…画質調整部。

Claims (10)

  1. 入力された画像データが表す、複数のページにより構成される原稿の画像から当該画像を構成する各要素の領域を抽出する抽出部と、
    前記抽出部により抽出された前記領域に文字領域が含まれる場合には、当該文字領域に対して文字認識処理を施す文字認識部と、
    前記複数のページの各々について、前記抽出部により当該ページから抽出された各々の前記領域の当該ページ全体に占める割合及び当該ページに含まれる前記文字領域に対して前記文字認識部により施された前記文字認識処理の結果に応じて、ファイル形式を決定する第1決定部と、
    前記第1決定部により各ファイル形式が決定されたページの総数を計数し、前記計数された総数が最も多いファイル形式を決定する第2決定部と、
    前記入力された画像データを前記第2決定部により決定された前記ファイル形式のデータに変換する変換部と、
    前記変換部により変換された前記データを出力する出力部と
    を備える画像処理装置。
  2. 前記文字認識部は、前記文字認識処理により認識された文字の数を計算し、
    前記第1決定部は、前記ページ全体に占める前記文字領域の割合が閾値より大きく、且つ、前記文字認識部により計算された前記文字の数が閾値より多い場合には、前記ファイル形式として文書用のファイル形式を決定する
    請求項1に記載の画像処理装置。
  3. 前記文字認識部は、前記文字認識処理により認識された文字の大きさ及び位置を計算し、
    前記第1決定部は、前記文字認識部により計算された前記文字の位置が予め設定された位置であり、前記文字認識部により計算された当該文字の大きさが閾値より大きい場合には、前記ファイル形式としてプレゼンテーション用のファイル形式を決定する
    請求項1又は2に記載の画像処理装置。
  4. 前記第1決定部は、前記割合、前記文字認識処理の結果及び前記画像の色数に応じて、前記ファイル形式を決定する
    請求項1から3のいずれか1項に記載の画像処理装置。
  5. 前記抽出部により抽出された前記領域には、図領域が含まれ、
    前記第1決定部は、前記ページ全体に占める前記図領域の割合が閾値より大きい場合には、前記ファイル形式としてプレゼンテーション用のファイル形式を決定する
    請求項1から4のいずれか1項に記載の画像処理装置。
  6. 前記抽出部により抽出された前記領域には、表領域が含まれ、
    前記第1決定部は、前記ページ全体に占める前記表領域の割合が閾値より大きい場合には、前記ファイル形式として表計算用のファイル形式を決定する
    請求項1から5のいずれか1項に記載の画像処理装置。
  7. 前記第1決定部は、前記文字認識処理により認識された文字に特定の文字が含まれる場合には、前記ファイル形式として編集が制限されるファイル形式を決定する
    請求項1から6のいずれか1項に記載の画像処理装置。
  8. 前記割合及び前記文字認識処理の結果に応じて、前記画像の種別を判別する判別部と、
    前記入力された画像データに対して、前記判別部により判別された前記画像の種別に対応する画質調整処理を施す画質調整部とをさらに備え、
    前記出力部は、前記変換部によるファイル形式の変換を要しない出力指示が入力された場合には、前記画質調整部により前記画質調整処理が施された前記画像データを出力する
    請求項1から7のいずれか1項に記載の画像処理装置。
  9. 前記出力部により出力された前記画像データに応じた画像を形成する画像形成部をさらに備える
    請求項8に記載の画像処理装置。
  10. コンピュータに、
    入力された画像データが表す、複数のページにより構成される原稿の画像を構成する各要素の領域を抽出するステップと、
    前記抽出された領域に文字領域が含まれる場合には、当該文字領域に対して文字認識処理を施すステップと、
    前記複数のページの各々について、当該ページから抽出された各々の前記領域の当該ページ全体に占める割合及び当該ページに含まれる前記文字領域に対して施された前記文字認識処理の結果に応じて、ファイル形式を決定する第1決定ステップと、
    前記第1決定ステップにおいて各ファイル形式が決定されたページの総数を計数し、前記計数された総数が最も多いファイル形式を決定する第2決定ステップと、
    前記入力された画像データを前記第2決定ステップにおいて決定された前記ファイル形式のデータに変換するステップと、
    前記変換されたデータを出力するステップと
    を実行させるためのプログラム。
JP2013122150A 2013-06-10 2013-06-10 画像処理装置及びプログラム Active JP6191256B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013122150A JP6191256B2 (ja) 2013-06-10 2013-06-10 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013122150A JP6191256B2 (ja) 2013-06-10 2013-06-10 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014238787A JP2014238787A (ja) 2014-12-18
JP6191256B2 true JP6191256B2 (ja) 2017-09-06

Family

ID=52135877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013122150A Active JP6191256B2 (ja) 2013-06-10 2013-06-10 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6191256B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6874673B2 (ja) * 2017-12-26 2021-05-19 京セラドキュメントソリューションズ株式会社 画像処理装置
JP7074171B2 (ja) * 2020-09-17 2022-05-24 株式会社リコー 画像処理装置、画像投影装置、および画像処理方法
JP2023128907A (ja) 2022-03-04 2023-09-14 シャープ株式会社 画像処理装置および画像処理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4135659B2 (ja) * 2004-03-09 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 フォーマット変換装置およびファイル検索装置
JP5020698B2 (ja) * 2007-05-09 2012-09-05 キヤノン株式会社 画像処理装置、画像処理方法、画像処理プログラム

Also Published As

Publication number Publication date
JP2014238787A (ja) 2014-12-18

Similar Documents

Publication Publication Date Title
JP5274495B2 (ja) 文書画像サイズ変更方法
US8386957B2 (en) Method for dynamically scaling an original background layout
JP4483909B2 (ja) 翻訳装置及びプログラム
US20110113323A1 (en) Systems and methods to resize document content
EP2270714A2 (en) Image processing device and image processing method
JP2003132358A (ja) 画像処理方法、装置およびシステム
JP5042917B2 (ja) 画像処理装置およびプログラム
JP6191256B2 (ja) 画像処理装置及びプログラム
JP5920293B2 (ja) 画像処理装置及びプログラム
US9489603B2 (en) Image processing apparatus, image processing method, and storage medium that determine whether a white character exists inside a graphics object and convert density information accordingly
JP7483471B2 (ja) 画像処理装置、画像処理方法ならびにプログラム
US20150278661A1 (en) Image processing apparatus
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
KR101945581B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
JP2004120092A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
US9277074B2 (en) Image processing apparatus, method, and medium determining whether image data of a page to be processed is blank and contains a foreground object and transmitting the foreground object obtained by removing a background object
JP5046243B2 (ja) 画像処理装置、画像処理方法、およびプログラム
US20190007582A1 (en) Information processing apparatus, information processing method, and storage medium
JP4165408B2 (ja) 画像形成装置及び画像形成プログラム
US20100171969A1 (en) Preventing artifacts that may be produced when bottling pdl files converted from raster images
JP5884509B2 (ja) 画像処理装置、画像読取装置およびプログラム
JP3997696B2 (ja) 画像処理のための装置、方法及び記録媒体
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP5233739B2 (ja) 画像処理装置、画像読取装置及び画像形成装置
JP4911585B2 (ja) 画像処理装置、画像処理方法、プログラム及び情報記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170724

R150 Certificate of patent or registration of utility model

Ref document number: 6191256

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350