JP4569162B2 - 画像処理方法、画像処理プログラムおよび画像処理装置 - Google Patents

画像処理方法、画像処理プログラムおよび画像処理装置 Download PDF

Info

Publication number
JP4569162B2
JP4569162B2 JP2004135334A JP2004135334A JP4569162B2 JP 4569162 B2 JP4569162 B2 JP 4569162B2 JP 2004135334 A JP2004135334 A JP 2004135334A JP 2004135334 A JP2004135334 A JP 2004135334A JP 4569162 B2 JP4569162 B2 JP 4569162B2
Authority
JP
Japan
Prior art keywords
image
region
character
image processing
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004135334A
Other languages
English (en)
Other versions
JP2005316813A (ja
Inventor
俊浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2004135334A priority Critical patent/JP4569162B2/ja
Publication of JP2005316813A publication Critical patent/JP2005316813A/ja
Application granted granted Critical
Publication of JP4569162B2 publication Critical patent/JP4569162B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、画像処理装置で実行される画像処理方法、画像処理プログラムおよび当該画像処理装置に関し、特に処理画像に属性を付加する技術に関する。
近年、書類をペーパで管理するのではなく、スキャナーで当該書類の画像を読み込んで画像データファイルを生成して管理するシステム(以下、「ファイリングシステム」という。)が普及しつつある。これによれば、ペーパー上で書類を管理する必要がないので、収納スペースの低減や省資源化に資する。
このようなファイリングシステムとして、例えばイメージデータをPDF(Portable Document Format)ファイルへ変換する手法がしばしば利用されている。
PDFファイルは、イメージデータをその領域の種類(文字、写真等)に応じた圧縮処理を施すことができるので、極めて効率的にデータ量を低減でき、保存する記憶装置の記憶容量を節約できる。その上、ファイルごとに当該ファイルの名称や内容などのデータをプロパティとして入力することにより、ファイル検索が容易に行えるという利点もある。
特開2003−338934号公報
しかしながら、ファイル検索のために、現状ではファイルごとにその書類のプロパティを手入力しなければならないので、大変手間である。
本発明は、上記の問題点に鑑みてなされたものであって、ファイル検索を容易に行うことが可能な画像処理方法、画像処理プログラムおよび画像処理装置を提供することを目的としている。
上記目的を達成するため、本発明に係る画像処理方法は、入力画像に対して、当該画像における各画素データが、少なくとも文字領域と写真領域のいずれの領域に属するかの領域判別を行う第1ステップと、前記第1ステップにおける領域判別の結果に基づき、各画素データに対し、その属する領域の種類に応じた画像処理を行う第2ステップと、前記第1ステップにおいて判別された領域の内、少なくとも前記文字領域と前記写真領域について、各領域の位置関係もしくは各領域ごとの特性を含む領域特徴情報に基づき、当該入力画像の属性情報を生成する第3ステップとを含む処理を実行し、前記第3ステップにおいて、前記領域特徴情報に含まれる各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として算出し、異なる複数の画像種類ごとに、当該画像種類に対して予め決められた前記各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として示す基本特徴量と、前記算出された画像特徴量とを、対応する項目ごとに比較し、画像種類ごとに、前記比較結果に応じて当該入力画像が前記異なる複数の画像種類の内のどの種類に属している蓋然性が高いのかを示す適合度を重み付けして、重み付けした適合度を、それぞれの画像種類に対応する属性情報とすることを特徴とする。
また、前記第2ステップで画像処理された入力画像をファイル出力すると共に、前記第3ステップで得られた入力画像の属性情報を当該ファイルに付加する第4のステップとを含む処理を実行することを特徴とする。
さらに、前記各領域ごとの特性には、当該領域において使用されている色の数、網点画像の割合、文字のサイズ、文字領域に使用される罫線の量の少なくとも一つが含まれることを特徴とする。
た、前記複数の画像種類には、新聞画像、カタログ画像、表画像、文書画像、プレゼンテーション用画像のうち少なくとも2つが含まれることを特徴とする。
さらに、前記第3ステップにおいて、前記複数の画像種類のそれぞれに対して、それぞれの画像種類に対応付けて管理されている当該画像種類の画像作成に用いられたと推定されるアプリケーションの種類を対応付けた情報を、さらに、前記属性情報に含めることを特徴とする。
さらに、前記入力画像の属性情報には、入力画像において各種類の領域の占める割合に関する情報、各種類の領域の相対的位置に関する情報のうち少なくともどちらかの情報が含まれることを特徴とする。
本発明に係る画像処理プログラムは、入力画像に対して、当該画像における各画素データが、少なくとも文字領域と写真領域のいずれの領域に属するかの領域判別を行う第1の処理と、前記第1ステップにおける領域判別の結果に基づき、各画素データに対し、その属する領域の種類に応じた画像処理を行う第2の処理と、前記第1ステップにおいて判別された領域の内、少なくとも前記文字領域と前記写真領域について、各領域の位置関係もしくは各領域ごとの特性を含む領域特徴情報に基づき、当該入力画像の属性情報を生成する第3の処理とを画像処理装置に実行させ、前記第3の処理において、前記領域特徴情報に含まれる各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として算出し、異なる複数の画像種類ごとに、当該画像種類に対して予め決められた前記各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として示す基本特徴量と、前記算出された画像特徴量とを、対応する項目ごとに比較し、画像種類ごとに、前記比較結果に応じて当該入力画像が前記異なる複数の画像種類の内のどの種類に属している蓋然性が高いのかを示す適合度を重み付けして、重み付けした適合度を、それぞれの画像種類に対応する属性情報とすることを特徴とする。
さらに、前記第2の処理で画像処理された入力画像をファイル出力すると共に、前記第3の処理で得られた入力画像の属性情報を当該ファイルに付加する第4の処理を画像処理装置に実行させることを特徴とする。
本発明に係る画像処理装置は、入力画像に対して、当該画像における各画素データが、少なくとも文字領域と写真領域のいずれの領域に属するかの領域判別を行う領域判別手段と、前記領域判別手段における領域判別の結果に基づき、各画素データに対し、その属する領域の種類に応じた画像処理を行う画像処理手段と、前記領域判別手段において判別された領域の内、少なくとも前記文字領域と前記写真領域について、各領域の位置関係もしくは各領域ごとの特性を含む領域特徴情報に基づき、当該入力画像の属性情報を生成する特徴情報生成手段とを備え、前記特徴情報生成手段は、前記領域特徴情報に含まれる各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として算出し、異なる複数の画像種類ごとに、当該画像種類に対して予め決められた前記各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として示す基本特徴量と、前記算出された画像特徴量とを、対応する項目ごとに比較し、画像種類ごとに、前記比較結果に応じて当該入力画像が前記異なる複数の画像種類の内のどの種類に属している蓋然性が高いのかを示す適合度を重み付けして、重み付けした適合度を、それぞれの画像種類に対応する属性情報とすることを特徴とする。
このように、判別された領域について、各領域の位置関係もしくは各領域ごとの特性を含む領域特徴情報に基づき当該入力画像の属性情報が生成されるので、生成された属性情報を検索条件として用いることにより、ユーザは、従来のようにいちいち検索条件を手入力するといった手間が一切なくなり大変便利になる。
以下、本発明の実施の形態について図面を参照しながら説明する。
(1)画像処理システムの構成
図1は、本発明に係る画像処理装置を含む画像処理システム(以下、「システム」と略する。)の全体構成を示す図である。
同図に示すように、本システムは、画像処理装置1と、画像処理装置1とデータのやりとりが可能に接続された画像読取装置2、外部記憶装置3および画像出力装置4から構成されている。
画像読取装置2は、原稿画像を1頁単位で読み取って画像データを得る公知の装置であり、読み取って得られた画像データを画像処理装置1に送る。
画像処理装置1は、パーソナルコンピュータからなり、画像読取装置2から画像データを受信すると、原稿1頁ごとに、当該原稿画像に含まれる文字画像と文字以外の写真等の画像の領域判別を行い、その判別結果に基づいて当該原稿を検索するために用いられる属性情報(後述)を作成すると共に、判別された文字画像と文字以外の画像(背景画像)を抽出し、抽出した文字画像の各画素のデータをMMR(Modified Modified READ)を用いて圧縮し、背景画像の各画素のデータをJPEG(Joint Photographic Experts Group)を用いて圧縮して、圧縮データをPDFファイルに変換し、上記属性情報を付加した上で個別のファイル名を付けて、外部記憶装置3に送る処理を実行する。
外部記憶装置3は、ハードディスクドライブを有し、画像処理装置1から送信されて来るデータを受信すると、それらをハードディスクドライブに格納する。
画像出力装置4は、画像処理装置1からの印刷指示を受けると、指示されたファイル名のデータを外部記憶装置3から読み出して、読み出したデータに基づいて用紙に印刷する公知の画像形成装置である。
図2は、本システムにおいてPDFファイルが格納されるまでの処理フローの概要を示す図である。
同図に示すように、ステップS1では、画像読取装置2において読み取られた画像データが画像処理装置1に送られる。この画像データとしては、例えばTIFF、JPEGまたはBMPとすることができ、その他のフォーマットの画像データであっても良い。
ステップS2では、画像処理装置1において、領域判別の前処理が実行される。この前処理は、入力画像の領域判別をより精度良く行うための処理であり、具体的には解像度変換(高から低へ)、下地除去等の公知の処理である。
ステップS3では、文字と写真等の画像の領域判別が行われる。そして、判別された領域の特徴量が抽出され、抽出された特徴量に基づいて属性情報が作成される。
ステップS4では、判別結果に基づいて入力画像から文字画像が抽出され、抽出された文字画像がMMRにより圧縮される。
ステップS5では、判別結果に基づいて入力画像から背景画像が抽出され、抽出された背景画像がJPEGにより圧縮される。
ステップS6では、圧縮された文字画像と背景画像とがPDF化されて合成される。その際、ステップS3で作成された属性情報が付加され、PDFファイルとして出力される。
ステップS7では、出力されるPDFファイルが、外部記憶装置3に格納される。
このように、領域判別により判別された領域ごとの圧縮を行う場合に、その領域判別結果を利用して属性情報を作成するので、検索のための属性情報の作成を合理的に行うことができる。
(2)画像処理装置1の構成
図3は、画像処理装置1の機能構成を示すブロック図である。
同図に示すように、画像処理装置1は、制御部100、入力装置200および表示装置300を備えている。
入力装置200は、キーボード、マウス等を含むものであり、ユーザからのキー入力等を受付け、それを制御部100に伝える。
表示装置300は、ディスプレイからなり、制御部100からの表示指示に基づく画面を表示させる。
制御部100は、主な構成要素としてインターフェース(I/F)部101、画像前処理部102、領域判別部103、属性判別部104、圧縮部105、PDFファイル作成部106、I/F部107、108、CPU109、RAM110およびROM111を備えており、それぞれがバス120を介して接続されデータのやりとりが可能になっている。
I/F部101は、画像読取装置2に接続するためのインターフェースであり、画像読取装置2からの画像データを画像前処理部102に送る。
画像前処理部102は、I/F部101からの画像データに上記の前処理を施し、前処理されたデータを領域判別部103に送る。
領域判別部103は、画像前処理102からのデータに基づいて文字領域と写真領域を判別する領域判別処理を実行する。
属性判別部104は、判別された領域について、当該領域の特性(使用されている色の数、文字サイズ、罫線や網点の割合等)を抽出する特徴量抽出処理と、抽出された特性に基づいて当該入力画像の属性情報(当該入力画像が文書、表、カタログ等の画像種類の内のどの種類に属する蓋然性が高いのかを示す適合度)を作成する属性情報作成処理を実行する。
圧縮部105は、領域判別により判別された文字領域内の文字画像の各画素のデータをMMRを用いて圧縮し、文字以外の背景画像の各画素のデータをJPEGを用いて圧縮する。
PDFファイル作成部106は、圧縮されたデータを公知のPDFフォーマットに変換し、変換したファイルに上記属性情報を付加してI/F部107に送る。
I/F部107は、外部記憶装置3に接続するためのインターフェースであり、PDFファイル作成部106からのデータを外部記憶装置3に送信する。
I/F部108は、画像出力装置4に接続するためのインターフェースである。
CPU109は、ROM111に格納されているプログラムを読み出して、画像処理装置1の全体の動作を統一的に制御する。また、入力装置200からの入力情報に基づく処理を実行すると共に表示装置300の表示制御を行って必要な画面を表示させる。
さらに、画像前処理部102、領域判別部103等に指示して、画像読取装置2からの入力画像をPDF変換して外部記憶装置3に出力するまでの一連の処理(PDF変換処理)を実行する。
ROM111には、PDF変換処理等を実行するためのプログラムが格納されている。また、図8に示す文書、表、カタログ等の各種画像についての特徴量の大小関係を示した基本特徴量テーブル112(内容は、後述)が格納されている。
RAM110は、CPU109が各種プログラムを実行する際のワークエリアとなる。
(3)PDF変換処理
図4は、PDF変換処理の内容を示すフローチャートである。
同図に示すように、CPU109は、ユーザからのPDF変換指示を受付けると、スキャン画像取得処理(ステップS10)を実行する。
このスキャン画像取得処理は、画像読取装置2からの画像データをI/F部101を介して取得する処理である。なお、取得された画像データは、そのまま入力画像としてRAM110内の所定の格納領域に格納される。以下、各処理において、画像のr(赤)、g(緑)、b(青)色の画素データを用いる場合は、このRAM110内に格納されたデータが読み出されるものとする。
次に、領域判別処理(ステップS20)を実行する。ここでは、まず画像前処理部102に指示して、取得された画像データに上記所定の前処理を施させた後、領域判別部103に指示して、前処理された入力画像に基づく領域判別処理を実行させる。
図5は、領域判別処理のサブルーチンの内容を示すフローチャートであり、写真領域判別としてのステップS201〜S204と、文字領域判別としてのステップS205〜S213の処理が実行される。
同図に示すように、写真領域判別では、まず明度算出処理を行う(ステップS201)。具体的には、例えば入力画像をカラーの画像データとすると、原稿1頁分の画像の各画素について、そのr、g、b色の画素データ(256階調)を公知の変換式を用いて明度データに変換する。
次に、生成された明度データに公知のスムージングフィルタをかけて、入力画像に含まれているノイズを除去するスムージング処理を実行する(ステップS202)。
そして、スムージング処理が施されたデータに基づいて写真ブロックの検出を行う(ステップS203)。ここでは、ノイズ除去されたデータについて所定の閾値を用いて2値化を行う。そして、2値化画像に対し画素を連結させてラベリングを行い、ラベリングされた画像それぞれについて、写真領域であるか否かを判別する。
例えば、ブロックの大きさが所定の大きさ(文字相当程度の大きさ)よりも大きく、そのブロック内の各画素の明度、彩度、色相等の特徴、例えば中間調の画素が所定の割合以上含まれている場合等の所定の条件を満たす場合に写真領域と判別される。当該所定の条件を満たしていないブロックについては、写真領域とみなされない。なお、ここで写真領域として判定される領域には、写真の他、絵画、図表など階調性を有する画像の領域が含まれるものである。また、各画素の彩度、色相等については、RAM110に格納されている入力画像のデータが参照される。
そして、写真領域であると判別された各ブロックについて、そのブロック(写真領域)を取り囲む矩形領域の座標のデータをRAM110に格納させる(ステップS204)。
一方、文字領域判別では、まず入力画像を明度データに変換する明度算出処理を行う(ステップS205)。この処理は、基本的に上記ステップS201の処理と同じであるが、明度データの変換式では文字判別のためのパラメータが用いられる点が異なっている。
次に、明度データにスムージングフィルタをかけてノイズを除去するスムージング処理を行う(ステップS206)。このスムージングも基本的に上記ステップS202の処理と同じであるが、文字判別に適したフィルタが用いられる点が異なっている。
そして、スムージング処理が施されたデータに公知のエッジフィルタをかけ2値のエッジ画像を生成する2値化処理を行う(ステップS207)。
生成された2値のエッジ画像に含まれる罫線を検出する処理を行う(ステップS208)。具体的には罫線検出のための公知のフィルタをかけて当該エッジ画像内に含まれる罫線を検出する。そして、検出された罫線の量(ここでは、前処理された入力画像の全画素数をA、罫線画像の画素数Bとして、B/A)を算出し(ステップS209)、算出されたデータをRAM110に格納して、検出された罫線を削除する(ステップS210)。この罫線削除は、文字判定精度を高めるためである。
罫線削除された2値のエッジ画像について、主走査方向、副走査方向に所定の範囲内にあるものを連結し、連結されたブロックを取り囲んだ矩形領域を設定する文字ブロック検出処理を行う(ステップS211)。
そして、設定された文字ブロックの画像が文字であるか否かを判定する文字判定処理を行う(ステップS212)。例えば、文字ブロック内の画像について、その局所的な形状を特徴量として抽出し、抽出した特徴量からその画像が文字によるものであるか否かを判定する。より具体的には、画像の局所的な形状として、カーブ量や傾斜方向、閉ループ数、十字交差数、T字交差数等を抽出し、抽出された特徴点が、予め保持している文字判定のためのパターンの特徴点と一致している数が所定値(閾値)以上であれば、文字として判定し、所定値よりも少なければ文字ではないと判定するものである。なお、文字判定には、他にも文字判定用の辞書に基づいてパターン認識を行う方法等を用いることが出来る。
ステップS213では、文字と判定されたブロック(文字領域)の座標データをRAM110に格納させる。
次に、文字領域内に含まれる網点領域を検出する処理を実行する(ステップS214)。この網点検出は、例えば文字領域内の画素に公知の網点検出用フィルタをかけ、所定範囲内の孤立点数が所定数を上回った場合に、その範囲を網点領域とすることにより行われる。
検出された網点領域から、当該網点の量(ここでは、文字領域内の全画素数をC、網点領域の画素数をDとして、D/C)を算出し(ステップS215)、算出されたデータをRAM110に格納した後、網点領域内に散在している点画像を除去する(ステップS216)。
続いて、網点除去された文字領域内の各画素を所定の閾値を用いて2値化して文字領域内の文字画像と文字以外の部分(下地)を分離する処理を行う(ステップS217)。
そして、2値化により分離された文字画像を構成する各画素の座標(以下、「文字マップ」という。)のデータと、下地部分の座標のデータをRAM110に格納させる(ステップ218)。
ステップS219では、文字色数の算出処理を行い、その後メインルーチンにリターンする。この文字色数の算出としては、例えば文字マップから文字を構成する画素を特定し、特定された各画素について、r、g、b色の画素データを色相を現すデータに変換し、所定の閾値との比較により、予め決められた複数色(黒、青、赤、黄、白色等)の内のどの色に属するのかを求め、その数(黒色の画素数、青色の画素数等)を計数することで行われる。なお、算出されたデータは、RAM110に格納される。
なお、上記文字等の領域判別方法については、上記のものに限られることはなく、他の公知の方法を用いることができる。
図4に戻って、ステップS30では、属性判別部104に指示して、特徴量抽出処理を実行させる。
図6は、特徴量抽出処理のサブルーチンの内容を示すフローチャートである。
同図に示すように、文字サイズの算出処理を行う(ステップS31)。文字サイズの算出としては、例えば文字マップを参照し、文字画像それぞれについて、当該文字の高さ方向に相当する方向に並ぶ画素数を計数し、その画素数から当該文字の大きさ(ポイント)を検出することで行われる。ここでは、文字の中で最も大きなポイント数を示すデータがRAM110に格納される。
次に、下地領域の量の算出処理を行う(ステップS32)。ここで、下地領域とは、文字領域内における下地であって、下地が白色以外のもの(例えば、新聞の文字領域内の背景に相当)をいう。
下地領域の量の算出方法としては、例えば上記ステップS218において格納された下地の座標のデータを参照し、入力画像のr、g、b色の画素データから、当該下地であって、白色以外の画素を抽出し、抽出された画素数をEとし、さらにE/Cの値を算出し、この値を下地領域の量とすることにより行われる。算出されたデータは、RAM110に格納される。
そして、画像の色数の算出処理を行う(ステップS33)。この処理は、上記ステップS219の文字色数の算出処理と同様の処理であり、ここでは写真領域と判定された画像の画素を特定し、特定された各画素のr、g、b色の画素データから、画素ごとに、上記複数色の内のどの色に属するのかを求め、その数を計数する処理である。なお、算出されたデータは、RAM110に格納される。
ステップS34では、位置関係検出処理を行って、メインルーチンにリターンする。この位置関係検出処理は、入力画像における文字領域の配置位置と写真領域の配置位置の関係から入力画像の特性を検出するものである。
図7は、文字領域と写真領域の位置関係の具体例を示す図である。
図7(a)、図7(b)は、文字領域と写真領域が重なることなく並置されている例であって、表中心、文書中心の画像に多いパターンである。
図7(c)は、文字領域(破線で示す矩形領域)と写真領域が重なっている場合の例である。なお、上記のように文字領域は、2値のエッジ画像について隣接するもの同士が主走査方向、副走査方向において所定の範囲内にある場合には、それらが連結されて矩形領域が設定されるため、文字の配置によっては、同図の例のように破線で示す範囲が文字領域として設定されることがある。
同図では、文字領域と写真領域が重なっているが、文字領域と写真領域の右上の角部の位置が一致しており、文字画像と写真画像が並置された構成になっている。
図7(d)は、文字領域内に2つの写真領域が重なっている場合の例であるが、文字領域と写真領域の角部の位置が一致しており、文字と写真が並置された構成になっている。
一方、図7(e)は、文字領域内に一つの写真領域が重なっている場合の例であり、雑誌やカタログの画像に多いパターンである。文字領域と写真領域の角部の位置が一致しておらず、写真画像が文字領域に四方から取り囲まれた配置になっており、図7(c)、図7(d)に比べて複雑な構成になっている。
位置関係検出処理では、文字領域と写真領域の座標値を参照し、文字領域内に含まれる写真領域の数が0または1であり、文字領域と写真領域が重なっていても角部の位置が一致している場合には、当該入力画像について位置関係に基づく複雑度を「小」(図7(a)〜(c)に相当)、文字領域内に含まれる写真領域の数が2または3であり、文字領域と写真領域の角部の位置が一致している場合には「中」(図7(d)に相当)、それ以外には、「大」(図7(e)に相当)として、そのデータをRAM110に格納する。
図4に戻って、特徴量抽出処理(ステップS30)が終了すると、属性情報作成処理(ステップS40)を実行させる。
属性情報作成処理は、領域判別処理および特徴量抽出処理において抽出された特徴量、すなわち罫線の量、網点の量、文字サイズ、文字色数、下地の量、画像色数、複雑度を示すデータをRAM110から読み出す。そして、読み出した特徴量と、ROM111に格納されている基本特徴量テーブル112の内容を比較して、入力画像がどの画像種類に適合しているのかを示す適合度を算出する。
図8は、基本特徴量テーブル112の内容例を示す図である。
同図に示すように、基本特徴量テーブル112には、画像の種類を示す項目として、表中心の原稿画像、文書中心の原稿画像、プレゼンテーション画像(グラフ、図形、色文字等を含むプレゼンテーション資料として用いられる画像)、雑誌/カタログ画像、新聞画像の欄が設けられ、画像の特徴を示す項目として、罫線量、文字サイズ、文字色数、画像色数、網点量、下地量、位置(複雑度)の欄が設けられており、各画像について、項目ごとに特徴量の大小関係が予め決められている。
例えば、罫線量の場合、表中心の原稿画像が「多」、文書中心の原稿画像が「中」、プレゼンテーション画像、雑誌/カタログ画像、新聞画像が「少」となっている。これは、表中心の原稿画像には通常罫線が大変多く、文書中心の原稿画像には一部に表が組み込まれていることがあり、プレゼンテーション画像、雑誌/カタログ画像、新聞画像には使用されることが少ないと考えられるからであり、この関係を相対評価したものである。
文字サイズについては、プレゼンテーション画像で大きな文字が使用される蓋然性が高いことから、プレゼンテーション画像が「大」、新聞画像は小さな文字が使用されるので「小」、その他は「中」とされている。
文字色数については、プレゼンテーション画像では多彩な色が使用されることが多く、逆に他の画像ではそれほど多くの色が使用されないことを考慮して、プレゼンテーション画像が「多」、その他は「少」とされている。
画像色数については、雑誌やカタログで多彩な色が使用されることが多いことから、雑誌/カタログ画像が「多」になっている。
網点量については、新聞が最も多いことから、新聞画像が「多」になっている。
下地量については、新聞が最も多いことから、新聞画像が「多」になっている。
位置(複雑度)については、雑誌やカタログで文字と写真が複雑な位置関係で配置されることが最も多いと考えられ、雑誌/カタログ画像が複雑度「大」になっている。
上記読み出された入力画像の特徴量は、位置(複雑度)以外のものが数値データで示されているため、入力画像の特徴量も、基本特徴量テーブル112の大、中、小に合わせて所定の閾値を用いて大(多)、中、小(少)の3段階に分類され、その分類結果がRAM110内に設けられた入力画像特徴量テーブル113に書き込まれる。
図9は、3段階に分類された入力画像の特徴量を示す入力画像特徴量テーブル113の内容例を示す図である。
同図に示すように、入力画像特徴量テーブル113は、画像の特徴量について基本特徴量テーブル112と同じ項目が設けられている。
図9に示す特徴量と、図8に示す表中心の原稿の画像特徴量とを項目ごとに比較し、内容が同じ(例えば、両方とも「多」)であれば、当該項目についての適合度として0.95の重み付けをし、1段階ずれると(例えば、一方が「多」、他方が「中」)であれば、0.8の重み付けをし、2段階ずれると(例えば、一方が「多」、他方が「少」)であれば、0.6の重み付けをして、全項目の重みを乗算したものを適合度とする。
表中心の原稿画像の場合、罫線量、文字サイズ、画像色数、網点量、下地量、位置(複雑度)については、重み0.95、文字色数については、重み0.8になり、乗算すると、入力画像が表中心の原稿画像である適合度は、0.95×0.95×0.8×0.95×0.95×0.95×0.95=0.6(60%)になる。
同様に、文書中心の原稿画像の場合では、文字サイズ、画像色数、網点量、下地量、位置(複雑度)については、重み0.95、罫線量、文字色数については、重み0.8になり、入力画像が文書中心の原稿画像である適合度は、0.8×0.95×0.8×0.95×0.95×0.95×0.95=0.5(50%)になる。
同様に他の画像種類も計算すると、入力画像がプレゼンテーション画像である適合度は、0.18(18%)、雑誌/カタログ画像である適合度は、0.10(10%)、新聞画像である適合度は、0.12(12%)になる。これより、入力画像は、表中心の原稿画像である蓋然性が最も高いことがわかる。なお、重みの値については、上記のものに限られることはなく、適合度算出に最適と想定される値が実験等から求められる。算出された適合度を示すデータは、PDFファイル作成部106に送られる。
図4に戻って、属性情報作成処理(ステップS40)が終了すると、圧縮部105に指示して画像圧縮処理(ステップS50)を実行させる。
この画像圧縮処理では、RAM110から文字マップを読み出して、入力画像中の文字画像の座標値を取得し、入力画像から文字画像だけを抽出して、抽出された文字画像の各画素のデータをMMRを用いて圧縮する。また、入力画像から文字以外の背景画像(写真、下地等)を抽出し、抽出された画像の各画素のデータをJPEGを用いて圧縮する処理が実行される。圧縮された文字画像ファイル、背景画像ファイルは、PDFファイル作成部106に送られる。
画像圧縮処理(ステップS50)が終了すると、PDFファイル作成部106に指示してPDFファイル作成処理(ステップS60)を実行させる。
PDFファイル作成処理では、画像圧縮処理において圧縮された文字画像ファイル、背景画像ファイルをPDFフォーマットに変換し、変換後のファイルに、属性情報作成処理において算出された適合度を示すデータを関連付けたPDFファイルを作成する。
図10は、作成されたPDFファイルの構造例を示す図である。
同図に示すように、PDFファイルは、文字画像と背景画像のレイヤーと、属性情報を示すレイヤーからなる。属性情報を示すレイヤーは、画像種類ごとに分けられており、レイヤーごとに、算出された適合度を示すデータ、そのデータの貼り付け位置、サイズ、色(ここでは透明)を示す情報が含まれている。
作成されたPDFファイルは、I/F部107を介して外部記憶装置3に送信され、これによりPDF変換処理が終了する。
以上説明したように、本実施の形態では、入力画像から文字と背景画像を抽出し、それぞれ別々の圧縮処理を行ってPDFファイルを作成する構成において、文字領域と写真領域を判別し、判別された各領域について画像の特徴量を抽出し、抽出された特徴量に基づいて入力画像がどの種類の画像に適合しているのかを示す適合度を算出し、これを属性情報としてPDFファイルに含めるようにしている。
したがって、属性情報に含まれる「適合率」を検索条件として用いれば、例えば「表」中心の原稿画像からなるファイルを検索したい場合、その適合率60%以上のものを検索条件とすることにより、「表」を含む蓋然性が高いファイルを検索することが可能になり、大量のファイルを管理する場合であっても、ユーザは、従来のようにいちいち検索条件をファイル毎に手入力するといった手間が一切なくなり大変便利になる。
なお、本発明は、画像処理装置に限られず、上記属性情報を作成する画像処理方法であるとしても良い。また、その方法をコンピュータが実行するプログラムであるとしてもよい。また、本発明に係るプログラムは、例えば磁気テープ、フレキシブルディスク等の磁気ディスク、DVD、CD−ROM、CD−R、MO、PDなどの光記録媒体、Smart Media(登録商標)などのフラッシュメモリ系記録媒体等、コンピュータ読み取り可能な各種記録媒体に記録することが可能であり、当該記録媒体の形態で生産、譲渡等がなされる場合もあるし、プログラムの形態でインターネットを含む有線、無線の各種ネットワーク、放送、電気通信回線、衛星通信等を介して伝送、供給される場合もある。
また、本発明に係るプログラムは、上記に説明した処理をコンピュータに実行させるための全てのモジュールを含んでいる必要はなく、例えば通信プログラムやオペレーティングシステム(OS)に含まれるプログラムなど、別途情報処理装置にインストールすることができる各種汎用的なプログラムを利用して、本発明の各処理をコンピュータに実行させるようにしても良い。従って、上記した本発明の記録媒体に必ずしも上記全てのモジュールを記録している必要はないし、また必ずしも全てのモジュールを伝送する必要もない。さらに所定の処理を専用ハードウェアを利用して実行させるようにすることができる場合もある。
(変形例)
以上、本発明を実施の形態に基づいて説明してきたが、本発明は、上述の実施の形態に限定されないのは勿論であり、以下のような変形例が考えられる。
(1)上記実施の形態では、属性情報作成処理において適合度を算出し、これを入力画像の属性情報としたが、本発明の属性情報は、入力画像の検索条件として用いることが可能なものであれば良く、その意味で上記適合度に限定されることはない。
例えば、図8の基本特徴量テーブル112と図9の入力画像特徴量テーブル113において、特徴量が一致する項目の数が最も多い原稿種類を当該入力画像の属性とすることができる。図8、9の例では、一致数が6個になる「表中心の原稿画像」が入力画像の属性ということになり、入力画像が表中心の原稿画像であることを示すデータが属性情報としてPDFファイルに付加されることになる。この場合、重み付けや乗算処理自体が不要になり、CPUの負担を減らすことができる。なお、一致数が次に多い画像種類を属性情報に付加するとしても良い。
また、画像種類と、画像作成に用いられたと推定されるアプリケーションソフトウェアとを対応付けて管理し、入力画像の属性情報に当該アプリケーションの種類をも含める構成とすることもできる。例えば、表中心の原稿画像に対し「表計算ソフト」、文書中心の原稿画像に対し「ワードプロセッサ」、プレゼンテーション画像に対し「プレゼンテーションソフト」等とするものである。これにより、ユーザは、アプリケーションの種類をも検索条件に加えることが可能になる。
(2)上記実施の形態では、基本特徴量テーブル112に7項目の画像特徴量を設けるとしたが、もちろん上記7項目に限られることはなく、それよりも多い、または少ない項目に基づいて属性情報を作成するとしても良い。追加する項目として、例えば入力画像1ページに対する写真領域の量を考えることができる。雑誌、カタログ等には、写真が多く含まれ、表、文書中心の原稿には極めて少ないと推定されることから、基本特徴テーブル112に、雑誌/カタログ画像に対し「多」、プレゼンテーション画像、新聞画像に対し「中」、表、文書中心の原稿画像に対し「少」とすることができる。
また、1項目、例えば罫線量だけを用いるとすることも可能である。その場合でも、入力画像が「表中心」である蓋然性が高い、低いという情報を得ることはでき、表中心原稿画像を検索する条件として用いることができる。また、同様に画像種類についても上記のもの(表中心、文書中心等)に限られることもない。
(3)また、基本特徴量テーブル112を用いない構成、例えば入力画像特徴量テーブル113の情報を属性情報として用いることも可能である。さらに、抽出された画像特徴量(罫線量、網点量等の算出値)そのものを属性情報として用いるとしても良い。
(4)上記実施の形態では、領域判別処理において、文字、写真領域を矩形領域としたが、領域判別としては文字画像(文字を構成する画素)だけを文字領域、写真画像だけを写真領域として判別するとしても良い。文字画像だけを文字領域として判別しても、文字サイズ、文字色等の特徴量を得ることが可能である。
また、上記実施の形態では、文字領域と写真領域を判別するとしたが、領域判別としては、これらに加えて別の領域、例えば文字、写真のいずれにも属さない下地領域も判別し、当該下地領域の量、色数等を特徴量として抽出するとしても良い。ビジネス関係の表、文書中心の画像では下地がもっぱら白色であることが多いが、新聞画像、プレゼンテーション画像等では白以外の色が用いられている場合が多く、画像の一の特徴を表すものといえるからである。このような判別を用いる場合、例えば各領域を別の圧縮方法を用いて圧縮することもできる。写真と下地とで圧縮率を変えた方がさらなる高圧縮の効果を得ることができる場合があるからである。
(5)上記実施の形態では、PDFファイルを作成する場合の例を説明したが、本発明はPDFに限定されることはなく、例えば領域毎に色変換を行ったり、下地色を付けるなどのカラー画像処理や、領域毎に画像を切り出して領域別DB(データベース)に保存させるなど領域判別された各領域について、その領域に応じた画像処理を実行する場合に、各領域の画像特徴量を抽出し、抽出された特徴量に基づいて入力画像の属性情報を作成するとしても良い。
本発明に係る画像処理方法、画像処理プログラムおよび画像処理装置は、処理後の画像に検索条件となる属性情報を付加することで検索を容易にする技術として有用である。
画像処理システムの全体構成を示す図である。 画像処理システムにおいてPDFファイルが格納されるまでの処理フローの概要を示す図である。 画像処理装置1の機能構成を示すブロック図である。 PDF変換処理の内容を示すフローチャートである。 PDF変換処理の領域判別処理のサブルーチンの内容を示すフローチャートである。 PDF変換処理の特徴量抽出処理のサブルーチンの内容を示すフローチャートである。 文字領域と写真領域の位置関係の具体例を示す図である。 基本特徴量テーブル112の内容例を示す図である。 入力画像特徴量テーブル113の内容例を示す図である。 作成されたPDFファイルの構造例を示す図である。
符号の説明
1 画像処理装置
100 制御部
103 領域判別部
104 属性判別部
105 圧縮部
106 PDFファイル作成部
112 基本特徴量テーブル
113 入力画像特徴量テーブル

Claims (9)

  1. 入力画像に対して、当該画像における各画素データが、少なくとも文字領域と写真領域のいずれの領域に属するかの領域判別を行う第1ステップと、
    前記第1ステップにおける領域判別の結果に基づき、各画素データに対し、その属する領域の種類に応じた画像処理を行う第2ステップと、
    前記第1ステップにおいて判別された領域の内、少なくとも前記文字領域と前記写真領域について、各領域の位置関係もしくは各領域ごとの特性を含む領域特徴情報に基づき、当該入力画像の属性情報を生成する第3ステップと
    を含む処理を実行し、
    前記第3ステップにおいて、前記領域特徴情報に含まれる各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として算出し、
    異なる複数の画像種類ごとに、当該画像種類に対して予め決められた前記各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として示す基本特徴量と、前記算出された画像特徴量とを、対応する項目ごとに比較し、
    画像種類ごとに、前記比較結果に応じて当該入力画像が前記異なる複数の画像種類の内のどの種類に属している蓋然性が高いのかを示す適合度を重み付けして、重み付けした適合度を、それぞれの画像種類に対応する属性情報とすることを特徴とする画像処理方法。
  2. 前記第2ステップで画像処理された入力画像をファイル出力すると共に、前記第3ステップで得られた入力画像の属性情報を当該ファイルに付加する第4のステップとを含む処理を実行することを特徴とする請求項1記載の画像処理方法。
  3. 前記各領域ごとの特性には、当該領域において使用されている色の数、網点画像の割合、文字のサイズ、文字領域に使用される罫線の量の少なくとも一つが含まれることを特徴とする請求項1または2に記載の画像処理方法。
  4. 前記複数の画像種類には、新聞画像、カタログ画像、表画像、文書画像、プレゼンテーション用画像のうち少なくとも2つが含まれることを特徴とする請求項1から3のいずれか1項に記載の画像処理方法。
  5. 前記第3ステップにおいて、
    前記複数の画像種類のそれぞれに対して、それぞれの画像種類に対応付けて管理されている当該画像種類の画像作成に用いられたと推定されるアプリケーションの種類を対応付けた情報を、さらに、前記属性情報に含めることを特徴とする請求項1から3のいずれか1項に記載の画像処理方法。
  6. 前記入力画像の属性情報には、入力画像において各種類の領域の占める割合に関する情報、各種類の領域の相対的位置に関する情報のうち少なくともどちらかの情報が含まれることを特徴とする請求項2に記載の画像処理方法。
  7. 入力画像に対して、当該画像における各画素データが、少なくとも文字領域と写真領域のいずれの領域に属するかの領域判別を行う第1の処理と、
    前記第1ステップにおける領域判別の結果に基づき、各画素データに対し、その属する領域の種類に応じた画像処理を行う第2の処理と、
    前記第1ステップにおいて判別された領域の内、少なくとも前記文字領域と前記写真領域について、各領域の位置関係もしくは各領域ごとの特性を含む領域特徴情報に基づき、当該入力画像の属性情報を生成する第3の処理と
    を画像処理装置に実行させ、
    前記第3の処理において、前記領域特徴情報に含まれる各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として算出し、
    異なる複数の画像種類ごとに、当該画像種類に対して予め決められた前記各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として示す基本特徴量と、前記算出された画像特徴量とを、対応する項目ごとに比較し、
    画像種類ごとに、前記比較結果に応じて当該入力画像が前記異なる複数の画像種類の内のどの種類に属している蓋然性が高いのかを示す適合度を重み付けして、重み付けした適合度を、それぞれの画像種類に対応する属性情報とすることを特徴とする画像処理プログラム。
  8. さらに、前記第2の処理で画像処理された入力画像をファイル出力すると共に、前記第3の処理で得られた入力画像の属性情報を当該ファイルに付加する第4の処理を画像処理装置に実行させることを特徴とする請求項7に記載の画像処理プログラム。
  9. 入力画像に対して、当該画像における各画素データが、少なくとも文字領域と写真領域のいずれの領域に属するかの領域判別を行う領域判別手段と、
    前記領域判別手段における領域判別の結果に基づき、各画素データに対し、その属する領域の種類に応じた画像処理を行う画像処理手段と、
    前記領域判別手段において判別された領域の内、少なくとも前記文字領域と前記写真領域について、各領域の位置関係もしくは各領域ごとの特性を含む領域特徴情報に基づき、当該入力画像の属性情報を生成する特徴情報生成手段と
    を備え、
    前記特徴情報生成手段は、前記領域特徴情報に含まれる各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として算出し、
    異なる複数の画像種類ごとに、当該画像種類に対して予め決められた前記各領域の位置関係もしくは各領域ごとの特性を項目別に画像の特徴量として示す基本特徴量と、前記算出された画像特徴量とを、対応する項目ごとに比較し、
    画像種類ごとに、前記比較結果に応じて当該入力画像が前記異なる複数の画像種類の内のどの種類に属している蓋然性が高いのかを示す適合度を重み付けして、重み付けした適合度を、それぞれの画像種類に対応する属性情報とすることを特徴とする画像処理装置。
JP2004135334A 2004-04-30 2004-04-30 画像処理方法、画像処理プログラムおよび画像処理装置 Expired - Fee Related JP4569162B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004135334A JP4569162B2 (ja) 2004-04-30 2004-04-30 画像処理方法、画像処理プログラムおよび画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004135334A JP4569162B2 (ja) 2004-04-30 2004-04-30 画像処理方法、画像処理プログラムおよび画像処理装置

Publications (2)

Publication Number Publication Date
JP2005316813A JP2005316813A (ja) 2005-11-10
JP4569162B2 true JP4569162B2 (ja) 2010-10-27

Family

ID=35444152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004135334A Expired - Fee Related JP4569162B2 (ja) 2004-04-30 2004-04-30 画像処理方法、画像処理プログラムおよび画像処理装置

Country Status (1)

Country Link
JP (1) JP4569162B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4731303B2 (ja) * 2005-12-09 2011-07-20 株式会社ソニー・コンピュータエンタテインメント 画像表示装置、画像表示方法、プログラム及び情報記憶媒体
JP4329764B2 (ja) 2006-01-17 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および罫線抽出プログラム
JP4424309B2 (ja) 2006-01-23 2010-03-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字判定プログラム、および文字判定方法
JP4089736B2 (ja) 2006-05-26 2008-05-28 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP4135752B2 (ja) 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001319231A (ja) * 2000-05-09 2001-11-16 Canon Inc 画像処理装置及び画像処理方法、記録媒体
JP2004363786A (ja) * 2003-06-03 2004-12-24 Canon Inc 画像処理装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011459A (ja) * 1996-06-25 1998-01-16 N T T Data Tsushin Kk 文書登録システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001319231A (ja) * 2000-05-09 2001-11-16 Canon Inc 画像処理装置及び画像処理方法、記録媒体
JP2004363786A (ja) * 2003-06-03 2004-12-24 Canon Inc 画像処理装置

Also Published As

Publication number Publication date
JP2005316813A (ja) 2005-11-10

Similar Documents

Publication Publication Date Title
JP4960897B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
US7272269B2 (en) Image processing apparatus and method therefor
US7860266B2 (en) Image processing system and image processing method
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US7545992B2 (en) Image processing system and image processing method
US7640269B2 (en) Image processing system and image processing method
US20130114099A1 (en) Image processing system and image processing method
US20090284780A1 (en) Image processing apparatus, control method therefor, and program
US20070076984A1 (en) Electronic document creating apparatus
US20060008113A1 (en) Image processing system and image processing method
US7596271B2 (en) Image processing system and image processing method
US7421124B2 (en) Image processing system and image processing method
JP4502385B2 (ja) 画像処理装置およびその制御方法
US7133559B2 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
US20060274081A1 (en) Image retrieving apparatus, image retrieving method, program, and storage medium
JP4708888B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US7126612B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP4859054B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP6607490B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
JP2004363786A (ja) 画像処理装置
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2000295468A (ja) 画像処理装置
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100713

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100726

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130820

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees