JP4960897B2 - 画像処理装置、画像処理方法、プログラム、記憶媒体 - Google Patents

画像処理装置、画像処理方法、プログラム、記憶媒体 Download PDF

Info

Publication number
JP4960897B2
JP4960897B2 JP2008019724A JP2008019724A JP4960897B2 JP 4960897 B2 JP4960897 B2 JP 4960897B2 JP 2008019724 A JP2008019724 A JP 2008019724A JP 2008019724 A JP2008019724 A JP 2008019724A JP 4960897 B2 JP4960897 B2 JP 4960897B2
Authority
JP
Japan
Prior art keywords
pixel
image data
color
area
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008019724A
Other languages
English (en)
Other versions
JP2009182662A (ja
Inventor
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008019724A priority Critical patent/JP4960897B2/ja
Priority to US12/356,586 priority patent/US8218863B2/en
Publication of JP2009182662A publication Critical patent/JP2009182662A/ja
Application granted granted Critical
Publication of JP4960897B2 publication Critical patent/JP4960897B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像データから所定の画素値情報を抽出する画像処理装置等であって、特に、記号領域を排除して図又は写真を形成する画素の画素値情報を再利用可能な態様で抽出する画像処理装置、画像処理方法、プログラム及び記憶媒体に関する。
図や写真を含む文書を新規に作成する場合、すでに作成された文書に含まれる写真や図を再利用することができれば便利である。この場合、ユーザは作成されている文書をスキャナで読み取って画像データを生成したり記憶されている画像データを読み出して、PC(パーソナルコンピュータ)で実現される画像操作ツールなどを利用し、必要な領域をマウスで指定して切り出して、同じPCで作成中の新規の文書に貼り付けるという操作を行うことになる。
このような作業では、画像データから候補となる写真や図領域が自動的に切り出されていると、ユーザがPCを操作して領域を指定する必要がなく便利であり、かかる要求やOCR処理の精度向上等のため、図や写真を含む画像データから図や写真を形成する画素の位置(領域)を特定する技術が提案されている(例えば、特許文献1〜5参照。)
特許文献1には、文字の画像データか写真の画像データかを区分する画像判別装置が記載されている。特許文献1記載の画像判別装置は、画像データのエッジを取得し、エッジを画像データの縦方向に射影した投影ヒストグラムを作り、投影ヒストグラムとこれを平滑化して作成した平滑ヒストグラムとの差分を求め、差分が大きい領域を文字領域と判定する。
特許文献2は、写真抽出を行う方法が記載されている。まず、背景色を求め、背景色以外の画素の連結成分を求めて写真領域の候補領域とする。この、背景色以外の画素のうち、同色とみなせる画素をグループ化した候補領域の外接矩形を求め、外接矩形の数及び重なり方から写真領域を決定する。
また、特許文献3には、背景色から写真領域を特定し、写真領域以外からOCR処理する方法が記載されている。特許文献3では、所定画素数のブロック毎に代表色を求め、代表色をクラスタリングして最大のクラスタを背景色と決定する。そして背景色以外の画素を連結したラン(矩形)を生成し、矩形の形状や大きさ等に応じて文字の領域、罫線、図・写真等の領域を特定する。
また、特許文献4には、背景模様などの小さな構成要素が多数含まれた文書画像から文字を抽出する方法が記載されている。まず、画像データを二値化してその連結成分の外接矩形を求める。そして、外接矩形のサイズのヒストグラムから文字サイズを推定し、外接矩形の密集度などを参考に文字の領域とそれ以外とに分離する。
また、特許文献5には、文字と写真領域を高精度に分離する方法が提案されている。画像縮小変換を施した後に離散的コサイン変換処理を行い、離散的コサイン変換係数から文字と写真を特徴づける係数の統計的性質からブロック毎に文字と写真領域に分離する。
特開2006−128987号公報 特開2004−110434号公報 特開2001−297303号公報 特開2002−015323号公報 特開平06−339019号公報
しかしながら、特許文献1の方法は、文字の領域と図や写真の画像領域とが既に別々に切り出されていたり、元から別々の画像データ(ファイル)であることを前提としている方法であるため、文字と図や写真とが1つの文書に混在した画像データに対し自動で切り出す方法は開示されていない。
また、特許文献2、3では背景色を決定して、文字領域や写真領域を切り分けるため、背景色の特定が不十分であると画像データから写真領域等の切り出しが適切に実行できない。特許文献2、3では背景色を例えば用紙の色、一色であると想定しているため、背景色が用紙色のみであればそれ以外の部分を抽出できる。しかし、例えば、写真領域毎に異なる背景色が適用されるなど背景色が2色以上ある場合、本来は背景色として特定されるべき領域を抽出することが困難になる。また、背景色にグラデーション(すなわち多色)が施されている場合、写真領域の抽出が不安定になる。
また、特許文献4では文字の抽出はできるが、カラーの画像データでは文字以外の領域が単色とは限らないので、文字以外の領域が二値化で黒画素になるとは限らない。したがって、必ずしも文字以外の領域がひとかたまりとはならず、写真領域や図をひとかたまりの領域として抽出することはできない。
また、特許文献5では高周波成分と低周波成分のバランスで判断しているため、線画の抽出をする際には分布が似ている文字と区別ができない。
本発明は、上記課題に鑑み、画像データから写真や図を形成する画素の画素値情報を抽出する画像処理装置において、背景がグラデーションの場合など2色以上であっても、写真や図を安定して抽出できる画像処理装置、画像処理方法、プログラム及び記憶媒体を提供することを目的とする。また、微少な画素のブロック毎又は周波数成分に基づき写真や図と文字を区別するのでなく、文字と線図を切り分けて抽出可能な画像処理装置、画像処理方法、プログラム及び記憶媒体を提供することを目的とする。
上記課題に鑑み、本発明は、カラーの画像データから図又は写真を形成する図写真画素の画素値情報を抽出する画像処理装置であって、画像データの画素値を、画像データ全体の色数よりも少ない複数の色の代表画素値に置き換える画素値置き換え手段と、同じ色の代表画素値が連続した候補領域を特定し、各色別に前記候補領域を抽出する候補領域抽出手段と、前記候補領域毎に記号を形成する画素が含まれる程度を示す特徴量を取得する特徴量取得手段と、前記特徴量に基づき記号が含まれる前記候補領域は前記図写真画素を有さないと判定する特徴量判定手段と、前記図写真画素を有すると判定された前記候補領域であって、一部又は全部が重畳する前記候補領域を統合する統合手段と、を有することを特徴とする。
本発明によれば、画像データの画素値を画素値に応じて複数の代表画素値に置き換え、同じ代表画素値を有する領域毎に文字を含む領域を排除するので、背景色が2色以上あっても図や写真領域を安定して抽出することができる。
また、本発明の一形態において、代表色で置き換える前の画像データからエッジ情報を検出するエッジ検出手段を有し、候補領域抽出手段は、エッジ情報が連続した候補領域を抽出する、ことを特徴とする。
本発明によれば、クラスタ色を多くする必要がなくなるので、計算負荷を大きくすることなく、色数が多い画像やグレー画像から安定して図や写真領域を抽出することができる。
画像データから写真や図を抽出する画像処理装置において、背景がグラデーションの場合など2色以上であっても、写真や図を安定して抽出できる画像処理装置、画像処理方法、プログラム及び記憶媒体を提供することができる。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
〔第1の実施形態〕
図1は、本実施形態の画像処理装置100のブロック図を示す。画像処理装置100は画像取得手段11が取得した画像データから写真や図を形成する画素の画素値情報を再利用可能な単位で抽出する。図や写真とは、文字以外をいい例えば表も含まれる。以下、再利用可能な単位の図、写真及び表を単に図・写真要素という。
本実施形態の画像処理装置100は、
・背景色を決定することなく、色クラスタリング処理により画像データを数色(例えば4〜数十色)に減色する。
・減色後の画像データから同じクラスタ色の連結領域を抽出する。
・減色後の画像データから所定のクラスタ色の領域とその他の色の領域を、減色後の全てのクラスタ色毎に抽出する
・領域の例えば外接矩形を設定し、その領域の複数の特徴量を取得することで、図又は写真領域を決定する。
・図又は写真領域を統合することで、写真領域や図をひとかたまりの領域として抽出する。
すなわち、クラスタ色ごとに領域を抽出するので、背景色が2色以上あっても図や写真領域を安定して抽出することができる。また、複数の特徴量に基づき図又は写真領域を決定するので、文字と線図を切り分けて抽出することができる。
画像処理装置100は、例えばスキャナ装置、複写機、ファクシミリ装置、及び、これらの機能を備えたMFP(Multi Function Printer)、又は、これらの装置と接続されたPC(パーソナルコンピュータ)40である。
画像取得手段11は、例えばスキャナ装置、デジタルカメラ等、原稿をデジタルの画像データに変換する装置であるが、画像処理装置100をPCで構成する場合は既に変換された画像データを、ネットワークを介して受信するNIC(Network Interface Card)としてもよい。
例えば、スキャナ装置の場合、主走査方向に一次元のCCDやCMOSの光電変換素子を備え、3原色に中心波長を有する光で原稿を露光する露光ランプが1つの露光位置(副走査方向)で3色の光を順に照射し、原稿から反射した光を光電変換素子により光電変換して、光色毎にアナログデータを生成する。アナログデータは、A/Dコンバータによりデジタルの画像データに変換され、さらにシェーディング補正、MTF補正、ガンマ補正等が施される。1つの画素に光色毎の3つの成分のデジタル値を対応させることでカラーの画像データが得られる。画像データは画像格納手段12により記憶装置13に記憶される。
画像処理装置100は、プログラムを実行するCPU、プログラム実行の作業領域となりまた一時的にデータを記憶するRAM、設定ファイルやパラメータを記憶するROM、画像データやプログラムを記憶する記憶装置13及びデータを入出力する入出力部、がバスにより接続されたコンピュータを有する。
そして、画像処理装置100は、CPUがプログラムを実行するか又はASIC(Application Specific Integrated Circuit)等のロジック回路により実現される画像格納手段12、色クラスタリング手段14、連結成分抽出手段15、特徴量取得手段16、特徴量判別手段17、図写真領域統合手段18を有する。
画像格納手段12は画像取得手段11が取得した画像データを記憶装置13に記憶する。色クラスタリング手段14は、画素値を量子化してそのうち数が多い画素値に画像データを減色する。連結成分抽出手段15は、減色後の画像データから同じ色の画素を連結する。特徴量取得手段16はエッジ強度、文字画素含有率及び文字の外接矩形の形状・大きさから連結された領域の特徴量を取得する。特徴量判別手段17は、特徴量を閾値で判断し、図又は写真領域か否かを判定する。図写真領域統合手段18は、図又は写真領域を統合し写真領域や図をひとかたまりの領域として抽出する。また、記憶装置13は、画像データや図・写真要素、プログラムを記憶する、ハードディスクドライブや半導体メモリなどの記憶手段である。以下、これらの各手段が図・写真要素を抽出する手順を説明する。
<図・写真要素の抽出手順>
図2は、図・写真要素を抽出する対象とする画像データ(原画像)の一例を、図3は、画像処理装置100が図・写真要素を抽出する手順を示すフローチャート図である。
図2の画像データは、例えば、RGBの各成分がそれぞれ複数ビットある、所定の大きさ(VGA、SVGA、XGA、SXGA、UXGA等)のカラー画像である。図2の画像データは第1の背景B1と第2の背景B2を有し、第2の背景B2から第1の背景B1を跨ぐように写真領域23を有する。また、第1の背景B1には猫の線図(アイコン)22と文字21が描画され、第2の背景にはページ番号19が描画されている。文字21、線図22及びページ番号19は例えば、黒色1色で、第2の背景B2は例えばグレーに近い1色で、写真領域23は例えば1677万色である。また、第1の背景B1は、少なくとも第2の背景B2と異なる色の一色か、グラデーションがかかっている。なお、本実施形態の画像処理装置100は、後述するように色クラスタリングにより減色するので、文字21、線図22、ページ番号19及び第2の背景B2が単色である必要はない。
・S10
このフローチャートは、例えば図・写真要素を抽出するよう画像処理装置100が操作されるとスタートする。操作により画像取得手段11がセットされた原稿を光学的に読み取り画像データを生成してもよいし、既に記憶装置13に記憶された画像データを読み出してもよい。
・S20
次に、色クラスタリング手段14は、処理対象の画像データに色クラスタリング処理(減色処理)を施す。ここでは画像データの画素を数色程度のグループに分ける。
図4は色クラスタリングの手順を示すフローチャート図である。
まず、画素値の各成分(RGB)を量子化する(S21)。例えば、各成分4色に量子化すれば、全体の色数は4×4×4=64色に量子化できる。各成分256値の場合、0〜63を32に、64〜127を96に、128〜191を160に、192〜255を224に量子化する。なお、カラー画像でなくグレー画像の場合、成分は明度成分だけなので、4色に量子化できる。
次に、画素値ヒストグラムを作る(S22)。量子化により各画素の画素値は64色のいずれかに一致するので、画素毎に、画素値を64色のいずれかに振り分け、同色の画素が何画素あるかのヒストグラムを作る。
次に、頻度の高い(数の多い)画素値を選び、色数をさらに絞り込む(S23)。数の多い画素値から数色程度を選択する。以下、選択したこの数色をクラスタ色と称する。
次に、すべての画素の量子化した画素値が、クラスタ色のうちどれに一番近いかを判定し、最も近いクラスタ色に分類する(S24)。色の距離は、クラスタ色のRGB成分と各画素のRGB成分の差の2乗和または絶対値和を用いるとよい。したがって、各画素の画素値は全て数色のクラスタ色に対応づけられる。
図5は、色クラスタリング処理を施した減色画像の一例を示す。図5は実際にはカラー画像であり、5つのクラスタ色、白、黒、黄、緑、グレーに減色されている。文字21及び線図22は、以下では簡単のため黒色とする。また、第2の背景B2は第2の背景B2の色に近い例えばグレーのクラスタ色に減色される。また、第1の背景B1はグレーのグラデーションであったが、減色処理により例えば白のクラスタ色に減色される。また、写真領域23は、例えば、「月」が黄色のクラスタ色に、「山」が緑色のクラスタ色に、それ以外が黒のクラスタ色に減色されたものとする。
・S30、S40
図3に戻り、連結成分抽出手段15は、クラスタ色を1つ選び、このクラスタ色に対応づけられた画素が連結した連結画素を抽出する。この2つの処理をクラスタ色毎に実行する。上記のクラスタ色では、白とそれ以外、黒とそれ以外、黄とそれ以外、緑とそれ以外の、グレートそれ以外の連結画素を抽出する。
図6はクラスタ色の画素とそれ以外の画素を分けて示した例を示す図である。図6(a)は黒とそれ以外、図6(b)は白とそれ以外、図6(c)は緑とそれ以外、図6(d)は黄とそれ以外、図6(e)はグレーとそれ以外、に区分した例を示す。なお、白黒表示のため、図6ではクラスタ色を黒で、それ以外の色を白とする二値画像で示している。
例えば、図6(a)の黒とそれ以外を分けた画像において、黒画素の連結成分の外接矩形は図7のようになる。クラスタ色毎に求められたこの各外接矩形が図・写真要素の候補領域となる。連結成分抽出手段15は、それぞれの連結画素の外接矩形を図・写真要素の候補領域とする。文字、数字、アルファベットなどの記号が描画された外接矩形は図・写真要素から除外される。したがって、文字21が描画された第1の背景B1及びページ番号19が配置された第2の背景B2が、図・写真要素として抽出されることはない。
・S50
次に、特徴量取得手段16は、各候補領域内の特徴量を抽出する。この特徴量は各候補領域が図・写真要素の領域であるか、それとも他の領域であるかを判断するための指標となる。特徴量にはいくつかの指標を用いることができる。例えば、以下のような指標を用いる。
A1.エッジ強度
エッジ強度(隣あう画素の画素値の変化量)は、候補領域内の各画素に対しSobelなどの空間フィルタを施し、そのフィルタ値から算出することができる。エッジ情報が大きい場合は、文字21や線図22である可能性が高い。
例えば、候補領域のフィルタ値を合計して画素数で除算すれば、候補領域の大きさの影響を排除して、所定の閾値と比較することができる。また、所定値以上のエッジ強度を持つ画素数をエッジ強度としてもよい。
A2.文字画素含有率
候補領域毎に文字抽出処理を行い、文字21を構成する画素が候補領域内にどの程度含まれているかを利用する。図8は文字21の抽出の手順を示すフローチャート図である。
まず、候補領域から横行を抽出する(S51)。行候補の抽出は種々の方法があるが、ここでは黒画素の連結成分を利用する。すでに連結画素の外接矩形が求められているので、この外接矩形が抽出したい行の方向(ここでは横方向)の近傍に連結する外接矩形を抽出する。近傍とは例えば外接矩形の大きさ程度の距離とする。
そして、連結する外接矩形があればそのサイズが似通っているかどうかを調べる。例えば、高さが近く、位置も近い場合にそれらは同一の行を構成するとみなすことができる。この連結処理をすべての外接矩形について吟味すると、横方向の文字行候補を検出できる。
また、横方向の行候補の抽出と同様に、縦方向の文字行候補も抽出する(S52)。
横方向と縦方向の文字行候補をそれぞれ抽出したら、横方向と縦方向の文字行候補の中から、位置が重なり合うものがあるか否かを判定し、位置が重なり合うものがある場合、重なり合う横方向の文字行候補と縦方向の文字行候補同士を1本ずつ取り出す(S53)。
次いで、1本ずつ取り出した位置が重なり合う文字行候補同士のどちらかが正しい文字行に相当するものと仮定すると、その判定のため、重なり合う文字行候補の行らしさ(行尤度)を重なり合う行それぞれについて計算する(S54)。
行らしさの計算方法には様々なものが考えられるが、ここでは以下の方法で行うこととする。
まず、対象文字行の長さ、高さを求め、求めた行の長さ、高さをもとに文字行候補の縦横比(長さ比)を計算する。また、行を構成する連結成分同士の距離(文字間隔)を計算する。さらに、行を構成する連結成分のサイズを考慮するため、連結成分のうち、文字らしいサイズの連結成分数を数える。
以上の縦横比、文字間隔、連結成分数、を特徴量として用い、文字行らしさを表す尤度を計算する。行尤度の計算方法には様々な方法が考えられるが、ここでは、あらかじめ求めておいた各特徴量の典型値との差の絶対値の線型和を行尤度とする。
ついで、得られた重なり合う一対の文字行候補それぞれの尤度をもとに、行らしくないほうを削除する(S55)。行尤度は小さいほど文字らしいことを意味するので、縦行と横行の候補のうち、尤度の値が小さいほうを正しい文字行とみなし、他方を削除する。
以上の処理により文字行を抽出することができる。なお、文字行の抽出処理は、例えば特開2004−038530号公報に詳しい。
そして、文字行を構成する文字21の画素数をカウントし、各候補領域の画素数との比率を算出し、その比率を図・写真要素の領域か否かを判定する特徴量とする。文字21しかない候補領域ではこの比率が大きくなる。
A3.外接矩形サイズ
候補領域の外接矩形が文字21として適当なサイズかどうかを利用する。文字21のサイズは、縦横比と縦横の長さがある程度定まっているので、所定範囲の縦横比と長さに含まれる候補領域の数を、図・写真要素の領域か否かを判定する特徴量とする。
・S60、S70
ついで、ステップS60に戻り、ステップS50で得られた特徴量から候補領域が図・写真要素の候補領域か否かを判定する。特徴量判別手段17は、例えば、A1〜A3の個々の特徴量を閾値で判断し、すべての条件をクリアした場合に図・写真要素と判定する。または、特徴量の重み付き線型和を作り、これを閾値で判断しても良い。例えば、線形和=a1・A1+a2・A2+a3・A3 として、この線形和と閾値を比較する。a1〜a3は重みであるが、A1のエッジ情報では線図22を検出する可能性があるのでa1を小さくしたり、A3では文字21と似た線図22の外接矩形をする可能性があるのでa3を小さくする。したがって、例えば、a1<a3<a2である。
ステップS70の判定により、図6(a)に示した第1の背景B1からは文字21が、第2の背景B2からはページ番号19がそれぞれ検出されるので、第1の背景B1及び第2の背景B2は図・写真要素領域でないと判定される。
・S80
図・写真要素の領域と判定された場合、特徴量判別手段17はその図・写真要素の候補領域(以下、図・写真要素領域という)を登録する。図・写真要素領域に対応する減色前の画素値情報を、図・写真要素領域の識別番号に画素位置及び減色前の画素値情報を対応づけて記憶装置13に記憶しておく。なお、登録する画素値情報は、図写真要素領域の外接矩形の画素値情報でもよいし、図・写真要素に対応する画素の画素値情報だけでもよい。図・写真要素に対応する画素の画素値情報だけとする場合、図写真要素領域の外接矩形のうち最外縁の外接矩形については、図・写真要素に対応する画素の画素値情報だけを取り出すことで対応できる。
・S90
ステップS30〜S80の処理を全てのクラスタ色に対し行う。
・S100
全てのクラスタ色に対し図・写真要素領域が登録されたら、図写真領域統合手段18は図・写真要素領域を統合する。
・S110
図写真領域統合手段18は、統合図写真領域を例えば元の画像データのファイル名と対応づけて記憶装置13に記憶する。
図5に示した画像データでは、線図22及び写真領域23があるが、線図22や写真領域23は複数の図・写真要素領域で構成されている場合が多い。このため、ひとかたまりで図や写真を抽出するには線図22や写真領域23を構成する図・写真要素領域を個別に抽出するのでなく、これらをひとまとめに統合しておくことが好ましい。
図9(a)は、複数の図・写真要素領域を矩形で囲んだ画像データを示す。図6(b)に示した白とそれ以外の画素の抽出から、線図22はいくつかの白の連結成分があることが分かる(例えば、猫の顔、動体、足、しっぽ、耳、等)。したがって、これら1つ1つが図・写真要素領域となる(図9(b)では一部の図・写真要素領域を省略している)。同様に、その他のクラスタ色について図・写真要素領域が検出される。
図9(a)では、線図22に3つの図・写真要素領域24〜26を示し、写真領域23には3つの図・写真要素領域27〜29を示した。図・写真要素領域24〜26、図・写真要素領域27〜29は、それぞれ本来ひとかたまりなので、統合することが好ましい。
統合方法には種々の方法が考えられるが、一部分が重複する図・写真要素領域24〜26、27〜29を連鎖的に全て抽出し、それらの図・写真要素領域をひとかたまりとして互いに対応づければよい。図9(a)に示したように、図・写真要素領域24〜26は一部又は全部が重複しているので、図・写真要素領域24〜26はひとかたまりに統合され、図・写真要素領域27〜29は全部が重複しているので図・写真要素領域27〜29はひとかたまりにそれぞれ統合される。図9(b)は図・写真要素領域を統合した画像データを示す。統合された図・写真要素領域を、以下、統合図写真領域という。
なお、ステップS50の特徴量により、図と写真が別々に判別できているのであれば、属性ごとに(図のみ又は写真のみ)統合してもよい。
・S110
画像処理装置100は、統合図写真領域をそれぞれ個別に出力する。印刷してもよいし、記憶装置13にJPEGなど所定のフォーマットで記憶しておいてもよい。したがって、ユーザは統合図写真領域を文書の作成などに利用することができる。
以上のように、本実施形態の画像処理装置100は、原稿の画像データから図や写真をひとまとめに抽出することができる。クラスタ色に減色処理してクラスタ色毎に図・写真要素領域を抽出するので、背景色が2色以上でも図・写真要素を適格に抽出できる。
かかる効果は、例えば特開2004−110434号公報の方法と比較すると分かりやすい。特開2004−110434号公報の方法では、背景色を特定するが図6で例えば白を背景色とした場合、図6(b)の「白とそれ以外」の「それ以外」の領域しか抽出できない。すなわち、写真領域23のみを抽出することができず、第2の背景B2と写真領域23を峻別できない。これに対し、本実施形態の画像処理装置100は、図9(b)に示すように、背景色が2色以上でも写真領域23のみを適格に抽出できる。
また、図3のステップS50のように複数の特徴量で総合的な判断を行っているので、線画(猫の線画)22も文字21と区別して抽出できる。
〔第2の実施形態〕
本実施形態では、2値画像を処理する画像処理装置100について説明する。2値画像は第1の実施形態の一部を省略するだけで実現できる。2値画像であるので写真領域23は存在しないとしてよく(存在しても写真として判別することは困難)、文字21及び線画による線図22が存在するだけである。
図10は、本実施形態の本実施形態の画像処理装置100のブロック図を示す。なお、図10において図1と同一構成部分には同一の符号を付しその説明は省略する。図10の画像処理装置100は、色クラスタリング手段14を有さない点で図1と異なる。2値画像を対象とするので、これ以上減色する余地がないためである。
図11は、画像処理装置100が図・写真要素を抽出する手順を示すフローチャート図である。なお、図11において図3と同一ステップには同一の符号を付しその説明は省略する。
図11では、図3のステップS30とS40の代わりに、ステップS31とS32の処理を有する。また、2値しかないのでステップS90で全色に対し処理を繰り返す必要はないため、図3のステップS90の判定は省略される。
・S31、S32
画素の連結は白画素と他方の画素(ここでは黒画素)に対して行う。この処理により、文字21と線画22があれば連結画素として抽出される。
・S50
黒画素の連結画素の外接矩形が図・写真要素領域の候補領域となるが、候補領域内の特徴量を求める上で、多値画像に関する特徴量(第1の実施形態ではA1.エッジ強度)を求める必要がない。
・S60
特徴量の判別も多値画像に関する特徴量以外で判別を行う。第1の実施形態の例ではA2.文字画素含有率、A3.外接矩形サイズを用いればよい。したがって、線形和を用いて判別する場合、比較のための閾値も第1の実施形態よりも小さくなる。
これ以外の処理は第1の実施形態と同様である。すなわち、図・写真要素領域を統合することで線図22がひとかたまりに抽出される。
本実施形態の画像処理装置100によれば、画像取得手段11が取得した画像データが2値画像か否かを判定し、2値画像の場合は2値画像に適した処理を施すことで、処理負荷を低減し、多値画像の場合と同様に図や写真を抽出できる。
〔第3の実施形態〕
処理対象の画像データがカラー画像やグレー画像の場合、第1の実施形態の処理を縮小画像に対して行えば、処理時間や実装時のメモリ使用量を削減でき有利である。本実施形態では、文字21を消去し、縮小画像を作って図や写真を抽出する画像処理装置100について説明する。
縮小画像を作ることにより、背景や写真部分が相異なる色(画素値)をもつ小さな点で構成される場合に、小さな点が周囲の色と融合して連結成分数が大きく減少することが期待できる。その結果、連結成分の増大を防ぐことができるので処理時間、メモリ使用量を削減できる。また、画像サイズ自体も小さくなるので連結成分数も減少する。
また、図・写真要素の抽出が目的であるので、色クラスタリングの対象画像には文字21が含まれないことが望ましい。そこで、縮小画像の作成に先立ち、文字画素の位置を特定しておき、原画像から消去しておく。これにより、色クラスタリング時に文字色が混入することが防げるので、色クラスタリングの精度が高まる。
図12は本実施形態の画像処理装置100のブロック図を示す。なお、図12において図1と同一構成部分には同一の符号を付しの説明は省略する。図12の画像処理装置100は、縮小画像を生成する縮小画像生成手段31、文字21を構成する画素を特定する文字画素特定手段32及び文字21を消去する文字消去手段33を有する。
図13は、画像処理装置100が図・写真要素を抽出する手順を示すフローチャート図である。なお、図13において図3と同一ステップには同一の符号を付しその説明は省略する。図13では、ステップS11〜S13、S101の処理を有する点で図3と異なる。
・S11
まず、文字画素特定手段32は文字画素を特定する。文字画素の特定は、種々の方法があるが例えば、次のように処理する。
S11−1:対象の画像データに対して背景色を特定する。背景色は文書全体に広く分布して、文字21は単一色であることが多いことを考慮すると、最も画素数が多い色を背景色としてよい。背景色が多値である場合は、画素数が多い順に数種の背景色を特定する。
S11−2:次に、背景色以外の画素が連結した部分領域を抽出し、部分領域から等色連結成分を抽出する。等色連結成分は、隣接する画素色が色空間上においてある一定の距離内にあれば同色とみてグループ化する操作を繰り返して得られる。こうして、部分領域内の画素はいずれかの連結成分に属することになる。
S11−3:等色連結成分の特徴を抽出する。例えば、部分領域を構成する等色連結成分の色の種類の数を求める。この色の種類の数を予め定めてあったしきい値と比較し、しきい値よりも大きければ、当該部分領域を写真領域23と判定する。しきい値は、実験的に求めておけばよい。
S11−4:写真領域以外の部分領域から文字21を抽出する。文字21の抽出は、図8のフローチャート図で説明したように、A1〜A3の手法を用いることができる。
・S12
次に、文字消去手段33は元の画像データから文字21を消去する。消去は、文字画素に隣接した又は周囲の画素の色で文字21のある画素の画素値をおきかえる。置き換える画素値は背景色であるので、これにより文字画素を背景色とすることができた。
・S13
縮小画像生成手段31は、文字21が消去された画像データから縮小画像を生成する。例えば、4分の1の縮小画像を生成するのであれば、元の画像データから4×4画素づつ取り出し、4×4画素の平均値を画素値とし、縮小画像の1画素の画素値とする。4画素ごとのダウンサンプリングを行っても良いが、網掛けや細かい点の影響を減じるためには平均値を取ったほうが良い。
・S20〜S100
以降の処理は第1の実施形態と同様である。すなわち、色クラスタリング、連結成分抽出、は縮小画像に対して行う。これらの処理を縮小画像に行うことで連結成分数を減らすことができる。
ところで、特徴量の抽出は原画像に対して行ったほうが良い場合と、縮小画像に対して行ったほうが良い場合がある。文字画素含有率は文字21が細かい形状を持つために原画像の方が良い結果を生むことが多い。本実施形態では文字抽出のやり方を特に定めていないので、縮小画像に対して処理を行ったほうが良い場合もありえる。なお、縮小画像のほうが処理時間が短いという効果は特徴量抽出においても同じである。したがって、例えば、A1.エッジ強度については縮小画像に対し行い、A2.文字画素含有率については原画像について行い、A3.外接矩形サイズについては縮小画像に対し行う。
・S101
ステップS100までの処理で縮小画像に対し統合図写真領域がえられるので、統合図写真領域の画素を元の画像データの画素に変換する。すなわち、縮小画像の画素の位置情報(座標値)を元の画像データの座標値に変換する。統合図写真領域は矩形なので、四隅の画素の座標値を変換すればよい。
以上で、元の画像の統合図写真領域を特定することができた。画像処理装置100は元の画像データから統合図写真領域を抽出して出力する。
本実施形態の画像処理装置100は、処理対象の画像データを縮小することで、処理時間、メモリ使用量を削減できる。
〔第4の実施形態〕
第1又は第3の実施形態では色クラスタリング処理を実行したが、条件によっては色クラスタリングの処理結果が不安定になる場合がある。たとえば、次のような場合である。
・対象の原稿で使用されている色数が多い場合
クラスタ色が多くなると計算量が増大するのであまり多く取れない。元の色数に比べクラスタ色が少ないと、本来別のクラスタ色に分類すべき色が一緒になり、正しい候補領域を取得できない可能性がある。
・グレー画像の場合
色同士が明度の違いしかなく互いに似た色であるため、別のクラスタ色に分類されるべき領域が1つのクラスタ色にまとまりがちになり、正しい候補領域を取得できない可能性がある。
そこで、本実施形態では、色数が多い画像データやグレー画像から安定して図・写真要素を抽出できる画像処理装置100について説明する。
例えば、色数が多くても写真はたいていの場合、多くのエッジを含む。エッジがない写真はピントがひどくぼけてしまっている状態で、そのような例は少ないと思われる。また、線画22の場合は確実にエッジが存在する。そのため、エッジを手がかりにすれば候補領域を抽出しやすくなる。また、エッジの検出と色クラスタリングによる候補領域抽出とを併用すると、候補領域の抽出漏れが減ると考えられる。
そこで、本実施形態の画像処理装置100は、
・エッジ検出を行い、エッジがある画素の連結画素抽出を行う。
・連結画素を図・写真要素領域に追加する。
これにより、色クラスタリングが不安定な場合でも候補領域の抽出が容易になり、特に図(線画)の抽出を行いやすくできる。
図14は、本実施形態の画像処理装置100のブロック図を示す。なお、図14において図1と同一構成部分には同一の符号を付しその説明は省略する。図14の画像処理装置100はエッジを検出するエッジ検出手段34を有する。エッジ検出手段34は、画素のRGBの各成分毎にエッジを検出する。
図15は、本実施形態の原画像の画像データを、図16は減色画像をそれぞれ示す。本実施形態の画像データは線図22の上にグレーのハート模様30を有する。図15のハート模様30は、第1の背景B1と似た色である。このため、第1の実施形態のように色クラスタリングすると、第1の背景B1と同じクラスタ色に減色され、図16に示すように減色画像にはハート模様30が白のクラスタ色にまとめられてしまう。
図17は、画像処理装置100が図・写真要素を抽出する手順を示すフローチャート図である。なお、図17において図3と同一ステップには同一の符号を付しその説明は省略する。
ステップS30とS40により、図6に示したように特定のクラスタ色を持つ連結画素とそれ以外の連結画素を抽出する。これを全クラスタ色に対して繰り返すことで、白とそれ以外、黒とそれ以外、黄とそれ以外、緑とそれ以外及びグレートそれ以外、の連結画素を抽出する。
・S42
エッジ検出手段34は、「元の」画像データからエッジを検出する。エッジ検出は画素ごとに行う。例えば、グレー画像の場合には各画素を中心として以下の空間フィルタを施し、その絶対値があらかじめ定めた値よりも大きい場合に、エッジであると判定する。
−1 −1 −1
−1 8 −1 …(1)
−1 −1 −1
カラー画像の場合は、RGB成分ごとに上述のフィルタを施し、一成分でもあらかじめ定めた値を超えた場合にエッジがあると判定する。
他のやり方として、RGB成分ごとに以下の2種類のフィルタを施し、その2乗和があらかじめ定めた値よりも大きい場合にエッジであると判定してもよい。
−1 −1 −1 −1 0 1
0 0 0 −1 0 1 …(2)
1 1 1 −1 0 1
このフィルタ(2)は最初に示したフィルタ(1)に比べて細かいノイズに鈍感であるという傾向がある。例えば、背景が細かいドットで構成されている中間色である場合に、各ドットをエッジとして拾いにくいという利点がある。なお、エッジが検出された画素を黒画素とした二値画像が生成される。
図18は、エッジ画像の一例を示す。ハート模様30は、色クラスタリングで消失してしまうが、エッジ画像ではハート模様30が消失することなく検出されている。
・S43
連結成分抽出手段15は、エッジ画像からエッジ画素の連結成分を抽出しその外接矩形を図・写真要素領域として追加する。図16に示したように、ハート模様30のグレーは色が白に比較的近いため独立したグループにならず、減色画像から候補領域を抽出すると、ハート模様30の部分は図・写真要素領域として抽出できないことになる。
しかし、エッジ画像から候補領域を抽出することで、ハート模様30を図・写真要素領域の候補領域にすることができる。
以降の処理は第1の実施形態と同じである。ステップS91で「全領域を吟味したか」を判定するが、これはクラスタ色の全ての候補領域とエッジ画像の全ての候補領域を吟味したかを判定するものでステップS90と同じである。
図19(a)は、複数の図・写真要素領域を矩形で示した画像データを示す。図19(a)では、ハート模様30が抽出されていることがわかる。図19(b)は、図・写真要素領域を統合した画像データを示す。ハート模様30は他の図・写真要素領域と重複していないので、ハート模様30のみで統合図写真領域となる。
本実施形態によれば、第1の実施形態の効果に加え、色クラスタリングが適切に行えなかった場合でも、エッジによる候補が抽出されているので、クラスタ色を多くすることなく、色数の多い画像データやグレーの画像データから、図や写真の抽出漏れを低減することができる。
〔第5の実施形態〕
第4の実施形態では、色クラスタリングとエッジの検出の双方を行ったが、色クラスタリングを行わずにエッジ画像のみから図・写真要素の候補領域を抽出することができる。色クラスタリングを行わないので、処理時間を低減することができる。
図20は本実施形態の画像処理装置100のブロック図を示す。なお、図20において図14と同一構成部分には同一の符号を付しその説明は省略する。図20の画像処理装置100は色クラスタリング手段14を有さない点で異なる。
また、図21は、画像処理装置100が図・写真要素を抽出する手順を示すフローチャート図である。なお、図21において図17と同一ステップには同一の符号を付しその説明は省略する。図21では、色クラスタリング(S20)、特定のクラスタ色毎の連結画素の抽出(S30〜S41)を有さない。その他の処理は図17と同様である。
本実施形態の画像処理装置100によれば、第4の実施形態の効果に加え、色クラスタリングを行わないことで、処理時間を低減することができる。
〔画像処理装置100の構成例〕
図22は、画像処理装置100の構成図の一例を示す。図22の画像処理装置100は、画像取得手段11を別体に設け、画像取得手段11とネットワーク又は1対1に接続されたPC40を有する。PC40が次述するハードウェア構成を用いてソフトウェアと協働して第1〜第5の実施形態で説明した処理を実現する。なお、上述したように、例えばMFPが単体で画像処理装置100を実現してもよい。
図23は、PC40のハードウェア構成図を示す。PC40は、CPU401、作業領域となるメモリ(RAM)402、ハードディスク(図1の記憶装置13に相当する)403、キーボードやマウスなどの入力装置404、CD−ROMドライブ405、ディスプレイ406、などがバスにより接続されて構成されている。
ハードディスク403には、CPU401が実行して、画像格納手段12、色クラスタリング手段14,連結成分抽出手段15、特徴量取得手段16、特徴量判別手段17、図写真領域統合手段18、縮小画像生成手段31、文字画素特定手段32、文字消去手段33及びエッジ検出手段34を実現するためのプログラム41が記憶されている。
CPU401は、ハードディスク403からプログラム41を読み出し実行することで各手段を実現する。実現された各手段により、画像取得手段11が取得した画像データから統合図写真領域が抽出され、ハードディスク403に保存したり、必要に応じてディスプレイ406に出力したり、プリンター408で印刷される。また、同じPC40やネットワークで接続された他のPCで実行されている別のソフトウェア(アプリケーション)に統合図写真領域を出力してもよい。
なお、プログラム41は、CD−ROMなどの記録媒体407に記憶して配布され、記憶媒体407からハードディスク403にインストールされる。ネットワークを介してサーバからプログラム41をダウンロードしてもよい。
〔図・写真要素の再利用〕
抽出した統合図写真領域を再利用する実施形態について説明する。抽出した統合図写真領域は、新規の文書作成において再利用することができるので、統合図写真領域を容易に再利用できる画像処理装置100について説明する。
図24は、図・写真要素の再利用を考慮した画像処理装置100のブロック図の一例を示す。画像処理装置100のハードウェア構成は図23と同様であって、PC40のCPU401がプログラム41を実行することで、画像データの画像を表示する画像表示手段51、表示された画像に対するユーザの操作を取得する操作取得手段52、抽出された統合図写真領域を表示する統合図写真領域表示手段53、抽出された統合図写真領域を画像データから切り出す統合図写真領域切り出し手段55、新規に文書を作成する他のアプリケーションと連携する他アプリ連携手段54、とが実現される。
なお、統合図写真領域抽出手段50は、第1〜第5の実施形態にて説明した各手段を有し、操作取得手段52が取得したユーザの操作に応じて、画像データから第1から第5の実施形態を実行し統合図写真領域を抽出する。
したがって、ハードディスク403に記憶されるプログラム41は、統合図写真領域抽出手段50に加え、画像取得手段11、画像表示手段51、操作取得手段52、統合図写真領域表示手段53、他アプリ連携手段54及び統合図写真領域切り出し手段55、を実現するプログラムである。
以下、画像処理装置100が提供する統合図写真領域の再利用について、図25のアプリケーション実行例、及び、図26のフローチャート図に基づき説明する。まず、ユーザの操作又は画像取得手段11で画像を入力するとアプリケーションプログラムが自動的に立ち上がる(S210)。なお、ハードディスク403に記憶された画像データのファイル名をユーザがマウス等で指定するとリンクされた自動抽出アプリが立ち上がるとしてもよい。
図25(a)は、ディスプレイ406に表示されたアプリケーションプログラムのGUI(Graphical User Interface)を示す。このアプリケーションプログラムを図25では自動抽出アプリとした。自動抽出アプリは対象となる画像データから自動的に線図22や写真領域23を判別し、切り出す機能(統合図写真領域抽出手段50に相当)を有する。
自動抽出アプリのGUIには、ボタン61、62、画像データ表示欄63、候補欄64が形成され、画像データ表示欄63に画像データが表示される。ボタン61は統合図写真領を抽出するための「自動抽出ボタン」で、ボタン62は他のアプリケーションと連携するための「他アプリ連携ボタン」である。ボタン62により連携される他のアプリケーションは自動抽出アプリに予め登録しておいてもよいし、ボタン62が操作される毎に連携可能なアプリケーションを一覧で表示してもよい。
ついで、画像表示手段51は画像データを画像データ表示欄63に表示する(S220)。画像データの表示には2つの手順があり、ユーザがマウスなどのポインティングデバイスなどで自動抽出アプリの「ファイル」欄から画像データのファイルを指定することで、画像データが画像データ表示欄63に表示される。また、自動抽出アプリを立ち上げる前に、画像データのファイル名をユーザがマウス等で指定した場合、自動抽出アプリが立ち上がると自動的に画像データが画像データ表示欄63に表示される。
図25(a)に示すように、画像データが画像データ表示欄63に表示された状態で、マウス等によりボタン61が選択されると、操作取得手段52が統合図写真領域を抽出するという操作内容を取得し、統合図写真領域抽出手段50が第1〜第5の実施形態で説明した方法で統合図写真領域を抽出する(S230)。
統合図写真領域抽出手段50が統合図写真領域を抽出すると、統合図写真領域表示手段53が候補欄64に抽出した統合図写真領域を表示する(S240)。
図25(b)は画像データと共に統合図写真領域が表示されたGUIの一例を示す。ユーザは、表示された統合図写真領域を視認して、抽出された統合図写真領域のうち再利用したい統合図写真領域をマウスなどで選択できる。
なお、統合図写真領域でない領域のみが抽出された場合、ユーザは画像データ表示欄63から統合図写真領域を指定する。これにより、統合図写真領域抽出手段50は、選択された領域にのみに色クラスタリング処理等を施せばよいので、統合図写真領域の抽出が容易なる。また、統合図写真領域の抽出を容易にするため、例えばA1〜A3の個々の特徴量の重み付き線型和と閾値で図・写真要素領域を判定する場合、閾値を低くすることが好ましい。閾値を低く調整することで図・写真要素領域の判定を緩和し、図・写真要素領域が抽出しやすくなる。この場合、図・写真要素領域でない領域が抽出されても再利用しなければよいだけなので、実用上の不都合はない。
操作取得手段52は、候補欄63に表示した統合図写真領域からユーザが選択した統合図写真領域を検出する(S250)。ユーザが選択した統合図写真領域を検出すると、操作取得手段52は画像表示手段51に選択された統合図写真領域を通知する。これにより、選択された統合図写真領域が強調表示され、ユーザは選択された統合図写真領域を確認できるようになる。図25(b)では選択された統合図写真領域を矩形65で囲むことで強調表示した。
ついで、ユーザの操作に応じて統合図写真領域切り出し手段55は、選択された統合図写真領域を画像データから切り出す(S260)。選択した統合図写真領域を他のアプリケーションで再利用するためユーザがボタン62を操作すると、統合図写真領域切り出し手段55は、画像データのうち統合図写真領域に対応する領域の画素の画素値を抽出する。これにより、画像データから統合図写真領域が複写されることになる。
ついで、ボタン62の操作に応じて、他アプリ連携手段54は連携する所定のアプリケーションに起動を要求する(S270)。所定のアプリケーションは、予め自動抽出アプリと連携するアプリケーションとして自動抽出アプリに登録(関連付け)されており、登録されたアプリケーションが2以上ある場合、例えば連携可能な複数のアプリケーションがポップアップ表示される。なお、自動抽出アプリに連携するアプリケーションが登録されていない場合、他アプリ連携手段54は例えばOSに統合図写真領域に対応したアプリケーションを問い合わせ、かかるアプリケーションを起動させる。本実施形態では、例えば、ワープロのアプリケーションが起動されるものとする。
他のアプリケーションが起動されると、他アプリ連携手段54は、ワープロのアプリケーションに、切り出された統合図写真領域を転送する(S280)。これにより、ワープロのアプリケーションに処理が移行し、ワープロのアプリケーションは転送された統合図写真領域を所定の位置(例えば、入力行の下)に表示する。
図25(c)はディスプレイ406に表示されたワープロのアプリケーションのGUIを示す。図25(c)では、ワープロのアプリケーションのGUIに、ユーザが入力したテキスト及び統合図写真領域が表示されている。したがって、ユーザはワープロのアプリケーションで統合図写真領域を再利用することができる。
なお、図25、26では他のアプリケーションで統合図写真領域を再利用する際に、1つの画像データから統合図写真領域を抽出したが、予め統合図写真領域を抽出してハードディスク403に記憶しておいてもよい。この場合、画像データのファイル名をファイル一覧からユーザがマウスなどで指定しておき、統合図写真領域抽出手段50に画像データの全ての統合図写真領域の抽出を指示する。自動抽出アプリは起動していても起動していなくてもよい。統合図写真領域抽出手段50は、抽出した統合図写真領域に重複しないファイル名を付与してハードディスク403に記憶していく。したがって、ユーザは、既に抽出された統合図写真領域から所望の統合図写真領域を選択することができる。
以上のように、本実施形態の画像処理装置100は、統合図写真領域を自動的に抽出でき、さらに、容易に他のアプリケーションで統合図写真領域を再利用することができる。
画像処理装置のブロック図である(第1の実施形態)。 図・写真要素を抽出する対象とする画像データ(原画像)の一例を示す図である。 画像処理装置が図・写真要素を抽出する手順を示すフローチャート図である(第1の実施形態)。 色クラスタリングの手順を示すフローチャート図である。 色クラスタリング処理を施した減色画像の一例を示す図である。 クラスタ色の画素とそれ以外の画素を分けて示した例を示す図である。 黒画素の連結成分の外接矩形の一例を示す図である。 文字の抽出の手順を示すフローチャート図である。 複数の図・写真要素を矩形で囲んだ画像データを示す。 画像処理装置のブロック図である(第2の実施形態)。 画像処理装置が図・写真要素を抽出する手順を示すフローチャート図である(第2の実施形態)。 画像処理装置のブロック図である(第3の実施形態)。 画像処理装置が図・写真要素を抽出する手順を示すフローチャート図である(第3の実施形態)。 画像処理装置のブロック図である(第4の実施形態)。 原画像の画像データを示す図である。 減色画像の示す図である。 画像処理装置が図・写真要素を抽出する手順を示すフローチャート図である(第4の実施形態)。 エッジ画像の一例を示す図である。 複数の図・写真要素領域を矩形で示した画像データを示す図である。 画像処理装置のブロック図である(第5の実施形態)。 画像処理装置が図・写真要素を抽出する手順を示すフローチャート図である(第5の実施形態)。 画像処理装置の構成図の一例を示す図である。 PCのハードウェア構成図の一例である。 図・写真要素の再利用を考慮した画像処理装置のブロック図の一例である。 アプリケーション実行例を説明する図である。 画像処理装置が提供する統合図写真領域の再利用の手順を示すフローチャート図である。
符号の説明
11 画像取得手段
12 画像格納手段
13 記憶装置
14 色クラスタリング処理
15 連結成分抽出手段
16 特徴量取得手段
17 特徴量判別手段
18 図写真領域統合手段
31 縮小画像生成手段
32 文字画素特定手段
33 文字消去手段
34 エッジ検出手段
41 プログラム
50 統合図写真領域抽出手段
51 画像表示手段
52 操作取得手段
53 統合図写真領域表示手段
54 他アプリ連携手段
55 統合図写真領域切り出し手段
100 画像処理装置
407 記憶媒体

Claims (15)

  1. カラーの画像データから図又は写真を形成する図写真画素の画素値情報を抽出する画像処理装置であって、
    画像データの画素値を、画像データ全体の色数よりも少ない複数の色の代表画素値に置き換える画素値置き換え手段と、
    同じ色の代表画素値が連続した候補領域を特定し、各色別に前記候補領域を抽出する候補領域抽出手段と、
    前記候補領域毎に記号を形成する画素が含まれる程度を示す特徴量を取得する特徴量取得手段と、
    前記特徴量に基づき記号が含まれる前記候補領域は前記図写真画素を有さないと判定する特徴量判定手段と、
    前記図写真画素を有すると判定された前記候補領域であって、一部又は全部が重畳する前記候補領域を統合する統合手段と、
    を有することを特徴とする画像処理装置。
  2. 前記代表画素値で置き換える前の画像データからエッジ情報を検出するエッジ検出手段を有し、
    前記候補領域抽出手段は、エッジ情報が連続した領域を前記候補領域とした後、前記画素値置き換え手段が代表画素値に置き換えた画像データから前記候補領域を抽出する、
    ことを特徴とする請求項1記載の画像処理装置。
  3. 前記画素値置き換え手段は、画像データの画素値に基づき色クラスタリングする、
    ことを特徴とする請求項1記載の画像処理装置。
  4. 前記画像データが1つの画素毎に複数の成分を有するカラー画像の場合、
    前記画素値置き換え手段は、
    前記成分毎に量子化した量子化画素値のヒストグラムを生成し、最も頻度の高い量子化画素値から所定数を前記代表画素値に決定し、量子化前の画素値を、複数の前記代表画素値のうち最も近い前記代表画素値に置き換える、
    ことを特徴とする請求項1記載の画像処理装置。
  5. 前記候補領域抽出手段は、
    前記代表画素値に置き換えられた画像データから、同じ前記代表画素値が連続した一連の画素のみを抽出し、全ての前記代表画素値毎にこれを繰り返して前記候補領域を抽出する、
    ことを特徴とする請求項1記載の画像処理装置。
  6. 前記特徴量取得手段は、
    前記候補領域毎のエッジ強度情報、前記候補領域の間隔及び所定間隔以下に連続した連続数に基づく記号行程度情報、並びに、前記候補領域毎の外接矩形形状情報、を取得し、
    前記特徴量判定手段は、これらの全てが所定の条件を満たさない場合に、前記候補領域が前記図写真画素を有すると判定する、
    ことを特徴とする請求項1〜5いずれか1項記載の画像処理装置。
  7. 画像データを前記代表画素値で置き換える前に、
    前記画像データから記号を形成する記号画素を特定する記号画素特定手段と、
    前記記号画素特定手段により特定された記号画素を、記号画素に隣接した画素の画素値で置き換える記号消去手段、を有し、
    前記画素値置き換え手段は、前記記号消去手段により記号画素が消去された画像データの画素値を画素値に応じて複数の代表画素値に置き換える、
    ことを特徴とする請求項1項記載の画像処理装置。
  8. 前記記号画素特定手段は、
    画像データから決定された背景色以外の画素の画素値から等色連結成分を抽出し、等色連結成分の色の数が閾値を超えた場合、等色連結成分を写真領域と推定し、
    写真領域以外の等色連結成分の領域の、エッジ強度情報、等色連結成分の領域の間隔及び所定間隔以下に連続した連続数に基づく記号行程度情報、並びに、等色連結成分の領域の外接矩形形状情報、に基づき記号画素を特定する、
    ことを特徴とする請求項7記載の画像処理装置。
  9. 前記記号消去手段が画像データから記号を消去した後に、画像データを縮小する縮小画像生成手段を有し、
    前記画素値置き換え手段は、前記縮小画像生成手段により縮小された画像データの画素値を画素値に応じて複数の代表画素値に置き換える、
    ことを特徴とする請求項7記載の画像処理装置。
  10. 前記統合手段により統合された統合図写真領域を表示装置に表示する統合図写真領域表示手段と、
    統合図写真領域を画像データから切り出す統合図写真領域切り出し手段と、
    前記統合図写真領域切り出し手段により切り出された統合図写真領域を、電子文書を生成する生成手段に送出する連携手段と、
    を有することを特徴とする請求項1〜9いずれか1項記載の画像処理装置。
  11. 前記画素値置き換え手段は、背景色を特定することなく、画像データの画素値を複数の色の代表画素値に置き換える、
    ことを特徴とする請求項1記載の画像処理装置。
  12. 前記画像データは、輝度が連続的に変化するグラデーション領域を含む、ことを特徴とする請求項1記載の画像処理装置。
  13. カラーの画像データから図又は写真を形成する図写真画素の画素値情報を抽出する画像処理方法であって、
    画素値置き換え手段が、画像データの画素値を、画像データ全体の色数よりも少ない複数の色の代表画素値に置き換えるステップと、
    候補領域抽出手段が、同じ色の代表画素値が連続した候補領域を特定し、各色別に前記候補領域を抽出するステップと、
    特徴量取得手段が、前記候補領域毎に記号を形成する画素が含まれる程度を示す特徴量を取得するステップと、
    特徴量判定手段が、前記特徴量に基づき記号が含まれる前記候補領域は前記図写真画素を有さないと判定するステップと、
    統合手段が、前記図写真画素を有すると判定された前記候補領域であって、一部又は全部が重畳する前記候補領域を統合するステップと、
    を有することを特徴とする画像処理方法。
  14. コンピュータを、
    画像取得手段が取得した画像データを記憶手段に記憶させる画像格納手段と、
    画像データが記憶された記憶手段からカラーの画像データを読み出し、画像データの画素値を画素値に応じて、画像データ全体の色数よりも少ない複数の色の代表画素値に置き換える画素値置き換え手段と、
    同じ色の代表画素値が連続した候補領域を特定し、各色別に前記候補領域を抽出する候補領域抽出手段と、
    前記候補領域毎に記号を形成する画素が含まれる程度を示す特徴量を取得する特徴量取得手段と、
    前記特徴量に基づき記号が含まれる前記候補領域は図又は写真を形成する図写真画素を有さないと判定する特徴量判定手段と、
    前記図写真画素を有すると判定された前記候補領域であって、一部又は全部が重畳する前記候補領域を統合して、図又は写真を形成する図写真画素の画素値情報として記憶手段に記憶する統合手段と、
    として機能させることを特徴とするプログラム、
  15. 請求項14記載のプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
JP2008019724A 2008-01-30 2008-01-30 画像処理装置、画像処理方法、プログラム、記憶媒体 Expired - Fee Related JP4960897B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008019724A JP4960897B2 (ja) 2008-01-30 2008-01-30 画像処理装置、画像処理方法、プログラム、記憶媒体
US12/356,586 US8218863B2 (en) 2008-01-30 2009-01-21 Image processing apparatus, image processing method and image processing means

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008019724A JP4960897B2 (ja) 2008-01-30 2008-01-30 画像処理装置、画像処理方法、プログラム、記憶媒体

Publications (2)

Publication Number Publication Date
JP2009182662A JP2009182662A (ja) 2009-08-13
JP4960897B2 true JP4960897B2 (ja) 2012-06-27

Family

ID=40899296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008019724A Expired - Fee Related JP4960897B2 (ja) 2008-01-30 2008-01-30 画像処理装置、画像処理方法、プログラム、記憶媒体

Country Status (2)

Country Link
US (1) US8218863B2 (ja)
JP (1) JP4960897B2 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9842331B2 (en) 2008-01-18 2017-12-12 Mitek Systems, Inc. Systems and methods for mobile image capture and processing of checks
US10102583B2 (en) 2008-01-18 2018-10-16 Mitek Systems, Inc. System and methods for obtaining insurance offers using mobile image capture
US8983170B2 (en) 2008-01-18 2015-03-17 Mitek Systems, Inc. Systems and methods for developing and verifying image processing standards for mobile deposit
US10528925B2 (en) 2008-01-18 2020-01-07 Mitek Systems, Inc. Systems and methods for mobile automated clearing house enrollment
US9298979B2 (en) * 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US10685223B2 (en) * 2008-01-18 2020-06-16 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US8289935B2 (en) 2008-02-04 2012-10-16 Nokia Siemens Networks Oy Method, apparatus and computer program to map a cyclic shift to a channel index
US8929657B2 (en) * 2008-08-22 2015-01-06 KyongHee Yi System and method for indexing object in image
JP5049920B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法
JP5182523B2 (ja) * 2009-03-04 2013-04-17 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4821869B2 (ja) * 2009-03-18 2011-11-24 富士ゼロックス株式会社 文字認識装置、画像読取装置、およびプログラム
US8306345B2 (en) * 2009-09-22 2012-11-06 Xerox Corporation 3+N layer mixed raster content (MRC) images and processing thereof
CN102194118B (zh) * 2010-03-02 2013-04-10 方正国际软件(北京)有限公司 一种从图像中抽取信息的方法及装置
US10891475B2 (en) 2010-05-12 2021-01-12 Mitek Systems, Inc. Systems and methods for enrollment and identity management using mobile imaging
US20110280476A1 (en) * 2010-05-13 2011-11-17 Kelly Berger System and method for automatically laying out photos and coloring design elements within a photo story
EP2442238A1 (en) 2010-09-29 2012-04-18 Accenture Global Services Limited Processing a reusable graphic in a document
US8891860B2 (en) * 2011-08-05 2014-11-18 Rakuten, Inc. Color name determination device, color name determination method, information recording medium, and program
JP5000781B1 (ja) 2011-11-09 2012-08-15 楽天株式会社 画像処理装置、画像処理装置の制御方法、プログラム、及び情報記憶媒体
JP6031921B2 (ja) * 2012-09-28 2016-11-24 ブラザー工業株式会社 画像処理装置およびプログラム
US20140270347A1 (en) * 2013-03-13 2014-09-18 Sharp Laboratories Of America, Inc. Hierarchical image classification system
JP6108220B2 (ja) * 2013-03-26 2017-04-05 ブラザー工業株式会社 画像処理装置、画像処理プログラム
JP6165513B2 (ja) * 2013-06-14 2017-07-19 国立大学法人埼玉大学 ハンドジェスチャトラッキングシステム
CN104281850B (zh) * 2013-07-09 2020-01-31 腾讯科技(深圳)有限公司 一种文字区域识别方法和装置
US20150030241A1 (en) * 2013-07-24 2015-01-29 Intuit Inc. Method and system for data identification and extraction using pictorial representations in a source document
JP6348791B2 (ja) * 2014-07-16 2018-06-27 クラリオン株式会社 表示制御装置および表示制御方法
US11144777B2 (en) * 2016-06-30 2021-10-12 Rakuten Group, Inc. Image processing apparatus, image processing method, and image processing program for clipping images included in a large image
GB2577989B (en) * 2018-09-30 2021-03-24 Lenovo Beijing Co Ltd Information processing method and electronic device
WO2021050054A1 (en) * 2019-09-11 2021-03-18 Hewlett-Packard Development Company, L.P. Overlapped element identification within an image
US11521028B2 (en) * 2020-04-10 2022-12-06 Toyota Research Institute, Inc. Meta-learning neural architecture search via graph networks on search space lattices
US11947634B2 (en) * 2021-09-01 2024-04-02 FootPrintKu Inc. Image object classification method, system and computer readable medium
US20230063213A1 (en) * 2021-09-01 2023-03-02 FootPrintKu Inc. Image object labeling method, system and computer readable medium

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6115465A (ja) * 1984-06-30 1986-01-23 Toshiba Corp 画像編集装置
JP3253356B2 (ja) * 1992-07-06 2002-02-04 株式会社リコー 文書画像の領域識別方法
JPH06337926A (ja) * 1993-05-27 1994-12-06 Victor Co Of Japan Ltd 表示限定色の最適化方法および限定色表示装置
JPH06339019A (ja) 1993-05-28 1994-12-06 Nippon Telegr & Teleph Corp <Ntt> 離散的コサイン変換による文書画像の領域分離方式
JP3615333B2 (ja) * 1996-12-05 2005-02-02 株式会社リコー 罫線消去装置
JP3913985B2 (ja) * 1999-04-14 2007-05-09 富士通株式会社 文書画像中の基本成分に基づく文字列抽出装置および方法
JP2001297303A (ja) 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP3960756B2 (ja) 2000-04-26 2007-08-15 富士通株式会社 文書画像レイアウト識別方法および装置
JP2002209084A (ja) * 2001-01-09 2002-07-26 Seiko Epson Corp 色指定が可能なグレースケール処理機能を有するロゴデータの作成方法、及びロゴデータ作成装置
US7085006B2 (en) * 2000-12-28 2006-08-01 Seiko Epson Corporation Apparatus for generating two color printing data, a method for generating two color printing data and recording media
JP4183231B2 (ja) * 2002-05-09 2008-11-19 キヤノン株式会社 画像処理サーバ及びその制御方法、プログラム、画像処理システム、端末
JP2004038530A (ja) 2002-07-03 2004-02-05 Ricoh Co Ltd 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置
JP2004062459A (ja) * 2002-07-26 2004-02-26 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4116377B2 (ja) 2002-09-18 2008-07-09 株式会社リコー 画像処理方法および画像処理装置
JP4112413B2 (ja) * 2003-03-27 2008-07-02 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム、及び画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
JP2006092206A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 画像取得装置、画像取得方法および画像取得のプログラム
JP2006128987A (ja) 2004-10-28 2006-05-18 Matsushita Electric Ind Co Ltd 画像判別装置
EP1670257B1 (en) * 2004-12-10 2018-09-26 Ricoh Company, Ltd. Compressing a mutlivalue image with control of memory space requirement
US7848589B2 (en) * 2005-02-01 2010-12-07 Richoh Company, Ltd. Method and apparatus for applying edge enhancement based on image characteristics
JP4149464B2 (ja) * 2005-06-10 2008-09-10 富士通株式会社 画像処理装置
JP4861711B2 (ja) * 2005-07-27 2012-01-25 株式会社リコー 画像処理装置、画像圧縮方法、画像圧縮プログラム及び記録媒体
JP4814039B2 (ja) * 2005-10-27 2011-11-09 株式会社リコー 画像処理装置、画像処理プログラムおよび記録媒体
JP4745830B2 (ja) * 2006-01-05 2011-08-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP2007221340A (ja) * 2006-02-15 2007-08-30 Canon Inc 画像ファイル生成方法及び画像ファイル生成装置
JP4750047B2 (ja) * 2006-03-31 2011-08-17 株式会社リコー 位置ずれ検出装置、位置ずれ検出方法、位置ずれ検出プログラムおよび記録媒体
JP2008017213A (ja) * 2006-07-06 2008-01-24 Canon Inc 画像処理装置及びその方法

Also Published As

Publication number Publication date
JP2009182662A (ja) 2009-08-13
US8218863B2 (en) 2012-07-10
US20090190830A1 (en) 2009-07-30

Similar Documents

Publication Publication Date Title
JP4960897B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
US7272269B2 (en) Image processing apparatus and method therefor
US8203748B2 (en) Image processing apparatus, control method therefor, and program
US7630544B1 (en) System and method for locating a character set in a digital image
US20060274081A1 (en) Image retrieving apparatus, image retrieving method, program, and storage medium
US11935314B2 (en) Apparatus for generating a binary image into a white pixel, storage medium, and method
KR20120132314A (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
JP2010067223A (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2008141681A (ja) 画像処理装置、画像処理方法及び画像処理のプログラム
JP2010056827A (ja) 画像処理装置および画像処理プログラム
US9277074B2 (en) Image processing apparatus, method, and medium determining whether image data of a page to be processed is blank and contains a foreground object and transmitting the foreground object obtained by removing a background object
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
US11082581B2 (en) Image processing apparatus and method for control to smooth a character region of a binary image and perform character recognition
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP6607496B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
JP4867903B2 (ja) 画像処理プログラム及び画像処理装置
US11443399B2 (en) Image processing apparatus for generating multiplexed information in which information is embedded in an image
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2005157928A (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
US11405525B2 (en) Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode
JP5825142B2 (ja) 画像処理装置、画像処理方法およびコンピュータープログラム
JP2005267119A (ja) 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム、記録媒体
JP6545592B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100623

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120323

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4960897

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees