JP5328510B2 - 画像処理装置、画像処理方法、コンピュータプログラム - Google Patents

画像処理装置、画像処理方法、コンピュータプログラム Download PDF

Info

Publication number
JP5328510B2
JP5328510B2 JP2009149799A JP2009149799A JP5328510B2 JP 5328510 B2 JP5328510 B2 JP 5328510B2 JP 2009149799 A JP2009149799 A JP 2009149799A JP 2009149799 A JP2009149799 A JP 2009149799A JP 5328510 B2 JP5328510 B2 JP 5328510B2
Authority
JP
Japan
Prior art keywords
color
character
information
quantization
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009149799A
Other languages
English (en)
Other versions
JP2011009924A (ja
Inventor
妙子 山▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009149799A priority Critical patent/JP5328510B2/ja
Priority to US12/818,670 priority patent/US8532385B2/en
Publication of JP2011009924A publication Critical patent/JP2011009924A/ja
Application granted granted Critical
Publication of JP5328510B2 publication Critical patent/JP5328510B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、文字画像部分の穴埋め処理を行う画像処理装置に関する。
近年、情報の電子化が進み、紙文書をそのまま保存するのではなく、スキャナ等を用いてスキャンして電子化して保存したり、その電子データ(画像)を他装置に送信したりするシステムが普及してきている。
一方、送信コストや保存コストを削減するため、電子化された文書に対して高い圧縮性が要求されている。また、電子化データを部分的に編集できる再利用性と、拡大しても縮小しても画質が落ちない高画質性も要求されている。
文字領域や写真領域が混在する文書画像を圧縮する場合、可逆圧縮方式で圧縮すると画質は良いが圧縮率が低くなり、写真領域に適した非可逆圧縮方式(JPEGなど)で圧縮すると圧縮率は高いが文字領域の画質が劣化してしまう。
そこで、電子化された文書画像を文字領域や線画領域、写真領域等に分離し、各領域に適した圧縮手法で圧縮することが考えられている。
特許文献1では、文字領域を抽出して、当該抽出した文字領域をMMR圧縮し、また、原画像の文字部分をその周囲の色で塗りつぶして縮小した後にJPEG圧縮し、それらの圧縮データをPDFなどのファイルにすることが記載されている。なお、特許文献1では、処理対象画像から2値画像を生成し、2値画像の画素の塊に基づいて文字領域を特定し、文字部分をその周囲の画素の平均色で塗る手法が提案されている。
また、文字領域や線画領域をベクトルデータに変換し、それ以外の容易にベクトル化で再現できない領域(写真領域など)をJPEGで圧縮し、各領域の圧縮データを合成して1つの電子ファイルとして出力することなども考えられている(特許文献2参照)。
特開2002−077633号公報 特開2007−272601号公報
一方、文字周囲の画素の色情報は文字画素周囲に発生する滲みの影響を受けやすい。そのため、特許文献1のように、文字領域を抜いた下地画像を作る際に文字部分を塗り潰す色を決定するためには、多くの画素の色情報を取得して平均を取る必要がある。しかしながら、文字画像ごとに平均色を求める処理を行うと、処理時間がかかる。
また一方、文字領域の背景は、単色であったり、複数の色(例えばグラデーション)であったりする。そこで、本発明では、各文字領域に適した文字部の塗り潰し処理(文字部分の穴埋め処理)を行うことにより、処理速度と画質向上の両立することを課題とする。
上記課題を解決するために、本発明の画像処理装置は、入力多値画像類似するごとに統合することにより複数の量子化領域を生成し、当該生成された量子化領域において縦・横・斜めの少なくともいずれで連結する連結成分を求め、当該求めた連結成分それぞれについて、属性情報と位置情報と色情報と包含関係にある他の連結成分の情報とを含む領域情報を得る領域解析手段と、前記領域解析手段で得た前記領域情報に基づいて、前記属性情報が文字属性と判定された連結成分に隣接する量子化領域を特定し、当該特定された量子化領域の数と当該特定された量子化領域の前記属性情報と当該特定された量子化領域の前記色情報とに基づいて、当該文字属性と判定された連結成分の穴埋め色を決定し、当該決定された穴埋め色を用いて当該文字属性と判定された連結成分の穴埋め処理を行う文字部穴埋め手段と、を有する画像処理装置であって、前記文字部穴埋め手段は、前記特定された量子化領域の数と当該特定された量子化領域の前記属性情報とに応じて、前記穴埋め色の決定方法を切り替えることを特徴とする。
本発明によれば、処理速度と画質の両方を保持した文字穴埋め処理が実現できる。
システム構成例 画像処理部の構成を説明するブロック図 画像処理の処理手順を説明する図 処理対象となる画像の例 領域解析処理および属性判定処理のフローチャート 量子化領域に関する情報、およびカラー連結成分に関する情報 実施形態1の文字部穴埋め処理のフローチャート 実施形態1の穴埋め色決定処理のフローチャート 画素由来の色情報を決定する際の説明図 生成される電子ファイルの例 実施形態2の文字部穴埋め処理のフローチャート 実施形態2の穴埋め色決定処理のフローチャート 実施形態3の穴埋め色決定処理のフローチャート
(実施形態1)
本実施形態では、カラー入力画像を類似色ごとに量子化して領域解析し、当該領域解析結果に基づいて文字領域の文字部穴埋め色の決定手法を切り替えるようにする。
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。図1は、実施形態1におけるシステム構成を示す図の一例である。
画像処理装置100は、本発明を実現するための画像処理装置の構成例であり、スキャナ101とCPU102とメモリ103とハードディスク104とネットワークI/F105とから成る。スキャナ101は、紙文書を読み取って画像データを生成する。CPU102は、コンピュータプログラムを実行することにより、画像データに本発明の画像処理を行う。メモリ103は、CPUがコンピュータプログラムを実行する際のワークメモリとして利用されたり、データの一時保存などに利用されたりする。ハードディスク104は、該コンピュータプログラムやデータを格納する保存部である。ネットワークI/F105は、ネットワーク110等を介して、外部装置とデータの入出力を行うためのインターフェースである。なお、本実施形態では、コンピュータプログラムは、ハードディスクに格納されているものとしたが、これに限るものではなく、その他のコンピュータ読み取り可能な記憶媒体であってもよい。また、このコンピュータプログラムは、ネットワークを介してダウンロードして実行できるようになっていてもよい。また、本実施形態においては、コンピュータが該コンピュータプログラムを実行することにより、図2に示すような本発明の各処理部として機能するものとするが、これに限るものではない。例えば、その処理部の一部または全部を電気回路等のハードウェアで実現するようにしてもよい。
パーソナルコンピュータ(PC)120は、画像処理装置100とLAN110などのネットワークを介して接続され、画像処理装置から送信されたデータを受信する。
図2は、本実施形態1の画像処理を実行する処理部の構成を説明する図である。図2の各処理部10〜40は、CPU102でコンピュータプログラムを実行することによって実現されるものとするが、その一部又は全部を電気回路で構成するようにしても構わない。
各処理部(各処理ユニット)は、領域解析部10、文字部ベクトル化処理部20、文字部穴埋め処理部30、電子ファイル生成部40で構成される。また、各処理部で処理対象とするデータや生成されるデータを、入力画像201、領域情報202、文字ベクトル203、下地画像204、電子ファイル205として示す。
また、図2で生成されるデータ201〜205が一時格納されるメモリや、コンピュータが各処理部10〜40として機能する際に必要なワークメモリは、メモリ103に確保される。
図3は、図2の各処理部により実行される処理手順を説明する図である。
ステップS10では、領域解析部10が、カラー入力画像201(多値画像)から文字部(文字領域)、図画部(図画領域)等を判別して領域分割する領域解析処理を行い、領域情報202を得る。
ステップS20では、文字部ベクトル化処理部20が、領域情報202に基づいて入力画像201から処理対象の文字領域を特定し、当該文字領域に含まれる文字部分の輪郭を検出してベクトル化処理を行う。このような処理を行うことにより、文字画像をベクトルデータ(文字ベクトル203)に変換する。
ステップS30では、文字部穴埋め処理部30が、入力画像201と領域情報202に基づいて、文字領域内の文字部分の穴埋め処理(入力画像における文字画像の部分を下地色で塗り潰す処理)を行い、下地画像204を生成する。
ステップS40では、電子ファイル生成部40が、領域情報202と文字ベクトル203と下地画像204とを統合して、電子ファイル205を生成する。
図2及び図3における各処理の詳細を以下に説明する。なお、以下では、図4のような入力多値画像201を例として用いて説明する。
<領域解析処理部10>
領域解析処理部10は、ステップS10において、入力多値画像201中の文字領域、図画領域等を判別し、領域を分割する。ここでは公知のカラー多値画像を領域分割する技術(例えば、国際公開番号WO2006/066325に記載の技術)を用いて領域解析処理を行う。図5(A)は、領域解析処理部10で実行する領域解析処理のフローチャートを示す。
ステップS101では、入力されたカラー多値画像を色量子化し、更に、類似する色を持つ領域を統合して、複数の領域に分割する。
ステップS102では、色量子化で得られた各領域の属性の判定を行う。ここでは、文字、図画部、ページ背景等の属性判定を行う。
図5(B)は、ステップS102で行われる属性判定処理の詳細を示すフローチャートである。
ステップS1021では、色量子化で得られた各領域を、各領域から求めた統計値(領域のサイズ、色分布等)に基づいて、各領域属性の大まかな分類を行う。ここでは、文字、単色背景、写真、多色背景に分類するものとする。
例えば、色の変化が少なく(すなわち色分布範囲が狭く)、面積があまり大きくない領域は、文字に分類される。なお、この分類の時点において、文字に分類される領域には、線画や表などの領域も含まれるものとする。色の変化が少なく、ページに対する面積が大きい領域は、単色背景に分類される。また、色の変化が大きいが、面積があまり大きくない領域は、写真に分類され、このような領域は前景として意味のあるものと見なす。また、色の変化があり、面積も大きい領域は、多色背景に分類される。
図4の領域2011,2012,2013,2014,2015,2016は、入力多値画像201を量子化領域に分割した結果であり、それぞれの領域は色量子化結果の代表色で統合された領域である。各量子化領域に関する詳細な情報を、図6(A)に示す。
領域2011にグラデーション等があった場合、色の変化があり(すなわち色分布範囲が広く)、面積も大きいため、多色背景と分類される。また、領域2012に色変化がない場合、面積も大きいので単色背景と分類される。また、領域2013,2014,2015,2016は、文字と分類されたとみなして次のステップへ進む。
ステップS1022では、量子化領域をカラーの画素連結成分に変換する。カラーの画素連結成分とは、同じ代表色を有する画素で縦・横・斜めのいずれかで連結している(接触している)画素群を指す。
ステップS1023では、カラー連結成分それぞれを、それぞれの連結成分の統計値を基に、詳細に分類する。ここで連結成分の統計値とは、該連結成分の外接矩形のサイズ、連結成分の画素数、連結成分の境界線長さ、平均色などとする。
ステップS1024では、カラー連結成分同士の包含関係を確認し、グループ化する。
ステップS1025では、グループ化した連結成分から領域情報202を生成する。領域情報202は、各カラー連結成分について、連結成分の識別子ID、属性情報(文字、線画、写真、表、枠、ページ背景など)、位置情報、色情報、包含関係にあるカラー連結成分の情報などが格納されているものとする。また、カラー連結成分の変換元となる量子化領域の情報も保持している。
図4の連結成分20111〜20161は、色量子化領域をカラー連結成分に変換してグループ化した結果として得られる各カラー連結成分である。このカラー連結成分に関する領域情報202を図6(B)に示す。図6(B)の領域情報では、20111と20121は背景の属性(それぞれ、多色背景、単色背景の属性)、20131〜20153は文字の属性、20161は線画の属性を有すると分類されている。
<文字部ベクトル化処理部20>
文字部ベクトル化処理部20は、ステップS20において、文字部分(文字属性の連結成分)をベクトルデータに変換するベクトル化処理を実行する。文字部ベクトル化処理の詳細を、以下で説明する。
領域情報202から、属性が文字である連結成分を取得し、当該連結成分の輪郭を公知のベクトル化技術を用いてベクトルデータに変換する。ベクトル化技術としては、例えば、特許第3026592号公報や特開2005-346137号公報に記載の技術を用いることができる。特許第3026592号公報記載の技術は、画像をラスタ走査しながら注目画素とその近傍画素の状態に基づいて、水平方向及び垂直方向の画素間ベクトルを検出する。次に、これら画素間ベクトル同士の接続状態をもとに、画像データの輪郭を抽出することで、アウトラインベクトルと呼ばれる連結画素データの周回を画素間ベクトルの集合で記述する情報を生成する技術を開示している。また、特開2005-346137号公報に記載の技術では、アウトラインベクトルを直線や2次や3次のベジェ曲線で近似することで、大きく変倍しても高画質なベクトル記述データをする技術を開示している。
以上の処理により、文字部ベクトル化処理部20により、文字ベクトル203が生成され、領域情報202に追記される。
<文字部穴埋め処理部30>
文字部穴埋め処理部30では、ステップS30で、下地となる背景画像(単色背景、多色背景の画像)における文字部の穴埋め処理(画素値置換処理)を行う。以下に、本願の特徴となる文字部穴埋め処理の詳細を説明する。図7は、文字部穴埋め処理部30で行われる文字部穴埋め処理のフローチャートである。
ステップS301では、文字部穴埋め処理の処理対象である量子化領域を取得する。文字ベクトル化された部分、すなわち、文字属性の連結成分に対応する位置が穴埋め処理されることになるので、図4において対象となるのは、量子化領域2013,2014,2015内に含まれる文字属性の連結成分に対応する個所となる。
ステップS302において、各連結成分に対応する個所の穴埋め色を決定する。穴埋め色決定処理の詳細を図8に示す。
図8のステップS3021では、処理対象となる量子化領域(文字属性の連結成分)に隣接する背景の量子化領域を取得する。すなわち、文字属性の連結成分の周囲を取り囲むように近接する量子化領域(包含する量子化領域)を取得し、ステップS3022へ遷移する。図4の例では、量子化領域2013内の文字属性の連結成分を包含する量子化領域(文字属性の連結成分に隣接する量子化領域)は2011である。
ステップS3022では、処理対象領域に隣接する包含量子化領域が、1つだけであるか否かを判定する。1つだけであればステップS3023に進み、1つだけでないならばステップS3025へ進む。例えば、図4の例では、量子化領域2013の文字属性の連結成分に隣接する量子化領域は2011、量子化領域2015の連結成分に隣接する量子化領域は2012であり、それぞれ1つだけなのでステップS3023に遷移する。一方、量子化領域2014に含まれる文字属性の連結成分を包含する量子化領域は、2011と2012の2つがあるため、ステップS3025へ遷移する。
ステップS3023では、包含量子化領域の属性が単色背景か否か(すなわち、色の変化が少ない量子化領域であるか否か)を判定する。単色背景と判定したならばステップS3024へ進み、多色背景と判定したならばステップS3025へ遷移する。例えば、量子化領域2013を包含する量子化領域2011の属性は多色背景であるので、NOと判定されてステップS3025へ遷移する。また、量子化領域2015を包含する量子化領域2012の属性は単色背景であるので、YESと判定されてステップS3024へ遷移する。
ステップS3024では、当該包含する量子化領域の色情報(代表色)を文字画素の穴埋め色として採用する。例えば、量子化領域2015の内部にあるカラー連結成分20151,20152,20153に相当する位置の画素に対しては、包含する単色背景の量子化領域2012のもつ色情報yyが穴埋め色となる。
一方、ステップS3025では、画素由来の色情報を文字部穴埋め色として採用する。ここで、画素由来の色情報とは、文字属性の連結成分を包含する量子化領域に基づいて分割し、分割された連結成分の周囲の画素の平均色を指すものとする。具体例を図9にあげる。図9は、量子化領域2014に含まれる文字「E」(カラー連結成分20142)の周辺を拡大した模式図である。カラー連結成分20142を包含する量子化領域は20111と20121が存在するので、当該包含量子化領域20111と20121の境界位置に基づいて、連結成分20142を左右半分(201421と201422)に分割する。そして、当該分割された連結成分201421の穴埋め色は、量子化領域20111内にある連結成分201421の周辺画素20112の平均色を採用する。一方、分割された連結成分201422に対しても同様に、量子化領域20121内にある連結成分201422の周辺画素20122の平均色を、穴埋め色として採用する。
同様の処理を量子化領域内の文字カラー連結成分ごとに実施して穴埋め色を決定する。画素由来の色情報を文字部穴埋め色として採用するのは、文字量子化領域2013,2014となる。
ステップS303では、ステップS302で決定された文字穴埋め色を用い、文字画素部分を塗りつぶすことによって、下地画像204を生成する。
<電子ファイル生成部40>
電子ファイル生成部40では、ステップS40において、前記生成された領域情報202および下地画像204を統合して、電子ファイル205を生成する。すなわち、文字部ベクトル化処理部20でベクトル変換した結果の文字ベクトルと、その文字ベクトルが再生されるべき位置情報と、下地画像204とを統合し、PC120で再生したり編集したりすることが可能なフォーマットの電子ファイルへ変換する。例えば、電子ファイルのフォーマットとしては、PDFやXMLなどを用いればよい。
図10は、本実施例の説明のために作られた仮想的なXMLフォーマットに従って作られた電子ファイル205の例である。図10において、imageタグで示されるbackgroud.pngに対応する画像が下地画像204であり、Vectorタグで示される各Pathが文字ベクトル203を示す。
以上説明したように、本実施例では、穴埋め色の決定方法を包含量子化領域の状態に応じて切り替えている。すなわち、文字属性の連結成分に隣接する量子化領域が、単色背景の属性を有する量子化領域が1つだけである場合は、当該文字連結成分周辺の平均色を算出することなく、単色背景の量子化領域の代表色で穴埋めを行う。したがって、文字領域単位一括で穴埋め色を決定できるので、処理速度が向上する。このとき、文字画素周囲の滲みの影響の少ない、より背景に近い色を採用できる。
一方、文字連結成分に隣接する量子化領域が単色背景1つだけでない場合は、包含量子化領域ごとに分割して文字画素周辺の平均値を求めて穴埋め色にするため、複雑な背景であっても適切な色で穴埋めが可能になる。
(実施形態2)
実施形態1では、領域単位で文字穴埋め色の決定方法を切り替えたが、文字連結成分単位で切り替えるようにしてもよい。実施形態2における文字部穴埋め処理のフローを図11および図12に示す。なお、実施形態1と同じステップ番号が付与されている処理は、実施形態1と同じであるため、詳細な説明を省く。
ステップS301で穴埋め対象の文字属性を有する量子化領域を特定した後、ステップS304において、カラー連結成分単位で文字穴埋め色を決定し、ステップS303で当該決定さえた穴埋め色で文字部分を塗りつぶす。
ステップS304の詳細を図12に示す。図12のステップS3041では、穴埋め対象領域中の文字連結成分を取得する。例えば、図4の2014が穴埋め対象領域であった場合、文字連結成分は20141,20142,20143のうちの1つを処理対象として選択し、ステップS3042へ遷移する。
ステップS3042では、処理対象となる文字連結成分に対して、その周囲を取り囲むように近接する関係にある包含カラー連結成分を取得し、ステップS3043へ遷移する。例えば、連結成分20141に隣接する包含カラー連結成分は20111である。
ステップS3043では、処理対象の連結成分に隣接する包含カラー連結成分が1つだけであるか否かを判定する。1つだけならばステップS3044、1つだけでなければステップS3025へ遷移する。例えば、連結成分20141を包含する連結成分は20111の1つだけ、連結成分20143を包含する連結成分は20121の1つだけであるので、これらが処理対象の場合はステップS3044に遷移する。一方、連結成分20142を包含するカラー連結成分は20111と20121の2つが存在するため、このときはステップS3025へ遷移する。
ステップS3044では、包含カラー連結成分の元となる量子化領域の属性が単色背景、すなわち色の変化が少ない量子化領域か否かを判定する。単色背景と判定した場合はステップS3024へ進み、多色背景と判定した場合はステップS3025へ遷移する。例えば、連結成分20143が処理対象の場合、包含カラー連結成分は20112であり、これの元となる量子化領域は2012である。量子化領域2012の属性は単色背景であるため、このときはステップS3024へ遷移する。一方、連結成分20141が処理対象の場合、包含カラー連結成分は20111であり、これの元となる量子化領域は2011である。量子化領域2011の属性は多色背景であるため、このときはステップS3025へ遷移する。
ステップS3024またはステップS3025の処理を行った後は、ステップS3045に遷移し、領域内に未処理の文字画素連結成分があるかを判定し、あればステップS3041へ戻って次の文字連結成分を処理対象とし、なければ処理を終了する。
以上説明したように、本実施形態2では、穴埋め色の決定方法を連結成分単位で、その包含連結成分および包含連結成分のもととなる量子化領域の状態により切り替える。
領域単位で見た場合に単色背景で囲まれていない領域であっても、連結要素単位で見た場合には単色背景で囲まれている場合がある。その場合は、量子化領域の色を塗りつぶし色として採用することが可能になる。
(実施形態3)
実施形態1、2ではそれぞれ領域単位、文字連結成分単位で穴埋め色を決定したが、同一フローで領域単位、文字連結成分の穴埋め色決定方法を組み合わせてもよい。図13は実施形態3におけるフローチャートである。
まず、ステップS3021〜S3023では、実施形態1と同様に、領域単位で処理対象とし、その隣接する包含量子化領域が1つで且つ単色背景であるか否かを判定する。包含量子化領域が1つで且つ単色背景である場合は、ステップS3024に進み、包含量子化領域の色情報を穴埋め色として用いる。一方、包含量子化領域が1つでない(S3022でNO)、もしくは単色背景でない(S3023でNO)と判定した場合、ステップS304に進み、実施形態2の図12と同様の処理を行う。すなわち、文字穴埋め色決定において、まず、文字領域単位で単色背景の量子化領域に基づいて穴埋め色を決定可能か判断し、決定できない場合は、更に、文字連結成分単位で穴埋め色の決定を行うように構成している。
これにより、量子化領域ごとに一括で高速に文字穴埋め色を決定する方法と、連結成分ごとに穴埋め色を決定する方法とを適応的に採用できる。

Claims (10)

  1. 入力多値画像類似するごとに統合することにより複数の量子化領域を生成し、当該生成された量子化領域において縦・横・斜めの少なくともいずれで連結する連結成分を求め、当該求めた連結成分それぞれについて、属性情報と位置情報と色情報と包含関係にある他の連結成分の情報とを含む領域情報を得る領域解析手段と、
    前記領域解析手段で得た前記領域情報に基づいて、前記属性情報が文字属性と判定された連結成分に隣接する量子化領域を特定し、当該特定された量子化領域の数と当該特定された量子化領域の前記属性情報と当該特定された量子化領域の前記色情報とに基づいて、当該文字属性と判定された連結成分の穴埋め色を決定し、当該決定された穴埋め色を用いて当該文字属性と判定された連結成分の穴埋め処理を行う文字部穴埋め手段と、を有する画像処理装置であって、
    前記文字部穴埋め手段は、前記特定された量子化領域の数と当該特定された量子化領域の前記属性情報とに応じて、前記穴埋め色の決定方法を切り替えることを特徴とする画像処理装置。
  2. 前記文字部穴埋め手段は、前記文字属性と判定された連結成分に隣接する量子化領域が1つで且つ単色背景の属性情報を有する場合は、当該隣接する量子化領域の前記色情報を前記穴埋め色として決定し、
    前記文字属性と判定された連結成分に隣接する量子化領域が複数あるいは多色背景の属性情報を有する場合は、当該連結成分の周囲の画素の平均色を前記穴埋め色として決定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記文字部穴埋め手段は、前記文字属性と判定された連結成分に隣接する量子化領域が複数である場合は、当該隣接する量子化領域に基づいて当該連結成分を分割し、当該分割された連結成分の周囲の画素の平均色を前記穴埋め色として決定することを特徴とする請求項2に記載の画像処理装置。
  4. 前記文字部穴埋め手段は、前記文字属性と判定された複数の連結成分を含む量子化領域ごとに、前記穴埋め色の決定方法を切り替えることを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。
  5. 前記文字部穴埋め手段は、前記文字属性と判定された連結成分ごとに、前記穴埋め色の決定方法を切り替えることを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。
  6. 前記文字部穴埋め手段は、前記文字属性と判定された複数の連結成分を含む量子化領域ごとに、前記文字属性と判定された連結成分に隣接する量子化領域が1つで且つ単色背景の属性情報を有するか否か判定し、
    当該判定の結果が1つで且つ単色背景の属性情報を有する場合は、当該隣接する量子化領域の色を前記穴埋め色として決定し、
    当該判定の結果が複数あるいは多色背景の属性情報を有する場合は、更に、前記文字属性と判定された連結成分ごとに、隣接する量子化領域が1つで且つ単色背景の属性情報を有するか否か判定した結果に応じて、前記穴埋め色の決定方法を切り替えることを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。
  7. 前記領域解析手段で文字属性と判定された連結成分をベクトルデータに変換するベクトル化処理手段と、
    前記ベクトル化処理手段で変換されたベクトルデータと、前記文字部穴埋め手段で穴埋め処理された画像とを含む電子ファイルを生成する電子ファイル生成手段と、
    を更に有することを特徴とする請求項1乃至6のいずれかに記載の画像処理装置。
  8. 領域解析手段が、入力多値画像類似するごとに統合することにより複数の量子化領域を生成し、当該生成された量子化領域において縦・横・斜めの少なくともいずれで連結する連結成分を求め、当該求めた連結成分それぞれについて、属性情報と位置情報と色情報と包含関係にある他の連結成分の情報とを含む領域情報を得る領域解析工程と、
    文字部穴埋め手段が、前記領域解析工程で得た前記領域情報に基づいて、前記属性情報が文字属性と判定された連結成分に隣接する量子化領域を特定し、当該特定された量子化領域の数と当該特定された量子化領域の前記属性情報と当該特定された量子化領域の前記色情報とに基づいて、当該文字属性と判定された連結成分の穴埋め色を決定し、当該決定された穴埋め色を用いて当該文字属性と判定された連結成分の穴埋め処理を行う文字部穴埋め工程と、を有する画像処理方法であって、
    前記文字部穴埋め工程では、前記特定された量子化領域の数と当該特定された量子化領域の前記属性情報とに応じて、前記穴埋め色の決定方法を切り替えることを特徴とする画像処理方法。
  9. コンピュータを、
    入力多値画像類似するごとに統合することにより複数の量子化領域を生成し、当該生成された量子化領域において縦・横・斜めの少なくともいずれで連結する連結成分を求め、当該求めた連結成分それぞれについて、属性情報と位置情報と色情報と包含関係にある他の連結成分の情報とを含む領域情報を得る領域解析手段、
    前記領域解析手段で得た前記領域情報に基づいて、前記属性情報が文字属性と判定された連結成分に隣接する量子化領域を特定し、当該特定された量子化領域の数と当該特定された量子化領域の前記属性情報と当該特定された量子化領域の前記色情報とに基づいて、当該文字属性と判定された連結成分の穴埋め色を決定し、当該決定された穴埋め色を用いて当該文字属性と判定された連結成分の穴埋め処理を行う文字部穴埋め手段、
    として機能させるためのコンピュータプログラムであって、
    前記文字部穴埋め手段では、前記特定された量子化領域の数と当該特定された量子化領域の前記属性情報とに応じて、前記穴埋め色の決定方法を切り替えることを特徴とするコンピュータプログラム。
  10. 請求項9に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2009149799A 2009-06-24 2009-06-24 画像処理装置、画像処理方法、コンピュータプログラム Active JP5328510B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009149799A JP5328510B2 (ja) 2009-06-24 2009-06-24 画像処理装置、画像処理方法、コンピュータプログラム
US12/818,670 US8532385B2 (en) 2009-06-24 2010-06-18 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009149799A JP5328510B2 (ja) 2009-06-24 2009-06-24 画像処理装置、画像処理方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2011009924A JP2011009924A (ja) 2011-01-13
JP5328510B2 true JP5328510B2 (ja) 2013-10-30

Family

ID=43380796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009149799A Active JP5328510B2 (ja) 2009-06-24 2009-06-24 画像処理装置、画像処理方法、コンピュータプログラム

Country Status (2)

Country Link
US (1) US8532385B2 (ja)
JP (1) JP5328510B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9641572B1 (en) * 2012-05-17 2017-05-02 Google Inc. Generating a group photo collection
JP5697649B2 (ja) 2012-11-27 2015-04-08 京セラドキュメントソリューションズ株式会社 画像処理装置
JP6370080B2 (ja) * 2014-04-02 2018-08-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム。
US11170511B2 (en) * 2017-03-31 2021-11-09 Sony Semiconductor Solutions Corporation Image processing device, imaging device, and image processing method for replacing selected image area based on distance
US10740644B2 (en) * 2018-02-27 2020-08-11 Intuit Inc. Method and system for background removal from documents
CN110458232B (zh) * 2019-08-13 2023-05-30 腾讯科技(深圳)有限公司 一种确定图像风格相似度的方法及设备
CN113658111B (zh) * 2021-07-27 2023-12-12 武汉理工大学 用于建筑物或构筑物的裂纹检测方法、系统、装置和介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3026592B2 (ja) * 1990-10-22 2000-03-27 キヤノン株式会社 輪郭抽出方法及びその装置
JP4189506B2 (ja) * 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
EP1173003B1 (en) * 2000-07-12 2009-03-25 Canon Kabushiki Kaisha Image processing method and image processing apparatus
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP4366003B2 (ja) 2000-08-25 2009-11-18 キヤノン株式会社 画像処理装置及び画像処理方法
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
US7103858B2 (en) * 2004-04-14 2006-09-05 Lsi Logic Corporation Process and apparatus for characterizing intellectual property for integration into an IC platform environment
US7873218B2 (en) * 2004-04-26 2011-01-18 Canon Kabushiki Kaisha Function approximation processing method and image processing method
JP4371911B2 (ja) 2004-05-31 2009-11-25 キヤノン株式会社 関数化処理方法及び関数化処理装置
JP4345609B2 (ja) * 2004-08-12 2009-10-14 富士ゼロックス株式会社 画像処理装置およびプログラム
WO2006051482A1 (en) * 2004-11-15 2006-05-18 Koninklijke Philips Electronics N.V. Detection and modification of text in a image
JP2006251902A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
JP2007019673A (ja) * 2005-07-05 2007-01-25 Konica Minolta Business Technologies Inc 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造
JP4817821B2 (ja) * 2005-12-01 2011-11-16 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4764231B2 (ja) * 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
JP4878209B2 (ja) * 2006-05-15 2012-02-15 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP2008042346A (ja) * 2006-08-02 2008-02-21 Canon Inc 画像処理方法、画像処理装置
US8041135B2 (en) * 2006-10-20 2011-10-18 Canon Kabushiki Kaisha Image encoding apparatus and control method thereof
JP5132530B2 (ja) * 2008-02-19 2013-01-30 キヤノン株式会社 画像符号化装置及び画像処理装置及びそれらの制御方法
JP4950929B2 (ja) * 2008-04-01 2012-06-13 キヤノン株式会社 画像ファイル編集装置、画像ファイル編集方法及びプログラム
JP5302768B2 (ja) * 2008-06-26 2013-10-02 キヤノン株式会社 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
JP2011009924A (ja) 2011-01-13
US20100329551A1 (en) 2010-12-30
US8532385B2 (en) 2013-09-10

Similar Documents

Publication Publication Date Title
JP5328510B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US8417029B2 (en) Image processing apparatus and method, including fill-up processing
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP4047192B2 (ja) 画像圧縮装置及び方法、画像伸張装置及び方法、プログラム
US8077986B2 (en) Information processing apparatus, method of controlling same and computer program
JP2000175052A (ja) ピクセルマップ表現の処理方法及び装置
JP2006121645A (ja) 画像圧縮装置および画像圧縮プログラム
US8417042B2 (en) Image processing apparatus, control method and computer-readable medium
JP2005012768A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JPH11150660A (ja) 情報圧縮方法、圧縮装置、情報処理方法、情報処理装置、及び、記録媒体
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP2007088912A (ja) 画像処理装置およびプログラム
JP2007005907A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
US8422774B2 (en) Image processing method, image processing apparatus and program storage medium
US20120013959A1 (en) Image processing apparatus
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP4719924B2 (ja) 画像処理装置および画像処理方法
JP2004128881A (ja) 画像圧縮装置、画像伸長装置及びそれらの方法、プログラム
JP2004128880A (ja) 画像圧縮装置、画像伸長装置及びそれらの方法、プログラム
JP5424785B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4957572B2 (ja) 画像処理装置、画像処理システム、画像処理方法および画像処理プログラム
JP5321364B2 (ja) 画像処理装置、画像処理方法、プログラム
JP4757172B2 (ja) 画像符号化装置及びその制御方法
JP4696738B2 (ja) 画像データの圧縮方法および装置並びに擬似階調画像の復元方法
JP4047207B2 (ja) 画像符号化装置、画像符号化方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130723

R151 Written notification of patent or utility model registration

Ref document number: 5328510

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151