JP2005190010A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2005190010A
JP2005190010A JP2003428104A JP2003428104A JP2005190010A JP 2005190010 A JP2005190010 A JP 2005190010A JP 2003428104 A JP2003428104 A JP 2003428104A JP 2003428104 A JP2003428104 A JP 2003428104A JP 2005190010 A JP2005190010 A JP 2005190010A
Authority
JP
Japan
Prior art keywords
data
character
pixel
line drawing
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003428104A
Other languages
English (en)
Other versions
JP2005190010A5 (ja
Inventor
Masahiro Kato
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2003428104A priority Critical patent/JP2005190010A/ja
Publication of JP2005190010A publication Critical patent/JP2005190010A/ja
Publication of JP2005190010A5 publication Critical patent/JP2005190010A5/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 画質の向上等を図ることのできる画像処理装置を提供する。
【解決手段】 処理対象となった画像データから文字又は線画を構成する画素を抽出し、当該抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能な部分を特定し、当該特定した部分の画素を描画するベクトルデータを生成し、抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能として特定されなかった部分を表すビットマップデータを再現するデータを生成する画像処理装置である。
【選択図】 図1

Description

本発明は、画像データから文字部分と絵柄部分とを分離して所定処理を行う画像処理装置に関する。
ラスタ画像のデータ(以下、区別するべき場合を除いて単に「画像データ」と呼ぶ)には、文字(テキスト)部分や、自然画の部分(絵柄部分)など、互いに性状の異なる多くの画像要素が含まれ得る。こうした画像要素は、その性状の相違から、例えば圧縮処理において異なる方式での圧縮が適していたりするなど、画像要素ごとに異なる画像処理を行うことが好ましい場合が多い。
そこで従来から、いわゆるT/I分離と呼ばれる画像処理が研究・開発されている。従来、T/I分離の方法としては、例えば処理対象画像を二値化し、黒画素の連続する領域を画定し、当該画定した領域のサイズが予め定めたしきい値を下回る場合に当該領域に含まれる黒画素が文字を表すものと判定する方法等がある(特許文献1)。
また、こうして文字部分として判定された領域については、当該領域に含まれる画素値に基づいてそれらの画素の代表的な色を決定し、各文字を構成する画素の値を当該代表的な色の値に設定することで圧縮率をさらに高めているものがある(特許文献2)。
特開2003−8909号公報(段落番号0026を参照) 特開2002−165105号公報 特開2002−175532号公報
しかしながら、表など、罫線・色・文字などの複合体で構成されている部分については、場合によっては文字線画でないと判断されて絵柄として圧縮されてしまう場合があった。
本発明は上記実情に鑑みて為されたもので、表などベクトルデータに変換可能な部分をベクトルデータに変換し、ベクトルデータに変換されなかった部分について文字線画として扱うことで、画質の向上等を図ることのできる画像処理装置を提供することをその目的の一つとする。
上記従来例の問題点を解決するための本発明は、画像処理装置であって、処理対象となった画像データから文字又は線画を構成する画素を抽出する手段と、前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能な部分を特定し、当該特定した部分の画素を描画するベクトルデータを生成するベクトルデータ生成手段と、前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能として特定されなかった部分を表すビットマップデータを再現するデータを生成する手段と、を含むことを特徴としている。
表などベクトルデータに変換可能な部分をベクトルデータに変換し、ベクトルデータに変換されなかった部分について文字線画として扱うことで、画質の向上等を図ることができる。
また、前記ベクトルデータ生成手段は、前記抽出された文字又は線画を構成する画素に対して表認識処理を行い、ベクトルデータに変換可能な部分として表を構成する画素として認識された部分を特定することとしてもよい。
さらに、前記ベクトルデータに変換可能な部分として特定された表内部の画素であって、前記文字又は線画を構成する画素として抽出されていない各画素について可逆圧縮処理を行い、当該可逆圧縮処理結果と前記ベクトルデータとを関連づけて出力することとしてもよい。
また、上記従来例の問題点を解決するための本発明は、画像処理装置であって、前記可逆圧縮処理の対象となる各画素が連結して構成される連結画素成分ごとに一色以上の代表色を決定し、当該決定した代表色を連結画素成分を構成する各画素に割り当てた後に前記可逆圧縮処理を実施することを特徴としている。
また、上記従来例の問題点を解決するための本発明は、画像処理方法であって、処理対象となった画像データから文字又は線画を構成する画素を抽出する工程と、前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能な部分を特定し、当該特定した部分の画素を描画するベクトルデータを生成する工程と、前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能として特定されなかった部分を表すビットマップデータを再現するデータを生成する工程と、を含むことを特徴としている。
また、本発明のある態様に係るプログラムは、コンピュータに、処理対象となった画像データから文字又は線画を構成する画素を抽出する手順と、前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能な部分を特定し、当該特定した部分の画素を描画するベクトルデータを生成する手順と、前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能として特定されなかった部分を表すビットマップデータを再現するデータを生成する手順と、を実行させることを特徴としている。
本発明の実施の形態に係る画像処理装置は、図1に示すように、制御部11と記憶部12と画像入力部13と画像出力部14とを含んで構成されている。制御部11は、記憶部12に格納されているプログラムに従って動作しており、後に説明する各画像処理を遂行する。この画像処理の内容については、後に詳しく述べる。
記憶部12は、制御部11によって実行されるプログラムを保持している。またこの記憶部12は、制御部11の処理の過程で生成される各種データ等を格納するワークメモリとしても動作する。具体的にこの記憶部12は、コンピュータ可読な記録媒体と当該記録媒体に対してデータを書き込み、又は当該記録媒体からデータを読み出す装置(例えばハードディスク装置やメモリ装置)として実装できる。
画像入力部13は、例えばスキャナであり、原稿を光学的に読み取って得られた画像データを制御部11に出力する。ここではこの画像入力部13が出力する画像データにおいて、各画素の値がRGB(赤、緑、青)の色空間で表現されているとする。画像出力部14は、制御部11から入力される指示に従って画像データを出力するもので、例えば画像形成部(プリンタ等)に出力し、又はネットワークを介して外部の装置に送信する等の処理を行うものである。
次に制御部11の処理の内容について説明する。本実施の形態の制御部11は、図2に機能的に示すように、画像入力部13から入力される画像データを処理対象として、この処理対象となった画像データに対して、所定前処理を行う前処理部21と、文字線画を抽出する文字線画抽出処理部23と、レイアウト処理を遂行するレイアウト処理部24と、表領域処理部28と、文字線画処理部25と、絵柄部分処理部26と、圧縮処理部27とを含んで構成されている。
以下、これら各部について具体的に説明する。
[前処理部]
この前処理部21では、画像入力部13から入力される画像データ(処理対象画像データ)の各画素の値をRGBからYCbCr(輝度と色差とからなる値)に変換する。具体的には、次の(1)式を用いて変換を行うことができる。なお、ここではRGBの各成分の値は0x00(「0x」は16進数であることを示す)から0xFFまでの値であるとしている。また、この前処理部21では、下地領域の輝度・彩度に基づいて各画素値を階調補正してもよい。尤も、この階調補正の処理は、必ずしも必要なものではない。
Figure 2005190010
[文字線画抽出処理部]
文字線画抽出処理部23は、前処理部21が出力するYCbCr色空間で表現された画像データから文字線画部分を抽出する処理を行う。この処理は、例えば特許文献3に開示されている通りの処理を用いることができる。
そして文字線画抽出処理部23は、個々の文字や、線画部分についてそれらを取囲む矩形(文字線画外接矩形)の座標情報を記憶部12に格納する。
[レイアウト処理部]
レイアウト処理部24は、処理対象画像データのうち文字線画外接矩形によって画定される領域内部の画素を処理対象としてレイアウト解析処理を行い、個々の文字の配置状態(行又は列方向に対する個々の文字の配列)を検出する。また、このレイアウト処理部24は、表(テーブル)を構成する画素部分を特定する(表認識処理)。この表認識処理は、広く知られているので詳細な説明は省略するが、具体的には上記処理対象となった画素群について、罫線(線分)抽出処理を行って罫線を抽出し、この抽出した罫線と文字の配列状態とに基づき、表に含まれる各欄(セル)を画定し、さらに画定した各セルの位置を解析して表構造データ(表の外接矩形を画定する座標情報など)を生成するなどの処理によって行われる。レイアウト処理部24は、ここで抽出された罫線を構成する画素を特定する情報や表構造データを罫線画素情報として記憶部12に格納する。
[表領域処理]
表領域処理部28は、レイアウト処理部24によって特定された、表(テーブル)を構成する画素部分を、ベクトルデータに変換可能な部分として、当該部分の画素を描画するベクトルデータを生成する。具体的には、記憶部12に格納されている罫線画素情報を参照し、当該罫線画素情報によって特定される画素で構成される各罫線を描画するベクトルデータを生成する。例えば端点座標が(Xs,Ys)から(Xe,Ye)で示されている罫線については、ポストスクリプト(登録商標)を用いて、
Xs Ys moveto
Xe Ye lineto
stroke
のような記述情報をベクトルデータとして生成する。
またこの表領域処理部28は、表構造データを参照して、処理対象画像データ(元の画像データ)上で、上記テーブルに外接する矩形内部の画素のうち、文字線画抽出処理部23によって抽出された画素を除去(除去されたことを表す画素値に設定する)して部分画像データを取り出す。そしてこの部分画像データに穴埋処理を行う。すなわち、この部分画像データの各画素をラスタスキャン順(左から右へと1ラインずつ走査し、各ラインを上から下へと走査する順)に走査し、走査により選択される注目画素が除去された画素でなければ、当該注目画素の画素値をそのままとするとともに、当該注目画素の画素値を直前画素値として記憶部12のワークメモリに記憶する。なお、既に他の画素値が直前画素値として記憶されている場合は、その記憶内容に上書きする。
また、走査により選択される注目画素が除去された画素である場合、当該注目画素の画素値を、記憶している直前画素値に設定する。これにより除去された部分の画素値が、ラスタスキャン順に直前画素値と同一になる。表領域処理部28は、穴埋処理後のこの部分画像データを、ランレングス圧縮などで可逆的に圧縮してもよい。また、圧縮する前処理として穴埋処理後のこの部分画像データの代表色を決定し、決定した代表色をこの部分の画像データに一様に割り当てても良い。この代表色は、画像データが予め保有する色情報に基づき算出しても良いし、予め決定しておいた色を用いても良い。この際、多値の可逆圧縮方式(JBIG2やPNGなど)を用いることが好ましい。表領域処理部28は、生成した穴埋処理後のこの部分画像データ、又はそれを圧縮したデータを、テーブル背景画像データとして記憶部12に格納する。
[文字線画処理]
文字線画処理部25は、図3に示すように、色数算出部51と、限定色化部52と、第1圧縮部53と、線分色画像生成部54と、第2圧縮部55と、第3圧縮部56とを含んで構成される。
ここで色数算出部51は、記憶部12に格納されている文字線画外接矩形の各々について、それらの文字線画外接矩形に内包される画素のうち、記憶部12に格納されている文字線分画像データのビットマップデータに含まれる画素(以下、この画素を特定画素と呼ぶ)について、その画素値の種類の数、つまり色の数をカウントする。
この色の数をカウントする処理は、図4に機能的な構成を示すように、代表色候補関連付け部61と、画素数算出部62と、判定部63と、新規代表色候補決定部64と、代表色決定部65とを含んで構成される。
代表色候補関連付け部61は、現在の代表色候補のセットを記憶部12から読み出して、処理対象となった画素群の各画素について、代表色候補のいずれかを関連付ける。例えば、代表色候補関連付け部61は、上記特定画素を構成する各画素から順次、一つずつ注目画素を選択し、この注目画素の画素値と、各代表色候補の画素値との色空間上での距離を演算する。そして、そのうち、最も距離の小さい代表色候補を、当該注目画素を特定する情報(例えばその座標情報)に関連付けて記憶部12に代表色候補関係データベースとして格納していく。
画素数算出部62は、代表色候補ごとに、記憶部12に格納された代表色候補関係データベース内での出現数をカウントして出力する。判定部63は、出現数が所定の閾値を超えるか否かを判断し、当該所定の閾値を超える場合に文字線画外接矩形内の特定画素で構成される文字や線画が1色であると判断する。また、出現数が所定の閾値を超えない場合は、文字線画外接矩形内の特定画素で構成される文字や線画が1色でないと判断し、処理を終了する。
ここで所定の閾値は、予め一定の値としておいてもよいし、処理対象とした特定画素の全画素数に基づいて定めてもよい。例えば、全画素数Nに対してその8割である、0.8×Nを所定の閾値として定めてもよい。
さらに、この判定部63は、文字線画外接矩形内の特定画素で構成される文字や線画が1色でないと判断したときには、その判断回数をカウントしておき、判断回数が予め定めた最大回数になったときに、処理を終了する。
新規代表色候補決定部64は、文字線画外接矩形内の特定画素で構成される文字や線画が1色でないと判断されたときに、代表色候補関係データベースを参照して、出現数の多い順に複数の代表色候補を選択する。例えば出現数の上位2つの代表色候補を選択する。そして新規代表色候補決定部64は、選択した代表色候補に基づいて少なくとも一つの新規代表色を決定して、当該決定した新規代表色を代表色候補のセットに含め、代表色候補関連付け部61に対して処理を繰返すように指示する。ここで新規代表色は、選択した代表色候補の平均画素値として決定してもよい。
代表色決定部65は、判定部63が処理を終了したときに、その判定結果を参照して代表色を決定する。具体的には、判定部63が特定画素で構成される文字や線画が1色であると判断した場合には、特定画素の画素値のヒストグラムを生成し、最頻値となる画素値を代表色として決定する。代表色決定部65は、この代表色を記憶部12に代表色情報として格納する。
また、判定部63が特定画素で構成される文字や線画が1色でないと判断した場合には、特定画素の各画素値をグループ化する処理を行って、グループごとに代表的な色を決定する。具体的に、代表色決定部65は、特定画素のうち未だにグループ化されていない画素の一つを注目画素として選択し、また、特定画素のうち未だにグループ化されていない画素であって注目画素として選択していない画素を一つずつ、順次、対象画素として選択する。そして、この注目画素の画素値と対象画素の画素値とを次に示すように比較して、注目画素と同一のグループ(互いに同一色と判断されるグループ)に属するか否かを判断する。
なお、以下の説明では注目画素の画素値と対象画素の画素値との色空間上の距離を算出し、この距離が所定のしきい値より小さい場合に、同一のグループに属すると判断する。そしてグループごとに、同一グループに属すると判断された画素値の平均値をグループ代表画素値として決定する。そして、このグループ代表画素値のセットを記憶部12に代表色情報として格納する。
このように色数算出部51は、文字線画外接矩形ごとに、その内部に含まれる特定画素の色数と、当該代表色情報とを決定することになる。
本実施の形態において特徴的なことの一つは、上記色数をカウントする処理のように、一つの線分を構成する連結画素(隣接した画素同士が所定の背景画素値から異なる値となっており、これらが連結して一つの塊を形成している画素群)を単位とし、この連結画素を単位として見たときに有意と考えられる色数を求めていることである。これにより、例えば、元の画像データが、紙原稿をスキャンしたことにより得られており、もともと線分であった部分のエッジが鈍り、エッジ部分と線分の中心部とが少々異なる色となる場合でも、線分として有意な色は1色と判定される。一方、明らかなグラデーションを持つ線分においては、当該線分が複数の色を持つと判定される。
そして色数算出部51は、カウントされた色の数と、予め利用者から受け入れて記憶している設定情報とに応じて文字線画外接矩形内の特定画素の情報の出力先を次のように振り分ける。すなわち、色数算出部51は、カウントされた色の数が「1」であれば、その文字線画外接矩形内の特定画素の情報を第3圧縮部56に出力する。また、カウントされた色の数が複数ある場合は、予め利用者から受け入れて記憶している設定情報を参照して、限定色化部52又は線分色画像生成部54の一方に出力する。
限定色化部52は、入力された文字線画外接矩形内の特定画素の各々について減色処理を行い、当該文字線画外接矩形に関連してカウントされた色の数まで減色する。具体的には、特定画素の各々を、当該文字線画外接矩形に関連して定められた代表色(代表色情報に含まれる代表色)のいずれかのうち、画素値間の色空間上での距離が最小となる代表色にそれぞれ設定する。
第1圧縮部53は、限定色化部52が出力する文字線画外接矩形内の特定画素(限定色化したもの)について、多値かつ可逆な圧縮方式(例えばJBIG2やPNGなど)で圧縮処理する。
ここで限定色化部52は、例えばカウントされた色の数が所定しきい値より大きい場合、線分にグラデーション修飾など施されているケースがあり、このケースでは減色処理によって再現性が低下することがあるので、限定色化せずにそのまま第1圧縮部53に文字線画外接矩形内の特定画素の情報を出力してもよい。
線分色画像生成部54は、入力された文字線画外接矩形内の特定画素の画素値を含む画像データを線分色画像として生成する。例えば、この線分色画像生成部54は、上記文字線画外接矩形内の特定画素からなる画像データについて、穴埋処理を行う。すなわち、この画像データ内の各画素をラスタスキャン順(左から右へと1ラインずつ走査し、各ラインを上から下へと走査する順)に走査し、走査により選択される注目画素が特定画素であれば、当該注目画素の画素値をそのままとするとともに、当該注目画素の画素値を直前画素値として記憶部12のワークメモリに記憶する。なお、既に他の画素値が直前画素値として記憶されている場合は、その記憶内容に上書きする。また、走査により選択される注目画素が特定画素でない場合、当該注目画素の画素値を、記憶している直前画素値に設定する。そして線分色画像生成部54は、この穴埋処理結果の画像データを線分色画像として出力する。なお、線分色画像生成部54は、線分色画像のサイズを縮小して出力してもよい。
第2圧縮部55は、線分色画像を所定圧縮方式で圧縮処理する。この圧縮方式は可逆であっても非可逆(JPEGなど)であっても構わない。
第3圧縮部56は、入力される文字線画外接矩形内の特定画素の情報について、当該特定画素を二値化した二値化画像データを生成し、当該二値化画像データを可逆な圧縮方法で圧縮処理する。この圧縮処理としては例えばMMR等のランレングス圧縮方法などがある。
すなわち文字線画処理部25は、文字線画外接矩形のそれぞれについてレイアウト解析処理を行い、その結果、テーブルなどベクトルデータを生成できると判断される画素については、ベクトルデータに変換して、文字線画プレーン要素データとして記憶部12に格納する。また文字線画外接矩形の画素のうち、ベクトルデータに変換できなかった画素(特定画素)が1色である場合は、当該特定画素を二値化し、文字線画外接矩形内の画素を可逆圧縮して文字線画プレーン要素データとして記憶部12に格納する。
さらに、文字線画外接矩形内の特定画素が1色でない場合は、別途決定した代表色のセットで示される色に、特定画素を限定色化し、多値の可逆圧縮を行って出力する。また、文字線画外接矩形内の特定画素が1色でない場合には、利用者の設定により、線分色画像を生成し、この線分色画像と文字線画外接矩形内の特定画素を二値化した情報とを文字線画プレーン要素データとして記憶部12に格納することとしてもよい。
文字線画処理部25は、これら記憶部12に格納した文字線画プレーン要素データを含むデータを生成し、このデータを文字線画プレーンデータとして記憶部12に格納する。なお、各文字線画プレーン要素データには、関連する文字線画外接矩形を画定する座標情報を関連付けておく。
[絵柄部分処理部]
絵柄部分処理部26は、元の画像データの画素のうち、文字線画外接矩形内の画素を除去して絵柄部分画像データを生成する。そして、この絵柄部分画像データの各画素をラスタスキャン順に走査し、走査により選択される注目画素が除去された画素でなければ、当該注目画素の画素値をそのままとするとともに、当該注目画素の画素値を直前画素値として記憶部12のワークメモリに記憶する。なお、既に他の画素値が直前画素値として記憶されている場合は、その記憶内容に上書きする。
また、走査により選択される注目画素が除去された画素である場合、当該注目画素の画素値を、記憶している直前画素値に設定する。これにより除去された部分の画素値が、ラスタスキャン順に直前画素値と同一になり、多くの圧縮処理において圧縮効率を向上させることができるようになる。
そしてこの処理を行った後の絵柄部分画像データを絵柄プレーンデータとして記憶部12に格納する。
[圧縮処理部]
圧縮処理部27は、記憶部12に格納されている絵柄プレーンデータをJPEG圧縮し、圧縮絵柄プレーンデータを生成する。また、この圧縮処理部27は、記憶部12に格納されている文字線画プレーンデータとテーブル背景画像データ並びに、圧縮絵柄プレーンデータを連結して一連のデータを生成する。
具体的にこの一連のデータとしては、PDF(Portable Document
Format)データとすることができる。すなわち、圧縮絵柄プレーンデータを伸長して生成したビットマップ(絵柄プレーンデータのビットマップ)を生成させる指示と、当該絵柄プレーンデータのビットマップ上に文字線画プレーンデータに含まれる各文字や線画を描画させる指示とを含むPDFデータとする。
ここで文字線画プレーンデータに含まれる各文字や線画を描画させる指示は、ベクトルデータについては、当該ベクトルデータそのものである。また、二値化され可逆圧縮された文字線画外接矩形内の画素については、当該圧縮を伸長して描画する指示であり、多値の可逆圧縮された情報については、当該圧縮を伸長して描画する指示である。さらに、線分色画像と文字線画外接矩形内の特定画素を二値化した情報とで表される文字線画プレーン要素データであれば、当該二値化された情報をマスクとして、線分色画像内の画素を抽出する指示とすることができる。このとき、線分色画像のサイズが縮小されている場合は、これを元のサイズに拡大してから、二値化された情報をマスクとして当該拡大後の線分色画像内の画素を抽出する指示とする。
さらに、これらの指示に基づいて生成したビットマップデータを、絵柄プレーンデータのビットマップ上で、関連する文字線画外接矩形を画定する座標情報に示される位置に透過合成する指示を含む。ここで透過合成とは、二値化画像のうち黒画素(代表色に設定された画素)以外の画素については上書きせず、代表色に設定された画素のみを上書きすることをいう。
圧縮処理部27は、この生成したPDFデータを記憶部12に格納し、または画像出力部14にこのPDFデータを出力して、外部の装置に送出させる。
[動作]
本実施の形態の画像処理装置は、上述の構成を有しているので、次のように動作する。ここでは図5に示すような文字部分(T1,T2)と、写真部分(P)と、線画部分としての表(テーブル)(E)とを含むドキュメントが画像入力部13から入力され、このドキュメントの画像データを処理対象とする場合を例として説明する。この図5の例においては写真部分(P)内に文字部分の一部(T2)が重ね合わせられている。またテーブル部分(E)には、罫線と文字とが入組んでいる。なお、ここでは便宜的に白黒で示しているが、実際には地図部分の道路線図と文字とは互いに異なる色で表され、写真はカラーで構わない。
前処理部21は、この画像データの画素値を所定色空間(YCbCr)の値に変換する。文字線画抽出処理部23は、前処理部21が出力するYCbCr色空間で表現された画像データをラスタスキャン順に走査しながら選択し、当該選択した画素の近傍で、画素値の移動平均を算出し、当該移動平均と選択した画素の値との比較によって、当該選択した画素を白又は黒に決定して、文字線画部分を黒画素として抽出する。
そしてレイアウト処理部24がこの文字線画部分に対してレイアウト解析処理を行い、罫線や文字、表(テーブル)部分(E)を識別する。表領域処理部28は、当該テーブルを構成する罫線で囲まれる画素のうち、文字線画として抽出されていない画素に基づくテーブル背景画像データを生成し、テーブルを構成する罫線をベクトルデータに変換する。また文字線画処理部25は、ベクトルデータに変換できなかった文字線画部分の画素について、レイアウト解析処理によって特定される文字や線分ごとに、含まれる色数(互いに異なる画素値の数)が1色であるか否かに応じて異なる圧縮方法で圧縮処理する。この処理によって文字部分(T1,T2)や、テーブル内の文字がここで圧縮される。
絵柄部分処理部26は、元の画像データから文字線画部分として抽出された画素を除去して絵柄画像データ(写真部分Pを含む画像)を生成して穴埋処理を行う。そしてさらに、絵柄画像データについて圧縮処理部27によって圧縮処理して、圧縮絵柄画像データを生成する。
そしてこの圧縮絵柄画像データと、上記ベクトルデータや圧縮された文字線画の画像データと、背景画像データとを連結し、一連の画像データとして出力する。
ここで圧縮処理部27は、絵柄プレーンデータについてJPEG圧縮の前に画像のサイズを縮小する処理(縮小処理)を行って圧縮率をより向上させることとしてもよい。
本発明の実施の形態に係る画像処理装置の一例を表す構成ブロック図である。 本発明の実施の形態に係る画像処理装置の制御部によって実行される処理内容を表す機能ブロック図である。 文字線画処理部25の処理内容例を表す機能ブロック図である。 色数算出部51の処理例を表す機能ブロック図である。 本発明の実施の形態の画像処理装置の動作の例を表す説明図である。
符号の説明
11 制御部、12 記憶部、13 画像入力部、14 画像出力部、21 前処理部、23 文字線画抽出処理部、24 レイアウト処理部、25 文字線画処理部、26 絵柄部分処理部、27 圧縮処理部、28 表領域処理部、51 色数算出部、52 限定色化部、53 第1圧縮部、54 線分色画像生成部、55 第2圧縮部、56 第3圧縮部、61 代表色候補関連付け部、62 画素数算出部、63 判定部、64 新規代表色候補決定部、65 代表色決定部。

Claims (6)

  1. 処理対象となった画像データから文字又は線画を構成する画素を抽出する手段と、
    前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能な部分を特定し、当該特定した部分の画素を描画するベクトルデータを生成するベクトルデータ生成手段と、
    前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能として特定されなかった部分を表すビットマップデータを再現するデータを生成する手段と、
    を含むことを特徴とする画像処理装置。
  2. 請求項1に記載の画像処理装置において、
    前記ベクトルデータ生成手段は、前記抽出された文字又は線画を構成する画素に対して表認識処理を行い、ベクトルデータに変換可能な部分として表を構成する画素として認識された部分を特定することを特徴とする画像処理装置。
  3. 請求項2に記載の画像処理装置において、
    前記ベクトルデータに変換可能な部分として特定された表内部の画素であって、前記文字又は線画を構成する画素として抽出されていない各画素について可逆圧縮処理を行い、当該可逆圧縮処理結果と前記ベクトルデータとを関連づけて出力することを特徴とする画像処理装置。
  4. 請求項3に記載の画像処理装置において、
    前記可逆圧縮処理の対象となる各画素が連結して構成される連結画素成分ごとに一色以上の代表色を決定し、当該決定した代表色を連結画素成分を構成する各画素に割り当てた後に前記可逆圧縮処理を実施することを特徴とする画像処理装置。
  5. 処理対象となった画像データから文字又は線画を構成する画素を抽出する工程と、
    前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能な部分を特定し、当該特定した部分の画素を描画するベクトルデータを生成する工程と、
    前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能として特定されなかった部分を表すビットマップデータを再現するデータを生成する工程と、
    を含むことを特徴とする画像処理方法。
  6. コンピュータに、
    処理対象となった画像データから文字又は線画を構成する画素を抽出する手順と、
    前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能な部分を特定し、当該特定した部分の画素を描画するベクトルデータを生成する手順と、
    前記抽出された文字又は線画を構成する画素のうち、ベクトルデータに変換可能として特定されなかった部分を表すビットマップデータを再現するデータを生成する手順と、
    を実行させることを特徴とする画像処理プログラム。
JP2003428104A 2003-12-24 2003-12-24 画像処理装置 Withdrawn JP2005190010A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003428104A JP2005190010A (ja) 2003-12-24 2003-12-24 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003428104A JP2005190010A (ja) 2003-12-24 2003-12-24 画像処理装置

Publications (2)

Publication Number Publication Date
JP2005190010A true JP2005190010A (ja) 2005-07-14
JP2005190010A5 JP2005190010A5 (ja) 2007-01-18

Family

ID=34787199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003428104A Withdrawn JP2005190010A (ja) 2003-12-24 2003-12-24 画像処理装置

Country Status (1)

Country Link
JP (1) JP2005190010A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007142885A (ja) * 2005-11-18 2007-06-07 Ricoh Co Ltd 画像処理装置及び画像読取装置
JP2009290780A (ja) * 2008-05-30 2009-12-10 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2013135451A (ja) * 2011-12-27 2013-07-08 Fuji Xerox Co Ltd 画像推定装置、画像処理装置、及びプログラム
JP2018121226A (ja) * 2017-01-26 2018-08-02 株式会社リコー 画像処理装置、画像処理方法およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007142885A (ja) * 2005-11-18 2007-06-07 Ricoh Co Ltd 画像処理装置及び画像読取装置
JP4571066B2 (ja) * 2005-11-18 2010-10-27 株式会社リコー 画像処理装置及び画像読取装置
JP2009290780A (ja) * 2008-05-30 2009-12-10 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US8396298B2 (en) 2008-05-30 2013-03-12 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas
JP2013135451A (ja) * 2011-12-27 2013-07-08 Fuji Xerox Co Ltd 画像推定装置、画像処理装置、及びプログラム
JP2018121226A (ja) * 2017-01-26 2018-08-02 株式会社リコー 画像処理装置、画像処理方法およびプログラム

Similar Documents

Publication Publication Date Title
JP5875637B2 (ja) 画像処理装置、画像処理方法
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP2007336226A (ja) 情報処理装置、制御方法、およびコンピュータプログラム
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP4582200B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
US8274515B2 (en) Vector image generation method, image processing apparatus, and computer-readable storage medium for computer program
JP4370950B2 (ja) 画像処理装置
JP2005190010A (ja) 画像処理装置
JP4217969B2 (ja) 画像処理装置及びプログラム
JP4396331B2 (ja) 画像処理装置
JP4182891B2 (ja) 画像処理装置
JP4228905B2 (ja) 画像処理装置及びプログラム
JP4259310B2 (ja) 画像処理装置及びプログラム
JP4186832B2 (ja) 画像処理装置
JP4507656B2 (ja) 画像処理装置
JP2005244649A (ja) 画像処理装置
JP4631371B2 (ja) 画像処理装置
JP4193687B2 (ja) 画像処理装置及びプログラム
JP4311183B2 (ja) 画像処理装置及びプログラム
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP4329564B2 (ja) 画像処理装置
JP2005323066A (ja) 画像処理装置
JP2006262258A (ja) 画像処理装置、画像処理方法及びプログラム
JP4182873B2 (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061128

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061128

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071112

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20081016