JP4228905B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP4228905B2
JP4228905B2 JP2003421667A JP2003421667A JP4228905B2 JP 4228905 B2 JP4228905 B2 JP 4228905B2 JP 2003421667 A JP2003421667 A JP 2003421667A JP 2003421667 A JP2003421667 A JP 2003421667A JP 4228905 B2 JP4228905 B2 JP 4228905B2
Authority
JP
Japan
Prior art keywords
group
pixel
unit
character
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003421667A
Other languages
English (en)
Other versions
JP2005184403A (ja
JP2005184403A5 (ja
Inventor
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2003421667A priority Critical patent/JP4228905B2/ja
Publication of JP2005184403A publication Critical patent/JP2005184403A/ja
Publication of JP2005184403A5 publication Critical patent/JP2005184403A5/ja
Application granted granted Critical
Publication of JP4228905B2 publication Critical patent/JP4228905B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、画像データから文字部分と絵柄部分とを分離して所定処理を行う画像処理装置及びプログラムに関する。


ラスタ画像のデータ(以下、区別するべき場合を除いて単に「画像データ」と呼ぶ)には、文字(テキスト)部分や、自然画などの部分(絵柄部分)など、互いに性状の異なる多くの画像要素が含まれ得る。こうした画像要素は、その性状の相違から、例えば圧縮処理において異なる方式での圧縮が適していたりするなど、画像要素ごとに異なる画像処理を行うことが好ましい場合が多い。そこで従来から、いわゆるT/I分離と呼ばれる画像処理が研究・開発され、文字部分と絵柄部分とを分離して、それぞれに適した圧縮処理を行う処理方法が知られている(特許文献1,2)。
特開2002−369011号公報 特開2003−18413号公報 特開2002−175532号公報
しかしながら、上記従来の方式では、一般に線画で構成される部分が絵柄として扱われることとなり、線図や表罫線などの高周波部分が例えばJPEG(Joint Picture Experts Group)圧縮処理されてモスキートノイズが発生するなどの問題点があった。
本発明は上記実情に鑑みて為されたもので、文字と線画とを一体的に扱うことで、圧縮処理時のモスキートノイズの発生などの画質劣化を防止できる画像処理装置を提供することをその目的の一つとする。
請求項1記載の発明は、画像処理装置であって、処理対象となった画像データから文字を構成する画素群を取り囲む外接矩形と、線画を構成する画素群を取り囲む外接矩形と、を抽出する手段と、前記抽出した外接矩形同士を、各外接矩形間の距離が、予め定めた距離範囲内にある場合に、文字と線画とを区別せずに、グループ化する手段と、前記グループ化された外接矩形内の画素群ごとに定めた可逆な圧縮方法で、各グループの文字及び線画を構成する画素群の圧縮データを生成する手段と、を含み、前記圧縮データを生成する手段は、各グループごとに、当該グループ内に含まれる画素によって表される色数を算出し、当該算出した色数に基づいてグループごとの可逆な圧縮方法を定めることとしたものである。
請求項記載の発明は、画像処理プログラムであって、コンピュータを、処理対象となった画像データから文字を構成する画素群を取り囲む外接矩形と、線画を構成する画素群を取り囲む外接矩形と、を抽出する手段と、前記抽出した外接矩形同士を、各外接矩形間の距離が、予め定めた距離範囲内にある場合に、文字と線画とを区別せずに、グループ化する手段と、前記グループ化された外接矩形内の画素群ごとに定めた可逆な圧縮方法で、各グループの文字及び線画を構成する画素群の圧縮データを生成する手段と、として機能させ、前記圧縮データを生成する手段として機能させる際には、各グループごとに、当該グループ内に含まれる画素によって表される色数を算出し、当該算出した色数に基づいてグループごとの可逆な圧縮方法を定めさせることとしたものである。
本発明の実施の形態に係る画像処理装置は、図1に示すように、制御部11と記憶部12と画像入力部13と画像出力部14とを含んで構成されている。制御部11は、記憶部12に格納されているプログラムに従って動作しており、後に説明する各画像処理を遂行する。この画像処理の内容については、後に詳しく述べる。
記憶部12は、制御部11によって実行されるプログラムを保持している。またこの記憶部12は、制御部11の処理の過程で生成される各種データ等を格納するワークメモリとしても動作する。具体的にこの記憶部12は、コンピュータ可読な記録媒体と当該記録媒体に対してデータを書き込み、又は当該記録媒体からデータを読み出す装置(例えばハードディスク装置やメモリ装置)として実装できる。
画像入力部13は、例えばスキャナであり、原稿を光学的に読み取って得られた画像データを制御部11に出力する。ここではこの画像入力部13が出力する画像データにおいて、各画素の値がRGB(赤、緑、青)の色空間で表現されているとする。画像出力部14は、制御部11から入力される指示に従って画像データを出力するもので、例えば画像形成部(プリンタ等)に出力し、又はネットワークを介して外部の装置に送信する等の処理を行うものである。
次に制御部11の処理の内容について説明する。本実施の形態の制御部11は、図2に機能的に示すように、画像入力部13から入力される画像データを処理対象として、この処理対象となった画像データに対して、所定前処理を行う前処理部21と、文字線画を抽出する文字線画抽出処理部23と、文字線画グループ化部24と、文字線画処理部25と、絵柄部分処理部26と、下地処理部27と、フォーマット処理部28とを含んで構成されている。
以下、これら各部について具体的に説明する。
[前処理部]
この前処理部21では、画像入力部13から入力される画像データ(処理対象画像データ)の各画素の値をRGBからYCbCr(輝度と色差とからなる値)に変換する。具体的には、次の(1)式を用いて変換を行うことができる。なお、ここではRGBの各成分の値は0x00(「0x」は16進数であることを示す)から0xFFまでの値であるとしている。また、この前処理部21では、下地領域の輝度・彩度に基づいて各画素値を階調補正してもよい。尤も、この階調補正の処理は、必ずしも必要なものではない。
Figure 0004228905
[文字線画抽出処理部]
文字線画抽出処理部23は、前処理部21が出力するYCbCr色空間で表現された画像データから文字線画部分を抽出する処理を行う。この処理は、例えば特許文献3に開示されている通りの処理を用いることができる。
そして文字線画抽出処理部23は、個々の文字や、線画部分についてそれらを取囲む矩形(文字線画外接矩形)の座標情報を記憶部12に格納する。
[文字線画グループ化部]
文字線画グループ化部24は、予め定めたグループ化の条件に基づき、記憶部12に格納された文字線画外接矩形の各々に内包される個々の文字や線画部分の画素群を少なくとも一つのグループにグループ化する。具体的には、文字線画グループ化部24の処理では、記憶部12に格納された文字線画外接矩形のうち、未だグループ化されていないものを一つ、注目矩形として選択する。次にこの注目矩形以外で、未だグループ化されていない他の文字線画外接矩形を順次、比較対照矩形として選択し、注目矩形と比較対照矩形との間の距離が予め定めたしきい値未満の比較対照矩形があれば、当該比較対照矩形を特定する情報を注目矩形を特定する情報に関連付けてグループ化データベースとして記憶部12に格納し、注目矩形と当該比較対照矩形とを同一のグループに属するものとしてグループ化する。なお、ここで矩形間の距離は、各矩形の2つの対角線の交点(矩形の中心)間の距離とすることができる。また、レイアウト解析処理を行うことで、グループ化を行ってもよい。この場合は、例えば一つの段落部分に属する文字群が一つのグループとしてまとめられるようになる。
このように本実施の形態では、線分の太さや長さにかかわらず、また文字領域や絵柄領域といった分類をも行うことなく、一定の距離範囲内にある線分同士(文字もまた、線分によって構成される)をグループ化し、グループごとに、グループを特定するためのグループに固有の識別子と、各グループに属する文字線画外接矩形を特定する情報(例えばその識別子)のリストと関連付けて記憶部12に格納する。
[文字線画処理]
文字線画処理部25は、図3に示すように、色数算出部51と、限定色化部52と、第1圧縮部53と、線分色画像生成部54と、第2圧縮部55と、第3圧縮部56とを含んで構成される。
ここで色数算出部51は、記憶部12に格納されているグループ化データベースを参照して、各グループについて、当該グループに属する文字線画外接矩形に内包される画素のうち、記憶部12に格納されている文字線分画像データのビットマップデータに含まれる画素(以下、この画素を特定画素と呼ぶ)について、その画素値の種類の数、つまり色の数をカウントする。
この色の数をカウントする処理は、図4に機能的な構成を示すように、代表色候補関連付け部61と、画素数算出部62と、判定部63と、新規代表色候補決定部64と、代表色決定部65とを含んで構成される。
代表色候補関連付け部61は、代表色候補のセットを記憶部12から読み出して、処理対象となったグループ(以下、処理対象矩形グループと呼ぶ)内の画素群の各画素について、代表色候補のいずれかを関連付ける処理を行う。ここで代表色候補のセットには、後に説明する処理により、新たな代表色候補が追加され、更新されていくのであるが、当初は、予め定めた複数の代表色候補を含むものであって構わない。
すなわち、この代表色候補関連付け部61は、上記特定画素を構成する各画素から順次、一つずつ注目画素を選択し、この注目画素の画素値と、各代表色候補の画素値との色空間上での距離を演算する。そして、そのうち、最も距離の小さい代表色候補を、当該注目画素を特定する情報(例えばその座標情報)に関連付けて記憶部12に代表色候補関係データベースとして格納していく。
画素数算出部62は、代表色候補ごとに、記憶部12に格納された代表色候補関係データベース内での出現数をカウントして出力する。判定部63は、出現数が所定の閾値を超えるか否かを判断し、当該所定の閾値を超える場合に処理対象矩形グループ内の特定画素で構成される文字や線画が1色であると判断する。また、出現数が所定の閾値を超えない場合は、処理対象矩形グループ内の特定画素で構成される文字や線画が1色でないと判断し、処理を終了する。
ここで所定の閾値は、予め一定の値としておいてもよいし、処理対象とした特定画素の全画素数に基づいて定めてもよい。例えば、全画素数Nに対してその8割である、0.8×Nを所定の閾値として定めてもよい。
さらに、この判定部63は、処理対象矩形グループ内の特定画素で構成される文字や線画が1色でないと判断したときには、その判断回数をカウントしておき、判断回数が予め定めた最大回数になったときに、処理を終了する。
新規代表色候補決定部64は、処理対象矩形グループ内の特定画素で構成される文字や線画が1色でないと判断されたときに、代表色候補関係データベースを参照して、出現数の多い順に複数の代表色候補を選択する。例えば出現数の上位2つの代表色候補を選択する。そして新規代表色候補決定部64は、選択した代表色候補に基づいて少なくとも一つの新規代表色を決定して、当該決定した新規代表色を代表色候補のセットに含め、代表色候補関連付け部61に対して処理を繰返すように指示する。ここで新規代表色は、選択した代表色候補の平均画素値として決定してもよい。
代表色決定部65は、判定部63が処理を終了したときに、その判定結果を参照して代表色を決定する。具体的には、判定部63が特定画素で構成される文字や線画が1色であると判断した場合には、特定画素の画素値のヒストグラムを生成し、最頻値となる画素値を代表色として決定する。代表色決定部65は、この代表色を処理対象矩形グループを特定する情報に関連付けて記憶部12に代表色情報として格納する。
また、判定部63が特定画素で構成される文字や線画が1色でないと判断した場合には、特定画素の各画素値を画素グループとしてグループ化する処理を行って、画素グループごとに代表的な色を決定する。具体的に、代表色決定部65は、特定画素のうち未だにいずれかの画素グループにグループ化されていない画素の一つを注目画素として選択し、また、特定画素のうち未だにいずれかの画素グループにグループ化されていない画素であって注目画素として選択していない画素を一つずつ、順次、対象画素として選択する。そして、この注目画素の画素値と対象画素の画素値とを次に示すように比較して、注目画素と同一の画素グループ(互いに同一色と判断される画素グループ)に属するか否かを判断する。
なお、以下の説明では注目画素の画素値と対象画素の画素値との色空間上の距離を算出し、この距離が所定のしきい値より小さい場合に、同一の画素グループに属すると判断することとする。この場合、画素グループごとに、同一の画素グループに属すると判断された画素値の平均値を画素グループ代表画素値として決定する。そして、この画素グループ代表画素値のセットを、処理対象矩形グループを特定する情報に関連付けて、記憶部12に代表色情報として格納する。
このようにして色数算出部51は、文字線画外接矩形のグループごとに、その内部に含まれる特定画素の色数と、当該代表色情報とを決定することになる。
本実施の形態において特徴的なことの一つは、上記色数をカウントする処理のように、グループに属する画素群を単位とし、この画素群を単位として見たときに有意と考えられる色数を求めていることである。これにより、例えば、元の画像データが、紙原稿をスキャンしたことにより得られており、もともと線分であった部分のエッジが鈍り、エッジ部分と線分の中心部とが少々異なる色となる場合でも、線分として有意な色は1色と判定される。一方、明らかなグラデーションを持つ線分においては、当該線分が複数の色を持つと判定される。
そして色数算出部51は、カウントされた色の数と、予め利用者から受け入れて記憶している設定情報とに応じてグループ(文字線画外接矩形のグループ)内の特定画素の情報の出力先を次のように振り分ける。すなわち、色数算出部51は、カウントされた色の数が「1」であれば、そのグループ内の特定画素の情報を第1圧縮部53に出力する。また、カウントされた色の数が複数ある場合は、第2圧縮部55に出力する。
第1圧縮部53は、入力されるグループ内の特定画素の情報について、当該特定画素を二値化した二値化画像データを生成し、当該二値化画像データを可逆な圧縮方法で圧縮処理する。この圧縮処理としては例えばMMR等のランレングス圧縮方法などがある。そしてこの第1圧縮部53は、処理対象となっているグループの識別子と、当該圧縮処理結果と、当該グループに関連して定められた代表色情報(この場合は1色である)とを関連付けて文字線画プレーン要素データとして出力する。
第2圧縮部55は、入力されたグループ内の特定画素の各々について減色処理を行い、当該グループに関連してカウントされた色の数まで減色する。具体的には、特定画素の各々を、当該グループに関連して定められた代表色(代表色情報に含まれる代表色)のいずれかのうち、画素値間の色空間上での距離が最小となる代表色にそれぞれ設定する。つまり、この第2圧縮部55ではまず、特定画素を代表色のいずれかに限定する処理(限定色化処理)を行うことになる。
そして第2圧縮部55は、限定色化処理後の特定画素について、多値画像に対応した圧縮方式で圧縮処理し、処理対象となっているグループの識別子と、この圧縮処理結果とを関連付けて文字線画プレーン要素データとして出力する。なお、ここでの圧縮方式は、可逆な圧縮方式であってもよく、例えばJBIG2やPNGなどがある。
ここで限定色化部52は、例えばカウントされた色の数が所定しきい値より大きい場合、線分にグラデーション修飾など施されているケースがあり、このケースでは減色処理によって再現性が低下することがあるので、限定色化せずにそのまま多値かつ可逆な圧縮方式(例えばJBIG2やPNGなど)で圧縮処理してもよい。
文字線画処理部25は、これら記憶部12に格納した文字線画プレーン要素データを含むデータを生成し、このデータを文字線画プレーンデータとして記憶部12に格納する。また、文字線画処理部25は、各グループについて、それに属する文字線画外接矩形の座標情報などから、各グループに含まれる特定画素を内包する矩形(例えば特定画素に外接する外接矩形)の座標情報(グループ外接矩形情報)を生成して、記憶部12に格納する。
[絵柄部分処理部]
絵柄部分処理部26は、元の画像データの画素のうち、各文字線画外接矩形内の特定画素を除去して絵柄部分候補画像データを生成する。そしてこの絵柄部分候補画像データの一部の画素(例えば外周部分の画素や四隅の画素など)の画素値を参照して、処理対象となった(元の)画像データの背景色を定める。具体的には、四隅の画素の画素値の平均として背景色を定めてもよい。
そして絵柄部分処理部26は、記憶部12上に、元の画像データと同サイズの画像データを記憶するための領域を2つ確保する。ここでは、それぞれを下地画像データ格納領域、絵柄部分画像データ格納領域と呼ぶ。絵柄部分処理部26は、絵柄部分候補画像データ上の各画素をラスタスキャン順に走査しながら順次注目画素として選択し、注目画素の輝度と当該背景色の輝度とを比較して、注目画素の輝度が背景色の輝度以上であれば、下地画像データ格納領域内で当該注目画素に対応する位置(元の画像データ上の注目画素の位置に対応する下地画像データ格納領域内での位置)にある画素の値を、当該注目画素の画素値に設定する。また、注目画素の輝度が背景色の輝度未満であれば、絵柄部分画像データ格納領域内で当該注目画素に対応する位置(元の画像データ上の注目画素の位置に対応する絵柄部分画像データ格納領域内での位置)にある画素の値を、当該注目画素の画素値に設定する。
絵柄部分処理部26は、絵柄部分候補画像データの各画素について上記走査を完了すると、次に、記憶部12内の絵柄部分画像データ格納領域内の画像データ(いわば絵柄部分画像データ)の画素から連結画素群を画定する。ここで連結画素群は、隣接した画素(上記処理で画素値が設定された画素)同士が連結して一つの塊(画素塊)を形成している画素群のことをいう。絵柄部分処理部26は、画定した連結画素群の各々を含む矩形として、例えば連結画素群に外接する矩形を、絵柄部分外接矩形として画定する。
絵柄部分処理部26は、画定した絵柄部分外接矩形の各々について、彩度やコントラストを補正する処理など、画質補正処理を行い、さらに解像度を変換する。ここで解像度の変換は、例えば絵柄部分外接矩形に含まれる元の画像データ上の画素値の配列から周波数(空間周波数)を調べ、所定周波数以上の高周波成分がどの程度含まれているかによって変換後の解像度を決定し、当該決定した解像度へと変換を行うこととしてもよい。
なおこの解像度変換は、例えば所定周波数以上の高周波成分があるしきい値以上含まれている等の画像の性状に関する所定条件に合致する場合など、所定の場合には行わないようにしてもよい。
そして絵柄部分処理部26は、画定した絵柄部分外接矩形の各々について、それによって囲まれる元の画像データ上の部分的な画像データ(上記の画質補正、解像度変換を行う場合は、それぞれの処理を行った後のもの)に対して多値の圧縮処理を行う。ここでの圧縮処理は例えばJPEG等、一般的に不可逆なものであってもよい。このとき、例えば絵柄部分外接矩形に含まれる元の画像データ上の画素値の配列から周波数(空間周波数)を調べ、所定周波数以上の高周波成分がどの程度含まれているかによって圧縮率を決定し、当該決定した圧縮率で圧縮処理を行うこととしてもよい。
絵柄部分処理部26は、各絵柄部分外接矩形について、それぞれを識別するための識別子と、当該絵柄部分外接矩形を画定する座標情報と、当該絵柄部分外接矩形内の部分的な画像データを圧縮処理した結果とを関連付けて、絵柄プレーンデータとして記憶部12に格納する。
なお、この圧縮処理の前に、元の画像データ上で絵柄部分外接矩形によって囲まれる部分的な画像データについて穴埋処理を行ってもよい。具体的には、当該部分的な画像データ内の各画素をラスタスキャン順に走査し、走査により選択される注目画素が文字線画を構成する画素などとして除去された画素でなければ、当該注目画素の画素値をそのままとするとともに、当該注目画素の画素値を直前画素値として記憶部12のワークメモリに記憶する。なお、既に他の画素値が直前画素値として記憶されている場合は、その記憶内容に上書きする。
また、走査により選択される注目画素が除去された画素である場合、当該注目画素の画素値を、記憶している直前画素値に設定する。これにより除去された部分の画素値が、ラスタスキャン順に直前画素値と同一になり、多くの圧縮処理において圧縮効率を向上させることができるようになる。
[下地処理]
下地処理部27は、絵柄部分処理部26の処理により生成され、記憶部12に格納された下地画像データ格納領域内の画像データ(いわば下地画像データ)について、下地画像データ内の画素の値についてその色数を演算する。この色数の演算は、文字線画処理部25における色数の演算処理と同じで構わない。そして、下地処理部27は、演算した色数が一色であったか否かを調べ、一色であったならば、下地画像データ内の画素の値から定められる一つの代表色の情報(例えば各画素の値の平均値などでよい)を下地プレーンデータとして生成し、記憶部12に格納する。
またこの下地処理部27は、下地画像データに含まれる画素の色数が一色でない(つまり複数色)の場合、下地画像データに対し、下地かぶりや裏写りなどを除去する公知の画像処理を行い、また、その解像度を変換する。一般に下地の画像は高周波成分を多く含まないので、ここでの解像度の値は比較的小さい値を予め定めておいてもよい。
そして下地処理部27は、下地画像データ(上記解像度変換を行う場合は、解像度変換後のもの)について、多値の圧縮処理を実行する。ここでの圧縮処理は例えば一般に非可逆なJPEG圧縮などで構わない。下地処理部27は、下地画像データに含まれる画素の色数が一色でない場合は、この圧縮処理後の画像データを下地プレーンデータとして記憶部12に格納する。
[フォーマット処理部]
フォーマット処理部28は、記憶部12に格納されている文字線画プレーンデータと、絵柄プレーンデータと、下地プレーンデータと、絵柄部分外接矩形の座標情報と、グループ外接矩形情報とを連結して、これらを含む一連のデータを生成する。
具体的にこの一連のデータとしては、PDF(Portable Document
Format)データとすることができる。すなわち、下地プレーンデータを伸長してビットマップを生成させる指示と、絵柄プレーンデータを伸長してビットマップを生成させる指示と、文字線画プレーンデータに含まれる各文字や線画の画素を描画させる指示と、これらを透過合成する指示とを含むPDFデータとする。ここで透過合成とは画素値の設定されていない画素については上書きせず、画素値の設定された画素のみを上書きすることをいう。
ここで文字線画プレーンデータに含まれる各文字や線画を描画させる指示は、二値化され可逆圧縮されたグループ内の画素については、当該圧縮を伸長して描画するとともに、当該グループに関連する代表色の情報に基づき、当該描画後の画素(例えば黒画素)部分を当該代表色に設定する指示である。この場合、白画素部分は画素値の設定されない画素としてもよい。また、多値で圧縮された情報については、当該圧縮を伸長して描画する指示である。
フォーマット処理部28は、この生成したPDFデータを記憶部12に格納し、または画像出力部14にこのPDFデータを出力して、外部の装置に送出させる。
[動作]
本実施の形態の画像処理装置は、上述の構成を有しているので、次のように動作する。ここでは図5に示すような文字部分(T1,T2)と、写真部分(P)と、線画部分としての表(テーブル)(E)及び地図画像(M)とを含むドキュメントが画像入力部13から入力され、このドキュメントの画像データを処理対象とする場合を例として説明する。この図5(a)の例においては写真部分(P)内に文字部分の一部(T2)が重ね合わせられている。またテーブル部分(E)には、罫線と文字とが入組んでいる。なお、ここでは便宜的に全体を白黒で示しているが、実際には、例えば写真部分などはカラーであっても構わない。
前処理部21は、この画像データの画素値を所定色空間(YCbCr)の値に変換する。文字線画抽出処理部23は、前処理部21が出力するYCbCr色空間で表現された画像データをラスタスキャン順に走査しながら選択し、当該選択した画素の近傍で、画素値の移動平均を算出し、当該移動平均と選択した画素の値との比較によって、当該選択した画素を白又は黒に決定して、文字線画部分を黒画素として抽出する(図5(b))。
そして文字線画グループ化部24がこの文字線画部分の各部について、相互間の距離に応じてグループ化を行う。このグループ化は、文字と線画とを区別せずに行われるため、例えばテーブルは一つのグループとなり、地図画像(M)は、その内部に含まれる文字を含めて一つのグループとなる。このグループ化の結果は例えば図5(c)に示すようなものとなる。図5(c)では説明のため、各グループを枠線で囲んで図示している。
文字線画処理部25は、文字線画グループ化部24が生成した各グループごとに、その内部に含まれる画素の値が一種類(内部の画素が一色)である場合は、グループ内の画素を二値化してMMR等の方式でランレングス圧縮し、この圧縮処理結果と、当該グループに関連して定められた代表色情報とグループの識別子とを関連付けて文字線画プレーン要素データを生成し、そうでない場合は、例えば多値かつ可逆な圧縮方式(例えばJBIG2やPNGなど)で圧縮処理し、処理対象となっているグループの識別子と、この圧縮処理結果とを関連付けて文字線画プレーン要素データを生成する。
そして文字線画処理部25は、各グループごとの文字線画プレーン要素データを含む文字線画プレーンデータを生成する。
絵柄部分処理部26は、元の画像データから文字線画抽出処理部23で抽出された画素を除去し、背景色を検出して、当該背景色に近い色(例えば背景色と同等かそれよりも高い輝度の画素)を下地として抽出する。また、そうでない部分を絵柄部分として抽出する。この処理により、写真部分(P)のうち、文字を除いた部分が絵柄部分として抽出される。なお、文字のあった部分は穴埋処理により、所定走査順序で直前の走査位置にある画素値に設定されてもよい。絵柄部分処理部26は当該絵柄部分を所定の圧縮方式で圧縮処理して絵柄プレーンデータを生成する。ここでの圧縮方式はJPEG圧縮でよい。
下地処理部27は、絵柄部分処理部26が抽出した下地部分の画像データを所定圧縮方式で圧縮処理して下地プレーンデータを生成する。このとき、下地部分の画像データについて解像度変換の処理を行ってサイズを縮小してもよい。この場合は、下地プレーンデータに元の解像度の情報など、元のサイズに戻すために必要な情報を関連付けておく。なお、下地処理部27は、下地部分の画像データが一色である場合は、当該色(代表色)を特定するデータのみを下地プレーンデータとしてもよい。
フォーマット処理部28は、これら文字線画プレーンデータと絵柄プレーンデータと下地プレーンデータとを含む所定フォーマットの画像データを生成して出力する。すなわち、図6に示すように、元の画像データは、二値の可逆圧縮方式で圧縮される要素(二値で描画されていた文字線画部分)と、多値の可逆圧縮方式で圧縮される要素(カラーで描画されていた文字線画部分)と、多値の非可逆方式(圧縮効率は比較的低く設定される)で圧縮される絵柄部分(例えば写真等の部分)と、多値の非可逆方式で圧縮される下地部分(圧縮効率は比較的高く設定される)とに分離されて、各々対応する方式で圧縮処理されることとなる。
なお、こうして生成された画像データから元の画像データを復元する際は次のように処理することになる。すなわち、まず下地プレーンデータを取り出す。そして下地プレーンデータを伸長して下地の画像データを生成する。
具体的に、下地プレーンデータが下地部分の代表色を含む場合は、元の画像データのサイズの情報に基づいて、この下地部分の代表色によって塗潰された当該サイズの画像データを生成する。
また、下地プレーンデータが圧縮されたデータを含む場合は、この圧縮を伸長して下地部分の画像データを生成する。この際、当該下地プレーンデータのサイズが縮小されているなどの場合は、そのサイズを元の画像データと同じサイズに拡大する処理を行う。
次に、絵柄プレーンデータを取り出して伸長し、各絵柄プレーンデータに関する絵柄部分外接矩形の座標情報に応じて、下地の画像データ上の対応する位置に、当該伸長した画像データを上書きした画像データを生成する。
そしてさらに、グループごとの文字線画プレーンデータを取り出して伸長し、グループごとの文字線画ビットマップを生成する。そして各グループごとの文字線画ビットマップを、この生成した画像データ上でグループ外接矩形情報によって示される位置に上書きする。
なお、ここまでの説明では、例えば絵柄画像データなどについては、多値の圧縮処理を行うことを前提としているが、例えば予めグレースケールであるとの情報が利用者等から取得されている場合や、画像入力部13がグレースケールや二値画像などしか入力できないこととなっている場合は、当該絵柄部分画像の画像データをグレイスケールや二値画像に変換して圧縮処理してもよい。
本発明の実施の形態に係る画像処理装置の一例を表す構成ブロック図である。 本発明の実施の形態に係る画像処理装置の制御部によって実行される処理内容を表す機能ブロック図である。 文字線画処理部25の処理内容例を表す機能ブロック図である。 色数算出部51の処理例を表す機能ブロック図である。 本発明の実施の形態の画像処理装置の動作の例を表す説明図である。 本発明の実施の形態の画像処理装置の動作の例を表すもう一つの説明図である。
符号の説明
11 制御部、12 記憶部、13 画像入力部、14 画像出力部、21 前処理部、23 文字線画抽出処理部、24 文字線画グループ化部、25 文字線画処理部、26 絵柄部分処理部、27 下地処理部、28 フォーマット処理部、51 色数算出部、52 限定色化部、53 第1圧縮部、54 線分色画像生成部、55 第2圧縮部、56 第3圧縮部、61 代表色候補関連付け部、62 画素数算出部、63 判定部、64 新規代表色候補決定部、65 代表色決定部。

Claims (2)

  1. 処理対象となった画像データから文字を構成する画素群を取り囲む外接矩形と、線画を構成する画素群を取り囲む外接矩形と、を抽出する手段と、
    前記抽出した外接矩形同士を、各外接矩形間の距離が、予め定めた距離範囲内にある場合に、文字と線画とを区別せずに、グループ化する手段と、
    前記グループ化された外接矩形内の画素群ごとに定めた可逆な圧縮方法で、各グループの文字及び線画を構成する画素群の圧縮データを生成する手段と、
    を含み、
    前記圧縮データを生成する手段は、各グループごとに、当該グループ内に含まれる画素によって表される色数を算出し、当該算出した色数に基づいてグループごとの可逆な圧縮方法を定めることを特徴とする画像処理装置。
  2. コンピュータを、
    処理対象となった画像データから文字を構成する画素群を取り囲む外接矩形と、線画を構成する画素群を取り囲む外接矩形と、を抽出する手段と、
    前記抽出した外接矩形同士を、各外接矩形間の距離が、予め定めた距離範囲内にある場合に、文字と線画とを区別せずに、グループ化する手段と、
    前記グループ化された外接矩形内の画素群ごとに定めた可逆な圧縮方法で、各グループの文字及び線画を構成する画素群の圧縮データを生成する手段と、
    として機能させ、
    前記圧縮データを生成する手段として機能させる際には、各グループごとに、当該グループ内に含まれる画素によって表される色数を算出し、当該算出した色数に基づいてグループごとの可逆な圧縮方法を定めさせることを特徴とする画像処理プログラム。
JP2003421667A 2003-12-18 2003-12-18 画像処理装置及びプログラム Expired - Fee Related JP4228905B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003421667A JP4228905B2 (ja) 2003-12-18 2003-12-18 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003421667A JP4228905B2 (ja) 2003-12-18 2003-12-18 画像処理装置及びプログラム

Publications (3)

Publication Number Publication Date
JP2005184403A JP2005184403A (ja) 2005-07-07
JP2005184403A5 JP2005184403A5 (ja) 2007-01-18
JP4228905B2 true JP4228905B2 (ja) 2009-02-25

Family

ID=34782796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003421667A Expired - Fee Related JP4228905B2 (ja) 2003-12-18 2003-12-18 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4228905B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007088912A (ja) * 2005-09-22 2007-04-05 Fuji Xerox Co Ltd 画像処理装置およびプログラム
JP5047051B2 (ja) 2008-05-02 2012-10-10 キヤノン株式会社 画像処理装置及び画像符号化方法
JP5847063B2 (ja) * 2012-11-27 2016-01-20 京セラドキュメントソリューションズ株式会社 画像処理装置

Also Published As

Publication number Publication date
JP2005184403A (ja) 2005-07-07

Similar Documents

Publication Publication Date Title
JP5875637B2 (ja) 画像処理装置、画像処理方法
US7376267B2 (en) Image processing apparatus, image processing method, and program and storage medium therefor
US7133565B2 (en) Image processing apparatus and method
US8395813B2 (en) Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program
JP4366003B2 (ja) 画像処理装置及び画像処理方法
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP6370080B2 (ja) 画像処理装置、画像処理方法及びプログラム。
JP2004229261A (ja) 画像圧縮方法、画像圧縮装置及びプログラム並びに記録媒体
JP4370950B2 (ja) 画像処理装置
JP4217969B2 (ja) 画像処理装置及びプログラム
JP4228905B2 (ja) 画像処理装置及びプログラム
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP4396331B2 (ja) 画像処理装置
JP4182891B2 (ja) 画像処理装置
JP4259310B2 (ja) 画像処理装置及びプログラム
JP4742632B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2005190010A (ja) 画像処理装置
JP4507656B2 (ja) 画像処理装置
JP4193687B2 (ja) 画像処理装置及びプログラム
JP4631371B2 (ja) 画像処理装置
JP4311183B2 (ja) 画像処理装置及びプログラム
JP2004242075A (ja) 画像処理装置および方法
JP2005244649A (ja) 画像処理装置
JP4329564B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061128

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061128

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071112

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081124

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131212

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees