JP2003244447A - 画像処理装置及び画像処理方法 - Google Patents
画像処理装置及び画像処理方法Info
- Publication number
- JP2003244447A JP2003244447A JP2002039035A JP2002039035A JP2003244447A JP 2003244447 A JP2003244447 A JP 2003244447A JP 2002039035 A JP2002039035 A JP 2002039035A JP 2002039035 A JP2002039035 A JP 2002039035A JP 2003244447 A JP2003244447 A JP 2003244447A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- character area
- document data
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Abstract
(57)【要約】
【課題】 文書をスキャナで入力した画像データや、コ
ンピュータ上の文書作成ソフトウェアで作成された文書
データを、一般的な圧縮画像データとして、高画質かつ
高圧縮率で圧縮することができる画像処理装置及び画像
処理方法を提供する。 【解決手段】 入力された文書データについての多値画
像100について、縮小・二値化部120で二値画像が
生成される。この二値画像に基づいて文字領域検出部1
01において文字領域が抽出され、文字領域座標109
が得られる。また、抽出された文字領域内の文字領域代
表色110が文字色抽出部103で抽出され、文字部塗
りつぶし部104において多値画像100から下地多値
画像108が生成される。さらに、文字領域画像が文字
領域画像圧縮部105で圧縮されて圧縮コード111が
生成され、下地画像が下地画像圧縮部106で圧縮され
て圧縮コード112が生成される。
ンピュータ上の文書作成ソフトウェアで作成された文書
データを、一般的な圧縮画像データとして、高画質かつ
高圧縮率で圧縮することができる画像処理装置及び画像
処理方法を提供する。 【解決手段】 入力された文書データについての多値画
像100について、縮小・二値化部120で二値画像が
生成される。この二値画像に基づいて文字領域検出部1
01において文字領域が抽出され、文字領域座標109
が得られる。また、抽出された文字領域内の文字領域代
表色110が文字色抽出部103で抽出され、文字部塗
りつぶし部104において多値画像100から下地多値
画像108が生成される。さらに、文字領域画像が文字
領域画像圧縮部105で圧縮されて圧縮コード111が
生成され、下地画像が下地画像圧縮部106で圧縮され
て圧縮コード112が生成される。
Description
【0001】
【発明の属する技術分野】本発明は、文書データを好適
に圧縮することができる画像処理装置及び画像処理方法
に関する。
に圧縮することができる画像処理装置及び画像処理方法
に関する。
【0002】
【従来の技術】近年、スキャナの普及により文書の電子
化が進んでいる。電子化された文書の一形式としてフル
カラービットマップ形式がある。例えば、A4サイズの
文書原稿を300dpiのフルカラービットマップ形式
で電子化した場合、その画像データは約24Mバイトに
達する。このような大容量の画像データは、メール等の
添付ファイルとしてネットワークを介して通信するには
データ容量が大きくて不便である。そこで、通常、フル
カラー画像に対してはJPEG等を用いた圧縮処理が行
われ、データ容量を縮小した後に取り扱われることが一
般的である。
化が進んでいる。電子化された文書の一形式としてフル
カラービットマップ形式がある。例えば、A4サイズの
文書原稿を300dpiのフルカラービットマップ形式
で電子化した場合、その画像データは約24Mバイトに
達する。このような大容量の画像データは、メール等の
添付ファイルとしてネットワークを介して通信するには
データ容量が大きくて不便である。そこで、通常、フル
カラー画像に対してはJPEG等を用いた圧縮処理が行
われ、データ容量を縮小した後に取り扱われることが一
般的である。
【0003】JPEG圧縮は、写真等の自然画像を圧縮
する方法としては非常に効果が高く、圧縮後の画質も良
いという利点がある。しかし、文字部分等の高周波部分
をJPEG圧縮した場合、モスキートノイズと呼ばれる
画像劣化が発生するという欠点がある。そこで、従来か
ら、画像領域を文字領域とそれ以外の領域とに分割し
て、文字領域以外の下地部分には自然画像に適した圧縮
方式を施し、単色あるいは小数色の文字領域部分には可
逆圧縮方式を施すような方法が知られている。その一例
として、画像領域を文字領域とそれ以外の領域とに分割
して、文字領域に対しては色情報を保持しつつMMR圧
縮やZIP圧縮を行い、文字領域以外の下地部分につい
てはJPEG圧縮を行うような方法がある。
する方法としては非常に効果が高く、圧縮後の画質も良
いという利点がある。しかし、文字部分等の高周波部分
をJPEG圧縮した場合、モスキートノイズと呼ばれる
画像劣化が発生するという欠点がある。そこで、従来か
ら、画像領域を文字領域とそれ以外の領域とに分割し
て、文字領域以外の下地部分には自然画像に適した圧縮
方式を施し、単色あるいは小数色の文字領域部分には可
逆圧縮方式を施すような方法が知られている。その一例
として、画像領域を文字領域とそれ以外の領域とに分割
して、文字領域に対しては色情報を保持しつつMMR圧
縮やZIP圧縮を行い、文字領域以外の下地部分につい
てはJPEG圧縮を行うような方法がある。
【0004】一方、ワードプロセッサ等のコンピュータ
上の文書作成ソフトウェアを用いて作成された文書デー
タは、一般に、それぞれのソフトウェアに固有の方法で
作成されており、また文字部分と画像部分とは異なるデ
ータとして格納されている。そして、これらの文書デー
タは、一般に、紙面上に形成されている文書をスキャナ
で入力した画像データよりもデータ容量が小さいので、
ネットワークを介した通信において大きく支障をきたす
ことは少ない。
上の文書作成ソフトウェアを用いて作成された文書デー
タは、一般に、それぞれのソフトウェアに固有の方法で
作成されており、また文字部分と画像部分とは異なるデ
ータとして格納されている。そして、これらの文書デー
タは、一般に、紙面上に形成されている文書をスキャナ
で入力した画像データよりもデータ容量が小さいので、
ネットワークを介した通信において大きく支障をきたす
ことは少ない。
【0005】
【発明が解決しようとする課題】しかしながら、特定の
文書作成ソフトウェアを用いて作成された文書データを
送信先において閲覧し、また紙面上に印刷等するために
は、送信された文書データを解析することができる同様
のソフトウェアが送信先においても必要とされる。従っ
て、送信先において、現在流通している多種多様な文書
作成ソフトウェアで作成される文書データのすべてに対
応させるようにすることは困難である。
文書作成ソフトウェアを用いて作成された文書データを
送信先において閲覧し、また紙面上に印刷等するために
は、送信された文書データを解析することができる同様
のソフトウェアが送信先においても必要とされる。従っ
て、送信先において、現在流通している多種多様な文書
作成ソフトウェアで作成される文書データのすべてに対
応させるようにすることは困難である。
【0006】そこで、あらゆる送信先で当該文書データ
の利用を可能とするためには、特定のソフトウェアがな
くても閲覧することができるように、文書データを画像
データとして扱うことが望ましい。さらに、その画像デ
ータは、一般的な圧縮方式によって、画像データが圧縮
されていることが望ましい。
の利用を可能とするためには、特定のソフトウェアがな
くても閲覧することができるように、文書データを画像
データとして扱うことが望ましい。さらに、その画像デ
ータは、一般的な圧縮方式によって、画像データが圧縮
されていることが望ましい。
【0007】本発明は、このような事情を考慮してなさ
れたものであり、文書をスキャナで入力した画像データ
や、コンピュータ上の文書作成ソフトウェアで作成され
た文書データを選択的に処理でき、これら文書データを
夫々の入力方法に適切な画質/処理方法で効率良く圧縮
することができる画像処理装置及び画像処理方法を提供
することを目的とする。
れたものであり、文書をスキャナで入力した画像データ
や、コンピュータ上の文書作成ソフトウェアで作成され
た文書データを選択的に処理でき、これら文書データを
夫々の入力方法に適切な画質/処理方法で効率良く圧縮
することができる画像処理装置及び画像処理方法を提供
することを目的とする。
【0008】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、入力された文書データを圧縮する画像処
理装置であって、光学的な原稿読み取りにて発生した文
書データ、またはコンピュータ上で作成した文書データ
を入力する入力手段と、前記光学的な読み取りで発生し
た文書データの多値画像から閾値処理により二値画像を
生成する第1の二値化手段と、前記コンピュータ上で作
成した文書データを展開した多値画像から二値画像を生
成する第2の二値化手段と、前記何れかの二値画像に基
づいて文字領域を抽出する文字領域抽出手段と、抽出さ
れた文字領域内の文字の色を抽出する文字色抽出手段
と、前記多値画像内の文字を文字周辺色で置換すること
によって下地画像を生成する下地画像生成手段と、前記
文字領域から成る文字領域画像を圧縮する第1の圧縮手
段と、前記下地画像を圧縮する第2の圧縮手段とを備え
ることを特徴とする。
に、本発明は、入力された文書データを圧縮する画像処
理装置であって、光学的な原稿読み取りにて発生した文
書データ、またはコンピュータ上で作成した文書データ
を入力する入力手段と、前記光学的な読み取りで発生し
た文書データの多値画像から閾値処理により二値画像を
生成する第1の二値化手段と、前記コンピュータ上で作
成した文書データを展開した多値画像から二値画像を生
成する第2の二値化手段と、前記何れかの二値画像に基
づいて文字領域を抽出する文字領域抽出手段と、抽出さ
れた文字領域内の文字の色を抽出する文字色抽出手段
と、前記多値画像内の文字を文字周辺色で置換すること
によって下地画像を生成する下地画像生成手段と、前記
文字領域から成る文字領域画像を圧縮する第1の圧縮手
段と、前記下地画像を圧縮する第2の圧縮手段とを備え
ることを特徴とする。
【0009】
【発明の実施の形態】以下、図面を参照して、本発明の
実施形態について説明する。
実施形態について説明する。
【0010】<第1の実施形態>図1は、本発明の一実
施形態による入力された画像を圧縮するための画像処理
装置の構成を示すブロック図である。尚、第1の実施形
態では、紙面上に形成された文書がスキャナ等で本画像
処理装置に入力されたものとする。この入力画像が、図
1における多値画像100に相当する。
施形態による入力された画像を圧縮するための画像処理
装置の構成を示すブロック図である。尚、第1の実施形
態では、紙面上に形成された文書がスキャナ等で本画像
処理装置に入力されたものとする。この入力画像が、図
1における多値画像100に相当する。
【0011】図1において、縮小・二値化部120は、
多値画像100の縮小処理及び二値化処理を行う部分で
ある。文字領域検出部101は、多値画像100が二値
化された二値画像を用いて多値画像中から文字領域を検
出して、それらの文字領域座標109を取得する部分で
ある。文字領域画像作成部102は、取得された文字領
域座標109と入力された多値画像100より、複数の
文字領域部分の画像である文字領域画像107を作成す
る部分である。文字色抽出部103は、文字領域画像1
07における文字部分と多値画像100とを参照して、
文字領域代表色110を算出する部分である。
多値画像100の縮小処理及び二値化処理を行う部分で
ある。文字領域検出部101は、多値画像100が二値
化された二値画像を用いて多値画像中から文字領域を検
出して、それらの文字領域座標109を取得する部分で
ある。文字領域画像作成部102は、取得された文字領
域座標109と入力された多値画像100より、複数の
文字領域部分の画像である文字領域画像107を作成す
る部分である。文字色抽出部103は、文字領域画像1
07における文字部分と多値画像100とを参照して、
文字領域代表色110を算出する部分である。
【0012】文字部塗りつぶし部104は、作成された
文字領域画像107の文字部分に対応する多値画像10
0上の画素を、その画素の周辺の色で塗りつぶすことに
よって文字部分を取り除いた下地多値画像108を作成
する部分である。文字領域画像圧縮部105は、文字領
域画像107を圧縮処理することによって、文字領域の
圧縮コード111を作成する部分である。また、下地画
像圧縮部106は、作成された下地多値画像108を圧
縮して、下地画像の圧縮コード112を作成する部分で
ある。
文字領域画像107の文字部分に対応する多値画像10
0上の画素を、その画素の周辺の色で塗りつぶすことに
よって文字部分を取り除いた下地多値画像108を作成
する部分である。文字領域画像圧縮部105は、文字領
域画像107を圧縮処理することによって、文字領域の
圧縮コード111を作成する部分である。また、下地画
像圧縮部106は、作成された下地多値画像108を圧
縮して、下地画像の圧縮コード112を作成する部分で
ある。
【0013】尚、中間言語翻訳部121は、文書作成ソ
フトウェアを用いて作成された文書データをプリント用
の中間言語を翻訳した後、ページ画像(多値画像10
0)と像域フラグ画像122を作成する部分であるが、
その詳細については第2の実施形態において説明する。
フトウェアを用いて作成された文書データをプリント用
の中間言語を翻訳した後、ページ画像(多値画像10
0)と像域フラグ画像122を作成する部分であるが、
その詳細については第2の実施形態において説明する。
【0014】次に、図1に示される構成の画像処理装置
を用いて、スキャナで入力された多値画像100を圧縮
する一連の処理手順について説明する。図3は、本発明
の第1の実施形態による画像処理装置の動作手順を説明
するためのフローチャートである。
を用いて、スキャナで入力された多値画像100を圧縮
する一連の処理手順について説明する。図3は、本発明
の第1の実施形態による画像処理装置の動作手順を説明
するためのフローチャートである。
【0015】まず、入力された多値画像100は、縮小
・二値化部120において、画素を任意の間隔で間引く
ことによって画像が縮小され、さらに縮小された画像に
対して二値化処理が行われる(ステップS301)。こ
の二値化処理の内容について一例を説明する。まず、入
力されたRGB成分の多値画像100に対して、次式に
示すような輝度変換を行って、輝度画像Jを作成する。
・二値化部120において、画素を任意の間隔で間引く
ことによって画像が縮小され、さらに縮小された画像に
対して二値化処理が行われる(ステップS301)。こ
の二値化処理の内容について一例を説明する。まず、入
力されたRGB成分の多値画像100に対して、次式に
示すような輝度変換を行って、輝度画像Jを作成する。
【0016】
Y=0.299R+0.587G+0.114B
すなわち、輝度画像JはY成分のみからなる。
【0017】この際、入力された多値画像100の解像
度に応じて解像度変換を併せて行ってもよい。例えば、
多値画像100が300dpiの場合、縦方向及び横方
向とも4画素ごとに上式の演算を行いて新しい画像Jを
作成する場合を考える。このとき、新しい画像Jは、Y
成分が8ビットの75dpiの画像となる。次に、輝度
画像Jのヒストグラムを取り、二値化処理におけるしき
い値Tを算出する。輝度画像Jを算出されたしきい値T
を用いて二値化し、二値画像Kを作成する。尚、ヒスト
グラムからしきい値Tを算出する方法は、公知の方法を
用いるものとする。
度に応じて解像度変換を併せて行ってもよい。例えば、
多値画像100が300dpiの場合、縦方向及び横方
向とも4画素ごとに上式の演算を行いて新しい画像Jを
作成する場合を考える。このとき、新しい画像Jは、Y
成分が8ビットの75dpiの画像となる。次に、輝度
画像Jのヒストグラムを取り、二値化処理におけるしき
い値Tを算出する。輝度画像Jを算出されたしきい値T
を用いて二値化し、二値画像Kを作成する。尚、ヒスト
グラムからしきい値Tを算出する方法は、公知の方法を
用いるものとする。
【0018】次に、文字領域検出部101において、二
値画像Kに対して領域分割処理を行い、その結果から文
字領域のみを抽出するとともに、その文字領域の座標
(文字領域座標109)を取得する(ステップS30
2)。尚、本実施形態による領域分割処理は、米国特許
第5,680,478号で開示されている「文字認識の方法及び
装置(Method and Apparatus for character recogniti
on)」などの公知の方法を用いるものとする。この方法
について簡単に説明すると、二値画像中の黒画素を輪郭
線追跡して得られた塊を抽出し、その形状、大きさ、文
字、絵や図、線、表を分類するとともに、文字と判定さ
れる塊の集合から、文字列をなす文字領域を抽出する処
理を行うものである。
値画像Kに対して領域分割処理を行い、その結果から文
字領域のみを抽出するとともに、その文字領域の座標
(文字領域座標109)を取得する(ステップS30
2)。尚、本実施形態による領域分割処理は、米国特許
第5,680,478号で開示されている「文字認識の方法及び
装置(Method and Apparatus for character recogniti
on)」などの公知の方法を用いるものとする。この方法
について簡単に説明すると、二値画像中の黒画素を輪郭
線追跡して得られた塊を抽出し、その形状、大きさ、文
字、絵や図、線、表を分類するとともに、文字と判定さ
れる塊の集合から、文字列をなす文字領域を抽出する処
理を行うものである。
【0019】上述したステップS301及びS302で
の具体的な処理例について示す。図2は、本実施形態に
よる画像処理装置に入力される文書の一例を示す図であ
る。尚、図2に示される文書はカラー原稿であり、文字
部分と画像部分の両方が含まれているものとする。図5
は、図2に示されるカラー原稿をスキャナから入力して
得られた多値画像100を間引いて輝度変換された後の
画像に対するヒストグラムを示す図である。本実施形態
では、図5に示されるヒストグラムから、平均、分散等
のデータを利用して、二値化処理のためのしきい値T=
199が算出されたものとする。
の具体的な処理例について示す。図2は、本実施形態に
よる画像処理装置に入力される文書の一例を示す図であ
る。尚、図2に示される文書はカラー原稿であり、文字
部分と画像部分の両方が含まれているものとする。図5
は、図2に示されるカラー原稿をスキャナから入力して
得られた多値画像100を間引いて輝度変換された後の
画像に対するヒストグラムを示す図である。本実施形態
では、図5に示されるヒストグラムから、平均、分散等
のデータを利用して、二値化処理のためのしきい値T=
199が算出されたものとする。
【0020】また、図6は、図5に示すヒストグラムか
ら算出されたしきい値Tを用いて多値画像を二値化した
二値化画像の一例を示す図である。さらに、図7は、図
6に示される二値化画像を領域分割した結果生成される
文字領域を説明するための図である。図7に示すよう
に、本実施形態では、図6に示される二値化画像から1
5個の矩形領域で表されてる文字領域が検出された。そ
して、検出されたそれぞれの文字領域に関する座標デー
タを、文字領域座標109とする。
ら算出されたしきい値Tを用いて多値画像を二値化した
二値化画像の一例を示す図である。さらに、図7は、図
6に示される二値化画像を領域分割した結果生成される
文字領域を説明するための図である。図7に示すよう
に、本実施形態では、図6に示される二値化画像から1
5個の矩形領域で表されてる文字領域が検出された。そ
して、検出されたそれぞれの文字領域に関する座標デー
タを、文字領域座標109とする。
【0021】次に、文字領域画像作成部102におい
て、文字領域座標109に基づいて、それぞれ文字領域
ごとに領域内の文字部分を黒画素(0)、背景を白画素
(1)の二値画像である文字領域画像107が作成され
る(ステップS303)。この二値画像である文字領域
画像107は、縮小・二値化部120で得られたしきい
値Tで縮小処理された多値画像を全面二値化し、それか
ら切りとって作成したものであってもよい。また、文字
領域内で多値画像からヒストグラムを取りなおして、領
域毎に最適な二値化しきい値を再度算出して得られた二
値画像を用いてもよい。
て、文字領域座標109に基づいて、それぞれ文字領域
ごとに領域内の文字部分を黒画素(0)、背景を白画素
(1)の二値画像である文字領域画像107が作成され
る(ステップS303)。この二値画像である文字領域
画像107は、縮小・二値化部120で得られたしきい
値Tで縮小処理された多値画像を全面二値化し、それか
ら切りとって作成したものであってもよい。また、文字
領域内で多値画像からヒストグラムを取りなおして、領
域毎に最適な二値化しきい値を再度算出して得られた二
値画像を用いてもよい。
【0022】さらに、文字色抽出部103では、各文字
領域内の代表色(文字領域代表色110)が抽出される
(ステップS304)。ここで、代表色は1色に限定し
てもよいし、領域内に複数色の文字が混在する場合には
任意の最大代表色数を選ぶようにしてもよい。以下に、
ある文字領域に対する文字色抽出処理の詳細について説
明する。
領域内の代表色(文字領域代表色110)が抽出される
(ステップS304)。ここで、代表色は1色に限定し
てもよいし、領域内に複数色の文字が混在する場合には
任意の最大代表色数を選ぶようにしてもよい。以下に、
ある文字領域に対する文字色抽出処理の詳細について説
明する。
【0023】図4は、文字色抽出部103における文字
色抽出処理の詳細を説明するためのフローチャートであ
る。文字色抽出部103では、まず、文字領域の二値画
像である文字領域画像107から、文字行および個別文
字に対応する矩形領域が抽出される(ステップ40
1)。この矩形領域の抽出を、「文字切り処理」と呼
ぶ。
色抽出処理の詳細を説明するためのフローチャートであ
る。文字色抽出部103では、まず、文字領域の二値画
像である文字領域画像107から、文字行および個別文
字に対応する矩形領域が抽出される(ステップ40
1)。この矩形領域の抽出を、「文字切り処理」と呼
ぶ。
【0024】本実施形態では、この文字切り処理につい
ては公知の方法を利用するものとし、ここではその一例
について示す。図9は、本実施形態で使用される文字切
り処理の一手法を説明するための図である。図9(a)
に示すような二値画像を用いて説明する。まず、水平方
向の射影と垂直方向の射影をとり、その分散の高い方向
を文字列方向する。これによって、図9(b)の矩形で
囲まれる部分がそれぞれ文字列とされる。次いで、射影
の切れ目で行を分割し、さらに個々の行内で射影により
文字を分割する方法又はラベリングによって画素塊それ
ぞれを文字とする。これによって、図9(c)に示すよ
うに、それぞれの文字列から個々の文字が矩形を用いて
切り出される。本実施形態における以降の処理は、文字
切りされた各文字矩形内の領域に対して行われる。
ては公知の方法を利用するものとし、ここではその一例
について示す。図9は、本実施形態で使用される文字切
り処理の一手法を説明するための図である。図9(a)
に示すような二値画像を用いて説明する。まず、水平方
向の射影と垂直方向の射影をとり、その分散の高い方向
を文字列方向する。これによって、図9(b)の矩形で
囲まれる部分がそれぞれ文字列とされる。次いで、射影
の切れ目で行を分割し、さらに個々の行内で射影により
文字を分割する方法又はラベリングによって画素塊それ
ぞれを文字とする。これによって、図9(c)に示すよ
うに、それぞれの文字列から個々の文字が矩形を用いて
切り出される。本実施形態における以降の処理は、文字
切りされた各文字矩形内の領域に対して行われる。
【0025】次に、上述したようにして得られた各文字
矩形内の二値画像を細線化した二値画像が生成される
(ステップS402)。これは、スキャナ特性やプリン
ト時のアンチエイリアシングにより、文字周辺の乱され
た色情報を避けるためである。図11は、矩形領域で切
り出された文字及びその文字を細線化した細線化画像の
一例を示す図である。
矩形内の二値画像を細線化した二値画像が生成される
(ステップS402)。これは、スキャナ特性やプリン
ト時のアンチエイリアシングにより、文字周辺の乱され
た色情報を避けるためである。図11は、矩形領域で切
り出された文字及びその文字を細線化した細線化画像の
一例を示す図である。
【0026】さらに、細線化された二値画像の各画素に
対応する色情報を、元のカラー画像である多値画像を参
照することによって求め、RGBそれぞれの成分ごとに
ヒストグラムが作成される(ステップS403)。ここ
では、RGB成分ではなく、例えばYUVなどの他の色
空間を用いてもよい。さらに、RGB各ヒストグラムか
ら分散を求め、あらかじめ定められたしきい値と比較す
る(ステップS404)。その結果、いずれの成分もそ
の分散値がしきい値以内の場合(YES)、ステップS
405での処理が行われる。一方、しきい値を超える分
散値があった場合(NO)、ステップS406での処理
が行われる。
対応する色情報を、元のカラー画像である多値画像を参
照することによって求め、RGBそれぞれの成分ごとに
ヒストグラムが作成される(ステップS403)。ここ
では、RGB成分ではなく、例えばYUVなどの他の色
空間を用いてもよい。さらに、RGB各ヒストグラムか
ら分散を求め、あらかじめ定められたしきい値と比較す
る(ステップS404)。その結果、いずれの成分もそ
の分散値がしきい値以内の場合(YES)、ステップS
405での処理が行われる。一方、しきい値を超える分
散値があった場合(NO)、ステップS406での処理
が行われる。
【0027】ステップS405では、RGB各ヒストグ
ラムから注目文字矩形の代表色が決定される。これは、
各ヒストグラムのピーク値からなる色を用いてもよい。
また、平均値を用いてもよい。一方、ステップS406
では、非単色の注目矩形を非文字と判定して、当該文字
矩形内の二値画像中の黒画素をすべて消去する。この処
理は、該当部分をすべて白画素にすることで、該当部分
を非文字の領域と同様に扱うための処理である。
ラムから注目文字矩形の代表色が決定される。これは、
各ヒストグラムのピーク値からなる色を用いてもよい。
また、平均値を用いてもよい。一方、ステップS406
では、非単色の注目矩形を非文字と判定して、当該文字
矩形内の二値画像中の黒画素をすべて消去する。この処
理は、該当部分をすべて白画素にすることで、該当部分
を非文字の領域と同様に扱うための処理である。
【0028】図10は、図4におけるステップS403
〜S406の処理の一例を説明するための図である。図
10では、、文字「イ」は黒文字、文字「ン」は赤文
字、花模様Fは赤色と青色とからなるものとする、この
とき、図10に示すように、両文字については、ヒスト
グラムからそれぞれ代表色のRGB値を得る。また、花
模様Fについては、ヒストグラムの分散が大きいので非
文字と判定されるものとする。
〜S406の処理の一例を説明するための図である。図
10では、、文字「イ」は黒文字、文字「ン」は赤文
字、花模様Fは赤色と青色とからなるものとする、この
とき、図10に示すように、両文字については、ヒスト
グラムからそれぞれ代表色のRGB値を得る。また、花
模様Fについては、ヒストグラムの分散が大きいので非
文字と判定されるものとする。
【0029】そして、ステップS407において、文字
領域内に未処理の文字矩形が残っているか否かが判定さ
れる。その結果、未処理矩形が残っている場合(YE
S)、ステップS403に戻って上述した処理が未処理
の矩形に対して繰り返えされる。一方、未処理矩形がな
ければステップS408に進む。
領域内に未処理の文字矩形が残っているか否かが判定さ
れる。その結果、未処理矩形が残っている場合(YE
S)、ステップS403に戻って上述した処理が未処理
の矩形に対して繰り返えされる。一方、未処理矩形がな
ければステップS408に進む。
【0030】ステップS408では、各文字矩形に対応
する色の集合に対して減色処理が施されてn色以下にさ
れる。これは、紙面上に形成された画像を入力した場合
に生ずる色のばらつきをまとめるための処理である。具
体的な減色方法としては、ヒストグラムをとってしきい
値以上のピークを1個以上抽出し、それらの色を近接ピ
ークと統合する等の方法がある。また、その他の方法と
して、他のクラスタリング手法を用いてもよい。また、
nの値は任意の定数とするが、圧縮率に影響するので多
くても4程度も値が望ましい。
する色の集合に対して減色処理が施されてn色以下にさ
れる。これは、紙面上に形成された画像を入力した場合
に生ずる色のばらつきをまとめるための処理である。具
体的な減色方法としては、ヒストグラムをとってしきい
値以上のピークを1個以上抽出し、それらの色を近接ピ
ークと統合する等の方法がある。また、その他の方法と
して、他のクラスタリング手法を用いてもよい。また、
nの値は任意の定数とするが、圧縮率に影響するので多
くても4程度も値が望ましい。
【0031】図3に示すフローチャートのステップS3
04の処理においては、上述したような手順を用いて文
字領域内の代表色を抽出することができる。次に、文字
部塗りつぶし部104において、二値の文字領域画像内
の黒画素に対応する原画像上の各画素を、その周辺の画
素の色で塗りつぶすことによって下地多値画像108が
作成される(ステップS305)。図8は、本実施形態
による文字部塗りつぶし処理の一例を説明するための図
である。
04の処理においては、上述したような手順を用いて文
字領域内の代表色を抽出することができる。次に、文字
部塗りつぶし部104において、二値の文字領域画像内
の黒画素に対応する原画像上の各画素を、その周辺の画
素の色で塗りつぶすことによって下地多値画像108が
作成される(ステップS305)。図8は、本実施形態
による文字部塗りつぶし処理の一例を説明するための図
である。
【0032】図8(a)は、原画像の一例を示してお
り、グラデーション画像を背景として、「イン」という
青色の文字が中央付近に描かれている画像である。この
原画像から(b)に示されるような二値のの文字領域画
像が得られたとする。ここで、本実施形態においては、
例えば(a)に示される原画像を32画素×32画素ご
との小領域(以下、「パーツ」と称す。)に分割し、パ
ーツごとに以下に示す処理が行われるものとする。図8
(c)にパーツ分けの様子を示す。この図では、説明を
簡単にするため、(a)の原画像は4×3のパーツに分
割することができるものとする。
り、グラデーション画像を背景として、「イン」という
青色の文字が中央付近に描かれている画像である。この
原画像から(b)に示されるような二値のの文字領域画
像が得られたとする。ここで、本実施形態においては、
例えば(a)に示される原画像を32画素×32画素ご
との小領域(以下、「パーツ」と称す。)に分割し、パ
ーツごとに以下に示す処理が行われるものとする。図8
(c)にパーツ分けの様子を示す。この図では、説明を
簡単にするため、(a)の原画像は4×3のパーツに分
割することができるものとする。
【0033】図8(c)の各パーツ内左上の数字はパー
ツの番号を示す。この場合、パーツ00〜03、10、
13、20〜23内には(b)に示される文字領域を含
まないので何も処理は行われない。一方、パーツ11に
対しては、対応する二値画像中の画素より、各パーツ内
の白部分に対応するカラー画像のRGB値(これは、Y
UV等でも良い)の平均値ave_color11を算
出する。そして、原画像上で、二値画像の黒部分にあた
る画素を算出したave_color11で塗りつぶす
ことによって文字を取り除いた下地のみの下地多値画像
を生成する。パーツ12に対しても同様である。このよ
うにすることによって、文字の存在する部分の周りの画
素の平均値をもって、文字の存在する画素を塗りつぶす
ことができ、見掛け上、文字のみが取り除かれた自然な
下地多値画像108を生成することができる。
ツの番号を示す。この場合、パーツ00〜03、10、
13、20〜23内には(b)に示される文字領域を含
まないので何も処理は行われない。一方、パーツ11に
対しては、対応する二値画像中の画素より、各パーツ内
の白部分に対応するカラー画像のRGB値(これは、Y
UV等でも良い)の平均値ave_color11を算
出する。そして、原画像上で、二値画像の黒部分にあた
る画素を算出したave_color11で塗りつぶす
ことによって文字を取り除いた下地のみの下地多値画像
を生成する。パーツ12に対しても同様である。このよ
うにすることによって、文字の存在する部分の周りの画
素の平均値をもって、文字の存在する画素を塗りつぶす
ことができ、見掛け上、文字のみが取り除かれた自然な
下地多値画像108を生成することができる。
【0034】また、ステップS306では、文字領域画
像圧縮部105において、文字領域画像107にあたる
二値画像を圧縮して圧縮コード111を作成する。この
際、単色の文字領域はMMR圧縮を施す。尚、ステップ
S304において複数の代表色が抽出された文字領域
は、領域内の色情報を保存できる最低必要ビット数に変
換し、ZIP圧縮をするか、あるいは同一領域を色別に
異なる二値画像に分解する形で、それぞれをMMR圧縮
を施すようにしてもよい。
像圧縮部105において、文字領域画像107にあたる
二値画像を圧縮して圧縮コード111を作成する。この
際、単色の文字領域はMMR圧縮を施す。尚、ステップ
S304において複数の代表色が抽出された文字領域
は、領域内の色情報を保存できる最低必要ビット数に変
換し、ZIP圧縮をするか、あるいは同一領域を色別に
異なる二値画像に分解する形で、それぞれをMMR圧縮
を施すようにしてもよい。
【0035】ステップS307では、下地画像圧縮部1
06において、下地多値画像108に対しJPEG圧縮
を行って圧縮コード112を作成する。尚、JPEG圧
縮処理は一般的なものを用いるものとする。簡単に説明
すると、画像をYUVの各成分に分割し、それぞれを例
えば8画素×8画素の小領域ごとにDCT変換し、得ら
れた変換係数を量子化し、さらに符号化することによっ
て圧縮コードを得る。尚、文字の取り去られた下地は一
般に高い解像度を必要としないため、JPEG圧縮を行
う前に解像度変換を行ってもよい。
06において、下地多値画像108に対しJPEG圧縮
を行って圧縮コード112を作成する。尚、JPEG圧
縮処理は一般的なものを用いるものとする。簡単に説明
すると、画像をYUVの各成分に分割し、それぞれを例
えば8画素×8画素の小領域ごとにDCT変換し、得ら
れた変換係数を量子化し、さらに符号化することによっ
て圧縮コードを得る。尚、文字の取り去られた下地は一
般に高い解像度を必要としないため、JPEG圧縮を行
う前に解像度変換を行ってもよい。
【0036】最後に、ステップS308では、文字領域
座標109、文字領域代表色110、圧縮コード11
1、圧縮コード112の4つのデータをまとめて最終的
な画像データとして出力する。尚、この画像データを生
成するために、画像処理装置内に画像データ生成部を設
けてもよい。また、これらのデータは、PDFやXML
のように一般的に共有されるフォーマットで出力しても
よい。
座標109、文字領域代表色110、圧縮コード11
1、圧縮コード112の4つのデータをまとめて最終的
な画像データとして出力する。尚、この画像データを生
成するために、画像処理装置内に画像データ生成部を設
けてもよい。また、これらのデータは、PDFやXML
のように一般的に共有されるフォーマットで出力しても
よい。
【0037】<第2の実施形態>次に、ワードプロセッ
サなどの文書作成ソフトウェアによって作成された文書
データを展開して得られる画像を圧縮する画像処理装置
について説明する。
サなどの文書作成ソフトウェアによって作成された文書
データを展開して得られる画像を圧縮する画像処理装置
について説明する。
【0038】図14は、一般的な文書作成ソフトウェア
を用いて作成された独自の文書データを汎用的プリンタ
で出力する際の処理手順を説明するためのフローチャー
トである。まず、文書作成ソフトウェアを用いて作成さ
れた文書データが、プリンタ用の中間言語に翻訳されて
出力される(ステップS1401)。この中間言語は、
点、線、文字などのプリミティブ描画やビットマップの
コピー命令からなるものであり、一般的に普及している
形式である。
を用いて作成された独自の文書データを汎用的プリンタ
で出力する際の処理手順を説明するためのフローチャー
トである。まず、文書作成ソフトウェアを用いて作成さ
れた文書データが、プリンタ用の中間言語に翻訳されて
出力される(ステップS1401)。この中間言語は、
点、線、文字などのプリミティブ描画やビットマップの
コピー命令からなるものであり、一般的に普及している
形式である。
【0039】図1における中間言語翻訳部121では、
文書作成ソフトウェアを用いて作成された文書データを
プリント用の中間言語を翻訳した後、ページ画像(多値
画像100)と像域フラグ画像122が作成される。す
なわち、中間言語に翻訳された文書データがすべて描画
されて、ページ画像に変換される。この際、ページ画像
と共に、ページ画像上の各画素が、文字として描画され
た画素か否かを示すフラグで構成される像域フラグ画像
122が作成される(ステップS1402)。尚、像域
フラグ画像において重ね書きがある場合は、後に描画さ
れたものの属性に従うようなフラグとなる。例えば、
「文字」の上に「絵」が重ね書きされた場合、像域フラ
グはオフになり、逆に「絵」の上に「文字」が重ね書き
された場合はオンになる。
文書作成ソフトウェアを用いて作成された文書データを
プリント用の中間言語を翻訳した後、ページ画像(多値
画像100)と像域フラグ画像122が作成される。す
なわち、中間言語に翻訳された文書データがすべて描画
されて、ページ画像に変換される。この際、ページ画像
と共に、ページ画像上の各画素が、文字として描画され
た画素か否かを示すフラグで構成される像域フラグ画像
122が作成される(ステップS1402)。尚、像域
フラグ画像において重ね書きがある場合は、後に描画さ
れたものの属性に従うようなフラグとなる。例えば、
「文字」の上に「絵」が重ね書きされた場合、像域フラ
グはオフになり、逆に「絵」の上に「文字」が重ね書き
された場合はオンになる。
【0040】図12は、第2の実施形態において用いら
れる像域フラグ画像の一例を説明するための図である。
図12(a)に示すように、「星型」の絵(Picture)
の上に文字「イ」(Character)が重ね書きされている
場合について説明する。この様子を部分的に拡大すると
図12(b)に示すようになる。この場合、重ね書きさ
れている部分の像域フラグはオンになるので、図12
(b)のページ画像に対応する像域フラグ画像は図12
(c)に示すようになる。そして、プリンタによって画
像が印刷される(ステップS1403)が、この際に、
像域フラグ画像が参照され、文字部分に対するエッジ強
調などの処理が行われて画質の向上が計られる。
れる像域フラグ画像の一例を説明するための図である。
図12(a)に示すように、「星型」の絵(Picture)
の上に文字「イ」(Character)が重ね書きされている
場合について説明する。この様子を部分的に拡大すると
図12(b)に示すようになる。この場合、重ね書きさ
れている部分の像域フラグはオンになるので、図12
(b)のページ画像に対応する像域フラグ画像は図12
(c)に示すようになる。そして、プリンタによって画
像が印刷される(ステップS1403)が、この際に、
像域フラグ画像が参照され、文字部分に対するエッジ強
調などの処理が行われて画質の向上が計られる。
【0041】図13は、文書作成ソフトウェアがプリン
タに出力するために作成する中間言語データを入力とし
て画像の圧縮処理を行う手順を説明するためのフローチ
ャートである。まず、中間言語翻訳部121において、
文書データについての中間言語データからページ画像
(多値画像100)と像域フラグ画像122とが作成さ
れる。そして、像域フラグ画像122を用いて、文字領
域抽出用の二値画像である像域二値画像K’が生成され
る(ステップS1301)。ここで、像域二値画像K’
は、像域フラグがオンの画素を黒画素(0)、像域フラ
グがオフの画素を白画素(1)とする二値画像である。
タに出力するために作成する中間言語データを入力とし
て画像の圧縮処理を行う手順を説明するためのフローチ
ャートである。まず、中間言語翻訳部121において、
文書データについての中間言語データからページ画像
(多値画像100)と像域フラグ画像122とが作成さ
れる。そして、像域フラグ画像122を用いて、文字領
域抽出用の二値画像である像域二値画像K’が生成され
る(ステップS1301)。ここで、像域二値画像K’
は、像域フラグがオンの画素を黒画素(0)、像域フラ
グがオフの画素を白画素(1)とする二値画像である。
【0042】尚、中間言語データから像域フラグ画像を
作成する処理は、前述した図14におけるステップS1
402と同様の処理が行われる。この処理は、図1に示
される本実施形態に係る画像処理装置内に実装してもよ
いが、既存のプリンタへの出力系から両方の画像が得ら
れる場合は、それらの画像を利用する形で実現してもよ
い。また、この場合、画像の解像度に応じて解像度変換
を行ってもよい。例えば、原画像が300dpiで電子
化された場合、像域フラグ画像における4画素×4画素
の「or」値を1画素に対応させるように作成された画
像K”は、75dpiの画像となる。
作成する処理は、前述した図14におけるステップS1
402と同様の処理が行われる。この処理は、図1に示
される本実施形態に係る画像処理装置内に実装してもよ
いが、既存のプリンタへの出力系から両方の画像が得ら
れる場合は、それらの画像を利用する形で実現してもよ
い。また、この場合、画像の解像度に応じて解像度変換
を行ってもよい。例えば、原画像が300dpiで電子
化された場合、像域フラグ画像における4画素×4画素
の「or」値を1画素に対応させるように作成された画
像K”は、75dpiの画像となる。
【0043】次に、文字領域検出部101において、像
域二値画像K’あるいは画像K”に対して領域分割処理
が行われ、その結果から文字領域のみが抽出されて文字
領域座標109が作成される(ステップS1302)。
ここで、像域二値画像K’は、原画像上の文字情報のみ
を含む二値画像に相当するので、第1の実施形態で説明
したスキャン時と共通の領域分割処理アルゴリズムを用
いて、文字領域を高精度で抽出することができる。
域二値画像K’あるいは画像K”に対して領域分割処理
が行われ、その結果から文字領域のみが抽出されて文字
領域座標109が作成される(ステップS1302)。
ここで、像域二値画像K’は、原画像上の文字情報のみ
を含む二値画像に相当するので、第1の実施形態で説明
したスキャン時と共通の領域分割処理アルゴリズムを用
いて、文字領域を高精度で抽出することができる。
【0044】さらに、文字領域画像作成部102におい
て、文字領域座標109に基づき、文字領域画像が作成
される(ステップS1303)。これは、像域二値画像
K’の部分画像に相当する。また、文字色抽出部103
において、ページ画像と部分文字領域画像を参照して、
各文字領域内の代表色が抽出される(ステップS130
4)。
て、文字領域座標109に基づき、文字領域画像が作成
される(ステップS1303)。これは、像域二値画像
K’の部分画像に相当する。また、文字色抽出部103
において、ページ画像と部分文字領域画像を参照して、
各文字領域内の代表色が抽出される(ステップS130
4)。
【0045】次に、文字部塗りつぶし部104におい
て、文字領域画像内の黒画素に対応するページ画像上の
各画素をその周辺の色で塗りつぶして、下地多値画像1
08が作成される(ステップS1305)。また、文字
領域画像圧縮部105において、文字領域画像107に
相当する部分二値画像の集合を圧縮して圧縮コード11
1が作成される(ステップS1306)。さらに、下地
画像圧縮部106において、下地多値画像108に対し
てJPEG圧縮が施されて圧縮コード112が作成され
る(ステップS1307)。
て、文字領域画像内の黒画素に対応するページ画像上の
各画素をその周辺の色で塗りつぶして、下地多値画像1
08が作成される(ステップS1305)。また、文字
領域画像圧縮部105において、文字領域画像107に
相当する部分二値画像の集合を圧縮して圧縮コード11
1が作成される(ステップS1306)。さらに、下地
画像圧縮部106において、下地多値画像108に対し
てJPEG圧縮が施されて圧縮コード112が作成され
る(ステップS1307)。
【0046】最後に、上記処理によって得られた、文字
領域座標109、文字領域色情報110、圧縮コード1
11、圧縮コード112の4つのデータをまとめて画像
データとして出力する(ステップS1308)。また、
これらのデータは、PDFやXMLのように一般的に共
有されるフォーマットで出力してもよい。
領域座標109、文字領域色情報110、圧縮コード1
11、圧縮コード112の4つのデータをまとめて画像
データとして出力する(ステップS1308)。また、
これらのデータは、PDFやXMLのように一般的に共
有されるフォーマットで出力してもよい。
【0047】尚、上記ステップS1302〜S1308
の各処理は、図3におけるステップS302〜S308
のそれぞれの処理に対応する。すなわち、本発明に係る
画像処理装置は同一構成であって、スキャンされて得ら
れた画像と、文書作成ソフトウェアの文書データの両方
を対象としたデータ圧縮を提供することが可能である。
の各処理は、図3におけるステップS302〜S308
のそれぞれの処理に対応する。すなわち、本発明に係る
画像処理装置は同一構成であって、スキャンされて得ら
れた画像と、文書作成ソフトウェアの文書データの両方
を対象としたデータ圧縮を提供することが可能である。
【0048】また、文書作成ソフトウェアが印刷の際に
作成するページ画像と像域フラグ情報を用いるので、個
々の文書作成ソフトウェア独自のデータ構造に依存せず
に、高画質を保ったデータ圧縮が可能になる。
作成するページ画像と像域フラグ情報を用いるので、個
々の文書作成ソフトウェア独自のデータ構造に依存せず
に、高画質を保ったデータ圧縮が可能になる。
【0049】以上、本発明によれば、紙をスキャンした
画像と、コンピュータ上の文書作成ソフトで作成された
文書データの両方に対し、高画質、高圧縮でかつ一般に
広く可読なデータへと変換することが可能になる。
画像と、コンピュータ上の文書作成ソフトで作成された
文書データの両方に対し、高画質、高圧縮でかつ一般に
広く可読なデータへと変換することが可能になる。
【0050】すなわち、本発明は、入力された文書デー
タを圧縮する画像処理装置であって、光学的な原稿読み
取りにて発生した文書データ、またはコンピュータ上で
作成した文書データを入力する入力手段と、光学的な読
み取りで発生した文書データの多値画像100から閾値
処理により二値画像を生成する第1の二値化手段(縮小
・二値化部120)と、コンピュータ上で作成した文書
データを展開した多値画像100から二値画像を生成す
る第2の二値化手段(縮小・二値化部120)と、何れ
かの二値画像に基づいて文字領域を抽出する文字領域抽
出手段(文字領域検出部101)と、抽出された文字領
域内の文字の色を抽出する文字色抽出手段(文字領域代
表色110)と、多値画像100内の文字を文字周辺色
で置換することによって下地画像(下地多値画像10
8)を生成する下地画像生成手段(文字部塗りつぶし部
104)と、文字領域から成る文字領域画像を圧縮する
第1の圧縮手段(文字領域画像圧縮部105)と、下地
画像を圧縮する第2の圧縮手段(下地画像圧縮部10
6)とを備えることを特徴とする。
タを圧縮する画像処理装置であって、光学的な原稿読み
取りにて発生した文書データ、またはコンピュータ上で
作成した文書データを入力する入力手段と、光学的な読
み取りで発生した文書データの多値画像100から閾値
処理により二値画像を生成する第1の二値化手段(縮小
・二値化部120)と、コンピュータ上で作成した文書
データを展開した多値画像100から二値画像を生成す
る第2の二値化手段(縮小・二値化部120)と、何れ
かの二値画像に基づいて文字領域を抽出する文字領域抽
出手段(文字領域検出部101)と、抽出された文字領
域内の文字の色を抽出する文字色抽出手段(文字領域代
表色110)と、多値画像100内の文字を文字周辺色
で置換することによって下地画像(下地多値画像10
8)を生成する下地画像生成手段(文字部塗りつぶし部
104)と、文字領域から成る文字領域画像を圧縮する
第1の圧縮手段(文字領域画像圧縮部105)と、下地
画像を圧縮する第2の圧縮手段(下地画像圧縮部10
6)とを備えることを特徴とする。
【0051】また、本発明に係る画像処理装置は、多値
画像100を所定の縮小率で縮小する縮小手段(縮小・
二値化部120)をさらに備えることを特徴とする。さ
らに、本発明に係る画像処理装置は、文字領域の位置情
報(文字領域座標)、圧縮された文字領域画像(圧縮コ
ード111)、圧縮された下地画像(圧縮コード11
2)及び抽出された文字の色(文字領域代表色110)
を圧縮画像データとして出力する出力手段をさらに備え
ることを特徴とする。
画像100を所定の縮小率で縮小する縮小手段(縮小・
二値化部120)をさらに備えることを特徴とする。さ
らに、本発明に係る画像処理装置は、文字領域の位置情
報(文字領域座標)、圧縮された文字領域画像(圧縮コ
ード111)、圧縮された下地画像(圧縮コード11
2)及び抽出された文字の色(文字領域代表色110)
を圧縮画像データとして出力する出力手段をさらに備え
ることを特徴とする。
【0052】さらにまた、本発明に係る画像処理装置
は、多値画像100が、文書作成ソフトウェアで作成さ
れた文書データであってプリンタ用の中間言語に翻訳さ
れた文書データを入力して生成され、文書データから像
域フラグ画像122を生成する生成手段(中間言語翻訳
部121)をさらに備えることを特徴とする。
は、多値画像100が、文書作成ソフトウェアで作成さ
れた文書データであってプリンタ用の中間言語に翻訳さ
れた文書データを入力して生成され、文書データから像
域フラグ画像122を生成する生成手段(中間言語翻訳
部121)をさらに備えることを特徴とする。
【0053】また、本発明に係る画像処理装置は、縮小
手段(縮小・二値化部120)が、文書原稿を光学的読
取手段を用いて読み取られて入力された多値画像100
を所定の縮小率で縮小し、文書作成ソフトウェアで作成
された文書データから生成された多値画像を縮小しない
ことを特徴とする。
手段(縮小・二値化部120)が、文書原稿を光学的読
取手段を用いて読み取られて入力された多値画像100
を所定の縮小率で縮小し、文書作成ソフトウェアで作成
された文書データから生成された多値画像を縮小しない
ことを特徴とする。
【0054】尚、本発明は、複数の機器(例えば、ホス
トコンピュータ、インタフェース機器、リーダ、プリン
タ等)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機、ファクシミリ装置
等)に適用してもよい。
トコンピュータ、インタフェース機器、リーダ、プリン
タ等)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機、ファクシミリ装置
等)に適用してもよい。
【0055】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記録媒体(または記憶媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記録媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記録媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
の機能を実現するソフトウェアのプログラムコードを記
録した記録媒体(または記憶媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記録媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記録媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0056】さらに、記録媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0057】本発明を上記記録媒体に適用する場合、そ
の記録媒体には、先に説明したフローチャートに対応す
るプログラムコードが格納されることになる。
の記録媒体には、先に説明したフローチャートに対応す
るプログラムコードが格納されることになる。
【0058】
【発明の効果】本発明によれば、文書をスキャナで入力
した画像データや、コンピュータ上の文書作成ソフトウ
ェアで作成された文書データを選択的に処理でき、これ
ら文書データを夫々の入力方法に適切な画質/処理方法
で効率良く圧縮することができる。
した画像データや、コンピュータ上の文書作成ソフトウ
ェアで作成された文書データを選択的に処理でき、これ
ら文書データを夫々の入力方法に適切な画質/処理方法
で効率良く圧縮することができる。
【図1】本発明の一実施形態による入力された画像を圧
縮するための画像処理装置の構成を示すブロック図であ
る。
縮するための画像処理装置の構成を示すブロック図であ
る。
【図2】本実施形態による画像処理装置に入力される文
書の一例を示す図である。
書の一例を示す図である。
【図3】本発明の第1の実施形態による画像処理装置の
動作手順を説明するためのフローチャートである。
動作手順を説明するためのフローチャートである。
【図4】文字色抽出部103における文字色抽出処理の
詳細を説明するためのフローチャートである。
詳細を説明するためのフローチャートである。
【図5】図2に示されるカラー原稿をスキャナから入力
して得られた多値画像100を間引いて輝度変換された
後の画像に対するヒストグラムを示す図である。
して得られた多値画像100を間引いて輝度変換された
後の画像に対するヒストグラムを示す図である。
【図6】図5に示すヒストグラムから算出されたしきい
値Tを用いて多値画像を二値化した二値化画像の一例を
示す図である。
値Tを用いて多値画像を二値化した二値化画像の一例を
示す図である。
【図7】図6に示される二値化画像を領域分割した結果
生成される文字領域を説明するための図である。
生成される文字領域を説明するための図である。
【図8】本実施形態による文字部塗りつぶし処理の一例
を説明するための図である。
を説明するための図である。
【図9】本実施形態で使用される文字切り処理の一手法
を説明するための図である。
を説明するための図である。
【図10】図4におけるステップS403〜S406の
処理の一例を説明するための図である。
処理の一例を説明するための図である。
【図11】矩形領域で切り出された文字及びその文字を
細線化した細線化画像の一例を示す図である。
細線化した細線化画像の一例を示す図である。
【図12】第2の実施形態において用いられる像域フラ
グ画像の一例を説明するための図である。
グ画像の一例を説明するための図である。
【図13】文書作成ソフトウェアがプリンタに出力する
ために作成する中間言語データを入力として画像の圧縮
処理を行う手順を説明するためのフローチャートであ
る。
ために作成する中間言語データを入力として画像の圧縮
処理を行う手順を説明するためのフローチャートであ
る。
【図14】一般的な文書作成ソフトウェアを用いて作成
された独自の文書データを汎用的プリンタで出力する際
の処理手順を説明するためのフローチャートである。
された独自の文書データを汎用的プリンタで出力する際
の処理手順を説明するためのフローチャートである。
100 多値画像
101 文字領域検出部
102 文字領域画像作成部102
103 文字色抽出部
104 文字部塗りつぶし部
105 文字領域画像圧縮部
106 下地画像圧縮部
107 文字領域画像
108 下地多値画像
109 文字領域座標
110 文字領域代表色
111、112 圧縮コード
120 縮小・二値化部
121 中間言語翻訳部
122 像域フラグ画像
フロントページの続き
(51)Int.Cl.7 識別記号 FI テーマコート゛(参考)
H04N 1/46 H04N 1/40 D
1/60 1/46 Z
Fターム(参考) 5B057 CA01 CA08 CA12 CA16 CB01
CB08 CB12 CB16 CC01 CE09
CE12 CE17 CG01 CH08
5C077 LL17 MP08 PP27 PP28 PP31
PP32 PP37 PP38 PQ08 PQ12
PQ19 PQ25 RR02 RR15 RR21
5C078 AA01 AA09 CA02 DA01 DB06
5C079 HB01 LA06 LA07 LA21 LA27
LA31 LB12 NA10
5L096 AA02 BA07 BA17 EA43 FA18
FA37 FA38 FA44 GA34 MA03
Claims (12)
- 【請求項1】 入力された文書データを圧縮する画像処
理装置であって、 光学的な原稿読み取りにて発生した文書データ、または
コンピュータ上で作成した文書データを入力する入力手
段と、 前記光学的な読み取りで発生した文書データの多値画像
から閾値処理により二値画像を生成する第1の二値化手
段と、 前記コンピュータ上で作成した文書データを展開した多
値画像から二値画像を生成する第2の二値化手段と、 前記何れかの二値画像に基づいて文字領域を抽出する文
字領域抽出手段と、 抽出された文字領域内の文字の色を抽出する文字色抽出
手段と、 前記多値画像内の文字を文字周辺色で置換することによ
って下地画像を生成する下地画像生成手段と、 前記文字領域から成る文字領域画像を圧縮する第1の圧
縮手段と、 前記下地画像を圧縮する第2の圧縮手段とを備えること
を特徴とする画像処理装置。 - 【請求項2】 前記コンピュータ上で作成した文書デー
タを展開した多値画像が、文書作成ソフトウェアで作成
された文書データであってプリンタ用の中間言語に翻訳
された文書データを入力して生成され、 前記文書データから像域フラグ画像を生成する生成手段
をさらに備えることを特徴とする請求項1記載の画像処
理装置。 - 【請求項3】 前記多値画像を所定の縮小率で縮小する
縮小手段をさらに備えることを特徴とする請求項1又は
2に記載の画像処理装置。 - 【請求項4】 前記縮小手段が、文書原稿を光学的読取
手段を用いて読み取られて入力された多値画像を所定の
縮小率で縮小し、文書作成ソフトウェアで作成された文
書データから生成された多値画像を縮小しないことを特
徴とする請求項3記載の画像処理装置。 - 【請求項5】 前記文字領域の位置情報、圧縮された文
字領域画像、圧縮された下地画像及び抽出された文字の
色を圧縮画像データとして出力する出力手段をさらに備
えることを特徴とする請求項1から4までのいずれか1
項に記載の画像処理装置。 - 【請求項6】 光学的な原稿読み取りにて発生した文書
データ、またはコンピュータ上で作成した文書データを
圧縮する画像処理方法であって、 前記光学的な読み取りで発生した文書データの多値画像
から閾値処理により二値画像を生成する第1の二値化工
程と、 前記コンピュータ上で作成した文書データを展開した多
値画像から二値画像を生成する第2の二値化工程と、 前記何れかの二値画像に基づいて文字領域を抽出する文
字領域抽出工程と、 抽出された文字領域内の文字の色を抽出する文字色抽出
工程と、 前記多値画像内の文字を文字周辺色で置換することによ
って下地画像を生成する下地画像生成工程と、 前記文字領域から成る文字領域画像を圧縮する第1の圧
縮工程と、 前記下地画像を圧縮する第2の圧縮工程とを有すること
を特徴とする画像処理方法。 - 【請求項7】 前記多値画像が、文書作成ソフトウェア
で作成された文書データであってプリンタ用の中間言語
に翻訳された文書データを入力して生成され、 前記文書データから像域フラグ画像を生成する生成工程
をさらに有することを特徴とする請求項6記載の画像処
理方法。 - 【請求項8】 前記コンピュータ上で作成した文書デー
タを展開した多値画像を所定の縮小率で縮小する縮小工
程をさらに有することを特徴とする請求項6又は7に記
載の画像処理方法。 - 【請求項9】 前記縮小工程が、文書原稿を光学的読取
手段を用いて読み取られて入力された多値画像を所定の
縮小率で縮小し、文書作成ソフトウェアで作成された文
書データから生成された多値画像を縮小しないことを特
徴とする請求項8記載の画像処理装置。 - 【請求項10】 前記文字領域の位置情報、圧縮された
文字領域画像、圧縮された下地画像及び抽出された文字
の色を圧縮画像データとして出力する出力工程をさらに
有することを特徴とする請求項6から9までのいずれか
1項に記載の画像処理方法。 - 【請求項11】 光学的な原稿読み取りにて発生した文
書データ、またはコンピュータ上で作成した文書データ
を圧縮する画像処理装置を制御するためのコンピュータ
プログラムであって、 前記光学的な読み取りで発生した文書データの多値画像
から閾値処理により二値画像を生成する第1の二値化手
段と、 前記コンピュータ上で作成した文書データを展開した多
値画像から二値画像を生成する第2の二値化手段と、 前記何れかの二値画像に基づいて文字領域を抽出する文
字領域抽出手段と、 抽出された文字領域内の文字の色を抽出する文字色抽出
手段と、 前記多値画像内の文字を文字周辺色で置換することによ
って下地画像を生成する下地画像生成手段と、 前記文字領域から成る文字領域画像を圧縮する第1の圧
縮手段と、 前記下地画像を圧縮する第2の圧縮手段として機能する
ことを特徴とするコンピュータプログラム。 - 【請求項12】 請求項11記載のコンピュータプログ
ラムを格納することを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002039035A JP2003244447A (ja) | 2002-02-15 | 2002-02-15 | 画像処理装置及び画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002039035A JP2003244447A (ja) | 2002-02-15 | 2002-02-15 | 画像処理装置及び画像処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003244447A true JP2003244447A (ja) | 2003-08-29 |
Family
ID=27780192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002039035A Withdrawn JP2003244447A (ja) | 2002-02-15 | 2002-02-15 | 画像処理装置及び画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003244447A (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005269269A (ja) * | 2004-03-18 | 2005-09-29 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2006050548A (ja) * | 2004-07-05 | 2006-02-16 | Matsushita Electric Ind Co Ltd | 画像処理装置及び画像処理方法 |
JP2006053786A (ja) * | 2004-08-12 | 2006-02-23 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2006270260A (ja) * | 2005-03-22 | 2006-10-05 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2007033727A (ja) * | 2005-07-26 | 2007-02-08 | Fuji Xerox Co Ltd | 教材処理装置、教材処理方法および教材処理プログラム |
JP2007249774A (ja) * | 2006-03-17 | 2007-09-27 | Konica Minolta Business Technologies Inc | 文字色判別装置、文字色判別方法、およびコンピュータプログラム |
JP2010028603A (ja) * | 2008-07-23 | 2010-02-04 | Nec Access Technica Ltd | 画像データ処理装置、画像データ処理方法および画像データ処理プログラム |
US7728850B2 (en) | 2005-03-14 | 2010-06-01 | Fuji Xerox Co., Ltd. | Apparatus and methods for processing layered image data of a document |
US7792388B2 (en) | 2005-08-23 | 2010-09-07 | Ricoh Company, Ltd. | Controlling format of a compound image |
CN101938650A (zh) * | 2009-06-25 | 2011-01-05 | 夏普株式会社 | 图像压缩方法和装置、图像解压方法和装置、图像形成装置 |
US8014620B2 (en) | 2006-08-24 | 2011-09-06 | Fuji Xerox Co., Ltd. | Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus |
US8213713B2 (en) | 2009-03-27 | 2012-07-03 | Fuji Xerox Co., Ltd. | Image processing apparatus and computer readable medium |
US8275198B2 (en) | 2009-03-27 | 2012-09-25 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer readable medium with compression processing for each color |
US8532404B2 (en) | 2009-03-27 | 2013-09-10 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
-
2002
- 2002-02-15 JP JP2002039035A patent/JP2003244447A/ja not_active Withdrawn
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005269269A (ja) * | 2004-03-18 | 2005-09-29 | Fuji Xerox Co Ltd | 画像処理装置 |
JP4507656B2 (ja) * | 2004-03-18 | 2010-07-21 | 富士ゼロックス株式会社 | 画像処理装置 |
JP2006050548A (ja) * | 2004-07-05 | 2006-02-16 | Matsushita Electric Ind Co Ltd | 画像処理装置及び画像処理方法 |
JP4695914B2 (ja) * | 2004-07-05 | 2011-06-08 | パナソニック株式会社 | 画像処理装置及び画像処理方法 |
JP2006053786A (ja) * | 2004-08-12 | 2006-02-23 | Fuji Xerox Co Ltd | 画像処理装置 |
JP4506346B2 (ja) * | 2004-08-12 | 2010-07-21 | 富士ゼロックス株式会社 | 画像処理装置 |
US7728850B2 (en) | 2005-03-14 | 2010-06-01 | Fuji Xerox Co., Ltd. | Apparatus and methods for processing layered image data of a document |
JP2006270260A (ja) * | 2005-03-22 | 2006-10-05 | Fuji Xerox Co Ltd | 画像処理装置 |
JP4736489B2 (ja) * | 2005-03-22 | 2011-07-27 | 富士ゼロックス株式会社 | 画像処理装置 |
JP2007033727A (ja) * | 2005-07-26 | 2007-02-08 | Fuji Xerox Co Ltd | 教材処理装置、教材処理方法および教材処理プログラム |
US7792388B2 (en) | 2005-08-23 | 2010-09-07 | Ricoh Company, Ltd. | Controlling format of a compound image |
JP4710672B2 (ja) * | 2006-03-17 | 2011-06-29 | コニカミノルタビジネステクノロジーズ株式会社 | 文字色判別装置、文字色判別方法、およびコンピュータプログラム |
JP2007249774A (ja) * | 2006-03-17 | 2007-09-27 | Konica Minolta Business Technologies Inc | 文字色判別装置、文字色判別方法、およびコンピュータプログラム |
US8014620B2 (en) | 2006-08-24 | 2011-09-06 | Fuji Xerox Co., Ltd. | Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus |
JP2010028603A (ja) * | 2008-07-23 | 2010-02-04 | Nec Access Technica Ltd | 画像データ処理装置、画像データ処理方法および画像データ処理プログラム |
US8213713B2 (en) | 2009-03-27 | 2012-07-03 | Fuji Xerox Co., Ltd. | Image processing apparatus and computer readable medium |
US8275198B2 (en) | 2009-03-27 | 2012-09-25 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer readable medium with compression processing for each color |
US8532404B2 (en) | 2009-03-27 | 2013-09-10 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
CN101938650A (zh) * | 2009-06-25 | 2011-01-05 | 夏普株式会社 | 图像压缩方法和装置、图像解压方法和装置、图像形成装置 |
JP2011010023A (ja) * | 2009-06-25 | 2011-01-13 | Sharp Corp | 画像圧縮装置、画像圧縮方法、画像伸張装置、画像伸張方法、画像形成装置、コンピュータプログラム及び記録媒体 |
US8265401B2 (en) | 2009-06-25 | 2012-09-11 | Sharp Kabushiki Kaisha | Image compressing apparatus, image compressing method, image decompressing apparatus, image decompressing method, image forming apparatus and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4366011B2 (ja) | 文書処理装置及び方法 | |
US8417029B2 (en) | Image processing apparatus and method, including fill-up processing | |
US7639388B2 (en) | Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction | |
JP2005020227A (ja) | 画像圧縮装置 | |
JP4366003B2 (ja) | 画像処理装置及び画像処理方法 | |
US20040165782A1 (en) | Image processing apparatus | |
JP2007074030A (ja) | 画像処理装置及び方法 | |
US7626743B2 (en) | Image processing apparatus, image processing method and image processing program for rendering pixels transparent in circumscribed areas | |
JP2003244447A (ja) | 画像処理装置及び画像処理方法 | |
JP3715905B2 (ja) | 画像処理装置、画像処理方法、プログラム並びに記憶媒体 | |
JP4579759B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2010056827A (ja) | 画像処理装置および画像処理プログラム | |
US8971647B2 (en) | Image compression apparatus, image compression method, and storage medium | |
JP2003018412A (ja) | 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体 | |
JP6607490B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
JP2010146218A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
JP4693289B2 (ja) | 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体 | |
JP2003338935A (ja) | 画像処理装置および方法 | |
JP5132440B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2002369011A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP2003338934A (ja) | 画像処理装置および方法 | |
JP4411244B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP4504096B2 (ja) | 画像処理装置、プログラム、及び記憶媒体 | |
JP4228905B2 (ja) | 画像処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20050510 |