JP2003244447A

JP2003244447A - 画像処理装置及び画像処理方法

Info

Publication number: JP2003244447A
Application number: JP2002039035A
Authority: JP
Inventors: Tomotoshi Kanatsu; 知俊金津
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2002-02-15
Filing date: 2002-02-15
Publication date: 2003-08-29

Abstract

(57)【要約】【課題】文書をスキャナで入力した画像データや、コ
ンピュータ上の文書作成ソフトウェアで作成された文書
データを、一般的な圧縮画像データとして、高画質かつ
高圧縮率で圧縮することができる画像処理装置及び画像
処理方法を提供する。【解決手段】入力された文書データについての多値画
像１００について、縮小・二値化部１２０で二値画像が
生成される。この二値画像に基づいて文字領域検出部１
０１において文字領域が抽出され、文字領域座標１０９
が得られる。また、抽出された文字領域内の文字領域代
表色１１０が文字色抽出部１０３で抽出され、文字部塗
りつぶし部１０４において多値画像１００から下地多値
画像１０８が生成される。さらに、文字領域画像が文字
領域画像圧縮部１０５で圧縮されて圧縮コード１１１が
生成され、下地画像が下地画像圧縮部１０６で圧縮され
て圧縮コード１１２が生成される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文書データを好適
に圧縮することができる画像処理装置及び画像処理方法
に関する。

【０００２】

【従来の技術】近年、スキャナの普及により文書の電子
化が進んでいる。電子化された文書の一形式としてフル
カラービットマップ形式がある。例えば、Ａ４サイズの
文書原稿を３００ｄｐｉのフルカラービットマップ形式
で電子化した場合、その画像データは約２４Ｍバイトに
達する。このような大容量の画像データは、メール等の
添付ファイルとしてネットワークを介して通信するには
データ容量が大きくて不便である。そこで、通常、フル
カラー画像に対してはＪＰＥＧ等を用いた圧縮処理が行
われ、データ容量を縮小した後に取り扱われることが一
般的である。

【０００３】ＪＰＥＧ圧縮は、写真等の自然画像を圧縮
する方法としては非常に効果が高く、圧縮後の画質も良
いという利点がある。しかし、文字部分等の高周波部分
をＪＰＥＧ圧縮した場合、モスキートノイズと呼ばれる
画像劣化が発生するという欠点がある。そこで、従来か
ら、画像領域を文字領域とそれ以外の領域とに分割し
て、文字領域以外の下地部分には自然画像に適した圧縮
方式を施し、単色あるいは小数色の文字領域部分には可
逆圧縮方式を施すような方法が知られている。その一例
として、画像領域を文字領域とそれ以外の領域とに分割
して、文字領域に対しては色情報を保持しつつＭＭＲ圧
縮やＺＩＰ圧縮を行い、文字領域以外の下地部分につい
てはＪＰＥＧ圧縮を行うような方法がある。

【０００４】一方、ワードプロセッサ等のコンピュータ
上の文書作成ソフトウェアを用いて作成された文書デー
タは、一般に、それぞれのソフトウェアに固有の方法で
作成されており、また文字部分と画像部分とは異なるデ
ータとして格納されている。そして、これらの文書デー
タは、一般に、紙面上に形成されている文書をスキャナ
で入力した画像データよりもデータ容量が小さいので、
ネットワークを介した通信において大きく支障をきたす
ことは少ない。

【０００５】

【発明が解決しようとする課題】しかしながら、特定の
文書作成ソフトウェアを用いて作成された文書データを
送信先において閲覧し、また紙面上に印刷等するために
は、送信された文書データを解析することができる同様
のソフトウェアが送信先においても必要とされる。従っ
て、送信先において、現在流通している多種多様な文書
作成ソフトウェアで作成される文書データのすべてに対
応させるようにすることは困難である。

【０００６】そこで、あらゆる送信先で当該文書データ
の利用を可能とするためには、特定のソフトウェアがな
くても閲覧することができるように、文書データを画像
データとして扱うことが望ましい。さらに、その画像デ
ータは、一般的な圧縮方式によって、画像データが圧縮
されていることが望ましい。

【０００７】本発明は、このような事情を考慮してなさ
れたものであり、文書をスキャナで入力した画像データ
や、コンピュータ上の文書作成ソフトウェアで作成され
た文書データを選択的に処理でき、これら文書データを
夫々の入力方法に適切な画質／処理方法で効率良く圧縮
することができる画像処理装置及び画像処理方法を提供
することを目的とする。

【０００８】

【課題を解決するための手段】上記課題を解決するため
に、本発明は、入力された文書データを圧縮する画像処
理装置であって、光学的な原稿読み取りにて発生した文
書データ、またはコンピュータ上で作成した文書データ
を入力する入力手段と、前記光学的な読み取りで発生し
た文書データの多値画像から閾値処理により二値画像を
生成する第１の二値化手段と、前記コンピュータ上で作
成した文書データを展開した多値画像から二値画像を生
成する第２の二値化手段と、前記何れかの二値画像に基
づいて文字領域を抽出する文字領域抽出手段と、抽出さ
れた文字領域内の文字の色を抽出する文字色抽出手段
と、前記多値画像内の文字を文字周辺色で置換すること
によって下地画像を生成する下地画像生成手段と、前記
文字領域から成る文字領域画像を圧縮する第１の圧縮手
段と、前記下地画像を圧縮する第２の圧縮手段とを備え
ることを特徴とする。

【０００９】

【発明の実施の形態】以下、図面を参照して、本発明の
実施形態について説明する。

【００１０】＜第１の実施形態＞図１は、本発明の一実
施形態による入力された画像を圧縮するための画像処理
装置の構成を示すブロック図である。尚、第１の実施形
態では、紙面上に形成された文書がスキャナ等で本画像
処理装置に入力されたものとする。この入力画像が、図
１における多値画像１００に相当する。

【００１１】図１において、縮小・二値化部１２０は、
多値画像１００の縮小処理及び二値化処理を行う部分で
ある。文字領域検出部１０１は、多値画像１００が二値
化された二値画像を用いて多値画像中から文字領域を検
出して、それらの文字領域座標１０９を取得する部分で
ある。文字領域画像作成部１０２は、取得された文字領
域座標１０９と入力された多値画像１００より、複数の
文字領域部分の画像である文字領域画像１０７を作成す
る部分である。文字色抽出部１０３は、文字領域画像１
０７における文字部分と多値画像１００とを参照して、
文字領域代表色１１０を算出する部分である。

【００１２】文字部塗りつぶし部１０４は、作成された
文字領域画像１０７の文字部分に対応する多値画像１０
０上の画素を、その画素の周辺の色で塗りつぶすことに
よって文字部分を取り除いた下地多値画像１０８を作成
する部分である。文字領域画像圧縮部１０５は、文字領
域画像１０７を圧縮処理することによって、文字領域の
圧縮コード１１１を作成する部分である。また、下地画
像圧縮部１０６は、作成された下地多値画像１０８を圧
縮して、下地画像の圧縮コード１１２を作成する部分で
ある。

【００１３】尚、中間言語翻訳部１２１は、文書作成ソ
フトウェアを用いて作成された文書データをプリント用
の中間言語を翻訳した後、ページ画像（多値画像１０
０）と像域フラグ画像１２２を作成する部分であるが、
その詳細については第２の実施形態において説明する。

【００１４】次に、図１に示される構成の画像処理装置
を用いて、スキャナで入力された多値画像１００を圧縮
する一連の処理手順について説明する。図３は、本発明
の第１の実施形態による画像処理装置の動作手順を説明
するためのフローチャートである。

【００１５】まず、入力された多値画像１００は、縮小
・二値化部１２０において、画素を任意の間隔で間引く
ことによって画像が縮小され、さらに縮小された画像に
対して二値化処理が行われる（ステップＳ３０１）。こ
の二値化処理の内容について一例を説明する。まず、入
力されたＲＧＢ成分の多値画像１００に対して、次式に
示すような輝度変換を行って、輝度画像Ｊを作成する。

【００１６】Ｙ＝０．２９９Ｒ＋０．５８７Ｇ＋０．１１４Ｂすなわち、輝度画像ＪはＹ成分のみからなる。

【００１７】この際、入力された多値画像１００の解像
度に応じて解像度変換を併せて行ってもよい。例えば、
多値画像１００が３００ｄｐｉの場合、縦方向及び横方
向とも４画素ごとに上式の演算を行いて新しい画像Ｊを
作成する場合を考える。このとき、新しい画像Ｊは、Ｙ
成分が８ビットの７５ｄｐｉの画像となる。次に、輝度
画像Ｊのヒストグラムを取り、二値化処理におけるしき
い値Ｔを算出する。輝度画像Ｊを算出されたしきい値Ｔ
を用いて二値化し、二値画像Ｋを作成する。尚、ヒスト
グラムからしきい値Ｔを算出する方法は、公知の方法を
用いるものとする。

【００１８】次に、文字領域検出部１０１において、二
値画像Ｋに対して領域分割処理を行い、その結果から文
字領域のみを抽出するとともに、その文字領域の座標
（文字領域座標１０９）を取得する（ステップＳ３０
２）。尚、本実施形態による領域分割処理は、米国特許
第5,680,478号で開示されている「文字認識の方法及び
装置（Method and Apparatus for character recogniti
on）」などの公知の方法を用いるものとする。この方法
について簡単に説明すると、二値画像中の黒画素を輪郭
線追跡して得られた塊を抽出し、その形状、大きさ、文
字、絵や図、線、表を分類するとともに、文字と判定さ
れる塊の集合から、文字列をなす文字領域を抽出する処
理を行うものである。

【００１９】上述したステップＳ３０１及びＳ３０２で
の具体的な処理例について示す。図２は、本実施形態に
よる画像処理装置に入力される文書の一例を示す図であ
る。尚、図２に示される文書はカラー原稿であり、文字
部分と画像部分の両方が含まれているものとする。図５
は、図２に示されるカラー原稿をスキャナから入力して
得られた多値画像１００を間引いて輝度変換された後の
画像に対するヒストグラムを示す図である。本実施形態
では、図５に示されるヒストグラムから、平均、分散等
のデータを利用して、二値化処理のためのしきい値Ｔ＝
１９９が算出されたものとする。

【００２０】また、図６は、図５に示すヒストグラムか
ら算出されたしきい値Ｔを用いて多値画像を二値化した
二値化画像の一例を示す図である。さらに、図７は、図
６に示される二値化画像を領域分割した結果生成される
文字領域を説明するための図である。図７に示すよう
に、本実施形態では、図６に示される二値化画像から１
５個の矩形領域で表されてる文字領域が検出された。そ
して、検出されたそれぞれの文字領域に関する座標デー
タを、文字領域座標１０９とする。

【００２１】次に、文字領域画像作成部１０２におい
て、文字領域座標１０９に基づいて、それぞれ文字領域
ごとに領域内の文字部分を黒画素（０）、背景を白画素
（１）の二値画像である文字領域画像１０７が作成され
る（ステップＳ３０３）。この二値画像である文字領域
画像１０７は、縮小・二値化部１２０で得られたしきい
値Ｔで縮小処理された多値画像を全面二値化し、それか
ら切りとって作成したものであってもよい。また、文字
領域内で多値画像からヒストグラムを取りなおして、領
域毎に最適な二値化しきい値を再度算出して得られた二
値画像を用いてもよい。

【００２２】さらに、文字色抽出部１０３では、各文字
領域内の代表色（文字領域代表色１１０）が抽出される
（ステップＳ３０４）。ここで、代表色は１色に限定し
てもよいし、領域内に複数色の文字が混在する場合には
任意の最大代表色数を選ぶようにしてもよい。以下に、
ある文字領域に対する文字色抽出処理の詳細について説
明する。

【００２３】図４は、文字色抽出部１０３における文字
色抽出処理の詳細を説明するためのフローチャートであ
る。文字色抽出部１０３では、まず、文字領域の二値画
像である文字領域画像１０７から、文字行および個別文
字に対応する矩形領域が抽出される（ステップ４０
１）。この矩形領域の抽出を、「文字切り処理」と呼
ぶ。

【００２４】本実施形態では、この文字切り処理につい
ては公知の方法を利用するものとし、ここではその一例
について示す。図９は、本実施形態で使用される文字切
り処理の一手法を説明するための図である。図９（ａ）
に示すような二値画像を用いて説明する。まず、水平方
向の射影と垂直方向の射影をとり、その分散の高い方向
を文字列方向する。これによって、図９（ｂ）の矩形で
囲まれる部分がそれぞれ文字列とされる。次いで、射影
の切れ目で行を分割し、さらに個々の行内で射影により
文字を分割する方法又はラベリングによって画素塊それ
ぞれを文字とする。これによって、図９（ｃ）に示すよ
うに、それぞれの文字列から個々の文字が矩形を用いて
切り出される。本実施形態における以降の処理は、文字
切りされた各文字矩形内の領域に対して行われる。

【００２５】次に、上述したようにして得られた各文字
矩形内の二値画像を細線化した二値画像が生成される
（ステップＳ４０２）。これは、スキャナ特性やプリン
ト時のアンチエイリアシングにより、文字周辺の乱され
た色情報を避けるためである。図１１は、矩形領域で切
り出された文字及びその文字を細線化した細線化画像の
一例を示す図である。

【００２６】さらに、細線化された二値画像の各画素に
対応する色情報を、元のカラー画像である多値画像を参
照することによって求め、ＲＧＢそれぞれの成分ごとに
ヒストグラムが作成される（ステップＳ４０３）。ここ
では、ＲＧＢ成分ではなく、例えばＹＵＶなどの他の色
空間を用いてもよい。さらに、ＲＧＢ各ヒストグラムか
ら分散を求め、あらかじめ定められたしきい値と比較す
る（ステップＳ４０４）。その結果、いずれの成分もそ
の分散値がしきい値以内の場合（ＹＥＳ）、ステップＳ
４０５での処理が行われる。一方、しきい値を超える分
散値があった場合（ＮＯ）、ステップＳ４０６での処理
が行われる。

【００２７】ステップＳ４０５では、ＲＧＢ各ヒストグ
ラムから注目文字矩形の代表色が決定される。これは、
各ヒストグラムのピーク値からなる色を用いてもよい。
また、平均値を用いてもよい。一方、ステップＳ４０６
では、非単色の注目矩形を非文字と判定して、当該文字
矩形内の二値画像中の黒画素をすべて消去する。この処
理は、該当部分をすべて白画素にすることで、該当部分
を非文字の領域と同様に扱うための処理である。

【００２８】図１０は、図４におけるステップＳ４０３
〜Ｓ４０６の処理の一例を説明するための図である。図
１０では、、文字「イ」は黒文字、文字「ン」は赤文
字、花模様Ｆは赤色と青色とからなるものとする、この
とき、図１０に示すように、両文字については、ヒスト
グラムからそれぞれ代表色のＲＧＢ値を得る。また、花
模様Ｆについては、ヒストグラムの分散が大きいので非
文字と判定されるものとする。

【００２９】そして、ステップＳ４０７において、文字
領域内に未処理の文字矩形が残っているか否かが判定さ
れる。その結果、未処理矩形が残っている場合（ＹＥ
Ｓ）、ステップＳ４０３に戻って上述した処理が未処理
の矩形に対して繰り返えされる。一方、未処理矩形がな
ければステップＳ４０８に進む。

【００３０】ステップＳ４０８では、各文字矩形に対応
する色の集合に対して減色処理が施されてｎ色以下にさ
れる。これは、紙面上に形成された画像を入力した場合
に生ずる色のばらつきをまとめるための処理である。具
体的な減色方法としては、ヒストグラムをとってしきい
値以上のピークを１個以上抽出し、それらの色を近接ピ
ークと統合する等の方法がある。また、その他の方法と
して、他のクラスタリング手法を用いてもよい。また、
ｎの値は任意の定数とするが、圧縮率に影響するので多
くても４程度も値が望ましい。

【００３１】図３に示すフローチャートのステップＳ３
０４の処理においては、上述したような手順を用いて文
字領域内の代表色を抽出することができる。次に、文字
部塗りつぶし部１０４において、二値の文字領域画像内
の黒画素に対応する原画像上の各画素を、その周辺の画
素の色で塗りつぶすことによって下地多値画像１０８が
作成される（ステップＳ３０５）。図８は、本実施形態
による文字部塗りつぶし処理の一例を説明するための図
である。

【００３２】図８（ａ）は、原画像の一例を示してお
り、グラデーション画像を背景として、「イン」という
青色の文字が中央付近に描かれている画像である。この
原画像から（ｂ）に示されるような二値のの文字領域画
像が得られたとする。ここで、本実施形態においては、
例えば（ａ）に示される原画像を３２画素×３２画素ご
との小領域（以下、「パーツ」と称す。）に分割し、パ
ーツごとに以下に示す処理が行われるものとする。図８
（ｃ）にパーツ分けの様子を示す。この図では、説明を
簡単にするため、（ａ）の原画像は４×３のパーツに分
割することができるものとする。

【００３３】図８（ｃ）の各パーツ内左上の数字はパー
ツの番号を示す。この場合、パーツ００〜０３、１０、
１３、２０〜２３内には（ｂ）に示される文字領域を含
まないので何も処理は行われない。一方、パーツ１１に
対しては、対応する二値画像中の画素より、各パーツ内
の白部分に対応するカラー画像のＲＧＢ値（これは、Ｙ
ＵＶ等でも良い）の平均値ａｖｅ＿ｃｏｌｏｒ１１を算
出する。そして、原画像上で、二値画像の黒部分にあた
る画素を算出したａｖｅ＿ｃｏｌｏｒ１１で塗りつぶす
ことによって文字を取り除いた下地のみの下地多値画像
を生成する。パーツ１２に対しても同様である。このよ
うにすることによって、文字の存在する部分の周りの画
素の平均値をもって、文字の存在する画素を塗りつぶす
ことができ、見掛け上、文字のみが取り除かれた自然な
下地多値画像１０８を生成することができる。

【００３４】また、ステップＳ３０６では、文字領域画
像圧縮部１０５において、文字領域画像１０７にあたる
二値画像を圧縮して圧縮コード１１１を作成する。この
際、単色の文字領域はＭＭＲ圧縮を施す。尚、ステップ
Ｓ３０４において複数の代表色が抽出された文字領域
は、領域内の色情報を保存できる最低必要ビット数に変
換し、ＺＩＰ圧縮をするか、あるいは同一領域を色別に
異なる二値画像に分解する形で、それぞれをＭＭＲ圧縮
を施すようにしてもよい。

【００３５】ステップＳ３０７では、下地画像圧縮部１
０６において、下地多値画像１０８に対しＪＰＥＧ圧縮
を行って圧縮コード１１２を作成する。尚、ＪＰＥＧ圧
縮処理は一般的なものを用いるものとする。簡単に説明
すると、画像をＹＵＶの各成分に分割し、それぞれを例
えば８画素×８画素の小領域ごとにＤＣＴ変換し、得ら
れた変換係数を量子化し、さらに符号化することによっ
て圧縮コードを得る。尚、文字の取り去られた下地は一
般に高い解像度を必要としないため、ＪＰＥＧ圧縮を行
う前に解像度変換を行ってもよい。

【００３６】最後に、ステップＳ３０８では、文字領域
座標１０９、文字領域代表色１１０、圧縮コード１１
１、圧縮コード１１２の４つのデータをまとめて最終的
な画像データとして出力する。尚、この画像データを生
成するために、画像処理装置内に画像データ生成部を設
けてもよい。また、これらのデータは、ＰＤＦやＸＭＬ
のように一般的に共有されるフォーマットで出力しても
よい。

【００３７】＜第２の実施形態＞次に、ワードプロセッ
サなどの文書作成ソフトウェアによって作成された文書
データを展開して得られる画像を圧縮する画像処理装置
について説明する。

【００３８】図１４は、一般的な文書作成ソフトウェア
を用いて作成された独自の文書データを汎用的プリンタ
で出力する際の処理手順を説明するためのフローチャー
トである。まず、文書作成ソフトウェアを用いて作成さ
れた文書データが、プリンタ用の中間言語に翻訳されて
出力される（ステップＳ１４０１）。この中間言語は、
点、線、文字などのプリミティブ描画やビットマップの
コピー命令からなるものであり、一般的に普及している
形式である。

【００３９】図１における中間言語翻訳部１２１では、
文書作成ソフトウェアを用いて作成された文書データを
プリント用の中間言語を翻訳した後、ページ画像（多値
画像１００）と像域フラグ画像１２２が作成される。す
なわち、中間言語に翻訳された文書データがすべて描画
されて、ページ画像に変換される。この際、ページ画像
と共に、ページ画像上の各画素が、文字として描画され
た画素か否かを示すフラグで構成される像域フラグ画像
１２２が作成される（ステップＳ１４０２）。尚、像域
フラグ画像において重ね書きがある場合は、後に描画さ
れたものの属性に従うようなフラグとなる。例えば、
「文字」の上に「絵」が重ね書きされた場合、像域フラ
グはオフになり、逆に「絵」の上に「文字」が重ね書き
された場合はオンになる。

【００４０】図１２は、第２の実施形態において用いら
れる像域フラグ画像の一例を説明するための図である。
図１２（ａ）に示すように、「星型」の絵（Picture）
の上に文字「イ」（Character）が重ね書きされている
場合について説明する。この様子を部分的に拡大すると
図１２（ｂ）に示すようになる。この場合、重ね書きさ
れている部分の像域フラグはオンになるので、図１２
（ｂ）のページ画像に対応する像域フラグ画像は図１２
（ｃ）に示すようになる。そして、プリンタによって画
像が印刷される（ステップＳ１４０３）が、この際に、
像域フラグ画像が参照され、文字部分に対するエッジ強
調などの処理が行われて画質の向上が計られる。

【００４１】図１３は、文書作成ソフトウェアがプリン
タに出力するために作成する中間言語データを入力とし
て画像の圧縮処理を行う手順を説明するためのフローチ
ャートである。まず、中間言語翻訳部１２１において、
文書データについての中間言語データからページ画像
（多値画像１００）と像域フラグ画像１２２とが作成さ
れる。そして、像域フラグ画像１２２を用いて、文字領
域抽出用の二値画像である像域二値画像Ｋ’が生成され
る（ステップＳ１３０１）。ここで、像域二値画像Ｋ’
は、像域フラグがオンの画素を黒画素（０）、像域フラ
グがオフの画素を白画素（１）とする二値画像である。

【００４２】尚、中間言語データから像域フラグ画像を
作成する処理は、前述した図１４におけるステップＳ１
４０２と同様の処理が行われる。この処理は、図１に示
される本実施形態に係る画像処理装置内に実装してもよ
いが、既存のプリンタへの出力系から両方の画像が得ら
れる場合は、それらの画像を利用する形で実現してもよ
い。また、この場合、画像の解像度に応じて解像度変換
を行ってもよい。例えば、原画像が３００ｄｐｉで電子
化された場合、像域フラグ画像における４画素×４画素
の「ｏｒ」値を１画素に対応させるように作成された画
像Ｋ”は、７５ｄｐｉの画像となる。

【００４３】次に、文字領域検出部１０１において、像
域二値画像Ｋ’あるいは画像Ｋ”に対して領域分割処理
が行われ、その結果から文字領域のみが抽出されて文字
領域座標１０９が作成される（ステップＳ１３０２）。
ここで、像域二値画像Ｋ’は、原画像上の文字情報のみ
を含む二値画像に相当するので、第１の実施形態で説明
したスキャン時と共通の領域分割処理アルゴリズムを用
いて、文字領域を高精度で抽出することができる。

【００４４】さらに、文字領域画像作成部１０２におい
て、文字領域座標１０９に基づき、文字領域画像が作成
される（ステップＳ１３０３）。これは、像域二値画像
Ｋ’の部分画像に相当する。また、文字色抽出部１０３
において、ページ画像と部分文字領域画像を参照して、
各文字領域内の代表色が抽出される（ステップＳ１３０
４）。

【００４５】次に、文字部塗りつぶし部１０４におい
て、文字領域画像内の黒画素に対応するページ画像上の
各画素をその周辺の色で塗りつぶして、下地多値画像１
０８が作成される（ステップＳ１３０５）。また、文字
領域画像圧縮部１０５において、文字領域画像１０７に
相当する部分二値画像の集合を圧縮して圧縮コード１１
１が作成される（ステップＳ１３０６）。さらに、下地
画像圧縮部１０６において、下地多値画像１０８に対し
てＪＰＥＧ圧縮が施されて圧縮コード１１２が作成され
る（ステップＳ１３０７）。

【００４６】最後に、上記処理によって得られた、文字
領域座標１０９、文字領域色情報１１０、圧縮コード１
１１、圧縮コード１１２の４つのデータをまとめて画像
データとして出力する（ステップＳ１３０８）。また、
これらのデータは、ＰＤＦやＸＭＬのように一般的に共
有されるフォーマットで出力してもよい。

【００４７】尚、上記ステップＳ１３０２〜Ｓ１３０８
の各処理は、図３におけるステップＳ３０２〜Ｓ３０８
のそれぞれの処理に対応する。すなわち、本発明に係る
画像処理装置は同一構成であって、スキャンされて得ら
れた画像と、文書作成ソフトウェアの文書データの両方
を対象としたデータ圧縮を提供することが可能である。

【００４８】また、文書作成ソフトウェアが印刷の際に
作成するページ画像と像域フラグ情報を用いるので、個
々の文書作成ソフトウェア独自のデータ構造に依存せず
に、高画質を保ったデータ圧縮が可能になる。

【００４９】以上、本発明によれば、紙をスキャンした
画像と、コンピュータ上の文書作成ソフトで作成された
文書データの両方に対し、高画質、高圧縮でかつ一般に
広く可読なデータへと変換することが可能になる。

【００５０】すなわち、本発明は、入力された文書デー
タを圧縮する画像処理装置であって、光学的な原稿読み
取りにて発生した文書データ、またはコンピュータ上で
作成した文書データを入力する入力手段と、光学的な読
み取りで発生した文書データの多値画像１００から閾値
処理により二値画像を生成する第１の二値化手段（縮小
・二値化部１２０）と、コンピュータ上で作成した文書
データを展開した多値画像１００から二値画像を生成す
る第２の二値化手段（縮小・二値化部１２０）と、何れ
かの二値画像に基づいて文字領域を抽出する文字領域抽
出手段（文字領域検出部１０１）と、抽出された文字領
域内の文字の色を抽出する文字色抽出手段（文字領域代
表色１１０）と、多値画像１００内の文字を文字周辺色
で置換することによって下地画像（下地多値画像１０
８）を生成する下地画像生成手段（文字部塗りつぶし部
１０４）と、文字領域から成る文字領域画像を圧縮する
第１の圧縮手段（文字領域画像圧縮部１０５）と、下地
画像を圧縮する第２の圧縮手段（下地画像圧縮部１０
６）とを備えることを特徴とする。

【００５１】また、本発明に係る画像処理装置は、多値
画像１００を所定の縮小率で縮小する縮小手段（縮小・
二値化部１２０）をさらに備えることを特徴とする。さ
らに、本発明に係る画像処理装置は、文字領域の位置情
報（文字領域座標）、圧縮された文字領域画像（圧縮コ
ード１１１）、圧縮された下地画像（圧縮コード１１
２）及び抽出された文字の色（文字領域代表色１１０）
を圧縮画像データとして出力する出力手段をさらに備え
ることを特徴とする。

【００５２】さらにまた、本発明に係る画像処理装置
は、多値画像１００が、文書作成ソフトウェアで作成さ
れた文書データであってプリンタ用の中間言語に翻訳さ
れた文書データを入力して生成され、文書データから像
域フラグ画像１２２を生成する生成手段（中間言語翻訳
部１２１）をさらに備えることを特徴とする。

【００５３】また、本発明に係る画像処理装置は、縮小
手段（縮小・二値化部１２０）が、文書原稿を光学的読
取手段を用いて読み取られて入力された多値画像１００
を所定の縮小率で縮小し、文書作成ソフトウェアで作成
された文書データから生成された多値画像を縮小しない
ことを特徴とする。

【００５４】尚、本発明は、複数の機器（例えば、ホス
トコンピュータ、インタフェース機器、リーダ、プリン
タ等）から構成されるシステムに適用しても、一つの機
器からなる装置（例えば、複写機、ファクシミリ装置
等）に適用してもよい。

【００５５】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記録媒体（または記憶媒体）を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ（またはＣＰＵやＭＰＵ）が記録媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記録媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム（ＯＳ）などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。

【００５６】さらに、記録媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるＣＰＵなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。

【００５７】本発明を上記記録媒体に適用する場合、そ
の記録媒体には、先に説明したフローチャートに対応す
るプログラムコードが格納されることになる。

【００５８】

【発明の効果】本発明によれば、文書をスキャナで入力
した画像データや、コンピュータ上の文書作成ソフトウ
ェアで作成された文書データを選択的に処理でき、これ
ら文書データを夫々の入力方法に適切な画質／処理方法
で効率良く圧縮することができる。

【図面の簡単な説明】

【図１】本発明の一実施形態による入力された画像を圧
縮するための画像処理装置の構成を示すブロック図であ
る。

【図２】本実施形態による画像処理装置に入力される文
書の一例を示す図である。

【図３】本発明の第１の実施形態による画像処理装置の
動作手順を説明するためのフローチャートである。

【図４】文字色抽出部１０３における文字色抽出処理の
詳細を説明するためのフローチャートである。

【図５】図２に示されるカラー原稿をスキャナから入力
して得られた多値画像１００を間引いて輝度変換された
後の画像に対するヒストグラムを示す図である。

【図６】図５に示すヒストグラムから算出されたしきい
値Ｔを用いて多値画像を二値化した二値化画像の一例を
示す図である。

【図７】図６に示される二値化画像を領域分割した結果
生成される文字領域を説明するための図である。

【図８】本実施形態による文字部塗りつぶし処理の一例
を説明するための図である。

【図９】本実施形態で使用される文字切り処理の一手法
を説明するための図である。

【図１０】図４におけるステップＳ４０３〜Ｓ４０６の
処理の一例を説明するための図である。

【図１１】矩形領域で切り出された文字及びその文字を
細線化した細線化画像の一例を示す図である。

【図１２】第２の実施形態において用いられる像域フラ
グ画像の一例を説明するための図である。

【図１３】文書作成ソフトウェアがプリンタに出力する
ために作成する中間言語データを入力として画像の圧縮
処理を行う手順を説明するためのフローチャートであ
る。

【図１４】一般的な文書作成ソフトウェアを用いて作成
された独自の文書データを汎用的プリンタで出力する際
の処理手順を説明するためのフローチャートである。

【符号の説明】

１００多値画像１０１文字領域検出部１０２文字領域画像作成部１０２１０３文字色抽出部１０４文字部塗りつぶし部１０５文字領域画像圧縮部１０６下地画像圧縮部１０７文字領域画像１０８下地多値画像１０９文字領域座標１１０文字領域代表色１１１、１１２圧縮コード１２０縮小・二値化部１２１中間言語翻訳部１２２像域フラグ画像

フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｎ 1/46 Ｈ０４Ｎ 1/40 Ｄ 1/60 1/46 ＺＦターム(参考） 5B057 CA01 CA08 CA12 CA16 CB01 CB08 CB12 CB16 CC01 CE09 CE12 CE17 CG01 CH08 5C077 LL17 MP08 PP27 PP28 PP31 PP32 PP37 PP38 PQ08 PQ12 PQ19 PQ25 RR02 RR15 RR21 5C078 AA01 AA09 CA02 DA01 DB06 5C079 HB01 LA06 LA07 LA21 LA27 LA31 LB12 NA10 5L096 AA02 BA07 BA17 EA43 FA18 FA37 FA38 FA44 GA34 MA03

Claims

【特許請求の範囲】

【請求項１】入力された文書データを圧縮する画像処
理装置であって、光学的な原稿読み取りにて発生した文書データ、または
コンピュータ上で作成した文書データを入力する入力手
段と、前記光学的な読み取りで発生した文書データの多値画像
から閾値処理により二値画像を生成する第１の二値化手
段と、前記コンピュータ上で作成した文書データを展開した多
値画像から二値画像を生成する第２の二値化手段と、前記何れかの二値画像に基づいて文字領域を抽出する文
字領域抽出手段と、抽出された文字領域内の文字の色を抽出する文字色抽出
手段と、前記多値画像内の文字を文字周辺色で置換することによ
って下地画像を生成する下地画像生成手段と、前記文字領域から成る文字領域画像を圧縮する第１の圧
縮手段と、前記下地画像を圧縮する第２の圧縮手段とを備えること
を特徴とする画像処理装置。
【請求項２】前記コンピュータ上で作成した文書デー
タを展開した多値画像が、文書作成ソフトウェアで作成
された文書データであってプリンタ用の中間言語に翻訳
された文書データを入力して生成され、前記文書データから像域フラグ画像を生成する生成手段
をさらに備えることを特徴とする請求項１記載の画像処
理装置。
【請求項３】前記多値画像を所定の縮小率で縮小する
縮小手段をさらに備えることを特徴とする請求項１又は
２に記載の画像処理装置。
【請求項４】前記縮小手段が、文書原稿を光学的読取
手段を用いて読み取られて入力された多値画像を所定の
縮小率で縮小し、文書作成ソフトウェアで作成された文
書データから生成された多値画像を縮小しないことを特
徴とする請求項３記載の画像処理装置。
【請求項５】前記文字領域の位置情報、圧縮された文
字領域画像、圧縮された下地画像及び抽出された文字の
色を圧縮画像データとして出力する出力手段をさらに備
えることを特徴とする請求項１から４までのいずれか１
項に記載の画像処理装置。
【請求項６】光学的な原稿読み取りにて発生した文書
データ、またはコンピュータ上で作成した文書データを
圧縮する画像処理方法であって、前記光学的な読み取りで発生した文書データの多値画像
から閾値処理により二値画像を生成する第１の二値化工
程と、前記コンピュータ上で作成した文書データを展開した多
値画像から二値画像を生成する第２の二値化工程と、前記何れかの二値画像に基づいて文字領域を抽出する文
字領域抽出工程と、抽出された文字領域内の文字の色を抽出する文字色抽出
工程と、前記多値画像内の文字を文字周辺色で置換することによ
って下地画像を生成する下地画像生成工程と、前記文字領域から成る文字領域画像を圧縮する第１の圧
縮工程と、前記下地画像を圧縮する第２の圧縮工程とを有すること
を特徴とする画像処理方法。
【請求項７】前記多値画像が、文書作成ソフトウェア
で作成された文書データであってプリンタ用の中間言語
に翻訳された文書データを入力して生成され、前記文書データから像域フラグ画像を生成する生成工程
をさらに有することを特徴とする請求項６記載の画像処
理方法。
【請求項８】前記コンピュータ上で作成した文書デー
タを展開した多値画像を所定の縮小率で縮小する縮小工
程をさらに有することを特徴とする請求項６又は７に記
載の画像処理方法。
【請求項９】前記縮小工程が、文書原稿を光学的読取
手段を用いて読み取られて入力された多値画像を所定の
縮小率で縮小し、文書作成ソフトウェアで作成された文
書データから生成された多値画像を縮小しないことを特
徴とする請求項８記載の画像処理装置。
【請求項１０】前記文字領域の位置情報、圧縮された
文字領域画像、圧縮された下地画像及び抽出された文字
の色を圧縮画像データとして出力する出力工程をさらに
有することを特徴とする請求項６から９までのいずれか
１項に記載の画像処理方法。
【請求項１１】光学的な原稿読み取りにて発生した文
書データ、またはコンピュータ上で作成した文書データ
を圧縮する画像処理装置を制御するためのコンピュータ
プログラムであって、前記光学的な読み取りで発生した文書データの多値画像
から閾値処理により二値画像を生成する第１の二値化手
段と、前記コンピュータ上で作成した文書データを展開した多
値画像から二値画像を生成する第２の二値化手段と、前記何れかの二値画像に基づいて文字領域を抽出する文
字領域抽出手段と、抽出された文字領域内の文字の色を抽出する文字色抽出
手段と、前記多値画像内の文字を文字周辺色で置換することによ
って下地画像を生成する下地画像生成手段と、前記文字領域から成る文字領域画像を圧縮する第１の圧
縮手段と、前記下地画像を圧縮する第２の圧縮手段として機能する
ことを特徴とするコンピュータプログラム。
【請求項１２】請求項１１記載のコンピュータプログ
ラムを格納することを特徴とする記録媒体。