JP2006054817A - ドキュメント処理装置 - Google Patents
ドキュメント処理装置 Download PDFInfo
- Publication number
- JP2006054817A JP2006054817A JP2004236724A JP2004236724A JP2006054817A JP 2006054817 A JP2006054817 A JP 2006054817A JP 2004236724 A JP2004236724 A JP 2004236724A JP 2004236724 A JP2004236724 A JP 2004236724A JP 2006054817 A JP2006054817 A JP 2006054817A
- Authority
- JP
- Japan
- Prior art keywords
- image
- document
- layer
- processing
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 ドキュメントに対して、画質劣化を抑えて、効率よく圧縮処理を行うことができるドキュメント処理装置を提供する。
【解決手段】 イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うドキュメント処理装置であって、処理対象ドキュメントのうち、イメージ部分の少なくとも一部から、文字画像の部分を検出し、この検出された文字画像部分と、テキスト部分とには第一の圧縮処理を施し、文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施すドキュメント処理装置である。
【選択図】 図3
【解決手段】 イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うドキュメント処理装置であって、処理対象ドキュメントのうち、イメージ部分の少なくとも一部から、文字画像の部分を検出し、この検出された文字画像部分と、テキスト部分とには第一の圧縮処理を施し、文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施すドキュメント処理装置である。
【選択図】 図3
Description
本発明は、イメージ部分とテキスト部分とを含むドキュメントを圧縮処理するドキュメント処理装置に関する。
近年、ネットワークの利用が広まるにつれ、コンピュータ上で文書作成用ソフトウェア等を用いて作成されたドキュメントは、電子メールにより配信されたり、サーバコンピュータなどに保存された後に必要に応じて配信されたりすることが多くなってきている。
一般に、このドキュメント配信に際しては、そのデータサイズを低減させ、可搬性を高めるために、配信に先立って当該ドキュメントの圧縮処理をする。具体的に、自然画写真などのイメージのみが含まれているドキュメントは、高周波成分を間引きするJPEG(Joint Picture Experts Group)などの不可逆圧縮方式による圧縮処理をする(特許文献1参照)と効果的である。また、文字等のテキスト部分は高周波成分を多く含むので、高周波成分を間引するJPEG式圧縮を行うと、モスキートノイズの発生等の画質劣化を生じてしまうことから、テキストのみが含まれているドキュメントに対しては、MMR(Modified Modified Read)などの可逆圧縮方式による圧縮処理を行うことが好ましい。
さらに、例えば、いわゆるTI(Text-Image)分離技術を用いて、イメージ部分とテキスト部分とが分離可能な状態で含まれているドキュメントについては、イメージ部分に対してはJPEG方式により、またテキスト部分に対してはMMR方式により、それぞれ圧縮処理を行えばよい。
特開2003−244447号公報
しかしながら、例えば修飾文字などがイメージとして作成されている場合もある。また、文字がラスタライズされ、イメージとして作成されている場合など、イメージ部分がもともと文字画像を含む場合がある。
このような場合、ドキュメントに含まれるイメージ部分を画一的にJPEG方式により圧縮してしまうと、当該イメージ部分に含まれる文字画像部分もJPEG方式による圧縮が行われることとなって、当該部分については結局、モスキートノイズ等の画質劣化が生じてしまう。
本発明は、上記課題に鑑みて為されたものであり、画質劣化を抑制しつつ、効率のよい圧縮処理を行うことができるドキュメント処理装置を提供することをその目的の一つとする。
上記従来の課題を解決するための本発明の一実施態様に係るドキュメント処理装置は、イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うドキュメント処理装置であって、処理対象ドキュメントのうち、イメージ部分の少なくとも一部から、文字画像の部分を検出する文字検出手段と、前記検出された文字画像部分と、前記テキスト部分とに第一の圧縮処理を施し、前記文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施す手段と、を含むことを特徴とする。
また、前記ドキュメント処理装置は、前記処理対象ドキュメントに含まれるイメージ部分の形状を表す形状情報を生成する形状情報生成手段と、前記生成された形状情報に基づいて、前記イメージ部分を文字検出対象とするか否かを決定する対象決定手段と、をさらに含み、前記文字検出手段は、前記対象決定手段により文字検出対象と決定されたイメージ部分から文字画像部分を検出する、こととしてもよい。
また、前記ドキュメント処理装置においては、前記対象決定手段は、前記形状情報生成手段により生成された形状情報が、予め定めた形状条件を満足すると判断した場合に、当該形状情報に係るイメージ部分を文字検出対象と決定する、こととしてもよい。
また、本発明の一実施態様に係るドキュメント処理プログラムは、イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うためのドキュメント処理プログラムであって、コンピュータに、処理対象ドキュメントのうち、イメージ部分の少なくとも一部から、文字画像の部分を検出する手順と、前記検出された文字画像部分と、前記テキスト部分とに第一の圧縮処理を施し、前記文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施す手順と、を実行させることを特徴とする。
また、本発明の一実施態様に係るドキュメント処理方法は、イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うためのドキュメント処理方法であって、コンピュータに、処理対象ドキュメントのうち、イメージ部分の少なくとも一部から、文字画像の部分を検出する工程と、前記検出された文字画像部分と、前記テキスト部分とに第一の圧縮処理を施し、前記文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施す工程と、を実行させることを特徴とする。
以下、本発明の一実施の形態に係るドキュメント処理装置について、図面を参照しながら説明する。なお、以下の説明では、本実施形態のドキュメント処理装置が図1に示すドキュメントDを処理対象として圧縮処理を行う場合を例として説明する。
この処理対象ドキュメントDは、コンピュータ上で文書作成用ソフトウェアを用いて作成されたものであり、図1に示すように、その1ページ内に、ビットマップデータとして形成される3つのイメージ部分i1,i2,i3と、ベクタデータとして形成される2つのグラフィック部分g1,g2と、アウトラインフォントとして形成される2つのテキスト部分t1,t2と、を含んでいる。
ここでイメージ部分i1には「TITLE」の文字画像が含まれる。イメージ部分i2は風景写真(自然画像)であり、イメージ部分i3は複数の星型図形を横一列に並べたものである。このイメージ部分i2は、風景写真を光学スキャナで読み取って電子化することにより作成されたものである。また、グラフィック部分g1は赤色の星型図形を表し、グラフィック部分g2は黒色の星型図形を表している。
また、テキスト部分t1は複数の「a」の文字形状を並べたものである。また、テキスト部分t2は1文字のアルファベット文字「A」の形状からなる。このテキスト部分t2は、グラフィック部分g1上に一部重ね合わせられている。
図2は、ドキュメント処理装置1の主な構成を示すブロック図である。図2に示すように、本実施の形態のドキュメント処理装置1は、制御部10と、記憶部20と、指示入力部30と、表示部40と、インターフェース部50とを含んで構成されている。
制御部10は、CPUなどを用いて実現でき、記憶部20に格納されているプログラムに従って動作している。この制御部10が行う処理の具体的な内容については、後に詳しく述べる。
記憶部20は、RAM(Random Access Memory)や、ROM(Read Only Memory)等のメモリ素子、並びにハードディスク等によって実現できる。この記憶部20には、制御部10によって実行されるプログラムが保持されている。また、この記憶部20は、制御部10の処理の過程で利用される種々のデータを保持するワークメモリとしても動作する。
指示入力部30は、マウスやキーボード等によって実現できる。この指示入力部30は、ドキュメント処理装置1の利用者からの指示を受け入れて、当該指示の内容を制御部10に出力する。表示部40は、ディスプレイ等であり、制御部10から入力される指示に従って、制御部10から入力されるデータを表示出力する。
インターフェース部50は、ネットワークカード等によって実現できる。このインターフェース部50は、LAN(Local Area Network)やインターネット等のネットワークに接続されており、当該ネットワークを介して処理対象ドキュメントDを受け入れ、制御部10に出力する。また、このインターフェース部50は、制御部10から入力される指示に従って、制御部10から入力されるデータをネットワークを介して送信出力する。
次に、制御部10が行う処理の内容について説明する。本実施形態では、この制御部10は、処理対象ドキュメントDに含まれるデータを、互いに異なる圧縮処理の対象となるイメージ部分とテキスト部分との少なくとも2つの部分に分離し、各々の部分を含むレイヤを生成する(第1分離処理)。具体的に、この第1分離処理は、広く知られたTI分離技術を利用してもよい。
そして制御部10は、当該イメージ部分についてさらに文字画像があるか否かを調べ、文字画像が含まれれば、当該文字画像をイメージ部分のレイヤから除去してテキスト部分のレイヤに追記する(第2分離処理)。なお、除去した後の部分は穴埋処理を行ってもよい。
すなわち、この制御部10は、第1分離処理におけるテキスト部分の分離に加え、第2分離処理において文字画像部分の分離を行い、当該文字画像部分を第2レイヤに含めてMMR等による圧縮を行うことにより、テキスト部分のみならず、イメージ部分に含まれる文字画像についても画質劣化を抑えながら圧縮処理を行うことができるようになる。
図3は、制御部10によって行われる処理を表す機能ブロック図である。図3に示すように、制御部10は、画像情報生成部11と、レイヤ処理制御部12と、第1レイヤ処理部13と、第2レイヤ処理部14と、文字検出部15と、圧縮処理部16と、データ出力部17とを含む。
以下では、まず第1分離処理について説明し、本発明に特徴的な第2分離処理については後に詳しく説明する。第1分離処理では、画像情報生成部11が処理対象ドキュメントDに基づいて各レイヤへの分離に適した画像情報を生成する。レイヤ処理制御部12と、第1レイヤ処理部13と、第2レイヤ処理部14とは、当該画像情報に基づいてレイヤの生成を行うことになる。
具体的にレイヤへの分離に適した画像情報は、処理対象ドキュメントDに係る付加情報とエッジ情報とを含む。ここで付加情報は、処理対象ドキュメントDのページサイズや解像度を表すとともに、後述するレイヤ生成処理において生成されるレイヤのページサイズや解像度を指定する情報である。
本実施の形態では、圧縮効率の向上のため、イメージ部分については元の解像度を、その半分の解像度の画像に変換してもよい。この場合、付加情報は、第1レイヤを処理対象ドキュメントDと同じページサイズで、且つ処理対象ドキュメントDの解像度の半分の解像度で生成するよう指示するとともに、第2レイヤを処理対象ドキュメントDと同じページサイズで、且つ処理対象ドキュメントDの解像度と同じ解像度で生成するよう指示する情報として生成される。
またエッジ情報は、処理対象ドキュメントDに含まれるイメージ部分、テキスト部分等、各オブジェクトの位置を特定する位置情報と、当該各位置に配置されるデータの属性(イメージ、グラフィック、テキストの別)を表すタグ情報と、を関連付けた情報として生成される。例えば、図4に示すように、処理対象ドキュメントD上のオブジェクトの各位置がページ左上隅を原点OとしたXY座標系によって特定される場合、画像情報生成部11は、ページ上端からページ下端までのY座標値ごとに複数のエッジ情報要素を関連付けてエッジ情報を生成する。ここでエッジ情報要素は、図5(a)に示すように、始点X座標値SXと、終点X座標値EXと、タグ情報Tと、色情報Cとを含む構造(以下、エッジ構造体と呼ぶ)として規定される。
このエッジ構造体のエッジ情報要素により、各Y座標値に対応する1ラインごとに、当該ラインに含まれる画素線分が規定される。つまり、始点X座標値SX及び終点X座標値EXにより画素線分の範囲が規定される。また、当該画素線分に係るタグ情報Tによって当該画素線分をどのレイヤに分類するかが規定され、色情報Cによって当該画素線分の画素値によって表されるべき色が規定される。また、このエッジ構造体は、ランレングスデータの基礎として用いるのに適している(画素線分の長さが特定しやすい)ので、MMR圧縮の基礎データとしても有用である。
例えば図4に示す処理対象ドキュメントD上の1つの座標値Y1については、当該Y1座標値ライン上に形成されるデータ部分の属性と表示色とを、ページ左端(X座標値=0)からページ右端(X座標値=199)まで調べ、データ属性や表示色が変わるたびに異なるエッジ構造体を生成する。図4の例ではイメージ部分i2と、テキスト部分t2と、グラフィック部分g1とによって6つの部分に区切られるので、各部分に対応して、図5(b)に示すように、6つのエッジ構造体(1)から(6)を含むエッジ情報が生成される。なお、イメージ部分、テキスト部分などの別は、領域ごとに予め指定されているものとする。例えばある矩形領域を特定する座標情報と、当該矩形領域内の画像がイメージ、テキスト等のうちどの部分であるかを特定する情報が予め知られているものとする。タグ情報は当該予め知られている情報に基づいて生成される。
なお、イメージ部分は一般に、一つのライン中に複数の色の画素を含む。そこで図5(b)に示すエッジ情報に含まれるエッジ構造体(2)、つまり、始点X座標値11(SX)から終点X座標値140(EX)までのX座標値の範囲のイメージ部分(図1の風景画像部分i2の一部)に対応するエッジ情報要素であるが、ここでの表示色は、記憶部20内のアドレスZにより特定されることを表している。このアドレスZは、当該イメージ部分における該当するラインの画素値(表示色)を表すデータが格納されている位置を表すポインタ情報である。
また、エッジ構造体(4)は、X座標値151から165までの範囲に、テキストデータ(図1のテキスト「A」部分t2の一部)が黒色で形成されることを表している。また、エッジ構造体(5)は、X座標値166から170までの範囲に、グラフィックデータ(図1の星型図形部分g1の一部)が赤色で形成されること表している。
また、その他のエッジ構造体(1),(3),(6)については、タグ情報Tは「背景」となり、その表示色は未定としている。ここで背景とは、当該エッジ構造体(1),(3),(6)に係るX座標値の範囲には、イメージ、グラフィック、テキストのいずれも形成されていないことを表している。すなわち、この背景部分は、用紙上に画像を形成する場合であれば、用紙の地色となる部分に相当する。
画像情報生成部11は、このように生成した画像情報をレイヤ処理制御部12に出力する。レイヤ処理制御部12は、当該画像情報の入力を受けて、記憶部20に予め格納された条件情報を読み出し、当該画像情報と条件情報とに基づいて、第1レイヤ処理部13と第2レイヤ処理部14とにレイヤ生成処理を指示する。
ここで条件情報の具体的内容について説明する。この条件情報は、後述の第1レイヤ処理部13と第2レイヤ処理部14とによるレイヤの生成条件を指定する情報であり、割り当て情報と、圧縮条件情報と、解像度情報とを含んでいる。
割り当て情報は、画像情報に含まれるタグ情報Tの種類ごとに、当該種類の分類先であるレイヤ種別(第1レイヤ又は第2レイヤの別)を関連付けた情報であり、後述するレイヤ生成処理において利用される。本実施の形態では、この割り当て情報は、イメージ部分であることを表すタグ情報に対して、第1レイヤを表すレイヤ種別を関連付けるとともに、テキスト部分又はグラフィック部分であることを表すタグ情報に対して、第2レイヤを表すレイヤ種別を関連付けている。
また圧縮条件情報は、レイヤ種別ごとに、当該種別のレイヤに含まれるデータの圧縮方式や圧縮パラメータ(例えば圧縮方式がJPEGの場合には量子化レベル等)を含む圧縮処理条件を関連付けた情報である。この圧縮処理条件は、後述するレイヤの圧縮処理において利用される。本実施の形態ではこの圧縮条件情報は、第1レイヤを表すレイヤ種別に対しては、圧縮方式としてJPEG等の非可逆圧縮方式を特定する情報を関連付けている。また、第2レイヤを表すレイヤ種別に対しては、MMR等の可逆式圧縮方式を特定する情報を関連付けている。
また解像度情報は、レイヤ種別ごとに、レイヤに含まれる画像の解像度を特定する情報である。この解像度情報は、後述するレイヤ生成処理において利用される。本実施の形態では、この解像度情報は、第1レイヤを表すレイヤ種別に対しては、処理対象ドキュメントDの解像度より小さい解像度が関連付けられている。また、第2レイヤを表すレイヤ種別には、処理対象ドキュメントDの解像度と同じ解像度を関連付けている。
レイヤ処理制御部12は、まず条件情報に含まれる付加情報に基づいて、第1レイヤ処理部13と第2レイヤ処理部14とに対して、それぞれが生成すべき第1レイヤ又は第2レイヤの解像度やデータサイズを指定する。第1レイヤ処理部13と第2レイヤ処理部14とは、それぞれのレイヤの画像データを記憶する領域を記憶部20内に確保して、初期化する。
また、このレイヤ処理制御部12は、条件情報の割り当て情報に基づき、第1レイヤ処理部13に対しては、画像情報に含まれるエッジ情報のうち、イメージ部分であることを表すタグ情報Tに係る情報を含むエッジ情報を選択して出力する。また、第2レイヤ処理部14に対しては、テキスト部分又はグラフィック部分に係る情報を含むエッジ情報を選択して出力する。なお、レイヤ処理制御部12は、各Y座標値ごとに、エッジ情報を出力する。
さらに、このレイヤ処理制御部12は、第1レイヤ処理部13と第2レイヤ処理部14とに対して、処理対象ドキュメントDのページ始端からページ終端に係る(つまり1ページ分の)エッジ情報を出力し終えると、第1レイヤ処理部13と第2レイヤ処理部14とに対して、生成したレイヤをデータ出力部17に出力するよう指示する。
また、このレイヤ処理制御部12は、条件情報に含まれる圧縮条件情報に基づいて、第1レイヤ処理部13に対しては、生成した第1レイヤを圧縮処理部16にJPEG方式で圧縮処理させるよう指示するとともに、第2レイヤ処理部14に対しては、生成した第2レイヤを圧縮処理部16にMMR方式で圧縮させるよう指示する。
第1、第2のレイヤ処理部13,14は、入力されるエッジ情報に基づいて各レイヤの画像データを生成する。具体的に本実施の形態では、入力されるエッジ情報に基づいて座標変換を行う。つまり、エッジ情報によって特定される画素線分の配置位置を、記憶部20に確保された解像度における配置位置に変換する。例えば、解像度を1/2としている場合は、座標の値を1/2とする。
第1レイヤ処理部13は、受け入れたエッジ情報に含まれるエッジ情報要素に基づいて、当該エッジ情報要素によって特定される画素線分のXY座標値の位置(エッジ構造に係るY座標値上であって始点のX座標値から終点のX座標値までの範囲)に対応する画素の色を、色情報Cによって特定される色(図5参照)に設定する。これによりイメージ部分のみを形成した仮第1レイヤを生成する。
すなわち、この第1レイヤ処理部13は、図6(a)に示すように、処理対象ドキュメントDに含まれるデータのうち、3つのイメージデータ部分i1,i2,i3のみを、処理対象ドキュメントDにおける位置に対応する位置(解像度が異なるので座標値自体は異なる)に配置した仮第1レイヤを生成する。そして、この第1レイヤ処理部13は、仮第1レイヤに含まれる3つのイメージデータ部分i1,i2,i3を文字検出部15に出力する。
また第1レイヤ処理部13は、文字検出部15からイメージ部分のうち、文字画像の部分を特定する情報を受け入れて、当該特定された部分のエッジ情報を分割し、文字画像部分の画素線分に係るエッジ情報にテキスト部分であることを示す情報を設定して、当該エッジ情報を第2レイヤ処理部14に出力する。また、仮第1レイヤ上で、当該文字画像部分に対応する画素の値を所定の背景色に設定する。ここで第1レイヤ処理部13は、当該背景色部分の色を、その周囲(例えば隣接する有意画素(背景色でない画素))の色に基づいて決定し、当該決定した色に設定する処理(いわゆる穴埋処理)を行ってもよい。
具体的に、第1レイヤ処理部13が、イメージ部分i1に含まれる「title」の画像部分(この場合イメージ部分i1全体)が文字画像部分であると特定する情報を文字検出部15から受けた場合、当該イメージ部分i1全体を背景色で塗り潰すとともに、イメージ部分i1に係るエッジ情報のタグ情報Tをテキストであることを表す情報に設定して、第2レイヤ処理部14に出力する。このようにイメージ部分の一つが全体的に除去される(背景色に設定される)場合は、穴埋処理は必ずしも必要でない。
この第1レイヤ処理部13が出力する第1レイヤの画像は、従って、図7(a)に示すように、2つのイメージデータ部分i2,i3のみを含むものになる。これにより、第1レイヤ処理部13は、処理対象ドキュメントDのうち、文字画像部分を含まないイメージ部分のみを含む第1レイヤを生成する。
さらに第1レイヤ処理部13は、圧縮処理部16に対して、当該生成した第1レイヤの画像(文字画像部分を含まないイメージ部分のみを含む画像)を出力する。そして圧縮処理部16からJPEG圧縮された第1レイヤの画像の入力を受けて、当該圧縮後の第1レイヤ(圧縮第1レイヤ)をデータ出力部17に出力する。
一方、第2レイヤ処理部14は、レイヤ処理制御部12からエッジ情報の入力を受けて、記憶部20に確保した第2レイヤの画像のうち、各エッジ情報によって特定される座標範囲の画素値を、各エッジ情報によって特定される色に設定する。これにより、第2レイヤ処理部14は、処理対象ドキュメントDのうち、テキスト部分とグラフィック部分とを含む仮第2レイヤを生成する(図6(b))。
また第2レイヤ処理部14は、第1レイヤ処理部13が出力するエッジ情報の入力を受けて、仮第2レイヤの画像のうち、当該エッジ情報によって特定される座標範囲の画素値を、当該エッジ情報によって特定される色に設定し、第2レイヤの画像を生成する。ここで第1レイヤ処理部13が出力するエッジ情報は、文字部分の画像に係るものであるので、第2レイヤ処理部14が生成する第2レイヤの画像は、テキスト部分とグラフィック部分と、イメージ部分に含まれていた文字画像の部分とを含むものとなる。
つまり図1の例でいえば、この第2レイヤ処理部14が出力する第2レイヤの画像は、図7(b)に示すように、処理対象ドキュメントDのうち、2つのテキスト部分t1,t2と、2つのグラフィック部分g1,g2と、文字画像を含むイメージ部分i1とが、処理対象ドキュメントDにおけるのと対応する位置及びサイズ(ここでの例では第2レイヤの画像は元のドキュメントの画像と同じ解像度であるので、同じ座標値になる)で配置した第2レイヤを生成する。
そして、この第2レイヤ処理部14は、圧縮処理部16に対して、ラスタライズした第2レイヤの画像を出力する。圧縮処理部16はこの第2レイヤの画像をMMR方式により圧縮する。そしてこの第2レイヤ処理部14は、圧縮処理部16からMMR圧縮された第2レイヤの画像を受け入れて、当該圧縮後の第2レイヤ(圧縮第2レイヤ)をデータ出力部17に出力する。
ここで、文字検出部15の動作の内容について述べる。この文字検出部15は、第2分離処理を実現するものである。本実施の形態の文字検出部15は、第1レイヤ処理部13から、イメージ部分の画像を受け入れ、受け入れた各イメージ部分に文字画像が含まれているか否かを判断する(文字検出処理)。また、この文字検出部15は、イメージ部分が文字画像を含むと判断した場合には、当該文字画像の部分を特定する情報を、第2レイヤ処理部14に出力する。
具体的に、文字検出部15は、まず第1レイヤ処理部13から受け入れた各イメージ部分がカラーの画像かグレイスケールの画像かを判断し、カラーの画像と判断した場合には、当該イメージ部分をグレイスケールの画像に変換する。
文字検出部15は、次に、グレイスケールのイメージ部分の画素について、輝度値のヒストグラムを生成する。一般に風景写真等の中に文字が含まれるようなイメージ部分を構成する画素について、その輝度値のヒストグラムを生成すると、文字部分に特徴的な輝度値ピークが出現することが知られている。そこで文字検出部15は、当該生成したヒストグラムに基づいて、文字部分と風景写真等の下地部分とを区別し得る輝度値をしきい値として決定し、当該しきい値を用いてグレイスケールのイメージ部分の画像を二値化する。なお、このしきい値はこれとは異なり、例えば、イメージデータ部分の注目画素の周辺画素値から動的に求めていく浮動二値化方式によって動的に決定されてもよい。
文字検出部15は、二値化されたイメージ部分の画像に対して公知のレイアウト技術を適用してノイズを除去し、文字の検出を行う。例えば、この文字検出部15は、二値化されたイメージ部分上でオンとなっている画素(黒画素)が含まれる領域の外接矩形を画定し、当該外接矩形内のオン画素数と矩形を構成する画素の総数とを比較する。
そして、この文字検出部15は、外接矩形範囲内のオン画素数が矩形内の総画素数に対して所定割合以上である場合には、当該外接矩形内に文字が表されていると判断し、所定割合未満である場合には、ノイズであると判断してそのオン画素を除去する。また、この文字検出部15は、イメージデータ部分上のオン画素がページ内で水平方向又は垂直方向に周期性をもって並んでいると判断した場合には、当該周期性をもって形成されているオン画素が文字を表すものであると判断することとしてもよい。
図1に示した本実施の形態の例では、こうした処理を経て文字検出部15が、3つのイメージ部分i1,i2,i3のうち、イメージ部分i1から「TITLE」という文字列を検出し、文字画像の部分を特定する(外接矩形の領域として特定できる)。また、他の2つのイメージ部分i2,i3については、文字が検出できないため、文字画像を特定する情報を出力しない。
圧縮処理部16は、第1レイヤ処理部13や第2レイヤ処理部14から受け入れた各レイヤの画像の圧縮処理を行う。具体的に、この圧縮処理部16は、第1レイヤ処理部13から図7(a)に示す第1レイヤの画像を受け入れ、当該第1レイヤの画像に対して、圧縮条件情報により指定される量子化レベルでJPEG方式による圧縮処理を行い、当該圧縮処理後の第1レイヤの画像を第1レイヤ処理部13に出力する。
また、この圧縮処理部16は、第2レイヤ処理部14から、図7(b)に示した第2レイヤの画像を受け入れ、当該第2レイヤの画像に対して、圧縮条件情報により指定されるMMR方式による圧縮処理を行う。そして、この圧縮処理部16は、当該圧縮処理後の第2レイヤの画像を第2レイヤ処理部14に出力する。
データ出力部17は、第1レイヤ処理部13から入力される圧縮第1レイヤと、第2レイヤ処理部14から入力される圧縮第2レイヤとを含む圧縮ドキュメントを生成する。この圧縮ドキュメントは、可搬性の高いデータ形式で生成してもよい。具体的に、このデータ出力部17は、1ページ上に、圧縮第1レイヤに含まれるデータ部分をJPEG解凍処理して形成するとともに、圧縮第2レイヤに含まれるデータ部分をMMR解凍処理して形成するよう記述したPDF(Portable Document Format)形式のドキュメントとする。
なお、データ出力部17は、当該生成した圧縮ドキュメントを記憶部20に格納し、またはインターフェース部50を介して送信出力する。
また、この圧縮ドキュメントは、処理対象ドキュメントDにおいてテキスト部分t2をグラフィック部分g1上に重ねて形成する指示や、第1レイヤの上に第2レイヤを合成するといった各オブジェクトや各レイヤの合成順序等を指示する記述を含んで生成されてもよい。
本実施の形態によれば、一般的なTI分離処理によってイメージ部分と判断された領域についても、さらに文字形状を含む部分があるか否かを調べ、文字形状を含む部分が検出されると、当該部分をテキスト部分に含め、イメージ部分から除いてから圧縮処理を行っている。これにより、画質劣化が軽減され、圧縮効率も向上する。
また、ここまでの説明では文字検出部15は、処理対象ドキュメントDに含まれる全てのイメージ部分について、文字検出処理を行うこととしている。このため、処理対象ドキュメントDが多くのイメージ部分を含む場合には、文字検出処理に長時間を要してしまう。
そこで、本発明の他の実施形態として、制御部10が、図8に示すような処理を行うこととしてもよい。すなわち、制御部10によって行われる処理は、画像情報生成部11と、レイヤ処理制御部12と、第1レイヤ処理部13と、第2レイヤ処理部14と、文字検出部15と、圧縮処理部16と、データ出力部17と、に加え、さらに文字検出対象決定部18と、を含む。ここで既に説明した実施形態と同様の処理を行うものについては同じ符号を付して詳細な説明を省略する。
文字検出対象決定部18は、第2分離処理において、処理対象ドキュメントDに含まれるイメージ部分のうち、少なくとも一部を文字検出処理の対象として決定する処理を行う。
なお、本実施の形態では、画像情報生成部11が、付加情報とエッジ情報とに加え、処理対象ドキュメントDに含まれるオブジェクトの形状を表す情報(形状情報)を生成するものとする。具体的に、この形状情報は、処理対象ドキュメントD上において、各イメージ部分が配置される範囲を特定する座標情報である。
例えば、図4において点線で示すように、例えば「TITLE」との文字列を表すイメージ部分i1については、当該イメージ部分i1に対応する外接矩形領域i1a(図4において破線で示す)を画定する情報を生成する。なお、矩形領域を画定する情報としては対角線を画定する情報として、イメージ部分i1に係る領域i1aの4つの頂点のうち、原点Oからの距離が最も小さい頂点(左上の頂点P1)のXY座標値と、原点Oからの距離が最も大きい頂点(右下の頂点P2)のXY座標値とのセットでよい。
この画像情報生成部11は、形状情報を含む画像情報をレイヤ処理制御部12に出力する。レイヤ処理制御部12は、処理対象ドキュメントDに含まれる3つのイメージ部分i1,i2,i3の画像とともに、当該形状情報を文字検出対象決定部18に出力する。
文字検出対象決定部18は、当該形状情報に基づいて、イメージ部分の画像の各々について、文字検出処理の対象とするか否かを決定する。具体的に、この文字検出対象決定部18は、画像情報生成部11から受け入れた形状情報により特定される各イメージ部分の形状が、予め設定され、記憶部20に格納されている所定の形状条件を満足するか否かを判断し、当該形状条件を満足すると判断されたイメージ部分を文字検出対象として決定する。
一般に、イメージ部分が横書きの文字列を表す文字画像を含む場合、当該イメージ部分の外接矩形の幅Wに対して、高さHは小さくなる。尤も、イメージ部分が横線からなる場合、幅Wに対して高さHが極端に小さくなるという特徴を備えている。例えば外接矩形の高さに対する幅の比(W/H)について、この比がM1<M2なる、M1,M2について、M1以上かつM2未満の場合、横書の文字画像部分を含む可能性のある文字検出対象とする。このように、上側しきい値M2を用いることで横線を文字検出対象から排除するのである。
同じように、イメージ部分が縦書きの文字を表す文字画像部分である場合には、幅Wに対して高さHが大きくなる。また、当該イメージ部分が縦線からなる場合に配慮して、例えば外接矩形の高さに対する幅の比(W/H)について、N1<N2なる、N1,N2を用いて、当該比が、N1以上かつN2未満である場合、縦書の文字画像部分を含む可能性のある文字検出対象とする。このように、上側しきい値N2を用いることで縦線部分を文字検出対象から排除するのである。
本実施の形態の文字検出対象決定部18は、このように各イメージ部分の幅Wと高さHとの比を用い、形状条件であるこの比に対するしきい値M1,M2,N1,N2を用いて上記条件を満足するか否かによって文字検出対象とするか否かを定める。
具体的に図1に示したドキュメントDの例であれば、3つのイメージ部分i1,i2,i3のうち、「TITLE」の文字列を表すイメージ部分i1に係る幅/高さ比、W1/H1と、横一列に並んだ複数の星型図形を表すイメージ部分i3に係る幅/高さ比、W3/H3とがいずれも横書きの文字画像部分である可能性が高い(M1以上かつM2未満)と判断し、これら2つのイメージ部分i1,i3を文字検出処理対象と決定する。
文字検出対象決定部18は、文字検出対象として決定した2つのイメージ部分i1,i3を特定する情報を文字検出部15に出力する。また、この文字検出対象決定部18は、文字検出対象と決定しなかったイメージ部分i2を特定する情報を第1レイヤ処理部13に出力してもよい。
この場合文字検出部15は、当該決定の結果の入力を受けて、入力されるイメージ部分のうち、文字検出対象として決定されたイメージ部分について文字検出処理を行う。
また、文字検出対象と決定しなかったイメージ部分i2を特定する情報が入力された第1レイヤ処理部13は、当該イメージ部分i2については、除去の処理を必要としない部分と判断して、別途所定の処理を実行してもよい。
なお、本実施形態における処理対象ドキュメントDは、文書作成用ソフトウェアや図形形成用ソフトウェア等に特有のデータ形式で作成されたものであってもよいし、プリンタ装置等、画像形成装置による出力処理に適したページ記述言語(PDL:Page Discription Language)で記述されたものであってもよい。
また、本実施形態においては、イメージ部分のみを文字検出処理の対象としているが、処理対象ドキュメントDに含まれるデータのうち、テキスト部分以外のデータ(すなわちイメージ部分とグラフィック部分との双方)について、その全部又は一部を、文字検出対象決定処理又は文字検出処理の対象としてもよい。この場合、制御部10は第1レイヤ処理部13及び第2レイヤ処理部14に加え、グラフィック部分のみが含まれる第3レイヤの生成処理を行う第3レイヤ処理部をさらに含むこととしてもよい。この第3レイヤの画像(グラフィック部分であっても文字形状部分を除いた部分)は、第1レイヤ又は第2レイヤの少なくとも一方と同じ方式で圧縮処理されてもよいし、いずれとも異なる第三の方式で圧縮処理されてもよい。
また、グラフィック部分についても文字検出対象決定処理を行う場合には、画像情報生成部11は、イメージ部分に加え、各グラフィック部分の形状を特定する形状情報を生成し、文字検出対象決定部18は、当該形状情報に基づいて、各グラフィック部分を文字検出処理の対象とするか否かの決定処理を行う。
具体的に、図9(a)乃至(c)は、画像情報生成部11が、処理対象ドキュメントD内に複数の矩形範囲を設定する場合の一例について示している。この場合、画像情報生成部11は、図9(a)に示すように、処理対象ドキュメントDの1ページ分と同じページサイズの新規なレイヤL1を用意し、当該レイヤL1上に4つの分割領域(1)から(4)を設定して、当該分割領域ごとに形成されるグラフィック部分の矩形範囲を設定する。すなわち、この画像情報生成部11は、レイヤL1内に最大4つの矩形範囲を設定することができる。
ただし、この場合、図9(b)に示すように、レイヤL1上の2つの分割領域(3)と分割領域(4)とに跨って形成されるグラフィック部分g1と、1つの分割領域(4)内に形成されるグラフィック部分g2とがあると、2つの分割領域に跨って形成される1つのグラフィック部分g1については、各分割領域内に形成される部分ごとに2つの矩形範囲g1,g2が設定される。
そこで、画像情報生成部11は、図9(b)に示す3つの矩形範囲のうち、いずれかが互いに隣接しているか否かを調べ、隣接していると判断した矩形範囲同士を統合する。すなわち、この画像情報生成部11は、図9(b)に示すように、部分領域(3)内に形成されたグラフィック部分g1の一部に外接する矩形範囲g1aと、部分領域(4)内に形成されたグラフィック部分g1の残り部分に外接する矩形範囲g2aと、が互いに隣接することを検出し、図9(c)に示すように、これらを統合して、当該グラフィック部分g1全体に外接する矩形範囲g4aを新たに設定する。なお、この画像情報生成部11は、各矩形範囲間の距離(例えば矩形範囲の重心間の距離)を調べ、当該距離が所定値以下と判断した場合に、当該矩形範囲同士を統合することとしてもよい。
また、この画像情報生成部11は、ページ全体又は分割領域内ごとにフラグ値を設定し、当該フラグ値に基づいて、当該ページ全体又は各分割領域内に形成される複数のグラフィック部分に係る矩形範囲を統合することとしてもよい。図9(d)から(f)は、画像情報生成部11がページ全体について1つのフラグ値を設定し、当該フラグ値を参照して2つのグラフィック部分g1,g2の両方に外接する1つの矩形範囲を設定する場合の一例を示している。
すなわち、図9(d)に示すように、この画像情報生成部11は、新規に用意したレイヤL2のページ全体に対するフラグ値をOFFに設定する。次に、この画像情報生成部11は、図9(d)に示すフラグ値がOFFの状態のレイヤL2上に、図9(e)に示すように、1つ目のグラフィック部分g1を形成する。このとき、画像情報生成部11は、グラフィック部分g1の形成前のフラグ値を参照し、当該フラグ値がOFFであることから、図9(e)に示すように、当該グラフィック部分g1に外接する1つの矩形範囲g5aを設定する。また、このとき画像情報生成部11は、レイヤのフラグ値をOFFからONに変更する。
そして、この画像情報生成部11は、図9(e)に示すフラグ値がONに設定された(すなわち既にグラフィック部分g1が形成されている)レイヤL2上に、図9(f)に示すように、2つ目のグラフィック部分g2をさらに形成する。このとき、画像情報生成部11は、グラフィック部分g2の形成前のフラグ値を参照し、当該フラグ値がONであることから、既に形成されているグラフィック部分g1に外接する矩形範囲g5aを拡張して、図9(f)に示すように、2つのグラフィック部分g1,g2の両方に外接する新たな矩形範囲g6aを設定する。
また、画像情報生成部11が生成する形状情報は、上述のように、イメージ部分又はグラフィック部分の形状を処理対象ドキュメントD上の座標値を用いて矩形範囲として特定するものに限られず、矩形以外の形状として、当該任意の形状を特定するための関数や座標情報の群として生成されてもよい。
また、レイヤ処理制御部12は、条件情報のうち少なくとも一部を指示入力部30から受け入れることとしてもよい。この場合、例えば、ドキュメント処理装置1の利用者が、表示部40に表示される案内画面に従って、指示入力部30を介して条件情報を入力し、当該条件情報が制御部10に入力されることとなる。
1 ドキュメント処理装置、10 制御部、11 画像情報生成部、12 レイヤ処理制御部、13 第1レイヤ処理部、14 第2レイヤ処理部、15 文字検出部、16 圧縮処理部、17 データ出力部、18 文字検出対象決定部、20 記憶部、30 指示入力部、40 表示部、50 インターフェース部。
Claims (5)
- イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うドキュメント処理装置であって、
処理対象ドキュメントに含まれる、前記イメージ部分の少なくとも一部から、文字画像の部分を検出する文字検出手段と、
前記検出された文字画像部分と、前記テキスト部分とに第一の圧縮処理を施し、前記文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施す手段と、
を含むことを特徴とするドキュメント処理装置。 - 請求項1に記載のドキュメント処理装置において、
前記処理対象ドキュメントに含まれるイメージ部分の形状を表す形状情報を生成する形状情報生成手段と、
前記生成された形状情報に基づいて、前記イメージ部分を文字検出対象とするか否かを決定する対象決定手段と、
をさらに含み、
前記文字検出手段は、前記対象決定手段により文字検出対象と決定されたイメージ部分から文字画像部分を検出する、
ことを特徴とするドキュメント処理装置。 - 請求項2に記載のドキュメント処理装置において、
前記対象決定手段は、前記形状情報生成手段により生成された形状情報が、予め定めた形状条件を満足すると判断した場合に、当該形状情報に係るイメージ部分を文字検出対象と決定する、
ことを特徴とするドキュメント処理装置。 - イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うためのドキュメント処理プログラムであって、コンピュータに、
処理対象ドキュメントのうち、イメージ部分の少なくとも一部から、文字画像の部分を検出する手順と、
前記検出された文字画像部分と、前記テキスト部分とに第一の圧縮処理を施し、前記文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施す手順と、
を実行させることを特徴とするドキュメント処理プログラム。 - イメージ部分とテキスト部分とを含むドキュメントを対象として圧縮処理を行うためのドキュメント処理方法であって、コンピュータに、
処理対象ドキュメントのうち、イメージ部分の少なくとも一部から、文字画像の部分を検出する工程と、
前記検出された文字画像部分と、前記テキスト部分とに第一の圧縮処理を施し、前記文字画像部分以外のイメージ部分には前記第一の圧縮処理とは異なる第二の圧縮処理を施す工程と、
を実行させることを特徴とするドキュメント処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004236724A JP2006054817A (ja) | 2004-08-16 | 2004-08-16 | ドキュメント処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004236724A JP2006054817A (ja) | 2004-08-16 | 2004-08-16 | ドキュメント処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006054817A true JP2006054817A (ja) | 2006-02-23 |
Family
ID=36031972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004236724A Pending JP2006054817A (ja) | 2004-08-16 | 2004-08-16 | ドキュメント処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006054817A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006333361A (ja) * | 2005-05-30 | 2006-12-07 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
JP2009093319A (ja) * | 2007-10-05 | 2009-04-30 | Seiko Epson Corp | ファイル生成プログラム、画像処理装置、および画像処理方法 |
JP2009284508A (ja) * | 2009-07-14 | 2009-12-03 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
JP2010232891A (ja) * | 2009-03-26 | 2010-10-14 | Nec Personal Products Co Ltd | サーバ、リモート操作システム、伝送方式制御方法、プログラム及び記録媒体 |
JP2014072750A (ja) * | 2012-09-28 | 2014-04-21 | Brother Ind Ltd | 画像処理装置およびコンピュータプログラム |
-
2004
- 2004-08-16 JP JP2004236724A patent/JP2006054817A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006333361A (ja) * | 2005-05-30 | 2006-12-07 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
JP2009093319A (ja) * | 2007-10-05 | 2009-04-30 | Seiko Epson Corp | ファイル生成プログラム、画像処理装置、および画像処理方法 |
JP2010232891A (ja) * | 2009-03-26 | 2010-10-14 | Nec Personal Products Co Ltd | サーバ、リモート操作システム、伝送方式制御方法、プログラム及び記録媒体 |
JP2009284508A (ja) * | 2009-07-14 | 2009-12-03 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
JP2014072750A (ja) * | 2012-09-28 | 2014-04-21 | Brother Ind Ltd | 画像処理装置およびコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8320019B2 (en) | Image processing apparatus, image processing method, and computer program thereof | |
US8050499B2 (en) | Image-processing apparatus, image-processing method, and computer program used therewith | |
JP5274495B2 (ja) | 文書画像サイズ変更方法 | |
JP5361574B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN1859541B (zh) | 图像处理设备及其控制方法 | |
JP4817821B2 (ja) | 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
US10477063B2 (en) | Character detection and binarization | |
JP2006023945A (ja) | 画像処理システム及び画像処理方法 | |
US20120250048A1 (en) | Image processing apparatus and image processing method | |
JP2000067155A (ja) | 画像処理装置及びその方法、コンピュ―タ可読メモリ | |
US20060217826A1 (en) | Image processing apparatus and a method therefor | |
JP5171733B2 (ja) | 画像処理装置及び画像処理方法 | |
US8094973B2 (en) | Content aware image resizing for text and contone images | |
JP2008028717A (ja) | 画像処理装置および方法、プログラム | |
JP3715905B2 (ja) | 画像処理装置、画像処理方法、プログラム並びに記憶媒体 | |
JP2009302758A (ja) | 画像処理装置、画像変換方法、およびコンピュータプログラム | |
JP2003244447A (ja) | 画像処理装置及び画像処理方法 | |
JP4920814B2 (ja) | 画像処理方法、装置および記録媒体 | |
JP2006054817A (ja) | ドキュメント処理装置 | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP4736489B2 (ja) | 画像処理装置 | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JP4506346B2 (ja) | 画像処理装置 | |
JP4186832B2 (ja) | 画像処理装置 | |
JP2008077148A (ja) | 画像処理システムおよび画像処理装置 |