JP4333708B2

JP4333708B2 - 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム

Info

Publication number: JP4333708B2
Application number: JP2006211157A
Authority: JP
Inventors: 俊浩森
Original assignee: Konica Minolta Business Technologies Inc
Current assignee: Konica Minolta Business Technologies Inc
Priority date: 2006-08-02
Filing date: 2006-08-02
Publication date: 2009-09-16
Anticipated expiration: 2026-08-02
Also published as: JP2008042325A; US20080030812A1; US7884977B2

Description

本発明は、電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラムに関する。

近年、ＭＦＰ（Multi Function Peripherals）などの複合機は、白黒の画像に対応した処理を行なうものからカラーの画像に対応した処理を行なうもの（カラー対応のＭＦＰ）へ移行しつつある。

このようなカラー対応のＭＦＰにおいて、スキャナで読み取った（スキャンした）原稿の画像データを電子メールに添付してそこから直接送信する機能が一般に普及している。

しかしながら、Ａ４サイズの原稿を３００ｄｐｉのフルカラーの画像データとしてスキャンすると、そのデータ量は、２５ＭＢ程度となり電子メールでの送信には適さない。

そのため、スキャンした原稿の画像データを圧縮して送信するのが一般的である。しかし、データ量を小さくするために高い圧縮率で圧縮すると文字の部分がつぶれて読めなくなることがある。それを避けるために圧縮率を下げる必要があるが、そうすると、データ量を十分に小さくできない。

そこで、従来、高圧縮ＰＤＦという機能が用いられている。この機能では、画像データ全体に対して同じ圧縮方法を適用するのではなく、処理する領域によって別の圧縮方法を適用する。それによって文字の判読性を維持しつつデータ量（ファイルサイズ）の小さなＰＤＦのファイルを生成する。

具体的には、ＭＦＰ等でスキャンした原稿の画像データから所定のルールに従って単語または行の単位の領域（オブジェクト）を抽出し、その領域が文字を含む文字領域（文字オブジェクト）であるか文字を含まない非文字領域（非文字オブジェクト）であるかを判別する。

全ての文字オブジェクトについて、文字オブジェクトに含まれる文字の色などに関する代表色を１つ設定する。そして、代表色が近似している文字オブジェクト同士を統合して１つの文字オブジェクトにまとめる。または、文字オブジェクト同士の距離または統合した場合に発生する不要な空白の画素の増加具合などに基づいて統合する。

さらに、文字オブジェクトに対応する部分の画像データを、高い解像度を保ったままで二値化する。非文字オブジェクトについては、階調性を保つために二値化を行わずに低解像度化した後、高い圧縮率で圧縮（高圧縮）する。

また、その他、ファイルサイズの低減を図るために、次のような方法も用いられている。

色空間をあらかじめ所定数のブロックに分割しておき、各文字オブジェクトを色の近いブロックに割り振る。これによって、オブジェクトの個数を所定数以内に制限し、ファイルサイズの増加を抑える。

また、特許文献１および２で提案される方法を用いて画像データの中で使用される色数を減らすことによって、ファイルサイズを低減することも可能である。

特許文献１の方法では、色変換情報を格納するルックアップテーブルを用いて、入力画像を構成する各画素の色を限定色のいずれかに割り当てることによって減色の処理を行う。

特許文献２の方法では、多数色の入力画像データについて、ＲＧＢデータから各色の割合を算出し、目的の少ない色数に応じたグループに分けると共に代表色を決定する。代表色が複数ある色の領域を未確定領域とし、未確定領域のエッジ部分または中央部分における色と周辺の色の差などから未確定領域が図柄か否かを推論し、図柄なら周囲と異なる色、図柄でないなら周囲と同一の色に決定する。
特開平１０−７４２４８特開平６−１７５６３３

上述のように、従来の方法では、オブジェクトの代表色、距離、および統合によって発生する不要な空白の画素の増加具合に応じてオブジェクトを統合する。そして、その後に残ったオブジェクトを用いてファイルを生成する。このような方法では、統合の後に残るオブジェクトの個数が原稿の種類などに依存するため、オブジェクトの個数を十分に減らすことができない場合がある。そうすると、ファイルサイズが大きくなってしまう。

また、従来の方法においては、オブジェクトの統合に際して、代表色などの属性を全てのオブジェクトについて総当りで比較する。そのため、オブジェクトの個数が膨大であった場合には、その比較の処理に多大な時間を要してしまう。

また、文字オブジェクトに対応する画像データを高解像度に保ち、非文字オブジェクトを高圧縮する方法では、スキャンした原稿の画像データから文字の部分が正確に抽出されなければならない。すなわち、文字を含む領域が正確に文字領域と判別されなければならない。もし、誤って判別されると、その領域の画像データは、低解像度化された後に高い圧縮率で圧縮されるため、その領域の文字が読めなくなってしまうことがある。現実には完全な判別は困難であるため、文字が読めなくなるおそれがある。

色空間をあらかじめ所定数のブロックに分割しておく方法では、ブロックの境界付近にまたがる色の文字で構成されるオブジェクトにおいて、文字の色がブロックの一方と他方とに分かれてしまい、色段差が発生することがある。

特許文献１の方法では、画素ごとに、限定色を割り当てることによって減色処理を実現する。この方法においても、ある限定色が割り当てられた画素群と別の限定色が割り当てられた画素群との境界付近において色段差が発生する。特許文献２の方法を用いたとしても、同様の理由で色段差が発生する。

本発明は、このような問題点に鑑み、色段差の発生を抑えつつ文字の判読性を維持しながらファイルサイズを大幅に低減できるようにすることを目的とする。

本願の一請求項に係る入力データの処理方法は、入力データから電子ファイルを生成する際の当該入力データの処理方法であって、前記入力データに含まれる特定の領域を示すオブジェクトを生成する第１のステップと、生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第１の条件を満たすオブジェクト同士を統合することによってそれらを１つのオブジェクトにする第１の統合処理を前記第１の条件を満たすオブジェクト全てについて実行する第２のステップと、前記第２のステップ終了後、前記第２のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であること、を含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第１の全体統合ステップと、前記第１の全体統合ステップ終了後、前記第１の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第２の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第２の全体統合ステップとを含む、第３のステップと、を有する。

好ましくは、前記第３のステップにおいて、統合の後に残っているオブジェクトの個数が前記設定値以下になるように、前記第２の条件を満たすオブジェクト同士の統合を繰り返す。

好ましくは、オブジェクトには、文字の領域に関する文字オブジェクトと文字以外の領域に関する非文字オブジェクトとがあり、前記文字オブジェクトに対して、前記第２のステップおよび前記第３のステップの処理を行う。

好ましくは、前記第３のステップの処理の後に残っている前記文字オブジェクトを可逆圧縮し、前記非文字オブジェクトを非可逆圧縮する。

好ましくは、前記非可逆圧縮に用いるパラメータを、前記文字オブジェクトの可逆圧縮によって生成されたデータのデータ量に基づいて決定する。

本願の他の請求項に係るコンピュータプログラムは、入力データから電子ファイルを生成するコンピュータに、前記入力データに含まれる特定の領域を示すオブジェクトを生成する第１のステップと、生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第１の条件を満たすオブジェクト同士を統合することによってそれらを１つのオブジェクトにする第１の統合処理を前記第１の条件を満たすオブジェクト全てについて実行する第２のステップと、前記第２のステップ終了後、前記第２のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であること、を含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第１の全体統合ステップと、前記第１の全体統合ステップ終了後、前記第１の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第２の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第２の全体統合ステップとを含む、第３のステップと、を実行させることを特徴とする。

本願のさらに他の請求項に係る処理装置は、入力データから電子ファイルを生成する処理装置であって、前記入力データに含まれる特定の領域を示すオブジェクトを生成する生成手段と、前記生成手段によって生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第１の条件を満たすオブジェクト同士を統合することによってそれらを１つのオブジェクトにする第１の統合処理を前記第１の条件を満たすオブジェクト全てについて実行する第１の統合手段と、前記第１の統合手段による統合の処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であること、を含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第１の全体統合手段と、前記第１の全体統合手段による統合の処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第２の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第２の全体統合手段とを含む、第２の統合手段と、前記第２の統合手段による統合の処理の後に残っている前記文字オブジェクトを可逆圧縮する可逆圧縮手段と、前記非文字オブジェクトを非可逆圧縮する非可逆圧縮手段と、を有する

好ましくは、前記処理装置に、画像入力装置によって入力された入力画像に表れる文字の線図形の中央線またはその付近の領域である中央領域を検出する中央領域検出手段と、複数の画素からなる複数の小領域を前記中央領域から抽出する小領域抽出手段と、前記小領域ごとに、当該小領域に属する画素の中から所定の条件に合う画素を条件合致画素として検出する条件合致画素検出手段と、前記入力画像に表れる文字の色を前記各小領域の前記条件合致画素の色情報に基づいて判別する色判別手段と、を設けておく。

なお、前記第１の条件は、オブジェクト同士の距離、当該各オブジェクトに含まれる文字の色の差、および当該オブジェクト同士を統合した場合にできる空白の部分の大きさを示す値がそれぞれ所定の値よりも小さいことである。

前記第２の条件は、ある組合せのオブジェクト同士を統合した場合に当該統合によってできる１つのオブジェクトの属性値と統合前の各オブジェクトの属性値との差異が他の組合せのオブジェクト同士を統合した場合の差異より小さいことである。

前記属性値は、オブジェクトに含まれる文字の色についての値である。

スキャンした原稿の画像データに基づいて電子ファイルを生成する場合に、色段差の発生を抑えつつ文字の判読性を維持しながらファイルサイズを大幅に低減できる。

〔画像処理装置のハードウェア構成〕
図１は本発明の一実施形態に係る画像処理装置１のハードウェア構成の例を示す図、図２は操作パネル１０ｋの例を示す図、図３はスキャナ１０ａの設定項目を説明するための図である。

本実施形態において、画像処理装置１は、スキャナで読み取った原稿の画像をＰＤＦなどの形式の電子ファイルに変換して保存する。また、保存した電子ファイルを電子メールに添付して送信しまたはその電子ファイルに基づいて印刷の処理を行う。以下、画像処理装置１としてカラー対応のＭＦＰ（Multi Function Peripherals）を用いる場合を例にあげて説明する。

図１に示すように、画像処理装置１は、スキャナ１０ａ、ＣＰＵ１０ｂ、ハードディスク１０ｃ、ＲＡＭ１０ｄ、ＲＯＭ１０ｅ、印刷装置１０ｆ、通信インタフェース１０ｇ、制御用回路１０ｈ、および操作パネル１０ｋなどによって構成される。

スキャナ１０ａは、原稿の用紙に描かれている写真、文字、絵、または図表などを光学的に読み取って画像データ（イメージデータ）を生成し出力するための装置である。

ＣＰＵ１０ｂは、スキャナ１０ａが読み取った原稿の画像データをＴＩＦＦ、ＪＰＥＧ、ビットマップ、およびＰＤＦなどの形式のファイルに変換するための処理を行う。また、ユーザからの入力の検出、操作パネル１０ｋの表示の制御，または電子メールの作成など、画像処理装置１の全体的な制御を行う。

ハードディスク１０ｃには、後に説明する図４に示すような各部の機能を実現するためのプログラムおよびデータがインストールされている。これらのプログラムおよびデータは必要に応じてＲＡＭ１０ｄに読み出される。そして、ＣＰＵ１０ｂによってプログラムが実行される。これらのプログラムおよびデータの一部または全部を、ＲＯＭ１０ｅに記憶させておいてもよい。または、その機能の一部または全部を、制御用回路１０ｈによって実現するようにしてもよい。

印刷装置１０ｆは、スキャナ１０ａによって得られた画像データまたは他の装置から送信されてきた画像データに基づいて、用紙に画像を印刷する装置である。印刷の際には、イエロー、マゼンタ、シアン、およびブラックの４色のトナーが用いられる。

通信インタフェース（ネットワークインタフェース）１０ｇは、他の装置と通信を行うためのインタフェースである。通信インタフェース１０ｇとして、ＮＩＣ（Network Interface Card）、モデム、またはＮＣＵ（Network Control Unit）などが用いられる。なお、通信インタフェース１０ｇは、電子メールの送信、電話回線へのデータの送受信、ファクシミリ（ＦＡＸ）などにおける通信のプロトコルに関する処理、およびＦＡＸの送受信の際の変復調などを行う。

制御用回路１０ｈは、スキャナ１０ａ、ハードディスク１０ｃ、印刷装置１０ｆ、通信インタフェース１０ｇ、および操作パネル１０ｋなどの装置を制御するための回路である。

操作パネル１０ｋは、ユーザが画像処理装置１に各種の設定をしたり印刷などの指令を与えたりするための入力装置（インターフェース）である。

図２に示すように、操作パネル１０ｋには、スタートボタンＢＴ１、ストップボタンＢＴ２、テンキーＢＴ３、コピーボタンＢＴ４、スキャンボタンＢＴ５、およびディスプレイＴＰが設けられている。

図２において、ディスプレイＴＰは、タッチパネル式の液晶ディスプレイであり、ユーザが各種の設定を行うための画面またはユーザに対するメッセージなどを表示する。

ユーザは、例えば、ここに表示された画面を操作してスキャンの設定に関する項目（スキャン設定項目）を選択しそれについての設定を行う。また、画像ファイルのフォーマットを選択しまたは電子メールおよびＦＡＸの宛先などを入力する。

スタートボタンＢＴ１は、コピーまたはスキャンなど、各種の処理を開始するためのボタンである。

ストップボタンＢＴ２は、実行中の処理を中断するためのボタンである。

テンキーＢＴ３は、コピーの枚数またはＦＡＸの宛先などを入力するためのボタンである。

コピーボタンＢＴ４は、コピーについての設定を開始するためのボタンである。このボタンが押されると、コピーの設定を行うための画面がディスプレイＴＰに表示される。

スキャンボタンＢＴ５は、スキャナ１０ａによる読み取り（スキャン）の設定を開始するためのボタンである。ユーザがこのボタンを押すと、ディスプレイＴＰに、図２に示されるような設定画面ＦＲが表示される。

設定画面ＦＲには、スキャン設定項目に対応するタブＴＡ１、ＴＡ２、ＴＡ３、画面ボタンＣＭ１０、ＣＭ２０、ＣＭ３０、およびＣＭ４０が含まれている。以下、タブＴＡ１、ＴＡ２、およびＴＡ３をまとめて「タブＴＡ」と記載し、画面ボタンＣＭ１０、ＣＭ２０、ＣＭ３０、およびＣＭ４０をまとめて「画面ボタンＣＭ」と記載することがある。他の符号についても同様に、符号に付した連番などを省略して記載することがある。

図３に示すように、本実施形態におけるスキャン設定項目は、４段階の階層構造となっている。図２の例では、タブＴＡ１、ＴＡ２、およびＴＡ３が、それぞれ、図３における第１階層のスキャン設定項目Ｍ１、Ｍ２、およびＭ３に対応している。さらに、画面ボタンＣＭ１０、ＣＭ２０、ＣＭ３０、およびＣＭ４０が、それぞれ、第２階層のスキャン設定項目Ｍ１０、Ｍ２０、Ｍ３０、およびＭ４０に対応している。

図２の設定画面ＦＲにおいて、画面ボタンＣＭが選択されると、それらに対応するスキャン設定項目Ｍの下位のスキャン設定項目Ｍが設定画面ＦＲに表示される。

スキャンの設定に際して、ユーザは、設定画面ＦＲを用いて順番に階層をたどっていき、設定を行いたい第４階層目のスキャン設定項目Ｍ（Ｍ１１１〜Ｍ１１３、Ｍ１２１〜Ｍ１２４、またはＭ１３１〜Ｍ１３２）を表示させる。そして、テンキーＢＴ３などを用いてそのスキャン設定項目Ｍのパラメータなどを設定する。

ところで、近年、ＭＦＰは、白黒対応のものからカラー対応のものに移行しつつある。また、スキャンした原稿の画像データを電子メールに添付してＭＦＰから直接送信するという用途で使用されることがある。そのような状況において、送付する原稿の種類または枚数などに応じて必要な要件が変わることから、ＭＦＰを使用するユーザのニーズも以下のように様々に変化する。
・送付する原稿の枚数が多いので、文字が読める範囲で、できる限り小さいサイズのファイルを生成したい。
・文字の色が変わると原稿の意味が変わるので、できる限り正確に文字の色を再現したい。
・印刷の速度をあまり低下させずに、できるだけ小さなサイズのファイルを生成したい。
・ＯＣＲ（Optical Character Reader）の処理が目的なので、文字が読めれば良い。
・文字だけでなくその背景も高解像度を保ちたい。

上記のようなニーズを満たす為には、原稿の種類または枚数などに応じて、ユーザがＭＦＰの設定を変更できることが望ましい。変更する項目としては下記のようなものがあげられる。
（ａ）スキャンの解像度（領域判別解像度）
（ｂ）背景レイヤの解像度
（ｃ）背景レイヤの圧縮強度
（ｄ）背景レイヤの有無
（ｅ）文字レイヤの解像度
（ｆ）文字レイヤの文字色の個数の制限
（ｇ）文字の統合レベル
以下、本実施形態においては、特に上記の（ｆ）に関する処理について詳しく説明する。
〔画像処理装置の機能的な構成〕
図４は画像処理装置１の機能的な構成の例を示す図、図５は領域処理部１４の構成の例を示す図、図６は原稿画像ＤＧおよび明度原稿画像ＤＭの例を示す図、図７は文字色決定処理部１１４の構成の例を示す図、図８は細線化画像ＧＳの生成方法の例を説明するための図、図９は文字の線図形の中央線の位置の例を示す図、図１０は文字の線図形の中央線およびその付近の領域を複数の文字色候補領域ＲＣに分割する方法の例を説明するための図、図１１は近似色画素選出処理の流れの例を説明するためのフローチャート、図１２は各原色の階調の分布の例を示す図、図１３は文字オブジェクトＯＢＭの統合を説明するための第１の例を示す図、図１４は文字オブジェクトＯＢＭの統合を説明するための第２の例を示す図、図１５はコンパクトＰＤＦファイルの構成の例を示す図である。次に、図４などを参照して画像処理装置１の各部の処理について説明する。

図４に示すように、画像処理装置１は、ファイル保存部１１、画像データ取得部１２、前処理部１３、領域処理部１４、統合処理部１５、可逆圧縮部１６、低解像度化部１７、非可逆圧縮部１８、およびファイル生成部１９などから構成される。

ファイル保存部１１は、ファイル生成部１９によって生成されるＰＤＦなどの形式の電子ファイルを保存する。

画像データ取得部１２は、スキャナ１０ａが読み取った原稿の画像データである原稿画像データＤＧを取得する。この原稿画像データＤＧは、ＴＩＦＦ、ＪＰＥＧ、またはビットマップなどの形式でスキャナ１０ａから出力される。なお、以下において、「画像データ」および「原稿画像データ」の「データ」を省略し、それぞれ、単に「画像」および「原稿画像」と記載することがある。後に説明するその他の画像データについても同様である。

前処理部１３は、次に説明する領域処理部１４の処理のための前処理を行う。具体的には、原稿画像ＤＧの形式の変換、解像度の変換、および下地除去などの処理を行う。

領域処理部１４は、前処理部１３によって前処理が施された原稿画像ＤＧｂから特定の領域を抽出し、その領域に含まれる画像の属性に基づいて、その領域が、図形に関する図形領域、写真に関する写真領域、表に関する表領域、下地のみの下地領域、または文字に関する文字領域（テキスト領域）のいずれであるかを判別するための処理（領域判別処理）を行う。

さらに、その判別の結果に基づいて、その領域の中に文字が含まれるかどうかを判定し（文字判定処理）、文字が含まれる領域の画像を二値化しその文字の色を判別するための処理（二値化・文字色判別処理）を行う。ここで、領域処理部１４における領域判別処理（図・写真・下地判定処理）、文字判定処理、および二値化・文字色判別処理のそれぞれについて図５を参照してさらに詳しく説明する。

図５に示すように、領域処理部１４は、明度画像生成部１０１、スムージング部１０２、領域抽出部１０３、領域判別部１０４、明度画像生成部１０５、スムージング部１０６、エッジ抽出部１０７、罫線分離部１０８、文字判定部１０９、文字オブジェクト生成部１１０、非文字オブジェクト生成部１１１、網点除去部１１２、二値化部１１３、および文字色判別処理部１１４などから構成される。

ここにおいて、明度画像生成部１０１、スムージンング部１０２、領域抽出部１０３、および領域判別部１０４の処理が、先に述べた「領域判別処理」に対応する。また、明度画像生成部１０５、スムージング部１０６、エッジ抽出部１０７、罫線分離部１０８、文字判定部１０９、文字オブジェクト生成部１１０、および非文字オブジェクト生成部１１１の処理が、「文字判定処理」に対応する。さらに、網点除去部１１２、二値化部１１３、および文字色判別処理部１１４の処理が、「二値化・文字色判別処理」に対応する。

図５において、明度画像生成部１０１は、原稿画像ＤＧｂから明度を算出し、明度で表される画像（明度画像）を生成する。これによって、図６に示すような、元の原稿画像ＤＧに対応した明度画像である明度原稿画像ＤＭが生成される。なお、「元の原稿画像ＤＧに対応した明度画像」とは、この図６の例ように、元の原稿画像ＤＧと同じ広さの領域に元の原稿画像ＤＧに対応した内容を表す明度画像のことである。

なお、本実施形態では、Ｒ（赤）、Ｇ（緑）、およびＢ（青）の各原色（以下、「ＲＧＢ」と記載する。）による２４ビットの階調性を有するフルカラーの原稿画像ＤＧｂから８ビットの階調性を有する明度原稿画像ＤＭを生成する。

また、本実施形態では、領域判別処理における判別の精度および演算の負荷などの点を考慮して、主に明度画像を領域処理部１４での処理の対象としている。

スムージンング部１０２は、明度画像生成部１０１によって生成された明度原稿画像ＤＭに対してスムージングを行う。スムージングによってノイズが除去されることにより領域判別処理における情報の誤検出が低減される。

領域抽出部（領域分離手段）１０３は、スムージングが施された明度原稿画像ＤＭｂを二値化した後、そこから文字、写真、または図形などを形成する連続する白以外の画素を検出し、その連続する画素の画素群を包含する矩形領域（ブロック）を抽出（検出）する。または、互いに所定の距離にある画素群同士を一つの画素群とみなして、それを包含する（囲む）矩形領域を抽出する。これによって、図６において一点鎖線で示されるような、１つの文字、単語、図形、または写真ごとの矩形領域が抽出される。

さらに、抽出した矩形領域に対してラベリングを行うことによって矩形領域の位置（以下、「ブロック位置」と記載することがある。）を取得する。なお、二値化およびラベリング処理を行うのは、次に説明する領域判別部１０４が、文字、図形、または写真の連続した矩形領域ごとに処理し判別を行うからである。

そして、矩形領域の大きさ（以下、「ブロックサイズ」と記載することがある。）およびブロック位置など、その矩形領域についての情報を示すオブジェクトデータ（オブジェクト）を生成する。以下、このオブジェクトを「オブジェクトＯＢ」と記載することがある。また、オブジェクトＯＢの符号に連番を付して、「オブジェクトＯＢ１」、「オブジェクトＯＢ２」、…などと区別して記載することもある。他の符号についても同様に、符号の後に連番を付して記載することがある。また、矩形領域を図示する場合に、その矩形領域を、それに対応するオブジェクトＯＢで表すことがある。

本実施形態においては、文字オブジェクトＯＢのブロック位置は、明度原稿画像ＤＭの左上端を原点とした場合の、その矩形領域内の左上画素の明度原稿画像ＤＭ内における座標によって示される。ブロックサイズは、矩形領域の縦方向の画素数および横方向の画素数によって示される。

以上の処理によって、図６に示すような矩形領域についてのオブジェクトＯＢ１、ＯＢ２、…、ＯＢ７が取得される。

領域判別部１０４は、明度原稿画像ＤＭにおいてオブジェクトＯＢの矩形領域に対応する部分を抽出し、その部分に示される明度画像の特徴（特性）に応じて、その矩形領域が、図形領域、写真領域、表領域、下地領域、または文字領域のいずれであるかを判別する。すなわち、その矩形領域を上記のいずれかに分類する。そして、判別の結果を示すデータをその判別の対象となったオブジェクトＯＢに付加する。

図６において、例えば、オブジェクトＯＢ５として示されるような矩形領域が図形領域である。オブジェクトＯＢ７として示されるような矩形領域が写真領域である。オブジェクトＯＢ１、ＯＢ２、ＯＢ３、ＯＢ４、およびＯＢ６として示されるような矩形領域が文字領域である。また、下地のみの矩形領域がある場合は、それが下地領域となる。

以下、図形領域、写真領域、表領域、および下地領域をまとめて「背景領域」と記載することがある。

明度画像生成部１０５は、原稿画像ＤＧｂから明度を算出し、明度原稿画像ＤＭ２を生成する。

スムージンング部１０６は、明度原稿画像ＤＭ２に対してスムージングを行なう。

なお、明度画像生成部１０５およびスムージンング部１０６では、それぞれの処理において、後の文字判定部１０９の処理を考慮した適切なパラメータが用いられる。

エッジ抽出部１０７は、スムージンング部１０６によってスムージングが施された明度原稿画像ＤＭ２ｂからエッジ部分を抽出し、そのエッジ部分によって示される画像であるエッジ画像を生成する。明度の高い領域の文字または反転文字などを検出するために、ここでは、二値化せずにエッジ部分の抽出を行う。これによって、元の原稿画像ＤＧに対応したエッジ画像であるエッジ原稿画像ＤＥが生成される。

罫線分離部１０８は、エッジ原稿画像ＤＥ全体に対して、文字と罫線とを分離する処理を行い、罫線分離済画像を生成する。これによって、元の原稿画像ＤＧに対応した罫線分離済画像である罫線分離済原稿画像ＤＫが生成される。文字と罫線とを分離することで、文字判定処理における判定の精度を上げることができる。

文字判定部１０９は、オブジェクトＯＢに文字が含まれるかどうか、すなわち罫線分離済原稿画像ＤＫのうちでオブジェクトＯＢに対応する部分の罫線分離済画像に文字が表されているかどうかを、オブジェクトＯＢごとに判定する。

例えば、図６のオブジェクトＯＢ１の場合、元の原稿画像ＤＧのうちでオブジェクトＯＢ１に対応する部分の画像には、「社」という文字が表されているので、文字が含まれると判定される。また、文字判定部１０９は、写真領域などにさらに文字が含まれている場合にも、その文字の判定を行う。

なお、領域判別部１０４においてオブジェクトＯＢの矩形領域が文字領域と判別されたかまたはその他の領域と判別されたかによって文字判定部１０９での判定の方法が異なる。

文字オブジェクト生成部１１０は、文字が表されていると判定されたオブジェクトＯＢの矩形領域についてのオブジェクトデータである文字オブジェクトＯＢＭを生成するための処理を以下のようにして行う。

文字が表されていると判定されたオブジェクトＯＢから、そのオブジェクトＯＢのブロック位置、およびブロックサイズを取得する。さらに罫線分離済原稿画像ＤＫのうちでそのオブジェクトＯＢに対応する部分の罫線分離済画像を取得する。そして、取得した罫線分離済画像、ブロック位置、およびブロックサイズを示す文字オブジェクトＯＢＭを生成する。

非文字オブジェクト生成部１１１は、文字が表されていると判定されなかったオブジェクトＯＢの矩形領域についてのオブジェクトデータである非文字オブジェクトＯＢＨを生成するための処理を以下のようにして行う。

文字が表されていると判定されなかったオブジェクトＯＢから、そのオブジェクトＯＢのブロック位置、およびブロックサイズを取得する。さらに原稿画像ＤＧのうちでそのオブジェクトＯＢに対応する部分の画像（フルカラー画像）を取得する。そして、取得したフルカラー画像、ブロック位置、およびブロックサイズを示す非文字オブジェクトＯＢＨを生成する。

なお、非文字オブジェクトＯＢＨの生成に、原稿画像ＤＧではなく、原稿画像ＤＧｂまたは明度画像ＤＭを用いるようにしてもよい。すなわち、原稿画像ＤＧｂまたは明度画像ＤＭのうちでそのオブジェクトＯＢに対応する部分の画像を取得し、取得したブロック位置、ブロックサイズ、およびその画像を示す非文字オブジェクトＯＢＨを生成するようにしてもよい。

以下、文字オブジェクトＯＢＭおよび非文字オブジェクトＯＢＨに示される罫線分離済画像またはフルカラー画像などの画像を総称して「オブジェクト画像」と記載することがある。

網点除去部１１２は、各文字オブジェクトＯＢＭのオブジェクト画像（罫線分離済画像）に対して網点除去の処理を行う。

二値化部１１３は、網点除去が施された文字オブジェクトＯＢＭのオブジェクト画像を二値化する。これによって、オブジェクト画像に含まれる文字の部分と背景の部分とが分離される。以下、網点除去および二値化が施されたオブジェクト画像のことを、特に、「オブジェクト二値画像ＧＮ」と記載することがある。

この二値化に先立って網点除去を行なうことで、文字の背景の部分の網点を二値化することによるノイズ（ゴミ）の発生を低減できる。また、二値化によって文字オブジェクトＯＢＭのデータ量を削減することできる。

文字色判別処理部１１４は、図７に示すように、低解像度画像生成部３０１、細線化画像生成部３０２、文字画像分割部３０３、近似色画素選出部３０４、文字色成分取得部３０５、文字色決定部３０６、および文字色情報付加部３０７などによって構成され、原稿に描かれていた文字色（以下、「原稿文字色」と記載する。）を判別する。本実施形態では、文字オブジェクトＯＢＭごとに原稿文字色を判別し、その文字オブジェクトＯＢＭについての１つの原稿文字色である代表色を決定する。ここで、原稿文字色を判別する処理の内容について、図８に示すような「２５５２５５」という文字群についての文字オブジェクトＯＢＭｘが処理対象である場合を例に説明する。

図８（ａ）は、原稿画像ＤＧのうちで文字オブジェクトＯＢＭｘに対応する部分の画像（以下、「ブロック原稿画像ＤＧＢｘ」と記載する。）を示している。図８（ｂ）は、明度原稿画像ＤＭのうちで文字オブジェクトＯＢＭｘに対応する部分の画像（以下、「ブロック明度画像ＤＭＢｘ」と記載する。）を示している。図８（ｃ）は、文字オブジェクトＯＢＭｘが示すオブジェクト二値画像ＧＮｘを示している。

図７の低解像度画像生成部３０１は、文字オブジェクトＯＢＭｘのオブジェクト二値画像ＧＮｘの解像度を落とすことによって図８（ｄ）に示すような低解像度画像ＧＴｘを生成する。本実施形態では、ブロック原稿画像ＤＧＢｘ、ブロック明度画像ＤＭＢｘ、およびオブジェクト二値画像ＧＮｘの解像度が３００ｄｐｉであるものとし、低解像度画像生成部３０１は７５ｄｐｉの低解像度画像ＧＴｘを生成するものとする。

細線化画像生成部３０２は、低解像度画像ＧＴｘに対して公知の細線化処理を施すことによって、図８（ｅ）のような細線化画像ＧＳｘを生成する。すなわち、低解像度画像ＧＴｘに表れている太さ１ピクセル（画素）以上の線図形から中央線を検出することによって低解像度画像ＧＴｘを生成する。例えば「２」という文字の線図形からは、図９に示すような中央線が検出される。本実施形態では、太さ１ピクセル（画素）の細線を表わす細線化画像ＧＳｘを生成する。なお、細線化画像ＧＳｘの解像度は、低解像度画像ＧＴｘの解像度と同じであり、７５ｄｐｉである。細線化画像生成部３０２の処理によって、文字の線図形の中央線およびその付近に位置する画素群（領域）を見つけることができる。

文字画像分割部３０３は、細線化画像ＧＳｘに基づいて、ブロック原稿画像ＤＧＢｘに表されている（含まれている）文字の線図形の中央線およびその付近を複数の文字色候補領域ＲＣ（図１０参照）に分割する。文字色候補領域ＲＣに分割する処理は、例えば次のような方法で行う。

細線化画像ＧＳｘの細線上の１つの画素は、ブロック原稿画像ＤＧＢｘの中の文字を構成するうちの複数個の画素に相当する。つまり、例えば図１０（ａ）において円形の点線枠で示す細線化画像ＧＳｘの中の細線上の１つの画素ＰＸは、図１０（ｂ）において矩形の点線枠で示す元のブロック原稿画像ＤＧＢｘの文字の線上の複数個の画素に相当する。文字画像分割部３０３は、これらの画素の塊を文字色候補領域ＲＣとして抽出する。本実施形態では、細線化画像ＧＳｘおよびブロック原稿画像ＤＧＢｘのそれぞれの解像度の関係から、図１０（ｃ）に示すように、４×４画素の文字色候補領域ＲＣが抽出される。同様に、細線上の他の画素に対応する画素の塊を抽出することによって、ブロック原稿画像ＤＧＢｘの文字の線図形の中央線およびその付近を複数の文字色候補領域ＲＣに分割することができる。文字画像分割部３０３の処理によって複数の文字色候補領域ＲＣが抽出される。

近似色画素選出部３０４は、文字画像分割部３０３によって得られた各文字色候補領域ＲＣの中から、原稿文字色に最も近い色を表わしていると考えられる画素（以下、「近似色画素ＰＫ」と記載する。）を、図１１に示すような手順で選出する。

１つの文字色候補領域ＲＣに注目し、その文字色候補領域ＲＣを構成する４×４個の画素のうち上下左右の端に位置する画素（例えば、図１０（ｃ）において太線枠の外側に位置する１２個の画素）を候補から除外する（図１１の＃１２）。これらの画素は、太線枠の内側に位置する画素よりも文字背景画像に近いので、色滲みが発生している可能性が高く信頼性が低いからである。

除外されずに残った画素つまり図１０（ｃ）において太線枠の内側に位置する２×２個の画素のそれぞれの明度を算出する。そして、明度が最も低い画素（つまり、濃度が最も高い画素）を、原稿文字色に最も近い色を表わしている画素つまり近似色画素ＰＫとして選出する（＃１３）。

他の文字色候補領域ＲＣについても同様にステップ＃１２、＃１３の処理を実行し、近似色画素ＰＫを選出する。

以上の処理によって、１つの文字オブジェクトＯＢＭｘについて多数の近似色画素ＰＫが選出される。具体的には、その文字オブジェクトＯＢＭｘの細線化画像ＧＳｘ（図８（ｅ）参照）の細線を構成する画素の個数分の近似色画素ＰＫが選出される。

図７の文字色成分取得部３０５は、近似色画素選出部３０４によって選出された各近似色画素ＰＫについて、文字オブジェクトＯＢＭｘのオブジェクト画像に表されている文字（文字オブジェクトＯＢＭｘに含まれる文字）についてのその近似色画素ＰＫの、ＲＧＢの各原色の階調の値である画素値（濃度値）を取得する。係る画素値は、元の原稿画像ＤＧのうちの文字オブジェクトＯＢＭｘに対応する部分を検索し、その文字オブジェクトＯＢＭｘの中のその近似色画素ＰＫの位置の画素値を参照することによって取得することができる。取得した各原色の階調の値は、例えば、図１２に示すヒストグラムのような分布になる。

文字色決定部３０６は、文字色成分取得部３０５によって取得された各原色の階調の値の分布に基づいて、文字オブジェクトＯＢＭｘに含まれる文字の色を、例えば次のような方法で決定する。

文字色成分取得部３０５によって取得された各原色の階調の値の分布のそれぞれについて、ピークの値を求める。これは、公知の方法によって求められる。例えば、最も個数の多い画素値をピークの値として選出してもよいし、公知の演算方法によって求めてもよい。このようにして求められたＲ、Ｇ、Ｂそれぞれのピークの値によって再現される色を、文字オブジェクトＯＢＭｘに含まれる文字の色に決定する。そして、これを、文字オブジェクトＯＢＭｘに含まれる文字の色であると判別する。

これによって、文字オブジェクトＯＢＭｘの代表色が決定する。

文字色情報付加部３０７は、文字色決定部３０６が決定した代表色を示すデータを、その文字オブジェクトＯＢＭｘに付加する。すなわち、この時点で文字オブジェクトＯＢＭｘには、オブジェクト二値画像ＧＮ、ブロック位置、およびブロックサイズを示すデータとともに、代表色を示すデータが含まれることになる。

図４に戻って、統合処理部１５は、領域処理部１４から文字オブジェクトＯＢＭを取得し、取得した文字オブジェクトＯＢＭのうちで所定の条件を満たす関係にあるもの同士を統合して一つの文字オブジェクトＯＢＭにする処理を行う。これによって文字オブジェクトＯＢＭの個数を減少させる。

ここで、図１３および図１４を参照して、文字オブジェクトＯＢＭの統合について説明する。なお、ここでは、「あ」、「い」、「う」、「え」、および「お」などの文字についての文字オブジェクトＯＢＭを例にあげて説明する。

図１３には、水平方向（行方向）に並ぶ文字オブジェクトＯＢＭ１、ＯＢＭ２、ＯＢＭ３、ＯＢＭ４、およびＯＢＭ５が示されている。図１３において、オブジェクトＯＢＭ１、ＯＢＭ２、…のブロック位置は、原稿画像ＤＧの左上端を原点とし画素の水平方向の座標をＸ座標とし画素の垂直方向の座標をＹ座標した場合に、それぞれ、（ｘ_１，ｙ_１）、（ｘ_２，ｙ_２）、…と表される。また、ブロックサイズは、縦の長さと横の長さを「（縦の長さ，横の長さ）」と表記した場合に、それぞれ、（ａ_１，ｂ_１）、（ａ_２，ｂ_２）、…と表される。

まず、統合処理部１５が文字オブジェクトＯＢＭ１と文字オブジェクトＯＢＭ２とを統合する場合について考える。

統合処理部１５は、文字オブジェクトＯＢＭ１のブロック位置（ｘ１，ｙ１）、文字オブジェクトＯＢＭ２のブロック位置（ｘ２，ｙ２）、文字オブジェクトＯＢＭ１のブロックサイズ（ａ１，ｂ１）、および文字オブジェクトＯＢＭ２のブロックサイズ（ａ２，ｂ２）に基づいて、文字オブジェクトＯＢＭ１と文字オブジェクトＯＢＭ２とを包含する矩形領域のブロック位置（ｘ１，ｙ１）およびブロックサイズ（ａ１，ｂ６）を求める。

これによって、図１３（ｂ）に示すような、文字の「あ」および「い」を包含する矩形領域が定義される。

さらに、文字オブジェクトＯＢＭ１およびＯＢＭ２に示される代表色の平均値を加重平均によって求める。この平均値の求め方については、後に詳しく説明する。

そして、定義された矩形領域の画像、ブロック座標（ａ_１，ｂ_１）、ブロックサイズ（ａ_１，ｂ_６）、および求めた平均値を示す文字オブジェクトＯＢＭ６を生成する。すなわち、文字オブジェクトＯＢＭ１および文字オブジェクトＯＢＭ２のそれぞれに含まれるオブジェクト二値画像ＧＮを統合し、ブロック位置、ブロックサイズ、および代表色を示すデータを統合することによって新たな文字オブジェクトＯＢＭ６を生成する。

これによって、文字オブジェクトＯＢＭの個数が１個減り、図１３（ｂ）に示すように、文字オブジェクトＯＢＭ６、ＯＢＭ３、ＯＢＭ４、およびＯＢＭ５の４個が残る。

この後、統合処理部１５は、残ったものの中で所定の条件を満たす関係にある２つの文字オブジェクトＯＢＭがある場合、それら対してさらに統合の処理を行う。例えば、次に、文字オブジェクトＯＢＭ３と文字オブジェクトＯＢＭ４との関係が所定の条件を満たす場合、これらを統合して新たな文字オブジェクトＯＢＭ７を生成する。

そうすると、図１３（ｃ）に示すように、文字オブジェクトＯＢＭ５、ＯＢＭ６、およびＯＢＭ７が残る。さらに、文字オブジェクトＯＢＭ６と文字オブジェクトＯＢＭ７とを統合したとすると、図１３（ｄ）に示すように、文字オブジェクトＯＢＭ５およびＯＢＭ８が残る。

このように、統合処理部１５は、統合の後に残った文字オブジェクトＯＢＭに対してさらに統合の処理を繰り返し、文字オブジェクトＯＢＭの個数を減らしていく。

図１３においては、文字オブジェクトＯＢＭが水平方向に配置されている場合を示した。それに対して図１４では、垂直方向（列方向）にも配置されている場合の例を示す。

図１４（ａ）には、文字オブジェクトＯＢＭ１０、ＯＢＭ１１、ＯＢＭ１２、ＯＢＭ１３、ＯＢＭ１４、ＯＢＭ１５、およびＯＢＭ１６が示されている。

ここで、文字オブジェクトＯＢＭ１０と文字オブジェクトＯＢＭ１３とを統合した後、文字オブジェクトＯＢＭ１４と文字オブジェクトＯＢＭ１６とを統合した場合、その後には、図１４（ｂ）のように文字オブジェクトＯＢＭ１１、ＯＢＭ１２、ＯＢＭ１５、ＯＢＭ１７、およびＯＢＭ１８が残る。

この場合、図１４（ｂ）に示すように、「あ」、「い」、および「か」の文字を含む文字オブジェクトＯＢＭ１７と「き」、「く」、「し」、および「す」の文字を含む文字オブジェクトＯＢＭ１８とには互いに重なる領域が生じる。

この例のように、統合後に互いに重なり合う文字オブジェクトＯＢＭができるような統合を行うこともできる。すなわち、文字オブジェクトＯＢＭごとにレイヤが形成されており、それぞれ、そのレイヤ上に位置していると考えることができる。非文字オブジェクトについても同様である。

従って、文字オブジェクトＯＢＭのことを「文字レイヤ」と呼ぶことができ、非文字オブジェクトＯＢＨのことを「非文字レイヤ」または「背景レイヤ」などと呼ぶことができる。

統合処理部１５は、上記のような統合の処理を、水平方向に行ごとに行い、さらに垂直方向に列ごとに行う。その後に残った文字オブジェクトＯＢＭに対して所定の条件の下に統合の処理を繰り返す。このような統合処理の手順および統合の条件などについては、後に、〔統合処理部の構成〕において詳しく説明する。

可逆圧縮部１６は、統合処理部１５の統合の処理の後に残った文字オブジェクトＯＢＭを取得し、それに示されるオブジェクト二値画像ＧＮを可逆圧縮の方式で圧縮する（可逆圧縮する）。そして、圧縮されたオブジェクト画像を含む文字オブジェクトＯＢＭを出力する。なお、本実施形態では、可逆圧縮の方式としてＭＭＲを用いる。

低解像度化部１７は、非文字オブジェクトＯＢＨに示されるオブジェクト画像に対して低解像度化の処理を行う。

非可逆圧縮部１８は、低解像度化された非文字オブジェクトＯＢＨのオブジェクト画像を非可逆圧縮し、圧縮されたオブジェクト画像を含む非文字オブジェクトＯＢＨを出力する。なお、本実施形態では、非可逆圧縮の方式としてＪＰＥＧを用いる。

ファイル生成部１９は、可逆圧縮部１６および非可逆圧縮部１８から出力される文字オブジェクトＯＢＭおよび非文字オブジェクトＯＢＨを合成して、ファイルを生成する。本実施形態においては、コンパクトＰＤＦのファイルを生成する。

なお、ここで生成されるファイルの形式は、図３におけるスキャン設定項目Ｍ１２の「フォーム」から設定することができる。すなわち、その下位のスキャン設定項目Ｍ１２１、Ｍ１２２、Ｍ１２３、またはＭ１２４のいずれかの形式を選択することによって設定する。本実施形態では、予め、スキャン設定項目Ｍ１２４の「コンパクトＰＤＦ」が設定されている。

ここで、コンパクトＰＤＦファイルの構成について、図１５を参照して説明する。

図１５に示すように、コンパクトＰＤＦファイルは、大きく分けて、ファイルヘッダ、ボディ、相互参照表、およびトレーラなどから構成される。

ファイルヘッダには、コンパクトＰＤＦの仕様のバージョンが示される。ボディには、文書の内容が示される。相互参照表には、ボディ内に含まれるオブジェクトの位置についての情報が示される。トレーラには、コンパクトＰＤＦファイルのオブジェクトの個数またはカタログ辞書のオブジェクトの番号などが示される。

ボディは、さらに、文書情報、子ページのデータブロック、子ページ辞書、親ページ辞書、およびカタログ辞書などから構成される。ここにおいて、カタログ辞書には、親ページ辞書の番号が示される。親ページ辞書には、ページ数または子ページ辞書の番号などが示される。子ページ辞書には、データブロックの書式などが示される。

また、各子ページのデータブロックは、背景レイヤ、複数の文字レイヤ、およびレイヤ情報などから構成される。

背景レイヤには、ＪＰＥＧの圧縮によって生成されたデータが格納される。文字レイヤには、二値化されＭＭＲの圧縮によって生成されたデータが格納される。レイヤ情報には、背景レイヤおよび文字レイヤの位置または文字レイヤに含まれる原稿文字色などが示される。
〔統合処理部の構成〕
図１６は統合処理部１５の構成を示す図、図１７は全体統合処理を説明するための図、図１８は再統合処理を説明するための図、図１９は２つ文字オブジェクトＯＢＭを統合したと仮定した場合の統合前および統合後の文字オブジェクトＯＢＭの属性値を示す第１の図、図２０は２つの文字オブジェクトＯＢＭを統合したと仮定した場合の統合前および統合後の文字オブジェクトＯＢＭの属性値を示す第２の図である。次に、統合処理部１５の処理について、図１６を参照してさらに詳しく説明する。

図１６において、統合処理部１５は、行方向統合部１５１、列方向統合部１５２、全体統合部１５３、および第２全体統合部１５４などから構成される。

行方向統合部１５１は、文字オブジェクトＯＢＭ同士を水平方向に統合するための処理（行方向統合処理）を以下のようにして行う。

まず、所定のルールに従って元の原稿画像ＤＧに対応する領域全体に対して行を定義する。そして、１つの行内での最も左側にある文字オブジェクトＯＢＭを基準オブジェクトとして選択する。基準オブジェクトと同じ行にある文字オブジェクトＯＢＭのうち基準オブジェクトから所定の距離内にあるものを抽出し、距離の近い文字オブジェクトＯＢＭから順番に、それに示される代表色を基準オブジェクトの代表色と比較していく。

なお、「基準オブジェクトと同じ行にある文字オブジェクトＯＢＭ」とは、例えば、基準オブジェクトと交わる一つまたは複数の行と交わる（少なくとも一つの行を基準オブジェクトと共有する）文字オブジェクトＯＢＭのことである。

また、本実施形態では、２つの文字オブジェクトＯＢＭ間の距離を、それぞれに含まれる最も近い画素同士の距離とする。従って、同じ行にある２つの文字オブジェクトＯＢＭの距離は、右側にある文字オブジェクトＯＢＭの左端の画素のＸ座標から左側にある文字オブジェクトＯＢＭの右端の画素のＸ座標を引くことによって求めることができる。ただし、文字オブジェクトＯＢＭ同士が互いに重なり合っている場合は、それらの距離を「０」とする。または、２つの文字オブジェクトＯＢＭ間の距離として、それぞれのブロック位置の距離を用いてもよい。

比較した代表色の差（文字色差）が予め設定されている閾値以下の文字オブジェクトＯＢＭが見つかった時点で、基準オブジェクトとその文字オブジェクトＯＢＭとを統合する。すなわち、基準オブジェクトから所定の距離内にあって且つ文字色差が所定の閾値以下であるという条件を満たす文字オブジェクトＯＢＭと基準オブジェクトとを統合する。

次に、統合によって新たに生成された文字オブジェクトＯＢＭを次の基準オブジェクトとして上記の処理を行う。上記の条件を満たす文字オブジェクトＯＢＭがない場合は、そのときの基準オブジェクトと同じ行にあるひとつ右隣の文字オブジェクトＯＢＭを次の基準オブジェクトとして上記の処理を行う。そして、その行内の最も右側の文字オブジェクトＯＢＭが基準オブジェクトＯＢＭとなるまで上記の処理を繰り返す。定義した全ての行に対してこのような処理を行う。

列方向統合部１５２は、行方向統合処理の後に残った文字オブジェクトＯＢＭ同士を垂直方向に列ごとに統合する処理（列方向統合処理）を以下のようにして行う。

まず、所定のルールに従って元の原稿画像ＤＧに対応する領域全体に対して列を定義する。そして、１つの列内での最も上側にある文字オブジェクトＯＢＭを基準オブジェクトとして選択する。基準オブジェクトと同じ列にある文字オブジェクトＯＢＭのうち基準オブジェクトから所定の距離内にあるものを抽出し、距離の近い文字オブジェクトＯＢＭから順番に、それに示される代表色を基準オブジェクトの代表色と比較していく。

なお、「基準オブジェクトと同じ列にある文字オブジェクトＯＢＭ」とは、例えば、基準オブジェクトと交わる一つまたは複数の列と交わる（少なくとも一つの列を基準オブジェクトと共有する）文字オブジェクトＯＢＭのことである。

また、この場合の２つの文字オブジェクトＯＢＭ間の距離は、下側にある文字オブジェクトＯＢＭの上端の画素のＹ座標から上側にある文字オブジェクトＯＢＭの下端の画素のＹ座標を引くことによって求めることができる。ただし、２つの文字オブジェクトＯＢＭが互いに重なり合っている場合は、それらの距離を「０」とする。または、２つの文字オブジェクトＯＢＭ間の距離として、それぞれのブロック位置の距離を用いてもよい。

次に、統合によって新たに生成された文字オブジェクトＯＢＭを次の基準オブジェクトとして上記の処理を行う。上記の条件を満たす文字オブジェクトＯＢＭがない場合は、そのときの基準オブジェクトと同じ列にあるひとつ下隣の文字オブジェクトＯＢＭを次の基準オブジェクトとして上記の処理を行う。そして、その列内の最も下側の文字オブジェクトＯＢＭが基準ＯＢＭとなるまで上記の処理を繰り返す。定義した全ての列に対してこのような処理を行う。

全体統合部１５３は、列方向統合処理の後に残った文字オブジェクトＯＢＭに対して統合の処理（全体統合処理）を行う。この全体統合処理について図１７を参照して説明する。

図１７（ａ）には、行方向統合処理および列方向統合処理の後に残った文字オブジェクトＯＢＭ２１、ＯＢＭ２２、ＯＢＭ２３、ＯＢＭ２４、ＯＢＭ２５、およびＯＢＭ２６が示されている。まず、この中から同じ代表色の２つの文字オブジェクトＯＢＭを抽出する。

次に、抽出した２つの文字オブジェクトＯＢＭの矩形領域に含まれる画素数（文字オブジェクトＯＢＭに含まれる画素数）と、これらの統合後にできる文字オブジェクトＯＢＭに含まれる画素数とを算出する。画素数は、その文字オブジェクトＯＢＭのブロックサイズに示される縦の長さ（画素数）×横の長さ（画素数）で求められる。

例えば、同じ代表色であるとして抽出した文字オブジェクトＯＢＭが文字オブジェクトＯＢＭ２１および２４であった場合、これら２つの文字オブジェクトＯＢＭに含まれる画素数Ｓ_２１およびＳ_２４は、それぞれ、ａ_２１×ｂ_２１およびａ_２４×ｂ_２４となる。また、これら２つの文字オブジェクトＯＢＭを統合した場合、統合後の文字オブジェクトＯＢＭは、１７（ｂ）の文字オブジェクトＯＢＭ２７のようになる。

図１７（ｂ）から分かるとおり、文字オブジェクトＯＢＭ２７に含まれる画素数は、（ｙ_２４−ｙ_２１＋ａ_２４）×（ｘ_２４−ｘ_２１＋ｂ_２４）となる。

さらに、抽出した２つの文字オブジェクトＯＢＭの画素数をＳ_１とし、統合後にできる文字オブジェクトＯＢＭの画素数をＳ_０として以下の式を満たすかどうかを判定する。

Ｓ_０／Ｓ_１＜閾値
この式を満たした場合は、抽出した２つの文字オブジェクトＯＢＭを実際に統合する。図１７の例では、Ｓ_０は、（ｙ_２４−ｙ_２１＋ａ_２４）×（ｘ_２４−ｘ_２１＋ｂ_２４）となり、Ｓ_１は、（ａ_２１×ｂ_２１＋ａ_２４×ｂ_２４）となる。従って、
（ｙ_２４−ｙ_２１＋ａ_２４）×（ｘ_２４−ｘ_２１＋ｂ_２４）/（ａ_２１×ｂ_２１＋ａ_２４×ｂ_２４）＜閾値
の式を満たす場合に、文字オブジェクトＯＢＭ２１およびＯＢＭ２４を実際に統合し、文字オブジェクトＯＢＭ２７を生成する。上記の式を満たさなかった場合は、統合は行わない。

さらに、代表色が同じである２つの文字オブジェクトＯＢＭの他の組合せを抽出し、同様に上記の式を満たすかどうかの判定を行い、満たす場合にそれらを統合する。そのような処理を、代表色が同じである文字オブジェクトＯＢＭの全ての組合せについて完了するまで繰り返す。なお、ここでは、代表色が同じ２つの文字オブジェクトＯＢＭを抽出するようにしたが、代表色が近似する２つの文字オブジェクトＯＢＭ、すなわち文字色差が所定の閾値以内である２つの文字オブジェクトＯＢＭを抽出するようにしてもよい。

ところで、統合後の文字オブジェクトＯＢＭの矩形領域の中で統合前の２つの文字オブジェクトＯＢＭの矩形領域以外の部分（増加部分）の画素、すなわち図１７の例では文字オブジェクトＯＢＭ２７における文字オブジェクトＯＢＭ２１およびＯＢＭ２４の矩形領域に対応する部分以外の部分の画素は、ドットが打たれていない不要な画素（不要空白画素）となる。この増加部分の画素は連続する空白の画素となるので、後の可逆圧縮処理部１６の圧縮によってデータ量が大幅に削減される。

従って、２つの文字オブジェクトＯＢＭのブロックサイズに対してそれらの統合後の文字オブジェクトＯＢＭのブロックサイズが顕著に大きくなったとしても、可逆圧縮処理部１６の圧縮によって生成される圧縮データのデータ量はさほど大きく増加するわけではない。

しかし、印刷の際には、不要空白画素についても、その画素が空白の画素であるという情報に基づいて印刷のための処理が行われるので、不要空白画素が増加すればその分だけ無駄に印刷に時間がかかってしまう。

本実施形態においては、統合によって文字オブジェクトＯＢＭのブロックサイズが顕著に増加する場合には統合を行わない。このように、不要空白画素の増加具合（増加加減）などを考慮して全体統合処理を行うため、印刷の速度を低下させるという弊害を防止することができる。

第２全体統合部１５４は、全体統合処理の後に残った文字オブジェクトＯＢＭの個数が所定の閾値である制限個数（レイヤ上限）以下になるように、その文字オブジェクトＯＢＭを再度全体として統合するための処理（再統合処理）を行う。係る処理は以下のようにして行われる。

まず、全体統合処理の後に残った文字オブジェクトＯＢＭの個数を求め、その個数と制限個数とを比較する。文字オブジェクトＯＢＭの個数が制限個数以下である場合は、統合を行わずに処理を終了する。文字オブジェクトＯＢＭの個数が制限個数を超える場合は、文字オブジェクトＯＢＭを統合してその個数を減らすための処理を行う。

それに際して、まず、２つの文字オブジェクトＯＢＭを選択し、それらを統合したと仮定した場合にできる文字オブジェクトＯＢＭの代表色のＲＧＢの濃度値を算出する。選択した文字オブジェクトＯＢＭのそれぞれの代表色と算出した代表色とを比較してそれぞれについての文字色差を求める。このような比較を、全体統合処理の後に残った全ての文字オブジェクトＯＢＭについて総当りで行い、全ての組み合わせについて文字色差を求める。そして、文字色差が最も小さい組み合わせの文字オブジェクトＯＢＭ同士を統合する。

統合の後、残った文字オブジェクトＯＢＭの個数と制限個数とを比較する。文字オブジェクトＯＢＭの個数が制限個数以下である場合は、処理を終了する。文字オブジェクトＯＢＭの個数が制限個数を超える場合は、文字オブジェクトＯＢＭの代表色を再度総当りで比較し、文字色差が最も小さい組み合わせの文字オブジェクトＯＢＭ同士を統合する。このような処理を、文字オブジェクトＯＢＭの個数が制限個数以下になるまで繰り返す。

ここで、この再統合処理について、図１８を参照して具体的に説明する。なお、ここでは、全体統合処理の後に残った文字オブジェクトＯＢＭの個数が６個であり、制限個数が「４」である場合を例にあげる。なお、図１８では、文字オブジェクトＯＢＭを「ＯＢＭ」と記載する。

図１８には、全体統合処理の後、すなわち再統合処理が行われる前の状態（統合前）、再統合処理において１回目の統合が行われた後の状態（統合１回目）、および２回目の統合が行われた後の状態（統合２回目）での文字オブジェクトＯＢＭが、それぞれ、示されている。また、文字オブジェクトＯＢＭごとにその文字オブジェクトＯＢＭに含まれる画素数およびＲＧＢの各濃度値が示されている。

図１８において、統合前の文字オブジェクトＯＢＭは６個であり、制限個数の「４」よりも大きい。従って、第２全体統合部１５４は、文字オブジェクトＯＢＭの個数が４個以下になるように、文字オブジェクトＯＢＭを統合してその個数を減らすための処理を行う。

それに際して、まず、２つの文字オブジェクトＯＢＭ３１およびＯＢＭ３２を選択する。そして、それらの各代表色とそれらを統合したと仮定した場合にできる文字オブジェクトＯＢＭ３１２の代表色とを比較しそれぞれについての文字色差を算出する。

文字色差を求めるに当たって、まず、統合後の文字オブジェクトＯＢＭ３１２のＲＧＢの各濃度値を算出する。ＲＧＢの各濃度値は、統合前の２つの文字オブジェクトＯＢＭを文字オブジェクトＯＢＭａとＯＢＭｂとし、統合後にできる文字オブジェクトＯＢＭを文字オブジェクトＯＢＭｃとした場合に、例えば、以下の式のような加重平均によって求めることができる。なお、行方向統合処理、列方向統合処理、および全体統合処理においても同様に次の式によって統合後にできる文字オブジェクトＯＢＭの代表色のＲＧＢの各濃度値を求めることができる。

従って、文字オブジェクトＯＢＭ３１とＯＢＭ３２とを統合した場合のＲの濃度値、すなわち文字オブジェクトＯＢＭ３１２の代表色のＲの濃度値は、
（２０２×１０００＋１９５×５０）／１０５０＝２０１
となる。同様にしてＧおよびＢの濃度値は、それぞれ、「１４７」および「１６」となる。

続いて、統合前の各文字オブジェクトＯＢＭと統合後の文字オブジェクトＯＢＭとの文字色差をそれぞれ求める。文字色差は、統合前の文字オブジェクトＯＢＭのＲＧＢの濃度値を、それぞれ、「Ｒ０」、「Ｇ０」、および「Ｂ０」とし、統合後の文字オブジェクトＯＢＭのＲＧＢの濃度値を、それぞれ、「Ｒ１」、「Ｇ１」、および「Ｂ１」した場合に、例えば、次の式によって求めることができる。なお、行方向統合処理、列方向統合処理、および全体統合処理においても同様に次の式によって文字色差を求めることができる。

従って、文字オブジェクトＯＢＭ３１と統合後の文字オブジェクト３１２との文字色差は、

となる。

また、文字オブジェクトＯＢＭ３２と統合後の文字オブジェクト３１２の文字色差は、

となる。

同様にして、他の全ての組合せについても文字色差を求めると、図１９の表ＴＢ１に示される値が得られる。

図１９においては、「統合前」の欄に、統合前の文字オブジェクトＯＢＭａおよびＯＢＭｂの属性値などが示される。それぞれについて、Ｎｏの欄には、その文字オブジェクトＯＢＭに対応する番号が示される。この番号は、文字オブジェクトＯＢＭの符号の「ＯＢＭ」に付した連番である。「画素数」の欄には、その文字オブジェクトＯＢＭに含まれる画素数が示される。「Ｒ」、「Ｇ」、および「Ｂ」の欄には、それぞれ、その文字オブジェクトＯＢＭの代表色のＲＧＢの各濃度値が示される。

また、それらを統合した場合の統合後の文字オブジェクトＯＢＭｃの画素数およびＲＧＢの各濃度値が「統合後の文字オブジェクトＯＢＭｃ」の欄に示される。文字オブジェクトＯＢＭａおよびＯＢＭｂと統合後の文字オブジェクトＯＢＭｃとの文字色差が「統合前後の文字色差」の欄に示される。

「統合前後の文字色差」の欄においては、「ＯＢＭａ」の欄に、文字オブジェクトＯＢＭａと文字オブジェクトＯＢＭｃとの文字色差が示され、「ＯＢＭｂ」の欄に、文字オブジェクトＯＢＭｂと文字オブジェクトＯＢＭｃとの文字色差が示される。「ＭＡＸ」の欄には、「ＯＢＭａ」および「ＯＢＭｂ」の欄に示される文字色差の内で大きい方の値（代表色差）が示される。

全ての組合せについて文字色差が求まると、第２全体統合部１５４は、代表色差が最も小さい組合せの文字オブジェクトＯＢＭ同士を統合する。

図１９の「ＭＡＸ」の欄に示される値から分かるとおり、この例では、文字オブジェクトＯＢＭ３１およびＯＢＭ３６を統合した場合の代表色差が「１４」で最小となる。従って、文字オブジェクトＯＢＭ３１とＯＢＭ３６とを統合する。

この統合によって、図１８の「統合１回目」に示されるように、文字オブジェクト３１６が新たに生成され、全体として文字オブジェクトＯＢＭの個数が５個に減少する。

統合の後、再度、制限個数と文字オブジェクトＯＢＭの個数とを比較する。図１８の例では、文字オブジェクトＯＢＭの個数が５個であり、まだ制限個数の「４」より大きいので、残った５つの文字オブジェクトＯＢＭに対して上記のような処理を繰り返す。

この５個の文字オブジェクトＯＢＭについて、図１９の表ＢＴ１の場合と同様にして各値を求めると、図２０のような表ＴＢ２が得られる。表ＴＢ２の「ＭＡＸ」の欄に示される値によれば、文字オブジェクトＯＢＭ２と文字オブジェクトＯＢＭ５とを統合した場合の代表色差が「２０」で最小となる。従って、文字オブジェクトＯＢＭ２と文字オブジェクトＯＢＭ５とを統合する。

文字オブジェクトＯＢＭ２と文字オブジェクトＯＢＭ５とを統合すると、図１８の「統合２回目」に示されるように、文字オブジェクトＯＢＭ３２５が新たに生成され、全体としてオブジェクトの個数が４個に減少する。

２回目の統合によって、文字オブジェクトＯＢＭの個数が制限個数以下になるので、この時点で再統合処理を終了する。

ところで、文字オブジェクトＯＢＭには、そこに含まれる文字の色を代表する１つの代表色が対応付けられる。そのため、最終的に生成されるＰＤＦファイルに使用される文字色の個数（文字色数）は、文字オブジェクトＯＢＭの個数に依存することになる。よって、文字オブジェクトＯＢＭの個数を制限することはＰＤＦファイルに使用される文字色数を制限することになる。

従って、再統合処理における制限個数を「文字色制限値」と呼ぶことができる。また、この再統合処理を「文字色制限処理」と呼ぶことができる。

本実施形態においては、ユーザは、このような文字色制限値を、図３のスキャン設定項目Ｍ１３１によって設定することができる。

また、本実施形態では、ユーザは、スキャン設定項目Ｍ１３２によって、生成されるＰＤＦファイルのデータ量（ファイルサイズ）を設定することもできる。ファイルサイズが設定されると、画像処理装置１は、そのファイルサイズ内に収まるようにＰＤＦファイルを生成するための処理を行う。このような処理を文字色制限処理に対して「ファイルサイズ制限処理」と呼ぶことができる。このファイルサイズ制限処理については、後に〔ファイルサイズ制限処理の説明〕において詳しく説明する。

本実施形態においては、文字オブジェクトＯＢＭの統合が統合処理部１５において行なわれる場合の例を説明したが、文字色判別処理部１１４において代表色が決定したときに、同じまたは近似している代表色の文字オブジェクトＯＢＭで近傍にあるもの同士を予め統合しておくようにしてもよい。

また、本実施形態においては、統合前の２つの文字オブジェクトＯＢＭとそれらの統合後の文字オブジェクトＯＢＭとの文字色差のうち大きい方の値を代表色差としたが、小さい方の値を代表色差としてもよい。また、代表色差が所定値より小さい場合にのみ再統合処理を許可するという制限を設けることも可能である。
〔フローチャートによる説明〕
図２１は画像処理装置１におけるＰＤＦファイルを生成するまでの概略の処理の流れを説明するためのフローチャートである。

次に、図２１のフローチャートを参照して、画像処理装置１において、スキャンされた原稿についてのＰＤＦファイルが生成されるまでの概略の処理の流れについて説明する。

図２１において、スキャナ１０ａが原稿をスキャンすると（＃２１）、画像処理装置１は、それによって得られた原稿画像ＤＧに対して画像形式の変換、解像度の変換、および下地除去などの前処理を施す（＃２２）。

原稿画像ＤＧから明度画像ＤＭを生成し、そこに含まれるオブジェクトＯＢを抽出する。抽出したオブジェクトＯＢの矩形領域が、図形領域、写真領域、表領域、下地領域、または文字領域のいずれであるかを判別する（＃２３）。

そのオブジェクトＯＢに文字が含まれるかどうかを判定する（＃２４）。ここでは、ステップ＃２３での判別の結果に応じて判定の方法が変更される。

文字が含まれると判定されたオブジェクトＯＢである文字オブジェクトＯＢＭのブロック画像を二値化した後（＃２５）、統合処理を行う（＃２６）。

ステップ＃２６の統合処理の後に残った文字オブジェクトＯＢＭのオブジェクト画像をＭＭＲによって可逆圧縮する（＃２７）。

ステップ＃２４で文字を含まないと判定されたオブジェクトＯＢである非文字オブジェクトＯＢＨのオブジェクト画像を低解像度化した後（＃２８）、ＪＰＥＧなどの非可逆圧縮する（＃２９）。

ステップ＃２７およびステップ＃２９による圧縮の処理が施された文字オブジェクトＯＢＭおよび非文字オブジェクトＯＢＨに基づいてＰＤＦファイルを生成する（＃３０）。

なお、本実施形態では、ステップ＃２７において、文字オブジェクトＯＢＭのオブジェクト画像を圧縮するようにしたが、文字オブジェクトＯＢＭの全体を圧縮するようにしてもよい。同様に、ステップ＃２９において、非文字オブジェクトＯＢＨの全体を圧縮するようにしてもよい。

図２２はステップ＃２６の統合処理の流れを説明するためのフローチャートである。

図２２において、まず、水平方向において所定の距離内にあり且つ代表色が近似する２つの文字オブジェクトＯＢＭを検索し、そのような２つの文字オブジェクトＯＢＭを統合する処理を繰り返す。そのような統合の処理を行ごとに行う（＃１０１）。

ステップ＃１０１の統合の後に残った文字オブジェクトＯＢＭから、垂直方向において所定の距離内にあり且つ代表色が近似する２つの文字オブジェクトＯＢＭを検索し、そのような２つの文字オブジェクトＯＢＭを統合する処理を繰り返す。そのような統合の処理を列ごとに行う（＃１０２）。

ステップ＃１０２の統合の後に残った文字オブジェクトＯＢＭに対して、全体統合処理を行う（＃１０３）。

ステップ＃１０３の全体統合処理の後に残った文字オブジェクトＯＢＭに対して、再統合処理を行う（＃１０４）。

図２３はステップ＃１０３の全体統合処理の流れを説明するためのフローチャートである。次に、図２３のフローチャートを参照して全体統合処理の流れについて説明する。

図２３において、まず、同じ代表色の文字オブジェクトＯＢＭを２つ抽出する（＃３０１）。抽出した各文字オブジェクトＯＢＭのブロックサイズを求める（＃３０２）。さらに、それら二つの文字オブジェクトを統合した場合における統合後の文字オブジェクトＯＢＭのブロックサイズを求め（＃３０３）、統合前の２つの文字オブジェクトＯＢＭのブロックサイズの合計と統合後の文字オブジェクトのブロックサイズとを比較する（＃３０４）。

比較の結果、ブロックサイズが大幅に増加する場合、すなわち増加の割合が所定の閾値以上である場合は（＃３０４でＮｏ）、ステップ＃３０１以降の処理を繰り返す。なお、ステップ＃３０１の処理において、２回目以降は、既に抽出した組合せ以外の組合せで文字オブジェクトＯＢＭを抽出する。

増加の割合が所定の閾値未満であった場合は（＃３０４でＹｅｓ）、それら２つの文字オブジェクトＯＢＭを統合する。すなわち、統合前の２つの文字オブジェクトＯＢＭの矩形領域に基づいて統合後の文字オブジェクトＯＢＭの矩形領域を求め、そこに含まれる画像をその文字オブジェクトＯＢＭのオブジェクト画像として保存することによって、統合前の２つの文字オブジェクトＯＢＭに含まれるオブジェクト画像（オブジェクト二値画像ＧＮ）を統合する（＃３０５）。さらに、統合前の２つの文字オブジェクトＯＢＭの属性値に基づいて統合後の文字オブジェクトＯＢＭの代表色、ブロック位置、ブロックサイズを求め、それらを、それぞれ、その統合後の文字オブジェクトＯＢＭの代表色、ブロック位置、およびブロックサイズとして保存する。それによって、統合前の２つの文字オブジェクトＯＢＭの代表色、ブロック位置、およびブロックサイズを示すデータを統合する（＃３０６）。

同じ代表色の文字オブジェクトＯＢＭの全ての組合せについてステップ＃３０６までの処理が完了していない場合は（＃３０７でＮｏ）、ステップ＃３０１以降の処理を繰り返す。完了した場合は（＃３０７でＹｅｓ）、全体統合処理を終了する。

図２４はステップ＃１０４の再統合処理の流れを説明するためのフローチャートである。次に、図２４のフローチャートを参照して再統合処理の流れについて説明する。

図２４において、まず、残っている文字オブジェクトＯＢＭをカウントしてその個数を求める（＃４０１）。その個数が所定の閾値である制限個数以下である場合（＃４０２でＮｏ）、そのまま再統合処理を終了する。

制限個数を超える場合（＃４０２でＹｅｓ）、残っている文字オブジェクトＯＢＭから２つの文字オブジェクトＯＢＭを選択し、それらの代表色とそれらを統合した場合の統合後の文字オブジェクトＯＢＭの代表色とについて文字色差を求める（＃４０３）。残っている文字オブジェクトＯＢＭの全ての組合せについてステップ＃４０３の処理を繰り返す（＃４０４でＮｏ）。

全ての組合せについて完了したら（＃４０４でＹｅｓ）、各組合せについて求められた２つ文字色差のうちで大きい方の値が最も小さい組合せの文字オブジェクトＯＢＭ同士を統合し（＃４０５）、ステップ＃４０１以降の処理を繰り返す。ステップ＃４０１において、２回目以降は、前回求めた個数から１減算することによってその回の個数を求めるようにしてもよい。

次に、上述した文字オブジェクトの統合処理に加えて、非文字オブジェクトの非可逆圧縮時にファイルサイズ制限を行う実施例について説明する。
〔ファイルサイズ制限処理の説明〕
図２５は画像処理装置１Ｂの機能的な構成の例を示す図である。

ファイルサイズ制限処理を行うために、画像処理装置１を図２５に示す画像処理装置１Ｂのように構成する。画像処理装置１Ｂは、ユーザなどによって予め設定されたファイルサイズの上限値（制限値）であるファイルサイズ上限値以下のデータ量のファイルを生成するための処理を行う。

図２５において、画像処理装置１Ｂは、ファイル保存部１１、画像データ取得部１２、前処理部１３、領域処理部１４、統合処理部１５、可逆圧縮部１６Ｂ、ファイル生成部１９、および非文字オブジェクト処理部２０などから構成される。

ここにおいて、ファイル保存部１１、画像データ取得部１２、前処理部１３、領域処理部１４、統合処理部１５、およびファイル生成部１９の処理の内容は図４において説明したものと同様である。よって、ここでは、説明を省略する。

可逆圧縮部１６Ｂは、統合の処理の後に残った文字オブジェクトＯＢＭのオブジェクト画像をＭＭＲによって圧縮する。圧縮の処理が施された全ての文字オブジェクトＯＢＭのデータ量の合計を示す可逆圧縮データ量ＤＤを求める。

非文字オブジェクト処理部２０は、低解像度化部１７Ｂおよび非可逆圧縮部１８Ｂなどから構成されている。この非文字オブジェクト処理部２０は、非文字オブジェクトＯＢＨに対して低解像度化およびＪＰＥＧによる圧縮の処理を以下のようにして行う。

まず、可逆圧縮部１６Ｂから可逆圧縮データ量ＤＤを取得し、その可逆圧縮データ量ＤＤの値とファイルサイズ上限値との差分を求める。

求めた差分は、ファイルサイズ上限値が示す容量から文字オブジェクトＯＢＭの総データを引いた残りの容量（残容量）であり、非文字オブジェクトＯＢＨに対して使用できる容量を示す。すなわち、背景領域に使用できる容量である。

求めた残容量に基づいて、非文字オブジェクトＯＢＨのオブジェクト画像の解像度をどこまで下げるのかを決定する。すなわち、低解像度化における目標の解像度（目標背景解像度）を求める。さらに、求めた残容量に基づいて、ＪＰＥＧによる圧縮の際のパラメータである圧縮パラメータ（圧縮強度）を求める。

そして、低解像度化部１７Ｂによって、各非文字オブジェクトＯＢＨのオブジェクト画像を目標解像度まで低解像度化する。これによって、例えば、３００ｄｐｉの解像度を１５０ｄｐｉの目標解像度まで低解像度化する。

続いて、非可逆圧縮部１８Ｂによって、低解像度化された非文字オブジェクトＯＢＨのオブジェクト画像をＪＰＥＧによって圧縮する。この際、上で求めた圧縮パラメータを用いる。

ＪＰＥＧによる圧縮が施された全ての非文字オブジェクトＯＢＨのデータ量の合計である非可逆圧縮データ量と残容量とを比較し、非可逆圧縮データ量が残容量以下であるかどうかを判定する。残容量以下でない場合は、残容量を超えた分のデータ量に応じて、目標解像度と圧縮パラメータとを設定しなおし、低解像度化およびＪＰＥＧによる圧縮を再度行う。非可逆圧縮データ量が残容量以下になるまで上記の処理を繰り返す。

非可逆圧縮データ量が残容量以下となった場合に、非文字オブジェクトＯＢＨをファイル生成部１９に出力する。

また、低解像度化などに先立って非可逆圧縮データ量が残容量内に収まるかどうかを判定する処理を行ってもよい。そして、収まりきらないと判定した場合には、その旨をユーザに対して通知し、ファイルサイズ上限値、目標解像度、または圧縮パラメータなどの変更を促すようにする。

この判定においては、例えば、圧縮の対象の非文字オブジェクトＯＢＨのデータ量と残容量との差が所定の閾値以上である場合に収まりきらないと判定する。または、目標解像度と圧縮パラメータとを用いて非可逆圧縮データ量を試算し、試算した非可逆圧縮データ量と残容量との差が所定の閾値以上である場合に収まりきらないと判定する。
〔フローチャートによるファイルサイズ制限処理の説明〕
図２６はファイルサイズ制限処理の流れを説明するためのフローチャートである。

図２６において、まず、ＭＭＲによる圧縮が施された文字オブジェクトＯＢＭの総データ量と予め設定されているファイル上限値とから残容量を求める（＃５０１）。

求めた残容量に基づいて目標解像度とＪＰＥＧの圧縮に用いる圧縮パラメータとを決定する（＃５０２）。決定した目標解像度および圧縮パラメータから非可逆圧縮データ量を試算し、それが残容量以下になるかどうかを判定する。すなわち、残容量以下への圧縮が可能かどうかを判定する（＃５０３）。

可能でないと判定した場合（＃５０３でＮｏ）、その旨のメッセージを操作パネル１０ｋのディスプレイＴＰに表示してユーザに通知する（＃５０４）。そして、処理を終了する。通知を確認したユーザは、ファイルサイズ上限値を設定し直してリトライする。

残容量以下への圧縮が可能であると判定した場合（＃５０３でＹｅｓ）、ステップ＃５０２で決定した目標解像度になるように非文字オブジェクトＯＢＨのオブジェクト画像を低解像度化する（＃５０５）。さらに、ステップ＃５０２で決定した圧縮パラメータを用いてＪＥＰＧによる圧縮を行う（＃５０６）。圧縮の処理が施された非文字オブジェクトの総データ量（非可逆圧縮データ量）が実際に残容量以下になったかどうかを判定する（＃５０７）。

残容量以下でない場合は（＃５０７でＮｏ）、残容量を超えた分のデータ量に基づいて目標解像度と圧縮パラメータとを再設定（調整）する（＃５０８）。そして、非可逆圧縮データ量が残容量以下となるまで、ステップ＃５０５以降の処理を繰り返す。

非可逆圧縮データ量が残容量以下となった場合に（＃５０７でＹｅｓ）、処理を終了する。

本実施形態においては、１つの文字ごとまたは１つの単語ごとに文字オブジェクトＯＢＭが生成され、その文字オブジェクトＯＢＭに対して１つの代表色が決定される。そして、原稿文字色が同じまたは近似している近傍の文字オブジェクトＯＢＭ同士が統合され、統合前の各文字オブジェクトＯＢＭの代表色に基づいて、統合後の文字オブジェクトＯＢＭの代表色が決定される。このような統合を、一旦、行単位および列単位（段落単位）に行った後、残った文字オブジェクトＯＢＭの内で所定の条件を満たす関係にあるもの同士をさらに統合する。その後、残った文字オブジェクトＯＢＭの個数が制限個数を超える場合に、代表色の最も近い文字オブジェクトＯＢＭ同士を統合する。

これによって、統合前と統合後とにおける代表色の変化を最小限に抑えることができる。

また、色段差を発生させることなく文字オブジェクトＯＢＭの個数を減らすことができ、適切にファイルサイズの低減できる。

また、本実施形態では、従来のように初めから全てのオブジェクトについて総当りで属性を比較することはせず、まず、行方向統合処理、列方向統合処理、および全体統合処理を行なう。その後、再統合処理においてそのような総当りの比較をする。文字オブジェクトＯＢＭの個数は、全体統合処理が終わった時点で相当数減少していることが多い。そのため、再統合処理での総当りの比較は、従来の総当りの比較に比べて、計算量が少なくなる。

また、本実施形態では、文字領域の画像（文字オブジェクトＯＢＭのオブジェクト画像）に対して、高解像度のまま可逆圧縮する。写真領域または図形領域などの背景領域の画像（非文字オブジェクトＯＢＨのオブジェクト画像）を低解像度化してから非可逆圧縮する。すなわち、文字領域については画質を優先し、背景領域については画質よりもデータ量の削減を優先する。これによって、圧縮性および文字の判読性を両立したＰＤＦファイルを生成できるようになる。

また、背景領域の画像を低解像度化する際の目標解像度および非可逆圧縮の際の圧縮パラメータを、可逆圧縮データ量ＤＤおよびファイルサイズ上限値に基づいて決定する。そして、背景領域の画像については、目標解像度まで低解像度化し、圧縮パラメータに基づいて非可逆圧縮する。文字領域ついては、高解像度のまま可逆圧縮する。これによって、文字領域および背景領域の画像に対して最適な解像度を保ちつつ最適な圧縮を行えるようになる。

本実施形態においては、画像処理装置１としてＭＦＰを用いる場合の例を示したが、パーソナルコンピュータまたはワークステーションなどを用いることも可能である。その場合は、パーソナルコンピュータなどにスキャナおよびプリンタを外部接続しておき、さらに、図４または図２５に示す各部の機能を実現するためのプログラムなどをインストールしておけばよい。

また、図４または図２５の各部の機能の一部をハードウェアによって実現してもよい。例えば、入力画像処理部および出力画像処理部などのハードウェアを画像処理装置１に設けておく。入力画像処理部は、スキャナ１０ａから原稿画像ＤＧを受け付け、それに対して、色変換、色補正、解像度変換、領域判別などの処理を行う。処理された後のデータは、ハードディスク１０ｃ、ＲＡＭ１０ｄ、またはＲＯＭ１０ｅなどに保持する。

保持されたデータに基づいて印刷が実行される際には、印刷装置１０ｆの印刷の処理に先立って、出力画像処理部が、スクリーン制御、スムージング処理、およびＰＷＭ制御などを行う。

その他、画像処理装置１および１Ｂの全体または各部の構成、機能、閾値、上限値、各データが示す内容、代表色、文字色差、およびオブジェクトＯＢ間の距離などの値の求め方、処理の内容または順序などは、本発明の趣旨に沿って適宜変更することができる。

本発明の一実施形態に係る画像処理装置のハードウェア構成の例を示す図である。操作パネルの例を示す図である。スキャナの設定項目を説明するための図である。画像処理装置の機能的な構成の例を示す図である。領域処理部の構成の例を示す図である。原稿画像および明度原稿画像の例を示す図である。文字色決定処理部の構成の例を示す図である。細線化画像の生成方法の例を説明するための図である。文字の線図形の中央線の位置の例を示す図である。文字の線図形の中央線およびその付近の領域を複数の文字色候補領域に分割する方法の例を説明するための図である。近似色画素選出処理の流れの例を説明するためのフローチャートである。各原色の階調の分布の例を示す図である。文字オブジェクトの統合を説明するための第１の例を示す図である。文字オブジェクトの統合を説明するための第２の例を示す図である。コンパクトＰＤＦファイルの構成の例を示す図である。統合処理部の構成を示す図である。全体統合処理を説明するための図である。再統合処理を説明するための図である。２つ文字オブジェクトを統合したと仮定した場合の統合前および統合後の文字オブジェクトの属性値を示す第１の図である。２つ文字オブジェクトを統合したと仮定した場合の統合前および統合後の文字オブジェクトの属性値を示す第２の図である。画像処理装置におけるＰＤＦファイルを生成するまでの概略の処理の流れを説明するためのフローチャートである。統合処理の流れを説明するためのフローチャートである。全体統合処理の流れを説明するためのフローチャートである。再統合処理の流れを説明するためのフローチャートである。本発明の他の実施形態に係る画像処理装置の機能的な構成の例を示す図である。ファイルサイズ制限処理の流れを説明するためのフローチャートである。

符号の説明

１、１Ｂ画像処理装置（コンピュータ、処理装置）
１４領域処理部（生成手段、判別手段）
１５統合処理部（第１の統合手段、第２の統合手段）
１６、１６Ｂ可逆圧縮部（可逆圧縮手段）
１８、１８Ｂ非可逆圧縮部（非可逆圧縮手段）
１９非文字オブジェクト処理部（決定手段）
１０３領域抽出部（生成手段）
１０９文字判定部（判別手段）
１５１行方向統合部（第１の統合手段）
１５２列方向統合部（第１の統合手段）
１５３全体統合部（第１の統合手段）
１５４第２全体統合部（第２の統合手段）
ＤＥエッジ原稿画像（入力データ）
ＤＧ、ＤＧｂ原稿画像（入力データ）
ＤＫ罫線分離済原稿画像（入力データ）
ＭＤ、ＭＤｂ、ＭＤ２、ＭＤ２ｂ明度原稿画像（入力データ）
ＯＢオブジェクト
ＯＢＨ非文字オブジェクト（オブジェクト）
ＯＢＭ文字オブジェクト（オブジェクト）

Claims

入力データから電子ファイルを生成する際の当該入力データの処理方法であって、
前記入力データに含まれる特定の領域を示すオブジェクトを生成する第１のステップと、
生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第１の条件を満たすオブジェクト同士を統合することによってそれらを１つのオブジェクトにする第１の統合処理を前記第１の条件を満たすオブジェクト全てについて実行する第２のステップと、
前記第２のステップ終了後、前記第２のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であること、を含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第１の全体統合ステップと、前記第１の全体統合ステップ終了後、前記第１の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第２の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第２の全体統合ステップとを含む、第３のステップと、
を有することを特徴とする入力データの処理方法。
前記第２の全体統合ステップにおいては、統合の後に残っているオブジェクトの個数が前記設定値以下になるように、前記第２の条件を満たすオブジェクト同士の統合を繰り返す、
請求項１記載の入力データの処理方法。
前記第２の条件は、ある組合せのオブジェクト同士を統合した場合に当該統合によってできる１つのオブジェクトの属性値と統合前の各オブジェクトの属性値との差異が他の組合せのオブジェクト同士を統合した場合の差異より小さいことである、
請求項１または２記載の入力データの処理方法。
前記属性値は、オブジェクトに含まれる文字の色についての値である、
請求項３記載の入力データの処理方法。
オブジェクトには、文字の領域に関する文字オブジェクトと文字以外の領域に関する非文字オブジェクトとがあり、
前記文字オブジェクトに対して、前記第２のステップおよび前記第３のステップの処理を行う、
請求項１ないし４のいずれかに記載の入力データの処理方法。
前記第３のステップの処理の後に残っている前記文字オブジェクトを可逆圧縮し、
前記非文字オブジェクトを非可逆圧縮する、
請求項５記載の入力データの処理方法。
前記非可逆圧縮に用いるパラメータを、前記文字オブジェクトの可逆圧縮によって生成されたデータのデータ量に基づいて決定する、
請求項６記載の入力データの処理方法。
前記第１の統合処理における前記第１の条件として、当該各オブジェクトに含まれる文字の色の差、および当該オブジェクト同士を統合した場合にできる空白の部分の大きさを示す値がそれぞれ所定の値より小であることをさらに含む、
請求項１ないし７のいずれかに記載の入力データの処理方法。
前記第１の統合処理における前記第１の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
請求項１ないし７のいずれかに記載の入力データの処理方法。
前記第２のステップにおいて、前記第１の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第１の条件として当該オブジェクト同士を統合する第２の統合処理を含む、
請求項１ないし７または９のいずれかに記載の入力データの処理方法。
入力データから電子ファイルを生成するコンピュータに、
前記入力データに含まれる特定の領域を示すオブジェクトを生成する第１のステップと、
生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第１の条件を満たすオブジェクト同士を統合することによってそれらを１つのオブジェクトにする第１の統合処理を前記第１の条件を満たすオブジェクト全てについて実行する第２のステップと、
前記第２のステップ終了後、前記第２のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であること、を含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第１の全体統合ステップと、前記第１の全体統合ステップ終了後、前記第１の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第２の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第２の全体統合ステップとを含む、第３のステップと、
を実行させることを特徴とするコンピュータプログラム。
前記第１の統合処理における前記第１の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
請求項１１記載のコンピュータプログラム。
前記第２のステップにおいて、前記第１の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第１の条件として当該オブジェクト同士を統合する第２の統合処理を含む、
請求項１１または１２記載のコンピュータプログラム。
入力データから電子ファイルを生成する処理装置であって、
前記入力データに含まれる特定の領域を示すオブジェクトを生成する生成手段と、
前記生成手段によって生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第１の条件を満たすオブジェクト同士を統合することによってそれらを１つのオブジェクトにする第１の統合処理を前記第１の条件を満たすオブジェクト全てについて実行する第１の統合手段と、
前記第１の統合手段による統合の処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であること、を含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第１の全体統合手段と、前記第１の全体統合手段による統合の処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第２の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第２の全体統合手段とを含む、第２の統合手段と、
を有することを特徴とする処理装置。
前記第１の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
請求項１４記載の処理装置。
前記第１の統合手段は、前記第１の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第１の条件として当該オブジェクト同士を統合する第２の統合処理を行う、
請求項１４または１５記載の処理装置。
入力データから電子ファイルを生成する処理装置であって、
前記入力データに含まれる特定の領域を示すオブジェクトを生成する生成手段と、
前記生成手段によって生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第１の条件を満たすオブジェクト同士を統合することによってそれらを１つのオブジェクトにする第１の統合処理を前記第１の条件を満たすオブジェクト全てについて実行する第１の統合手段と、
前記第１の統合手段による統合の処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であること、を含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第１の全体統合手段と、前記第１の全体統合手段による統合の処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第２の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第２の全体統合手段とを含む、第２の統合手段と、
前記第２の統合手段による統合の処理の後に残っている前記文字オブジェクトを可逆圧縮する可逆圧縮手段と、
前記非文字オブジェクトを非可逆圧縮する非可逆圧縮手段と、
を有することを特徴とする処理装置。
前記非文字オブジェクトを非可逆圧縮する際のパラメータを、前記可逆圧縮手段の可逆圧縮によって生成したデータのデータ量に基づいて決定する決定手段を有し、
前記非可逆圧縮手段は、前記パラメータに基づいて非可逆圧縮を行う、
請求項１７記載の処理装置。
前記第１の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
請求項１７または１８記載の処理装置。
前記第１の統合手段は、前記第１の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第１の条件として当該オブジェクト同士を統合する第２の統合処理を行う、
請求項１７ないし１９のいずれかに記載の処理装置。