JP4333708B2 - 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム - Google Patents

電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム Download PDF

Info

Publication number
JP4333708B2
JP4333708B2 JP2006211157A JP2006211157A JP4333708B2 JP 4333708 B2 JP4333708 B2 JP 4333708B2 JP 2006211157 A JP2006211157 A JP 2006211157A JP 2006211157 A JP2006211157 A JP 2006211157A JP 4333708 B2 JP4333708 B2 JP 4333708B2
Authority
JP
Japan
Prior art keywords
objects
integration
character
processing
obm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006211157A
Other languages
English (en)
Other versions
JP2008042325A (ja
Inventor
俊浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2006211157A priority Critical patent/JP4333708B2/ja
Priority to US11/882,428 priority patent/US7884977B2/en
Publication of JP2008042325A publication Critical patent/JP2008042325A/ja
Application granted granted Critical
Publication of JP4333708B2 publication Critical patent/JP4333708B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Description

本発明は、電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラムに関する。
近年、MFP(Multi Function Peripherals)などの複合機は、白黒の画像に対応した処理を行なうものからカラーの画像に対応した処理を行なうもの(カラー対応のMFP)へ移行しつつある。
このようなカラー対応のMFPにおいて、スキャナで読み取った(スキャンした)原稿の画像データを電子メールに添付してそこから直接送信する機能が一般に普及している。
しかしながら、A4サイズの原稿を300dpiのフルカラーの画像データとしてスキャンすると、そのデータ量は、25MB程度となり電子メールでの送信には適さない。
そのため、スキャンした原稿の画像データを圧縮して送信するのが一般的である。しかし、データ量を小さくするために高い圧縮率で圧縮すると文字の部分がつぶれて読めなくなることがある。それを避けるために圧縮率を下げる必要があるが、そうすると、データ量を十分に小さくできない。
そこで、従来、高圧縮PDFという機能が用いられている。この機能では、画像データ全体に対して同じ圧縮方法を適用するのではなく、処理する領域によって別の圧縮方法を適用する。それによって文字の判読性を維持しつつデータ量(ファイルサイズ)の小さなPDFのファイルを生成する。
具体的には、MFP等でスキャンした原稿の画像データから所定のルールに従って単語または行の単位の領域(オブジェクト)を抽出し、その領域が文字を含む文字領域(文字オブジェクト)であるか文字を含まない非文字領域(非文字オブジェクト)であるかを判別する。
全ての文字オブジェクトについて、文字オブジェクトに含まれる文字の色などに関する代表色を1つ設定する。そして、代表色が近似している文字オブジェクト同士を統合して1つの文字オブジェクトにまとめる。または、文字オブジェクト同士の距離または統合した場合に発生する不要な空白の画素の増加具合などに基づいて統合する。
さらに、文字オブジェクトに対応する部分の画像データを、高い解像度を保ったままで二値化する。非文字オブジェクトについては、階調性を保つために二値化を行わずに低解像度化した後、高い圧縮率で圧縮(高圧縮)する。
また、その他、ファイルサイズの低減を図るために、次のような方法も用いられている。
色空間をあらかじめ所定数のブロックに分割しておき、各文字オブジェクトを色の近いブロックに割り振る。これによって、オブジェクトの個数を所定数以内に制限し、ファイルサイズの増加を抑える。
また、特許文献1および2で提案される方法を用いて画像データの中で使用される色数を減らすことによって、ファイルサイズを低減することも可能である。
特許文献1の方法では、色変換情報を格納するルックアップテーブルを用いて、入力画像を構成する各画素の色を限定色のいずれかに割り当てることによって減色の処理を行う。
特許文献2の方法では、多数色の入力画像データについて、RGBデータから各色の割合を算出し、目的の少ない色数に応じたグループに分けると共に代表色を決定する。代表色が複数ある色の領域を未確定領域とし、未確定領域のエッジ部分または中央部分における色と周辺の色の差などから未確定領域が図柄か否かを推論し、図柄なら周囲と異なる色、図柄でないなら周囲と同一の色に決定する。
特開平10−74248 特開平6−175633
上述のように、従来の方法では、オブジェクトの代表色、距離、および統合によって発生する不要な空白の画素の増加具合に応じてオブジェクトを統合する。そして、その後に残ったオブジェクトを用いてファイルを生成する。このような方法では、統合の後に残るオブジェクトの個数が原稿の種類などに依存するため、オブジェクトの個数を十分に減らすことができない場合がある。そうすると、ファイルサイズが大きくなってしまう。
また、従来の方法においては、オブジェクトの統合に際して、代表色などの属性を全てのオブジェクトについて総当りで比較する。そのため、オブジェクトの個数が膨大であった場合には、その比較の処理に多大な時間を要してしまう。
また、文字オブジェクトに対応する画像データを高解像度に保ち、非文字オブジェクトを高圧縮する方法では、スキャンした原稿の画像データから文字の部分が正確に抽出されなければならない。すなわち、文字を含む領域が正確に文字領域と判別されなければならない。もし、誤って判別されると、その領域の画像データは、低解像度化された後に高い圧縮率で圧縮されるため、その領域の文字が読めなくなってしまうことがある。現実には完全な判別は困難であるため、文字が読めなくなるおそれがある。
色空間をあらかじめ所定数のブロックに分割しておく方法では、ブロックの境界付近にまたがる色の文字で構成されるオブジェクトにおいて、文字の色がブロックの一方と他方とに分かれてしまい、色段差が発生することがある。
特許文献1の方法では、画素ごとに、限定色を割り当てることによって減色処理を実現する。この方法においても、ある限定色が割り当てられた画素群と別の限定色が割り当てられた画素群との境界付近において色段差が発生する。特許文献2の方法を用いたとしても、同様の理由で色段差が発生する。
本発明は、このような問題点に鑑み、色段差の発生を抑えつつ文字の判読性を維持しながらファイルサイズを大幅に低減できるようにすることを目的とする。
本願の一請求項に係る入力データの処理方法は、入力データから電子ファイルを生成する際の当該入力データの処理方法であって、前記入力データに含まれる特定の領域を示すオブジェクトを生成する第1のステップと、生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第1の条件を満たすオブジェクト同士を統合することによってそれらを1つのオブジェクトにする第1の統合処理を前記第1の条件を満たすオブジェクト全てについて実行する第2のステップと、前記第2のステップ終了後、前記第2のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であることを含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第1の全体統合ステップと、前記第1の全体統合ステップ終了後、前記第1の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第2の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第2の全体統合ステップとを含む、第3のステップと、を有する。
好ましくは、前記第3のステップにおいて、統合の後に残っているオブジェクトの個数が前記設定値以下になるように、前記第2の条件を満たすオブジェクト同士の統合を繰り返す。
好ましくは、オブジェクトには、文字の領域に関する文字オブジェクトと文字以外の領域に関する非文字オブジェクトとがあり、前記文字オブジェクトに対して、前記第2のステップおよび前記第3のステップの処理を行う。
好ましくは、前記第3のステップの処理の後に残っている前記文字オブジェクトを可逆圧縮し、前記非文字オブジェクトを非可逆圧縮する。
好ましくは、前記非可逆圧縮に用いるパラメータを、前記文字オブジェクトの可逆圧縮によって生成されたデータのデータ量に基づいて決定する。
本願の他の請求項に係るコンピュータプログラムは、入力データから電子ファイルを生成するコンピュータに、前記入力データに含まれる特定の領域を示すオブジェクトを生成する第1のステップと、生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第1の条件を満たすオブジェクト同士を統合することによってそれらを1つのオブジェクトにする第1の統合処理を前記第1の条件を満たすオブジェクト全てについて実行する第2のステップと、前記第2のステップ終了後、前記第2のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であることを含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第1の全体統合ステップと、前記第1の全体統合ステップ終了後、前記第1の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第2の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第2の全体統合ステップとを含む、第3のステップと、を実行させることを特徴とする。
本願のさらに他の請求項に係る処理装置は、入力データから電子ファイルを生成する処理装置であって、前記入力データに含まれる特定の領域を示すオブジェクトを生成する生成手段と、前記生成手段によって生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第1の条件を満たすオブジェクト同士を統合することによってそれらを1つのオブジェクトにする第1の統合処理を前記第1の条件を満たすオブジェクト全てについて実行する第1の統合手段と、前記第1の統合手段による統合の処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であることを含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第1の全体統合手段と、前記第1の全体統合手段による統合の処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第2の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第2の全体統合手段とを含む、第2の統合手段と、前記第2の統合手段による統合の処理の後に残っている前記文字オブジェクトを可逆圧縮する可逆圧縮手段と、前記非文字オブジェクトを非可逆圧縮する非可逆圧縮手段と、を有する
好ましくは、前記処理装置に、画像入力装置によって入力された入力画像に表れる文字の線図形の中央線またはその付近の領域である中央領域を検出する中央領域検出手段と、複数の画素からなる複数の小領域を前記中央領域から抽出する小領域抽出手段と、前記小領域ごとに、当該小領域に属する画素の中から所定の条件に合う画素を条件合致画素として検出する条件合致画素検出手段と、前記入力画像に表れる文字の色を前記各小領域の前記条件合致画素の色情報に基づいて判別する色判別手段と、を設けておく。
なお、前記第1の条件は、オブジェクト同士の距離、当該各オブジェクトに含まれる文字の色の差、および当該オブジェクト同士を統合した場合にできる空白の部分の大きさを示す値がそれぞれ所定の値よりも小さいことである。
前記第2の条件は、ある組合せのオブジェクト同士を統合した場合に当該統合によってできる1つのオブジェクトの属性値と統合前の各オブジェクトの属性値との差異が他の組合せのオブジェクト同士を統合した場合の差異より小さいことである。
前記属性値は、オブジェクトに含まれる文字の色についての値である。
スキャンした原稿の画像データに基づいて電子ファイルを生成する場合に、色段差の発生を抑えつつ文字の判読性を維持しながらファイルサイズを大幅に低減できる。
〔画像処理装置のハードウェア構成〕
図1は本発明の一実施形態に係る画像処理装置1のハードウェア構成の例を示す図、図2は操作パネル10kの例を示す図、図3はスキャナ10aの設定項目を説明するための図である。
本実施形態において、画像処理装置1は、スキャナで読み取った原稿の画像をPDFなどの形式の電子ファイルに変換して保存する。また、保存した電子ファイルを電子メールに添付して送信しまたはその電子ファイルに基づいて印刷の処理を行う。以下、画像処理装置1としてカラー対応のMFP(Multi Function Peripherals)を用いる場合を例にあげて説明する。
図1に示すように、画像処理装置1は、スキャナ10a、CPU10b、ハードディスク10c、RAM10d、ROM10e、印刷装置10f、通信インタフェース10g、制御用回路10h、および操作パネル10kなどによって構成される。
スキャナ10aは、原稿の用紙に描かれている写真、文字、絵、または図表などを光学的に読み取って画像データ(イメージデータ)を生成し出力するための装置である。
CPU10bは、スキャナ10aが読み取った原稿の画像データをTIFF、JPEG、ビットマップ、およびPDFなどの形式のファイルに変換するための処理を行う。また、ユーザからの入力の検出、操作パネル10kの表示の制御,または電子メールの作成など、画像処理装置1の全体的な制御を行う。
ハードディスク10cには、後に説明する図4に示すような各部の機能を実現するためのプログラムおよびデータがインストールされている。これらのプログラムおよびデータは必要に応じてRAM10dに読み出される。そして、CPU10bによってプログラムが実行される。これらのプログラムおよびデータの一部または全部を、ROM10eに記憶させておいてもよい。または、その機能の一部または全部を、制御用回路10hによって実現するようにしてもよい。
印刷装置10fは、スキャナ10aによって得られた画像データまたは他の装置から送信されてきた画像データに基づいて、用紙に画像を印刷する装置である。印刷の際には、イエロー、マゼンタ、シアン、およびブラックの4色のトナーが用いられる。
通信インタフェース(ネットワークインタフェース)10gは、他の装置と通信を行うためのインタフェースである。通信インタフェース10gとして、NIC(Network Interface Card)、モデム、またはNCU(Network Control Unit)などが用いられる。なお、通信インタフェース10gは、電子メールの送信、電話回線へのデータの送受信、ファクシミリ(FAX)などにおける通信のプロトコルに関する処理、およびFAXの送受信の際の変復調などを行う。
制御用回路10hは、スキャナ10a、ハードディスク10c、印刷装置10f、通信インタフェース10g、および操作パネル10kなどの装置を制御するための回路である。
操作パネル10kは、ユーザが画像処理装置1に各種の設定をしたり印刷などの指令を与えたりするための入力装置(インターフェース)である。
図2に示すように、操作パネル10kには、スタートボタンBT1、ストップボタンBT2、テンキーBT3、コピーボタンBT4、スキャンボタンBT5、およびディスプレイTPが設けられている。
図2において、ディスプレイTPは、タッチパネル式の液晶ディスプレイであり、ユーザが各種の設定を行うための画面またはユーザに対するメッセージなどを表示する。
ユーザは、例えば、ここに表示された画面を操作してスキャンの設定に関する項目(スキャン設定項目)を選択しそれについての設定を行う。また、画像ファイルのフォーマットを選択しまたは電子メールおよびFAXの宛先などを入力する。
スタートボタンBT1は、コピーまたはスキャンなど、各種の処理を開始するためのボタンである。
ストップボタンBT2は、実行中の処理を中断するためのボタンである。
テンキーBT3は、コピーの枚数またはFAXの宛先などを入力するためのボタンである。
コピーボタンBT4は、コピーについての設定を開始するためのボタンである。このボタンが押されると、コピーの設定を行うための画面がディスプレイTPに表示される。
スキャンボタンBT5は、スキャナ10aによる読み取り(スキャン)の設定を開始するためのボタンである。ユーザがこのボタンを押すと、ディスプレイTPに、図2に示されるような設定画面FRが表示される。
設定画面FRには、スキャン設定項目に対応するタブTA1、TA2、TA3、画面ボタンCM10、CM20、CM30、およびCM40が含まれている。以下、タブTA1、TA2、およびTA3をまとめて「タブTA」と記載し、画面ボタンCM10、CM20、CM30、およびCM40をまとめて「画面ボタンCM」と記載することがある。他の符号についても同様に、符号に付した連番などを省略して記載することがある。
図3に示すように、本実施形態におけるスキャン設定項目は、4段階の階層構造となっている。図2の例では、タブTA1、TA2、およびTA3が、それぞれ、図3における第1階層のスキャン設定項目M1、M2、およびM3に対応している。さらに、画面ボタンCM10、CM20、CM30、およびCM40が、それぞれ、第2階層のスキャン設定項目M10、M20、M30、およびM40に対応している。
図2の設定画面FRにおいて、画面ボタンCMが選択されると、それらに対応するスキャン設定項目Mの下位のスキャン設定項目Mが設定画面FRに表示される。
スキャンの設定に際して、ユーザは、設定画面FRを用いて順番に階層をたどっていき、設定を行いたい第4階層目のスキャン設定項目M(M111〜M113、M121〜M124、またはM131〜M132)を表示させる。そして、テンキーBT3などを用いてそのスキャン設定項目Mのパラメータなどを設定する。
ところで、近年、MFPは、白黒対応のものからカラー対応のものに移行しつつある。また、スキャンした原稿の画像データを電子メールに添付してMFPから直接送信するという用途で使用されることがある。そのような状況において、送付する原稿の種類または枚数などに応じて必要な要件が変わることから、MFPを使用するユーザのニーズも以下のように様々に変化する。
・送付する原稿の枚数が多いので、文字が読める範囲で、できる限り小さいサイズのファイルを生成したい。
・文字の色が変わると原稿の意味が変わるので、できる限り正確に文字の色を再現したい。
・印刷の速度をあまり低下させずに、できるだけ小さなサイズのファイルを生成したい。
・OCR(Optical Character Reader)の処理が目的なので、文字が読めれば良い。
・文字だけでなくその背景も高解像度を保ちたい。
上記のようなニーズを満たす為には、原稿の種類または枚数などに応じて、ユーザがMFPの設定を変更できることが望ましい。変更する項目としては下記のようなものがあげられる。
(a)スキャンの解像度(領域判別解像度)
(b)背景レイヤの解像度
(c)背景レイヤの圧縮強度
(d)背景レイヤの有無
(e)文字レイヤの解像度
(f)文字レイヤの文字色の個数の制限
(g)文字の統合レベル
以下、本実施形態においては、特に上記の(f)に関する処理について詳しく説明する。
〔画像処理装置の機能的な構成〕
図4は画像処理装置1の機能的な構成の例を示す図、図5は領域処理部14の構成の例を示す図、図6は原稿画像DGおよび明度原稿画像DMの例を示す図、図7は文字色決定処理部114の構成の例を示す図、図8は細線化画像GSの生成方法の例を説明するための図、図9は文字の線図形の中央線の位置の例を示す図、図10は文字の線図形の中央線およびその付近の領域を複数の文字色候補領域RCに分割する方法の例を説明するための図、図11は近似色画素選出処理の流れの例を説明するためのフローチャート、図12は各原色の階調の分布の例を示す図、図13は文字オブジェクトOBMの統合を説明するための第1の例を示す図、図14は文字オブジェクトOBMの統合を説明するための第2の例を示す図、図15はコンパクトPDFファイルの構成の例を示す図である。次に、図4などを参照して画像処理装置1の各部の処理について説明する。
図4に示すように、画像処理装置1は、ファイル保存部11、画像データ取得部12、前処理部13、領域処理部14、統合処理部15、可逆圧縮部16、低解像度化部17、非可逆圧縮部18、およびファイル生成部19などから構成される。
ファイル保存部11は、ファイル生成部19によって生成されるPDFなどの形式の電子ファイルを保存する。
画像データ取得部12は、スキャナ10aが読み取った原稿の画像データである原稿画像データDGを取得する。この原稿画像データDGは、TIFF、JPEG、またはビットマップなどの形式でスキャナ10aから出力される。なお、以下において、「画像データ」および「原稿画像データ」の「データ」を省略し、それぞれ、単に「画像」および「原稿画像」と記載することがある。後に説明するその他の画像データについても同様である。
前処理部13は、次に説明する領域処理部14の処理のための前処理を行う。具体的には、原稿画像DGの形式の変換、解像度の変換、および下地除去などの処理を行う。
領域処理部14は、前処理部13によって前処理が施された原稿画像DGbから特定の領域を抽出し、その領域に含まれる画像の属性に基づいて、その領域が、図形に関する図形領域、写真に関する写真領域、表に関する表領域、下地のみの下地領域、または文字に関する文字領域(テキスト領域)のいずれであるかを判別するための処理(領域判別処理)を行う。
さらに、その判別の結果に基づいて、その領域の中に文字が含まれるかどうかを判定し(文字判定処理)、文字が含まれる領域の画像を二値化しその文字の色を判別するための処理(二値化・文字色判別処理)を行う。ここで、領域処理部14における領域判別処理(図・写真・下地判定処理)、文字判定処理、および二値化・文字色判別処理のそれぞれについて図5を参照してさらに詳しく説明する。
図5に示すように、領域処理部14は、明度画像生成部101、スムージング部102、領域抽出部103、領域判別部104、明度画像生成部105、スムージング部106、エッジ抽出部107、罫線分離部108、文字判定部109、文字オブジェクト生成部110、非文字オブジェクト生成部111、網点除去部112、二値化部113、および文字色判別処理部114などから構成される。
ここにおいて、明度画像生成部101、スムージンング部102、領域抽出部103、および領域判別部104の処理が、先に述べた「領域判別処理」に対応する。また、明度画像生成部105、スムージング部106、エッジ抽出部107、罫線分離部108、文字判定部109、文字オブジェクト生成部110、および非文字オブジェクト生成部111の処理が、「文字判定処理」に対応する。さらに、網点除去部112、二値化部113、および文字色判別処理部114の処理が、「二値化・文字色判別処理」に対応する。
図5において、明度画像生成部101は、原稿画像DGbから明度を算出し、明度で表される画像(明度画像)を生成する。これによって、図6に示すような、元の原稿画像DGに対応した明度画像である明度原稿画像DMが生成される。なお、「元の原稿画像DGに対応した明度画像」とは、この図6の例ように、元の原稿画像DGと同じ広さの領域に元の原稿画像DGに対応した内容を表す明度画像のことである。
なお、本実施形態では、R(赤)、G(緑)、およびB(青)の各原色(以下、「RGB」と記載する。)による24ビットの階調性を有するフルカラーの原稿画像DGbから8ビットの階調性を有する明度原稿画像DMを生成する。
また、本実施形態では、領域判別処理における判別の精度および演算の負荷などの点を考慮して、主に明度画像を領域処理部14での処理の対象としている。
スムージンング部102は、明度画像生成部101によって生成された明度原稿画像DMに対してスムージングを行う。スムージングによってノイズが除去されることにより領域判別処理における情報の誤検出が低減される。
領域抽出部(領域分離手段)103は、スムージングが施された明度原稿画像DMbを二値化した後、そこから文字、写真、または図形などを形成する連続する白以外の画素を検出し、その連続する画素の画素群を包含する矩形領域(ブロック)を抽出(検出)する。または、互いに所定の距離にある画素群同士を一つの画素群とみなして、それを包含する(囲む)矩形領域を抽出する。これによって、図6において一点鎖線で示されるような、1つの文字、単語、図形、または写真ごとの矩形領域が抽出される。
さらに、抽出した矩形領域に対してラベリングを行うことによって矩形領域の位置(以下、「ブロック位置」と記載することがある。)を取得する。なお、二値化およびラベリング処理を行うのは、次に説明する領域判別部104が、文字、図形、または写真の連続した矩形領域ごとに処理し判別を行うからである。
そして、矩形領域の大きさ(以下、「ブロックサイズ」と記載することがある。)およびブロック位置など、その矩形領域についての情報を示すオブジェクトデータ(オブジェクト)を生成する。以下、このオブジェクトを「オブジェクトOB」と記載することがある。また、オブジェクトOBの符号に連番を付して、「オブジェクトOB1」、「オブジェクトOB2」、…などと区別して記載することもある。他の符号についても同様に、符号の後に連番を付して記載することがある。また、矩形領域を図示する場合に、その矩形領域を、それに対応するオブジェクトOBで表すことがある。
本実施形態においては、文字オブジェクトOBのブロック位置は、明度原稿画像DMの左上端を原点とした場合の、その矩形領域内の左上画素の明度原稿画像DM内における座標によって示される。ブロックサイズは、矩形領域の縦方向の画素数および横方向の画素数によって示される。
以上の処理によって、図6に示すような矩形領域についてのオブジェクトOB1、OB2、…、OB7が取得される。
領域判別部104は、明度原稿画像DMにおいてオブジェクトOBの矩形領域に対応する部分を抽出し、その部分に示される明度画像の特徴(特性)に応じて、その矩形領域が、図形領域、写真領域、表領域、下地領域、または文字領域のいずれであるかを判別する。すなわち、その矩形領域を上記のいずれかに分類する。そして、判別の結果を示すデータをその判別の対象となったオブジェクトOBに付加する。
図6において、例えば、オブジェクトOB5として示されるような矩形領域が図形領域である。オブジェクトOB7として示されるような矩形領域が写真領域である。オブジェクトOB1、OB2、OB3、OB4、およびOB6として示されるような矩形領域が文字領域である。また、下地のみの矩形領域がある場合は、それが下地領域となる。
以下、図形領域、写真領域、表領域、および下地領域をまとめて「背景領域」と記載することがある。
明度画像生成部105は、原稿画像DGbから明度を算出し、明度原稿画像DM2を生成する。
スムージンング部106は、明度原稿画像DM2に対してスムージングを行なう。
なお、明度画像生成部105およびスムージンング部106では、それぞれの処理において、後の文字判定部109の処理を考慮した適切なパラメータが用いられる。
エッジ抽出部107は、スムージンング部106によってスムージングが施された明度原稿画像DM2bからエッジ部分を抽出し、そのエッジ部分によって示される画像であるエッジ画像を生成する。明度の高い領域の文字または反転文字などを検出するために、ここでは、二値化せずにエッジ部分の抽出を行う。これによって、元の原稿画像DGに対応したエッジ画像であるエッジ原稿画像DEが生成される。
罫線分離部108は、エッジ原稿画像DE全体に対して、文字と罫線とを分離する処理を行い、罫線分離済画像を生成する。これによって、元の原稿画像DGに対応した罫線分離済画像である罫線分離済原稿画像DKが生成される。文字と罫線とを分離することで、文字判定処理における判定の精度を上げることができる。
文字判定部109は、オブジェクトOBに文字が含まれるかどうか、すなわち罫線分離済原稿画像DKのうちでオブジェクトOBに対応する部分の罫線分離済画像に文字が表されているかどうかを、オブジェクトOBごとに判定する。
例えば、図6のオブジェクトOB1の場合、元の原稿画像DGのうちでオブジェクトOB1に対応する部分の画像には、「社」という文字が表されているので、文字が含まれると判定される。また、文字判定部109は、写真領域などにさらに文字が含まれている場合にも、その文字の判定を行う。
なお、領域判別部104においてオブジェクトOBの矩形領域が文字領域と判別されたかまたはその他の領域と判別されたかによって文字判定部109での判定の方法が異なる。
文字オブジェクト生成部110は、文字が表されていると判定されたオブジェクトOBの矩形領域についてのオブジェクトデータである文字オブジェクトOBMを生成するための処理を以下のようにして行う。
文字が表されていると判定されたオブジェクトOBから、そのオブジェクトOBのブロック位置、およびブロックサイズを取得する。さらに罫線分離済原稿画像DKのうちでそのオブジェクトOBに対応する部分の罫線分離済画像を取得する。そして、取得した罫線分離済画像、ブロック位置、およびブロックサイズを示す文字オブジェクトOBMを生成する。
非文字オブジェクト生成部111は、文字が表されていると判定されなかったオブジェクトOBの矩形領域についてのオブジェクトデータである非文字オブジェクトOBHを生成するための処理を以下のようにして行う。
文字が表されていると判定されなかったオブジェクトOBから、そのオブジェクトOBのブロック位置、およびブロックサイズを取得する。さらに原稿画像DGのうちでそのオブジェクトOBに対応する部分の画像(フルカラー画像)を取得する。そして、取得したフルカラー画像、ブロック位置、およびブロックサイズを示す非文字オブジェクトOBHを生成する。
なお、非文字オブジェクトOBHの生成に、原稿画像DGではなく、原稿画像DGbまたは明度画像DMを用いるようにしてもよい。すなわち、原稿画像DGbまたは明度画像DMのうちでそのオブジェクトOBに対応する部分の画像を取得し、取得したブロック位置、ブロックサイズ、およびその画像を示す非文字オブジェクトOBHを生成するようにしてもよい。
以下、文字オブジェクトOBMおよび非文字オブジェクトOBHに示される罫線分離済画像またはフルカラー画像などの画像を総称して「オブジェクト画像」と記載することがある。
網点除去部112は、各文字オブジェクトOBMのオブジェクト画像(罫線分離済画像)に対して網点除去の処理を行う。
二値化部113は、網点除去が施された文字オブジェクトOBMのオブジェクト画像を二値化する。これによって、オブジェクト画像に含まれる文字の部分と背景の部分とが分離される。以下、網点除去および二値化が施されたオブジェクト画像のことを、特に、「オブジェクト二値画像GN」と記載することがある。
この二値化に先立って網点除去を行なうことで、文字の背景の部分の網点を二値化することによるノイズ(ゴミ)の発生を低減できる。また、二値化によって文字オブジェクトOBMのデータ量を削減することできる。
文字色判別処理部114は、図7に示すように、低解像度画像生成部301、細線化画像生成部302、文字画像分割部303、近似色画素選出部304、文字色成分取得部305、文字色決定部306、および文字色情報付加部307などによって構成され、原稿に描かれていた文字色(以下、「原稿文字色」と記載する。)を判別する。本実施形態では、文字オブジェクトOBMごとに原稿文字色を判別し、その文字オブジェクトOBMについての1つの原稿文字色である代表色を決定する。ここで、原稿文字色を判別する処理の内容について、図8に示すような「255255」という文字群についての文字オブジェクトOBMxが処理対象である場合を例に説明する。
図8(a)は、原稿画像DGのうちで文字オブジェクトOBMxに対応する部分の画像(以下、「ブロック原稿画像DGBx」と記載する。)を示している。図8(b)は、明度原稿画像DMのうちで文字オブジェクトOBMxに対応する部分の画像(以下、「ブロック明度画像DMBx」と記載する。)を示している。図8(c)は、文字オブジェクトOBMxが示すオブジェクト二値画像GNxを示している。
図7の低解像度画像生成部301は、文字オブジェクトOBMxのオブジェクト二値画像GNxの解像度を落とすことによって図8(d)に示すような低解像度画像GTxを生成する。本実施形態では、ブロック原稿画像DGBx、ブロック明度画像DMBx、およびオブジェクト二値画像GNxの解像度が300dpiであるものとし、低解像度画像生成部301は75dpiの低解像度画像GTxを生成するものとする。
細線化画像生成部302は、低解像度画像GTxに対して公知の細線化処理を施すことによって、図8(e)のような細線化画像GSxを生成する。すなわち、低解像度画像GTxに表れている太さ1ピクセル(画素)以上の線図形から中央線を検出することによって低解像度画像GTxを生成する。例えば「2」という文字の線図形からは、図9に示すような中央線が検出される。本実施形態では、太さ1ピクセル(画素)の細線を表わす細線化画像GSxを生成する。なお、細線化画像GSxの解像度は、低解像度画像GTxの解像度と同じであり、75dpiである。細線化画像生成部302の処理によって、文字の線図形の中央線およびその付近に位置する画素群(領域)を見つけることができる。
文字画像分割部303は、細線化画像GSxに基づいて、ブロック原稿画像DGBxに表されている(含まれている)文字の線図形の中央線およびその付近を複数の文字色候補領域RC(図10参照)に分割する。文字色候補領域RCに分割する処理は、例えば次のような方法で行う。
細線化画像GSxの細線上の1つの画素は、ブロック原稿画像DGBxの中の文字を構成するうちの複数個の画素に相当する。つまり、例えば図10(a)において円形の点線枠で示す細線化画像GSxの中の細線上の1つの画素PXは、図10(b)において矩形の点線枠で示す元のブロック原稿画像DGBxの文字の線上の複数個の画素に相当する。文字画像分割部303は、これらの画素の塊を文字色候補領域RCとして抽出する。本実施形態では、細線化画像GSxおよびブロック原稿画像DGBxのそれぞれの解像度の関係から、図10(c)に示すように、4×4画素の文字色候補領域RCが抽出される。同様に、細線上の他の画素に対応する画素の塊を抽出することによって、ブロック原稿画像DGBxの文字の線図形の中央線およびその付近を複数の文字色候補領域RCに分割することができる。文字画像分割部303の処理によって複数の文字色候補領域RCが抽出される。
近似色画素選出部304は、文字画像分割部303によって得られた各文字色候補領域RCの中から、原稿文字色に最も近い色を表わしていると考えられる画素(以下、「近似色画素PK」と記載する。)を、図11に示すような手順で選出する。
1つの文字色候補領域RCに注目し、その文字色候補領域RCを構成する4×4個の画素のうち上下左右の端に位置する画素(例えば、図10(c)において太線枠の外側に位置する12個の画素)を候補から除外する(図11の#12)。これらの画素は、太線枠の内側に位置する画素よりも文字背景画像に近いので、色滲みが発生している可能性が高く信頼性が低いからである。
除外されずに残った画素つまり図10(c)において太線枠の内側に位置する2×2個の画素のそれぞれの明度を算出する。そして、明度が最も低い画素(つまり、濃度が最も高い画素)を、原稿文字色に最も近い色を表わしている画素つまり近似色画素PKとして選出する(#13)。
他の文字色候補領域RCについても同様にステップ#12、#13の処理を実行し、近似色画素PKを選出する。
以上の処理によって、1つの文字オブジェクトOBMxについて多数の近似色画素PKが選出される。具体的には、その文字オブジェクトOBMxの細線化画像GSx(図8(e)参照)の細線を構成する画素の個数分の近似色画素PKが選出される。
図7の文字色成分取得部305は、近似色画素選出部304によって選出された各近似色画素PKについて、文字オブジェクトOBMxのオブジェクト画像に表されている文字(文字オブジェクトOBMxに含まれる文字)についてのその近似色画素PKの、RGBの各原色の階調の値である画素値(濃度値)を取得する。係る画素値は、元の原稿画像DGのうちの文字オブジェクトOBMxに対応する部分を検索し、その文字オブジェクトOBMxの中のその近似色画素PKの位置の画素値を参照することによって取得することができる。取得した各原色の階調の値は、例えば、図12に示すヒストグラムのような分布になる。
文字色決定部306は、文字色成分取得部305によって取得された各原色の階調の値の分布に基づいて、文字オブジェクトOBMxに含まれる文字の色を、例えば次のような方法で決定する。
文字色成分取得部305によって取得された各原色の階調の値の分布のそれぞれについて、ピークの値を求める。これは、公知の方法によって求められる。例えば、最も個数の多い画素値をピークの値として選出してもよいし、公知の演算方法によって求めてもよい。このようにして求められたR、G、Bそれぞれのピークの値によって再現される色を、文字オブジェクトOBMxに含まれる文字の色に決定する。そして、これを、文字オブジェクトOBMxに含まれる文字の色であると判別する。
これによって、文字オブジェクトOBMxの代表色が決定する。
文字色情報付加部307は、文字色決定部306が決定した代表色を示すデータを、その文字オブジェクトOBMxに付加する。すなわち、この時点で文字オブジェクトOBMxには、オブジェクト二値画像GN、ブロック位置、およびブロックサイズを示すデータとともに、代表色を示すデータが含まれることになる。
図4に戻って、統合処理部15は、領域処理部14から文字オブジェクトOBMを取得し、取得した文字オブジェクトOBMのうちで所定の条件を満たす関係にあるもの同士を統合して一つの文字オブジェクトOBMにする処理を行う。これによって文字オブジェクトOBMの個数を減少させる。
ここで、図13および図14を参照して、文字オブジェクトOBMの統合について説明する。なお、ここでは、「あ」、「い」、「う」、「え」、および「お」などの文字についての文字オブジェクトOBMを例にあげて説明する。
図13には、水平方向(行方向)に並ぶ文字オブジェクトOBM1、OBM2、OBM3、OBM4、およびOBM5が示されている。図13において、オブジェクトOBM1、OBM2、…のブロック位置は、原稿画像DGの左上端を原点とし画素の水平方向の座標をX座標とし画素の垂直方向の座標をY座標した場合に、それぞれ、(x,y)、(x,y)、…と表される。また、ブロックサイズは、縦の長さと横の長さを「(縦の長さ,横の長さ)」と表記した場合に、それぞれ、(a,b)、(a,b)、…と表される。
まず、統合処理部15が文字オブジェクトOBM1と文字オブジェクトOBM2とを統合する場合について考える。
統合処理部15は、文字オブジェクトOBM1のブロック位置(x1,y1)、文字オブジェクトOBM2のブロック位置(x2,y2)、文字オブジェクトOBM1のブロックサイズ(a1,b1)、および文字オブジェクトOBM2のブロックサイズ(a2,b2)に基づいて、文字オブジェクトOBM1と文字オブジェクトOBM2とを包含する矩形領域のブロック位置(x1,y1)およびブロックサイズ(a1,b6)を求める。
これによって、図13(b)に示すような、文字の「あ」および「い」を包含する矩形領域が定義される。
さらに、文字オブジェクトOBM1およびOBM2に示される代表色の平均値を加重平均によって求める。この平均値の求め方については、後に詳しく説明する。
そして、定義された矩形領域の画像、ブロック座標(a,b)、ブロックサイズ(a,b)、および求めた平均値を示す文字オブジェクトOBM6を生成する。すなわち、文字オブジェクトOBM1および文字オブジェクトOBM2のそれぞれに含まれるオブジェクト二値画像GNを統合し、ブロック位置、ブロックサイズ、および代表色を示すデータを統合することによって新たな文字オブジェクトOBM6を生成する。
これによって、文字オブジェクトOBMの個数が1個減り、図13(b)に示すように、文字オブジェクトOBM6、OBM3、OBM4、およびOBM5の4個が残る。
この後、統合処理部15は、残ったものの中で所定の条件を満たす関係にある2つの文字オブジェクトOBMがある場合、それら対してさらに統合の処理を行う。例えば、次に、文字オブジェクトOBM3と文字オブジェクトOBM4との関係が所定の条件を満たす場合、これらを統合して新たな文字オブジェクトOBM7を生成する。
そうすると、図13(c)に示すように、文字オブジェクトOBM5、OBM6、およびOBM7が残る。さらに、文字オブジェクトOBM6と文字オブジェクトOBM7とを統合したとすると、図13(d)に示すように、文字オブジェクトOBM5およびOBM8が残る。
このように、統合処理部15は、統合の後に残った文字オブジェクトOBMに対してさらに統合の処理を繰り返し、文字オブジェクトOBMの個数を減らしていく。
図13においては、文字オブジェクトOBMが水平方向に配置されている場合を示した。それに対して図14では、垂直方向(列方向)にも配置されている場合の例を示す。
図14(a)には、文字オブジェクトOBM10、OBM11、OBM12、OBM13、OBM14、OBM15、およびOBM16が示されている。
ここで、文字オブジェクトOBM10と文字オブジェクトOBM13とを統合した後、文字オブジェクトOBM14と文字オブジェクトOBM16とを統合した場合、その後には、図14(b)のように文字オブジェクトOBM11、OBM12、OBM15、OBM17、およびOBM18が残る。
この場合、図14(b)に示すように、「あ」、「い」、および「か」の文字を含む文字オブジェクトOBM17と「き」、「く」、「し」、および「す」の文字を含む文字オブジェクトOBM18とには互いに重なる領域が生じる。
この例のように、統合後に互いに重なり合う文字オブジェクトOBMができるような統合を行うこともできる。すなわち、文字オブジェクトOBMごとにレイヤが形成されており、それぞれ、そのレイヤ上に位置していると考えることができる。非文字オブジェクトについても同様である。
従って、文字オブジェクトOBMのことを「文字レイヤ」と呼ぶことができ、非文字オブジェクトOBHのことを「非文字レイヤ」または「背景レイヤ」などと呼ぶことができる。
統合処理部15は、上記のような統合の処理を、水平方向に行ごとに行い、さらに垂直方向に列ごとに行う。その後に残った文字オブジェクトOBMに対して所定の条件の下に統合の処理を繰り返す。このような統合処理の手順および統合の条件などについては、後に、〔統合処理部の構成〕において詳しく説明する。
可逆圧縮部16は、統合処理部15の統合の処理の後に残った文字オブジェクトOBMを取得し、それに示されるオブジェクト二値画像GNを可逆圧縮の方式で圧縮する(可逆圧縮する)。そして、圧縮されたオブジェクト画像を含む文字オブジェクトOBMを出力する。なお、本実施形態では、可逆圧縮の方式としてMMRを用いる。
低解像度化部17は、非文字オブジェクトOBHに示されるオブジェクト画像に対して低解像度化の処理を行う。
非可逆圧縮部18は、低解像度化された非文字オブジェクトOBHのオブジェクト画像を非可逆圧縮し、圧縮されたオブジェクト画像を含む非文字オブジェクトOBHを出力する。なお、本実施形態では、非可逆圧縮の方式としてJPEGを用いる。
ファイル生成部19は、可逆圧縮部16および非可逆圧縮部18から出力される文字オブジェクトOBMおよび非文字オブジェクトOBHを合成して、ファイルを生成する。本実施形態においては、コンパクトPDFのファイルを生成する。
なお、ここで生成されるファイルの形式は、図3におけるスキャン設定項目M12の「フォーム」から設定することができる。すなわち、その下位のスキャン設定項目M121、M122、M123、またはM124のいずれかの形式を選択することによって設定する。本実施形態では、予め、スキャン設定項目M124の「コンパクトPDF」が設定されている。
ここで、コンパクトPDFファイルの構成について、図15を参照して説明する。
図15に示すように、コンパクトPDFファイルは、大きく分けて、ファイルヘッダ、ボディ、相互参照表、およびトレーラなどから構成される。
ファイルヘッダには、コンパクトPDFの仕様のバージョンが示される。ボディには、文書の内容が示される。相互参照表には、ボディ内に含まれるオブジェクトの位置についての情報が示される。トレーラには、コンパクトPDFファイルのオブジェクトの個数またはカタログ辞書のオブジェクトの番号などが示される。
ボディは、さらに、文書情報、子ページのデータブロック、子ページ辞書、親ページ辞書、およびカタログ辞書などから構成される。ここにおいて、カタログ辞書には、親ページ辞書の番号が示される。親ページ辞書には、ページ数または子ページ辞書の番号などが示される。子ページ辞書には、データブロックの書式などが示される。
また、各子ページのデータブロックは、背景レイヤ、複数の文字レイヤ、およびレイヤ情報などから構成される。
背景レイヤには、JPEGの圧縮によって生成されたデータが格納される。文字レイヤには、二値化されMMRの圧縮によって生成されたデータが格納される。レイヤ情報には、背景レイヤおよび文字レイヤの位置または文字レイヤに含まれる原稿文字色などが示される。
〔統合処理部の構成〕
図16は統合処理部15の構成を示す図、図17は全体統合処理を説明するための図、図18は再統合処理を説明するための図、図19は2つ文字オブジェクトOBMを統合したと仮定した場合の統合前および統合後の文字オブジェクトOBMの属性値を示す第1の図、図20は2つの文字オブジェクトOBMを統合したと仮定した場合の統合前および統合後の文字オブジェクトOBMの属性値を示す第2の図である。次に、統合処理部15の処理について、図16を参照してさらに詳しく説明する。
図16において、統合処理部15は、行方向統合部151、列方向統合部152、全体統合部153、および第2全体統合部154などから構成される。
行方向統合部151は、文字オブジェクトOBM同士を水平方向に統合するための処理(行方向統合処理)を以下のようにして行う。
まず、所定のルールに従って元の原稿画像DGに対応する領域全体に対して行を定義する。そして、1つの行内での最も左側にある文字オブジェクトOBMを基準オブジェクトとして選択する。基準オブジェクトと同じ行にある文字オブジェクトOBMのうち基準オブジェクトから所定の距離内にあるものを抽出し、距離の近い文字オブジェクトOBMから順番に、それに示される代表色を基準オブジェクトの代表色と比較していく。
なお、「基準オブジェクトと同じ行にある文字オブジェクトOBM」とは、例えば、基準オブジェクトと交わる一つまたは複数の行と交わる(少なくとも一つの行を基準オブジェクトと共有する)文字オブジェクトOBMのことである。
また、本実施形態では、2つの文字オブジェクトOBM間の距離を、それぞれに含まれる最も近い画素同士の距離とする。従って、同じ行にある2つの文字オブジェクトOBMの距離は、右側にある文字オブジェクトOBMの左端の画素のX座標から左側にある文字オブジェクトOBMの右端の画素のX座標を引くことによって求めることができる。ただし、文字オブジェクトOBM同士が互いに重なり合っている場合は、それらの距離を「0」とする。または、2つの文字オブジェクトOBM間の距離として、それぞれのブロック位置の距離を用いてもよい。
比較した代表色の差(文字色差)が予め設定されている閾値以下の文字オブジェクトOBMが見つかった時点で、基準オブジェクトとその文字オブジェクトOBMとを統合する。すなわち、基準オブジェクトから所定の距離内にあって且つ文字色差が所定の閾値以下であるという条件を満たす文字オブジェクトOBMと基準オブジェクトとを統合する。
次に、統合によって新たに生成された文字オブジェクトOBMを次の基準オブジェクトとして上記の処理を行う。上記の条件を満たす文字オブジェクトOBMがない場合は、そのときの基準オブジェクトと同じ行にあるひとつ右隣の文字オブジェクトOBMを次の基準オブジェクトとして上記の処理を行う。そして、その行内の最も右側の文字オブジェクトOBMが基準オブジェクトOBMとなるまで上記の処理を繰り返す。定義した全ての行に対してこのような処理を行う。
列方向統合部152は、行方向統合処理の後に残った文字オブジェクトOBM同士を垂直方向に列ごとに統合する処理(列方向統合処理)を以下のようにして行う。
まず、所定のルールに従って元の原稿画像DGに対応する領域全体に対して列を定義する。そして、1つの列内での最も上側にある文字オブジェクトOBMを基準オブジェクトとして選択する。基準オブジェクトと同じ列にある文字オブジェクトOBMのうち基準オブジェクトから所定の距離内にあるものを抽出し、距離の近い文字オブジェクトOBMから順番に、それに示される代表色を基準オブジェクトの代表色と比較していく。
なお、「基準オブジェクトと同じ列にある文字オブジェクトOBM」とは、例えば、基準オブジェクトと交わる一つまたは複数の列と交わる(少なくとも一つの列を基準オブジェクトと共有する)文字オブジェクトOBMのことである。
また、この場合の2つの文字オブジェクトOBM間の距離は、下側にある文字オブジェクトOBMの上端の画素のY座標から上側にある文字オブジェクトOBMの下端の画素のY座標を引くことによって求めることができる。ただし、2つの文字オブジェクトOBMが互いに重なり合っている場合は、それらの距離を「0」とする。または、2つの文字オブジェクトOBM間の距離として、それぞれのブロック位置の距離を用いてもよい。
比較した代表色の差(文字色差)が予め設定されている閾値以下の文字オブジェクトOBMが見つかった時点で、基準オブジェクトとその文字オブジェクトOBMとを統合する。すなわち、基準オブジェクトから所定の距離内にあって且つ文字色差が所定の閾値以下であるという条件を満たす文字オブジェクトOBMと基準オブジェクトとを統合する。
次に、統合によって新たに生成された文字オブジェクトOBMを次の基準オブジェクトとして上記の処理を行う。上記の条件を満たす文字オブジェクトOBMがない場合は、そのときの基準オブジェクトと同じ列にあるひとつ下隣の文字オブジェクトOBMを次の基準オブジェクトとして上記の処理を行う。そして、その列内の最も下側の文字オブジェクトOBMが基準OBMとなるまで上記の処理を繰り返す。定義した全ての列に対してこのような処理を行う。
全体統合部153は、列方向統合処理の後に残った文字オブジェクトOBMに対して統合の処理(全体統合処理)を行う。この全体統合処理について図17を参照して説明する。
図17(a)には、行方向統合処理および列方向統合処理の後に残った文字オブジェクトOBM21、OBM22、OBM23、OBM24、OBM25、およびOBM26が示されている。まず、この中から同じ代表色の2つの文字オブジェクトOBMを抽出する。
次に、抽出した2つの文字オブジェクトOBMの矩形領域に含まれる画素数(文字オブジェクトOBMに含まれる画素数)と、これらの統合後にできる文字オブジェクトOBMに含まれる画素数とを算出する。画素数は、その文字オブジェクトOBMのブロックサイズに示される縦の長さ(画素数)×横の長さ(画素数)で求められる。
例えば、同じ代表色であるとして抽出した文字オブジェクトOBMが文字オブジェクトOBM21および24であった場合、これら2つの文字オブジェクトOBMに含まれる画素数S21およびS24は、それぞれ、a21×b21およびa24×b24となる。また、これら2つの文字オブジェクトOBMを統合した場合、統合後の文字オブジェクトOBMは、17(b)の文字オブジェクトOBM27のようになる。
図17(b)から分かるとおり、文字オブジェクトOBM27に含まれる画素数は、(y24−y21+a24)×(x24−x21+b24)となる。
さらに、抽出した2つの文字オブジェクトOBMの画素数をSとし、統合後にできる文字オブジェクトOBMの画素数をSとして以下の式を満たすかどうかを判定する。
/S< 閾値
この式を満たした場合は、抽出した2つの文字オブジェクトOBMを実際に統合する。図17の例では、Sは、(y24−y21+a24)×(x24−x21+b24)となり、Sは、(a21×b21+a24×b24)となる。従って、
(y24−y21+a24)×(x24−x21+b24)/(a21×b21+a24×b24)<閾値
の式を満たす場合に、文字オブジェクトOBM21およびOBM24を実際に統合し、文字オブジェクトOBM27を生成する。上記の式を満たさなかった場合は、統合は行わない。
さらに、代表色が同じである2つの文字オブジェクトOBMの他の組合せを抽出し、同様に上記の式を満たすかどうかの判定を行い、満たす場合にそれらを統合する。そのような処理を、代表色が同じである文字オブジェクトOBMの全ての組合せについて完了するまで繰り返す。なお、ここでは、代表色が同じ2つの文字オブジェクトOBMを抽出するようにしたが、代表色が近似する2つの文字オブジェクトOBM、すなわち文字色差が所定の閾値以内である2つの文字オブジェクトOBMを抽出するようにしてもよい。
ところで、統合後の文字オブジェクトOBMの矩形領域の中で統合前の2つの文字オブジェクトOBMの矩形領域以外の部分(増加部分)の画素、すなわち図17の例では文字オブジェクトOBM27における文字オブジェクトOBM21およびOBM24の矩形領域に対応する部分以外の部分の画素は、ドットが打たれていない不要な画素(不要空白画素)となる。この増加部分の画素は連続する空白の画素となるので、後の可逆圧縮処理部16の圧縮によってデータ量が大幅に削減される。
従って、2つの文字オブジェクトOBMのブロックサイズに対してそれらの統合後の文字オブジェクトOBMのブロックサイズが顕著に大きくなったとしても、可逆圧縮処理部16の圧縮によって生成される圧縮データのデータ量はさほど大きく増加するわけではない。
しかし、印刷の際には、不要空白画素についても、その画素が空白の画素であるという情報に基づいて印刷のための処理が行われるので、不要空白画素が増加すればその分だけ無駄に印刷に時間がかかってしまう。
本実施形態においては、統合によって文字オブジェクトOBMのブロックサイズが顕著に増加する場合には統合を行わない。このように、不要空白画素の増加具合(増加加減)などを考慮して全体統合処理を行うため、印刷の速度を低下させるという弊害を防止することができる。
第2全体統合部154は、全体統合処理の後に残った文字オブジェクトOBMの個数が所定の閾値である制限個数(レイヤ上限)以下になるように、その文字オブジェクトOBMを再度全体として統合するための処理(再統合処理)を行う。係る処理は以下のようにして行われる。
まず、全体統合処理の後に残った文字オブジェクトOBMの個数を求め、その個数と制限個数とを比較する。文字オブジェクトOBMの個数が制限個数以下である場合は、統合を行わずに処理を終了する。文字オブジェクトOBMの個数が制限個数を超える場合は、文字オブジェクトOBMを統合してその個数を減らすための処理を行う。
それに際して、まず、2つの文字オブジェクトOBMを選択し、それらを統合したと仮定した場合にできる文字オブジェクトOBMの代表色のRGBの濃度値を算出する。選択した文字オブジェクトOBMのそれぞれの代表色と算出した代表色とを比較してそれぞれについての文字色差を求める。このような比較を、全体統合処理の後に残った全ての文字オブジェクトOBMについて総当りで行い、全ての組み合わせについて文字色差を求める。そして、文字色差が最も小さい組み合わせの文字オブジェクトOBM同士を統合する。
統合の後、残った文字オブジェクトOBMの個数と制限個数とを比較する。文字オブジェクトOBMの個数が制限個数以下である場合は、処理を終了する。文字オブジェクトOBMの個数が制限個数を超える場合は、文字オブジェクトOBMの代表色を再度総当りで比較し、文字色差が最も小さい組み合わせの文字オブジェクトOBM同士を統合する。このような処理を、文字オブジェクトOBMの個数が制限個数以下になるまで繰り返す。
ここで、この再統合処理について、図18を参照して具体的に説明する。なお、ここでは、全体統合処理の後に残った文字オブジェクトOBMの個数が6個であり、制限個数が「4」である場合を例にあげる。なお、図18では、文字オブジェクトOBMを「OBM」と記載する。
図18には、全体統合処理の後、すなわち再統合処理が行われる前の状態(統合前)、再統合処理において1回目の統合が行われた後の状態(統合1回目)、および2回目の統合が行われた後の状態(統合2回目)での文字オブジェクトOBMが、それぞれ、示されている。また、文字オブジェクトOBMごとにその文字オブジェクトOBMに含まれる画素数およびRGBの各濃度値が示されている。
図18において、統合前の文字オブジェクトOBMは6個であり、制限個数の「4」よりも大きい。従って、第2全体統合部154は、文字オブジェクトOBMの個数が4個以下になるように、文字オブジェクトOBMを統合してその個数を減らすための処理を行う。
それに際して、まず、2つの文字オブジェクトOBM31およびOBM32を選択する。そして、それらの各代表色とそれらを統合したと仮定した場合にできる文字オブジェクトOBM312の代表色とを比較しそれぞれについての文字色差を算出する。
文字色差を求めるに当たって、まず、統合後の文字オブジェクトOBM312のRGBの各濃度値を算出する。RGBの各濃度値は、統合前の2つの文字オブジェクトOBMを文字オブジェクトOBMaとOBMbとし、統合後にできる文字オブジェクトOBMを文字オブジェクトOBMcとした場合に、例えば、以下の式のような加重平均によって求めることができる。なお、行方向統合処理、列方向統合処理、および全体統合処理においても同様に次の式によって統合後にできる文字オブジェクトOBMの代表色のRGBの各濃度値を求めることができる。
従って、文字オブジェクトOBM31とOBM32とを統合した場合のRの濃度値、すなわち文字オブジェクトOBM312の代表色のRの濃度値は、
(202×1000+195×50)/1050=201
となる。同様にしてGおよびBの濃度値は、それぞれ、「147」および「16」となる。
続いて、統合前の各文字オブジェクトOBMと統合後の文字オブジェクトOBMとの文字色差をそれぞれ求める。文字色差は、統合前の文字オブジェクトOBMのRGBの濃度値を、それぞれ、「R0」、「G0」、および「B0」とし、統合後の文字オブジェクトOBMのRGBの濃度値を、それぞれ、「R1」、「G1」、および「B1」した場合に、例えば、次の式によって求めることができる。なお、行方向統合処理、列方向統合処理、および全体統合処理においても同様に次の式によって文字色差を求めることができる。
従って、文字オブジェクトOBM31と統合後の文字オブジェクト312との文字色差は、
となる。
また、文字オブジェクトOBM32と統合後の文字オブジェクト312の文字色差は、
となる。
同様にして、他の全ての組合せについても文字色差を求めると、図19の表TB1に示される値が得られる。
図19においては、「統合前」の欄に、統合前の文字オブジェクトOBMaおよびOBMbの属性値などが示される。それぞれについて、Noの欄には、その文字オブジェクトOBMに対応する番号が示される。この番号は、文字オブジェクトOBMの符号の「OBM」に付した連番である。「画素数」の欄には、その文字オブジェクトOBMに含まれる画素数が示される。「R」、「G」、および「B」の欄には、それぞれ、その文字オブジェクトOBMの代表色のRGBの各濃度値が示される。
また、それらを統合した場合の統合後の文字オブジェクトOBMcの画素数およびRGBの各濃度値が「統合後の文字オブジェクトOBMc」の欄に示される。文字オブジェクトOBMaおよびOBMbと統合後の文字オブジェクトOBMcとの文字色差が「統合前後の文字色差」の欄に示される。
「統合前後の文字色差」の欄においては、「OBMa」の欄に、文字オブジェクトOBMaと文字オブジェクトOBMcとの文字色差が示され、「OBMb」の欄に、文字オブジェクトOBMbと文字オブジェクトOBMcとの文字色差が示される。「MAX」の欄には、「OBMa」および「OBMb」の欄に示される文字色差の内で大きい方の値(代表色差)が示される。
全ての組合せについて文字色差が求まると、第2全体統合部154は、代表色差が最も小さい組合せの文字オブジェクトOBM同士を統合する。
図19の「MAX」の欄に示される値から分かるとおり、この例では、文字オブジェクトOBM31およびOBM36を統合した場合の代表色差が「14」で最小となる。従って、文字オブジェクトOBM31とOBM36とを統合する。
この統合によって、図18の「統合1回目」に示されるように、文字オブジェクト316が新たに生成され、全体として文字オブジェクトOBMの個数が5個に減少する。
統合の後、再度、制限個数と文字オブジェクトOBMの個数とを比較する。図18の例では、文字オブジェクトOBMの個数が5個であり、まだ制限個数の「4」より大きいので、残った5つの文字オブジェクトOBMに対して上記のような処理を繰り返す。
この5個の文字オブジェクトOBMについて、図19の表BT1の場合と同様にして各値を求めると、図20のような表TB2が得られる。表TB2の「MAX」の欄に示される値によれば、文字オブジェクトOBM2と文字オブジェクトOBM5とを統合した場合の代表色差が「20」で最小となる。従って、文字オブジェクトOBM2と文字オブジェクトOBM5とを統合する。
文字オブジェクトOBM2と文字オブジェクトOBM5とを統合すると、図18の「統合2回目」に示されるように、文字オブジェクトOBM325が新たに生成され、全体としてオブジェクトの個数が4個に減少する。
2回目の統合によって、文字オブジェクトOBMの個数が制限個数以下になるので、この時点で再統合処理を終了する。
ところで、文字オブジェクトOBMには、そこに含まれる文字の色を代表する1つの代表色が対応付けられる。そのため、最終的に生成されるPDFファイルに使用される文字色の個数(文字色数)は、文字オブジェクトOBMの個数に依存することになる。よって、文字オブジェクトOBMの個数を制限することはPDFファイルに使用される文字色数を制限することになる。
従って、再統合処理における制限個数を「文字色制限値」と呼ぶことができる。また、この再統合処理を「文字色制限処理」と呼ぶことができる。
本実施形態においては、ユーザは、このような文字色制限値を、図3のスキャン設定項目M131によって設定することができる。
また、本実施形態では、ユーザは、スキャン設定項目M132によって、生成されるPDFファイルのデータ量(ファイルサイズ)を設定することもできる。ファイルサイズが設定されると、画像処理装置1は、そのファイルサイズ内に収まるようにPDFファイルを生成するための処理を行う。このような処理を文字色制限処理に対して「ファイルサイズ制限処理」と呼ぶことができる。このファイルサイズ制限処理については、後に〔ファイルサイズ制限処理の説明〕において詳しく説明する。
本実施形態においては、文字オブジェクトOBMの統合が統合処理部15において行なわれる場合の例を説明したが、文字色判別処理部114において代表色が決定したときに、同じまたは近似している代表色の文字オブジェクトOBMで近傍にあるもの同士を予め統合しておくようにしてもよい。
また、本実施形態においては、統合前の2つの文字オブジェクトOBMとそれらの統合後の文字オブジェクトOBMとの文字色差のうち大きい方の値を代表色差としたが、小さい方の値を代表色差としてもよい。また、代表色差が所定値より小さい場合にのみ再統合処理を許可するという制限を設けることも可能である。
〔フローチャートによる説明〕
図21は画像処理装置1におけるPDFファイルを生成するまでの概略の処理の流れを説明するためのフローチャートである。
次に、図21のフローチャートを参照して、画像処理装置1において、スキャンされた原稿についてのPDFファイルが生成されるまでの概略の処理の流れについて説明する。
図21において、スキャナ10aが原稿をスキャンすると(#21)、画像処理装置1は、それによって得られた原稿画像DGに対して画像形式の変換、解像度の変換、および下地除去などの前処理を施す(#22)。
原稿画像DGから明度画像DMを生成し、そこに含まれるオブジェクトOBを抽出する。抽出したオブジェクトOBの矩形領域が、図形領域、写真領域、表領域、下地領域、または文字領域のいずれであるかを判別する(#23)。
そのオブジェクトOBに文字が含まれるかどうかを判定する(#24)。ここでは、ステップ#23での判別の結果に応じて判定の方法が変更される。
文字が含まれると判定されたオブジェクトOBである文字オブジェクトOBMのブロック画像を二値化した後(#25)、統合処理を行う(#26)。
ステップ#26の統合処理の後に残った文字オブジェクトOBMのオブジェクト画像をMMRによって可逆圧縮する(#27)。
ステップ#24で文字を含まないと判定されたオブジェクトOBである非文字オブジェクトOBHのオブジェクト画像を低解像度化した後(#28)、JPEGなどの非可逆圧縮する(#29)。
ステップ#27およびステップ#29による圧縮の処理が施された文字オブジェクトOBMおよび非文字オブジェクトOBHに基づいてPDFファイルを生成する(#30)。
なお、本実施形態では、ステップ#27において、文字オブジェクトOBMのオブジェクト画像を圧縮するようにしたが、文字オブジェクトOBMの全体を圧縮するようにしてもよい。同様に、ステップ#29において、非文字オブジェクトOBHの全体を圧縮するようにしてもよい。
図22はステップ#26の統合処理の流れを説明するためのフローチャートである。
図22において、まず、水平方向において所定の距離内にあり且つ代表色が近似する2つの文字オブジェクトOBMを検索し、そのような2つの文字オブジェクトOBMを統合する処理を繰り返す。そのような統合の処理を行ごとに行う(#101)。
ステップ#101の統合の後に残った文字オブジェクトOBMから、垂直方向において所定の距離内にあり且つ代表色が近似する2つの文字オブジェクトOBMを検索し、そのような2つの文字オブジェクトOBMを統合する処理を繰り返す。そのような統合の処理を列ごとに行う(#102)。
ステップ#102の統合の後に残った文字オブジェクトOBMに対して、全体統合処理を行う(#103)。
ステップ#103の全体統合処理の後に残った文字オブジェクトOBMに対して、再統合処理を行う(#104)。
図23はステップ#103の全体統合処理の流れを説明するためのフローチャートである。次に、図23のフローチャートを参照して全体統合処理の流れについて説明する。
図23において、まず、同じ代表色の文字オブジェクトOBMを2つ抽出する(#301)。抽出した各文字オブジェクトOBMのブロックサイズを求める(#302)。さらに、それら二つの文字オブジェクトを統合した場合における統合後の文字オブジェクトOBMのブロックサイズを求め(#303)、統合前の2つの文字オブジェクトOBMのブロックサイズの合計と統合後の文字オブジェクトのブロックサイズとを比較する(#304)。
比較の結果、ブロックサイズが大幅に増加する場合、すなわち増加の割合が所定の閾値以上である場合は(#304でNo)、ステップ#301以降の処理を繰り返す。なお、ステップ#301の処理において、2回目以降は、既に抽出した組合せ以外の組合せで文字オブジェクトOBMを抽出する。
増加の割合が所定の閾値未満であった場合は(#304でYes)、それら2つの文字オブジェクトOBMを統合する。すなわち、統合前の2つの文字オブジェクトOBMの矩形領域に基づいて統合後の文字オブジェクトOBMの矩形領域を求め、そこに含まれる画像をその文字オブジェクトOBMのオブジェクト画像として保存することによって、統合前の2つの文字オブジェクトOBMに含まれるオブジェクト画像(オブジェクト二値画像GN)を統合する(#305)。さらに、統合前の2つの文字オブジェクトOBMの属性値に基づいて統合後の文字オブジェクトOBMの代表色、ブロック位置、ブロックサイズを求め、それらを、それぞれ、その統合後の文字オブジェクトOBMの代表色、ブロック位置、およびブロックサイズとして保存する。それによって、統合前の2つの文字オブジェクトOBMの代表色、ブロック位置、およびブロックサイズを示すデータを統合する(#306)。
同じ代表色の文字オブジェクトOBMの全ての組合せについてステップ#306までの処理が完了していない場合は(#307でNo)、ステップ#301以降の処理を繰り返す。完了した場合は(#307でYes)、全体統合処理を終了する。
図24はステップ#104の再統合処理の流れを説明するためのフローチャートである。次に、図24のフローチャートを参照して再統合処理の流れについて説明する。
図24において、まず、残っている文字オブジェクトOBMをカウントしてその個数を求める(#401)。その個数が所定の閾値である制限個数以下である場合(#402でNo)、そのまま再統合処理を終了する。
制限個数を超える場合(#402でYes)、残っている文字オブジェクトOBMから2つの文字オブジェクトOBMを選択し、それらの代表色とそれらを統合した場合の統合後の文字オブジェクトOBMの代表色とについて文字色差を求める(#403)。残っている文字オブジェクトOBMの全ての組合せについてステップ#403の処理を繰り返す(#404でNo)。
全ての組合せについて完了したら(#404でYes)、各組合せについて求められた2つ文字色差のうちで大きい方の値が最も小さい組合せの文字オブジェクトOBM同士を統合し(#405)、ステップ#401以降の処理を繰り返す。ステップ#401において、2回目以降は、前回求めた個数から1減算することによってその回の個数を求めるようにしてもよい。
次に、上述した文字オブジェクトの統合処理に加えて、非文字オブジェクトの非可逆圧縮時にファイルサイズ制限を行う実施例について説明する。
〔ファイルサイズ制限処理の説明〕
図25は画像処理装置1Bの機能的な構成の例を示す図である。
ファイルサイズ制限処理を行うために、画像処理装置1を図25に示す画像処理装置1Bのように構成する。画像処理装置1Bは、ユーザなどによって予め設定されたファイルサイズの上限値(制限値)であるファイルサイズ上限値以下のデータ量のファイルを生成するための処理を行う。
図25において、画像処理装置1Bは、ファイル保存部11、画像データ取得部12、前処理部13、領域処理部14、統合処理部15、可逆圧縮部16B、ファイル生成部19、および非文字オブジェクト処理部20などから構成される。
ここにおいて、ファイル保存部11、画像データ取得部12、前処理部13、領域処理部14、統合処理部15、およびファイル生成部19の処理の内容は図4において説明したものと同様である。よって、ここでは、説明を省略する。
可逆圧縮部16Bは、統合の処理の後に残った文字オブジェクトOBMのオブジェクト画像をMMRによって圧縮する。圧縮の処理が施された全ての文字オブジェクトOBMのデータ量の合計を示す可逆圧縮データ量DDを求める。
非文字オブジェクト処理部20は、低解像度化部17Bおよび非可逆圧縮部18Bなどから構成されている。この非文字オブジェクト処理部20は、非文字オブジェクトOBHに対して低解像度化およびJPEGによる圧縮の処理を以下のようにして行う。
まず、可逆圧縮部16Bから可逆圧縮データ量DDを取得し、その可逆圧縮データ量DDの値とファイルサイズ上限値との差分を求める。
求めた差分は、ファイルサイズ上限値が示す容量から文字オブジェクトOBMの総データを引いた残りの容量(残容量)であり、非文字オブジェクトOBHに対して使用できる容量を示す。すなわち、背景領域に使用できる容量である。
求めた残容量に基づいて、非文字オブジェクトOBHのオブジェクト画像の解像度をどこまで下げるのかを決定する。すなわち、低解像度化における目標の解像度(目標背景解像度)を求める。さらに、求めた残容量に基づいて、JPEGによる圧縮の際のパラメータである圧縮パラメータ(圧縮強度)を求める。
そして、低解像度化部17Bによって、各非文字オブジェクトOBHのオブジェクト画像を目標解像度まで低解像度化する。これによって、例えば、300dpiの解像度を150dpiの目標解像度まで低解像度化する。
続いて、非可逆圧縮部18Bによって、低解像度化された非文字オブジェクトOBHのオブジェクト画像をJPEGによって圧縮する。この際、上で求めた圧縮パラメータを用いる。
JPEGによる圧縮が施された全ての非文字オブジェクトOBHのデータ量の合計である非可逆圧縮データ量と残容量とを比較し、非可逆圧縮データ量が残容量以下であるかどうかを判定する。残容量以下でない場合は、残容量を超えた分のデータ量に応じて、目標解像度と圧縮パラメータとを設定しなおし、低解像度化およびJPEGによる圧縮を再度行う。非可逆圧縮データ量が残容量以下になるまで上記の処理を繰り返す。
非可逆圧縮データ量が残容量以下となった場合に、非文字オブジェクトOBHをファイル生成部19に出力する。
また、低解像度化などに先立って非可逆圧縮データ量が残容量内に収まるかどうかを判定する処理を行ってもよい。そして、収まりきらないと判定した場合には、その旨をユーザに対して通知し、ファイルサイズ上限値、目標解像度、または圧縮パラメータなどの変更を促すようにする。
この判定においては、例えば、圧縮の対象の非文字オブジェクトOBHのデータ量と残容量との差が所定の閾値以上である場合に収まりきらないと判定する。または、目標解像度と圧縮パラメータとを用いて非可逆圧縮データ量を試算し、試算した非可逆圧縮データ量と残容量との差が所定の閾値以上である場合に収まりきらないと判定する。
〔フローチャートによるファイルサイズ制限処理の説明〕
図26はファイルサイズ制限処理の流れを説明するためのフローチャートである。
図26において、まず、MMRによる圧縮が施された文字オブジェクトOBMの総データ量と予め設定されているファイル上限値とから残容量を求める(#501)。
求めた残容量に基づいて目標解像度とJPEGの圧縮に用いる圧縮パラメータとを決定する(#502)。決定した目標解像度および圧縮パラメータから非可逆圧縮データ量を試算し、それが残容量以下になるかどうかを判定する。すなわち、残容量以下への圧縮が可能かどうかを判定する(#503)。
可能でないと判定した場合(#503でNo)、その旨のメッセージを操作パネル10kのディスプレイTPに表示してユーザに通知する(#504)。そして、処理を終了する。通知を確認したユーザは、ファイルサイズ上限値を設定し直してリトライする。
残容量以下への圧縮が可能であると判定した場合(#503でYes)、ステップ#502で決定した目標解像度になるように非文字オブジェクトOBHのオブジェクト画像を低解像度化する(#505)。さらに、ステップ#502で決定した圧縮パラメータを用いてJEPGによる圧縮を行う(#506)。圧縮の処理が施された非文字オブジェクトの総データ量(非可逆圧縮データ量)が実際に残容量以下になったかどうかを判定する(#507)。
残容量以下でない場合は(#507でNo)、残容量を超えた分のデータ量に基づいて目標解像度と圧縮パラメータとを再設定(調整)する(#508)。そして、非可逆圧縮データ量が残容量以下となるまで、ステップ#505以降の処理を繰り返す。
非可逆圧縮データ量が残容量以下となった場合に(#507でYes)、処理を終了する。
本実施形態においては、1つの文字ごとまたは1つの単語ごとに文字オブジェクトOBMが生成され、その文字オブジェクトOBMに対して1つの代表色が決定される。そして、原稿文字色が同じまたは近似している近傍の文字オブジェクトOBM同士が統合され、統合前の各文字オブジェクトOBMの代表色に基づいて、統合後の文字オブジェクトOBMの代表色が決定される。このような統合を、一旦、行単位および列単位(段落単位)に行った後、残った文字オブジェクトOBMの内で所定の条件を満たす関係にあるもの同士をさらに統合する。その後、残った文字オブジェクトOBMの個数が制限個数を超える場合に、代表色の最も近い文字オブジェクトOBM同士を統合する。
これによって、統合前と統合後とにおける代表色の変化を最小限に抑えることができる。
また、色段差を発生させることなく文字オブジェクトOBMの個数を減らすことができ、適切にファイルサイズの低減できる。
また、本実施形態では、従来のように初めから全てのオブジェクトについて総当りで属性を比較することはせず、まず、行方向統合処理、列方向統合処理、および全体統合処理を行なう。その後、再統合処理においてそのような総当りの比較をする。文字オブジェクトOBMの個数は、全体統合処理が終わった時点で相当数減少していることが多い。そのため、再統合処理での総当りの比較は、従来の総当りの比較に比べて、計算量が少なくなる。
また、本実施形態では、文字領域の画像(文字オブジェクトOBMのオブジェクト画像)に対して、高解像度のまま可逆圧縮する。写真領域または図形領域などの背景領域の画像(非文字オブジェクトOBHのオブジェクト画像)を低解像度化してから非可逆圧縮する。すなわち、文字領域については画質を優先し、背景領域については画質よりもデータ量の削減を優先する。これによって、圧縮性および文字の判読性を両立したPDFファイルを生成できるようになる。
また、背景領域の画像を低解像度化する際の目標解像度および非可逆圧縮の際の圧縮パラメータを、可逆圧縮データ量DDおよびファイルサイズ上限値に基づいて決定する。そして、背景領域の画像については、目標解像度まで低解像度化し、圧縮パラメータに基づいて非可逆圧縮する。文字領域ついては、高解像度のまま可逆圧縮する。これによって、文字領域および背景領域の画像に対して最適な解像度を保ちつつ最適な圧縮を行えるようになる。
本実施形態においては、画像処理装置1としてMFPを用いる場合の例を示したが、パーソナルコンピュータまたはワークステーションなどを用いることも可能である。その場合は、パーソナルコンピュータなどにスキャナおよびプリンタを外部接続しておき、さらに、図4または図25に示す各部の機能を実現するためのプログラムなどをインストールしておけばよい。
また、図4または図25の各部の機能の一部をハードウェアによって実現してもよい。例えば、入力画像処理部および出力画像処理部などのハードウェアを画像処理装置1に設けておく。入力画像処理部は、スキャナ10aから原稿画像DGを受け付け、それに対して、色変換、色補正、解像度変換、領域判別などの処理を行う。処理された後のデータは、ハードディスク10c、RAM10d、またはROM10eなどに保持する。
保持されたデータに基づいて印刷が実行される際には、印刷装置10fの印刷の処理に先立って、出力画像処理部が、スクリーン制御、スムージング処理、およびPWM制御などを行う。
その他、画像処理装置1および1Bの全体または各部の構成、機能、閾値、上限値、各データが示す内容、代表色、文字色差、およびオブジェクトOB間の距離などの値の求め方、処理の内容または順序などは、本発明の趣旨に沿って適宜変更することができる。
本発明の一実施形態に係る画像処理装置のハードウェア構成の例を示す図である。 操作パネルの例を示す図である。 スキャナの設定項目を説明するための図である。 画像処理装置の機能的な構成の例を示す図である。 領域処理部の構成の例を示す図である。 原稿画像および明度原稿画像の例を示す図である。 文字色決定処理部の構成の例を示す図である。 細線化画像の生成方法の例を説明するための図である。 文字の線図形の中央線の位置の例を示す図である。 文字の線図形の中央線およびその付近の領域を複数の文字色候補領域に分割する方法の例を説明するための図である。 近似色画素選出処理の流れの例を説明するためのフローチャートである。 各原色の階調の分布の例を示す図である。 文字オブジェクトの統合を説明するための第1の例を示す図である。 文字オブジェクトの統合を説明するための第2の例を示す図である。 コンパクトPDFファイルの構成の例を示す図である。 統合処理部の構成を示す図である。 全体統合処理を説明するための図である。 再統合処理を説明するための図である。 2つ文字オブジェクトを統合したと仮定した場合の統合前および統合後の文字オブジェクトの属性値を示す第1の図である。 2つ文字オブジェクトを統合したと仮定した場合の統合前および統合後の文字オブジェクトの属性値を示す第2の図である。 画像処理装置におけるPDFファイルを生成するまでの概略の処理の流れを説明するためのフローチャートである。 統合処理の流れを説明するためのフローチャートである。 全体統合処理の流れを説明するためのフローチャートである。 再統合処理の流れを説明するためのフローチャートである。 本発明の他の実施形態に係る画像処理装置の機能的な構成の例を示す図である。 ファイルサイズ制限処理の流れを説明するためのフローチャートである。
符号の説明
1、1B 画像処理装置(コンピュータ、処理装置)
14 領域処理部(生成手段、判別手段)
15 統合処理部(第1の統合手段、第2の統合手段)
16、16B 可逆圧縮部(可逆圧縮手段)
18、18B 非可逆圧縮部(非可逆圧縮手段)
19 非文字オブジェクト処理部(決定手段)
103 領域抽出部(生成手段)
109 文字判定部(判別手段)
151 行方向統合部(第1の統合手段)
152 列方向統合部(第1の統合手段)
153 全体統合部(第1の統合手段)
154 第2全体統合部(第2の統合手段)
DE エッジ原稿画像(入力データ)
DG、DGb 原稿画像(入力データ)
DK 罫線分離済原稿画像(入力データ)
MD、MDb、MD2、MD2b 明度原稿画像(入力データ)
OB オブジェクト
OBH 非文字オブジェクト(オブジェクト)
OBM 文字オブジェクト(オブジェクト)

Claims (20)

  1. 入力データから電子ファイルを生成する際の当該入力データの処理方法であって、
    前記入力データに含まれる特定の領域を示すオブジェクトを生成する第1のステップと、
    生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第1の条件を満たすオブジェクト同士を統合することによってそれらを1つのオブジェクトにする第1の統合処理を前記第1の条件を満たすオブジェクト全てについて実行する第2のステップと、
    前記第2のステップ終了後、前記第2のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であることを含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第1の全体統合ステップと、前記第1の全体統合ステップ終了後、前記第1の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第2の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第2の全体統合ステップとを含む、第3のステップと、
    を有することを特徴とする入力データの処理方法。
  2. 前記第2の全体統合ステップにおいては、統合の後に残っているオブジェクトの個数が前記設定値以下になるように、前記第2の条件を満たすオブジェクト同士の統合を繰り返す、
    請求項1記載の入力データの処理方法。
  3. 前記第2の条件は、ある組合せのオブジェクト同士を統合した場合に当該統合によってできる1つのオブジェクトの属性値と統合前の各オブジェクトの属性値との差異が他の組合せのオブジェクト同士を統合した場合の差異より小さいことである、
    請求項1または2記載の入力データの処理方法。
  4. 前記属性値は、オブジェクトに含まれる文字の色についての値である、
    請求項3記載の入力データの処理方法。
  5. オブジェクトには、文字の領域に関する文字オブジェクトと文字以外の領域に関する非文字オブジェクトとがあり、
    前記文字オブジェクトに対して、前記第2のステップおよび前記第3のステップの処理を行う、
    請求項1ないし4のいずれかに記載の入力データの処理方法。
  6. 前記第3のステップの処理の後に残っている前記文字オブジェクトを可逆圧縮し、
    前記非文字オブジェクトを非可逆圧縮する、
    請求項5記載の入力データの処理方法。
  7. 前記非可逆圧縮に用いるパラメータを、前記文字オブジェクトの可逆圧縮によって生成されたデータのデータ量に基づいて決定する、
    請求項6記載の入力データの処理方法。
  8. 前記第1の統合処理における前記第1の条件として、当該各オブジェクトに含まれる文字の色の差、および当該オブジェクト同士を統合した場合にできる空白の部分の大きさを示す値がそれぞれ所定の値より小であることをさらに含む、
    請求項1ないし7のいずれかに記載の入力データの処理方法。
  9. 前記第1の統合処理における前記第1の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
    請求項1ないし7のいずれかに記載の入力データの処理方法。
  10. 前記第2のステップにおいて、前記第1の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第1の条件として当該オブジェクト同士を統合する第2の統合処理を含む、
    請求項1ないし7または9のいずれかに記載の入力データの処理方法。
  11. 入力データから電子ファイルを生成するコンピュータに、
    前記入力データに含まれる特定の領域を示すオブジェクトを生成する第1のステップと、
    生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第1の条件を満たすオブジェクト同士を統合することによってそれらを1つのオブジェクトにする第1の統合処理を前記第1の条件を満たすオブジェクト全てについて実行する第2のステップと、
    前記第2のステップ終了後、前記第2のステップの処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であることを含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第1の全体統合ステップと、前記第1の全体統合ステップ終了後、前記第1の全体統合ステップの処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第2の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第2の全体統合ステップとを含む、第3のステップと、
    を実行させることを特徴とするコンピュータプログラム。
  12. 前記第1の統合処理における前記第1の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
    請求項11記載のコンピュータプログラム。
  13. 前記第2のステップにおいて、前記第1の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第1の条件として当該オブジェクト同士を統合する第2の統合処理を含む、
    請求項11または12記載のコンピュータプログラム。
  14. 入力データから電子ファイルを生成する処理装置であって、
    前記入力データに含まれる特定の領域を示すオブジェクトを生成する生成手段と、
    前記生成手段によって生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第1の条件を満たすオブジェクト同士を統合することによってそれらを1つのオブジェクトにする第1の統合処理を前記第1の条件を満たすオブジェクト全てについて実行する第1の統合手段と、
    前記第1の統合手段による統合の処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であることを含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第1の全体統合手段と、前記第1の全体統合手段による統合の処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第2の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第2の全体統合手段とを含む、第2の統合手段と
    を有することを特徴とする処理装置。
  15. 前記第1の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
    請求項14記載の処理装置。
  16. 前記第1の統合手段は、前記第1の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第1の条件として当該オブジェクト同士を統合する第2の統合処理を行う、
    請求項14または15記載の処理装置。
  17. 入力データから電子ファイルを生成する処理装置であって、
    前記入力データに含まれる特定の領域を示すオブジェクトを生成する生成手段と、
    前記生成手段によって生成した複数のオブジェクトのうちで当該オブジェクトに含まれる文字の色の差およびオブジェクト間の距離がそれぞれ所定の値より小であることを含む第1の条件を満たすオブジェクト同士を統合することによってそれらを1つのオブジェクトにする第1の統合処理を前記第1の条件を満たすオブジェクト全てについて実行する第1の統合手段と、
    前記第1の統合手段による統合の処理の後に残っているオブジェクトについて、少なくとも当該オブジェクト同士を統合した場合において統合領域に空白の部分が含まれることによって生じる統合前に対する統合後のオブジェクトのサイズの増大が所定より小であることを含む条件を満たすオブジェクト同士を統合する処理を前記条件を満たすオブジェクト全てについて実行する第1の全体統合手段と、前記第1の全体統合手段による統合の処理の後に残っているオブジェクトの個数と予め設定されている設定値とを比較し、当該個数の値が当該設定値よりも大きい場合に、当該残っているオブジェクトのうちで第2の条件を満たすオブジェクト同士を統合してオブジェクトの個数を減少させる第2の全体統合手段とを含む、第2の統合手段と
    前記第2の統合手段による統合の処理の後に残っている前記文字オブジェクトを可逆圧縮する可逆圧縮手段と、
    前記非文字オブジェクトを非可逆圧縮する非可逆圧縮手段と、
    を有することを特徴とする処理装置。
  18. 前記非文字オブジェクトを非可逆圧縮する際のパラメータを、前記可逆圧縮手段の可逆圧縮によって生成したデータのデータ量に基づいて決定する決定手段を有し、
    前記非可逆圧縮手段は、前記パラメータに基づいて非可逆圧縮を行う、
    請求項17記載の処理装置。
  19. 前記第1の条件として、当該オブジェクトに含まれる文字の色の差が所定の値より小であることをさらに含む、
    請求項17または18記載の処理装置。
  20. 前記第1の統合手段は、前記第1の統合処理を行った後で残ったオブジェクトを統合した場合にできる空白の部分の大きさを示す値が所定の値より小であることを前記第1の条件として当該オブジェクト同士を統合する第2の統合処理を行う、
    請求項17ないし19のいずれかに記載の処理装置。
JP2006211157A 2006-08-02 2006-08-02 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム Active JP4333708B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006211157A JP4333708B2 (ja) 2006-08-02 2006-08-02 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
US11/882,428 US7884977B2 (en) 2006-08-02 2007-08-01 Method, device and computer program for processing input data concerning generation of electronic files

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006211157A JP4333708B2 (ja) 2006-08-02 2006-08-02 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2008042325A JP2008042325A (ja) 2008-02-21
JP4333708B2 true JP4333708B2 (ja) 2009-09-16

Family

ID=39028852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006211157A Active JP4333708B2 (ja) 2006-08-02 2006-08-02 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム

Country Status (2)

Country Link
US (1) US7884977B2 (ja)
JP (1) JP4333708B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8442311B1 (en) * 2005-06-30 2013-05-14 Teradici Corporation Apparatus and method for encoding an image generated in part by graphical commands
JP4847398B2 (ja) * 2007-06-06 2011-12-28 キヤノン株式会社 画像処理装置およびその方法
JP4927047B2 (ja) * 2008-08-29 2012-05-09 富士通フロンテック株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP4725645B2 (ja) 2008-12-26 2011-07-13 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、データ量削減方法およびデータ量削減プログラム
JP2010232738A (ja) * 2009-03-25 2010-10-14 Fuji Xerox Co Ltd 画像処理装置、画像形成装置およびプログラム
JP4707022B2 (ja) * 2009-03-27 2011-06-22 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP4780215B2 (ja) * 2009-03-27 2011-09-28 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP2011249996A (ja) * 2010-05-25 2011-12-08 Fuji Xerox Co Ltd 画像処理装置、画像送信装置及びプログラム
JP5645612B2 (ja) * 2010-11-09 2014-12-24 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP5838984B2 (ja) * 2013-03-19 2016-01-06 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP6489761B2 (ja) * 2014-05-14 2019-03-27 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
GB2528446B (en) * 2014-07-21 2021-08-04 Tobii Tech Ab Method and apparatus for detecting and following an eye and/or the gaze direction thereof
KR101946019B1 (ko) * 2014-08-18 2019-04-22 삼성전자주식회사 파노라믹 동영상을 생성하는 동영상 처리 장치 및 그 방법
JP6197840B2 (ja) 2015-08-24 2017-09-20 コニカミノルタ株式会社 画像処理装置、電子ファイル生成方法及びプログラム
CN114766092A (zh) * 2020-01-23 2022-07-19 沃尔沃卡车集团 一种用于使车辆驾驶室中的监视器上显示的图像适应驾驶员位置的方法
US11740465B2 (en) * 2020-03-27 2023-08-29 Apple Inc. Optical systems with authentication and privacy capabilities
CN114938418A (zh) * 2021-02-04 2022-08-23 佳能株式会社 具有视线检测功能的取景器单元、摄像设备和附接配件
CN113365071B (zh) * 2021-06-08 2023-01-17 北京数科网维技术有限责任公司 一种图像分层压缩方法及图像分层压缩装置
US20230055268A1 (en) * 2021-08-18 2023-02-23 Meta Platforms Technologies, Llc Binary-encoded illumination for corneal glint detection
US20230176377A1 (en) * 2021-12-06 2023-06-08 Facebook Technologies, Llc Directional illuminator and display apparatus with switchable diffuser
US20230274578A1 (en) * 2022-02-25 2023-08-31 Eyetech Digital Systems, Inc. Systems and Methods for Hybrid Edge/Cloud Processing of Eye-Tracking Image Data
US11912429B2 (en) * 2022-04-05 2024-02-27 Gulfstream Aerospace Corporation System and methodology to provide an augmented view of an environment below an obstructing structure of an aircraft

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06175633A (ja) 1992-12-09 1994-06-24 Omron Corp 画像データ処理装置
JPH08179752A (ja) * 1994-12-21 1996-07-12 Canon Inc 画像処理装置及び方法
JPH1074248A (ja) 1996-08-30 1998-03-17 Matsushita Electric Ind Co Ltd 減色装置および減色方法
US7164493B1 (en) * 1998-11-06 2007-01-16 Canon Kabushiki Kaisha Image processing method, system and apparatus, and storage medium
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
JP2003018412A (ja) 2001-07-03 2003-01-17 Canon Inc 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP2003338934A (ja) 2002-05-20 2003-11-28 Canon Inc 画像処理装置および方法
JP4235583B2 (ja) 2003-05-26 2009-03-11 株式会社リコー 画像処理装置、画像処理用プログラム及び記憶媒体
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium

Also Published As

Publication number Publication date
US20080030812A1 (en) 2008-02-07
US7884977B2 (en) 2011-02-08
JP2008042325A (ja) 2008-02-21

Similar Documents

Publication Publication Date Title
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4240107B2 (ja) 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
JP4329764B2 (ja) 画像処理装置および罫線抽出プログラム
US8401306B2 (en) Image processing apparatus and control method
EP1930820B1 (en) Image processing apparatus and image processing method
JP4586891B2 (ja) 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
US10477063B2 (en) Character detection and binarization
US20090284801A1 (en) Image processing apparatus and image processing method
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2009135796A (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像形成装置、記憶媒体
US7692669B2 (en) Image processing apparatus, image processing method and image processing program
JP4861362B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2012074852A (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体
US8577132B2 (en) Electronic document generation system, electronic document generation method, and program
JP4442701B2 (ja) 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
JP4695914B2 (ja) 画像処理装置及び画像処理方法
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP6025803B2 (ja) 画像処理装置
US8553294B2 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same
JP2010286917A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP2010218106A (ja) 画像処理装置、画像処理方法及びプログラム
JP2007189275A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090602

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090615

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4333708

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130703

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350