JP2007129456A - 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体 - Google Patents

画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2007129456A
JP2007129456A JP2005319812A JP2005319812A JP2007129456A JP 2007129456 A JP2007129456 A JP 2007129456A JP 2005319812 A JP2005319812 A JP 2005319812A JP 2005319812 A JP2005319812 A JP 2005319812A JP 2007129456 A JP2007129456 A JP 2007129456A
Authority
JP
Japan
Prior art keywords
image
data
block
encoding
layer data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005319812A
Other languages
English (en)
Other versions
JP4236659B2 (ja
Inventor
Yoichiro Hachiman
洋一郎 八幡
Kensaku Oji
謙作 蔭地
Hisafumi Saika
尚史 齋鹿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2005319812A priority Critical patent/JP4236659B2/ja
Priority to US11/590,842 priority patent/US7706618B2/en
Publication of JP2007129456A publication Critical patent/JP2007129456A/ja
Application granted granted Critical
Publication of JP4236659B2 publication Critical patent/JP4236659B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】符号化処理において画質の劣化を最小限に抑えつつ、データ容量を大幅に削減した汎用性の高いデータを作成可能な画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体を提供する。
【解決手段】入力画像を所定のブロック単位で像域判定し、像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成する。そして、生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理する。
【選択図】図2

Description

本発明は、画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体に関し、特に、複数の層毎に画像を処理する画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体に関する。
近年、紙の書類等、あらゆる物が電子化されるようになっている。そのため、電子化されたデータを記録する装置や媒体に、より多くのデータを記憶させるには、データ量の効率的な削減が求められる。
たとえば、文字および写真のような複数の異なる要素が配置された画像のデータを、記録装置または記録媒体に記録する際には、画像データの容量を効率よく削減する技術が重要となる。すなわち、画質劣化が小さく、かつ、データ容量の削減量が大きくなるように、符号化する技術が重要となる。以下においては、たとえば、文字、写真等の要素が表示される画像内の領域を像域ともいう。ここで、記録装置は、たとえば、パーソナルコンピュータ、複写機または複合機などに備えられるハードディスクである。また、記録媒体は、たとえば、CD−Rである。
特開平7−212601号公報(特許文献1)には、符号化処理で用いるマトリクス(ブロック)単位で像域分離を行ない、像域分離後の結果にマトリクスを使用した符号化を適用する技術(以下、従来技術Aともいう)が開示されている。
また、特開平7−212601号公報(特許文献1)には、写真部をマトリクス単位で効率的に分離するための技術(以下、従来技術Aともいう)が開示されている。従来技術Aでは、写真部をマトリクス単位で符号化(たとえば、JPEG(Joint Photographic Coding Experts Group)し、文字部(写真以外の部分)を2値化して可逆符号化(たとえば、ランレングス符号化)する。これにより、複数の異なる像域から成る画像データを効率よく符号化することが可能である。
特開2004−187000号公報(特許文献2)には、ITU−T勧告T.44に規定されるMRC(Mixed Raster Content)に基づく技術(以下、従来技術Bともいう)が開示されている。
MRCでは、文字、線および写真など複数の異なる像域から成る画像データを、前景プレーン、背景プレーン、マスクプレーンの合計3層のプレーンに分離する。ここで、マスクプレーンとは、前景プレーンおよび背景プレーンのいずれを選択するかを示すプレーンである。そして、MRCでは、3層のプレーンを、個別に符号化する方式を規定している。
一般に、MRCを使用する画像符号化装置では、文字および線を表す前景プレーンと、写真などを表す背景プレーンとを選択する情報であるマスクプレーンは、画素単位で構成されている。
また、MRCを使用する画像符号化装置では、文字および線の高解像度での形状情報の保持はマスクプレーンに委ねて高解像度での可逆符号化を行なう。そして、文字および線の色情報を保持する前景プレーンと、解像度低下による劣化が目立たない写真などの背景プレーンとは、マスクプレーンに比べて低解像度で非可逆符号化される場合が多い。
また、特開2004−187000号公報(特許文献2)には、前景プレーン中における背景像域のドント・ケア(don't care)画素や、背景プレーン中における前景像域のドント・ケア画素の画素値の算出方法を工夫することにより、前景プレーンおよび背景プレーンの解像度を低解像度化する際に発生する、色濁りなどを低減する技術が開示されている。ここで、ドント・ケア画素とは、データを合成して画像を再生する際に参照されない画素のことである。
一方、画像データを電子的に記録する場合、データフォーマット(データ形式)の選択が重要となる。たとえば、一つの装置内で画像データを符号化して、保存し、復号処理も実行する場合は独自のデータフォーマットでもよい。しかしながら、符号化して、記録されたデータを装置間で伝送する場合などは、一般に広く用いられるデータフォーマットに従うことが好ましい。
たとえば、JPEG方式に従うデータフォーマットは、パーソナルコンピュータやデジタルスチルカメラなどで広く利用されている。また、Adobe社によって開発されたPDF(Portable Document Format)も、広く利用されている画像データフォーマットの一つである。
特開平7−212601号公報 特開2004−187000号公報
従来技術Aでは、文字に対しては、2値化して可逆符号化する。したがって、従来技術Aでは、写真像域中に存在する色文字や色線については、可逆符号化の対象とすることが困難となり、写真像域向けの符号化条件が適用される。
すなわち、従来技術Aでは、色などの条件によっては、符号化することで文字や線の形状が見た目に劣化するという問題がある。さらに、従来技術Aでは、広く利用されているデータフォーマットを使用しておらず、汎用性に欠けるという問題点がある。
また、従来技術Bでは、文字および線の形状情報の保持をマスクプレーンに委ねている。そのため、マスクプレーンを符号化する場合、高解像度で、かつ、可逆である必要があるため、マスクプレーンの保持に多くのデータ容量が必要となる。
また、従来技術Bでは、ドント・ケア画素に起因する色濁りを低減しているが、完全な回避は困難という問題点がある。
本発明は、上述の問題点を解決するためになされたものであって、その目的は、符号化処理において画質の劣化を最小限に抑えつつ、データ容量を大幅に削減した汎用性の高いデータを作成可能な画像符号化装置を提供することである。
本発明の他の目的は、符号化処理において画質の劣化を最小限に抑えつつ、データ容量を大幅に削減した汎用性の高いデータを作成可能な画像符号化方法を提供することである。
本発明のさらに他の目的は、符号化処理において画質の劣化を最小限に抑えつつ、データ容量を大幅に削減した汎用性の高いデータを作成可能な画像符号化プログラムを提供することである。
本発明のさらに他の目的は、符号化処理において画質の劣化を最小限に抑えつつ、データ容量を大幅に削減した汎用性の高いデータを作成可能な画像符号化プログラムを記録した記録媒体を提供することである。
上述の課題を解決するために、この発明のある局面に従う画像符号化装置は、入力画像を所定のブロック単位で像域判定するブロック像域判定手段と、ブロック像域判定手段の像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成する層データ生成手段と、層データ生成手段が生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理する符号化手段とを備える。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
好ましくは、符号化手段は、各々が、2以上の層データのそれぞれに適する符号化条件で、2以上の層データのそれぞれに適するブロック単位で、2以上の層データをそれぞれ符号化処理する2以上のデータ符号化手段を含む。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
好ましくは、2以上の層データのうち、少なくとも1つの層データは画像データであり、層データ生成手段は、画像データである層データに基づく画像のうち、画像再生時に無効であると規定された1以上のブロック内の各々のブロック画像を構成する複数の画素値を設定し、層データ生成手段により設定された複数の画素値は、入力画像のデータを使用して設定される場合より、符号化手段が画像データの層データを符号化処理した符号化データ容量が小さくなる値である。
この発明に従えば、データ容量の削減量がより大きくなるように、かつ、設定した画素値に起因する色濁りの影響を再生画像に生じさせることなく、画像を符号化することができる。
好ましくは、2以上の層データのうち、少なくとも1つの層データは画像データであり、入力画像の解像度を変換した変換画像を生成する解像度変換手段をさらに備え、層データ生成手段は、画像データである層データに基づく画像のうち、画像再生時に有効であると規定された1以上のブロックにそれぞれ対応する、変換画像内の1以上のブロック画像のデータを設定する。
この発明に従えば、データ容量の削減量がより大きくなるように画像を符号化することができる。
好ましくは、入力画像を画素単位で像域判定する画素像域判定手段をさらに備え、ブロック像域判定手段は、画素像域判定手段の画素単位の像域判定結果に基づいて、ブロック単位の像域判定を行なう。
この発明に従えば、ブロック単位の像域判定をより正確に行なうことができる。
好ましくは、ブロック像域判定手段は、判定対象のブロックが、文字または線を含むか否かを判定し、層データ生成手段が生成した2以上の層データの少なくとも1つの層データは画像データであり、画像データである層データに基づく画像は、文字または線が表示される画像である。
この発明に従えば、高周波成分が比較的大きい文字または線を含むブロックに、適切なパラメータを設定して符号化を行い、文字または線を比較的高精細に保持して符号化することができる。
好ましくは、ブロック像域判定手段は、判定対象のブロックが、文字、線およびエッジ部の少なくとも1つを含むか否かを判定し、層データ生成手段が生成した2以上の層データの少なくとも1つの層データは画像データであり、画像データである層データに基づく画像は、文字、線およびエッジ部の少なくとも1つが表示される画像である。
この発明に従えば、像域の判定をブロック単位で行っているため、エッジに注目して層データを生成することができる。また、高周波成分が比較的大きい文字または線またはエッジを含むブロックに、適切なパラメータを設定して符号化を行い、文字または線またはエッジを比較的高精細に保持して符号化することができる。
好ましくは、2以上の層データのうち、少なくとも1つの層データは画像データであり、2以上の層データのうち、画像データ以外の層データのうち少なくとも1つの層データは、各々が、画像データである層データの画像再生時に所定のブロック単位で有効であるか無効であるかを示す複数のマスクデータから構成されるマスク層データである。
この発明に従えば、画素単位でマスクデータを生成する場合に比べて、複数のマスクデータから構成されるマスク層データの容量を削減することができる。
好ましくは、マスク層データを可逆符号化する可逆符号化手段をさらに備える。
この発明に従えば、マスク層データの容量を更に削減することができる。
好ましくは、2以上の層データのうち、少なくとも2つの層データは画像データであり、層データ生成手段は、画像データである層データに基づく画像のうち、画像再生時に無効であると規定された1以上のブロック内の各々のブロック画像を構成する複数の画素値を、透過色であるか否かを示す透過色値に設定する。
この発明に従えば、マスク層データを独立して保持することなく、複数の層データを重ね合わせて画像を再生することができる。
好ましくは、層データ生成手段は、画像データである少なくとも2つの層データのうち、透過色値が設定されていない、少なくとも1つの層データに基づく画像のうち、画像再生時に無効であると規定された1以上のブロック内の各々のブロック画像を構成する複数の画素値を、透過色値と同一の値に設定する。
この発明に従えば、透過色部分について下層のデータを用いる場合に、より正確に画像を再生することを可能とする。
好ましくは、複数のデータを関連付けた関連付けデータを生成するフォーマット手段をさらに備え、フォーマット手段は、符号化処理された2以上の層データと、可逆符号化されたマスク層データとを関連付ける。
この発明に従えば、汎用性の高いデータフォーマットを用いて表現することができる。
好ましくは、複数のデータを関連付けた関連付けデータを生成するフォーマット手段をさらに備え、フォーマット手段は、符号化処理された2以上の層データを関連付け、2以上の層データのうちの少なくとも1つの層データは、透過色値に設定されたデータを含む。
この発明に従えば、汎用性の高いデータフォーマットを用いて表現することができる。
好ましくは、符号化処理は、非可逆符号化処理である。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
好ましくは、非可逆符号化処理は、JPEG方式に従う符号化処理である。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
好ましくは、所定のブロックは、横および縦の画素数が等しく、画素数は8に自然数を乗じた値である。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
この発明の他の局面に従う画像符号化方法は、入力画像を所定のブロック単位で像域判定する工程と、像域判定する工程の像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成する工程と、2以上の層データを生成する工程が生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理する工程とを含む。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
好ましくは、符号化処理は、非可逆符号化処理である。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
この発明のさらに他の局面に従うと、コンピュータに画像処理を実行させるための画像符号化プログラムは、入力画像を所定のブロック単位で像域判定するステップと、像域判定するステップの像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成するステップと、2以上の層データを生成するステップが生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理するステップとをコンピュータに実行させる。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
好ましくは、符号化処理は、非可逆符号化処理である。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
この発明のさらに他の局面に従うと、記録媒体は、画像符号化プログラムを記録した媒体である。
この発明に従えば、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
本発明に係る画像符号化装置は、入力画像を所定のブロック単位で像域判定し、像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成する。そして、生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理する。
したがって、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
本発明に係る画像符号化方法は、入力画像を所定のブロック単位で像域判定し、像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成する。そして、生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理する。
したがって、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
本発明に係る画像符号化プログラムは、入力画像を所定のブロック単位で像域判定し、像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成する。そして、生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理する。
したがって、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
本発明に係る記録媒体は、画像符号化プログラムを記録する。画像符号化プログラムは、入力画像を所定のブロック単位で像域判定し、像域判定結果に基づいて、入力画像のデータを使用して、画像再生時に有効であるか無効であるかを所定のブロック単位で規定された2以上の層データを生成する。そして、生成した2以上の層データの各々に適する符号化条件で、2以上の層データの各々に適するブロック単位で、2以上の層データの各々を符号化処理する。
したがって、画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
<第1の実施の形態>
図1は、第1の実施の形態における画像符号化装置1000の構成を示すブロック図である。図1を参照して、画像符号化装置1000は、画像処理部100と、データバス50と、制御部120と、一時記憶部130と、記憶部140と、記録媒体アクセス部150と、記録媒体70とを備える。
データバス50には、画像処理部100、制御部120、一時記憶部130、記憶部140および記録媒体アクセス部150が接続されている。
記憶部140には、画像処理部100および制御部120に後述する処理を行なわせるための画像符号化プログラム72、入力画像データ、その他各種プログラムおよびデータ等が記憶されている。記憶部140は、画像処理部100および制御部120によってデータアクセスされる。
記憶部140は、大容量のデータを記憶可能なハードディスクである。なお、記憶部140は、ハードディスクに限定されることなく、電源を供給されなくてもデータを不揮発的に保持可能な媒体(たとえば、フラッシュメモリ)であればよい。
画像処理部100は、詳細は後述するが、記憶部140に記憶された画像符号化プログラム72に従って、後述する画像処理を行なう。
制御部120は、記憶部140に記憶された画像符号化プログラム72に従って、画像符号化装置1000内の各部に対する各種処理や、演算処理等を行なう機能を有する。また、制御部120は、画像処理部100で行なわれている処理を監視する機能を有する。
制御部120は、マイクロプロセッサ(Microprocessor)、プログラミングすることができるLSI(Large Scale Integration)であるFPGA(Field Programmable Gate Array)、特定の用途のために設計、製造される集積回路であるASIC(Application Specific Integrated Circuit)、その他の演算機能を有する回路のいずれであってもよい。
一時記憶部130は、データを一時的に記憶する機能を有する。一時記憶部130は、画像処理部100および制御部120によってデータアクセスされ、ワークメモリとして動作する。一時記憶部130は、RAM(Random Access Memory)、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、SDRAM(Synchronous DRAM)、DDR−SDRAM(Double Data Rate SDRAM)、RDRAM(Rambus Dynamic Random Access Memory)、Direct−RDRAM(Direct Rambus Dynamic Random Access Memory)、その他、データを揮発的に記憶保持可能な構成を有する回路のいずれであってもよい。
記録媒体70には、前述した画像符号化プログラム72が記録されている。
記録媒体アクセス部150は、画像符号化プログラム72が記録された記録媒体70から、画像符号化プログラム72を読出す機能を有する。記録媒体70に記憶されている画像符号化プログラム72は、制御部120のインストール処理により、記録媒体アクセス部150から読み出され、記憶部140に記憶される。
このインストール処理用プログラムは、予め、記憶部140に格納されており、インストール処理は、制御部120が、インストール処理用プログラムに基づいて行なう。
なお、記憶部140には、画像符号化プログラム72が記憶されていなくてもよい。この場合、制御部120は、記録媒体アクセス部150を介して、記録媒体70に記憶された画像符号化プログラム72を読み出して、画像符号化プログラム72に基づいた所定の処理を行なう。
記録媒体70は、画像符号化装置1000から着脱可能な媒体である。すなわち、記録媒体70に記録されている画像符号化プログラム72は、媒体等に記録されてプログラム製品として流通される。また、記録媒体70もプログラム製品として流通される。
記録媒体70は、DVD−ROM(Digital Versatile Disk Read Only Memory)、DVD−R(Digital Versatile Disk Recordable)、DVD−RAM(Digital Versatile Disk Random Access Memory)、DVD+RW(Digital Versatile Disk Re-Writable)、DVD−RW、CD−ROM(Compact Disk Read Only Memory)、MO(Magneto Optical Disk)、MD(Mini Disc)(登録商標)、フロッピー(登録商標)ディスク、着脱可能なハードディスク、CF(Compact Flash) カード、SM(Smart Media(登録商標))、MMC(Multi Media Card)、SD(Secure Digital)メモリーカード、メモリースティック(登録商標)、xDピクチャーカードおよびUSBメモリ、カセットテープ、磁気テープ、ICカード(メモリーカードを含む)、光カード、マスクROM、EPROM、EEPROM、フラッシュROM、その他不揮発性メモリのいずれであってもよい。
画像処理部100は、ブロック像域判定部101と、第1画像縮小部102と、第2画像縮小部103と、マスク生成部104と、前景画像生成部105と、背景画像生成部106とを含む。
ブロック像域判定部101には、入力画像のデータ(以下、入力画像データともいう)が入力される。入力画像は、たとえば、図示しないイメージスキャナ等を用いて読み込まれた画像である。入力画像データは、RGBなどの色空間に従うデジタル画像データである。入力画像データは、記憶部140に記憶される。
ブロック像域判定部101は、詳細は後述するが、入力画像の像域種別を所定のブロック単位で判定する。ここで、所定のブロック単位とは、入力画像、前景画像および背景画像の各々の解像度と、前景画像符号化部108、背景画像符号化部109の各々の符号化処理単位に基づいて、システム設計者が予め設定すればよい。また、所定のブロック単位は、処理条件に応じて、予め設定したブロックサイズの中から、自動的に選択されるようにしてもよい。ブロックサイズの具体例については、後述する。
ブロック像域判定部101は、マスク生成部104と接続される。ブロック像域判定部101は、像域種別の判定結果をマスク生成部104へ出力する。なお、ブロック像域判定部101は、たとえば、専用のLSIによって構成される。
第1画像縮小部102には、入力画像データが入力される。第1画像縮小部102は、入力画像の解像度を下げることにより、入力画像を縮小する。第1画像縮小部102は、前景画像生成部105と接続される。第1画像縮小部102は、縮小した入力画像(以下、第1縮小画像ともいう)のデータを、前景画像生成部105へ出力する。第1縮小画像は、文字、線等の像域に対し後述する処理が行なわれる画像である。なお、第1画像縮小部102は、たとえば、専用のLSIによって構成される。
第2画像縮小部103には、入力画像データが入力される。第2画像縮小部103は、入力画像の解像度を下げることにより、入力画像を縮小する。第2画像縮小部103は、背景画像生成部106と接続される。第2画像縮小部103は、縮小した入力画像(以下、第2縮小画像ともいう)のデータを、背景画像生成部106へ出力する。第2縮小画像は、写真等の像域に対し後述する処理が行なわれる画像である。なお、第2画像縮小部103は、たとえば、専用のLSIによって構成される。
ここで、第1縮小画像および第2縮小画像の解像度(サイズ)は、目標とする画質や符号化画像データ容量に応じて決定すればよい。
たとえば、第1縮小画像の縦および横方向の解像度(サイズ)は、入力画像の縦および横方向の解像度(サイズ)をそれぞれ、2のM乗の値および2のM’乗の値で除した値を有する解像度(サイズ)とすればよい。なお、M、M’は、0以上の整数とし、M=M’の関係が成立することが好ましい。また、第2縮小画像の縦および横方向の解像度(サイズ)は、入力画像の縦および横方向の解像度(サイズ)をそれぞれ、2のN乗の値および2のN’乗の値で除した解像度(サイズ)とすればよい。なお、N、N’は、0以上の整数とし、N=N’の関係が成立することが好ましい。
また、写真等の像域に対し後述する処理が行なわれる第2縮小画像の解像度は、文字、線等の像域に対し後述する処理が行なわれる第1縮小画像の解像度よりも、解像度が低いこと(M<NかつM’<N’)が好ましい。なぜなら、一般に、文字や線の解像度より、写真や背景色の解像度が低くても、写真や背景色の画質の劣化は目立たないからである。解像度の組み合わせに関する詳細な説明および具体例については、後述する。
第1画像縮小部102および第2画像縮小部103における、画像の縮小処理には、ニアレストネイバー(Nearest Neighbor)法、バイリニア(Bilinear)法、バイキュービック(Bicubic)法など、画像の解像度変換に一般的に用いられる既存の補間手法が使用される。
マスク生成部104は、ブロック像域判定部101と接続される。マスク生成部104は、ブロック像域判定部101で判定された像域種別の判定結果に基づいて、マスク(マスクデータ)を生成する。以下においては、複数のマスクデータから構成されるデータをマスク層データともいう。
マスクデータは、画像再生時に、処理対象のブロック画像が、前景画像として有効または無効であるかを示す情報である。ここで、ブロック画像とは、ブロック単位の画像のことをいう。また、「有効」とは、画像再生時に下層(本実施の形態では背景層)を上書きすることを示す。また、「無効」とは、画像再生時に下層(本実施の形態では背景層)のデータをそのまま用いることを示す。
本実施の形態では、画像またはデータが、3層構造で処理される。1つ目の層は、マスク層である。マスク層では、マスク層データ、後述するマスク符号化データが処理される。2つ目の層は、前景層である。前景層は、前景画像が処理される。3つ目の層は、背景層である。背景層は、背景画像が処理される。
画像処理部100は、さらに、マスク符号化部107と、前景画像符号化部108と、背景画像符号化部109と、フォーマット部110とを含む。
マスク生成部104は、マスク符号化部107と接続される。マスク生成部104は、生成したマスクをマスク符号化部107へ出力する。
また、マスク生成部104は、前景画像生成部105と接続される。マスク生成部104は、生成したマスクデータを前景画像生成部105へ出力する。また、マスク生成部104は、背景画像生成部106と接続される。マスク生成部104は、生成したマスクデータを背景画像生成部106へ出力する。なお、マスク生成部104は、たとえば、専用のLSIによって構成される。
前景画像生成部105は、マスク生成部104と、第1画像縮小部102とに接続される。前景画像生成部105は、マスク生成部104で生成された複数のマスクデータからなるマスク層データに基づいて、第1画像縮小部102で縮小された第1縮小画像のデータを使用して、前景画像(前景層データ)を生成する。また、前景画像生成部105は、前景画像符号化部108と接続される。前景画像生成部105は、生成した前景画像のデータを前景画像符号化部108へ出力する。なお、前景画像生成部105は、たとえば、専用のLSIによって構成される。
背景画像生成部106は、マスク生成部104と、第2画像縮小部103とに接続される。背景画像生成部106は、マスク生成部104で生成された複数のマスクデータからなるマスク層データに基づいて、第2画像縮小部103で縮小された第2縮小画像のデータを使用して、背景画像(背景層データ)を生成する。また、背景画像生成部106は、背景画像符号化部109と接続される。背景画像生成部106は、生成した背景画像のデータを背景画像符号化部109へ出力する。なお、背景画像生成部106は、たとえば、専用のLSIによって構成される。
マスク符号化部107は、マスク生成部104と接続される。マスク符号化部107は、マスク生成部104で生成された複数のマスクデータからなるマスク層データを可逆符号化する。マスクデータは、前述したように、対応するブロック画像が、前景画像として有効であるか否かを示すデータである。
可逆符号化では、各画素(または各ブロック)単位における選択のための情報を2値で表現する場合(2値画像データを使用する場合)、2値画像の可逆符号化に適した符号化方式が使用される。当該符号化方式は、MR(Modified Read)、MMR(Modified Modified Read)、JBIG(Joint Bi-level Image Coding Expert Group)等のいずれの符号化方式であってもよい。
マスク符号化部107は、フォーマット部110と接続される。マスク符号化部107は、符号化したマスクデータをフォーマット部110へ出力する。なお、マスク符号化部107は、たとえば、専用のLSIによって構成される。
前景画像符号化部108は、前景画像生成部105と接続される。前景画像符号化部108は、前景画像生成部105で生成された前景画像を非可逆符号化する。非可逆符号化を行なう符号化方式は、多値画像の符号化に好適なJPEG方式が使用される。なお、非可逆符号化を行なう符号化方式は、JPEG方式に限定されることなく、他の符号化方式であってもよい。
また、前景画像符号化部108は、フォーマット部110と接続される。前景画像符号化部108は、符号化した前景画像のデータをフォーマット部110へ出力する。なお、前景画像符号化部108は、たとえば、専用のLSIによって構成される。
背景画像符号化部109は、背景画像生成部106と接続される。背景画像符号化部109は、背景画像生成部106で生成された背景画像を非可逆符号化する。非可逆符号化を行なう符号化方式は、多値画像の符号化に好適なJPEG方式が使用される。なお、非可逆符号化を行なう符号化方式は、JPEG方式に限定されることなく、他の符号化方式であってもよい。
また、背景画像符号化部109は、フォーマット部110と接続される。背景画像符号化部109は、符号化した背景画像のデータをフォーマット部110へ出力する。なお、背景画像符号化部109は、たとえば、専用のLSIによって構成される。
フォーマット部110は、マスク符号化部107、前景画像符号化部108および背景画像符号化部109と接続される。フォーマット部110は、マスク符号化部107、前景画像符号化部108および背景画像符号化部109で、それぞれ生成された、マスク符号化データ、前景符号化データ、背景符号化データを統合的に取り扱うことができるように関係付けたデータ(以下、関係付けデータともいう)を作成する。
フォーマット部110は、マスク符号化データ、後述する前景画像符号化データ、後述する背景画像符号化データおよび関係付けデータを一つの符号化画像データとして、たとえば、一つの汎用的な電子データ(以下、汎用統合データともいう)を生成する。なお、汎用統合データは、図1の圧縮画像データに相当する。フォーマット部110が生成する汎用統合データのフォーマットは、たとえば、Adobe社のPDFに従うデータフォーマットである。
フォーマット部110は、汎用統合データを、データバス50を介して、一時記憶部130または記憶部140に記憶させる。また、フォーマット部110は、汎用統合データを、LAN(Local Area Network)などの通信経路を介して外部機器へ出力してもよい。
なお、前述の説明では、第1画像縮小部102および第2画像縮小部103は、それぞれ異なる構成要素として説明した。しかしながら、第1画像縮小部102および第2画像縮小部103は、一つの画像縮小部として構成されてもよい。この場合、画像縮小部は、解像度変換時のパラメータを変更して、適宜、第1画像縮小部102または第2画像縮小部103の機能による処理を行なえばよい。
また、前述の説明では、前景画像符号化部108および背景画像符号化部109は、それぞれ異なる構成要素として説明した。しかしながら、前景画像符号化部108および背景画像符号化部109のどちらもJPEG方式を用いる場合、前景画像符号化部108および背景画像符号化部109は、一つのJPEG符号化LSIとして構成されてもよい。
また、前述のブロック像域判定部101、第1画像縮小部102、第2画像縮小部103、マスク生成部104、前景画像生成部105、背景画像生成部106、マスク符号化部107、前景画像符号化部108、背景画像符号化部109およびフォーマット部110の各々が行なう処理は、専用のLSIではなく、パーソナルコンピュータなどの一般的なコンピュータのマイクロプロセッサまたは制御部120により実行されてもよい。この場合、たとえば、後述する画像符号化処理をコンピュータまたは制御部120に実行させるためのプログラムとして記述してもよい。当該プログラムは、画像符号化プログラム72であり、記録媒体70に記録されて流通する。
コンピュータにより、後述する画像符号化処理が実行される場合、画像符号化プログラム72は、記録媒体70に記録され、コンピュータが備える記録媒体アクセス部により、コンピュータが備える記憶部に読み込まれ、CPU(Central Processing Unit)で実行される。
制御部120により、後述する画像符号化処理が実行される場合、画像符号化プログラム72は、記録媒体70に記録され、制御部120により実行される。
さらに、画像符号化プログラム72は、インターネットなどのネットワークを介して他の装置からダウンロードされてもよい。
また、画像処理部100に含まれる、前述した複数の専用のLSIとコンピュータのマイクロプロセッサとを組み合わせてもよい。また、前述した複数の専用のLSIの一部または全てを一つの専用のLSIとして構成してもよい。
次に、第1の実施の形態における画像符号化装置1000の具体的な処理内容について説明する。
図2は、第1の実施の形態において、画像符号化装置1000で実行される画像符号化処理のフローチャートを示す。図2を参照して、ステップS101では、画像データ読出し処理が行なわれる。画像データ読出し処理では、画像処理部100が、記憶部140に記憶されている入力画像データを、所定のブロック単位で読み出す。
図3は、第1の実施の形態において、画像符号化装置1000で処理される画像を示す図である。なお、図3に示される各画像の解像度を忠実に図にて表現することは困難である。そのため、図3では、後述する図6のデータテーブルT100の組合せ番号“1”に対応する解像度と、ブロックサイズの関係を想定して、相対的な関係を例示する。
図3を参照して、入力画像100Gは、入力画像データに基づく画像である。入力画像100Gは、文字と、写真とが配置された画像である。なお、写真が表示されている領域内には、文字も配置されている。
ステップS101の画像データ読出し処理において、読み出される画像は、たとえば、所定のブロックに対応する領域100R内の画像である。領域100Rのサイズは、たとえば、横32画素、縦32画素のサイズである。ステップS101の処理が繰り返される毎に、領域100Rの位置は、前回の位置と重ならない位置に移動する。なお、初めてステップS101の処理が行なわれるときは、領域100Rの位置は、入力画像100Gの左上である。
具体的には、ステップS101の処理が繰り返される毎に、領域100Rの位置は、右に移動する。そして、領域100Rの位置が入力画像100Gの右端になると、次のステップS101の処理では、領域100Rの位置は、領域100Rの縦のサイズだけ下の位置であって、入力画像100Gの左端に移動する。上記処理が、繰り返されることにより、最終的に、領域100Rの位置は、入力画像100Gの右下の位置(領域100RFの位置)まで移動する。
再び、図2を参照して、読み出された所定のブロック単位の入力画像データは、ブロック像域判定部101、第1画像縮小部102および第2画像縮小部103へ入力される。以下においては、ブロック単位の画像データを、ブロック画像データともいう。また、前述したように、ブロック単位の画像のことをブロック画像という。また、画像データが入力画像データである場合のブロック画像データを入力ブロック画像データともいう。画像が入力画像である場合のブロック画像を入力ブロック画像ともいう。その後、ステップS110に進む。
ステップS110では、像域判定処理が行なわれる。像域判定処理では、ブロック像域判定部101が、ステップS101により入力された入力ブロック画像データに対し、後述する処理を行なう。ブロック像域判定部101は、領域100R内の各画素単位ではなく、所定のブロック画像(たとえば、領域100R内の画像)単位で後述する処理を行なう。この点が、本発明の一つの特徴である。像域判定処理は、処理対象の像域(ブロック画像)が、文字または線が存在する像域(ブロック画像)あるか否かを判定する処理である。
図4は、像域判定処理のフローチャートである。図4を参照して、ステップS112では、ブロック像域判定部101が、入力された入力ブロック画像(領域100R内の画像)内に、文字または線が存在するか否かを判定する。当該判定は、予め生成した画素単位マスクプレーンに基づいて行なわれる。
画素単位マスクプレーンは、入力画像の各画素が、文字または線画部分に該当する画素であるか否かを示す複数のデータ(以下、文字判定データともいう)から構成される。したがって、画素単位マスクプレーンは、入力画像(たとえば、入力画像100G)の全画素数と同じ数の文字判定データから構成される。また、複数の文字判定データは、入力画像の複数の画素(全画素)にそれぞれ対応する。
本実施の形態では、文字判定データが、入力画像の文字または線画部分に該当する画素に対応する場合、文字判定データを“1”とする。また、文字判定データが、入力画像の文字または線画部分に該当しない画素に対応する場合、文字判定データを“0”とする。
画素単位マスクプレーンの作成は、たとえば、入力画像の各画素の輝度データを用いて、特開平2−123479号公報または特開平2−155087号公報に開示されている技術により行なわれる。具体的には、制御部120が、記憶部140に記憶されている入力画像データから、予め用意した尾根画素検出パターンを適用して尾根画素を検出する。そして、制御部120が、予め定めた領域単位で計数することより、計数値に基づいて文字または線画部分に該当する画素であるか否かを判定し、複数の文字判定データの各々を“1”または“0”に設定する。制御部120は、以上の処理により生成した画素単位マスクプレーンを、記憶部140に記憶させる。なお、画像符号化装置1000の外部で、画素単位マスクプレーンを予め生成し、記憶部140に記憶させてもよい。
次に、入力されたブロック画像(領域100R内の画像)内に、文字または線が存在するか否かを判定する具体的な処理を説明する。
ブロック像域判定部101は、記憶部140に記憶された画素単位マスクプレーンを参照し、入力されたブロック画像(領域100R内の画像)内の複数の画素にそれぞれ対応する複数の文字判定データのうち、“1”に設定された文字判定データが1つ以上あるか否かを判定する。“1”に設定された文字判定データが1つ以上あれば、ブロック画像内には、文字または線が存在することになる。なお、判定の対象となる“1”に設定された文字判定データの数は、1以上に限定されることなく、N(2以上の自然数)以上であってもよい。以下においては、文字または線が存在するブロック画像を、線分ブロック画像ともいう。また、文字または線が存在しないブロック画像を、非線分ブロック画像ともいう。
なお、ブロック像域判定部101は、複数の文字判定データが、全て“1”に設定されている場合、判定対象のブロック画像を、線分ブロック画像と判定してもよい。ブロック像域判定部101は、複数の文字判定データのうち、“0”に設定された文字判定データが1つ以上ある場合、判定対象のブロック画像を、非線分ブロック画像と判定してもよい。
ステップS112において、YESならば、ステップS114Aに進む。一方、ステップS112において、NOならば、ステップS114Bに進む。
なお、ステップS112では、予め生成した画素単位マスクプレーンを使用しなくても、判定対象のブロック画像が、線分ブロック画像および非線分ブロック画像のいずれであるか判定することが可能である。
次に、画素単位マスクプレーンを使用せず、判定対象のブロック画像内の複数の画素値を用いて、判定対象のブロック画像が、線分ブロック画像および非線分ブロック画像のいずれであるか判定する方法を説明する。
この方法は、特開平5−014701号公報に開示されている技術を用いる。具体的には、まず、ブロック像域判定部101が、判定対象のブロック画像内の複数の画素値から最大濃度レベルと最小濃度レベルの差を求める。次に、ブロック像域判定部101は、濃度レベルの差のデータに基づいて閾値(たとえば、中間レベル)を定める。次に、ブロック像域判定部101は、ブロック内の画素を所定の方向に走査した際に濃度レベルが極大および極小となる点を抽出し、極大および極小の画素レベルの差からパルスの高さを求める。次に、ブロック像域判定部101は、求めたパルスの高さが、上記の閾値よりも大きい場合について計数する。次に、ブロック像域判定部101は、計数値が所定の値よりも小さいか否かで、判定対象のブロック画像が、線分ブロック画像または非線分ブロック画像であると判定することができる。
また、他の方法としては、特開平5−114045号公報に開示されている技術を用いる。具体的には、まず、ブロック像域判定部101が、「判定対象のブロック画像内で所定の閾値以上の濃度(たとえば、閾値以下の輝度値)を持つ画素の総数」を「判定対象のブロック画像内の画素の総数」で除算した値(以下、黒画素密度ともいう)を算出する。次に、ブロック像域判定部101は、黒画素密度の大小に基づいて、判定対象のブロック画像が、線分ブロック画像または非線分ブロック画像であるか判定することができる。すなわち、線分ブロック画像では黒画素密度が比較的小さい傾向にあることを利用する。
また、他の方法としては、特開平5−114045号公報に開示されている技術を用いる。具体的には、まず、ブロック像域判定部101が、「判定対象のブロック画像内で所定の閾値以上の画素値(輝度値)を持つ画素の総数」を「判定対象のブロック画像内の画素の総数」で除算した値(以下、黒画素密度ともいう)を算出する。次に、ブロック像域判定部101は、黒画素密度の大小に基づいて、判定対象のブロック画像が、線分ブロック画像または非線分ブロック画像であるか判定することができる。すなわち、線分ブロック画像では黒画素密度が比較的小さい傾向にあることを利用する。
また、他の方法としては、文字、線に加え、エッジ部分も判定に利用する。具体的には、まず、ブロック像域判定部101が、判定対象のブロック画像について横および縦の各方向にSobelオペレータなどの微分(または差分)オペレータを適用して、対応する画素単位で適用結果の絶対値を加算して傾きの大きさを算出する。
次に、ブロック像域判定部101は、算出した傾きの大きさが閾値より大きい画素を文字・線またはエッジ部分であると判定する。判定対象のブロック画像が、文字・線またはエッジ部分を含む場合、ブロック像域判定部101は、判定対象のブロック画像が、文字・線またはエッジ部分を含む線分ブロック画像であると判定することができる。
なお、判定対象のブロック画像が、文字・線またはエッジ部分を含むか否かの判定は、判定対象のブロック画像の画素値および当該ブロック画像の周辺の画素値を用いて行なわれてもよい。
ステップS114Aでは、ブロック像域判定部101が、線分ブロックデータを“1”に設定する。線分ブロックデータは、処理対象のブロック画像が、線分ブロック画像であるか否かを示すデータである。線分ブロックデータが“1”に設定されている場合は、処理対象のブロック画像が、線分ブロック画像であることを示す。一方、線分ブロックデータが“0”に設定されている場合は、処理対象のブロック画像が、非線分ブロック画像であることを示す。
ブロック像域判定部101は、“1”に設定した線分ブロックデータを、マスク生成部104へ送信する。また、ブロック像域判定部101は、処理対象のブロック画像を特定する情報と対応づけて、“1”に設定した線分ブロックデータを、一時記憶部130に記憶させる。その後、この像域判定処理は終了し、図2の画像符号化処理に戻り、ステップS110の次のステップS120に進む。
ステップS114Bでは、ブロック像域判定部101が、線分ブロックデータを“0”に設定する。ブロック像域判定部101は、“0”に設定した線分ブロックデータを、マスク生成部104へ送信する。また、ブロック像域判定部101は、処理対象のブロック画像を特定する情報と対応づけて、“0”に設定した線分ブロックデータを、一時記憶部130に記憶させる。その後、この像域判定処理は終了し、図2の画像符号化処理に戻り、ステップS110の次のステップS120に進む。
再び、図3を参照して、画像110Gは、像域判定処理により設定された線分ブロックデータの状態を視覚的に分かりやすく示した画像である。入力画像100Gに対し、ブロック画像単位で前述の像域判定処理を行なった場合、処理対象のブロック画像が、線分ブロック画像と判定されたブロック画像内の全画素は、白(たとえば、画素値“1”)で示される。また、処理対象のブロック画像が、非線分ブロック画像と判定されたブロック画像内の全画素は、黒(たとえば、画素値“0”)で示される。
再び、図2を参照して、ステップS120では、マスク生成処理が行なわれる。マスク生成処理では、像域判定処理により設定された線分ブロックデータに基づいて、マスクデータが生成される。マスクデータは、処理対象のブロック画像が、前景画像として有効であるか否かを示すデータである。マスクデータは、“0”または“1”のいずれかを示す1ビットのデータである。
マスクデータが“1”に設定された場合、処理対象のブロック画像は、前景画像として有効となる。一方、マスクデータが“0”に設定された場合、処理対象のブロック画像は、前景画像として無効となる。マスクデータは、ステップS110の像域判定処理で処理される1つのブロック画像に対し、1つの値を示す。なお、マスクデータは、ステップS110の像域判定処理で処理される1つのブロック画像内の全ての画素に対し、1つの値を示してもよい。
図5は、マスク生成処理のフローチャートである。図5を参照して、ステップS122では、処理対象のブロック画像が、線分ブロック画像であるか否かが判定される。具体的には、マスク生成部104が、受信した線分ブロックデータが“1”に設定されているか否かを判定する。ステップS122において、YESならば、ステップS124Aに進む。一方、ステップS122において、NOならば、ステップS124Bに進む。
ステップS124Aでは、マスク生成部104が、マスクデータを“1”に設定する。すなわち、処理対象のブロック画像は、前景画像として有効となる。マスク生成部104は、“1”に設定したマスクデータを、マスク符号化部107、前景画像生成部105および背景画像生成部106へ送信する。また、マスク生成部104は、処理対象のブロック画像を特定する情報と対応づけて、“1”に設定したマスクデータを、一時記憶部130に記憶させる。その後、このマスク生成処理は終了し、図2の画像符号化処理に戻り、ステップS120の次のステップS132に進む。
ステップS124Bでは、マスク生成部104が、マスクデータを“0”に設定する。すなわち、処理対象のブロック画像は、前景画像として無効となる。マスク生成部104は、“0”に設定したマスクデータを、マスク符号化部107、前景画像生成部105および背景画像生成部106へ送信する。また、マスク生成部104は、処理対象のブロック画像を特定する情報と対応づけて、“0”に設定したマスクデータを、一時記憶部130に記憶させる。その後、このマスク生成処理は終了し、図2の画像符号化処理に戻り、ステップS120の次のステップS132に進む。
再び、図3を参照して、画像120Gは、マスク生成処理により設定されたマスクデータの状態を視覚的に分かりやすく示した画像である。マスク生成処理により、前景画像として有効と判定されたブロック画像は、白(たとえば、画素値“1”)の1画素で示される。また、マスク生成処理により、前景画像として無効と判定されたブロック画像は、黒(たとえば、画素値“0”)の1画素で示される。ここで、画像120Gの解像度は、画像110Gの解像度600dpi(dots per inch)を、ブロック像域判定処理単位の画素数32画素で除した、18.75dpiとしている。なぜなら、一つのブロック画像に対し、一つの値が設定されているからである。
再び、図2を参照して、ステップS132では、画像縮小処理Aが行なわれる。画像縮小処理Aでは、第1画像縮小部102が、ステップS101により入力された入力ブロック画像データに基づいて、入力ブロック画像の解像度を下げる。すなわち、入力ブロック画像を縮小する。入力ブロック画像の縮小は、以下に説明するデータテーブルT100に基づいて行なわれる。
図6は、データテーブルT100を示す図である。データテーブルT100は、画像の解像度とブロックサイズとの関係を示すテーブルである。図6を参照して、組合せ番号とは、画像の解像度と対応するブロックサイズの組み合わせを特定するための番号である。なお、画像の解像度と対応するブロックサイズの組み合わせは、データテーブルT100に示されるものに限定されることはない。
たとえば、組合せ番号“1”では、入力画像、前景画像および背景画像の解像度を、それぞれ、600dpi、300dpiおよび150dpiとする。この場合、像域判定処理は、横32画素、縦32画素のサイズのブロック画像を1つの単位として行なわれる。また、前景画像は、横16画素、縦16画素のサイズのブロック画像毎に処理される。また、背景画像は、横8画素、縦8画素のサイズのブロック画像毎に処理される。組合せ番号“2”〜“4”も、前述した組合せ番号“1”と同様であるので詳細な説明は繰り返さない。
ここで、ブロックサイズの画素数を決定する際の基準に関して説明する。画像の解像度とブロックサイズの関係を示すデータテーブルT100において、ブロックサイズの横画素数および縦画素数は、8の倍数である。8の倍数が用いられる理由は、前景画像符号化部108および背景画像符号化部109が、JPEG方式により画像を符号化するためである。
JPEG方式は、公知の通り、8画素×8画素のサイズのブロック画像毎に処理を行なう。JPEG方式において、ブロック画像毎の処理では、まずDCT(離散コサイン変換)が行なわれ、1個のDC(直流)成分値と、63個のAC(交流)成分値が算出される。そして、算出された64個の値を、それぞれの成分に対応する量子化幅を規定した量子化テーブルを用いて、除算することにより量子化する。
さらに、DC成分値については、一つ前に処理されたブロック画像のDC成分値との差分値を利用してハフマン符号化が行なわれる。AC成分値については、ブロック画像内の63個の値をジグザグスキャンしてハフマン符号化が行なわれる。なお、ハフマン符号化は可逆な符号化であり、一般に、JPEG方式における非可逆性は、量子化誤差およびDCT計算時の誤差に起因するものである。
したがって、JPEG方式を用いて画像を符号化した際に生じる画質の劣化は、基本的に処理単位であるブロック画像(8画素×8画素)内で生じるものである。すなわち、ブロック画像内の画質の劣化は、ブロック画像内で閉じて生じるものである。そのため、JPEGの処理対象となるブロック画像は、当該ブロック画像外の画素の値や、周囲のブロック画像により、画質劣化が生じることはない。
そこで、本発明では、画像の解像度とブロック画像のサイズの関係を示すデータテーブルT100に示すように、像域判定、前景画像、背景画像の各処理におけるブロック画像のサイズの横画素数および縦画素数を8の倍数で規定している。これにより、前景画像、背景画像を生成する際、画像再生時に不要なブロックに、ブロック画像単位で任意の画素値を設定することが可能となる。
すなわち、不要なブロック画像内のドント・ケア画素の画素値に起因する色にじみを防ぐことができる。その結果、不要なブロック画像に設定する画素値に関わらず、再生画像を一定の品質に保つことができるという効果を奏する。
なお、像域判定、前景画像、背景画像の各処理におけるブロック画像のサイズについて、最小解像度の画像(本実施の形態では背景画像)の処理単位となるブロック画像の最小のサイズは、8画素×8画素とすることが好ましい。以下においては、画像の処理単位となるブロック画像の最小のサイズを最小ブロック画像サイズともいう。
また、最小解像度以上の画像(本実施の形態では入力画像と前景画像)の処理単位となるブロック画像の横画素数および縦画素数の各々は、以下の式(1)により算出される値とすることが好ましい。
画素数=8×(処理対象の画像の解像度)/(最小解像度) ・・・(1)
上記のように、最小ブロック画像サイズを8画素×8画素に設定することにより、像域分離精度を最大限に高めることができる。ここで、像域分離精度とは、文字または線が存在する像域(ブロック画像)と、文字または線が存在しない像域(ブロック画像)とを分離する精度である。また、最小ブロック画像サイズを処理単位としない画像には、式(1)で算出される値を用いてブロック画像のサイズを設定する。これにより、入力画像、前景画像および背景画像の間で、一つのブロック画像に対応する画像情報が、相対的に画像中の同じブロック画像部分を指し示すことを可能とする。
具体的には、データテーブルT100の組合せ番号“1”では、式(1)に各値を代入することにより以下のようになる。まず、像域判定処理における処理単位となるブロック画像の横画素数は、8×600/150=32となる。また、前景画像の処理単位となるブロック画像の横画素数は、8×300/150=16となる。なお、背景画像の処理単位となるブロック画像の横画素数は、式(1)に関係なく8とする。
また、データテーブルT100の組合せ番号“2”では、式(1)に各値を代入することにより以下のようになる。まず、像域判定処理における処理単位となるブロック画像の横画素数は、8×600/300=16となる。また、前景画像の処理単位となるブロック画像の横画素数は、8×600/300=16となる。なお、背景画像の処理単位となるブロック画像の横画素数は、式(1)に関係なく8とする。
また、データテーブルT100の組合せ番号“3”では、式(1)に各値を代入することにより以下のようになる。まず、像域判定処理における処理単位となるブロック画像の横画素数は、8×600/150=32となる。また、前景画像の処理単位となるブロック画像の横画素数は、8×600/150=32となる。なお、背景画像の処理単位となるブロック画像の横画素数は、式(1)に関係なく8とする。
また、データテーブルT100の組合せ番号“4”では、式(1)に各値を代入することにより以下のようになる。まず、像域判定処理における処理単位となるブロック画像の横画素数は、8×300/150=16となる。また、前景画像の処理単位となるブロック画像の横画素数は、8×300/150=16となる。なお、背景画像の処理単位となるブロック画像の横画素数は、式(1)に関係なく8とする。
図7は、各画像の解像度と、各画像の処理単位となるブロック画像の相対的な大小関係を例示した図である。図7(A)は、データテーブルT100の組合せ番号“1”の各データに対応した、入力画像、前景画像および背景画像の各々の、解像度および処理単位となるブロック画像のサイズの関係を示す。
図7(B)は、データテーブルT100の組合せ番号“2”の各データに対応した、入力画像、前景画像および背景画像の各々の、解像度および処理単位となるブロック画像のサイズの関係を示す。
図7(C)は、データテーブルT100の組合せ番号“3”の各データに対応した、入力画像、前景画像および背景画像の各々の、解像度および処理単位となるブロック画像のサイズの関係を示す。
図7(D)は、データテーブルT100の組合せ番号“4”の各データに対応した、入力画像、前景画像および背景画像の各々の、解像度および処理単位となるブロック画像のサイズの関係を示す。
たとえば、データテーブルT100の組合せ番号“1”では、入力画像、前景画像および背景画像の解像度は、それぞれ、600dpi、300dpiおよび150dpiである。
図7(A)を参照して、ブロック画像10Gは、入力画像の処理単位となるブロック画像である。ブロック画像10GAは、前景画像の処理単位となるブロック画像である。ブロック画像10GBは、背景画像の処理単位となるブロック画像である。
ブロック画像10G、ブロック画像10GAおよびブロック画像10GBのサイズは、それぞれ、32画素×32画素、16画素×16画素および8画素×8画素とする。これにより、入力画像、前景画像および背景画像の間で、一つのブロック画像に対応する画像情報が、相対的に画像中の同じブロック画像部分を指し示すことになる。なお、データテーブルT100の組合せ番号が“2”〜“4”についても、 図7(B)、図7(C)、図7(D)に示すように、前述したデータテーブルT100の組合せ番号“1”の場合と同様であるので詳細な説明は繰り返さない。
再び、図2を参照して、ステップS132では、第1画像縮小部102が、たとえば、データテーブルT100の組合せ番号“1”の各データおよびステップS101により入力された入力ブロック画像データに基づいて、入力ブロック画像を縮小する。たとえば、ステップS101により入力された入力ブロック画像のサイズが32画素×32画素である場合、16画素×16画素のブロック画像に縮小する。縮小処理には、前述したように、ニアレストネイバー法、バイリニア法、バイキュービック法など、画像の解像度変換に一般的に用いられる既存の補間手法が使用される。
再び、図3を参照して、第1縮小画像111Gは、第1画像縮小部102により、全ての入力ブロック画像が、画像縮小処理Aにより、それぞれ縮小された複数の縮小ブロック画像から構成される画像である。第1縮小画像111Gの解像度は、入力画像の解像度(600dpi)に対して、半分の解像度(300dpi)となっている。
ステップS132(画像縮小処理A)では、たとえば、入力画像100G内の領域100R内の画像が、第1縮小画像111G内の領域111R内の画像に縮小される。以下においては、画像縮小処理Aにより縮小された画像を第1縮小ブロック画像ともいう。
再び、図2を参照して、ステップS132(画像縮小処理A)では、第1画像縮小部102が、生成した第1縮小ブロック画像のデータを、前景画像生成部105へ送信する。その後、ステップS140に進む。
ステップS140では、前景画像生成処理が行なわれる。前景画像生成処理は、ステップS120により設定されたマスクデータに基づいて、ステップS132で生成された第1縮小ブロック画像を使用して、前景画像を生成する。
図8は、前景画像生成処理のフローチャートである。図8を参照して、ステップS141では、前景画像生成部105が、前述のマスク生成処理により、マスク生成部104が送信したマスクデータを受信する。その後、ステップS142に進む。
ステップS142では、第1画像縮小部102から送信された第1縮小ブロック画像が、前景画像として有効であるか否かが判定される。具体的には、受信したマスクデータが“1”であるか否かが、前景画像生成部105により判定される。マスクデータが“1”である場合、第1縮小ブロック画像は前景画像として有効となる。一方、マスクデータが“0”である場合、第1縮小ブロック画像は前景画像として無効となる。
ステップS142において、YESならば、ステップS144Aに進む。一方、ステップS142において、NOならば、ステップS144Bに進む。
ステップS144Aでは、前景画像生成部105が、受信した第1縮小ブロック画像のデータを、前景画像符号化部108へ送信する。その後、この前景画像生成処理は終了し、図2の画像符号化処理に戻り、ステップS140の次のステップS150に進む。
ステップS144Bでは、第1縮小ブロック画像と同じサイズの画像(たとえば、16×16のサイズの画像)の全ての画素を黒(画素値“0”)とした画像(以下、黒ブロック画像ともいう)のデータを、前景画像符号化部108へ送信する。その後、この前景画像生成処理は終了し、図2の画像符号化処理に戻り、ステップS140の次のステップS150に進む。
再び、図3を参照して、前景画像131Gは、前景画像生成部105が、前景画像符号化部108へ送信する全てのブロック画像のデータから構成される画像である。前景画像131Gの解像度は、第1縮小画像111Gの解像度と同じで、300dpiである。前景画像生成処理により、前景画像として有効と判定された第1縮小ブロック画像に対応する、前景画像131G内のブロック画像は、当該判定された第1縮小ブロック画像となる。一方、前景画像生成処理により、前景画像として無効と判定された第1縮小ブロック画像に対応する、前景画像131G内のブロック画像は、ブロック画像内の全ての画素が黒(画素値“0”)となる。
ステップS144Aで送信される画像は、たとえば、前景画像131G内の領域131R内の画像である。また、ステップS144Bで送信される画像は、たとえば、前景画像131G内の黒のブロック画像である。
再び、図2を参照して、ステップS150では、前景画像符号化処理が行なわれる。前景画像符号化処理では、前景画像符号化部108が、前景画像生成部105から受信した画像(たとえば、16×16のサイズの画像)を、非可逆符号化する。非可逆符号化を行なう符号化方式は、ブロック単位で処理を行なうJPEG方式が使用される。なお、非可逆符号化を行なう符号化方式は、JPEG方式に限定されることなく、ブロック単位で処理を行なう他の符号化方式であってもよい。前景画像符号化部108は、非可逆符号化したデータ(以下、前景画像ブロック符号化データともいう)を、フォーマット部110へ送信する。その後、ステップS152に進む。
ステップS152では、画像縮小処理Bが行なわれる。画像縮小処理Bでは、第2画像縮小部103が、たとえば、図6のデータテーブルT100の組合せ番号“1”の各データおよびステップS101により入力された入力ブロック画像データに基づいて、入力ブロック画像を縮小する。たとえば、ステップS101により入力された入力ブロック画像のサイズが32画素×32画素である場合、8画素×8画素のブロック画像に縮小する。縮小処理には、前述したように、ニアレストネイバー法、バイリニア法、バイキュービック法など、画像の解像度変換に一般的に用いられる既存の補間手法が使用される。
再び、図3を参照して、第2縮小画像112Gは、第2画像縮小部103により、全ての入力ブロック画像が、それぞれ縮小された複数の縮小ブロック画像から構成される画像である。第2画像縮小部103の解像度は、入力画像の解像度(600dpi)に対して、4分の1の解像度(150dpi)となっている。
ステップS152(画像縮小処理B)では、たとえば、入力画像100G内の領域100R内の画像が、第2縮小画像112G内の領域112R内の画像(たとえば、8画素×8画素のサイズの画像)に縮小される。以下においては、画像縮小処理Bにより縮小された画像を第2縮小ブロック画像(たとえば、8画素×8画素のサイズの画像)ともいう。
再び、図2を参照して、ステップS152(画像縮小処理B)では、第2画像縮小部103が、生成した第2縮小ブロック画像のデータを、背景画像生成部106へ送信する。その後、ステップS160に進む。
ステップS160では、背景画像生成処理が行なわれる。背景画像生成処理は、ステップS120により設定されたマスクデータに基づいて、ステップS152で生成された第2縮小ブロック画像を使用して、背景画像を生成する。
図9は、背景画像生成処理のフローチャートである。図9を参照して、ステップS161では、背景画像生成部106が、前述のマスク生成処理により、マスク生成部104が送信したマスクデータを受信する。その後、ステップS162に進む。
ステップS162では、第2画像縮小部103から送信された第2縮小ブロック画像が、背景画像として有効であるか否かが判定される。具体的には、受信したマスクデータが“0”であるか否かが、背景画像生成部106により判定される。マスクデータが“0”である場合、第2縮小ブロック画像は背景画像として有効となる。一方、マスクデータが“1”である場合、第2縮小ブロック画像は背景画像として無効となる。
ステップS162において、YESならば、ステップS164Aに進む。一方、ステップS162において、NOならば、ステップS164Bに進む。
ステップS164Aでは、背景画像生成部106が、受信した第2縮小ブロック画像のデータを、背景画像符号化部109へ送信する。その後、この背景画像生成処理は終了し、図2の画像符号化処理に戻り、ステップS160の次のステップS170に進む。
ステップS164Bでは、第2縮小ブロック画像と同じサイズの画像(たとえば、8×8のサイズの画像)の全ての画素を黒(画素値“0”)とした画像(以下、黒ブロック画像ともいう)のデータを、背景画像符号化部109へ送信する。その後、この背景画像生成処理は終了し、図2の画像符号化処理に戻り、ステップS160の次のステップS170に進む。
再び、図3を参照して、背景画像132Gは、背景画像生成部106が、背景画像符号化部109へ送信する全てのブロック画像のデータから構成される画像である。
背景画像132Gの解像度は、第2縮小画像112Gの解像度と同じで、150dpiである。背景画像生成処理により、前景画像として無効と判定された第2縮小ブロック画像に対応する、背景画像132G内のブロック画像は、当該判定された第2縮小ブロック画像となる。一方、前景画像生成処理により、前景画像として有効と判定された第2縮小ブロック画像に対応する、背景画像132G内のブロック画像は、ブロック画像内の全ての画素が黒(画素値“0”)となる。 ステップS164Aで送信される画像は、たとえば、背景画像132G内の領域132R内の画像である。また、ステップS164Bで送信される画像は、たとえば、背景画像132G内の黒のブロック画像である。
再び、図2を参照して、ステップS170では、背景画像符号化処理が行なわれる。背景画像符号化処理では、背景画像符号化部109が、背景画像生成部106から受信した画像(たとえば、8×8のサイズの画像)を、非可逆符号化する。非可逆符号化を行なう符号化方式は、ブロック単位で処理を行なうJPEG方式が使用される。なお、非可逆符号化を行なう符号化方式は、JPEG方式に限定されることなく、ブロック単位で処理を行なう他の符号化方式であってもよい。背景画像符号化部109は、非可逆符号化したデータ(以下、背景画像ブロック符号化データともいう)を、フォーマット部110へ送信する。その後、ステップS172に進む。
ステップS172では、入力画像全体に対し処理が終了したか否かが判定される。具体的には、制御部120が、ステップS101の処理で読み出された入力ブロック画像が、入力画像内の右下のブロック画像(領域100RF内の画像)であるか否かを判定する。
ステップS172において、YESならば、ステップS174に進む。一方、ステップS172において、NOならば、再度、ステップS101の処理が繰り返される。
ステップS174では、マスク符号化処理が行なわれる。マスク符号化処理では、マスク符号化部107が、ステップS120が繰返し行なわれることで生成された、複数のマスクデータ(2値データ)から構成されるマスク層データを、一時記憶部130から読み出す。複数のマスクデータは、入力画像内の複数のブロック画像にそれぞれ対応するデータである。そして、マスク符号化部107が、複数のマスクデータからなるマスク層データを可逆符号化する。
可逆符号化では、2値画像の可逆符号化に適した符号化方式であるMMRが使用される。なお、可逆符号化は、MMRに限定されることなく、2値画像の可逆符号化に適した符号化方式(たとえば、前述したMR、JBIG等)であればどの符号化方式であってもよい。マスク符号化部107は、符号化した符号化データ(以下、マスク符号化データともいう)を、フォーマット部110へ送信する。その後、ステップS180に進む。
ステップS180では、フォーマット処理が行なわれる。フォーマット処理では、フォーマット部110が、受信したマスク符号化データと、複数の前景画像ブロック符号化データと、複数の背景画像ブロック符号化データとの関連付けを行なう。当該関連付けは、汎用性の高いデータフォーマットを使用して行なわれる。
ここで、複数の前景画像ブロック符号化データは、ステップS150の処理が繰返し行なわれることで、前景画像符号化部108から受信した複数のデータである。以下においては、複数の前景画像ブロック符号化データから構成されるデータを前景画像符号化データともいう。
また、複数の背景画像ブロック符号化データは、ステップS170の処理が繰返し行なわれることで、背景画像符号化部109から受信した複数のデータである。以下においては、複数の背景画像ブロック符号化データから構成されるデータを背景画像符号化データともいう。
汎用性の高いデータフォーマットの一例としては、Adobe社のPDFフォーマットである。なお、汎用性の高いデータフォーマットは、Adobe社のPDFフォーマットに限定されることなく、他のデータフォーマットであってもよい。
たとえば、マスク符号化データがITU−T勧告T.6に規定されるMMR形式であり、また、前景画像符号化データおよび背景画像符号化データがJPEG形式である場合、フォーマット部110は、以下の関連付け処理を行なう。
関連付け処理では、フォーマット部110が、Adobe社のPDF形式に基づいて、マスク符号化データ、前景画像符号化データ、背景画像符号化データを関連付けた関連付けデータを作成する。そして、フォーマット部110は、マスク符号化データ、前景画像符号化データ、背景画像符号化データおよび関連付けデータを一つの符号化画像データとして、前述した汎用統合データを生成する。
汎用統合データを復号化する場合は、たとえば、前景画像符号化データをJPEGにより復号化した画像(以下、復号化前景画像ともいう)と、背景画像符号化データをJPEGにより復号化した画像(以下、復号化背景画像ともいう)と、マスク符号化データを復号化することによって得られる複数のマスクデータとを使用して行なわれる。
具体的には、まず、復号化前景画像と、復号化背景画像とのサイズが異なる場合、復号化背景画像を、復号化前景画像と同じサイズに拡大する処理が行なわれる。そして、復号化背景画像を最下層の画像とし、“1”に設定されたマスクデータに対応する復号化前景画像内のブロック画像を、復号化背景画像内の対応する位置に上書きする。上記処理を繰返し行なうことにより、汎用統合データを復号化して、符号化する前の入力画像を得ることができる。
なお、前述の説明では、ステップS101〜ステップS170までの処理をブロック画像単位で、一連の処理とすることを前提に説明した。しかしながら、本発明の一つの特徴であるブロック画像単位での像域判定が実施され、マスク層データが可逆符号化、前景画像および背景画像が非可逆符号化されていれば、前述の処理の順に限定されるものではない。
たとえば、入力画像全体について、まず、マスク生成処理、前景画像生成処理、背景画像生成処理を行ない、各処理により得られたデータを、一時記憶部130に記憶させる。その後、マスク層データ、前景画像、背景画像を符号化してもよい。すなわち、ステップS150、S170の処理を、ステップS172の後で、かつ、ステップS180の前に行なうようにしてもよい。
また、ステップS180のフォーマット処理をブロック画像単位で処理するようにしてもよい。すなわち、ステップS180の処理を、ステップS170の後で、かつ、ステップS172の前に行なうようにしてもよい。
また、処理を並列化して同時に複数の処理がなされるようにしてもよい。たとえば、ステップS132〜S150の処理と、ステップS152〜S170の処理とを、ステップS120の後に並列に行なってもよい。
また、ステップS174を、ステップS120の後で、かつ、ステップS172の前に配置し、マスクデータを所定数(たとえば2ライン、すなわち、「入力画像に対応する横方向ブロック数」×2)蓄積して、1ライン分更新が進むごとにステップS174の処理を実行するようにしてもよい。
また、ステップS132の画像縮小処理Aと、ステップS152の画像縮小処理Bとを、ステップS101で読み出すブロック画像単位ではなく、異なる処理単位で行なってもよい。
以上説明したように、本実施の形態では、処理対象となる入力画像を複数の層で別々に処理する。複数の層は、マスク層、前景層、背景層からなる。前景層では、入力画像または入力画像を縮小した画像に対し、文字、線またはエッジ部分を含む部分のブロック画像を非可逆符号化し、前景画像を生成する。
背景層では、入力画像または入力画像を縮小した画像に対し、文字、線およびエッジ部分のいずれも含まない部分のブロック画像を非可逆符号化し、背景画像を生成する。文字、線またはエッジ部分が含まれる前景画像は、背景画像以上の解像度を有する。
したがって、文字、線またはエッジ部分の画質の劣化を最小限に抑えつつ、データ容量を大幅に削減することができるという効果を奏する。
また、本実施の形態では、複数の層の画像データおよびデータを汎用性の高いフォーマットに従って関連付けし、1つのデータにする。したがって、汎用性の高いデータを作成することができるという効果を奏する。
また、本実施の形態では、所定のブロック画像単位で、処理対象のブロック画像が、文字または線が存在するか否かを判定する。また、所定のブロック画像単位で、非可逆符号化処理(たとえば、JPEGによる符号化処理)を行なう。当該非可逆符号化処理は、ブロック単位で処理を行なう。
したがって、不要なブロック画像内のドント・ケア画素の画素値に起因する色にじみを防ぐことができる。その結果、不要なブロック画像に設定する画素値に関わらず、再生画像を一定の品質に保つことができるという効果を奏する。
<第2の実施の形態>
第2の実施の形態では、マスク符号化データを使用せずに汎用統合データを生成する点が、第1の実施の形態と異なる。マスク符号化データの代わりに、前景画像に透過色を設定することにより、マスク符号化データを使用する必要がなくなる。そのため、第1の実施の形態よりも、汎用統合データのデータ容量を小さくすることができる。
図10は、第2の実施の形態における画像符号化装置1000Aの構成を示すブロック図である。図10を参照して、画像符号化装置1000Aは、図1の画像符号化装置1000と比較して、画像処理部100の代わりに画像処理部100Aを備える点が異なる。それ以外の構成は、画像符号化装置1000と同様なので詳細な説明は繰り返さない。
画像処理部100Aは、図1の画像処理部100と比較して、マスク符号化部107を含まない点と、透過色設定部112をさらに含む点とが異なる。なお、画像処理部100Aは、画像処理部100と同様、記憶部140に記憶された画像符号化プログラム72に従って、後述の処理を行なう。
透過色設定部112は、前景画像生成部105と、背景画像生成部106とに接続される。前景画像生成部105は、透過色を設定すべきブロック画像の情報を、透過色設定部112へ送信する。透過色設定部112は、透過色を設定すべきブロック画像の情報を、前景画像生成部105から受信する。透過色設定部112は、透過色を設定したブロック画像の情報を前景画像生成部105および背景画像生成部106へ送信する。
フォーマット部110は、前景画像符号化部108から、前景画像ブロック符号化データAを受信する。前景画像ブロック符号化データAは、前述の前景画像ブロック符号化データと比較して、透過色を示すデータを含む点が異なる。透過色の表現については、たとえば、透過色に設定する画素の画素値を“0”で表現し、画素値“0”が透過色であることを示すデータを別途設けることによって実現できる。なお、ある画素値が透過色であることを示すことは、たとえば、Adobe社のPDFのフォーマットによって表現可能である。上記以外の画像処理部100Aの構成は、画像処理部100と同様なので詳細な説明は繰り返さない。
透過色設定部112は、透過色を設定すべきブロック画像中の各画素に対して、透過色の色情報(たとえば、画素値“0”)を設定する。なお、透過色設定部112は、たとえば、専用のLSIによって構成される。
また、前述のブロック像域判定部101、第1画像縮小部102、第2画像縮小部103、マスク生成部104、前景画像生成部105、背景画像生成部106、前景画像符号化部108、背景画像符号化部109、フォーマット部110および透過色設定部112の各々が行なう処理は、専用のLSIではなく、パーソナルコンピュータなどの一般的なコンピュータのマイクロプロセッサまたは制御部120により実行されてもよい。
この場合、たとえば、後述する画像符号化処理Aをコンピュータまたは制御部120に実行させるためのプログラムとして記述してもよい。当該プログラムは、画像符号化プログラム72であり、記録媒体70に記録されて流通する。
コンピュータにより、後述する画像符号化処理Aが実行される場合、画像符号化プログラム72は、記録媒体70に記録され、コンピュータが備える記録媒体アクセス部により、コンピュータが備える記憶部に読み込まれ、CPUで実行される。
制御部120により、後述する画像符号化処理Aが実行される場合、画像符号化プログラム72は、記録媒体70に記録され、制御部120により実行される。
さらに、画像符号化プログラム72は、インターネットなどのネットワークを介して他の装置からダウンロードされてもよい。
また、画像処理部100Aに含まれる、前述した複数の専用のLSIとコンピュータのマイクロプロセッサとを組み合わせてもよい。また、前述した複数の専用のLSIの一部または全てを一つの専用のLSIとして構成してもよい。
次に、第2の実施の形態における画像符号化装置1000Aの具体的な処理内容について説明する。
図11は、第2の実施の形態において、画像符号化装置1000Aで実行される画像符号化処理Aのフローチャートを示す。図11を参照して、画像符号化処理Aは、図2の画像符号化処理と比較して、ステップS140の代わりに、ステップS140Aの処理が行なわれる点と、ステップS180の代わりに、ステップS180Aの処理が行なわれる点と、ステップS174の処理が行なわれない点が異なる。以下、異なる部分を主に説明する。
まず、ステップS101では、前述したのと同様、画像処理部100Aが、記憶部140に記憶されている入力画像データを、所定のブロック単位で読み出す。なお、入力画像データの読出す順序は、前述したステップS101の処理と同様なので詳細な説明は繰り返さない。
図12は、第2の実施の形態において、画像符号化装置1000Aで処理される画像を示す図である。なお、図12に示される各画像の解像度を忠実に図にて表現することは困難である。そのため、図12では、前述した図6のデータテーブルT100の組合せ番号“1”に対応する解像度と、ブロックサイズの関係を想定して、相対的な関係を例示する。
図12を参照して、入力画像100Gは、入力画像データに基づく画像である。入力画像100Gについては、前述したので詳細な説明は繰り返さない。
再び、図11を参照して、読み出された所定のブロック単位の入力画像データは、ブロック像域判定部101、第1画像縮小部102および第2画像縮小部103へ入力される。その後、ステップS110に進む。
ステップS110では、前述したのと同様、像域判定処理が行なわれる。
再び、図12を参照して、画像110Gは、像域判定処理により設定された線分ブロックデータの状態を視覚的に分かりやすく示した画像である。画像110Gについては、前述したので詳細な説明は繰り返さない。
再び、図11を参照して、ステップS110の処理の後、ステップS120の処理が行なわれる。
ステップS120では、前述したのと同様、マスク生成処理が行なわれる。なお、本実施の形態におけるマスク生成処理では、第1の実施の形態のマスク生成処理のうち、マスク生成部104が、マスクデータを、マスク符号化部107へ送信する処理は行なわれない。
再び、図12を参照して、画像120Gは、マスク生成処理により設定されたマスクデータの状態を視覚的に分かりやすく示した画像である。画像120Gについては、前述したので詳細な説明は繰り返さない。
再び、図11を参照して、ステップS120の処理の後、ステップS132の処理が行なわれる。
ステップS132では、前述したのと同様、画像縮小処理Aが行なわれる。
再び、図12を参照して、第1縮小画像111Gは、第1画像縮小部102により、全ての入力ブロック画像が、画像縮小処理Aにより、それぞれ縮小された複数の縮小ブロック画像から構成される画像である。第1縮小画像111Gについては、前述したので詳細な説明は繰り返さない。
再び、図11を参照して、ステップS132(画像縮小処理A)では、第1画像縮小部102が、生成した第1縮小ブロック画像のデータを、前景画像生成部105へ送信する。その後、ステップS140Aに進む。
ステップS140Aでは、前景画像生成処理Aが行なわれる。前景画像生成処理Aは、ステップS120により設定されたマスクデータに基づいて、ステップS132で生成された第1縮小ブロック画像を使用して、前景画像を生成する。
図13は、前景画像生成処理Aのフローチャートである。図13を参照して、ステップS241では、前景画像生成部105が、前述のマスク生成処理により、マスク生成部104が送信したマスクデータを受信する。その後、ステップS242に進む。
ステップS242では、第1画像縮小部102から送信された第1縮小ブロック画像が、前景画像として有効であるか否かが判定される。具体的には、受信したマスクデータが“1”であるか否かが、前景画像生成部105により判定される。マスクデータが“1”である場合、第1縮小ブロック画像は前景画像として有効となる。一方、マスクデータが“0”である場合、第1縮小ブロック画像は前景画像として無効となる。
ステップS242において、YESならば、ステップS244Aに進む。一方、ステップS242において、NOならば、ステップS244Bに進む。
ステップS244Aでは、前景画像生成部105が、受信した第1縮小ブロック画像のデータを、前景画像符号化部108へ送信する。その後、この前景画像生成処理は終了し、図11の画像符号化処理Aに戻り、ステップS140Aの次のステップS150に進む。
ステップS244Bでは、第1縮小ブロック画像と同じサイズの画像(たとえば、16×16のサイズの画像)の全ての画素を透過色(画素値 “0”)とした画像(以下、透過色ブロック画像ともいう)のデータを、前景画像符号化部108へ送信する。なお、透過色の画素値(以下、透過色値ともいう)は、後述する背景画像生成処理で生成される黒ブロック画像の画素値と同一の値である。
その後、透過色設定部112が、前景画像の画素値“0”が透過色であることを示す情報を、一時記憶部130に記憶させることにより設定する。その後、この前景画像生成処理Aは終了し、図11の画像符号化処理Aに戻り、ステップS140Aの次のステップS150に進む。
再び、図12を参照して、前景画像131GAは、前景画像生成部105が、前景画像符号化部108へ送信する全てのブロック画像のデータから構成される画像である。前景画像131GAの解像度は、第1縮小画像111Gの解像度と同じで、300dpiである。前景画像生成処理Aにより、前景画像として有効と判定された第1縮小ブロック画像に対応する、前景画像131GA内のブロック画像は、当該判定された第1縮小ブロック画像となる。一方、前景画像生成処理Aにより、前景画像として無効と判定された第1縮小ブロック画像に対応する、前景画像131GA内のブロック画像は、ブロック画像内の全ての画素が透過色(画素値“0”)となる。なお、前景画像131GAは、透過色を示す画素値“0”に対応する部分を黒色で表現している。
ステップS244Aで送信される画像は、たとえば、前景画像131GA内の領域131RA内の画像である。また、ステップS244Bで送信される画像は、たとえば、前景画像131GA内の透過色(黒色)のブロック画像である。
再び、図11を参照して、ステップS150では、前述したのと同様、前景画像符号化処理が行なわれる。その後、ステップS152に進む。
ステップS152では、前述したのと同様、画像縮小処理Bが行なわれる。
再び、図12を参照して、第2縮小画像112Gは、第2画像縮小部103により、全ての入力ブロック画像が、それぞれ縮小された複数の縮小ブロック画像から構成される画像である。第2縮小画像112Gについては、前述したので詳細な説明は繰り返さない。
再び、図11を参照して、ステップS152(画像縮小処理B)では、第2画像縮小部103が、生成した第2縮小ブロック画像のデータを、背景画像生成部106へ送信する。その後、ステップS160に進む。
ステップS160では、前述したのと同様、背景画像生成処理が行なわれる。
再び、図12を参照して、背景画像132Gは、背景画像生成部106が、背景画像符号化部109へ送信する全てのブロック画像のデータから構成される画像である。背景画像132Gの解像度は、第2縮小画像112Gの解像度と同じで、150dpiである。背景画像生成処理により、前景画像として無効と判定された第2縮小ブロック画像に対応する、背景画像132G内のブロック画像は、当該判定された第2縮小ブロック画像となる。一方、前景画像生成処理により、前景画像として有効と判定された第2縮小ブロック画像に対応する、背景画像132G内のブロック画像(黒ブロック画像)は、ブロック画像内の全ての画素が黒(画素値“0”)となる。
再び、図11を参照して、ステップS160の処理の後、ステップS170に進む。
ステップS170では、前述したのと同様、背景画像符号化処理が行なわれる。その後、ステップS172に進む。
ステップS172では、前述したのと同様、入力画像全体に対し処理が終了したか否かが判定される。ステップS172において、YESならば、ステップS180Aに進む。一方、ステップS172において、NOならば、再度、ステップS101の処理が繰り返される。
ステップS180Aでは、フォーマット処理Aが行なわれる。フォーマット処理Aでは、フォーマット部110が、複数の前景画像ブロック符号化データと、複数の背景画像ブロック符号化データとの関連付けを行なう。当該関連付けは、汎用性の高いデータフォーマットを使用して行なわれる。
ここで、複数の前景画像ブロック符号化データは、前述したので詳細な説明は繰り返さない。前述したように、複数の前景画像ブロック符号化データから構成されるデータを前景画像符号化データともいう。
また、複数の背景画像ブロック符号化データは、前述したので詳細な説明は繰り返さない。前述したように、複数の背景画像ブロック符号化データから構成されるデータを背景画像符号化データともいう。
汎用性の高いデータフォーマットの一例としては、Adobe社のPDFフォーマットである。なお、汎用性の高いデータフォーマットは、Adobe社のPDFフォーマットに限定されることなく、他のデータフォーマットであってもよい。
たとえば、前景画像符号化データおよび背景画像符号化データがJPEG形式である場合、フォーマット部110は、以下の関連付け処理Aを行なう。
関連付け処理Aでは、フォーマット部110が、Adobe社のPDF形式に基づいて、前景画像符号化データおよび背景画像符号化データを関連付けた関連付けデータAを作成する。そして、フォーマット部110は、前景画像符号化データ、背景画像符号化データおよび関連付けデータAを一つの符号化画像データとして、汎用統合データAを生成する。
汎用統合データAを復号化する場合は、たとえば、前景画像符号化データをJPEGにより復号化した復号化前景画像と、背景画像符号化データをJPEGにより復号化した復号化背景画像とを使用して行なわれる。
具体的には、まず、復号化前景画像と、復号化背景画像とのサイズが異なる場合、復号化背景画像を、復号化前景画像と同じサイズに拡大する処理が行なわれる。そして、復号化前景画像に対し、透過色が設定された復号化前景画像内のブロック画像に対応する、復号化背景画像内のブロック画像を、復号化前景画像内の対応する位置に上書きする。上記処理を繰返し行なうことにより、汎用統合データAを復号化して、符号化する前の入力画像を得ることができる。
なお、前述の説明では、ステップS101〜ステップS170までの処理をブロック画像単位で、一連の処理とすることを前提に説明した。しかしながら、本発明の一つの特徴であるブロック画像単位での像域判定が実施され、前景画像および背景画像が非可逆符号化されていれば、前述の処理の順に限定されるものではない。
たとえば、入力画像全体について、まず、前景画像生成処理、背景画像生成処理を行ない、各処理により得られたデータを、一時記憶部130に記憶させる。その後、前景画像、背景画像を符号化してもよい。すなわち、S150、S170の処理を、ステップS172の後で、かつ、ステップS180Aの前に行なうようにしてもよい。
また、ステップS180Aのフォーマット処理Aをブロック画像単位で処理するようにしてもよい。すなわち、ステップS180Aの処理を、ステップS170の後で、かつ、ステップS172の前に行なうようにしてもよい。
また、処理を並列化して同時に複数の処理がなされるようにしてもよい。たとえば、ステップS132〜S150の処理と、ステップS152〜S170の処理とを、ステップS120の後に並列に行なってもよい。
また、ステップS132の画像縮小処理Aと、ステップS152の画像縮小処理Bとを、ステップS101で読み出すブロック画像単位ではなく、異なる処理単位で行なってもよい。
以上説明したように、本実施の形態では、マスク符号化データを使用せずに汎用統合データAを生成するため、第1の実施の形態の奏する効果に加え、汎用統合データAのデータ容量をさらに小さくすることができるという効果を奏する。
(画像の色空間)
なお、本発明に従う上述の実施の形態は、入力画像がカラー画像の場合において特に効果を発揮するが、グレースケール(輝度成分のみ)画像などに適用することも可能である。
(無効なブロック内の画素値)
第1の実施の形態においては、無効なブロック(複数のドント・ケア画素から構成されるブロック画像)の画素値について、符号化効率が向上するように任意の値を設定することが可能である。たとえば、ある無効ブロックの画素値は“0”に設定し、他の無効ブロックの画素値は“255”に設定することが可能である。
しかしながら、本発明の第2の実施の形態においては、無効なブロック(複数のドント・ケア画素から構成されるブロック画像)の画素値について、以下のような注意が必要である。
すなわち、透過色を、画像の表現に必要な画素値(たとえば、画素値“0”)に割り当てて表現する場合、有効なブロック画像中の画素値“0”についても透過色として扱われる可能性があるため、全ての層(マスク層、前景層、背景層)のデータまたは画像において、無効なブロック画素の画素値として“0”を設定しておくことが好ましい。
なお、透過色を、画像の表現に必要な画素値以外の値で表現することが可能である場合には、無効なブロック画像中の画素値について、符号化効率が向上するような任意の値を設定することが可能である。
第1の実施の形態および第2の実施の形態のいずれにおいても、上述のように無効なブロック画素中の画素値について任意の値を設定する場合、以下のようにすることができる。たとえば、非可逆符号化をJPEG方式を用いて行なう場合、全ての無効なブロック画素中の全ての画素について、画素値“0”を設定すれば、複雑な処理を実行することなく、一般的に圧縮効率を高めることが可能である。
(マスク生成基準)
また、上述の説明では、処理対象のブロック画像が、前景画像として有効または無効であるかを示すマスクデータは、像域判定処理により設定された線分ブロックデータに基づいて生成される。線分ブロックデータは、処理対象のブロック画像が、文字・線を含む線分ブロック画像であるか否かを示すデータである。なお、線分ブロック画像は、文字、線に加え、エッジ部分を含む画像であってもよい。すなわち、線分ブロックデータは、処理対象のブロック画像が、文字、線またはエッジ部分を含む線分ブロック画像であるか否かを示すデータであってもよい。このとき、エッジ部分の有無の判定には、たとば、Sobelフィルタなどによる公知のエッジ抽出方法を用いればよい。
(画像縮小処理を行なわない場合)
また、上述の説明では、前景画像および背景画像を縮小する場合について説明した。しかしながら、前景画像および背景画像のどちらも縮小しない場合、あるいは前景画像および背景画像のいずれかのみを縮小する場合も考えられる。
すなわち、図2の画像符号化処理および図11の画像符号化処理Aにおいて、ステップS132(画像縮小処理A)およびステップS152(画像縮小処理B)のいずれか1つ、または両方の処理を行なわなくてもよい。
たとえば、図6に示した画像の解像度とブロックサイズとの関係を示すデータテーブルT100に示される、組合せ番号“2”、“3” 、“4”のいずれかに対応するデータで、処理が行なわれる場合、入力画像の解像度と前景画像の解像度は同じとなる。したがって、画像符号化処理および画像符号化処理Aにおいて、ステップS132(画像縮小処理A)を省略することができる。
また、本発明は、画像符号化装置1000および画像符号化装置1000Aにおいて、第1画像縮小部102および第2画像縮小部103を省略しても実現可能である。この場合、入力画像、前景画像および背景画像の解像度が全て同じとなる。そして、ブロック画像単位の像域情報(線分ブロックデータ)に基づいて前景画像および背景画像を生成する。これにより、像域の特徴に応じた適切な符号化パラメータ(たとえば、JPEG方式における量子化パラメータなど)を用いて符号化することが可能である。
前述の通り、画像符号化装置1000および画像符号化装置1000Aにおいて、第1画像縮小部102および第2画像縮小部103のいずれか1つまたは両方を省略した場合、画像符号化処理および画像符号化処理Aにおいて、対応する処理(たとえば、ステップS132の画像縮小処理Aなど)は、適宜省略すればよい。
(3層以上の場合)
また、前述の説明では一つの入力画像を、ブロック画像単位で、前景層と背景層の二つの層に分類することを前提としているが、本発明は二つの層に分類する場合のみに留まらず、三つ以上の層に分類する場合においても同様に実施することが可能である。
たとえば、文字または線またはエッジを表現する層(前景画像A)、写真を表現する層(前景画像B)、その他の成分を表現する層(背景画像)の三つに分類する場合においても、分類する単位がブロック画像単位であれば、本発明の主旨に則って処理することができる。
たとえば、ステップS110の像域判定処理において、文字、線またはエッジを含む像域、写真の像域、その他の像域の三つの像域に分類して、像域判定結果を示す像域判定データとして三種の値のいずれかを示し得るようにすればよい。たとえば、“0”は文字、線またはエッジ、“1”は写真、“2”はその他を示すようにすればよい。
また、ステップS120のマスク生成処理において、たとえば、前景画像Aについては、像域判定データに基づいて、“0”に対応するブロック画像は“前景画像Aとして有効”、“1”または“2”に対応するブロック画像は“前景画像Aとして無効”と設定して、前景画像A用のマスク層データを生成すればよい。
さらに、前景画像Bについては、像域判定データに基づいて、“1”に対応するブロック画像は“前景画像Bとして有効”、“0”または“2”に対応するブロック画像は“前景画像Bとして無効”と設定して、前景画像B用のマスク層データを生成すればよい。なお、N種類の像域を設定した場合についても同様に、N−1個のマスク層データを生成すればよい。
また、ステップS140の前景画像生成処理またはステップS140Aの前景画像生成処理Aでは、たとえば、前景画像Aの有効無効情報に基づいて、前景画像Aを生成し、前景画像Bの有効無効情報に基づいて、前景画像Bを生成すればよい。なお、N種類の像域を設定した場合についても同様に、N−1個の前景画像を生成すればよい。
また、ステップS160の背景画像生成処理において、処理対象のブロック画像が、たとえば、“前景画像Aとして無効”で且つ“前景画像Bとして無効”であるブロック画像は、背景画像として有効なブロック画像として第2縮小ブロック画像データを設定する。処理対象のブロック画像が、“前景画像Aとして有効”または“前景画像Bとして有効”のどちらか一つでも満たす場合、背景画像として無効なブロック画像として、たとえば、第2縮小ブロック画像と同じサイズの画像の全ての画素値を“0”に設定すればよい。
なお、N種類の像域を設定した場合においても同様に、処理対象のブロック画像が、N−1個の前景画像全てにおいて無効な場合、背景画像として有効なブロック画像とする。また、N−1個の前景画像のいずれか一つでも有効であるブロック画像は、背景画像として無効なブロック画像とすればよい。
三つ以上の層に分類する他の実施の形態として、ステップS120のマスク生成処理において、前景画像の数と同じ数のマスク層のデータを生成する代わりに、一つのマスク層のデータが、2値ではなく、N種類の値のいずれかを示し得るように構成してもよい。この場合、ステップS174のマスク符号化処理では、多値画像の可逆符号化に適したFLATEなどの符号化方式を用いればよい。
(入力画像の部分領域の層構造)
また、前述の説明では、層データ(たとえば、前景画像、背景画像、マスク層データ)が、入力画像全体を表現する(解像度のみ異なる)場合について説明した。しかしながら、本発明では、たとえば、背景画像が入力画像全体を表現する領域(解像度は低くてよい)を表現し、前景画像とマスク層データは、入力画像の部分領域を表現するように構成してもよい。
ただし、部分領域を表現するように構成する場合、ステップS180のフォーマット処理において、前景画像とマスク層データが背景画像上のどの部分領域に対応しているのかを示す情報を関連付けておく必要がある。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明は、たとえば、複写機や複合機のように画像を電子的に読み込み、データ容量を圧縮して、蓄積または伝送するような装置に適用することができる。
第1の実施の形態における画像符号化装置の構成を示すブロック図である。 第1の実施の形態において、画像符号化装置で実行される画像符号化処理のフローチャートを示す。 第1の実施の形態において、画像符号化装置で処理される画像を示す図である。 像域判定処理のフローチャートである。 マスク生成処理のフローチャートである。 データテーブルを示す図である。 各画像の解像度と、各画像の処理単位となるブロック画像の相対的な大小関係を例示した図である。 前景画像生成処理のフローチャートである。 背景画像生成処理のフローチャートである。 第2の実施の形態における画像符号化装置の構成を示すブロック図である。 第2の実施の形態において、画像符号化装置で実行される画像符号化処理Aのフローチャートを示す。 第2の実施の形態において、画像符号化装置で処理される画像を示す図である。 前景画像生成処理Aのフローチャートである。
符号の説明
70 記録媒体、100,100A 画像処理部、101 ブロック像域判定部、102 第1画像縮小部、103 第2画像縮小部、104 マスク生成部、105 前景画像生成部、106 背景画像生成部、107 マスク符号化部、108 前景画像符号化部、109 背景画像符号化部、110 フォーマット部、112 透過色設定部、120 制御部、130 一時記憶部、140 記憶部、150 記録媒体アクセス部、1000,1000A 画像符号化装置。

Claims (21)

  1. 入力画像を所定のブロック単位で像域判定するブロック像域判定手段と、
    前記ブロック像域判定手段の像域判定結果に基づいて、前記入力画像のデータを使用して、画像再生時に有効であるか無効であるかを前記所定のブロック単位で規定された2以上の層データを生成する層データ生成手段と、
    前記層データ生成手段が生成した前記2以上の層データの各々に適する符号化条件で、前記2以上の層データの各々に適するブロック単位で、前記2以上の層データの各々を符号化処理する符号化手段とを備える、画像符号化装置。
  2. 前記符号化手段は、各々が、前記2以上の層データのそれぞれに適する符号化条件で、前記2以上の層データのそれぞれに適するブロック単位で、前記2以上の層データをそれぞれ符号化処理する2以上のデータ符号化手段を含む、請求項1に記載の画像符号化装置。
  3. 前記2以上の層データのうち、少なくとも1つの層データは画像データであり、
    前記層データ生成手段は、前記画像データである層データに基づく画像のうち、前記画像再生時に無効であると規定された1以上のブロック内の各々のブロック画像を構成する複数の画素値を設定し、
    前記層データ生成手段により設定された前記複数の画素値は、前記入力画像のデータを使用して設定される場合より、前記符号化手段が前記画像データの層データを前記符号化処理した符号化データ容量が小さくなる値である、請求項1または請求項2に記載の画像符号化装置。
  4. 前記2以上の層データのうち、少なくとも1つの層データは画像データであり、
    前記入力画像の解像度を変換した変換画像を生成する解像度変換手段をさらに備え、
    前記層データ生成手段は、前記画像データである層データに基づく画像のうち、前記画像再生時に有効であると規定された1以上のブロックにそれぞれ対応する、前記変換画像内の1以上のブロック画像のデータを設定する、請求項1〜請求項3のいずれかに記載の画像符号化装置。
  5. 前記入力画像を画素単位で像域判定する画素像域判定手段をさらに備え、
    前記ブロック像域判定手段は、前記画素像域判定手段の画素単位の像域判定結果に基づいて、ブロック単位の像域判定を行なう、請求項1〜請求項3のいずれかに記載の画像符号化装置。
  6. 前記ブロック像域判定手段は、判定対象のブロックが、文字または線を含むか否かを判定し、
    前記層データ生成手段が生成した前記2以上の層データの少なくとも1つの層データは画像データであり、
    前記画像データである層データに基づく画像は、文字または線が表示される画像である、請求項1〜請求項3のいずれかに記載の画像符号化装置。
  7. 前記ブロック像域判定手段は、判定対象のブロックが、文字、線およびエッジ部の少なくとも1つを含むか否かを判定し、
    前記層データ生成手段が生成した前記2以上の層データの少なくとも1つの層データは画像データであり、
    前記画像データである層データに基づく画像は、文字、線およびエッジ部の少なくとも1つが表示される画像である、請求項1〜請求項3のいずれかに記載の画像符号化装置。
  8. 前記2以上の層データのうち、少なくとも1つの層データは画像データであり、
    前記2以上の層データのうち、前記画像データ以外の層データのうち少なくとも1つの層データは、各々が、前記画像データである層データの前記画像再生時に前記所定のブロック単位で有効であるか無効であるかを示す複数のマスクデータから構成されるマスク層データである、請求項1〜請求項3のいずれかに記載の画像符号化装置。
  9. 前記マスク層データを可逆符号化する可逆符号化手段をさらに備える、請求項8に記載の画像符号化装置。
  10. 前記2以上の層データのうち、少なくとも2つの層データは画像データであり、
    前記層データ生成手段は、前記画像データである層データに基づく画像のうち、前記画像再生時に無効であると規定された1以上のブロック内の各々のブロック画像を構成する複数の画素値を、透過色であるか否かを示す透過色値に設定する、請求項1〜請求項3のいずれかに記載の画像符号化装置。
  11. 前記層データ生成手段は、前記画像データである少なくとも2つの層データのうち、前記透過色値が設定されていない、少なくとも1つの層データに基づく画像のうち、前記画像再生時に無効であると規定された1以上のブロック内の各々のブロック画像を構成する複数の画素値を、前記透過色値と同一の値に設定する、請求項10に記載の画像符号化装置。
  12. 複数のデータを関連付けた関連付けデータを生成するフォーマット手段をさらに備え、
    前記フォーマット手段は、前記符号化処理された前記2以上の層データと、前記可逆符号化された前記マスク層データとを関連付ける、請求項9に記載の画像符号化装置。
  13. 複数のデータを関連付けた関連付けデータを生成するフォーマット手段をさらに備え、
    前記フォーマット手段は、前記符号化処理された前記2以上の層データを関連付け、
    前記2以上の層データのうちの少なくとも1つの層データは、前記透過色値に設定されたデータを含む、請求項10または請求項11に記載の画像符号化装置。
  14. 前記符号化処理は、非可逆符号化処理である、請求項1〜請求項13のいずれかに記載の画像符号化装置。
  15. 前記非可逆符号化処理は、JPEG方式に従う符号化処理である、請求項14に記載の画像符号化装置。
  16. 前記所定のブロックは、横および縦の画素数が等しく、前記画素数は8に自然数を乗じた値である、請求項1〜請求項15のいずれかに記載の画像符号化装置。
  17. 入力画像を所定のブロック単位で像域判定する工程と、
    前記像域判定する工程の像域判定結果に基づいて、前記入力画像のデータを使用して、画像再生時に有効であるか無効であるかを前記所定のブロック単位で規定された2以上の層データを生成する工程と、
    前記2以上の層データを生成する工程が生成した前記2以上の層データの各々に適する符号化条件で、前記2以上の層データの各々に適するブロック単位で、前記2以上の層データの各々を符号化処理する工程とを含む、画像符号化方法。
  18. 前記符号化処理は、非可逆符号化処理である、請求項17に記載の画像符号化方法。
  19. コンピュータに画像処理を実行させるための画像符号化プログラムであって、
    入力画像を所定のブロック単位で像域判定するステップと、
    前記像域判定するステップの像域判定結果に基づいて、前記入力画像のデータを使用して、画像再生時に有効であるか無効であるかを前記所定のブロック単位で規定された2以上の層データを生成するステップと、
    前記2以上の層データを生成するステップが生成した前記2以上の層データの各々に適する符号化条件で、前記2以上の層データの各々に適するブロック単位で、前記2以上の層データの各々を符号化処理するステップとをコンピュータに実行させる、画像符号化プログラム。
  20. 前記符号化処理は、非可逆符号化処理である、請求項19に記載の画像符号化プログラム。
  21. 請求項19または請求項20に記載の画像符号化プログラムを記録した、記録媒体。
JP2005319812A 2005-11-02 2005-11-02 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体 Expired - Fee Related JP4236659B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005319812A JP4236659B2 (ja) 2005-11-02 2005-11-02 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体
US11/590,842 US7706618B2 (en) 2005-11-02 2006-11-01 Image coding apparatus, image coding method, and recording medium, capable of creating highly versatile data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005319812A JP4236659B2 (ja) 2005-11-02 2005-11-02 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2007129456A true JP2007129456A (ja) 2007-05-24
JP4236659B2 JP4236659B2 (ja) 2009-03-11

Family

ID=37996371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005319812A Expired - Fee Related JP4236659B2 (ja) 2005-11-02 2005-11-02 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体

Country Status (2)

Country Link
US (1) US7706618B2 (ja)
JP (1) JP4236659B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009284093A (ja) * 2008-05-20 2009-12-03 Sharp Corp 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体
JP2010028796A (ja) * 2008-07-22 2010-02-04 Toshiba Corp 画像形成装置、画像変換装置および画像形成方法
JP2010278948A (ja) * 2009-06-01 2010-12-09 Kyocera Mita Corp 画像処理装置
JP2010278535A (ja) * 2009-05-26 2010-12-09 Kyocera Mita Corp 画像処理装置
JP2011244178A (ja) * 2010-05-18 2011-12-01 Sharp Corp 画像処理装置および画像処理装置の制御方法
KR20130054899A (ko) * 2011-11-17 2013-05-27 삼성전자주식회사 래스터 이미지 변환 장치, 화상독취장치, 래스터 이미지 변환 방법 및 컴퓨터 판독가능 기록매체
US9197126B2 (en) 2009-04-01 2015-11-24 Mitsubishi Electric Corporation Power converting apparatus
KR20200037887A (ko) * 2015-03-30 2020-04-09 알리바바 그룹 홀딩 리미티드 합성 화상을 생성하는 방법 및 장치

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4469330B2 (ja) * 2005-12-07 2010-05-26 株式会社リコー 画像処理装置、画像処理方法、画像処理プログラム、記録媒体及び画像形成装置
JP4697967B2 (ja) * 2006-03-02 2011-06-08 キヤノン株式会社 画像符号化装置及びその制御方法
JP2008072624A (ja) * 2006-09-15 2008-03-27 Canon Inc 画像符号化装置及びその制御方法
JP4847398B2 (ja) * 2007-06-06 2011-12-28 キヤノン株式会社 画像処理装置およびその方法
US9195661B2 (en) * 2007-06-07 2015-11-24 Thomson Reuters Global Resources Method and system for click-thru capability in electronic media
US8249349B2 (en) * 2008-11-25 2012-08-21 Microsoft Corporation Labeling image elements
US20130128324A1 (en) * 2011-11-17 2013-05-23 Samsung Electronics Co., Ltd. Raster image conversion apparatus, image scanning apparatus, method of converting raster image, and computer-readable recording medium
US10690697B1 (en) * 2018-10-26 2020-06-23 Seagate Technology Llc Metrology technique that provides true flattening

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02123479A (ja) 1988-11-02 1990-05-10 Ricoh Co Ltd 線画領域分離方式
JPH02155087A (ja) 1988-12-07 1990-06-14 Ricoh Co Ltd 線画領域分離方式
JP3108133B2 (ja) 1991-02-06 2000-11-13 株式会社リコー カラー文書画像の適応符号化方式
JP3161013B2 (ja) 1991-04-03 2001-04-25 セイコーエプソン株式会社 領域分離方法および画像処理装置
JP3128871B2 (ja) 1991-07-05 2001-01-29 オムロン株式会社 領域識別装置
JPH06333033A (ja) 1993-05-19 1994-12-02 Fuji Xerox Co Ltd 画像処理装置
JPH07212601A (ja) 1994-01-13 1995-08-11 Canon Inc 画像処理装置
JPH07240845A (ja) 1994-02-28 1995-09-12 Fuji Film Micro Device Kk 画像のデータ圧縮および伸張
US5778092A (en) 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
WO2000027130A1 (en) * 1998-11-04 2000-05-11 Mitsubishi Denki Kabushiki Kaisha Image decoder and image encoder
US6373981B1 (en) 1998-12-21 2002-04-16 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
JP4140362B2 (ja) 2002-12-03 2008-08-27 富士ゼロックス株式会社 画像処理装置
JP2004350182A (ja) 2003-05-26 2004-12-09 Fuji Xerox Co Ltd データ処理装置、データファイル、データ処理方法、およびプログラム
JP4182480B2 (ja) 2003-11-14 2008-11-19 富士ゼロックス株式会社 符号化装置、符号化方法及びそのプログラム
JP4432469B2 (ja) 2003-11-19 2010-03-17 富士ゼロックス株式会社 符号化装置、符号化方法及びそのプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009284093A (ja) * 2008-05-20 2009-12-03 Sharp Corp 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体
JP2010028796A (ja) * 2008-07-22 2010-02-04 Toshiba Corp 画像形成装置、画像変換装置および画像形成方法
US9197126B2 (en) 2009-04-01 2015-11-24 Mitsubishi Electric Corporation Power converting apparatus
JP2010278535A (ja) * 2009-05-26 2010-12-09 Kyocera Mita Corp 画像処理装置
JP2010278948A (ja) * 2009-06-01 2010-12-09 Kyocera Mita Corp 画像処理装置
JP2011244178A (ja) * 2010-05-18 2011-12-01 Sharp Corp 画像処理装置および画像処理装置の制御方法
KR20130054899A (ko) * 2011-11-17 2013-05-27 삼성전자주식회사 래스터 이미지 변환 장치, 화상독취장치, 래스터 이미지 변환 방법 및 컴퓨터 판독가능 기록매체
KR101869302B1 (ko) * 2011-11-17 2018-06-20 에이치피프린팅코리아 주식회사 래스터 이미지 변환 장치, 화상독취장치, 래스터 이미지 변환 방법 및 컴퓨터 판독가능 기록매체
KR20200037887A (ko) * 2015-03-30 2020-04-09 알리바바 그룹 홀딩 리미티드 합성 화상을 생성하는 방법 및 장치
US10692261B2 (en) 2015-03-30 2020-06-23 Alibaba Group Holding Limited Efficient images synthesis
US10878609B2 (en) 2015-03-30 2020-12-29 Advanced New Technologies Co., Ltd. Efficient image synthesis
KR102215766B1 (ko) 2015-03-30 2021-02-17 어드밴스드 뉴 테크놀로지스 씨오., 엘티디. 합성 화상을 생성하는 방법 및 장치

Also Published As

Publication number Publication date
JP4236659B2 (ja) 2009-03-11
US7706618B2 (en) 2010-04-27
US20070098285A1 (en) 2007-05-03

Similar Documents

Publication Publication Date Title
JP4236659B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
JP3813387B2 (ja) 情報埋込方法および装置並びに記録媒体
CN101902549B (zh) 图像处理装置及图像处理方法
US20090141048A1 (en) Method, apparatus, and computer program product for processing image
JP2006005939A (ja) スキャンされた文書用のセグメント化に基づくハイブリッド圧縮機構
CN101800827A (zh) 装置及方法
JP2011193394A (ja) 画像処理装置、画像処理方法、及びプログラム
JP4878040B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体
JP2009212800A (ja) 画像圧縮装置
JP2007088912A (ja) 画像処理装置およびプログラム
JPH04356873A (ja) カラー文書画像の適応符号化方式
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP2005204206A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JPH01144778A (ja) 画像符号化方法
JP4802853B2 (ja) 画像処理装置および画像処理プログラム
JP3563838B2 (ja) 画像符号化・復号化装置
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
US20100188670A1 (en) Image processing apparatus, image processing method and program executing the image processing method
JP2010028796A (ja) 画像形成装置、画像変換装置および画像形成方法
JP4383187B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP4875649B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP4926128B2 (ja) 画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム、記録媒体、及び画像処理方法
JP6188651B2 (ja) 画像処理装置および画像処理プログラム
JP2010245976A (ja) 画像圧縮装置、画像処理装置、画像形成装置、画像圧縮方法、画像圧縮プログラムおよび記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081216

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees