JP4753397B1

JP4753397B1 - エンコードシステムおよびデコードシステム

Info

Publication number: JP4753397B1
Application number: JP2010266066A
Authority: JP
Inventors: 一樹客野; 優佑星月
Original assignee: Axell Corp
Current assignee: Axell Corp
Priority date: 2010-11-30
Filing date: 2010-11-30
Publication date: 2011-08-24
Anticipated expiration: 2030-03-16
Also published as: JP2011193437A

Abstract

【課題】透明度の圧縮データ量を抑制しつつ、完全透明または完全不透明の再現性を保証する。
【解決手段】第１圧縮部２はα値に歪み圧縮を施し圧縮α値（Ａ）を生成する。第１伸長部３は圧縮α値（Ａ）を伸長し伸長α値（Ａ）を生成する。しきい値決定部４は完全透明又は完全不透明から異なる値に歪んだ伸長α値（Ａ）を本来値に補正する判定しきい値αth1，αth2を、対応する伸長α値（Ａ）とα値との比較から決定する。減色部６はα値から減色α値を生成する。第２圧縮部７は減色α値に無歪み圧縮を施し圧縮α値（Ｂ）を生成する。第２伸長部８は圧縮α値（Ｂ）を伸長し伸長α値（Ｂ）を生成する。タイプ判定部９は所定の基準によりタイプＡ，Ｂを評価し適用すべき圧縮タイプを選択する。出力部１０は指定されたタイプの圧縮α値および判定しきい値αth1，αth2とタイプ指定とを圧縮データとして出力する。
【選択図】図７

Description

本発明は、エンコードシステムおよびデコードシステムに係り、特に、歪み圧縮によって歪んだ透明度データ（α値）の歪み補正に関する。

画像の透明度を規定するデータとして、α値（アルファ値）や透過率と呼ばれる透明度データが知られている。しかしながら、その圧縮方法は、ＲＧＢやグレースケールの階調値を規定する輝度データほど規格化が進んでおらず、個々の実装に委ねられているのが実情である。例えば、透明度という概念自体が存在せず輝度データのみを取り扱う実装もあれば、輝度データの特別な値を透明度情報として割り当てる実装、更にはＪＰＥＧのような一般的な圧縮手法をα値の圧縮にそのまま適用する実装もあるといった如くである。

また、α値の特性に着目したα値固有の圧縮手法も従来より提案されている。例えば、特許文献１には、画像の輝度を規定する輝度レイヤと、画像の透明度を規定する透明度レイヤの間には相関性があるという知得に基づき、圧縮された輝度データを用いてα値を圧縮する手法が開示されている。この圧縮手法では、まず、各画素のＲＧＢデータがＹＵＶデータに変換され、このＹＵＶデータに非可逆圧縮が施された後、圧縮されたＹＵＶデータの輝度成分を用いてα値の符号化が行われる。一方、特許文献２には、輝度レイヤとは独立した透明度レイヤのみで完結するα値の圧縮手法が開示されている。具体的には、まず、α値の変化パターンに共通性がある画像領域が連結ブロックとして抽出される。つぎに、連結ブロック内のランやその差分に基づいて中間符号が生成され、この中間符号に対して可変長符号化が施される。この圧縮手法は、自然画等における輝度データと比べて、α値の変化パターンに共通性を有する画像領域が局所的に集中する傾向があるという知得に基づいており、この局所性を中間符号の出現確率の偏りに反映することで、圧縮率の向上を図る。

さらに、特許文献３には、階調範囲外にオーバーフローしたデコードα値を階調範囲内にクランプするクリッピングが開示されている。このクリッピングのために、階調範囲を規定する最小αしきい値（例えば０）および最大αしきい値（例えば２５５）が設けられており、これらのしきい値によってデコードα値がクランプされる。すなわち、階調の最小値に相当する最小αしきい値よりもデコードα値が小さい場合には、デコードα値が最小値に変更され、階調の最大を規定する最大αしきい値よりもデコードα値が大きい場合には、デコードα値が最大値に変更される。

特開２００４−１５９２６０号公報特開２００８−２２７９３４号公報特表２００７−５１７４３４号公報

ところで、画像の透明度を多階調で表現する透明度データでは、完全透明や完全不透明を的確に再現・復元する必要がある。本来、完全透明（例えば最小値０）であるべき画像領域がそうでなくなると、透過して表示されないはずの色が表示されてしまうことになる。そのため、α値が完全透明の場所に対応するＲＧＢ画素は、表示されないものと想定されているため、α値が非透明の画素とは全く異なる色が格納されていることが多い。例えば、グリーンバックで撮影した画像にα値を付加した場合、α値が完全透明の場所のRGB画素が緑色になる。ここで、非透明の画素が赤系であった場合、α値が量子化歪で０から１に変化してしまうだけで、赤の中に緑が出現して、非常に目立つことになる。このように、α値が完全透明の場所には、非透明の場所と相関の無い画像が入力されることも多く、そのため、完全透明のわずかな変化であっても目に付き易い。また、完全不透明においては、動く背景の上に静止した画像を重ねた場合、完全不透明２５５が２５４に変化してしまうだけで、動く背景の動きに連動して、静止した画像にノイズが生じることになる。そのため、完全不透明のわずかな変化であっても目に付き易い。

上述した特許文献３のクリッピングは、デコード時にオーバーフローしたα値を最小αしきい値と最大αしきい値とによって規定される階調範囲内にクランプするものであって、上述した完全透明や完全不透明のわずかな変化に対する対策を意図したものではない。

そこで、本発明の目的は、透明度の圧縮データ量を抑制しつつ、完全透明または完全不透明の再現性を保証することである。

この発明に係る、透明度データを圧縮するエンコードシステムにおいては、前記透明度データに歪み圧縮を施して、圧縮透明度データを生成する第１の圧縮部と、前記圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第１の伸長部と、画像平面上のグループ毎に設定され、かつ、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示す判定しきい値を、同一のグループに属するそれぞれの前記伸長透明度データと、これに対応する前記透明度データとを比較することによって決定するしきい値決定部と、を有する第１の処理系と、前記透明度データの階調数を減らして、減色透明度データを生成する減色部と、前記減色透明度データに無歪み圧縮を施して、圧縮減色透明度データを生成する第２の圧縮部と、前記圧縮減色透明度データを伸長して、前記減色透明度データの復元値である伸長減色透明度データを生成する第２の伸長部と、を有し、前記第１の処理系に並列に設けられた第２の処理系と、前記伸長透明度データおよび前記伸長減色透明度データの画質と、前記圧縮透明度データおよび前記圧縮減色透明度データの符号量とのうちの少なくとも一方を評価することによって、前記第１の処理系によって生成された前記圧縮透明度データおよび前記第２の処理系によって生成された前記圧縮減色透明度データのいずれかの圧縮タイプを選択し、当該選択された圧縮タイプの指定を行うタイプ判定部と、前記圧縮透明度データおよび前記判定しきい値並びに前記圧縮減色透明度データと前記圧縮タイプの指定とを圧縮データとして出力する出力部と、を備えた構成とする。

ここで、この発明に係るエンコードシステムにおいて、判定しきい値は、完全透明および完全不透明の一方を示す最小値に伸長透明度データを補正する階調範囲を示す最小判定しきい値であってもよい。この場合、しきい値決定部は、最小値よりも大きな値に歪んでいる伸長透明度データがグループ内に存在する場合、最小判定しきい値として、このグループに属する歪んだ伸長透明度データのうちの最大値以上を設定することが好ましい。また、判定しきい値は、完全透明および完全不透明の他方を示す最大値に伸長透明度データを補正する階調範囲を示す最大判定しきい値であってもよい。この場合、しきい値決定部は、最大値よりも小さな値に歪んでいる伸長透明度データがグループ内に存在する場合、最大判定しきい値として、このグループに属する歪んだ伸長透明度データのうちの最小値以下を設定することが好ましい。

また、この発明に係るデコードシステムにおいては、透明度データに歪み圧縮を施して生成する第１の圧縮タイプと、前記透明度データの階調数を減らした減色透明度データに無歪み圧縮を施して生成する第２の圧縮タイプとのいずれかの圧縮タイプの圧縮データを振り分け入力し、伸長して透明度データを復元するデコードシステムであって、前記第１の圧縮タイプの圧縮透明度データを伸長して、透明度データの復元値である伸長透明度データを生成する第１の伸長部と、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示し、かつ、画像平面上のグループ毎に設定された判定しきい値が、前記圧縮データから抽出されて供給されるとともに、あるグループの判定しきい値と当該判定しきい値に対応する完全透明または完全不透明との間の階調範囲内に、当該グループに属する前記伸長透明度データが含まれる場合、当該伸長透明度データを当該判定しきい値に対応する完全透明または完全不透明に補正するしきい値処理部と、を有する第１の処理系と、前記第２の圧縮タイプの圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第２の伸長部を有し、前記第１の処理系に並列に設けられた第２の処理系と、前記圧縮データから抽出された圧縮タイプの指定に応じて、前記圧縮データから抽出された前記第１の圧縮タイプの圧縮透明度データを前記第１の処理系に供給し、前記圧縮データから抽出された前記第２の圧縮タイプの前記圧縮透明度データを第２の処理系に供給する入力部と、を備えた構成とする。

ここで、この発明に係るデコードシステムにおいて、判定しきい値は、完全透明または完全不透明の一方を示す最小値に伸長透明度データを補正する階調範囲を示す最小判定しきい値であってもよい。この場合、しきい値処理部は、グループ毎に設けられた最小判定しきい値を用いて、このグループに属する伸長透明度データのそれぞれの補正を行うことが好ましい。また、判定しきい値は、完全透明または完全不透明の他方を示す最大値に伸長透明度データを補正する階調範囲を示す最大判定しきい値であってもよい。この場合、しきい値処理部は、グループ毎に設けられた最大判定しきい値を用いて、このグループ内に存在する伸長透明度データのそれぞれの補正を行うことが好ましい。

さらに、上述したこの発明に係るエンコードシステムおよびデコードシステムにおいて、上記グループは、画像平面を複数に分割することによって設定された画素ブロックであることが好ましい。

この発明に係るエンコードシステムにおいては、伸長透明度データを本来の完全透明または本来の完全不透明に補正するための判定しきい値を設け、これを圧縮データの一部とする。これにより、圧縮時に圧縮透明度データ自体の値を補正しなくても、その伸長時に完全透明または完全不透明を的確に再現することができる。また、この判定しきい値は、画像平面上のグループ単位で動的かつ個別的に設定される。したがって、補正値を画素単位で設定する場合と比較して、圧縮データ量が少なくて済む。加えて、無歪み圧縮を選択的に使用することにより、画質の低下を有効に防止することができる。また、この発明に係るデコードシステムにおいては、透明度データにおける完全透明または完全不透明を的確に再現しつつ、圧縮透明度データを伸長できる。

第１の実施形態に係るエンコードシステムのブロック構成図画素ブロックの説明図 α値の歪みに応じた判定しきい値の決定処理の説明図第１の実施形態に係る圧縮データの論理的な構成図第１の実施形態に係るデコードシステムのブロック構成図判定しきい値を用いたα値のしきい値処理の説明図第２の実施形態に係るエンコードシステムのブロック構成図第２の実施形態に係る圧縮データの論理的な構成図第２の実施形態に係るデコードシステムのブロック構成図

（第１の実施形態）
（エンコードシステム）
図１は、本実施形態に係るエンコードシステムのブロック構成図である。このエンコードシステム１は、圧縮部２と、伸長部３と、しきい値決定部４と、出力部５とを有し、画像の透明度を規定する透明度データ（以下「α値」という）を圧縮して圧縮データを出力する。本実施形態では、α値の階調数を一例として２５６とし、最小値０を完全透明、最大値２５５を完全不透明にそれぞれ対応付けるが、これとは逆に対応付けてもよい。

圧縮部２は、α値に歪み圧縮を施して、圧縮透明度データ（以下「圧縮α値」という）を生成する。この圧縮部２は、ＤＣＴ部２ａと、量子化部２ｂと、エントロピー符号化部２ｃとを有する。ＤＣＴ部２ａは、画像平面上に設定された所定サイズの画素ブロック単位で、個々の画素ブロック内のα値を入力としたＤＣＴ（離散コサイン変換）処理を行う。量子化部２ｂは、ＤＣＴ処理によって算出された画素ブロック毎のＤＣＴ係数を所定の除数で除算して、余りを丸めて符号化（量子化）する。エントロピー符号化部２ｃは、量子化処理が行われたＤＣＴ係数に対して、ハフマン符号化や算術符号化といったエントロピー符号化を施すことによって、圧縮α値を生成する。生成された圧縮α値は、後段の伸長部３および出力部５のそれぞれに供給される。

ここで、圧縮部２から最終的に出力される圧縮α値は、圧縮部２に入力されたα値とは僅かに異なる状態に歪むことがある。例えば、最小値０（完全透明）がこれよりも若干大きな値に歪んだ場合には、本来的に表示されないはずの画素が出現する。同様に、最大値２５５（完全不透明）がこれよりも若干小さな値に歪んだ場合には、本来的に表示されないはずの背景が出現する。完全透明および完全不透明については、わずかな変化であっても目に付き易いので、画質の低下に直結する。このような歪みが生じる原因としては、基本的に量子化による丸め誤差が挙げられるが、ＤＣＴの精度を切り詰めて実装した場合等では、順変換および逆変換における演算誤差も影響を及ぼし得る。

なお、本実施形態では、歪み圧縮の一例として、ＤＣＴを主体とした構成を例示しているが、周知のように歪み圧縮には様々な形態があり、それらのいずれを採用してもよい。例えば、ＤＣＴ以外の直交変換、ウエーブレット変換、ＤＰＣＭ等の線形予測符号化、交流成分予測（ＡＣＰ）、再帰的交流成分予測（ＲＡＣＰ）といった如くである。また、処理対象の上方および左方の処理済領域の値から予測画像を生成し、その差分にＤＣＴを施してもよい。

伸長部３は、図５の伸長部１２と同様の構成を有し、歪み圧縮された圧縮α値を伸長する。典型的には、この伸長は圧縮部２の処理とは逆の処理を行えばよい。これによって、α値の復元値である伸長透明度データ（以下「伸長α値」という）が生成される。生成された伸長α値は、後段のしきい値決定部４に供給される。

しきい値決定部４は、伸長α値（復元値）と、これに対応するα値（本来値）とを比較することによって、上述したα値の歪みを補正するための判定しきい値を決定する。判定しきい値の決定は、画素毎ではなく、画像平面上に設定されたグループ毎に行われる。グループの設定の仕方としては、画像平面上において互いに離間した複数の画素を１グループとしてもよいし、互いに隣接した複数の画素を１グループとしてもよい。ただし、α値の空間的な相関性を生かせる点で後者の方が有利なので、本実施形態では、上記グループとして、隣接した複数画素によって構成される画素ブロックを用いる。

図２は、画像平面上に設定される画素ブロックの説明図である。画素ブロックＰＢは、画像平面を複数に分割することによって設定される。それぞれの画素ブロックＰＢは、例えば８×８画素のα値で構成される。なお、判定しきい値の決定単位となる画素ブロックＰＢは、圧縮部２での処理対象（ＤＣＴの演算単位となる画素ブロック）と同じ８×８画素のサイズであってもよいが、そうでなくても構わない。また、同図の矢印は、しきい値決定部４の処理順序を示すが、これを圧縮部２の処理順序と一致させれば、処理速度の向上を図ることができる。

図３は、α値の歪みに応じた判定しきい値αth1，αth2の決定処理の説明図である。判定しきい値αth１，αth2は、完全透明または完全不透明から異なる値に歪んだ伸長α値を本来の完全透明または本来の完全不透明に補正する階調範囲を規定し、画素ブロック内に存在するα値（完全透明または完全不透明に関するもののみ）の歪みの程度に応じて設定される。

具体的には、最小判定しきい値αth１に関して、まず、処理対象となる画素ブロックＰＢにおいて、圧縮前α値（本来値）が最小値０、すなわち完全透明であるものが特定される。つぎに、完全透明の圧縮前α値に対応する伸長後α値（復元値）が参照される。そして、本来値０から大きな値に歪んだ伸長後α値がブロックＰＢ内に存在する場合、その最大値が最小判定しきい値αth１に設定される。例えば、ある画素ブロックＰＢ内に本来値０が３個存在し、それぞれが１，２，３に歪んでいる場合、最大値３が最小判定しきい値αth１となる。最小判定しきい値αth１は、完全透明を示す最小値０に伸長α値を補正する階調範囲を規定する。したがって、上記ケースでαth１＝３に設定すれば、本来値０から歪んだ３つの伸長後α値１，２，３が全て最小値０に補正されることを保証できる。ただし、歪み補正の観点でいえば、最小判定しきい値αth１は、本来値０から歪んだ伸長後α値の最大値である必要は必ずしもなく、最大値以上の値（例えば４）であれば足りる。一方、本来値０から大きな値に歪んだ伸長後α値がブロックＰＢ内に存在しない場合、最小判定しきい値αth１として０が設定される。

一方、最大判定しきい値αth2に関しては、まず、処理対象となる画素ブロックＰＢにおいて、圧縮前α値（本来値）が最大値２５５、すなわち完全不透明であるものが特定される。つぎに、完全不透明の圧縮前α値に対応する伸長後α値（復元値）が参照される。そして、本来値２５５から小さな値に歪んだ伸長後α値がブロックＰＢ内に存在する場合、その最小値が最大判定しきい値αth2に設定される。例えば、ある画素ブロックＰＢ内に本来値２５５が３個存在し、それぞれが２５２，２５３，２５４に歪んでいる場合、最小値２５２が最大判定しきい値αth2となる。最大判定しきい値αth2は、完全不透明を示す最大値２５５に伸長α値を補正する階調範囲を規定する。したがって、上記ケースでαth2＝２５２に設定すれば、本来値２５５から歪んだ３つの伸長後α値２５２，２５３，２５４が全て最大値２５５に補正されることを保証できる。ただし、歪み補正の観点でいえば、最大判定しきい値αth2は、本来値２５５から歪んだ伸長後α値の最小値である必要は必ずしもなく、最小値以下の値（例えば２５１）であれば足りる。一方、本来値２５５からも小さな値に歪んだ伸長後α値がブロックＰＢ内に存在しない場合、最大判定しきい値αth2として２５５が設定される。

しきい値決定部４は、以上のようにして算出された判定しきい値αth1，αth2を出力部５に供給する。なお、歪み補正は、完全透明および完全不透明の双方について行うことが最も好ましいが、いずれか一方のみであってもよい。一方のみを対象とする場合、判定しきい値αth1，αth2の一方のみを算出すれば足りる。

出力部５は、圧縮部２から供給された圧縮α値と、しきい値決定部４から供給された判定しきい値αth1，αth2とに基づいて、圧縮データを生成・出力する。図４に示すように、圧縮データは、画素ブロックＰＢ毎の圧縮α値Ｂ0，Ｂ1，・・・と、それぞれの画素ブロックＰＢの付帯情報である判定しきい値αth1，αth2とを有し、これらは互いに対応付けられている。この対応付けによって、圧縮データを伸長する際、どの画素ブロックＰＢにどの判定しきい値αth1，αth2を適用すべきかが一義的に特定される。

このように、本実施形態に係るエンコードシステム１によれば、伸長α値を本来の完全透明または本来の完全不透明に補正するための判定しきい値αth1，αth2を設け、これを圧縮データの一部として出力する。これにより、圧縮時に圧縮透明度データ自体の値を補正しなくても、伸長時における完全透明または完全不透明の再現性を保証できる。また、この判定しきい値αth1，αth2は、画像平面上の画素ブロックＰＢ単位で動的かつ個別的に設定される。したがって、補正値を画素単位で設定する場合と比較して、圧縮データ量が少なくて済む。

（デコードシステム）
図５は、本実施形態に係るデコードシステムのブロック構成図である。このデコードシステム１１は、伸長部１２と、しきい値処理部１３とを有し、図１に示したエンコードシステム１によって生成された圧縮データを伸長して、α値を復元する。

伸長部１２は、エントロピー復号化部１２ａと、逆量子化部１２ｂと、ＩＤＣＴ部１２ｃを有し、歪み圧縮された圧縮データから抽出された圧縮α値を伸長して、復元値としての伸長α値を生成する。典型的には、この伸長は圧縮部２の歪み圧縮とは逆の処理を行えばよい。生成された伸長α値は、しきい値処理部１３に供給される。しきい値処理部１３は、圧縮データから抽出された判定しきい値αth１，αth2を用いて、伸長部１２から供給された伸長α値にしきい値処理を施すことによって、伸長α値を補正する。このしきい値処理は、しきい値決定部４のしきい値決定処理と同様、画素ブロックＰＢ単位で行われる。

図６は、判定しきい値αth1，αth2を用いたしきい値処理の説明図である。上述したように、判定しきい値αth１，αth2は、完全透明または完全不透明から異なる値に歪んだ伸長α値を本来の完全透明または本来の完全不透明に補正する階調範囲を規定する。しきい値処理部１３は、ある画素ブロックＰＢの判定しきい値αth1，αth2によって規定される階調範囲内に伸長α値が含まれる場合、これを判定しきい値αth1，αth2に対応する完全透明または完全不透明に補正する。

具体的には、最小判定しきい値αth１の処理に関して、まず、処理対象となる画素ブロックＰＢの最小判定しきい値αth１が特定される。つぎに、この画素ブロックＰＢに属するしきい値処理前α値（入力値）が読み込まれる。そして、最小値０と最小判定しきい値αth1との間の階調範囲にある入力値については最小値０に一律に補正され、これが最終的な出力値（しきい値処理後α値）として出力される。例えば、ある画素ブロックＰＢ内の最小判定しきい値αth1が３の場合、その画素ブロックＰＢに属する３以下の入力値はすべて最小値０に変更される。これによって、完全透明の歪みが補正され、完全透明が的確に再現される。一方、３よりも大きな入力値については、このような変更を行うことなく、出力値としてそのまま出力される。

ここで、最小判定しきい値αth1が例えば３の場合、本来値が０値の入力値はもとより、本来値が０値でない入力値（例えば２）までもが０値に変更されてしまうことになる。非０値が０値として出力されると、厳密にはそれがノイズとして出現する。しかしながら、このような非０値は元々小さな成分なので、見えにくかった画素が完全に消えるだけで画質的には大差ない。したがって、このようなノイズについては許容するものとする。この点は、最大判定しきい値αth2の処理についても同様である。

一方、最大判定しきい値αth2の処理に関しては、まず、処理対象となる画素ブロックＰＢの最大判定しきい値αth2が特定される。つぎに、この画素ブロックＰＢに属するしきい値処理前α値（入力値）が読み込まれる。そして、最大判定しきい値αth2と最大値２５５との間の階調範囲にある入力値については最大値２５５に一律に補正され、これが最終的な出力値（しきい値処理後α値）として出力される。例えば、ある画素ブロックＰＢ内の最大判定しきい値αth1が２５２の場合、その画素ブロックＰＢに属する２５２以上の入力値はすべて最大値２５５に変更される。これによって、完全不透明の歪みが補正され、完全不透明が的確に再現される。一方、２５２よりも小さな入力値については、このような変更を行うことなく、出力値としてそのまま出力される。

このように、本実施形態に係るデコードシステム１１によれば、透明度データにおける完全透明または完全不透明を的確に再現しつつ、エンコードシステム１によって生成された圧縮α値を伸長できる。

（第２の実施形態）
上述した第１の実施形態では、歪み圧縮を用いているため、α値が急激に変化するエッジ部分が鈍り易い。かかる不都合を解消すべく、本実施形態では、歪み圧縮と無歪み圧縮とを併用したシステムについて説明する。

（エンコードシステム）
図７は、本実施形態に係るエンコードシステムのブロック構成図である。このエンコードシステム２１は、第１の処理系２〜４，１３と、第２の処理系６〜８と、タイプ判定部９と、出力部１０とを有する。このシステム２１の動作を概略的に述べると、第１の処理系２で歪み圧縮を行って、タイプＡの圧縮α値を生成するとともに、これと並行して第２の処理系６，７でα値の減色および無歪み圧縮を行って、タイプＢの圧縮α値を生成する。そして、タイプ判定部９において、タイプＡ，Ｂの画質および推定符号量を比較して一方を選択し、選択されたタイプの圧縮α値を出力部１０から出力する。

第１の処理系は、第１の圧縮部２と、第１の伸長部３と、しきい値決定部４と、しきい値処理部１３とによって構成されている。第１の圧縮部２は、第１の実施形態の圧縮部２と同様、歪み圧縮によって圧縮α値（タイプＡ）を生成する。第１の伸長部３は、第１の実施形態の伸長部３と同様、圧縮α値（タイプＡ）を伸長して、その復元値である伸長α値（タイプＡ）を生成する。この伸長部３には、伸長するデータの符号量をカウントするカウンタが内蔵されているが、このカウンタを第１の圧縮部２に内蔵してもよい。しきい値決定部４は、第１の実施形態と同様、伸長α値（タイプＡ）と、これに対応するα値とを比較することによって、画素ブロックＰＢ毎に判定しきい値αth１，αth2を決定する。しきい値処理部１３は、第１の実施形態と同様、判定しきい値αth１，αth2を用いたしきい値処理を行い、伸長α値（タイプＡ）を補正する。そして、補正後の伸長α値はタイプ判定部９に供給される。以上の処理部２〜４，１３については、第１の実施形態で述べたそれと基本構成は同様なので、同一の符号を付してここでの説明を省略する。

第２の処理系は、減色部６と、第２の圧縮部７と、第２の伸長部８とによって構成されており、第１の処理系２〜４，１３と並行して画質を優先した無歪み圧縮を行う。この無歪み圧縮は、第１の処理系の歪み圧縮と同様、ブロック単位で行われる。具体的には、減色部６は、α値の階調数を減らした減色透明度データ（以下「減色α値」という）を生成する。α値の減色は、量子化値を初期値としたクラスタリングによって行われる。クラスタリング（clustering）とは、複数のデータを、その類似度に基いて分類すること、または、そのための統計学的手法をいう。概略的には、α値が密な値域に対して多くのクラスタ値が割り当てられる一方、α値が疎な値域に対しては割り当てを省略することによって、割り当てが適応的に行われる。クラスタリングは、圧縮効率を高めるための前処理として行われるが、この処理によって、α値の本来の意味が失われる訳ではない。なお、α値の減色に際しては、最小値０および最大値２５５が必ず保持されるようにする。第２の圧縮部７は、周知の無歪み圧縮（無歪み符号化）を画素ブロックＰＢ単位で行って、減色α値から圧縮α値（圧縮減色透明度データ）を生成する。無歪み圧縮としては、例えば、エントロピー符号化、或いは、画素ブロックＰＢの上方および左方（処理済の領域）の値から減色後の値を予測した残差をエントロピー符号化するといった手法を用いることができる。第２の伸長部８は、タイプＢ、すなわち無歪み圧縮された圧縮α値から復元値である伸長α値（伸長減色透明度データ）を生成する。典型的には、この伸長は第２の圧縮部７の無歪み圧縮とは逆の処理を行えばよい。また、この伸長部８には、伸長するデータの符号量をカウントするカウンタが内蔵されている。第２の処理系は無歪み圧縮なので、伸長α値においてもα値の最小値０および最大値２５５は必ず保持される。

タイプ判定部９は、所定の基準に基づいて画素ブロックＰＢ毎にタイプＡ，Ｂを評価して、画素ブロックＰＢに適用すべき圧縮タイプとして、評価の優れている方を選択する。好ましい評価基準としては、例えば数式１のように定義された画質が挙げられる。

ここで、画質の評価関数において、ｉは画素ブロックＰＢにおける画素番号を示し、８×８画素サイズの場合、ｉは０から６３となる。ＳＲＣ[i]はｉ番目の画素のα値（本来値）、ＤＥＣ[i]はｉ番目の画素の伸長α値（復元値）である。ＳＲＣ[i]とＤＥＣ[i]の差分の自乗総和が小さいほど、換言すれば、ブロック内の復元画像が原画像に近くなるほど、評価関数ｆ１の出力値が小さくなる。したがって、タイプＡ，Ｂのそれぞれについて演算を行い、その出力値ｆ１が小さい方を画質がよいものと判定できる。この場合、画質がよい方を圧縮タイプとして選択することができる。

また、評価基準として、データの符号量を用いてもよい。上述したように、伸長するデータの符号量（タイプＡ，Ｂ）は、伸長部３，８のカウンタによってそれぞれカウントされる。タイプ判定部９は、タイプＡ，Ｂのうち符号量の少ない方を圧縮タイプとして選択することができる。

更に、評価基準として、画質および符号量の双方を考慮すれば、圧縮性能の更なる向上を図ることができる。一例として示す数式２は、画質に関する評価値ｆ１（数式１の出力値）と、上記符号量に係数λを乗算したものとの和を評価関数としている。

（数式２）
ｆ２ = ｆ１＋ λ×符号量

ここで、係数λは、符号量の重み付け、すなわち、画質と符号量のどちらをより重視するかのパラメータである。この係数λは、経験的に決定した定数であってもよいし、量子化係数に応じて変更してもよい。数式２において、符号量が大きくなるほど、もしくは画質が悪くなるほど、出力値ｆ２は大きな値を取る。したがって、タイプＡ，Ｂのそれぞれについて演算を行い、出力値ｆ２の小さい方を圧縮タイプとして選択することができる。以上のような評価基準によって選択された圧縮タイプは、出力部１０に通知される。

出力部１０は、タイプ判定部９によって指定された圧縮タイプの圧縮α値を圧縮データとして出力する。すなわち、ある画素ブロックＰＢに関して、タイプＡが指定された場合には、その画素ブロックＰＢの圧縮データとして圧縮α値（タイプＡ）が出力され、タイプＢが指定された場合には、圧縮データとして圧縮α値（タイプＢ）が出力される。図８に示すように、圧縮データは、画素ブロックＰＢ毎の圧縮α値Ｂ0，Ａ1，Ａ2，Ｂ3，・・・と、タイプＡの付帯情報である判定しきい値αth1，αth2とを有する。ここで、Ａ1，Ａ2は圧縮タイプがタイプＡであり、Ｂ0，Ｂ3は圧縮タイプがタイプＢであることをそれぞれ示し、圧縮データの一部としてタイプＡ，Ｂの指定が含まれる。これにより、圧縮データを伸長する際、画素ブロックＰＢの圧縮タイプと、どの判定しきい値αth1，αth2を適用すべきかとが一義的に特定される。

このように、本実施形態に係るエンコードシステム２１によれば、第１の実施形態と同様の効果を奏する他、無歪み圧縮を選択的に使用することにより、画質の低下を有効に防止することができる。

（デコードシステム）
図９は、本実施形態に係るデコードシステムのブロック構成図である。このデコードシステム３１は、入力部１４と、第１の処理系１２，１３と、第２の処理系１５とを有し、図７に示したエンコードシステム２１によって生成された圧縮データを伸長して、α値を復元する。

入力部１４は、圧縮データの振り分けを画素ブロックＰＢ毎に行って、タイプＡの圧縮α値を第１の処理系（第１の伸長部１２）に供給し、タイプＢの圧縮α値を第２の処理系（第２の伸長部１５）に供給する。

第１の処理系は、第１の伸長部１２と、しきい値処理部１３とを有し、圧縮データから抽出され、かつ、歪み圧縮された圧縮α値（タイプＡ）から復元値としての伸長α値を生成する。典型的には、この伸長は第１の圧縮部７の無歪み圧縮とは逆の処理を行えばよい。第１の伸長部１２によって生成された伸長α値は、しきい値処理部１３に供給される。しきい値処理部１３は、圧縮データから抽出された判定しきい値αth１，αth2を用いて、第１の伸長部１２から供給された伸長α値にしきい値処理を施すことによって、伸長α値を補正する。このしきい値処理は、しきい値決定部４のしきい値決定処理と同様、画素ブロックＰＢ単位で行われる。そして、しきい値処理を経た補正後の伸長α値が出力される。一方、第２の処理系は、第２の伸長部１５を有し、圧縮データから抽出され、かつ、無歪み圧縮された圧縮α値（タイプＢ）から復元値としての伸長α値を生成する。典型的には、この伸長は第２の圧縮部７の無歪み圧縮とは逆の処理を行えばよい。ブロック毎に復元された伸長α値は、最終的な出力データとしてデコードシステム１３から出力される。

このように、本実施形態によれば、透明度データにおける完全透明または完全不透明を的確に再現しつつ、エンコードシステム２１によって生成された圧縮α値を伸長できる。

なお、上述した各実施形態に係るエンコードシステムおよびデコードシステムと等価な機能は、コンピュータによるソフトウェア処理によっても実現できる。したがって、コンピュータの動作手順を規定するコンピュータ・プログラムとしても、本発明を捉えることができる。すなわち、α値を圧縮する圧縮処理をコンピュータに実行させるエンコードプログラムとして本発明を捉えた場合、このプログラムが規定する基本的な動作手順は以下のようになる。まず、α値に歪み圧縮を施して、圧縮α値が生成される。つぎに、圧縮α値を伸長して、α値の復元値である伸長α値が生成される。つぎに、同一のグループに属するそれぞれの伸長α値と、これに対応するα値（本来値）とを比較することによって、判定しきい値αth1，αth2が決定される。そして、圧縮α値と、判定しきい値αth1，αth2とが圧縮データとして出力される。一方、圧縮データを伸長してα値を復元する伸長処理をコンピュータに実行させるデコードプログラムとして本発明を捉えた場合、このプログラムが規定する基本的な動作手順は以下のようになる。まず、圧縮データから抽出され、かつ、歪み圧縮された圧縮α値を伸長して、α値の復元値である伸長α値が生成される。つぎに、上述した判定しきい値αth１，αth2が圧縮データから抽出される。そして、ある画素ブロックＰＢの判定しきい値αth1，αth2と、これに対応する本来値（完全透明または完全不透明）との間の階調範囲内に、この画素ブロックＰＢに属する伸長α値が含まれる場合、この伸長α値が判定しきい値αth1，αth2に対応する本来値に補正される。

以上のように、本発明は、透明度データにおける完全透明または完全不透明の再現性を確保することを意図したα値の歪み補正に対して広く適用できる。

１，２１エンコードシステム
２圧縮部（第１の圧縮部）
２ａＤＣＴ部
２ｂ量子化部
２ｃエントロピー符号化部
３伸長部（第１の伸長部）
４しきい値決定部
５，１０出力部
６減色部
７第２の圧縮部
８第２の伸長部
９タイプ判定部
１１，３１デコードシステム
１２伸長部（第１の伸長部）
１２ａエントロピー復号化部
１２ｂ逆量子化部
１２ｃＩＤＣＴ部
１３しきい値処理部
１４入力部
１５第２の伸長部

Claims

透明度データを圧縮するエンコードシステムにおいて、
前記透明度データに歪み圧縮を施して、圧縮透明度データを生成する第１の圧縮部と、前記圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第１の伸長部と、画像平面上のグループ毎に設定され、かつ、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示す判定しきい値を、同一のグループに属するそれぞれの前記伸長透明度データと、これに対応する前記透明度データとを比較することによって決定するしきい値決定部と、を有する第１の処理系と、
前記透明度データの階調数を減らして、減色透明度データを生成する減色部と、前記減色透明度データに無歪み圧縮を施して、圧縮減色透明度データを生成する第２の圧縮部と、前記圧縮減色透明度データを伸長して、前記減色透明度データの復元値である伸長減色透明度データを生成する第２の伸長部と、を有し、前記第１の処理系に並列に設けられた第２の処理系と、
前記伸長透明度データおよび前記伸長減色透明度データの画質と、前記圧縮透明度データおよび前記圧縮減色透明度データの符号量とのうちの少なくとも一方を評価することによって、前記第１の処理系によって生成された前記圧縮透明度データおよび前記第２の処理系によって生成された前記圧縮減色透明度データのいずれかの圧縮タイプを選択し、当該選択された圧縮タイプの指定を行うタイプ判定部と、
前記圧縮透明度データおよび前記判定しきい値並びに前記圧縮減色透明度データと前記圧縮タイプの指定とを圧縮データとして出力する出力部と、を備えたことを特徴とするエンコードシステム。
前記判定しきい値は、完全透明および完全不透明の一方を示す最小値に前記伸長透明度データを補正する階調範囲を示す最小判定しきい値であって、
前記しきい値決定部は、前記最小値よりも大きな値に歪んでいる前記伸長透明度データがグループ内に存在する場合、前記最小判定しきい値として、当該グループに属する当該歪んだ伸長透明度データのうちの最大値以上を設定することを特徴とする請求項１に記載されたエンコードシステム。
前記判定しきい値は、完全透明および完全不透明の他方を示す最大値に前記伸長透明度データを補正する階調範囲を示す最大判定しきい値であって、
前記しきい値決定部は、前記最大値よりも小さな値に歪んでいる前記伸長透明度データがグループ内に存在する場合、前記最大判定しきい値として、当該グループに属する当該歪んだ伸長透明度データのうちの最小値以下を設定することを特徴とする請求項１または２に記載されたエンコードシステム。
前記グループは、画像平面を複数に分割することによって設定された画素ブロックであることを特徴とする請求項１から３のいずれかに記載されたエンコードシステム。
透明度データに歪み圧縮を施して生成する第１の圧縮タイプと、前記透明度データの階調数を減らした減色透明度データに無歪み圧縮を施して生成する第２の圧縮タイプとのいずれかの圧縮タイプの圧縮データを振り分け入力し、伸長して透明度データを復元するデコードシステムであって、
前記第１の圧縮タイプの圧縮透明度データを伸長して、透明度データの復元値である伸長透明度データを生成する第１の伸長部と、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示し、かつ、画像平面上のグループ毎に設定された判定しきい値が、前記圧縮データから抽出されて供給されるとともに、あるグループの判定しきい値と当該判定しきい値に対応する完全透明または完全不透明との間の階調範囲内に、当該グループに属する前記伸長透明度データが含まれる場合、当該伸長透明度データを当該判定しきい値に対応する完全透明または完全不透明に補正するしきい値処理部と、を有する第１の処理系と、
前記第２の圧縮タイプの圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第２の伸長部を有し、前記第１の処理系に並列に設けられた第２の処理系と、
前記圧縮データから抽出された圧縮タイプの指定に応じて、前記圧縮データから抽出された前記第１の圧縮タイプの圧縮透明度データを前記第１の処理系に供給し、前記圧縮データから抽出された前記第２の圧縮タイプの圧縮透明度データを前記第２の処理系に供給する入力部と、を備えたことを特徴とするデコードシステム。
前記判定しきい値は、完全透明または完全不透明の一方を示す最小値に前記伸長透明度データを補正する階調範囲を示す最小判定しきい値であって、
前記しきい値処理部は、グループ毎に設けられた前記最小判定しきい値を用いて、当該グループに属する前記伸長透明度データのそれぞれの補正を行うことを特徴とする請求項５に記載されたデコードシステム。
前記判定しきい値は、完全透明または完全不透明の他方を示す最大値に前記伸長透明度データを補正する階調範囲を示す最大判定しきい値であって、
前記しきい値処理部は、グループ毎に設けられた前記最大判定しきい値を用いて、当該グループ内に存在する前記伸長透明度データのそれぞれの補正を行うことを特徴とする請求項５または６に記載されたデコードシステム。
前記グループは、画像平面を複数に分割することによって設定された画素ブロックであることを特徴とする請求項５から７のいずれかに記載されたデコードシステム。