JP4753397B1 - エンコードシステムおよびデコードシステム - Google Patents

エンコードシステムおよびデコードシステム Download PDF

Info

Publication number
JP4753397B1
JP4753397B1 JP2010266066A JP2010266066A JP4753397B1 JP 4753397 B1 JP4753397 B1 JP 4753397B1 JP 2010266066 A JP2010266066 A JP 2010266066A JP 2010266066 A JP2010266066 A JP 2010266066A JP 4753397 B1 JP4753397 B1 JP 4753397B1
Authority
JP
Japan
Prior art keywords
value
transparency data
compression
compressed
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010266066A
Other languages
English (en)
Other versions
JP2011193437A (ja
Inventor
一樹 客野
優佑 星月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Axell Corp
Original Assignee
Axell Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axell Corp filed Critical Axell Corp
Priority to JP2010266066A priority Critical patent/JP4753397B1/ja
Application granted granted Critical
Publication of JP4753397B1 publication Critical patent/JP4753397B1/ja
Publication of JP2011193437A publication Critical patent/JP2011193437A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】透明度の圧縮データ量を抑制しつつ、完全透明または完全不透明の再現性を保証する。
【解決手段】第1圧縮部2はα値に歪み圧縮を施し圧縮α値(A)を生成する。第1伸長部3は圧縮α値(A)を伸長し伸長α値(A)を生成する。しきい値決定部4は完全透明又は完全不透明から異なる値に歪んだ伸長α値(A)を本来値に補正する判定しきい値αth1,αth2を、対応する伸長α値(A)とα値との比較から決定する。減色部6はα値から減色α値を生成する。第2圧縮部7は減色α値に無歪み圧縮を施し圧縮α値(B)を生成する。第2伸長部8は圧縮α値(B)を伸長し伸長α値(B)を生成する。タイプ判定部9は所定の基準によりタイプA,Bを評価し適用すべき圧縮タイプを選択する。出力部10は指定されたタイプの圧縮α値および判定しきい値αth1,αth2とタイプ指定とを圧縮データとして出力する。
【選択図】図7

Description

本発明は、エンコードシステムおよびデコードシステムに係り、特に、歪み圧縮によって歪んだ透明度データ(α値)の歪み補正に関する。
画像の透明度を規定するデータとして、α値(アルファ値)や透過率と呼ばれる透明度データが知られている。しかしながら、その圧縮方法は、RGBやグレースケールの階調値を規定する輝度データほど規格化が進んでおらず、個々の実装に委ねられているのが実情である。例えば、透明度という概念自体が存在せず輝度データのみを取り扱う実装もあれば、輝度データの特別な値を透明度情報として割り当てる実装、更にはJPEGのような一般的な圧縮手法をα値の圧縮にそのまま適用する実装もあるといった如くである。
また、α値の特性に着目したα値固有の圧縮手法も従来より提案されている。例えば、特許文献1には、画像の輝度を規定する輝度レイヤと、画像の透明度を規定する透明度レイヤの間には相関性があるという知得に基づき、圧縮された輝度データを用いてα値を圧縮する手法が開示されている。この圧縮手法では、まず、各画素のRGBデータがYUVデータに変換され、このYUVデータに非可逆圧縮が施された後、圧縮されたYUVデータの輝度成分を用いてα値の符号化が行われる。一方、特許文献2には、輝度レイヤとは独立した透明度レイヤのみで完結するα値の圧縮手法が開示されている。具体的には、まず、α値の変化パターンに共通性がある画像領域が連結ブロックとして抽出される。つぎに、連結ブロック内のランやその差分に基づいて中間符号が生成され、この中間符号に対して可変長符号化が施される。この圧縮手法は、自然画等における輝度データと比べて、α値の変化パターンに共通性を有する画像領域が局所的に集中する傾向があるという知得に基づいており、この局所性を中間符号の出現確率の偏りに反映することで、圧縮率の向上を図る。
さらに、特許文献3には、階調範囲外にオーバーフローしたデコードα値を階調範囲内にクランプするクリッピングが開示されている。このクリッピングのために、階調範囲を規定する最小αしきい値(例えば0)および最大αしきい値(例えば255)が設けられており、これらのしきい値によってデコードα値がクランプされる。すなわち、階調の最小値に相当する最小αしきい値よりもデコードα値が小さい場合には、デコードα値が最小値に変更され、階調の最大を規定する最大αしきい値よりもデコードα値が大きい場合には、デコードα値が最大値に変更される。
特開2004−159260号公報 特開2008−227934号公報 特表2007−517434号公報
ところで、画像の透明度を多階調で表現する透明度データでは、完全透明や完全不透明を的確に再現・復元する必要がある。本来、完全透明(例えば最小値0)であるべき画像領域がそうでなくなると、透過して表示されないはずの色が表示されてしまうことになる。そのため、α値が完全透明の場所に対応するRGB画素は、表示されないものと想定されているため、α値が非透明の画素とは全く異なる色が格納されていることが多い。例えば、グリーンバックで撮影した画像にα値を付加した場合、α値が完全透明の場所のRGB画素が緑色になる。ここで、非透明の画素が赤系であった場合、α値が量子化歪で0から1に変化してしまうだけで、赤の中に緑が出現して、非常に目立つことになる。このように、α値が完全透明の場所には、非透明の場所と相関の無い画像が入力されることも多く、そのため、完全透明のわずかな変化であっても目に付き易い。また、完全不透明においては、動く背景の上に静止した画像を重ねた場合、完全不透明255が254に変化してしまうだけで、動く背景の動きに連動して、静止した画像にノイズが生じることになる。そのため、完全不透明のわずかな変化であっても目に付き易い。
上述した特許文献3のクリッピングは、デコード時にオーバーフローしたα値を最小αしきい値と最大αしきい値とによって規定される階調範囲内にクランプするものであって、上述した完全透明や完全不透明のわずかな変化に対する対策を意図したものではない。
そこで、本発明の目的は、透明度の圧縮データ量を抑制しつつ、完全透明または完全不透明の再現性を保証することである。
この発明に係る、透明度データを圧縮するエンコードシステムにおいては、前記透明度データに歪み圧縮を施して、圧縮透明度データを生成する第1の圧縮部と、前記圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第1の伸長部と、画像平面上のグループ毎に設定され、かつ、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示す判定しきい値を、同一のグループに属するそれぞれの前記伸長透明度データと、これに対応する前記透明度データとを比較することによって決定するしきい値決定部と、を有する第1の処理系と、前記透明度データの階調数を減らして、減色透明度データを生成する減色部と、前記減色透明度データに無歪み圧縮を施して、圧縮減色透明度データを生成する第2の圧縮部と、前記圧縮減色透明度データを伸長して、前記減色透明度データの復元値である伸長減色透明度データを生成する第2の伸長部と、を有し、前記第1の処理系に並列に設けられた第2の処理系と、前記伸長透明度データおよび前記伸長減色透明度データの画質と、前記圧縮透明度データおよび前記圧縮減色透明度データの符号量とのうちの少なくとも一方を評価することによって、前記第1の処理系によって生成された前記圧縮透明度データおよび前記第2の処理系によって生成された前記圧縮減色透明度データのいずれかの圧縮タイプを選択し、当該選択された圧縮タイプの指定を行うタイプ判定部と、前記圧縮透明度データおよび前記判定しきい値並びに前記圧縮減色透明度データと前記圧縮タイプの指定とを圧縮データとして出力する出力部と、を備えた構成とする。
ここで、この発明に係るエンコードシステムにおいて、判定しきい値は、完全透明および完全不透明の一方を示す最小値に伸長透明度データを補正する階調範囲を示す最小判定しきい値であってもよい。この場合、しきい値決定部は、最小値よりも大きな値に歪んでいる伸長透明度データがグループ内に存在する場合、最小判定しきい値として、このグループに属する歪んだ伸長透明度データのうちの最大値以上を設定することが好ましい。また、判定しきい値は、完全透明および完全不透明の他方を示す最大値に伸長透明度データを補正する階調範囲を示す最大判定しきい値であってもよい。この場合、しきい値決定部は、最大値よりも小さな値に歪んでいる伸長透明度データがグループ内に存在する場合、最大判定しきい値として、このグループに属する歪んだ伸長透明度データのうちの最小値以下を設定することが好ましい。
また、この発明に係るデコードシステムにおいては、透明度データに歪み圧縮を施して生成する第1の圧縮タイプと、前記透明度データの階調数を減らした減色透明度データに無歪み圧縮を施して生成する第2の圧縮タイプとのいずれかの圧縮タイプの圧縮データを振り分け入力し、伸長して透明度データを復元するデコードシステムであって、前記第1の圧縮タイプの圧縮透明度データを伸長して、透明度データの復元値である伸長透明度データを生成する第1の伸長部と、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示し、かつ、画像平面上のグループ毎に設定された判定しきい値が、前記圧縮データから抽出されて供給されるとともに、あるグループの判定しきい値と当該判定しきい値に対応する完全透明または完全不透明との間の階調範囲内に、当該グループに属する前記伸長透明度データが含まれる場合、当該伸長透明度データを当該判定しきい値に対応する完全透明または完全不透明に補正するしきい値処理部と、を有する第1の処理系と、前記第2の圧縮タイプの圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第2の伸長部を有し、前記第1の処理系に並列に設けられた第2の処理系と、前記圧縮データから抽出された圧縮タイプの指定に応じて、前記圧縮データから抽出された前記第1の圧縮タイプの圧縮透明度データを前記第1の処理系に供給し、前記圧縮データから抽出された前記第2の圧縮タイプの前記圧縮透明度データを第2の処理系に供給する入力部と、を備えた構成とする。
ここで、この発明に係るデコードシステムにおいて、判定しきい値は、完全透明または完全不透明の一方を示す最小値に伸長透明度データを補正する階調範囲を示す最小判定しきい値であってもよい。この場合、しきい値処理部は、グループ毎に設けられた最小判定しきい値を用いて、このグループに属する伸長透明度データのそれぞれの補正を行うことが好ましい。また、判定しきい値は、完全透明または完全不透明の他方を示す最大値に伸長透明度データを補正する階調範囲を示す最大判定しきい値であってもよい。この場合、しきい値処理部は、グループ毎に設けられた最大判定しきい値を用いて、このグループ内に存在する伸長透明度データのそれぞれの補正を行うことが好ましい。
さらに、上述したこの発明に係るエンコードシステムおよびデコードシステムにおいて、上記グループは、画像平面を複数に分割することによって設定された画素ブロックであることが好ましい。
この発明に係るエンコードシステムにおいては、伸長透明度データを本来の完全透明または本来の完全不透明に補正するための判定しきい値を設け、これを圧縮データの一部とする。これにより、圧縮時に圧縮透明度データ自体の値を補正しなくても、その伸長時に完全透明または完全不透明を的確に再現することができる。また、この判定しきい値は、画像平面上のグループ単位で動的かつ個別的に設定される。したがって、補正値を画素単位で設定する場合と比較して、圧縮データ量が少なくて済む。加えて、無歪み圧縮を選択的に使用することにより、画質の低下を有効に防止することができる。また、この発明に係るデコードシステムにおいては、透明度データにおける完全透明または完全不透明を的確に再現しつつ、圧縮透明度データを伸長できる。
第1の実施形態に係るエンコードシステムのブロック構成図 画素ブロックの説明図 α値の歪みに応じた判定しきい値の決定処理の説明図 第1の実施形態に係る圧縮データの論理的な構成図 第1の実施形態に係るデコードシステムのブロック構成図 判定しきい値を用いたα値のしきい値処理の説明図 第2の実施形態に係るエンコードシステムのブロック構成図 第2の実施形態に係る圧縮データの論理的な構成図 第2の実施形態に係るデコードシステムのブロック構成図
(第1の実施形態)
(エンコードシステム)
図1は、本実施形態に係るエンコードシステムのブロック構成図である。このエンコードシステム1は、圧縮部2と、伸長部3と、しきい値決定部4と、出力部5とを有し、画像の透明度を規定する透明度データ(以下「α値」という)を圧縮して圧縮データを出力する。本実施形態では、α値の階調数を一例として256とし、最小値0を完全透明、最大値255を完全不透明にそれぞれ対応付けるが、これとは逆に対応付けてもよい。
圧縮部2は、α値に歪み圧縮を施して、圧縮透明度データ(以下「圧縮α値」という)を生成する。この圧縮部2は、DCT部2aと、量子化部2bと、エントロピー符号化部2cとを有する。DCT部2aは、画像平面上に設定された所定サイズの画素ブロック単位で、個々の画素ブロック内のα値を入力としたDCT(離散コサイン変換)処理を行う。量子化部2bは、DCT処理によって算出された画素ブロック毎のDCT係数を所定の除数で除算して、余りを丸めて符号化(量子化)する。エントロピー符号化部2cは、量子化処理が行われたDCT係数に対して、ハフマン符号化や算術符号化といったエントロピー符号化を施すことによって、圧縮α値を生成する。生成された圧縮α値は、後段の伸長部3および出力部5のそれぞれに供給される。
ここで、圧縮部2から最終的に出力される圧縮α値は、圧縮部2に入力されたα値とは僅かに異なる状態に歪むことがある。例えば、最小値0(完全透明)がこれよりも若干大きな値に歪んだ場合には、本来的に表示されないはずの画素が出現する。同様に、最大値255(完全不透明)がこれよりも若干小さな値に歪んだ場合には、本来的に表示されないはずの背景が出現する。完全透明および完全不透明については、わずかな変化であっても目に付き易いので、画質の低下に直結する。このような歪みが生じる原因としては、基本的に量子化による丸め誤差が挙げられるが、DCTの精度を切り詰めて実装した場合等では、順変換および逆変換における演算誤差も影響を及ぼし得る。
なお、本実施形態では、歪み圧縮の一例として、DCTを主体とした構成を例示しているが、周知のように歪み圧縮には様々な形態があり、それらのいずれを採用してもよい。例えば、DCT以外の直交変換、ウエーブレット変換、DPCM等の線形予測符号化、交流成分予測(ACP)、再帰的交流成分予測(RACP)といった如くである。また、処理対象の上方および左方の処理済領域の値から予測画像を生成し、その差分にDCTを施してもよい。
伸長部3は、図5の伸長部12と同様の構成を有し、歪み圧縮された圧縮α値を伸長する。典型的には、この伸長は圧縮部2の処理とは逆の処理を行えばよい。これによって、α値の復元値である伸長透明度データ(以下「伸長α値」という)が生成される。生成された伸長α値は、後段のしきい値決定部4に供給される。
しきい値決定部4は、伸長α値(復元値)と、これに対応するα値(本来値)とを比較することによって、上述したα値の歪みを補正するための判定しきい値を決定する。判定しきい値の決定は、画素毎ではなく、画像平面上に設定されたグループ毎に行われる。グループの設定の仕方としては、画像平面上において互いに離間した複数の画素を1グループとしてもよいし、互いに隣接した複数の画素を1グループとしてもよい。ただし、α値の空間的な相関性を生かせる点で後者の方が有利なので、本実施形態では、上記グループとして、隣接した複数画素によって構成される画素ブロックを用いる。
図2は、画像平面上に設定される画素ブロックの説明図である。画素ブロックPBは、画像平面を複数に分割することによって設定される。それぞれの画素ブロックPBは、例えば8×8画素のα値で構成される。なお、判定しきい値の決定単位となる画素ブロックPBは、圧縮部2での処理対象(DCTの演算単位となる画素ブロック)と同じ8×8画素のサイズであってもよいが、そうでなくても構わない。また、同図の矢印は、しきい値決定部4の処理順序を示すが、これを圧縮部2の処理順序と一致させれば、処理速度の向上を図ることができる。
図3は、α値の歪みに応じた判定しきい値αth1,αth2の決定処理の説明図である。判定しきい値αth1,αth2は、完全透明または完全不透明から異なる値に歪んだ伸長α値を本来の完全透明または本来の完全不透明に補正する階調範囲を規定し、画素ブロック内に存在するα値(完全透明または完全不透明に関するもののみ)の歪みの程度に応じて設定される。
具体的には、最小判定しきい値αth1に関して、まず、処理対象となる画素ブロックPBにおいて、圧縮前α値(本来値)が最小値0、すなわち完全透明であるものが特定される。つぎに、完全透明の圧縮前α値に対応する伸長後α値(復元値)が参照される。そして、本来値0から大きな値に歪んだ伸長後α値がブロックPB内に存在する場合、その最大値が最小判定しきい値αth1に設定される。例えば、ある画素ブロックPB内に本来値0が3個存在し、それぞれが1,2,3に歪んでいる場合、最大値3が最小判定しきい値αth1となる。最小判定しきい値αth1は、完全透明を示す最小値0に伸長α値を補正する階調範囲を規定する。したがって、上記ケースでαth1=3に設定すれば、本来値0から歪んだ3つの伸長後α値1,2,3が全て最小値0に補正されることを保証できる。ただし、歪み補正の観点でいえば、最小判定しきい値αth1は、本来値0から歪んだ伸長後α値の最大値である必要は必ずしもなく、最大値以上の値(例えば4)であれば足りる。一方、本来値0から大きな値に歪んだ伸長後α値がブロックPB内に存在しない場合、最小判定しきい値αth1として0が設定される。
一方、最大判定しきい値αth2に関しては、まず、処理対象となる画素ブロックPBにおいて、圧縮前α値(本来値)が最大値255、すなわち完全不透明であるものが特定される。つぎに、完全不透明の圧縮前α値に対応する伸長後α値(復元値)が参照される。そして、本来値255から小さな値に歪んだ伸長後α値がブロックPB内に存在する場合、その最小値が最大判定しきい値αth2に設定される。例えば、ある画素ブロックPB内に本来値255が3個存在し、それぞれが252,253,254に歪んでいる場合、最小値252が最大判定しきい値αth2となる。最大判定しきい値αth2は、完全不透明を示す最大値255に伸長α値を補正する階調範囲を規定する。したがって、上記ケースでαth2=252に設定すれば、本来値255から歪んだ3つの伸長後α値252,253,254が全て最大値255に補正されることを保証できる。ただし、歪み補正の観点でいえば、最大判定しきい値αth2は、本来値255から歪んだ伸長後α値の最小値である必要は必ずしもなく、最小値以下の値(例えば251)であれば足りる。一方、本来値255からも小さな値に歪んだ伸長後α値がブロックPB内に存在しない場合、最大判定しきい値αth2として255が設定される。
しきい値決定部4は、以上のようにして算出された判定しきい値αth1,αth2を出力部5に供給する。なお、歪み補正は、完全透明および完全不透明の双方について行うことが最も好ましいが、いずれか一方のみであってもよい。一方のみを対象とする場合、判定しきい値αth1,αth2の一方のみを算出すれば足りる。
出力部5は、圧縮部2から供給された圧縮α値と、しきい値決定部4から供給された判定しきい値αth1,αth2とに基づいて、圧縮データを生成・出力する。図4に示すように、圧縮データは、画素ブロックPB毎の圧縮α値B0,B1,・・・と、それぞれの画素ブロックPBの付帯情報である判定しきい値αth1,αth2とを有し、これらは互いに対応付けられている。この対応付けによって、圧縮データを伸長する際、どの画素ブロックPBにどの判定しきい値αth1,αth2を適用すべきかが一義的に特定される。
このように、本実施形態に係るエンコードシステム1によれば、伸長α値を本来の完全透明または本来の完全不透明に補正するための判定しきい値αth1,αth2を設け、これを圧縮データの一部として出力する。これにより、圧縮時に圧縮透明度データ自体の値を補正しなくても、伸長時における完全透明または完全不透明の再現性を保証できる。また、この判定しきい値αth1,αth2は、画像平面上の画素ブロックPB単位で動的かつ個別的に設定される。したがって、補正値を画素単位で設定する場合と比較して、圧縮データ量が少なくて済む。
(デコードシステム)
図5は、本実施形態に係るデコードシステムのブロック構成図である。このデコードシステム11は、伸長部12と、しきい値処理部13とを有し、図1に示したエンコードシステム1によって生成された圧縮データを伸長して、α値を復元する。
伸長部12は、エントロピー復号化部12aと、逆量子化部12bと、IDCT部12cを有し、歪み圧縮された圧縮データから抽出された圧縮α値を伸長して、復元値としての伸長α値を生成する。典型的には、この伸長は圧縮部2の歪み圧縮とは逆の処理を行えばよい。生成された伸長α値は、しきい値処理部13に供給される。しきい値処理部13は、圧縮データから抽出された判定しきい値αth1,αth2を用いて、伸長部12から供給された伸長α値にしきい値処理を施すことによって、伸長α値を補正する。このしきい値処理は、しきい値決定部4のしきい値決定処理と同様、画素ブロックPB単位で行われる。
図6は、判定しきい値αth1,αth2を用いたしきい値処理の説明図である。上述したように、判定しきい値αth1,αth2は、完全透明または完全不透明から異なる値に歪んだ伸長α値を本来の完全透明または本来の完全不透明に補正する階調範囲を規定する。しきい値処理部13は、ある画素ブロックPBの判定しきい値αth1,αth2によって規定される階調範囲内に伸長α値が含まれる場合、これを判定しきい値αth1,αth2に対応する完全透明または完全不透明に補正する。
具体的には、最小判定しきい値αth1の処理に関して、まず、処理対象となる画素ブロックPBの最小判定しきい値αth1が特定される。つぎに、この画素ブロックPBに属するしきい値処理前α値(入力値)が読み込まれる。そして、最小値0と最小判定しきい値αth1との間の階調範囲にある入力値については最小値0に一律に補正され、これが最終的な出力値(しきい値処理後α値)として出力される。例えば、ある画素ブロックPB内の最小判定しきい値αth1が3の場合、その画素ブロックPBに属する3以下の入力値はすべて最小値0に変更される。これによって、完全透明の歪みが補正され、完全透明が的確に再現される。一方、3よりも大きな入力値については、このような変更を行うことなく、出力値としてそのまま出力される。
ここで、最小判定しきい値αth1が例えば3の場合、本来値が0値の入力値はもとより、本来値が0値でない入力値(例えば2)までもが0値に変更されてしまうことになる。非0値が0値として出力されると、厳密にはそれがノイズとして出現する。しかしながら、このような非0値は元々小さな成分なので、見えにくかった画素が完全に消えるだけで画質的には大差ない。したがって、このようなノイズについては許容するものとする。この点は、最大判定しきい値αth2の処理についても同様である。
一方、最大判定しきい値αth2の処理に関しては、まず、処理対象となる画素ブロックPBの最大判定しきい値αth2が特定される。つぎに、この画素ブロックPBに属するしきい値処理前α値(入力値)が読み込まれる。そして、最大判定しきい値αth2と最大値255との間の階調範囲にある入力値については最大値255に一律に補正され、これが最終的な出力値(しきい値処理後α値)として出力される。例えば、ある画素ブロックPB内の最大判定しきい値αth1が252の場合、その画素ブロックPBに属する252以上の入力値はすべて最大値255に変更される。これによって、完全不透明の歪みが補正され、完全不透明が的確に再現される。一方、252よりも小さな入力値については、このような変更を行うことなく、出力値としてそのまま出力される。
このように、本実施形態に係るデコードシステム11によれば、透明度データにおける完全透明または完全不透明を的確に再現しつつ、エンコードシステム1によって生成された圧縮α値を伸長できる。
(第2の実施形態)
上述した第1の実施形態では、歪み圧縮を用いているため、α値が急激に変化するエッジ部分が鈍り易い。かかる不都合を解消すべく、本実施形態では、歪み圧縮と無歪み圧縮とを併用したシステムについて説明する。
(エンコードシステム)
図7は、本実施形態に係るエンコードシステムのブロック構成図である。このエンコードシステム21は、第1の処理系2〜4,13と、第2の処理系6〜8と、タイプ判定部9と、出力部10とを有する。このシステム21の動作を概略的に述べると、第1の処理系2で歪み圧縮を行って、タイプAの圧縮α値を生成するとともに、これと並行して第2の処理系6,7でα値の減色および無歪み圧縮を行って、タイプBの圧縮α値を生成する。そして、タイプ判定部9において、タイプA,Bの画質および推定符号量を比較して一方を選択し、選択されたタイプの圧縮α値を出力部10から出力する。
第1の処理系は、第1の圧縮部2と、第1の伸長部3と、しきい値決定部4と、しきい値処理部13とによって構成されている。第1の圧縮部2は、第1の実施形態の圧縮部2と同様、歪み圧縮によって圧縮α値(タイプA)を生成する。第1の伸長部3は、第1の実施形態の伸長部3と同様、圧縮α値(タイプA)を伸長して、その復元値である伸長α値(タイプA)を生成する。この伸長部3には、伸長するデータの符号量をカウントするカウンタが内蔵されているが、このカウンタを第1の圧縮部2に内蔵してもよい。しきい値決定部4は、第1の実施形態と同様、伸長α値(タイプA)と、これに対応するα値とを比較することによって、画素ブロックPB毎に判定しきい値αth1,αth2を決定する。しきい値処理部13は、第1の実施形態と同様、判定しきい値αth1,αth2を用いたしきい値処理を行い、伸長α値(タイプA)を補正する。そして、補正後の伸長α値はタイプ判定部9に供給される。以上の処理部2〜4,13については、第1の実施形態で述べたそれと基本構成は同様なので、同一の符号を付してここでの説明を省略する。
第2の処理系は、減色部6と、第2の圧縮部7と、第2の伸長部8とによって構成されており、第1の処理系2〜4,13と並行して画質を優先した無歪み圧縮を行う。この無歪み圧縮は、第1の処理系の歪み圧縮と同様、ブロック単位で行われる。具体的には、減色部6は、α値の階調数を減らした減色透明度データ(以下「減色α値」という)を生成する。α値の減色は、量子化値を初期値としたクラスタリングによって行われる。クラスタリング(clustering)とは、複数のデータを、その類似度に基いて分類すること、または、そのための統計学的手法をいう。概略的には、α値が密な値域に対して多くのクラスタ値が割り当てられる一方、α値が疎な値域に対しては割り当てを省略することによって、割り当てが適応的に行われる。クラスタリングは、圧縮効率を高めるための前処理として行われるが、この処理によって、α値の本来の意味が失われる訳ではない。なお、α値の減色に際しては、最小値0および最大値255が必ず保持されるようにする。第2の圧縮部7は、周知の無歪み圧縮(無歪み符号化)を画素ブロックPB単位で行って、減色α値から圧縮α値(圧縮減色透明度データ)を生成する。無歪み圧縮としては、例えば、エントロピー符号化、或いは、画素ブロックPBの上方および左方(処理済の領域)の値から減色後の値を予測した残差をエントロピー符号化するといった手法を用いることができる。第2の伸長部8は、タイプB、すなわち無歪み圧縮された圧縮α値から復元値である伸長α値(伸長減色透明度データ)を生成する。典型的には、この伸長は第2の圧縮部7の無歪み圧縮とは逆の処理を行えばよい。また、この伸長部8には、伸長するデータの符号量をカウントするカウンタが内蔵されている。第2の処理系は無歪み圧縮なので、伸長α値においてもα値の最小値0および最大値255は必ず保持される。
タイプ判定部9は、所定の基準に基づいて画素ブロックPB毎にタイプA,Bを評価して、画素ブロックPBに適用すべき圧縮タイプとして、評価の優れている方を選択する。好ましい評価基準としては、例えば数式1のように定義された画質が挙げられる。
Figure 0004753397
ここで、画質の評価関数において、iは画素ブロックPBにおける画素番号を示し、8×8画素サイズの場合、iは0から63となる。SRC[i]はi番目の画素のα値(本来値)、DEC[i]はi番目の画素の伸長α値(復元値)である。SRC[i]とDEC[i]の差分の自乗総和が小さいほど、換言すれば、ブロック内の復元画像が原画像に近くなるほど、評価関数f1の出力値が小さくなる。したがって、タイプA,Bのそれぞれについて演算を行い、その出力値f1が小さい方を画質がよいものと判定できる。この場合、画質がよい方を圧縮タイプとして選択することができる。
また、評価基準として、データの符号量を用いてもよい。上述したように、伸長するデータの符号量(タイプA,B)は、伸長部3,8のカウンタによってそれぞれカウントされる。タイプ判定部9は、タイプA,Bのうち符号量の少ない方を圧縮タイプとして選択することができる。
更に、評価基準として、画質および符号量の双方を考慮すれば、圧縮性能の更なる向上を図ることができる。一例として示す数式2は、画質に関する評価値f1(数式1の出力値)と、上記符号量に係数λを乗算したものとの和を評価関数としている。
(数式2)
f2 = f1 + λ×符号量
ここで、係数λは、符号量の重み付け、すなわち、画質と符号量のどちらをより重視するかのパラメータである。この係数λは、経験的に決定した定数であってもよいし、量子化係数に応じて変更してもよい。数式2において、符号量が大きくなるほど、もしくは画質が悪くなるほど、出力値f2は大きな値を取る。したがって、タイプA,Bのそれぞれについて演算を行い、出力値f2の小さい方を圧縮タイプとして選択することができる。以上のような評価基準によって選択された圧縮タイプは、出力部10に通知される。
出力部10は、タイプ判定部9によって指定された圧縮タイプの圧縮α値を圧縮データとして出力する。すなわち、ある画素ブロックPBに関して、タイプAが指定された場合には、その画素ブロックPBの圧縮データとして圧縮α値(タイプA)が出力され、タイプBが指定された場合には、圧縮データとして圧縮α値(タイプB)が出力される。図8に示すように、圧縮データは、画素ブロックPB毎の圧縮α値B0,A1,A2,B3,・・・と、タイプAの付帯情報である判定しきい値αth1,αth2とを有する。ここで、A1,A2は圧縮タイプがタイプAであり、B0,B3は圧縮タイプがタイプBであることをそれぞれ示し、圧縮データの一部としてタイプA,Bの指定が含まれる。これにより、圧縮データを伸長する際、画素ブロックPBの圧縮タイプと、どの判定しきい値αth1,αth2を適用すべきかとが一義的に特定される。
このように、本実施形態に係るエンコードシステム21によれば、第1の実施形態と同様の効果を奏する他、無歪み圧縮を選択的に使用することにより、画質の低下を有効に防止することができる。
(デコードシステム)
図9は、本実施形態に係るデコードシステムのブロック構成図である。このデコードシステム31は、入力部14と、第1の処理系12,13と、第2の処理系15とを有し、図7に示したエンコードシステム21によって生成された圧縮データを伸長して、α値を復元する。
入力部14は、圧縮データの振り分けを画素ブロックPB毎に行って、タイプAの圧縮α値を第1の処理系(第1の伸長部12)に供給し、タイプBの圧縮α値を第2の処理系(第2の伸長部15)に供給する。
第1の処理系は、第1の伸長部12と、しきい値処理部13とを有し、圧縮データから抽出され、かつ、歪み圧縮された圧縮α値(タイプA)から復元値としての伸長α値を生成する。典型的には、この伸長は第1の圧縮部7の無歪み圧縮とは逆の処理を行えばよい。第1の伸長部12によって生成された伸長α値は、しきい値処理部13に供給される。しきい値処理部13は、圧縮データから抽出された判定しきい値αth1,αth2を用いて、第1の伸長部12から供給された伸長α値にしきい値処理を施すことによって、伸長α値を補正する。このしきい値処理は、しきい値決定部4のしきい値決定処理と同様、画素ブロックPB単位で行われる。そして、しきい値処理を経た補正後の伸長α値が出力される。一方、第2の処理系は、第2の伸長部15を有し、圧縮データから抽出され、かつ、無歪み圧縮された圧縮α値(タイプB)から復元値としての伸長α値を生成する。典型的には、この伸長は第2の圧縮部7の無歪み圧縮とは逆の処理を行えばよい。ブロック毎に復元された伸長α値は、最終的な出力データとしてデコードシステム13から出力される。
このように、本実施形態によれば、透明度データにおける完全透明または完全不透明を的確に再現しつつ、エンコードシステム21によって生成された圧縮α値を伸長できる。
なお、上述した各実施形態に係るエンコードシステムおよびデコードシステムと等価な機能は、コンピュータによるソフトウェア処理によっても実現できる。したがって、コンピュータの動作手順を規定するコンピュータ・プログラムとしても、本発明を捉えることができる。すなわち、α値を圧縮する圧縮処理をコンピュータに実行させるエンコードプログラムとして本発明を捉えた場合、このプログラムが規定する基本的な動作手順は以下のようになる。まず、α値に歪み圧縮を施して、圧縮α値が生成される。つぎに、圧縮α値を伸長して、α値の復元値である伸長α値が生成される。つぎに、同一のグループに属するそれぞれの伸長α値と、これに対応するα値(本来値)とを比較することによって、判定しきい値αth1,αth2が決定される。そして、圧縮α値と、判定しきい値αth1,αth2とが圧縮データとして出力される。一方、圧縮データを伸長してα値を復元する伸長処理をコンピュータに実行させるデコードプログラムとして本発明を捉えた場合、このプログラムが規定する基本的な動作手順は以下のようになる。まず、圧縮データから抽出され、かつ、歪み圧縮された圧縮α値を伸長して、α値の復元値である伸長α値が生成される。つぎに、上述した判定しきい値αth1,αth2が圧縮データから抽出される。そして、ある画素ブロックPBの判定しきい値αth1,αth2と、これに対応する本来値(完全透明または完全不透明)との間の階調範囲内に、この画素ブロックPBに属する伸長α値が含まれる場合、この伸長α値が判定しきい値αth1,αth2に対応する本来値に補正される。
以上のように、本発明は、透明度データにおける完全透明または完全不透明の再現性を確保することを意図したα値の歪み補正に対して広く適用できる。
1,21 エンコードシステム
2 圧縮部(第1の圧縮部)
2a DCT部
2b 量子化部
2c エントロピー符号化部
3 伸長部(第1の伸長部)
4 しきい値決定部
5,10 出力部
6 減色部
7 第2の圧縮部
8 第2の伸長部
9 タイプ判定部
11,31 デコードシステム
12 伸長部(第1の伸長部)
12a エントロピー復号化部
12b 逆量子化部
12c IDCT部
13 しきい値処理部
14 入力部
15 第2の伸長部

Claims (8)

  1. 透明度データを圧縮するエンコードシステムにおいて、
    前記透明度データに歪み圧縮を施して、圧縮透明度データを生成する第1の圧縮部と、前記圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第1の伸長部と、画像平面上のグループ毎に設定され、かつ、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示す判定しきい値を、同一のグループに属するそれぞれの前記伸長透明度データと、これに対応する前記透明度データとを比較することによって決定するしきい値決定部と、を有する第1の処理系と、
    前記透明度データの階調数を減らして、減色透明度データを生成する減色部と、前記減色透明度データに無歪み圧縮を施して、圧縮減色透明度データを生成する第2の圧縮部と、前記圧縮減色透明度データを伸長して、前記減色透明度データの復元値である伸長減色透明度データを生成する第2の伸長部と、を有し、前記第1の処理系に並列に設けられた第2の処理系と、
    前記伸長透明度データおよび前記伸長減色透明度データの画質と、前記圧縮透明度データおよび前記圧縮減色透明度データの符号量とのうちの少なくとも一方を評価することによって、前記第1の処理系によって生成された前記圧縮透明度データおよび前記第2の処理系によって生成された前記圧縮減色透明度データのいずれかの圧縮タイプを選択し、当該選択された圧縮タイプの指定を行うタイプ判定部と、
    前記圧縮透明度データおよび前記判定しきい値並びに前記圧縮減色透明度データと前記圧縮タイプの指定とを圧縮データとして出力する出力部と、を備えたことを特徴とするエンコードシステム。
  2. 前記判定しきい値は、完全透明および完全不透明の一方を示す最小値に前記伸長透明度データを補正する階調範囲を示す最小判定しきい値であって、
    前記しきい値決定部は、前記最小値よりも大きな値に歪んでいる前記伸長透明度データがグループ内に存在する場合、前記最小判定しきい値として、当該グループに属する当該歪んだ伸長透明度データのうちの最大値以上を設定することを特徴とする請求項1に記載されたエンコードシステム。
  3. 前記判定しきい値は、完全透明および完全不透明の他方を示す最大値に前記伸長透明度データを補正する階調範囲を示す最大判定しきい値であって、
    前記しきい値決定部は、前記最大値よりも小さな値に歪んでいる前記伸長透明度データがグループ内に存在する場合、前記最大判定しきい値として、当該グループに属する当該歪んだ伸長透明度データのうちの最小値以下を設定することを特徴とする請求項1または2に記載されたエンコードシステム。
  4. 前記グループは、画像平面を複数に分割することによって設定された画素ブロックであることを特徴とする請求項1から3のいずれかに記載されたエンコードシステム。
  5. 透明度データに歪み圧縮を施して生成する第1の圧縮タイプと、前記透明度データの階調数を減らした減色透明度データに無歪み圧縮を施して生成する第2の圧縮タイプとのいずれかの圧縮タイプの圧縮データを振り分け入力し、伸長して透明度データを復元するデコードシステムであって、
    前記第1の圧縮タイプの圧縮透明度データを伸長して、透明度データの復元値である伸長透明度データを生成する第1の伸長部と、完全透明または完全不透明から異なる値に歪んだ前記伸長透明度データを本来の完全透明または本来の完全不透明に補正する階調範囲を示し、かつ、画像平面上のグループ毎に設定された判定しきい値が、前記圧縮データから抽出されて供給されるとともに、あるグループの判定しきい値と当該判定しきい値に対応する完全透明または完全不透明との間の階調範囲内に、当該グループに属する前記伸長透明度データが含まれる場合、当該伸長透明度データを当該判定しきい値に対応する完全透明または完全不透明に補正するしきい値処理部と、を有する第1の処理系と、
    前記第2の圧縮タイプの圧縮透明度データを伸長して、前記透明度データの復元値である伸長透明度データを生成する第2の伸長部を有し、前記第1の処理系に並列に設けられた第2の処理系と、
    前記圧縮データから抽出された圧縮タイプの指定に応じて、前記圧縮データから抽出された前記第1の圧縮タイプの圧縮透明度データを前記第1の処理系に供給し、前記圧縮データから抽出された前記第2の圧縮タイプの圧縮透明度データを前記第2の処理系に供給する入力部と、を備えたことを特徴とするデコードシステム。
  6. 前記判定しきい値は、完全透明または完全不透明の一方を示す最小値に前記伸長透明度データを補正する階調範囲を示す最小判定しきい値であって、
    前記しきい値処理部は、グループ毎に設けられた前記最小判定しきい値を用いて、当該グループに属する前記伸長透明度データのそれぞれの補正を行うことを特徴とする請求項5に記載されたデコードシステム。
  7. 前記判定しきい値は、完全透明または完全不透明の他方を示す最大値に前記伸長透明度データを補正する階調範囲を示す最大判定しきい値であって、
    前記しきい値処理部は、グループ毎に設けられた前記最大判定しきい値を用いて、当該グループ内に存在する前記伸長透明度データのそれぞれの補正を行うことを特徴とする請求項5または6に記載されたデコードシステム。
  8. 前記グループは、画像平面を複数に分割することによって設定された画素ブロックであることを特徴とする請求項5から7のいずれかに記載されたデコードシステム。
JP2010266066A 2010-11-30 2010-11-30 エンコードシステムおよびデコードシステム Active JP4753397B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010266066A JP4753397B1 (ja) 2010-11-30 2010-11-30 エンコードシステムおよびデコードシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010266066A JP4753397B1 (ja) 2010-11-30 2010-11-30 エンコードシステムおよびデコードシステム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010059711 Division 2010-03-16

Publications (2)

Publication Number Publication Date
JP4753397B1 true JP4753397B1 (ja) 2011-08-24
JP2011193437A JP2011193437A (ja) 2011-09-29

Family

ID=44597109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010266066A Active JP4753397B1 (ja) 2010-11-30 2010-11-30 エンコードシステムおよびデコードシステム

Country Status (1)

Country Link
JP (1) JP4753397B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013074550A (ja) * 2011-09-28 2013-04-22 Axell Corp 画像圧縮方法、画像伸長方法、及び画像処理装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2670139A1 (en) * 2012-06-01 2013-12-04 Alcatel Lucent Method and apparatus for encoding a video stream having a transparency information channel
GB2512658B (en) * 2013-04-05 2020-04-01 British Broadcasting Corp Transmitting and receiving a composite image
JP6267628B2 (ja) * 2014-11-21 2018-01-24 株式会社ユニバーサルエンターテインメント 遊技機

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1051768A (ja) * 1996-07-31 1998-02-20 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像復号化装置
JP2001144934A (ja) * 1999-11-12 2001-05-25 Victor Co Of Japan Ltd 画像合成方法および画像合成装置
SE0401850D0 (sv) * 2003-12-19 2004-07-08 Ericsson Telefon Ab L M Image processing
JP2007072852A (ja) * 2005-09-08 2007-03-22 Seiko Epson Corp 画像処理装置、携帯電話、画像処理方法および画像処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013074550A (ja) * 2011-09-28 2013-04-22 Axell Corp 画像圧縮方法、画像伸長方法、及び画像処理装置

Also Published As

Publication number Publication date
JP2011193437A (ja) 2011-09-29

Similar Documents

Publication Publication Date Title
JP4771288B2 (ja) データ処理装置及びプログラム
US20080239090A1 (en) Picture processing apparatus and method
KR101367777B1 (ko) 적응 이미지 압축시스템 및 그 방법
JP4775756B2 (ja) 復号化装置及びそのプログラム
KR100809409B1 (ko) 복호화 장치, 역양자화 방법 및 이들의 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
JP4753397B1 (ja) エンコードシステムおよびデコードシステム
CN111709898B (zh) 基于优化clahe的红外图像增强方法与系统
JP2000101846A (ja) 画像情報符号化装置
KR20140027040A (ko) 적응 이미지 압축시스템 및 그 방법
JP4645948B2 (ja) 復号化装置及びプログラム
US10074040B2 (en) Methods for compressing and decompressing texture tiles and apparatuses using the same
US20210152838A1 (en) Methods for compressing and decompressing texture tiles and apparatuses using the same
US8031955B2 (en) Image processing apparatus, image processing method, medium storing program, and computer data signal
JPH08202881A (ja) 画像処理装置
KR101517019B1 (ko) 블록특성을 이용한 적응 이미지 압축방법 및 그 시스템
JP4789020B2 (ja) 画像処理システムおよび画像処理プログラム
CN110087073B (zh) 一种多阈值串匹配数据压缩方法
US10015506B2 (en) Frequency reduction and restoration system and method in video and image compression
JP5007432B2 (ja) 画像処理システムおよび画像処理プログラム
JP3781012B2 (ja) 画像データ圧縮方法、画像データ伸長方法、および画像データ伸長回路
JP2010087673A (ja) 画像処理システムおよび画像処理プログラム
JP6654549B2 (ja) 映像符号化装置、映像符号化方法及びコンピュータプログラム
JP3480644B2 (ja) 画像符号化装置および画像復号装置
CN115968547A (zh) Hdr视频的基于云的编码中的工作负载分配与处理
Andriani et al. A lossless image coding technique exploiting spectral correlation on the RGB space

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110520

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4753397

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250