JP2004222142A - 映像信号の圧縮方法および復号方法 - Google Patents
映像信号の圧縮方法および復号方法 Download PDFInfo
- Publication number
- JP2004222142A JP2004222142A JP2003009590A JP2003009590A JP2004222142A JP 2004222142 A JP2004222142 A JP 2004222142A JP 2003009590 A JP2003009590 A JP 2003009590A JP 2003009590 A JP2003009590 A JP 2003009590A JP 2004222142 A JP2004222142 A JP 2004222142A
- Authority
- JP
- Japan
- Prior art keywords
- data
- frame
- pixel
- plane
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Color Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】予測符号化を行わなくても、十分な圧縮を行うことが可能であると共に、復号時には、元の映像信号を完全に復号することが可能な可逆圧縮方式の映像信号の圧縮方法および復号方法を提供する。
【解決手段】静止画像フレームを時系列に配列したフレーム群として構成される映像信号を、完全に再現できるように圧縮するにあたり、フレームの各色プレーン間の相関演算、時系列に隣接するフレーム間の同一色プレーン同士の相関演算、各フレーム同一プレーンの画素値の変動が少ない信号平坦部の処理を順次行う。特に信号平坦部の処理として、各プレーンから画素値の変動が2ビット数以下に納まる矩形領域▲4▼を信号平坦部として抽出し(b)、この信号平坦部を、矩形領域の左上(x7,y7)、右下(x8,y8)、矩形領域内の画素平均値、2ビット以下に納まる各画素の画素平均値との差分値で表現して信号平坦部データとして符号化する(c)。
【選択図】 図5
【解決手段】静止画像フレームを時系列に配列したフレーム群として構成される映像信号を、完全に再現できるように圧縮するにあたり、フレームの各色プレーン間の相関演算、時系列に隣接するフレーム間の同一色プレーン同士の相関演算、各フレーム同一プレーンの画素値の変動が少ない信号平坦部の処理を順次行う。特に信号平坦部の処理として、各プレーンから画素値の変動が2ビット数以下に納まる矩形領域▲4▼を信号平坦部として抽出し(b)、この信号平坦部を、矩形領域の左上(x7,y7)、右下(x8,y8)、矩形領域内の画素平均値、2ビット以下に納まる各画素の画素平均値との差分値で表現して信号平坦部データとして符号化する(c)。
【選択図】 図5
Description
【0001】
【産業上の利用分野】
本発明は、映像制作、映像データの素材保管、ロケ素材の中継など映像制作分野、特にNTSC以上の品質の高い高精細映像制作を行う分野、DVD等のデジタル記録媒体を用いた映像記録再生装置分野、遠隔医療における医用動画像の伝送等、データの改変が嫌われる分野等において好適なデータの可逆圧縮技術に関する。
【0002】
【従来の技術】
従来より、映像信号の圧縮には様々な手法が用いられている。映像信号を圧縮して符号化する手法として、MPEG−1、MPEG−2、MPEG−4などが実用化されている。このような圧縮符号化方式により、映像信号を小さいデータとして扱うことが可能となり、データの記録・伝送の効率化に貢献している。
【0003】
上述のようなMPEG−1、MPEG−2、MPEG−4等はいずれもロッシー符号化方式といわれるものであり、効率的な圧縮が可能であるが、復号化にあたって、少なからず品質の劣化を伴い、原信号を完全に再現することはできない。そのため、映像制作、素材保管、ロケ素材の中継など映像制作分野では、これらの符号化方式を適用できず、非効率ではあるが、非圧縮で保存・伝送する方式がとられている。特に最近は高精細HDTV映像を扱うプロダクションが増え、素材容量が膨大になり、ワークディスクを管理する上で問題になっていた。
【0004】
このような問題を解決するため、本出願人は、映像信号の各画像を構成する画素データに対して、三原色プレーン間、動画フレーム間における相関演算を行って、各画素データの値を小さくした後、予測符号化を利用してデータの圧縮を行う手法について提案している(特許文献1参照)。
【0005】
【特許文献1】
特願2002−265729号
【0006】
【発明が解決しようとする課題】
しかしながら、上記出願で提案した手法では、三原色プレーン間、動画フレーム間における相関演算を行った後、予測誤差符号化を用いることにより大きな効果を発揮している。映像信号が複数の色信号で構成されるカラー映像信号である場合、色信号間相関がみられるのは局所的であるため、フレーム全体に対して差分処理を行うと、信号振幅が増大する箇所が発生し、その後に行う予測誤差を用いた符号化により、かえってデータ量が増えてしまうことがある。また、特に動きの速いシーンにおいて、フレーム間の差分処理を行うと、信号振幅が増大する箇所が発生し、その後に行う予測誤差を用いた符号化により、かえってデータ量が増えてしまうことがある。映像信号において、色信号間相関およびフレーム間相関が高い場合には、差分処理により信号の振幅が減少するが、予測不可能な雑音成分の割合が増大し、その後に行う予測誤差を用いた符号化によりかえってデータ量が増えてしまうことがある。また、各フレームの各プレーン上において、画素値が同一の画素が連続する部分を信号平坦部として分離し、データ量を削減するようにしているが、画素値が同一の画素が連続する映像素材はあまり多くないため、汎用的に利用できるものとなっていない。
【0007】
上記のような点に鑑み、本発明は、予測符号化を行わなくても、十分な圧縮を行うことが可能であると共に、復号時には、元の映像信号を完全に復号することが可能な可逆圧縮方式の映像信号の圧縮方法および復号方法を提供することを課題とする。
【0008】
【課題を解決するための手段】
上記課題を解決するため、本発明では、静止画像であるフレームを時系列に配列したフレーム群として構成される映像信号を、完全に再現できるように情報量を圧縮する方法として、前記フレームの各色別の画素情報の集合であるプレーン間の相関演算を行う色信号間演算段階、時系列に隣接するフレーム間の同一色プレーン同士の相関演算を行うフレーム間演算段階、各フレームにおいて、フレーム内の画素値の変動が少ない信号平坦部の処理を行う信号平坦部処理段階を有し、前記信号平坦部処理段階は、前記各フレームの各色プレーンに対して、画素値の変動が設定ビット数以下に納まる矩形領域を信号平坦部として抽出し、当該信号平坦部を、矩形領域の位置情報、および矩形領域内の画素平均値、および前記設定ビット数で設定された各画素の前記画素平均値との差分値で表現して信号平坦部データとして符号化するようにしたことを特徴とする。
【0009】
本発明によれば、各色信号間の演算、各フレーム間の演算を行った後、各フレームにおいて、画素値の変動が少ない信号平坦部を矩形領域で抽出し、抽出した矩形領域の各画素の情報を、矩形領域内の平均値との差分で記録するようにしたので、各画素を少ないビット数で記録することができ、画素値の変動の少ない部分を効率的に圧縮符号化することが可能となる。
【0010】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照して詳細に説明する。
(デジタル映像信号の構造)
まず、本発明に係る映像信号の圧縮方法において可逆圧縮対象とするデジタル映像信号について説明しておく。本実施形態では、映像信号として三原色の色信号から構成されるカラー映像信号を適用した場合を例にとって説明していく。図1は、本発明において扱うデジタル映像信号を模式化して示した図である。図1において、左右方向は時系列方向であり、右側に行く程、時間が進むことになる。図1に示した映像信号は1フレームが光の三原色であるR・G・Bの3プレーンで構成されている。
【0011】
図1に示したようなデジタル映像信号を得るには、まず、映像をTVカメラ等で撮影してデジタル化する。これにより、デジタル映像信号が得られる。このようなデジタル映像信号は、1秒間に複数フレーム(静止画像)を有し、各フレームがR、G、Bの3色の輝度値を有するものとなっている。なお、本実施形態では、1秒間に30フレーム、各画素の各色に8ビットが割り当てられているものとして説明する。例えば、10秒間に渡って記録したデジタル映像信号は、その300フレーム、900プレーンで構成されるフレーム群となる。
【0012】
(本発明の圧縮方法)
続いて、本発明に係る映像信号の圧縮方法の概要について説明する。本発明の圧縮方法は、コンピュータ、およびコンピュータに搭載される専用のソフトウェアプログラムにより実行される。図2は、本発明に係る映像信号の圧縮方法の概要を示すフローチャートである。まず、図1に示したようなデジタル映像信号を、圧縮するための装置(専用のソフトウェアを搭載したコンピュータ等)に読み込ませる。すると、圧縮用の装置が処理を開始する。まず、デジタル映像信号の各フレームの各プレーンについて、色信号間の相関演算処理を行う(ステップS1)。相関演算としては、両プレーンに相関があることを求めることができれば、どのような手法でも良いが、本実施形態では、差分演算を行っている。具体的には、まず、Gプレーンを基準プレーンとし、RプレーンおよびBプレーンを非基準プレーンとして、基準プレーンと非基準プレーンの同一座標の画素値の差分演算を行う。ここでは、GプレーンとRプレーンの差分演算、GプレーンとBプレーンの差分演算を行うことになる。その結果、差分が所定の閾値以下となるRプレーン、Bプレーンの差分データを色信号間差分データとして別途記録する。ここで、Gプレーンを基準プレーンとするのは、輝度信号はGを主体としており、R−G、B−Gの色差信号の空間分解能はG信号に対して1/2程度になるためである。すなわち、R、Bの2プレーンを差分信号にすると、隣接画素間の輝度差が小さくなり、圧縮に適したデータとなる。
【0013】
なお、本実施形態では、所定の閾値として、下位2ビット以内を設定している。下位2ビット以内とは、正負の符号付きで表現した場合、10進数で−2〜+1の値となる。差分演算の結果、画素値が−2〜+1の値をとる領域については、色信号間差分データとして記録されることになる。また、画素の差分値が前記設定ビット(本例では2ビット)以下に納まる画素の位置情報を全て色信号差分データとして記録すると、画素の位置情報を記録するためのデータ量が増えてしまう。画素の位置情報を効率的に記録するためには、ある矩形領域の左上端と右下端、もしくは右上端と左下端といったように2点で記録することが好ましい。そのため、ここでは、あらかじめ8画素×8画素の単位領域を設定し、この単位領域内の全ての差分値が設定ビット以内に納まる場合に、その領域を色信号差分データとして抽出する矩形領域の候補とする。そして、色信号差分データとする矩形領域の候補が隣接してより大きな矩形を構成する場合は、その矩形領域を色信号差分データとして抽出する。
【0014】
ここで、色信号間差分演算の処理の様子を図3を用いて説明する。例えば、プレーン間において、単位領域ごとに差分演算を行った結果、単位領域内の全ての差分値が−2〜+1に納まる単位領域として、図3(a)に示すように、単位領域R1、R2、R3が検出されたとする。この場合、これらは、色信号差分データを作成する候補となる。このうち、単位領域R1とR2は、隣接しているので、図3(b)に示すように、16画素×8画素の、より大きな矩形領域▲1▼が形成される。単位領域R3は、隣接する候補がないため、そのまま矩形領域▲2▼として色信号差分データを作成する。
【0015】
色信号差分データの作成は、各画素を差分値として記録し、しかも各画素は、差分値が納まる必要最小限の2ビットで記録していくことにより行われる。作成された色信号差分データの一例を図3(c)に示す。本実施形態では、色信号差分データは、矩形領域の左上のxy座標、右下のxy座標、各画素の差分値で構成されている。なお、図3(c)において3行目の「ビット数」は各項目の情報を記録するために必要なビット数である。矩形領域の左上のxy座標、右下のxy座標は、非基準プレーン上において矩形領域の位置を特定するために必要な位置情報であり、それぞれ16ビット割り当てている。ここで、色信号間演算前の、非基準プレーン上の元の領域▲1▼、▲2▼のデータの様子を図3(d)に示す。図3(d)に示すように、元の画像データには、矩形領域の座標は記録されておらず、各画素の値が0〜255の範囲で記録されている。領域▲1▼、▲2▼について、元の画素データと色信号差分データのデータ量を比較すると、領域▲1▼については、1024ビットから288ビットに削減され、領域▲2▼については、512ビットから160ビットに削減されていることがわかる。これは、元の映像信号の1画素では1色あたり8ビット必要なのに対して、色信号差分データでは、1色あたり2ビットで済むためである。色信号差分データとする矩形領域に含まれる画素数が多くなるほど、データ量を削減できることになる。
【0016】
なお、復号時に色信号差分データを元のフレームの元のプレーンに復元するためには、領域▲1▼、領域▲2▼がどのフレームのどのプレーンであるかを示す情報も必要となる。このような情報は、色信号差分データとして持っていても良いし、圧縮データのヘッダー等に付与するようにしても良い。いずれにしてもフレーム番号とプレーンの種類を特定する情報をもつだけであるので、わずか数ビットの追加で済む。
【0017】
また、色信号間差分データにおいて同一の値が、さらに小さな矩形領域として複数画素連続する場合は、連続する部分の左端の座標と、右端の座標と、画素値を記録することによりデータ量をさらに削減する処理を行う。各フレームのRプレーン、Bプレーンにおいて、色信号間差分データとして分離された領域は、マスク領域としてマスクされることになる。例えば、図3(b)の例では、非基準プレーン上の領域▲1▼、領域▲2▼がマスク領域となる。このマスク領域上の画素は後の処理において、その利用が制限されることになる。なお、入力されるデジタル映像信号がY・Pb・Prのように、輝度信号であるY信号と、色差信号であるPb、Prの形式で入力される場合は、ステップS1による処理を行わず、直接ステップS2における処理を行う。
【0018】
次に、色信号間演算されたデジタル映像信号に対して、時間的に隣接するフレーム間の相関演算を行う(ステップS2)。ここでも相関演算としては、連続するフレームの同一色プレーン同士に相関があることを求めることができれば、どのような手法でも良いが、本実施形態では、差分演算を行っている。具体的には、まず、隣接するフレーム間の同一色プレーン同士で同一座標の画素同士の差分演算を行う。その結果、差分が所定の閾値以下となる差分データをフレーム間差分データとして別途記録する。所定の閾値としては、上記ステップS1における色信号間演算の場合と同様に、下位2ビット以内を設定している。また、画素の差分演算の単位も上記ステップS1と同様に、8画素×8画素の単位領域ごとに行う。フレーム間差分データが記録された場合、後続するフレームのその領域はマスク領域としてマスクされることになる。なお、隣接するフレーム間とは、例えば、図1の例ではフレームF1とフレームF2のことであり、フレームF2が後続するフレームとなる。フレームF1とフレームF2間で相関演算を行う場合、フレームF1のGプレーンとフレームF2のGプレーン、フレームF1のBプレーンとフレームF2のBプレーン、フレームF1のRプレーンとフレームF2のRプレーンの3つの相関演算が行われる。
【0019】
ここで、フレーム間差分演算の処理の様子を図4を用いて説明する。例えば、隣接するフレーム間の同一色プレーン同士で、単位領域ごとに差分演算を行った結果、単位領域内の全ての差分値が−2〜+1に納まる単位領域として、図4(a)に示すように、単位領域R4、R5が検出されたとする。この場合、これらは、フレーム間差分データを作成する候補となる。単位領域R4とR5は、隣接しているので、図4(b)に示すように、8画素×16画素の、より大きな矩形領域▲3▼が形成される。なお、図4の例では、矩形領域は1つだけしか形成されていないが、複数箇所形成される可能性があることは当然である。
【0020】
フレーム間差分データの作成は、各画素を差分値として記録し、しかも各画素は、差分値が納まる必要最小限の2ビットで記録していくことにより行われる。作成されたフレーム間差分データの一例を図4(c)に示す。本実施形態では、フレーム間差分データは、矩形領域の左上のxy座標、右下のxy座標、各画素の差分値で構成されている。なお、図4(c)において2行目の「ビット数」は各項目の情報を記録するために必要なビット数である。矩形領域の左上のxy座標、右下のxy座標は、後続フレームのプレーン上において矩形領域の位置を特定するために必要な位置情報であり、それぞれ16ビット割り当てている。ここで、フレーム間演算前の、後続フレームのプレーン上の元の領域▲3▼のデータの様子を図4(d)に示す。図4(d)に示すように、元の画像データには、矩形領域の座標は記録されておらず、各画素の値が0〜255の範囲で記録されている。領域▲3▼について、元の画素データとフレーム間差分データのデータ量を比較すると、1024ビットから288ビットに削減されていることがわかる。これは、元の映像信号の1画素では1色あたり8ビット必要なのに対して、フレーム間差分データでは、1色あたり2ビットで済むためである。フレーム間差分データとする矩形領域に含まれる画素数が多くなるほど、データ量を削減できることになる。
【0021】
なお、復号時にフレーム間差分データを元のフレームの元のプレーンに復元するために、領域▲3▼がどのフレームのどのプレーンであるかを示す情報も必要となるのは、色信号間差分データの場合と同様である。
【0022】
このように、隣接する両フレーム間において、画素の差分演算を行うと、動きが早い部分については、当然画素値の差分が大きくなる。例えば、ある風景の中の特定の位置で物体が激しく動いているシーンなどでは、物体が存在する位置では、相関が低いことがあらかじめわかっているので、相関演算の処理を行うだけ無駄になる。このような場合、動きの速い部分だけをフレーム間演算の非適用領域として設定しておき、その他の領域についてのみフレーム間演算を行うようにすれば良い。そのため、本発明では、画像のフレームを表示手段などに表示させ、非適用領域のフレーム上の位置と、フレーム番号(時刻)をあらかじめ利用者に設定させるようにしている。このように、非適用領域が設定されたフレームについては、非適用領域を除いた領域について相関演算を行う。
【0023】
続いて、信号平坦部の処理を行う(ステップS3)。信号平坦部とは、本来は信号レベルが均一な値になっている箇所をいう。コンピュータグラフィックス映像等を除き、均一な値として信号レベルの最小値「0」または信号レベルの最大値(例えば255)が通常候補になる。実写映像では、一般にこのような箇所はまれであるが、照明が全暗になりA/D変換器入力が零校正レベル以下であったり(カメラの校正により全暗時にはカメラ信号出力が負値になる場合もある)、映像が逆光照明になってA/D変換器が飽和したりすると、このような箇所が生じる。信号レベルが「0」および信号レベルが最大値のいずれであっても、信号平坦部は、同一の信号レベルが所定の領域(所定の画素数)連続して記録される。このため、この部分は圧縮し易いデータになっている。本実施形態では、信号平坦部の定義を、信号レベルが同一の値が連続する部分だけでなく、信号レベルの変化が少ない部分も含むものとする。すなわち、ステップS3においては、隣接する画素との値の差が所定の閾値以下である画素が連続する部分を、信号平坦部データとして別途記録することになる。所定の閾値としては、上記ステップS1、ステップS2の場合と同様に、下位2ビット以内を設定している。また、画素の差分演算の単位も上記ステップS1、ステップS2と同様に、8画素×8画素の単位領域ごとに行う。具体的には、ここでは、単位領域内の全画素の平均値を算出し、その単位領域内の全画素の値が平均値と2ビット以内の差である場合に、信号平坦部として抽出する候補とする。信号平坦部データが記録された場合、後続するフレームのその領域はマスク領域としてマスクされることになる。
【0024】
ここで、信号平坦部処理の様子を図5を用いて説明する。例えば、各フレームの各プレーンにおいて、単位領域ごとに画素の平均値、平均値との各画素の差分を算出した結果、単位領域内の画素平均値との差分値が全て−2〜+1に納まる単位領域として、図5(a)に示すように、単位領域R6、R7、R8が検出されたとする。この場合、これらは、信号平坦部データを作成する候補となる。単位領域R6、R7、R8は隣接しているので、図5(b)に示すように、8画素×24画素の、より大きな矩形領域▲4▼が形成される。なお、図5の例では、矩形領域は1つだけしか形成されていないが、複数箇所形成される可能性があることは当然である。
【0025】
信号平坦部データの作成は、矩形領域内の画素の平均値を記録すると共に、各画素を平均値の差分値として記録し、しかも各画素は、差分値が納まる必要最小限の2ビットで記録していくことにより行われる。作成された信号平坦部データの一例を図5(c)に示す。本実施形態では、信号平坦部データは、矩形領域の左上のxy座標、右下のxy座標、各画素の差分値で構成されている。なお、図5(c)において2行目の「ビット数」は各項目の情報を記録するために必要なビット数である。矩形領域の左上のxy座標、右下のxy座標は、各プレーン上において矩形領域の位置を特定するために必要な位置情報であり、それぞれ16ビット割り当てている。ここで、信号平坦部処理前の、プレーン上の元の領域▲4▼のデータの様子を図5(d)に示す。図5(d)に示すように、元の画像データには、矩形領域の座標は記録されておらず、各画素の値が0〜255の範囲で記録されている。図5に示すように、領域▲4▼の平均値が「125」であった場合、画素値が「126」の画素は、差分「1」で表現されることになる。領域▲4▼について、元の画素データと信号平坦部データのデータ量を比較すると、1536ビットから424ビットに削減されていることがわかる。これは、元の映像信号の1画素では1色あたり8ビット必要なのに対して、信号平坦部データでは、1色あたり2ビットで済むためである。信号平坦部データとする矩形領域に含まれる画素数が多くなるほど、データ量を削減できることになる。
【0026】
なお、復号時に信号平坦部データを元のフレームの元のプレーンに復元するために、領域▲4▼がどのフレームのどのプレーンであるかを示す情報も必要となるのは、色信号間差分データ、フレーム間差分データの場合と同様である。
【0027】
以上のようにして、デジタル映像信号のフレーム群から色信号差分データ、フレーム間差分データ、信号平坦部データが分離され、分離された各データの画素は1画素当り2ビットという少ないビット数で記録される。上記各データの分離により残ったフレーム群の各プレーンの画素データは、マスク領域を除いて8ビットで記録される。
【0028】
(追加処理)
以上の処理で終了しても本発明による圧縮効果は十分にあるが、さらにデータ量を削減するため、上記特許文献1に記載した手法でもあるステップS4以降の処理を追加して行うようにしても良い。以下、フレーム群の各フレーム各プレーンにおいてマスクされていない領域(非マスク領域)に対して、圧縮を行う手順について説明する。まず、フレーム群の全フレーム全プレーンにおける非マスク領域の全画素について、各画素データの上位ビットと下位ビットの分離を行う(ステップS4)。本実施形態では、撮影映像をデジタル化する際に、各色について量子化ビット数8で量子化している。そのため、デジタルデータは各プレーンの各画素について8ビットが割り当てられている。この場合、本実施形態では、上位ビット6ビットと、下位ビット2ビットに分離する。この分離は、基本的に、A/D変換機等、映像信号をデジタル化する際に用いる回路の熱雑音等に起因する量子化雑音(アナログからデジタル数値に変換する際の端数のゆらぎ成分)を分離するために行う。そのため、量子化雑音であると考えられる下位ビットを分離するのである。下位ビットとして、どの程度分離するかは、撮影環境や利用した回路の特性によっても変化するが、通常量子化ビット数の1/4程度とすることが望ましい。したがって、ここでは、8ビットの1/4にあたる2ビットを下位ビットとして分離しているのである。
【0029】
ここで、上位ビットと下位ビットのデータ分離の様子を図6に模式的に示す。図6において、Hは上位ビットデータを示し、Lは下位ビットデータを示す。図6(a)は分離前の画素データである。ステップS4における処理により、各画素データは、図6(b)に示す上位ビットデータと図6(c)に示す下位ビットデータに分離されることになる。このようにして分離された画素データは、以降別々に処理されることになる。
【0030】
上位ビットデータに対しては、まず、近傍の2つの画素を基に各画素の予測値と予測誤差の算出を行う(ステップS5)。ここで、予測誤差の算出手法について、図7を用いて説明する。ここでは、走査線方向(x軸方向)に予測を行う場合を想定して、上位ビット値が図7(a)に示すような状態である場合を考えてみる。図7(a)において、横軸はプレーン上のx軸座標、縦軸は上位ビット値G(x)である。また、各座標値における線分は、各座標における画素の上位ビット値G(x)の値を示している。このような状態で、座標(x,y)の画素における予測誤差E(x)を算出する場合、直前の画素x−1における上位ビット値G(x−1)および2つ前の画素x−2における上位ビット値G(x−2)を利用して以下の〔数式1〕により算出する。
【0031】
〔数式1〕
E(x)=G(x)−2×G(x−1)+G(x−2)−E(x−1)/2
【0032】
上記〔数式1〕において、「2×G(x−1)−G(x−2)」は直前の2つの画素の上位ビット値に基づく線形予測成分である。すなわち、算出された線形予測成分、および、直前の画素において算出された予測誤差「E(x−1)/2」(誤差フィードバック成分)を用いて座標xにおける予測誤差E(x)を算出することになる。全画素について、予測誤差の算出を行い、画素データの上位ビット値の代わりに予測誤差が記録される。
【0033】
これを図7(a)に示した画素データの上位ビット値を基に説明する。まず、誤差フィードバック成分を加えない状態で各予測誤差Eo(x)を算出する。図7(b)に示すように、画素xの予測誤差Eo(x)を算出する場合、直前の画素x−1における上位ビット値G(x−1)および2つ前の画素x−2における上位ビット値G(x−2)を結ぶ予測線が座標xでとる値と、座標xにおける上位ビット値G(x)の差分(図中太点線で示す)に基づいて予測誤差Eo(x)が算出される。画素x+1以降も同様に行って予測誤差Eo(x+1)を算出する。算出された予測誤差Eo(x)は、図7(c)に示すようになる。図7(a)と図7(c)を比較するとわかるように値が変動する範囲が大きく狭まり、データ圧縮に都合が良くなる。
【0034】
続いて、〔数式1〕に基づいて予測誤差Eo(x)に対して直前の画素x−1における補正が加わった予測誤差E(x−1)の50%を減算させて、誤差フィードバック処理を加えた結果が図7(d)である。図7(c)と比べると、画素x+1およびx+2における予測誤差の低減が顕著である。逆に画素x+3およびx+4では予測誤差が増大しているが、平均的には予測誤差が低減し、図7(a)と比較すると値が変動する範囲が更に狭まり、データ圧縮効果が向上する。
【0035】
上記のようにして予測誤差の算出が行われるが、図7の例では、画像のx軸方向すなわち走査線方向に従って予測を行った。本発明では、予測精度をさらに高めるため、複数の方向のうち、予測誤差の算出に最も適した方向を選定する処理を行っている。ここでは、図8(a)に示すような走査線方向、副走査線方向、対角線方向の3方向のうち、いずれが最適であるかを選定することになる。具体的には、画素(x,y)の予測誤差を求めるための方向を決定する場合、まず、走査線方向の直前の画素(x−1,y)のさらに直前の2画素による予測誤差Eh(x−1,y)、副走査線方向の直前の画素(x,y−1)のさらに直前の2画素による予測誤差Ev(x,y−1)、対角線方向の直前の画素(x−1,y−1)のさらに直前の2画素による予測誤差Ed(x−1,y−1)を求める。なお、走査線方向の予測誤差Eh(x,y)、副走査線方向の予測誤差Ev(x,y)、対角線方向の予測誤差Ed(x,y)はそれぞれ以下の〔数式2〕〜〔数式4〕で算出される。
【0036】
〔数式2〕
Eh(x,y)=G(x,y)−2×G(x−1,y)+G(x−2,y)−E(x−1,y)/2
【0037】
〔数式3〕
Ev(x,y)=G(x,y)−2×G(x,y−1)+G(x,y−2)−E(x,y−1)/2
【0038】
〔数式4〕
Ed(x,y)=G(x,y)−2×G(x−1,y−1)+G(x−2,y−2)−E(x−1,y−1)/2
【0039】
そして、予測誤差が最小となる画素の方向を画素(x,y)の予測方向とする。例えば、Eh(x−1,y)、Ev(x,y−1)、Ed(x−1,y−1)のうち、Ev(x,y−1)が最小であった場合、副走査線方向について予測誤差を求めることになる。すなわち、画素(x,y)の予測誤差は、上記〔数式3〕に従って画素(x,y−1)、画素(x,y−2)の値を利用して、Ev(x,y)として算出される。同様にして全フレーム、全プレーンの全画素について、同様の処理を行って各画素の値を予測誤差値に置き換えていく。
【0040】
なお、プレーン上の各画素データの中には、上記ステップS1の色信号間演算、ステップS2のフレーム間演算、ステップS3の信号平坦部処理においてマスクされたマスク領域が存在する。このマスク領域上の各画素については、予測誤差の算出は行わないが、マスク領域に属さない画素の予測誤差の算出のために利用される。例えば、図8(b)に示すようなプレーンにおいて、マスク領域に属さない画素Aの予測誤差を求めるにあたって、対角線方向が最適であると判断されたとする。この場合、マスク領域に属する画素B、画素Cの画素データ(上位ビット)および予測誤差が必要になる。このような場合、画素B、画素Cの基のデータを利用して画素Aの予測誤差の算出を行う。
【0041】
上記ステップS5の処理により、各画素の上位ビットが元の値から予測誤差値に置き換えられることになるが、各画素のビット構成は固定長6ビットのままである。ここからは、予測誤差値で記録された上位ビットデータをより少ないデータ量で表現するために、固定長の上位ビットを可変長のビット構成に変換していく。そのために、まず、ビット構成の変換に利用するルックアップテーブルの作成を行う(ステップS6)。具体的には、残っている全てのフレーム、全てのプレーンについて、各画素データのヒストグラムを算出する。予測誤差に置きかえられたことにより、画素データは正負の値をとるが、ここでは、その絶対値ごとにヒストグラムを算出する。その結果、出現頻度の高い画素値から順に、少ないビット数のビットパターンを割り当てていく。この際、割り当てるビットパターンには規則が有り、最上位ビットは必ず「1」とし、「01」のビットパターンを含むビットパターンは禁止する。したがって、ビットパターンの最小値は1ビットの「1」となる。図9(c)に作成されたルックアップテーブルの一例を示す。
【0042】
上記のようにして作成されたルックアップテーブルを用いて、6ビット固定長の連続する上位ビットデータを、可変長のビットパターンに変換していく(ステップS7)。可変長になるため、変換後の各データの区切りを区別する必要が生じる。そのため、本実施形態では、各データ間に1ビットのセパレータビット「0」を挿入する。なお、ルックアップテーブルにおいて、「01」を含むビットパターンを禁止するのは、セパレータビット「0」とそれに続くビットデータの最上位ビット「1」で構成される「01」パターンでデータ間の区切りを判断するようにしているためで、ビットデータ中に「01」パターンが存在すると区切りと誤判断してしまうためである。また、ルックアップテーブルにおいては、上位固定長ビットデータがとる値の絶対値で変換するため、正負の値を記録する必要が生じる。このため、ビットデータと重複しない値をもつ正負反転データを挿入する。例えば、正負反転データ以前の可変長ビットが正である場合は、それ以降の可変長ビットは負であるとして認識されることになる。図9(a)(b)に、ステップS7によるデータ変換の様子を模式的に示す。図9(a)(b)はいずれも画素データの上位ビット部分に対応しており、図9(a)は固定長の上位ビットデータが連続して記録されている様子を示している。図9(a)に示したような上位ビットデータは、図9(c)に示したルックアップテーブルを用いて図9(b)に示すように変換されることになる。
【0043】
一方、下位ビットデータは、そのまま連続に配置される。具体的には、上記ステップS4において分離された下位2ビットのデータが連続に配置されていくことになる。
【0044】
(符号データの記録)
以上のようにして得られた符号データは、図10に示すようになる。すなわち、上位可変長ビットデータ、ルックアップテーブル、下位固定長ビットデータ、信号平坦部データ、フレーム間差分データ、色信号間差分データとなる。これらのデータを記録すべき記録媒体に合わせたフォーマットで記録する。なお、上記ステップS1からステップS3までで処理を終えた場合は、フレーム群(固定長ビットデータ)、信号平坦部データ、フレーム間差分データ、色信号間差分データが符号データとして記録される。
【0045】
(復号方法)
次に、上記圧縮方法により圧縮された符号データを復号解凍する方法について説明する。復号は、コンピュータ、およびコンピュータに搭載される専用のソフトウェアプログラムにより実行される。復号方法の概要を図11のフローチャートに示す。
【0046】
まず、図10に示したような符号データを記録した記録媒体を、復号するための装置(専用のソフトウェアを搭載したコンピュータ)に読み込ませる。続いて、読み込んだデータのうち、ルックアップテーブルを参照することにより、上位可変長ビットデータから固定長の上位固定長ビットデータすなわち線形予測誤差E(x,y)を復元していく(ステップS11)。これにより、図9(a)に示したような上位固定長ビットデータが復元される。次に、上記〔数式1〕の左辺の項と右辺第1項を交換した式に基づいて、6ビット固定長の上位ビットデータG(x,y)を順次復元していく(ステップS12)。ステップS12においては、その処理の前後共に、各上位ビットデータは6ビット固定長のままであるが、その値が変化することになる。続いて、復元した上位固定長ビットデータと、読み込んだ下位固定長ビットデータを統合する(ステップS13)。具体的には、上位ビットデータから6ビットを抽出し、下位ビットデータから2ビットを抽出して順次統合する処理を行う。
【0047】
この時点で、各プレーンの画素データは、各画素が8ビットで表現された形式となっている。上記ステップS11〜ステップS13の処理は、圧縮符号化時に、ステップS4〜ステップS7の処理を行った場合にのみ行われる。そのため、ステップS1〜ステップS3までの処理しか行っていない場合には、符号データの記録媒体を読み込んだ後、以下の処理から行う。
【0048】
上記のように、8ビット固定長の画素データで構成される各プレーンに対して信号平坦部データを挿入する(ステップS14)。信号平坦部データの挿入は、プレーン上の信号平坦部データに対応したマスク領域に、信号平坦部データの各画素を割り当てていくことにより行う。この時点で、デジタル映像信号の各フレームの各プレーンは図5(b)に示したような矩形領域がマスクされた状態から元に戻ることになる。
【0049】
次に、フレーム間差分データを利用して元のフレーム間相関部を復元する(ステップS15)。具体的には、フレーム間差分データの各画素の差分値と、直前のフレームの同一プレーン同一位置の画素値との和を求めることにより、元のプレーンの画素値を復元する。この時点でデジタル映像信号の各フレームの各プレーンは図4(b)に示したような矩形領域がマスクされた状態から元に戻ることになる。
【0050】
次に、色信号間差分データを利用して非基準プレーンの色信号相関部を復元する(ステップS16)。具体的には、各フレームごとに、基準プレーンであるGプレーンと、B−Gの色信号間差分データを用いてBプレーンを復元し、Gプレーンと、R−Gの色信号間差分データを用いてRプレーンを復元する。ステップS16の処理の結果、デジタル映像信号の各フレームの非基準プレーンは図3(b)に示したような矩形領域がマスクされた状態から元に戻ることになる。以上のようにして、図1に示したような、各フレームの各画素が24ビット(各プレーンは8ビット)で、全ての画素の欠落がないデジタル映像信号が復元されることになる。なお、上述のように、元のデジタル映像信号が、Y・Pb・Prのように、輝度信号であるY信号と、色差信号であるPb、Prの形式で入力される場合は、ステップS16の処理は行う必要がなく、ステップS15の処理を終えた段階で、元のデジタル映像信号が復元されることになる。以上のようにして、アナログ信号をデジタル化した状態のデジタル映像信号がデータの欠落無く復元される。
【0051】
【発明の効果】
以上、説明したように本発明によれば、静止画像であるフレームを時系列に配列したフレーム群として構成される映像信号を、完全に再現できるように情報量を圧縮するにあたり、フレームの各色別の画素情報の集合であるプレーン間の相関演算を行い、時系列に隣接するフレーム間の相関演算を行い、各フレームに対して、画素データの変動が設定ビット数以下に納まる矩形領域を信号平坦部として検出し、その信号平坦部を、矩形領域の位置情報、および矩形領域内の画素平均値、および前記設定ビット数で設定された各画素の前記画素平均値との差分値で表現した信号平坦部データとして符号化するようにしたので、各画素を少ないビット数で記録することができ、画素値の変動の少ない部分を効率的に圧縮符号化することが可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の映像信号の圧縮方法で圧縮対象とするデジタル映像信号の構造を示す模式図である。
【図2】本発明に係る映像信号の圧縮方法の概要を示すフローチャートである。
【図3】色信号間演算の様子を示す図である。
【図4】フレーム間演算の様子を示す図である。
【図5】信号平坦部処理の様子を示す図である。
【図6】各画素の各色を構成するビットデータの分離の様子を示す図である。
【図7】予測誤差算出処理の様子を示す図である。
【図8】予測誤差算出処理を行う際の各画素の位置関係を示す図である。
【図9】固定ビット長から可変ビット長へのデータ変換の様子を示す図である。
【図10】本発明に係る映像信号の圧縮方法により得られる符号データを示す図である。
【図11】本発明に係る映像信号の復号方法の概要を示すフローチャートである。
【符号の説明】
R1〜R8・・・単位領域
▲1▼〜▲4▼・・・矩形領域
【産業上の利用分野】
本発明は、映像制作、映像データの素材保管、ロケ素材の中継など映像制作分野、特にNTSC以上の品質の高い高精細映像制作を行う分野、DVD等のデジタル記録媒体を用いた映像記録再生装置分野、遠隔医療における医用動画像の伝送等、データの改変が嫌われる分野等において好適なデータの可逆圧縮技術に関する。
【0002】
【従来の技術】
従来より、映像信号の圧縮には様々な手法が用いられている。映像信号を圧縮して符号化する手法として、MPEG−1、MPEG−2、MPEG−4などが実用化されている。このような圧縮符号化方式により、映像信号を小さいデータとして扱うことが可能となり、データの記録・伝送の効率化に貢献している。
【0003】
上述のようなMPEG−1、MPEG−2、MPEG−4等はいずれもロッシー符号化方式といわれるものであり、効率的な圧縮が可能であるが、復号化にあたって、少なからず品質の劣化を伴い、原信号を完全に再現することはできない。そのため、映像制作、素材保管、ロケ素材の中継など映像制作分野では、これらの符号化方式を適用できず、非効率ではあるが、非圧縮で保存・伝送する方式がとられている。特に最近は高精細HDTV映像を扱うプロダクションが増え、素材容量が膨大になり、ワークディスクを管理する上で問題になっていた。
【0004】
このような問題を解決するため、本出願人は、映像信号の各画像を構成する画素データに対して、三原色プレーン間、動画フレーム間における相関演算を行って、各画素データの値を小さくした後、予測符号化を利用してデータの圧縮を行う手法について提案している(特許文献1参照)。
【0005】
【特許文献1】
特願2002−265729号
【0006】
【発明が解決しようとする課題】
しかしながら、上記出願で提案した手法では、三原色プレーン間、動画フレーム間における相関演算を行った後、予測誤差符号化を用いることにより大きな効果を発揮している。映像信号が複数の色信号で構成されるカラー映像信号である場合、色信号間相関がみられるのは局所的であるため、フレーム全体に対して差分処理を行うと、信号振幅が増大する箇所が発生し、その後に行う予測誤差を用いた符号化により、かえってデータ量が増えてしまうことがある。また、特に動きの速いシーンにおいて、フレーム間の差分処理を行うと、信号振幅が増大する箇所が発生し、その後に行う予測誤差を用いた符号化により、かえってデータ量が増えてしまうことがある。映像信号において、色信号間相関およびフレーム間相関が高い場合には、差分処理により信号の振幅が減少するが、予測不可能な雑音成分の割合が増大し、その後に行う予測誤差を用いた符号化によりかえってデータ量が増えてしまうことがある。また、各フレームの各プレーン上において、画素値が同一の画素が連続する部分を信号平坦部として分離し、データ量を削減するようにしているが、画素値が同一の画素が連続する映像素材はあまり多くないため、汎用的に利用できるものとなっていない。
【0007】
上記のような点に鑑み、本発明は、予測符号化を行わなくても、十分な圧縮を行うことが可能であると共に、復号時には、元の映像信号を完全に復号することが可能な可逆圧縮方式の映像信号の圧縮方法および復号方法を提供することを課題とする。
【0008】
【課題を解決するための手段】
上記課題を解決するため、本発明では、静止画像であるフレームを時系列に配列したフレーム群として構成される映像信号を、完全に再現できるように情報量を圧縮する方法として、前記フレームの各色別の画素情報の集合であるプレーン間の相関演算を行う色信号間演算段階、時系列に隣接するフレーム間の同一色プレーン同士の相関演算を行うフレーム間演算段階、各フレームにおいて、フレーム内の画素値の変動が少ない信号平坦部の処理を行う信号平坦部処理段階を有し、前記信号平坦部処理段階は、前記各フレームの各色プレーンに対して、画素値の変動が設定ビット数以下に納まる矩形領域を信号平坦部として抽出し、当該信号平坦部を、矩形領域の位置情報、および矩形領域内の画素平均値、および前記設定ビット数で設定された各画素の前記画素平均値との差分値で表現して信号平坦部データとして符号化するようにしたことを特徴とする。
【0009】
本発明によれば、各色信号間の演算、各フレーム間の演算を行った後、各フレームにおいて、画素値の変動が少ない信号平坦部を矩形領域で抽出し、抽出した矩形領域の各画素の情報を、矩形領域内の平均値との差分で記録するようにしたので、各画素を少ないビット数で記録することができ、画素値の変動の少ない部分を効率的に圧縮符号化することが可能となる。
【0010】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照して詳細に説明する。
(デジタル映像信号の構造)
まず、本発明に係る映像信号の圧縮方法において可逆圧縮対象とするデジタル映像信号について説明しておく。本実施形態では、映像信号として三原色の色信号から構成されるカラー映像信号を適用した場合を例にとって説明していく。図1は、本発明において扱うデジタル映像信号を模式化して示した図である。図1において、左右方向は時系列方向であり、右側に行く程、時間が進むことになる。図1に示した映像信号は1フレームが光の三原色であるR・G・Bの3プレーンで構成されている。
【0011】
図1に示したようなデジタル映像信号を得るには、まず、映像をTVカメラ等で撮影してデジタル化する。これにより、デジタル映像信号が得られる。このようなデジタル映像信号は、1秒間に複数フレーム(静止画像)を有し、各フレームがR、G、Bの3色の輝度値を有するものとなっている。なお、本実施形態では、1秒間に30フレーム、各画素の各色に8ビットが割り当てられているものとして説明する。例えば、10秒間に渡って記録したデジタル映像信号は、その300フレーム、900プレーンで構成されるフレーム群となる。
【0012】
(本発明の圧縮方法)
続いて、本発明に係る映像信号の圧縮方法の概要について説明する。本発明の圧縮方法は、コンピュータ、およびコンピュータに搭載される専用のソフトウェアプログラムにより実行される。図2は、本発明に係る映像信号の圧縮方法の概要を示すフローチャートである。まず、図1に示したようなデジタル映像信号を、圧縮するための装置(専用のソフトウェアを搭載したコンピュータ等)に読み込ませる。すると、圧縮用の装置が処理を開始する。まず、デジタル映像信号の各フレームの各プレーンについて、色信号間の相関演算処理を行う(ステップS1)。相関演算としては、両プレーンに相関があることを求めることができれば、どのような手法でも良いが、本実施形態では、差分演算を行っている。具体的には、まず、Gプレーンを基準プレーンとし、RプレーンおよびBプレーンを非基準プレーンとして、基準プレーンと非基準プレーンの同一座標の画素値の差分演算を行う。ここでは、GプレーンとRプレーンの差分演算、GプレーンとBプレーンの差分演算を行うことになる。その結果、差分が所定の閾値以下となるRプレーン、Bプレーンの差分データを色信号間差分データとして別途記録する。ここで、Gプレーンを基準プレーンとするのは、輝度信号はGを主体としており、R−G、B−Gの色差信号の空間分解能はG信号に対して1/2程度になるためである。すなわち、R、Bの2プレーンを差分信号にすると、隣接画素間の輝度差が小さくなり、圧縮に適したデータとなる。
【0013】
なお、本実施形態では、所定の閾値として、下位2ビット以内を設定している。下位2ビット以内とは、正負の符号付きで表現した場合、10進数で−2〜+1の値となる。差分演算の結果、画素値が−2〜+1の値をとる領域については、色信号間差分データとして記録されることになる。また、画素の差分値が前記設定ビット(本例では2ビット)以下に納まる画素の位置情報を全て色信号差分データとして記録すると、画素の位置情報を記録するためのデータ量が増えてしまう。画素の位置情報を効率的に記録するためには、ある矩形領域の左上端と右下端、もしくは右上端と左下端といったように2点で記録することが好ましい。そのため、ここでは、あらかじめ8画素×8画素の単位領域を設定し、この単位領域内の全ての差分値が設定ビット以内に納まる場合に、その領域を色信号差分データとして抽出する矩形領域の候補とする。そして、色信号差分データとする矩形領域の候補が隣接してより大きな矩形を構成する場合は、その矩形領域を色信号差分データとして抽出する。
【0014】
ここで、色信号間差分演算の処理の様子を図3を用いて説明する。例えば、プレーン間において、単位領域ごとに差分演算を行った結果、単位領域内の全ての差分値が−2〜+1に納まる単位領域として、図3(a)に示すように、単位領域R1、R2、R3が検出されたとする。この場合、これらは、色信号差分データを作成する候補となる。このうち、単位領域R1とR2は、隣接しているので、図3(b)に示すように、16画素×8画素の、より大きな矩形領域▲1▼が形成される。単位領域R3は、隣接する候補がないため、そのまま矩形領域▲2▼として色信号差分データを作成する。
【0015】
色信号差分データの作成は、各画素を差分値として記録し、しかも各画素は、差分値が納まる必要最小限の2ビットで記録していくことにより行われる。作成された色信号差分データの一例を図3(c)に示す。本実施形態では、色信号差分データは、矩形領域の左上のxy座標、右下のxy座標、各画素の差分値で構成されている。なお、図3(c)において3行目の「ビット数」は各項目の情報を記録するために必要なビット数である。矩形領域の左上のxy座標、右下のxy座標は、非基準プレーン上において矩形領域の位置を特定するために必要な位置情報であり、それぞれ16ビット割り当てている。ここで、色信号間演算前の、非基準プレーン上の元の領域▲1▼、▲2▼のデータの様子を図3(d)に示す。図3(d)に示すように、元の画像データには、矩形領域の座標は記録されておらず、各画素の値が0〜255の範囲で記録されている。領域▲1▼、▲2▼について、元の画素データと色信号差分データのデータ量を比較すると、領域▲1▼については、1024ビットから288ビットに削減され、領域▲2▼については、512ビットから160ビットに削減されていることがわかる。これは、元の映像信号の1画素では1色あたり8ビット必要なのに対して、色信号差分データでは、1色あたり2ビットで済むためである。色信号差分データとする矩形領域に含まれる画素数が多くなるほど、データ量を削減できることになる。
【0016】
なお、復号時に色信号差分データを元のフレームの元のプレーンに復元するためには、領域▲1▼、領域▲2▼がどのフレームのどのプレーンであるかを示す情報も必要となる。このような情報は、色信号差分データとして持っていても良いし、圧縮データのヘッダー等に付与するようにしても良い。いずれにしてもフレーム番号とプレーンの種類を特定する情報をもつだけであるので、わずか数ビットの追加で済む。
【0017】
また、色信号間差分データにおいて同一の値が、さらに小さな矩形領域として複数画素連続する場合は、連続する部分の左端の座標と、右端の座標と、画素値を記録することによりデータ量をさらに削減する処理を行う。各フレームのRプレーン、Bプレーンにおいて、色信号間差分データとして分離された領域は、マスク領域としてマスクされることになる。例えば、図3(b)の例では、非基準プレーン上の領域▲1▼、領域▲2▼がマスク領域となる。このマスク領域上の画素は後の処理において、その利用が制限されることになる。なお、入力されるデジタル映像信号がY・Pb・Prのように、輝度信号であるY信号と、色差信号であるPb、Prの形式で入力される場合は、ステップS1による処理を行わず、直接ステップS2における処理を行う。
【0018】
次に、色信号間演算されたデジタル映像信号に対して、時間的に隣接するフレーム間の相関演算を行う(ステップS2)。ここでも相関演算としては、連続するフレームの同一色プレーン同士に相関があることを求めることができれば、どのような手法でも良いが、本実施形態では、差分演算を行っている。具体的には、まず、隣接するフレーム間の同一色プレーン同士で同一座標の画素同士の差分演算を行う。その結果、差分が所定の閾値以下となる差分データをフレーム間差分データとして別途記録する。所定の閾値としては、上記ステップS1における色信号間演算の場合と同様に、下位2ビット以内を設定している。また、画素の差分演算の単位も上記ステップS1と同様に、8画素×8画素の単位領域ごとに行う。フレーム間差分データが記録された場合、後続するフレームのその領域はマスク領域としてマスクされることになる。なお、隣接するフレーム間とは、例えば、図1の例ではフレームF1とフレームF2のことであり、フレームF2が後続するフレームとなる。フレームF1とフレームF2間で相関演算を行う場合、フレームF1のGプレーンとフレームF2のGプレーン、フレームF1のBプレーンとフレームF2のBプレーン、フレームF1のRプレーンとフレームF2のRプレーンの3つの相関演算が行われる。
【0019】
ここで、フレーム間差分演算の処理の様子を図4を用いて説明する。例えば、隣接するフレーム間の同一色プレーン同士で、単位領域ごとに差分演算を行った結果、単位領域内の全ての差分値が−2〜+1に納まる単位領域として、図4(a)に示すように、単位領域R4、R5が検出されたとする。この場合、これらは、フレーム間差分データを作成する候補となる。単位領域R4とR5は、隣接しているので、図4(b)に示すように、8画素×16画素の、より大きな矩形領域▲3▼が形成される。なお、図4の例では、矩形領域は1つだけしか形成されていないが、複数箇所形成される可能性があることは当然である。
【0020】
フレーム間差分データの作成は、各画素を差分値として記録し、しかも各画素は、差分値が納まる必要最小限の2ビットで記録していくことにより行われる。作成されたフレーム間差分データの一例を図4(c)に示す。本実施形態では、フレーム間差分データは、矩形領域の左上のxy座標、右下のxy座標、各画素の差分値で構成されている。なお、図4(c)において2行目の「ビット数」は各項目の情報を記録するために必要なビット数である。矩形領域の左上のxy座標、右下のxy座標は、後続フレームのプレーン上において矩形領域の位置を特定するために必要な位置情報であり、それぞれ16ビット割り当てている。ここで、フレーム間演算前の、後続フレームのプレーン上の元の領域▲3▼のデータの様子を図4(d)に示す。図4(d)に示すように、元の画像データには、矩形領域の座標は記録されておらず、各画素の値が0〜255の範囲で記録されている。領域▲3▼について、元の画素データとフレーム間差分データのデータ量を比較すると、1024ビットから288ビットに削減されていることがわかる。これは、元の映像信号の1画素では1色あたり8ビット必要なのに対して、フレーム間差分データでは、1色あたり2ビットで済むためである。フレーム間差分データとする矩形領域に含まれる画素数が多くなるほど、データ量を削減できることになる。
【0021】
なお、復号時にフレーム間差分データを元のフレームの元のプレーンに復元するために、領域▲3▼がどのフレームのどのプレーンであるかを示す情報も必要となるのは、色信号間差分データの場合と同様である。
【0022】
このように、隣接する両フレーム間において、画素の差分演算を行うと、動きが早い部分については、当然画素値の差分が大きくなる。例えば、ある風景の中の特定の位置で物体が激しく動いているシーンなどでは、物体が存在する位置では、相関が低いことがあらかじめわかっているので、相関演算の処理を行うだけ無駄になる。このような場合、動きの速い部分だけをフレーム間演算の非適用領域として設定しておき、その他の領域についてのみフレーム間演算を行うようにすれば良い。そのため、本発明では、画像のフレームを表示手段などに表示させ、非適用領域のフレーム上の位置と、フレーム番号(時刻)をあらかじめ利用者に設定させるようにしている。このように、非適用領域が設定されたフレームについては、非適用領域を除いた領域について相関演算を行う。
【0023】
続いて、信号平坦部の処理を行う(ステップS3)。信号平坦部とは、本来は信号レベルが均一な値になっている箇所をいう。コンピュータグラフィックス映像等を除き、均一な値として信号レベルの最小値「0」または信号レベルの最大値(例えば255)が通常候補になる。実写映像では、一般にこのような箇所はまれであるが、照明が全暗になりA/D変換器入力が零校正レベル以下であったり(カメラの校正により全暗時にはカメラ信号出力が負値になる場合もある)、映像が逆光照明になってA/D変換器が飽和したりすると、このような箇所が生じる。信号レベルが「0」および信号レベルが最大値のいずれであっても、信号平坦部は、同一の信号レベルが所定の領域(所定の画素数)連続して記録される。このため、この部分は圧縮し易いデータになっている。本実施形態では、信号平坦部の定義を、信号レベルが同一の値が連続する部分だけでなく、信号レベルの変化が少ない部分も含むものとする。すなわち、ステップS3においては、隣接する画素との値の差が所定の閾値以下である画素が連続する部分を、信号平坦部データとして別途記録することになる。所定の閾値としては、上記ステップS1、ステップS2の場合と同様に、下位2ビット以内を設定している。また、画素の差分演算の単位も上記ステップS1、ステップS2と同様に、8画素×8画素の単位領域ごとに行う。具体的には、ここでは、単位領域内の全画素の平均値を算出し、その単位領域内の全画素の値が平均値と2ビット以内の差である場合に、信号平坦部として抽出する候補とする。信号平坦部データが記録された場合、後続するフレームのその領域はマスク領域としてマスクされることになる。
【0024】
ここで、信号平坦部処理の様子を図5を用いて説明する。例えば、各フレームの各プレーンにおいて、単位領域ごとに画素の平均値、平均値との各画素の差分を算出した結果、単位領域内の画素平均値との差分値が全て−2〜+1に納まる単位領域として、図5(a)に示すように、単位領域R6、R7、R8が検出されたとする。この場合、これらは、信号平坦部データを作成する候補となる。単位領域R6、R7、R8は隣接しているので、図5(b)に示すように、8画素×24画素の、より大きな矩形領域▲4▼が形成される。なお、図5の例では、矩形領域は1つだけしか形成されていないが、複数箇所形成される可能性があることは当然である。
【0025】
信号平坦部データの作成は、矩形領域内の画素の平均値を記録すると共に、各画素を平均値の差分値として記録し、しかも各画素は、差分値が納まる必要最小限の2ビットで記録していくことにより行われる。作成された信号平坦部データの一例を図5(c)に示す。本実施形態では、信号平坦部データは、矩形領域の左上のxy座標、右下のxy座標、各画素の差分値で構成されている。なお、図5(c)において2行目の「ビット数」は各項目の情報を記録するために必要なビット数である。矩形領域の左上のxy座標、右下のxy座標は、各プレーン上において矩形領域の位置を特定するために必要な位置情報であり、それぞれ16ビット割り当てている。ここで、信号平坦部処理前の、プレーン上の元の領域▲4▼のデータの様子を図5(d)に示す。図5(d)に示すように、元の画像データには、矩形領域の座標は記録されておらず、各画素の値が0〜255の範囲で記録されている。図5に示すように、領域▲4▼の平均値が「125」であった場合、画素値が「126」の画素は、差分「1」で表現されることになる。領域▲4▼について、元の画素データと信号平坦部データのデータ量を比較すると、1536ビットから424ビットに削減されていることがわかる。これは、元の映像信号の1画素では1色あたり8ビット必要なのに対して、信号平坦部データでは、1色あたり2ビットで済むためである。信号平坦部データとする矩形領域に含まれる画素数が多くなるほど、データ量を削減できることになる。
【0026】
なお、復号時に信号平坦部データを元のフレームの元のプレーンに復元するために、領域▲4▼がどのフレームのどのプレーンであるかを示す情報も必要となるのは、色信号間差分データ、フレーム間差分データの場合と同様である。
【0027】
以上のようにして、デジタル映像信号のフレーム群から色信号差分データ、フレーム間差分データ、信号平坦部データが分離され、分離された各データの画素は1画素当り2ビットという少ないビット数で記録される。上記各データの分離により残ったフレーム群の各プレーンの画素データは、マスク領域を除いて8ビットで記録される。
【0028】
(追加処理)
以上の処理で終了しても本発明による圧縮効果は十分にあるが、さらにデータ量を削減するため、上記特許文献1に記載した手法でもあるステップS4以降の処理を追加して行うようにしても良い。以下、フレーム群の各フレーム各プレーンにおいてマスクされていない領域(非マスク領域)に対して、圧縮を行う手順について説明する。まず、フレーム群の全フレーム全プレーンにおける非マスク領域の全画素について、各画素データの上位ビットと下位ビットの分離を行う(ステップS4)。本実施形態では、撮影映像をデジタル化する際に、各色について量子化ビット数8で量子化している。そのため、デジタルデータは各プレーンの各画素について8ビットが割り当てられている。この場合、本実施形態では、上位ビット6ビットと、下位ビット2ビットに分離する。この分離は、基本的に、A/D変換機等、映像信号をデジタル化する際に用いる回路の熱雑音等に起因する量子化雑音(アナログからデジタル数値に変換する際の端数のゆらぎ成分)を分離するために行う。そのため、量子化雑音であると考えられる下位ビットを分離するのである。下位ビットとして、どの程度分離するかは、撮影環境や利用した回路の特性によっても変化するが、通常量子化ビット数の1/4程度とすることが望ましい。したがって、ここでは、8ビットの1/4にあたる2ビットを下位ビットとして分離しているのである。
【0029】
ここで、上位ビットと下位ビットのデータ分離の様子を図6に模式的に示す。図6において、Hは上位ビットデータを示し、Lは下位ビットデータを示す。図6(a)は分離前の画素データである。ステップS4における処理により、各画素データは、図6(b)に示す上位ビットデータと図6(c)に示す下位ビットデータに分離されることになる。このようにして分離された画素データは、以降別々に処理されることになる。
【0030】
上位ビットデータに対しては、まず、近傍の2つの画素を基に各画素の予測値と予測誤差の算出を行う(ステップS5)。ここで、予測誤差の算出手法について、図7を用いて説明する。ここでは、走査線方向(x軸方向)に予測を行う場合を想定して、上位ビット値が図7(a)に示すような状態である場合を考えてみる。図7(a)において、横軸はプレーン上のx軸座標、縦軸は上位ビット値G(x)である。また、各座標値における線分は、各座標における画素の上位ビット値G(x)の値を示している。このような状態で、座標(x,y)の画素における予測誤差E(x)を算出する場合、直前の画素x−1における上位ビット値G(x−1)および2つ前の画素x−2における上位ビット値G(x−2)を利用して以下の〔数式1〕により算出する。
【0031】
〔数式1〕
E(x)=G(x)−2×G(x−1)+G(x−2)−E(x−1)/2
【0032】
上記〔数式1〕において、「2×G(x−1)−G(x−2)」は直前の2つの画素の上位ビット値に基づく線形予測成分である。すなわち、算出された線形予測成分、および、直前の画素において算出された予測誤差「E(x−1)/2」(誤差フィードバック成分)を用いて座標xにおける予測誤差E(x)を算出することになる。全画素について、予測誤差の算出を行い、画素データの上位ビット値の代わりに予測誤差が記録される。
【0033】
これを図7(a)に示した画素データの上位ビット値を基に説明する。まず、誤差フィードバック成分を加えない状態で各予測誤差Eo(x)を算出する。図7(b)に示すように、画素xの予測誤差Eo(x)を算出する場合、直前の画素x−1における上位ビット値G(x−1)および2つ前の画素x−2における上位ビット値G(x−2)を結ぶ予測線が座標xでとる値と、座標xにおける上位ビット値G(x)の差分(図中太点線で示す)に基づいて予測誤差Eo(x)が算出される。画素x+1以降も同様に行って予測誤差Eo(x+1)を算出する。算出された予測誤差Eo(x)は、図7(c)に示すようになる。図7(a)と図7(c)を比較するとわかるように値が変動する範囲が大きく狭まり、データ圧縮に都合が良くなる。
【0034】
続いて、〔数式1〕に基づいて予測誤差Eo(x)に対して直前の画素x−1における補正が加わった予測誤差E(x−1)の50%を減算させて、誤差フィードバック処理を加えた結果が図7(d)である。図7(c)と比べると、画素x+1およびx+2における予測誤差の低減が顕著である。逆に画素x+3およびx+4では予測誤差が増大しているが、平均的には予測誤差が低減し、図7(a)と比較すると値が変動する範囲が更に狭まり、データ圧縮効果が向上する。
【0035】
上記のようにして予測誤差の算出が行われるが、図7の例では、画像のx軸方向すなわち走査線方向に従って予測を行った。本発明では、予測精度をさらに高めるため、複数の方向のうち、予測誤差の算出に最も適した方向を選定する処理を行っている。ここでは、図8(a)に示すような走査線方向、副走査線方向、対角線方向の3方向のうち、いずれが最適であるかを選定することになる。具体的には、画素(x,y)の予測誤差を求めるための方向を決定する場合、まず、走査線方向の直前の画素(x−1,y)のさらに直前の2画素による予測誤差Eh(x−1,y)、副走査線方向の直前の画素(x,y−1)のさらに直前の2画素による予測誤差Ev(x,y−1)、対角線方向の直前の画素(x−1,y−1)のさらに直前の2画素による予測誤差Ed(x−1,y−1)を求める。なお、走査線方向の予測誤差Eh(x,y)、副走査線方向の予測誤差Ev(x,y)、対角線方向の予測誤差Ed(x,y)はそれぞれ以下の〔数式2〕〜〔数式4〕で算出される。
【0036】
〔数式2〕
Eh(x,y)=G(x,y)−2×G(x−1,y)+G(x−2,y)−E(x−1,y)/2
【0037】
〔数式3〕
Ev(x,y)=G(x,y)−2×G(x,y−1)+G(x,y−2)−E(x,y−1)/2
【0038】
〔数式4〕
Ed(x,y)=G(x,y)−2×G(x−1,y−1)+G(x−2,y−2)−E(x−1,y−1)/2
【0039】
そして、予測誤差が最小となる画素の方向を画素(x,y)の予測方向とする。例えば、Eh(x−1,y)、Ev(x,y−1)、Ed(x−1,y−1)のうち、Ev(x,y−1)が最小であった場合、副走査線方向について予測誤差を求めることになる。すなわち、画素(x,y)の予測誤差は、上記〔数式3〕に従って画素(x,y−1)、画素(x,y−2)の値を利用して、Ev(x,y)として算出される。同様にして全フレーム、全プレーンの全画素について、同様の処理を行って各画素の値を予測誤差値に置き換えていく。
【0040】
なお、プレーン上の各画素データの中には、上記ステップS1の色信号間演算、ステップS2のフレーム間演算、ステップS3の信号平坦部処理においてマスクされたマスク領域が存在する。このマスク領域上の各画素については、予測誤差の算出は行わないが、マスク領域に属さない画素の予測誤差の算出のために利用される。例えば、図8(b)に示すようなプレーンにおいて、マスク領域に属さない画素Aの予測誤差を求めるにあたって、対角線方向が最適であると判断されたとする。この場合、マスク領域に属する画素B、画素Cの画素データ(上位ビット)および予測誤差が必要になる。このような場合、画素B、画素Cの基のデータを利用して画素Aの予測誤差の算出を行う。
【0041】
上記ステップS5の処理により、各画素の上位ビットが元の値から予測誤差値に置き換えられることになるが、各画素のビット構成は固定長6ビットのままである。ここからは、予測誤差値で記録された上位ビットデータをより少ないデータ量で表現するために、固定長の上位ビットを可変長のビット構成に変換していく。そのために、まず、ビット構成の変換に利用するルックアップテーブルの作成を行う(ステップS6)。具体的には、残っている全てのフレーム、全てのプレーンについて、各画素データのヒストグラムを算出する。予測誤差に置きかえられたことにより、画素データは正負の値をとるが、ここでは、その絶対値ごとにヒストグラムを算出する。その結果、出現頻度の高い画素値から順に、少ないビット数のビットパターンを割り当てていく。この際、割り当てるビットパターンには規則が有り、最上位ビットは必ず「1」とし、「01」のビットパターンを含むビットパターンは禁止する。したがって、ビットパターンの最小値は1ビットの「1」となる。図9(c)に作成されたルックアップテーブルの一例を示す。
【0042】
上記のようにして作成されたルックアップテーブルを用いて、6ビット固定長の連続する上位ビットデータを、可変長のビットパターンに変換していく(ステップS7)。可変長になるため、変換後の各データの区切りを区別する必要が生じる。そのため、本実施形態では、各データ間に1ビットのセパレータビット「0」を挿入する。なお、ルックアップテーブルにおいて、「01」を含むビットパターンを禁止するのは、セパレータビット「0」とそれに続くビットデータの最上位ビット「1」で構成される「01」パターンでデータ間の区切りを判断するようにしているためで、ビットデータ中に「01」パターンが存在すると区切りと誤判断してしまうためである。また、ルックアップテーブルにおいては、上位固定長ビットデータがとる値の絶対値で変換するため、正負の値を記録する必要が生じる。このため、ビットデータと重複しない値をもつ正負反転データを挿入する。例えば、正負反転データ以前の可変長ビットが正である場合は、それ以降の可変長ビットは負であるとして認識されることになる。図9(a)(b)に、ステップS7によるデータ変換の様子を模式的に示す。図9(a)(b)はいずれも画素データの上位ビット部分に対応しており、図9(a)は固定長の上位ビットデータが連続して記録されている様子を示している。図9(a)に示したような上位ビットデータは、図9(c)に示したルックアップテーブルを用いて図9(b)に示すように変換されることになる。
【0043】
一方、下位ビットデータは、そのまま連続に配置される。具体的には、上記ステップS4において分離された下位2ビットのデータが連続に配置されていくことになる。
【0044】
(符号データの記録)
以上のようにして得られた符号データは、図10に示すようになる。すなわち、上位可変長ビットデータ、ルックアップテーブル、下位固定長ビットデータ、信号平坦部データ、フレーム間差分データ、色信号間差分データとなる。これらのデータを記録すべき記録媒体に合わせたフォーマットで記録する。なお、上記ステップS1からステップS3までで処理を終えた場合は、フレーム群(固定長ビットデータ)、信号平坦部データ、フレーム間差分データ、色信号間差分データが符号データとして記録される。
【0045】
(復号方法)
次に、上記圧縮方法により圧縮された符号データを復号解凍する方法について説明する。復号は、コンピュータ、およびコンピュータに搭載される専用のソフトウェアプログラムにより実行される。復号方法の概要を図11のフローチャートに示す。
【0046】
まず、図10に示したような符号データを記録した記録媒体を、復号するための装置(専用のソフトウェアを搭載したコンピュータ)に読み込ませる。続いて、読み込んだデータのうち、ルックアップテーブルを参照することにより、上位可変長ビットデータから固定長の上位固定長ビットデータすなわち線形予測誤差E(x,y)を復元していく(ステップS11)。これにより、図9(a)に示したような上位固定長ビットデータが復元される。次に、上記〔数式1〕の左辺の項と右辺第1項を交換した式に基づいて、6ビット固定長の上位ビットデータG(x,y)を順次復元していく(ステップS12)。ステップS12においては、その処理の前後共に、各上位ビットデータは6ビット固定長のままであるが、その値が変化することになる。続いて、復元した上位固定長ビットデータと、読み込んだ下位固定長ビットデータを統合する(ステップS13)。具体的には、上位ビットデータから6ビットを抽出し、下位ビットデータから2ビットを抽出して順次統合する処理を行う。
【0047】
この時点で、各プレーンの画素データは、各画素が8ビットで表現された形式となっている。上記ステップS11〜ステップS13の処理は、圧縮符号化時に、ステップS4〜ステップS7の処理を行った場合にのみ行われる。そのため、ステップS1〜ステップS3までの処理しか行っていない場合には、符号データの記録媒体を読み込んだ後、以下の処理から行う。
【0048】
上記のように、8ビット固定長の画素データで構成される各プレーンに対して信号平坦部データを挿入する(ステップS14)。信号平坦部データの挿入は、プレーン上の信号平坦部データに対応したマスク領域に、信号平坦部データの各画素を割り当てていくことにより行う。この時点で、デジタル映像信号の各フレームの各プレーンは図5(b)に示したような矩形領域がマスクされた状態から元に戻ることになる。
【0049】
次に、フレーム間差分データを利用して元のフレーム間相関部を復元する(ステップS15)。具体的には、フレーム間差分データの各画素の差分値と、直前のフレームの同一プレーン同一位置の画素値との和を求めることにより、元のプレーンの画素値を復元する。この時点でデジタル映像信号の各フレームの各プレーンは図4(b)に示したような矩形領域がマスクされた状態から元に戻ることになる。
【0050】
次に、色信号間差分データを利用して非基準プレーンの色信号相関部を復元する(ステップS16)。具体的には、各フレームごとに、基準プレーンであるGプレーンと、B−Gの色信号間差分データを用いてBプレーンを復元し、Gプレーンと、R−Gの色信号間差分データを用いてRプレーンを復元する。ステップS16の処理の結果、デジタル映像信号の各フレームの非基準プレーンは図3(b)に示したような矩形領域がマスクされた状態から元に戻ることになる。以上のようにして、図1に示したような、各フレームの各画素が24ビット(各プレーンは8ビット)で、全ての画素の欠落がないデジタル映像信号が復元されることになる。なお、上述のように、元のデジタル映像信号が、Y・Pb・Prのように、輝度信号であるY信号と、色差信号であるPb、Prの形式で入力される場合は、ステップS16の処理は行う必要がなく、ステップS15の処理を終えた段階で、元のデジタル映像信号が復元されることになる。以上のようにして、アナログ信号をデジタル化した状態のデジタル映像信号がデータの欠落無く復元される。
【0051】
【発明の効果】
以上、説明したように本発明によれば、静止画像であるフレームを時系列に配列したフレーム群として構成される映像信号を、完全に再現できるように情報量を圧縮するにあたり、フレームの各色別の画素情報の集合であるプレーン間の相関演算を行い、時系列に隣接するフレーム間の相関演算を行い、各フレームに対して、画素データの変動が設定ビット数以下に納まる矩形領域を信号平坦部として検出し、その信号平坦部を、矩形領域の位置情報、および矩形領域内の画素平均値、および前記設定ビット数で設定された各画素の前記画素平均値との差分値で表現した信号平坦部データとして符号化するようにしたので、各画素を少ないビット数で記録することができ、画素値の変動の少ない部分を効率的に圧縮符号化することが可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の映像信号の圧縮方法で圧縮対象とするデジタル映像信号の構造を示す模式図である。
【図2】本発明に係る映像信号の圧縮方法の概要を示すフローチャートである。
【図3】色信号間演算の様子を示す図である。
【図4】フレーム間演算の様子を示す図である。
【図5】信号平坦部処理の様子を示す図である。
【図6】各画素の各色を構成するビットデータの分離の様子を示す図である。
【図7】予測誤差算出処理の様子を示す図である。
【図8】予測誤差算出処理を行う際の各画素の位置関係を示す図である。
【図9】固定ビット長から可変ビット長へのデータ変換の様子を示す図である。
【図10】本発明に係る映像信号の圧縮方法により得られる符号データを示す図である。
【図11】本発明に係る映像信号の復号方法の概要を示すフローチャートである。
【符号の説明】
R1〜R8・・・単位領域
▲1▼〜▲4▼・・・矩形領域
Claims (13)
- 静止画像であるフレームを時系列に配列したフレーム群として構成される映像信号に対して、当該映像信号を完全に再現できるように情報量を圧縮する方法であって、
前記フレームの各色別の画素情報の集合であるプレーン間の相関演算を行う色信号間演算段階と、
時系列に隣接するフレーム間の同一色プレーン同士の相関演算を行うフレーム間演算段階と、
各フレームにおいて、フレーム内の画素値の変動が少ない信号平坦部の処理を行う信号平坦部処理段階と、を有し、
前記信号平坦部処理段階は、
前記各フレームの各色プレーンに対して、画素値の変動が設定ビット数以下に納まる矩形領域を信号平坦部として抽出し、
当該信号平坦部を、矩形領域の位置情報、および矩形領域内の画素平均値、および前記設定ビット数で設定された各画素の前記画素平均値との差分値で表現して信号平坦部データとして符号化するものであることを特徴とする映像信号の圧縮方法。 - 前記フレーム間演算段階は、
隣接するフレーム間の同一色プレーンの同一位置の画素値の差分演算を行い、差分値が設定ビット数以下に納まる矩形領域の情報を抽出し、
当該矩形領域の情報を、当該矩形領域の位置情報、および前記設定ビット数で設定された各画素の差分値で表現したフレーム間差分データとして符号化するものであると共に、
前記後続するフレームのプレーン上における、フレーム間差分データに対応した矩形領域を、後段の処理において利用を制限するマスク領域として設定するものであることを特徴とする請求項1に記載の映像信号の圧縮方法。 - 前記フレーム間演算段階における両フレームの同一色プレーン同士の差分演算は、あらかじめフレーム上に非適用領域が設定されている場合に、非適用領域を除いた領域に属する画素に対して行うものであることを特徴とする請求項2に記載の映像信号の圧縮方法。
- 前記色信号間演算段階は、
同一フレームにおける各色別の画素の集合であるプレーン間において、ある色のプレーンを基準プレーン、基準プレーン以外のプレーンを非基準プレーンとして、基準プレーンと非基準プレーンの同一位置の画素値の差分演算を行い、差分値が設定ビット数以下に納まる矩形領域の情報を抽出し、
当該矩形領域の情報を、当該矩形領域の位置情報、および前記設定ビット数で設定された各画素の差分値で表現した色信号間差分データとして符号化するものであると共に、
前記非基準プレーン上における、色信号間差分データに対応した矩形領域を、後段の処理において利用を制限するマスク領域として設定するものであることを特徴とする請求項1から請求項3のいずれかに記載の映像信号の圧縮方法。 - 前記信号平坦部処理段階の後に、
前記各フレーム各プレーンの非マスク領域に存在する各画素に対して、同一フレーム同一プレーン上の近傍2画素からの予測誤差を利用して符号化を行うようにした予測符号化段階を有することを特徴とする請求項1から請求項4のいずれかに記載の映像信号の圧縮方法。 - 前記信号平坦部分離段階と前記予測符号化段階の間に、
前記各画素データを表現する各ビットデータを所定のビット位置で分断し、画素データの上位ビットで構成される上位ビットデータと、画素データの下位ビットで構成される下位ビットデータとに分離する上下分離段階を有し、
前記予測符号化段階は、前記上位ビットデータに対して、近傍2画素の上位ビットデータからの予測誤差を基に符号化を行うようにすることを特徴とする請求項5に記載の映像信号の圧縮方法。 - 前記予測符号化段階は、
各画素について近傍の2画素を用いて算出した予測誤差を新たな値として各画素の上位ビットデータを更新する予測誤差算出段階と、
予測誤差値で記録された固定長の各上位ビットデータを可変長のビットデータに変換するビット長変換段階と、
を有するものであることを特徴とする請求項6に記載の映像信号の圧縮方法。 - 前記ビット長変換段階は、
対象ビットデータのヒストグラムに基づいて、変換されたビットデータの最上位ビットが1になるような最小ビット長で記述したルックアップテーブルを作成するルックアップテーブル作成段階と、
前記対象ビットデータに対して前記ルックアップテーブルを用いて変換を施すと共に、変換後のビットデータ間には所定のビット数の区分ビットデータを挿入するようにビットデータを符号化するビットデータ変換段階と、
を有することを特徴とする請求項7に記載の映像信号の圧縮方法。 - 与えられた映像信号に対して、請求項1から請求項8のいずれかに記載の映像信号の圧縮方法により得られたデータ群を記録した記録媒体。
- 映像信号を圧縮符号化したデータ群を復号して、映像信号の全てのフレーム群を再現する復号方法であって、
信号平坦部データを基に、フレーム群における各フレーム各プレーンに設定されたマスク領域の画素データを復元する信号平坦部データ復元段階と、
フレーム間差分データを基に、フレーム群におけるあるフレームの後続フレームの各プレーンに設定されたマスク領域の画素データを復元するフレーム相関部復元段階と、
色信号間差分データを基に、フレーム群における各フレームの非基準プレーンに設定されたマスク領域の画素データを復元する色信号相関部復元段階と、
を有することを特徴とする映像信号の復号方法。 - 前記信号平坦部データ復元段階の前段階として、
予測誤差で記録された上位ビットデータから、各画素ごとの独立した上位ビットデータに復元したフレーム群を得る段階と、
前記復元されたフレーム群の各画素を構成するビットデータと、下位ビットデータを統合する段階と、
を有することを特徴とする請求項10に記載の映像信号の復号方法。 - 静止画像であるフレームを時系列に配列したフレーム群として構成される映像信号に対して、当該映像信号を完全に再現できるように情報量を圧縮するためのプログラムであって、
コンピュータに、
同一フレームにおける各色別の画素の集合であるプレーン間において、ある色のプレーンを基準プレーン、基準プレーン以外のプレーンを非基準プレーンとして、基準プレーンと非基準プレーンの同一位置の画素値の差分演算を行い、差分値が設定ビット数以下に納まる矩形領域の情報を抽出し、当該矩形領域の情報を、当該矩形領域の位置情報、および前記設定ビット数で設定された各画素の差分値で表現した色信号間差分データとして符号化するものであると共に、前記非基準プレーン上における、色信号間差分データに対応した矩形領域を、後段の処理においてその利用を制限するマスク領域として設定する色信号間演算段階、
隣接するフレーム間の同一色プレーンの同一位置の画素値の差分演算を行い、差分値が設定ビット数以下に納まる矩形領域の情報を抽出し、当該矩形領域の情報を、当該矩形領域の位置情報、および前記設定ビット数で設定された各画素の差分値で表現したフレーム間差分データとして符号化するものであると共に、前記後続するフレームのプレーン上における、フレーム間差分データに対応した矩形領域を、後段の処理においてその利用を制限するマスク領域として設定するものであるフレーム間演算段階、
前記各フレームの各色プレーンに対して、画素値の変動が設定ビット数以下に納まる矩形領域を信号平坦部として検出し、当該信号平坦部を、矩形領域の位置情報、および矩形領域内の画素平均値、および前記設定ビット数で設定された各画素の前記画素平均値との差分値で表現して信号平坦部データとして符号化するものである信号平坦部処理段階、
を実行させるためのプログラム。 - 映像信号を圧縮符号化したデータ群を復号して、映像信号の全てのフレーム群を再現する復号プログラムであって、
コンピュータに、
信号平坦部データを基に、フレーム群における各フレーム各プレーンに設定されたマスク領域の画素データを復元する信号平坦部データ復元段階、
フレーム間差分データを基に、フレーム群におけるあるフレームの後続フレームの各プレーンに設定されたマスク領域の画素データを復元するフレーム相関部復元段階、
色信号間差分データを基に、フレーム群における各フレームの非基準プレーンに設定されたマスク領域の画素データを復元する色信号相関部復元段階、
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003009590A JP2004222142A (ja) | 2003-01-17 | 2003-01-17 | 映像信号の圧縮方法および復号方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003009590A JP2004222142A (ja) | 2003-01-17 | 2003-01-17 | 映像信号の圧縮方法および復号方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004222142A true JP2004222142A (ja) | 2004-08-05 |
Family
ID=32899041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003009590A Withdrawn JP2004222142A (ja) | 2003-01-17 | 2003-01-17 | 映像信号の圧縮方法および復号方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004222142A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100772613B1 (ko) | 2006-04-07 | 2007-11-02 | 주식회사 휴원 | 영상 장치를 위한 이미지 압축방법 |
US8773407B2 (en) | 2007-10-29 | 2014-07-08 | Samsung Display Co., Ltd. | Driving device of display device and driving method thereof |
-
2003
- 2003-01-17 JP JP2003009590A patent/JP2004222142A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100772613B1 (ko) | 2006-04-07 | 2007-11-02 | 주식회사 휴원 | 영상 장치를 위한 이미지 압축방법 |
US8773407B2 (en) | 2007-10-29 | 2014-07-08 | Samsung Display Co., Ltd. | Driving device of display device and driving method thereof |
US9330619B2 (en) | 2007-10-29 | 2016-05-03 | Samsung Display Co., Ltd. | Driving device of display device and driving method thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1853069B1 (en) | Decoding macroblock type and coded block pattern information | |
US6798977B2 (en) | Image data encoding and decoding using plural different encoding circuits | |
JP4898589B2 (ja) | 画像圧縮方法、および、画像処理装置 | |
JP4114885B2 (ja) | 画像符号化装置、方法、及びプログラム | |
JP2005333622A (ja) | イメージおよびビデオの予測可逆符号化 | |
US8213727B2 (en) | Image encoding apparatus and image decoding apparatus, and control method thereof | |
US9762916B2 (en) | Encoding apparatus and method | |
US20110135009A1 (en) | Combined lossy and lossless video compression | |
KR20180041441A (ko) | 결함화소 정보 기록장치, 결함화소 보정장치 및 방법 | |
JP2000244922A (ja) | 画像データ圧縮方法 | |
JP2010258576A (ja) | シーンチェンジ検出装置および映像記録装置 | |
WO2011010431A1 (ja) | 画像処理装置、画像処理方法および撮像装置 | |
JP4139657B2 (ja) | 映像信号の符号化装置および復号化装置 | |
JP2004222142A (ja) | 映像信号の圧縮方法および復号方法 | |
JP4092830B2 (ja) | 画像データ圧縮方法 | |
JP5199956B2 (ja) | 画像復号装置及びその制御方法 | |
JP2004201010A (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 | |
JP2006203744A (ja) | 静止画生成装置及び静止画生成方法 | |
JP4594163B2 (ja) | 画像符号化方法、及び画像符号化装置 | |
JP2005045527A (ja) | 静止画像の圧縮方法および映像信号の圧縮方法 | |
JP2005130345A (ja) | 映像信号および静止画像の符号化方法 | |
JP2009038740A (ja) | 画像符号化装置 | |
WO2016047250A1 (ja) | 信号処理装置、撮像装置および信号処理方法 | |
US20040179592A1 (en) | Image coding apparatus | |
JP6942504B2 (ja) | 符号化装置、撮像装置、符号化方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060404 |