JP2005304010A

JP2005304010A - データ圧縮装置およびデータ圧縮方法

Info

Publication number: JP2005304010A
Application number: JP2005080013A
Authority: JP
Inventors: Itsuki Sekida; 巖関田; Hidenori Sakanashi; 英徳坂無; Tetsuya Higuchi; 哲也樋口
Original assignee: National Institute of Advanced Industrial Science and Technology AIST
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 2004-03-18
Filing date: 2005-03-18
Publication date: 2005-10-27
Anticipated expiration: 2025-03-18
Also published as: JP4411411B2

Abstract

【課題】処理の高速化と精度の向上を両立させたデータ圧縮装置を提供する。
【解決手段】データ圧縮する画像データを複数のブロックに分割するブロック分割処理手段と、前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理手段と、分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第１コード化処理手段と、各クラスを代表する代表値をデータ圧縮しコード化する第２コード化処理手段と、前記コード化したクラスマップのデータおよび代表値のデータを１つのデータストリームにまとめる統合処理手段とを備え、ＲＧＢカラー画像のＲＧＢデータを所定の表色系の色空間の色データに変換する色変換手段により、データ圧縮する画像データを色変換した後に複数のクラスに分類する分類処理を行う。
【選択図】図１

Description

本発明は、ＢＴＣ（ＢｌｏｃｋＴｒｕｎｃａｔｉｏｎＣｏｄｉｎｇ）符号化方式と同様なデータ圧縮方法によってデータ圧縮処理を行うデータ圧縮装置およびデータ圧縮方法に関し、特に、ＢＴＣ符号化方式を改良して、処理の高速化と精度の向上を両立させたデータ圧縮装置およびデータ圧縮方法に関するものである。

従来、画像の圧縮方式の１つとして画像を所定の大きさのブロックに分割し、例えば２つの（クラス）代表色および各画素がどちらの代表色であるかを表すクラスマップデータに符号化するＢＴＣ符号化方式がある。ＢＴＣ符号化方式は、輪郭線などの情報を残しつつ、高能率に画像のデータ圧縮ができる圧縮可能な方式であり、例えば、下記の特許文献１には、ＢＴＣ符号化を使用した画像符号化装置が開示されている。また、後述するように、ＢＴＣ符号化方式において画素をクラスに分類する手法としては、次の非特許文献１および非特許文献２の手法が参照できる。
特開２００２−２０９１１０号公報 T. Kurita, N. Otsu, "A Method of Block Truncation Coding for Color Image Compression", IEEE Trans. on Communication, Vol. 41, No. 9, pp. 1270-1274, 1993. 関田、栗田、大津、アブデルマルク、「画像の量子化誤差を考慮したしきい値選定法」、電子情報通信学会論文誌D-II, Vol. J78-D-II, No. 12, pp.1806-1812 (1995).

携帯電話機など伝送速度の遅い通信環境のために画像情報を高圧縮することが求められる場合には、通信者間で画質の良い画像を送受信するために、通信者間で最も重視する情報を残す必要がある。このため、符号化には通信者間での要求を満たす符号化パラメータの設定が必要とされる。前述した従来のＢＴＣ符号化方式の符号化パラメータ設定では、ブロックサイズや色成分の選択などの設定が行われる。ブロックサイズを変えることで画質を調節することができ、また、色成分を指定することでカラー／モノクロの選択ができる。したがって、例えば、色成分を削除することで別のパラメータ量を高くすることができる。

しかし、視覚障害者が外出する時の遠隔支援や聴覚障害者が通常授業を受ける場合の遠隔支援、救急医療遠隔支援等を考えた場合に、通信者間の要求を満すためにはパラメータ設定項目が画質や色成分の指定だけでは不十分であるという問題点がある。また、伝送速度が時間と共に変化する場合に、最も遅い伝送速度に合わせて符号化パラメータを設定すると、伝送速度が速くなっても低画質のまま伝送されてしまうという問題点がある。

本発明は、上記した課題を解決するためになされたものであり、本発明の目的は、ＢＴＣ符号化方式を改良し、処理の高速化と精度の向上を両立させたデータ圧縮装置およびデータ圧縮方法を提供することにある。

上記のような目的を達成するため、本発明は、第１の態様として、本発明によるデータ圧縮装置が、データ圧縮する画像データを複数のブロックに分割するブロック分割処理手段と、前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理手段と、分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第１コード化処理手段と、各クラスを代表する代表値をデータ圧縮しコード化する第２コード化処理手段と、前記コード化したクラスマップのデータおよび代表値のデータを１つのデータストリームにまとめる統合処理手段とを備えるデータ圧縮装置において、ＲＧＢカラー画像のＲＧＢデータを所定の表色系の色空間の色データに変換する色変換手段を備え、前記クラス分類処理手段は前記色変換手段によりデータ圧縮する画像データを色変換した後に複数のクラスに分類する分類処理を行うように構成することを特徴とする。

この場合に、所定の表色系の色空間としては、カラー画像を表現する３つの直交座標軸として、青から黄への座標軸である第１軸、緑から赤への座標軸である第２軸、明るさを表す座標軸である第３軸を用い、第１軸および第２軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いることを特徴とする。

また、所定の表色系の色空間として下記の数式１で表された３つのｘ，ｙ，ｚの座標軸で表現される色空間を用いるようにしてもよい。

ここで、Ｒ，Ｇ，ＢはＲＧＢカラー画像の赤色成分，緑色成分，青色成分の各データであり、Ｃ_１，Ｃ_２は正規化定数である。

また、この場合に、前記所定の表色系の色空間の空間軸のｘ，ｙ，ｚの各軸について分散を求め、分散が最大の軸を射影軸として選定すると共に、クラスを判別する閾値として平均値を用いるようにしてもよい。また、各ブロックの画素を分類するクラスは、ｘ−ｙ平面上においてＲ（赤），Ｙ（黄），ＢＧ（青緑），Ｎ（無彩色）の４色に分類するようにしてもよい。更に、射影軸に基づいてクラス分類を行う場合に射影軸上の最大値と最小値との差情報に基づいてクラスの色数を制御するようにしてもよい。

また、本発明によるデータ圧縮装置においては、データ圧縮の度合いを高めるため、各クラスを代表するクラスの代表値を強制的に白および黒にするようにしても良く、更に、前記ブロック分割処理手段は指定された特定の領域のブロックサイズを細分化するようにしてもよい。

この場合、更に、パラメータ制御手段を備え、パラメータ制御手段により、外部からのパラメータ指定あるいは測定された伝送速度に基づき、画像サイズ、ブロックサイズ、色数を含む符号化制御パラメータを動的に変更するように構成されても良い。

また、本発明は、第２の態様として、本発明によるデータ圧縮方法は、データ圧縮する画像データを複数のブロックに分割するブロック分割処理ステップと、前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理ステップと、分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第１コード化処理ステップと、各クラスを代表する代表値をデータ圧縮しコード化する第２コード化処理ステップと、前記コード化したクラスマップのデータおよび代表値のデータを１つのデータストリームにまとめる統合処理ステップと、の処理をコンピュータの処理により実行するデータ圧縮方法であり、前記クラス分類処理ステップにおいては、データ圧縮する画像データのＲＧＢカラー画像のＲＧＢデータを所定の表色系の色空間の色データに変換する色変換ステップの処理を実行した後に複数のクラスに分類する分類処理を行うことを特徴とするものである。

この場合に、所定の表色系の色空間としては、カラー画像を表現する３つの直交座標軸として、青から黄への座標軸である第１軸、緑から赤への座標軸である第２軸、明るさを表す座標軸である第３軸を用い、第１軸，第２軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いるようにしてもよい。

上述したように、ここでは、所定の表色系の色空間の１つとしては、カラー画像を表現する３つの直交座標軸として、青から黄への座標軸である第１軸、緑から赤への座標軸である第２軸、明るさを表す座標軸である第３軸を用い、第１軸おいて第２軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いるが、この３つの直交座標軸で示される空間は、黄色の表現空間を広げたものとなっている。

本発明においては、このように黄色にシフトした色表現による色空間を用いる。この技術的な意義としては、カラー画像を表現する場合に、高データ圧縮時にも黄色が他色に変色することが避けられる。黄色は人の視認性が高い色であるので、画像表現における情報認知の劣化が避けられる。ＲＧＢ画像データにおいて、色の波長は、赤色成分（Ｒ：約７００ｎｍ）、緑色成分（Ｇ：約５３０ｎｍ）、青色成分（Ｂ：約４６０ｎｍ）の３成分であるが、波長を見ると、緑色成分は、赤色と青色の中間ではなく、青色に近い波長となっている。赤色と青色の波長の中間値は、（７００＋４６０）／２＝５８０であり、これは、黄色の波長となっている。したがって、黄色にシフトした色表現による色空間を用いることにより、データ圧縮時の量子化誤差が波長上で一様に生じた場合に、色変化に及ぼす誤差の影響が少ないといえる。

また、赤色，緑色，青色のそれぞれの中間色は、それぞれ赤と緑の中間色が黄色、緑と青の中間色がシアン、青と赤の中間色がマゼンダである。シアンは青に近い色で、マゼンダは赤に近い色であるが、黄色は赤とも緑とも近い色ではない。この意味でも、赤と緑の間の誤差の感度（重み）を、緑と青との間の誤差、青と赤との間の誤差の感度（重み）よりも上げることにより、色空間上での誤差が表現される色に及ぼす影響を下げることができるものとなる。

このように、本発明によるデータ圧縮装置においては、新規な色空間の採用、新規な射影軸および閾値の決定方法を採用しており、また、伝送速度や画像内の局所領域に応じたパラメータの設定や対象画像の特徴に合わせた符号化パラメータを設定できるようにしている。これにより、本発明のデータ圧縮装置は、色情報の制御、コントラスト制御、注目領域の高画質化の３つのパラメータの適応制御が可能となる。

すなわち、本発明のデータ圧縮装置は、今までに無い色空間を採用すると共に、新規な射影軸および閾値の決定方法を採用しており、従来のＢＴＣ符号化方式によるデータ圧縮装置と比較して処理負荷が軽く、そのため、高速処理が可能となっており、処理能力の低い処理装置においても十分に実用的な圧縮処理が可能となる。また、自動あるいは手動によるパラメータ制御が可能な適応型圧縮機能を備えているので、通信速度が変動する場合であっても、常にその時点における通信速度を最大限有効利用して通信者の要求を満たした画像のＢＴＣ符号化が可能である。

また、注目領域についてのみ高画質化することができるので、従来のように、画像全体を高画質化するわけではないので、画像の符号量の増大を抑えることができる。また、色情報量の制御により情報量が少ない領域の符号量を削減することができ、画像全体としての符号量を削減可能である。更に、コントラスト制御により文字などの認識率が向上するものとなっている。

以下、図面にしたがって発明を実施するための最良の形態について説明する。

図１は、本発明において基礎となるＢＴＣ符号化（復号化）方式によるデータ圧縮処理およびデータ復元処理を示すフローチャートである。図１（ａ）は圧縮処理のフローチャートを示しており、図１（ｂ）は復元処理のフローチャートを示している。圧縮処理について説明すると、圧縮処理では、まず、Ｓ１０において、１枚の画像をｎ_１画素×ｎ_２画素からなる複数のブロックに分ける。ｎ_１、ｎ_２は任意の正数である。次に、Ｓ１１において、各ブロックに属する画素をｍクラスに分類する。ｍは１以上の任意の正数であり、本発明においては、後述するように、パラメータの設定制御により、ブロック毎に異なって用いられる。

次に、Ｓ１２において、分類された各画素を０〜（ｍ−１）で表現してクラスマップを作り、それをデータ圧縮してコード化する。ｍ＝２の場合、クラスマップは、後述する図２（ｂ）に例示するように、１画素当たり１ビットのビットマップデータとなる。次に、Ｓ１３において、各クラスを代表する値（色データ）をデータ圧縮してコード化する。そして、次のＳ１４において、上記Ｓ１２、Ｓ１３の結果を１つのデータストリームにまとめる。

続いて、図１（ｂ）のフローチャートを参照して、復元（復号、伸張）処理を説明すると、復元処理では、まず、Ｓ１５において、１つのブロックについて、クラス代表値のデータが圧縮されたコードとクラスマップのデータが圧縮されたコードからクラスマップおよびクラス代表値を復元する。次に、Ｓ１６において、クラスマップを参照してブロックの各画素の値にクラス代表値を割り当てる。そして、Ｓ１７において、全てのブロックの復元処理が完了したか否かを判定し、その結果が否定の場合にはＳ１５に戻り、Ｓ１５からの処理を続けるが、肯定の場合にはＳ１８に移行する。

Ｓ１８においては後処理を行う。即ち、復元時のブロック間のブロック歪みを是正するために、隣のブロックとの間で平滑化フィルタ処理を行う。このフィルタ処理では、隣のブロックのクラス代表値と自分のブロックのクラス代表値とをＳ空間での線分で結び、画素数に基づく距離と比例するように、その線分を内分して色を定める。但し、ビットマッププレーンの同じレベルが連続していて、クラス代表値の差がＳ空間上での距離で許容誤差δ以下の範囲のときに限定する。これにより、文字画像等がボケることがなく、ブロック歪みを改善できる。

図２は、本発明において処理される画像データおよびクラスマップの構成を示す説明図である。図２（ａ）は注目領域を高画質化する場合のブロック化した画像データを説明する図であり、図２（ｂ）は白黒画像データにおけるクラスマップの構成を説明する図である。注目領域を高画質化する場合には、例えば、中心部を高画質化する場合、図２（ａ）に示すように、ブロックに分ける場合の中心部のｎ_１、ｎ_２の値は周辺部の１／２（例えば４分割）とする。このようなブロック化により、少ないデータ量でも、中心部分では細かく識別できるので、見たいものを短時間で探せるようになる。なお、３段階以上の細分化を行ってもよく、分割ステップも１／２以外であってもよい。

次に、図１により説明した圧縮処理および復元処理におけるそれぞれの処理ステップの詳細について説明する。

図３は、ブロック分割処理（Ｓ１０）を詳細に示すフローチャートである。図３に示すように、ブロック分割処理では、まず、Ｓ２０において、１枚の画像をｎ_１画素×ｎ_２画素からなるブロックに分ける。例えば、ｎ_１＝ｎ_２＝８とする。次に、Ｓ２１において、設定されている制御パラメータを参照して、注目領域を高画質化するか否かを判定し、判定結果が肯定の場合には、Ｓ２２に移行する。そして、Ｓ２２において、画像の中心部分あるいは動画において動きのある領域などの特定の領域のブロックを更に細分化する。

図４は、本発明において採用する色空間であるＳ空間を説明する説明図である。この表色系Ｓ（Ｓ空間）は、ｘ−ｙ平面でＮ(無彩色)を原点とし、Ｒ（赤），Ｙ（黄），Ｇ（緑），Ｂ（青）のデータに基づいてｘ，ｙが下記の式で定義される色相と彩度を表す平面であり、ｚ軸は明度を表している。

ここで、Ｒ，Ｇ，ＢはＲＧＢカラー画像の赤色成分，緑色成分，青色成分の各データであり、Ｃ_１，Ｃ_２は正規化定数である。Ｃ_１，Ｃ_２は、０≦Ｒ，Ｇ，Ｂ≦Ｍａｘとすると、以下のように定義する。

なお、ＲＧＢ空間（表色系）をＳ空間に変換する処理において、ｘ，ｙ，ｚを正整数として演算した場合には、暗いところに暗い人物がいる場合などには情報が量子化誤差の範囲内に埋もれてしまい、情報が欠落してしまうという問題点があるが、この場合、上記のような場合に人物をはっきり見たいときには、次のような感度増加処理を行う。まず、上記Ｓ空間の係数を下記のようにｆ倍に感度を上げる。

そこでｍクラスに分類した後、それぞれの代表色のｚの値を、明るい方には＋ｆを、暗い方には−ｆを加えることで、コントラストを増した後、代表値のｘ，ｙ，ｚを１／ｆにして元の感度に戻す。このような処理を施すことにより、同じ情報量で必要な情報を伝送することができる。

図５は、クラス分類処理（Ｓ１１）を詳細に示すフローチャートである。図５に示すように、クラス分類処理では、まず、Ｓ３０において、制御パラメータを参照するか、あるいは画像データの属性をチェックすることによってカラー画像か否かを判定し、結果が肯定の場合にはＳ３１に移行するが、否定の場合にはＳ３５に移行する。そして、Ｓ３１において、ＲＧＢ空間（表色系）を前述したＳ空間に変換する。次に、Ｓ３２において、射影軸に基づいてクラス分類を行うか否かを判定し、射影軸に基づいてクラス分類を行う場合には、Ｓ３４において、後述するように、射影軸を求める処理を行う。また、射影軸に基づいてクラス分類を行わない場合には、Ｓ３３において、画素を直接ｍクラスに分類する分類処理を行う。例えば、直接ｎ_１×ｎ_２画素を、ｍクラスに分類する。分類処理としては、具体的に、公知のk-means法などが利用できる。

次に、Ｓ３４において、射影軸を求める。この射影軸を求める処理については、後に詳述する。そして、次に、Ｓ３５に移行して、射影軸上における（最大値−最小値）＝Ｄを求める。Ｓ３６において、Ｄが所定値より大きい（色に差がある）か否かを判定し、判定結果が否定の場合にはＳ３７に移行するが、肯定の場合にはＳ３８に移行する。Ｓ３７に移行した場合、Ｓ３７において、ｍ＝１、即ちクラス数＝色の数を１に設定する。ｍ＝１の場合は、ブロック内は全て同色であるのでクラスマップが不要となり、データ量が減少する。

Ｓ３８に移行した場合、Ｓ３８おいては、画素をｍクラスに分類する閾値を求める処理を行う。クラス分類を行うｍ値化のための閾値は、例えば、非特許文献１に記載されている公知の大津の方法を利用して求めることができる。また、非特許文献２に記載されている公知のKittler や栗田の閾値にバイアス項を付加して修正した関田の方法により求めることもできる（非特許文献１，非特許文献２）。しかし、これらの方法は処理負荷が重い。そこで、簡略的には平均値を２値化の閾値とする。このように平均値を採用することによって上記の方法よりも処理負荷が軽減される。そして、求めた閾値を境にして画素をｍクラスに分類する。

なお、後述するように、視覚障害者の外出支援や聴覚障害者遠隔支援のためにデータ圧縮装置を適用する場合には、信号機の色や黒板やチョークの色が鮮明であることが望ましい。このようなときには、パラメータ制御の処理により、強制的にクラスをｘ−ｙ平面上においてＲ（赤），Ｙ（黄），ＢＧ（青緑），Ｎ（無彩色）の４色に分類するように構成する。また、注目領域を高画質化するためには、特定の領域のｍの値、即ち色の数を大きく（例えば３あるいは４と）する。

次に、Ｓ４０において、例えば設定されているパラメータを参照することにより、コントラストを強調するか否かを判定する。ここでのコントラスト強調処理は、例えば白地に黒で印刷された文字等を鮮明に見たい場合などに行うコントラストの強調処理である。そして、この判定結果が肯定の場合にはＳ４１に移行するが、否定の場合にはＳ４２に移行して、それぞれの処理を行う。

なお、このコントラスト強調のオン／オフを自動化することもできる。この場合の処理の例として、例えば、ｍ＝１の場合に、平均値が黒または白に近い場合にはオンとする処理を行うようにして自動化する。また、ｍ＝２の場合には、ｘ、ｙの分散と平均が小さく、ｚの分散が大きいときには白（黒）背景に黒（白）の文字と判断してオンとする処理を行うようにして自動化する。

コントラスト強調を行わない判定の場合には、Ｓ４２において、各クラスの代表色を求める。すなわち、この場合、閾値によってｍ個のクラスに分類された画素の各クラス毎の平均をそのクラスの代表色とする。

また、コントラスト強調を行う判定の場合には、Ｓ４１において、ｍ＝１か否かが判定され、結果が肯定（１色）の場合にはＳ４４に移行して、代表色を白または黒のみとするが、否定の場合にはＳ４３に移行する。Ｓ４３において、各クラスの代表色を白と黒（ｍ＝２の場合）にして、代表色の情報をコード化しない。この処理によって視認性を高めると同時に、データ圧縮率を高めることができる。

図６は、クラス分類処理（Ｓ１１）における射影軸決定処理（Ｓ３４）を詳細に示すフローチャートである。ここで閾値を求めるための射影軸の求め方について説明する。射影による２乗誤差が最小なものは主成分分析の主軸である。但し、主成分分析を使う方法は処理の負荷が重くなる。そこで、図６のフローチャートに示すような処理により、準最適な方法により射影軸を決定する処理を行う。この処理では、まず、Ｓ４５において、各ｘ，ｙ，ｚ軸毎に分散を求める。次に、Ｓ４６において、最大の分散を持つ軸を射影軸に選定する。この方法によって、軸を求める計算量が１／２以下になる。この方法は最大の分散を持つ軸に射影していることに相当する。

図７は、クラスマップ作成処理（Ｓ１２）を詳細に示すフローチャートである。このクラスマップ作成処理では、まず、Ｓ５０において、分類された各画素を０〜（ｍ−１）で表現してクラスマップを作る。前述した図２（ｂ）には、ｍ＝２（ブロックサイズ＝８×８）の場合のクラスマップの内容例を示している。図示されるように、例えば、ｍ＝２の場合には、クラスマップは１画素当たり１ビットのビットマップデータとなっている。なお、ｍ＝１（１色）の場合にはクラスマップは作成されない。

次に、Ｓ５１において、ｍ＝２か否かが判定され、結果が肯定の場合にはＳ５２に移行するが、否定の場合にはＳ５３に移行する。Ｓ５２においては、公知のビットマップ用のデータ圧縮手法によりデータ圧縮を行う。２値データの情報量に基づいて動的に圧縮を行う方法として、例えば、ＭＥＬコード方式を用いることができる。ＭＥＬコードは、ハフマン符号化における各通報の出現確率に起因する冗長性が抑制されており、さらに、算術符号型により、符号語のためのメモリサイズを少なくできる。また、ＭＥＬコードに限らず、ＪＢＩＧ２やＪＰＥＧ２０００で使用される公知のＭＱ−Ｃｏｄｅｒなど、２値画像の圧縮符号化方式なら何でも適用可能である。

Ｓ５１の判定においてｍ＝２の判定結果が否定の場合に、Ｓ５３において、濃淡画像用のデータ圧縮手法によりデータ圧縮を行う。このデータ圧縮の一例として、例えば、ＪＰＥＧやＪＰＥＧ−ＬＳ、ＪＰＥＧ２０００などによりデータ圧縮を行う。また、各画素をビットプレーンにスライスして、それぞれのプレーンをＳ５２の処理と同様に符号化するようにしてもよい。なお、Ｓ５２、５３におけるデータ圧縮の圧縮方式としては、例えばＺＩＰ，ＬＺＷ，ＰＡＣＫＢＩＴＳなど、画像ではなく一般的なデータの圧縮符号化方式を採用してもよい。

なお、代表色情報は、ブロックを１つの画素と見なすと、ｍ＝２の場合、通常１ブロックに２つの代表色が存在する。そこで、輝度の大きな方の代表色のみおよび輝度の小さな方の代表色のみを集めたものをそれぞれ１つのカラー画像データとみなすことができる。したがって、これらのカラー画像データを公知の方法によってデータ圧縮する。

図８は、クラス代表値圧縮処理（Ｓ１３）の詳細な処理を示すフローチャートである。クラス代表値圧縮処理について説明する。このクラス代表値圧縮処理では、まず、Ｓ６０において、公知のコンテクストモデリングの処理を行う。このコンテクストモデリングの処理では、注目画素の周辺の特定の画素値からコンテクストと言われる指標を求める。コンテクストの種類は、例えば、注目画素の周辺の４画素の相対値を量子化して、最初は７２９種類用意し、その後、冗長性等により削減する。コンテクストの種類に応じて注目画素の補正値を変え、注目画素の予測誤差のバイアスが０になるようにする。

次に、Ｓ６１において、代表値を順に１つ抽出する。そして、Ｓ６２において前値と同じであるか否かを判定する。この判定においては、ランモードでない場合には代表値が周辺の４画素と値が同じか否かが判定され、ランモードの場合には、代表値が左隣の画素の値と同じか否かが判定される。判定の結果が肯定の場合にはＳ６３に移行するが、否定の場合にはＳ６５に移行する。Ｓ６３に移行した場合、Ｓ６３において、ランモード（ランレングス符号化モード）にセットする。次に、Ｓ６４において、ラン長を計数（カウンタを＋１）してＳ７０に移行する。

また、Ｓ６５に移行した場合、Ｓ６５において、ランモードをリセットする。次に、Ｓ６６において、直前がランモードだったか否かを判定し、結果が否定の場合にはＳ６８に移行するが、肯定の場合にはＳ６７に移行して、Ｓ６７において、予測誤差情報の伝送中に割り込ませて伝送するラン長データを符号化する。そして、次のＳ６８において、予測器処理を行う。Ｓ６９においては、予測誤差を符号化する。

クラス代表値の表現形式としては、階調が多値である場合に対応したものが利用される。このため、クラス代表値の可逆符号化には、表現形式、圧縮率、処理の容易さなどの観点から予測符号化、ゴーロム符号化の組み合わせを用い、予測器により求められた予測値と実際の画素値との差分をゴーロム符号化を用いて符号化する。この符号化方式は、次のような３点の特徴を挙げることができる。
（１）符号化復号化が単純なため、高速な処理が可能。
（２）単純な処理にしては、高圧縮が望める。
（３）パラメータ指定により、可逆符号化の他に、復号画像の画素値が誤差範囲内に必ず収まる準可逆符号化も可能。

ゴーロム符号においては、極端に長い符号が現れるのを防ぐために有限長ゴーロム符号化を行う。有限長ゴーロム符号化では、ゴーロム符号化の対象となるデータ群がある限られた範囲に収まっている場合に、符号語の最大長を定めることにより極端に長い符号語が現れる弊害を防ぐことができる。極端に長い符号が出現するときは、有限長ゴーロム符号化をし、その他は通常のゴーロム符号化を行う。

そして、次のＳ７０において、全ての代表値の処理が完了したか否かを判定し、処理が完了していれば、ここでの処理を終了する。この判定結果が否定の場合にはＳ６１に戻る。なお、圧縮手法としては、例えばＴＩＦＦ（ＬＺＷ）、ＪＰＥＧ２０００など、上記方法以外の可逆圧縮手法でもよいし、例えば非可逆圧縮手法（例えばＪＰＥＧ−ＬＳ）によりコード化してもよい。

図９は、本発明によるデータ圧縮方法において圧縮された画像データのデータ構造の例を示す説明図である。図９（ａ）は、各ブロック毎にクラスマップデータとクラス代表値データとを組み合わせて収納しているデータ構造の例であり、図９（ｂ）は、クラスマップデータとクラス代表値データ毎にまとめて収納しているデータ構造の例である。

図１０は、本発明によるデータ圧縮装置におけるパラメータ制御処理を説明するフローチャートである。このパラメータ制御処理は、データ圧縮装置を利用する場合において、予め実行され、また、環境の状態に変化が生じた場合に必要に応じてその都度実行される。この処理では、まず、Ｓ８０においてデータ伝送速度を測定する。例えば、単位時間当たりの伝送成功パケット数などから、データ伝送速度を測定する。次に、Ｓ８１において、復元装置から送信されるモード情報等を受信し、Ｓ８２において、伝送速度情報およびモード情報に基づいて、各種の制御パラメータを決定する。制御パラメータとしては、例えば画像サイズ（解像度）、ブロックサイズ、カラー／モノクロ指定、クラス数（ｍ）、階調数、文字用コントラスト強調、暗画像用コントラスト増幅、高画質化、高画質化領域、交通信号用変換処理、伝送速度などが用いられる。各モードおよび伝送速度情報に基づき各パラメータをどのような値に設定するかは実験等を行うことにより決定する。

図１１は、本発明によるデータ圧縮装置を利用する視覚障害者遠隔支援システムの構成例を示すブロック図である。ここに利用されるデータ圧縮装置においては、上述したパラメータ制御処理が、所定のタイミングの割り込み処理により実行される。システム構成について説明すると、図１１において、カメラ２０は、例えば、視覚障害者の頭部やめがねなどに装着され、視覚障害者の視線の方向の画像を撮像して動画データとして出力する。圧縮装置２１は、本発明によるデータ圧縮装置であり、データ圧縮処理を行う。したがって、カメラ２０から入力される画像データは、データ圧縮処理が実行される。なお、圧縮パラメータは前述した処理方法によって動的に適応制御される。

この圧縮装置２１としては、ＣＰＵを含む専用のハードウェアを設計、製造してもよいが、市販のノートパソコン、ＰＤＡ、ウェアラブルコンピュータ携帯電話機など携帯できるデータ処理装置において本発明によるデータ圧縮処理を実行するためのプログラムをインストールすることによって実現することもできる。また、市販されている周知の携帯電話機２２および３０は、圧縮装置２１と支援用の復元装置３１との間のデータ通信機能および音声による通話機能を提供する。スピーカ２３、３２およびマイク２４、３３は別に装備してもよいし、携帯電話機に内蔵されているものを使用してもよい。

復元装置３１は、圧縮装置２１によりデータ圧縮処理されたデータを復元処理する処理装置であり、例えば、遠隔地にいる支援者が使用する周知のパソコンに本発明によるデータ復元処理を実行するためのプログラムをインストールすることにより実現できる。表示器３４は復元した画像を表示する。表示器３４、操作パネル３５はそれぞれパソコンのディスプレイおよびキーボード、マウスであってもよい。支援者は表示器の画像を見ながら視覚障害者と会話し、必要な情報を音声で伝達する。

また、支援者は必要に応じて操作パネルからモード情報を入力することによって画像の圧縮モードを直接指定することができる。圧縮モードとしては、カラーモード、モノクロモード、文字モード、色優先モード、特定領域高画質モードなどがある。

カラーモードは通常のモードであり、色数の自動制御機能を含んでいる。また、色優先モード、特定領域高画質モードとの組み合わせも可能である。色優先モードは、形状情報よりも色情報を優先させるモードであり、ブロックを小さくして色数は１とすることにより、クラスマップ情報を送らないので、同じ情報量でも正確な色情報を送れるモードである。代表色はＳ空間上での最頻値としてもよい。モノクロモードは輝度（濃淡）情報のみとすることにより、同じ情報量で形状等の情報をより詳細に送るモードである。

文字モードは色情報を伝送せずに代表色を強制的に白あるいは黒とすることによりコントラストを強調して文字を認識しやすくするモードである。なお、色情報をＲ、ＢＧ（青緑）、Ｙ、Ｎの４色のみとしてもよく、この場合には代表色情報を２ビットで伝送可能である。特定領域高画質モードは例えば画像の中心部のみ、支援者の指定した領域のみ、あるいは画像の動き、変化のある領域を自動的に検出してそのブロックを更に細分化して、データ量の増加を抑えながら高画質化するモードである。

本発明において基礎となるＢＴＣ符号化（復号化）方式によるデータ圧縮処理およびデータ復元処理を示すフローチャートである。本発明において処理される画像データおよびクラスマップの構成を示す説明図である。ブロック分割処理（Ｓ１０）を詳細に示すフローチャートである。本発明において採用する色空間であるＳ空間を説明する説明図である。クラス分類処理（Ｓ１１）を詳細に示すフローチャートである。クラス分類処理（Ｓ１１）における射影軸決定処理（Ｓ３４）を詳細に示すフローチャートである。クラスマップ作成処理（Ｓ１２）を詳細に示すフローチャートである。クラス代表値圧縮処理（Ｓ１３）の詳細な処理を示すフローチャートである。本発明によるデータ圧縮方法において圧縮された画像データの構造例を示す説明図である。本発明によるデータ圧縮装置におけるパラメータ制御処理を説明するフローチャートである。本発明によるデータ圧縮装置を利用する視覚障害者遠隔支援システムの構成例を示すブロック図である。

符号の説明

１０画像データ
１１、１２、１３ブロック
１４画素のクラス値
２０カメラ
２１圧縮装置
２２、３０携帯電話機
２３、３２スピーカ
２４、３３マイク
３１復元装置
３４表示器
３５操作パネル

Claims

データ圧縮する画像データを複数のブロックに分割するブロック分割処理手段と、
前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理手段と、
分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第１コード化処理手段と、
各クラスを代表する代表値をデータ圧縮しコード化する第２コード化処理手段と、
前記コード化したクラスマップのデータおよび代表値のデータを１つのデータストリームにまとめる統合処理手段と
を備えるデータ圧縮装置において、
ＲＧＢカラー画像のＲＧＢデータを所定の表色系の色空間の色データに変換する色変換手段を備え、
前記クラス分類処理手段は前記色変換手段によりデータ圧縮する画像データを色変換した後に複数のクラスに分類する分類処理を行う
ことを特徴とするデータ圧縮装置。
請求項１に記載のデータ圧縮装置において、
所定の表色系の色空間としては、カラー画像を表現する３つの直交座標軸として、青から黄への座標軸である第１軸、緑から赤への座標軸である第２軸、明るさを表す座標軸である第３軸を用い、第１軸および第２軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いる
ことを特徴とするデータ圧縮装置。
請求項１に記載のデータ圧縮装置において、
所定の表色系の色空間として下記の数式１で表された３つのｘ，ｙ，ｚの座標軸で表現される色空間を用いることを特徴とするデータ圧縮装置。

ここで、Ｒ，Ｇ，ＢはＲＧＢカラー画像の赤色成分，緑色成分，青色成分の各データであり、Ｃ_１，Ｃ_２は正規化定数である。
請求項３に記載のデータ圧縮装置において、
前記所定の表色系の色空間の空間軸のｘ，ｙ，ｚの各軸について分散を求め、分散が最大の軸を射影軸として選定すると共に、クラスを判別する閾値として平均値を用いる
ことを特徴とするデータ圧縮装置。
請求項３に記載のデータ圧縮装置において、
各ブロックの画素を分類するクラスは、ｘ−ｙ平面上においてＲ（赤），Ｙ（黄），ＢＧ（青緑），Ｎ（無彩色）の４色に分類する
ことを特徴とするデータ圧縮装置。
請求項１に記載のデータ圧縮装置において、
射影軸に基づいてクラス分類を行う場合に射影軸上の最大値と最小値との差情報に基づいてクラスの色数を制御する
を特徴とするデータ圧縮装置。
請求項１に記載のデータ圧縮装置において、
各クラスを代表するクラスの代表値を強制的に白および黒にする
を特徴とするデータ圧縮装置。
請求項１に記載のデータ圧縮装置において、
前記ブロック分割処理手段は指定された特定の領域のブロックサイズを細分化する
ことを特徴とするデータ圧縮装置。
請求項１に記載のデータ圧縮装置において、更に、
外部からのパラメータ指定あるいは測定された伝送速度に基づき、画像サイズ、ブロックサイズ、色数を含む符号化制御パラメータを動的に変更するパラメータ制御手段
を備えたことを特徴とするデータ圧縮装置。
データ圧縮する画像データを複数のブロックに分割するブロック分割処理ステップと、
前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理ステップと、
分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第１コード化処理ステップと、
各クラスを代表する代表値をデータ圧縮しコード化する第２コード化処理ステップと、
前記コード化したクラスマップのデータおよび代表値のデータを１つのデータストリームにまとめる統合処理ステップと、
の処理をコンピュータの処理により実行するデータ圧縮方法であって、
前記クラス分類処理ステップにおいては、データ圧縮する画像データのＲＧＢカラー画像のＲＧＢデータを所定の表色系の色空間の色データに変換する色変換ステップの処理を実行した後に複数のクラスに分類する分類処理を行う
ことを特徴とするデータ圧縮方法。
請求項９に記載のデータ圧縮方法において、
所定の表色系の色空間としては、カラー画像を表現する３つの直交座標軸として、青から黄への座標軸である第１軸、緑から赤への座標軸である第２軸、明るさを表す座標軸である第３軸を用い、第１軸および第２軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いる
ことを特徴とするデータ圧縮方法。
請求項９に記載のデータ圧縮方法において、
所定の表色系の色空間として下記の数式１で表された３つのｘ，ｙ，ｚの座標軸で表現される色空間を用いることを特徴とするデータ圧縮方法。

ここで、Ｒ，Ｇ，ＢはＲＧＢカラー画像の赤色成分，緑色成分，青色成分の各データであり、Ｃ_１，Ｃ_２は正規化定数である。