JP2005304010A - データ圧縮装置およびデータ圧縮方法 - Google Patents

データ圧縮装置およびデータ圧縮方法 Download PDF

Info

Publication number
JP2005304010A
JP2005304010A JP2005080013A JP2005080013A JP2005304010A JP 2005304010 A JP2005304010 A JP 2005304010A JP 2005080013 A JP2005080013 A JP 2005080013A JP 2005080013 A JP2005080013 A JP 2005080013A JP 2005304010 A JP2005304010 A JP 2005304010A
Authority
JP
Japan
Prior art keywords
data
class
color
data compression
axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005080013A
Other languages
English (en)
Other versions
JP4411411B2 (ja
Inventor
Itsuki Sekida
巖 関田
Hidenori Sakanashi
英徳 坂無
Tetsuya Higuchi
哲也 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2005080013A priority Critical patent/JP4411411B2/ja
Publication of JP2005304010A publication Critical patent/JP2005304010A/ja
Application granted granted Critical
Publication of JP4411411B2 publication Critical patent/JP4411411B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Color Television Systems (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

【課題】 処理の高速化と精度の向上を両立させたデータ圧縮装置を提供する。
【解決手段】 データ圧縮する画像データを複数のブロックに分割するブロック分割処理手段と、前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理手段と、分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第1コード化処理手段と、各クラスを代表する代表値をデータ圧縮しコード化する第2コード化処理手段と、前記コード化したクラスマップのデータおよび代表値のデータを1つのデータストリームにまとめる統合処理手段とを備え、RGBカラー画像のRGBデータを所定の表色系の色空間の色データに変換する色変換手段により、データ圧縮する画像データを色変換した後に複数のクラスに分類する分類処理を行う。
【選択図】 図1

Description

本発明は、BTC(Block Truncation Coding)符号化方式と同様なデータ圧縮方法によってデータ圧縮処理を行うデータ圧縮装置およびデータ圧縮方法に関し、特に、BTC符号化方式を改良して、処理の高速化と精度の向上を両立させたデータ圧縮装置およびデータ圧縮方法に関するものである。
従来、画像の圧縮方式の1つとして画像を所定の大きさのブロックに分割し、例えば2つの(クラス)代表色および各画素がどちらの代表色であるかを表すクラスマップデータに符号化するBTC符号化方式がある。BTC符号化方式は、輪郭線などの情報を残しつつ、高能率に画像のデータ圧縮ができる圧縮可能な方式であり、例えば、下記の特許文献1には、BTC符号化を使用した画像符号化装置が開示されている。また、後述するように、BTC符号化方式において画素をクラスに分類する手法としては、次の非特許文献1および非特許文献2の手法が参照できる。
特開2002−209110号公報 T. Kurita, N. Otsu, "A Method of Block Truncation Coding for Color Image Compression", IEEE Trans. on Communication, Vol. 41, No. 9, pp. 1270-1274, 1993. 関田、栗田、大津、アブデルマルク、「画像の量子化誤差を考慮したしきい値選定法」、電子情報通信学会論文誌D-II, Vol. J78-D-II, No. 12, pp.1806-1812 (1995).
携帯電話機など伝送速度の遅い通信環境のために画像情報を高圧縮することが求められる場合には、通信者間で画質の良い画像を送受信するために、通信者間で最も重視する情報を残す必要がある。このため、符号化には通信者間での要求を満たす符号化パラメータの設定が必要とされる。前述した従来のBTC符号化方式の符号化パラメータ設定では、ブロックサイズや色成分の選択などの設定が行われる。ブロックサイズを変えることで画質を調節することができ、また、色成分を指定することでカラー/モノクロの選択ができる。したがって、例えば、色成分を削除することで別のパラメータ量を高くすることができる。
しかし、視覚障害者が外出する時の遠隔支援や聴覚障害者が通常授業を受ける場合の遠隔支援、救急医療遠隔支援等を考えた場合に、通信者間の要求を満すためにはパラメータ設定項目が画質や色成分の指定だけでは不十分であるという問題点がある。また、伝送速度が時間と共に変化する場合に、最も遅い伝送速度に合わせて符号化パラメータを設定すると、伝送速度が速くなっても低画質のまま伝送されてしまうという問題点がある。
本発明は、上記した課題を解決するためになされたものであり、本発明の目的は、BTC符号化方式を改良し、処理の高速化と精度の向上を両立させたデータ圧縮装置およびデータ圧縮方法を提供することにある。
上記のような目的を達成するため、本発明は、第1の態様として、本発明によるデータ圧縮装置が、データ圧縮する画像データを複数のブロックに分割するブロック分割処理手段と、前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理手段と、分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第1コード化処理手段と、各クラスを代表する代表値をデータ圧縮しコード化する第2コード化処理手段と、前記コード化したクラスマップのデータおよび代表値のデータを1つのデータストリームにまとめる統合処理手段とを備えるデータ圧縮装置において、RGBカラー画像のRGBデータを所定の表色系の色空間の色データに変換する色変換手段を備え、前記クラス分類処理手段は前記色変換手段によりデータ圧縮する画像データを色変換した後に複数のクラスに分類する分類処理を行うように構成することを特徴とする。
この場合に、所定の表色系の色空間としては、カラー画像を表現する3つの直交座標軸として、青から黄への座標軸である第1軸、緑から赤への座標軸である第2軸、明るさを表す座標軸である第3軸を用い、第1軸および第2軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いることを特徴とする。
また、所定の表色系の色空間として下記の数式1で表された3つのx,y,zの座標軸で表現される色空間を用いるようにしてもよい。
Figure 2005304010
ここで、R,G,BはRGBカラー画像の赤色成分,緑色成分,青色成分の各データであり、C,Cは正規化定数である。
また、この場合に、前記所定の表色系の色空間の空間軸のx,y,zの各軸について分散を求め、分散が最大の軸を射影軸として選定すると共に、クラスを判別する閾値として平均値を用いるようにしてもよい。また、各ブロックの画素を分類するクラスは、x−y平面上においてR(赤),Y(黄),BG(青緑),N(無彩色)の4色に分類するようにしてもよい。更に、射影軸に基づいてクラス分類を行う場合に射影軸上の最大値と最小値との差情報に基づいてクラスの色数を制御するようにしてもよい。
また、本発明によるデータ圧縮装置においては、データ圧縮の度合いを高めるため、各クラスを代表するクラスの代表値を強制的に白および黒にするようにしても良く、更に、前記ブロック分割処理手段は指定された特定の領域のブロックサイズを細分化するようにしてもよい。
この場合、更に、パラメータ制御手段を備え、パラメータ制御手段により、外部からのパラメータ指定あるいは測定された伝送速度に基づき、画像サイズ、ブロックサイズ、色数を含む符号化制御パラメータを動的に変更するように構成されても良い。
また、本発明は、第2の態様として、本発明によるデータ圧縮方法は、データ圧縮する画像データを複数のブロックに分割するブロック分割処理ステップと、前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理ステップと、分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第1コード化処理ステップと、各クラスを代表する代表値をデータ圧縮しコード化する第2コード化処理ステップと、前記コード化したクラスマップのデータおよび代表値のデータを1つのデータストリームにまとめる統合処理ステップと、の処理をコンピュータの処理により実行するデータ圧縮方法であり、前記クラス分類処理ステップにおいては、データ圧縮する画像データのRGBカラー画像のRGBデータを所定の表色系の色空間の色データに変換する色変換ステップの処理を実行した後に複数のクラスに分類する分類処理を行うことを特徴とするものである。
この場合に、所定の表色系の色空間としては、カラー画像を表現する3つの直交座標軸として、青から黄への座標軸である第1軸、緑から赤への座標軸である第2軸、明るさを表す座標軸である第3軸を用い、第1軸,第2軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いるようにしてもよい。
上述したように、ここでは、所定の表色系の色空間の1つとしては、カラー画像を表現する3つの直交座標軸として、青から黄への座標軸である第1軸、緑から赤への座標軸である第2軸、明るさを表す座標軸である第3軸を用い、第1軸おいて第2軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いるが、この3つの直交座標軸で示される空間は、黄色の表現空間を広げたものとなっている。
本発明においては、このように黄色にシフトした色表現による色空間を用いる。この技術的な意義としては、カラー画像を表現する場合に、高データ圧縮時にも黄色が他色に変色することが避けられる。黄色は人の視認性が高い色であるので、画像表現における情報認知の劣化が避けられる。RGB画像データにおいて、色の波長は、赤色成分(R:約700nm)、緑色成分(G:約530nm)、青色成分(B:約460nm)の3成分であるが、波長を見ると、緑色成分は、赤色と青色の中間ではなく、青色に近い波長となっている。赤色と青色の波長の中間値は、(700+460)/2=580であり、これは、黄色の波長となっている。したがって、黄色にシフトした色表現による色空間を用いることにより、データ圧縮時の量子化誤差が波長上で一様に生じた場合に、色変化に及ぼす誤差の影響が少ないといえる。
また、赤色,緑色,青色のそれぞれの中間色は、それぞれ赤と緑の中間色が黄色、緑と青の中間色がシアン、青と赤の中間色がマゼンダである。シアンは青に近い色で、マゼンダは赤に近い色であるが、黄色は赤とも緑とも近い色ではない。この意味でも、赤と緑の間の誤差の感度(重み)を、緑と青との間の誤差、青と赤との間の誤差の感度(重み)よりも上げることにより、色空間上での誤差が表現される色に及ぼす影響を下げることができるものとなる。
このように、本発明によるデータ圧縮装置においては、新規な色空間の採用、新規な射影軸および閾値の決定方法を採用しており、また、伝送速度や画像内の局所領域に応じたパラメータの設定や対象画像の特徴に合わせた符号化パラメータを設定できるようにしている。これにより、本発明のデータ圧縮装置は、色情報の制御、コントラスト制御、注目領域の高画質化の3つのパラメータの適応制御が可能となる。
すなわち、本発明のデータ圧縮装置は、今までに無い色空間を採用すると共に、新規な射影軸および閾値の決定方法を採用しており、従来のBTC符号化方式によるデータ圧縮装置と比較して処理負荷が軽く、そのため、高速処理が可能となっており、処理能力の低い処理装置においても十分に実用的な圧縮処理が可能となる。また、自動あるいは手動によるパラメータ制御が可能な適応型圧縮機能を備えているので、通信速度が変動する場合であっても、常にその時点における通信速度を最大限有効利用して通信者の要求を満たした画像のBTC符号化が可能である。
また、注目領域についてのみ高画質化することができるので、従来のように、画像全体を高画質化するわけではないので、画像の符号量の増大を抑えることができる。また、色情報量の制御により情報量が少ない領域の符号量を削減することができ、画像全体としての符号量を削減可能である。更に、コントラスト制御により文字などの認識率が向上するものとなっている。
以下、図面にしたがって発明を実施するための最良の形態について説明する。
図1は、本発明において基礎となるBTC符号化(復号化)方式によるデータ圧縮処理およびデータ復元処理を示すフローチャートである。図1(a)は圧縮処理のフローチャートを示しており、図1(b)は復元処理のフローチャートを示している。圧縮処理について説明すると、圧縮処理では、まず、S10において、1枚の画像をn画素×n画素からなる複数のブロックに分ける。n、nは任意の正数である。次に、S11において、各ブロックに属する画素をmクラスに分類する。mは1以上の任意の正数であり、本発明においては、後述するように、パラメータの設定制御により、ブロック毎に異なって用いられる。
次に、S12において、分類された各画素を0〜(m−1)で表現してクラスマップを作り、それをデータ圧縮してコード化する。m=2の場合、クラスマップは、後述する図2(b)に例示するように、1画素当たり1ビットのビットマップデータとなる。次に、S13において、各クラスを代表する値(色データ)をデータ圧縮してコード化する。そして、次のS14において、上記S12、S13の結果を1つのデータストリームにまとめる。
続いて、図1(b)のフローチャートを参照して、復元(復号、伸張)処理を説明すると、復元処理では、まず、S15において、1つのブロックについて、クラス代表値のデータが圧縮されたコードとクラスマップのデータが圧縮されたコードからクラスマップおよびクラス代表値を復元する。次に、S16において、クラスマップを参照してブロックの各画素の値にクラス代表値を割り当てる。そして、S17において、全てのブロックの復元処理が完了したか否かを判定し、その結果が否定の場合にはS15に戻り、S15からの処理を続けるが、肯定の場合にはS18に移行する。
S18においては後処理を行う。即ち、復元時のブロック間のブロック歪みを是正するために、隣のブロックとの間で平滑化フィルタ処理を行う。このフィルタ処理では、隣のブロックのクラス代表値と自分のブロックのクラス代表値とをS空間での線分で結び、画素数に基づく距離と比例するように、その線分を内分して色を定める。但し、ビットマッププレーンの同じレベルが連続していて、クラス代表値の差がS空間上での距離で許容誤差δ以下の範囲のときに限定する。これにより、文字画像等がボケることがなく、ブロック歪みを改善できる。
図2は、本発明において処理される画像データおよびクラスマップの構成を示す説明図である。図2(a)は注目領域を高画質化する場合のブロック化した画像データを説明する図であり、図2(b)は白黒画像データにおけるクラスマップの構成を説明する図である。注目領域を高画質化する場合には、例えば、中心部を高画質化する場合、図2(a)に示すように、ブロックに分ける場合の中心部のn、nの値は周辺部の1/2(例えば4分割)とする。このようなブロック化により、少ないデータ量でも、中心部分では細かく識別できるので、見たいものを短時間で探せるようになる。なお、3段階以上の細分化を行ってもよく、分割ステップも1/2以外であってもよい。
次に、図1により説明した圧縮処理および復元処理におけるそれぞれの処理ステップの詳細について説明する。
図3は、ブロック分割処理(S10)を詳細に示すフローチャートである。図3に示すように、ブロック分割処理では、まず、S20において、1枚の画像をn画素×n画素からなるブロックに分ける。例えば、n=n=8とする。次に、S21において、設定されている制御パラメータを参照して、注目領域を高画質化するか否かを判定し、判定結果が肯定の場合には、S22に移行する。そして、S22において、画像の中心部分あるいは動画において動きのある領域などの特定の領域のブロックを更に細分化する。
図4は、本発明において採用する色空間であるS空間を説明する説明図である。この表色系S(S空間)は、x−y平面でN(無彩色)を原点とし、R(赤),Y(黄),G(緑),B(青)のデータに基づいてx,yが下記の式で定義される色相と彩度を表す平面であり、z軸は明度を表している。
Figure 2005304010
ここで、R,G,BはRGBカラー画像の赤色成分,緑色成分,青色成分の各データであり、C,Cは正規化定数である。C,Cは、0≦R,G,B≦Maxとすると、以下のように定義する。
Figure 2005304010
なお、RGB空間(表色系)をS空間に変換する処理において、x,y,zを正整数として演算した場合には、暗いところに暗い人物がいる場合などには情報が量子化誤差の範囲内に埋もれてしまい、情報が欠落してしまうという問題点があるが、この場合、上記のような場合に人物をはっきり見たいときには、次のような感度増加処理を行う。まず、上記S空間の係数を下記のようにf倍に感度を上げる。
Figure 2005304010
そこでmクラスに分類した後、それぞれの代表色のzの値を、明るい方には+fを、暗い方には−fを加えることで、コントラストを増した後、代表値のx,y,zを1/fにして元の感度に戻す。このような処理を施すことにより、同じ情報量で必要な情報を伝送することができる。
図5は、クラス分類処理(S11)を詳細に示すフローチャートである。図5に示すように、クラス分類処理では、まず、S30において、制御パラメータを参照するか、あるいは画像データの属性をチェックすることによってカラー画像か否かを判定し、結果が肯定の場合にはS31に移行するが、否定の場合にはS35に移行する。そして、S31において、RGB空間(表色系)を前述したS空間に変換する。次に、S32において、射影軸に基づいてクラス分類を行うか否かを判定し、射影軸に基づいてクラス分類を行う場合には、S34において、後述するように、射影軸を求める処理を行う。また、射影軸に基づいてクラス分類を行わない場合には、S33において、画素を直接mクラスに分類する分類処理を行う。例えば、直接n×n画素を、mクラスに分類する。分類処理としては、具体的に、公知のk-means法などが利用できる。
次に、S34において、射影軸を求める。この射影軸を求める処理については、後に詳述する。そして、次に、S35に移行して、射影軸上における(最大値−最小値)=Dを求める。S36において、Dが所定値より大きい(色に差がある)か否かを判定し、判定結果が否定の場合にはS37に移行するが、肯定の場合にはS38に移行する。S37に移行した場合、S37において、m=1、即ちクラス数=色の数を1に設定する。m=1の場合は、ブロック内は全て同色であるのでクラスマップが不要となり、データ量が減少する。
S38に移行した場合、S38おいては、画素をmクラスに分類する閾値を求める処理を行う。クラス分類を行うm値化のための閾値は、例えば、非特許文献1に記載されている公知の大津の方法を利用して求めることができる。また、非特許文献2に記載されている公知のKittler や栗田の閾値にバイアス項を付加して修正した関田の方法により求めることもできる(非特許文献1,非特許文献2)。しかし、これらの方法は処理負荷が重い。そこで、簡略的には平均値を2値化の閾値とする。このように平均値を採用することによって上記の方法よりも処理負荷が軽減される。そして、求めた閾値を境にして画素をmクラスに分類する。
なお、後述するように、視覚障害者の外出支援や聴覚障害者遠隔支援のためにデータ圧縮装置を適用する場合には、信号機の色や黒板やチョークの色が鮮明であることが望ましい。このようなときには、パラメータ制御の処理により、強制的にクラスをx−y平面上においてR(赤),Y(黄),BG(青緑),N(無彩色)の4色に分類するように構成する。また、注目領域を高画質化するためには、特定の領域のmの値、即ち色の数を大きく(例えば3あるいは4と)する。
次に、S40において、例えば設定されているパラメータを参照することにより、コントラストを強調するか否かを判定する。ここでのコントラスト強調処理は、例えば白地に黒で印刷された文字等を鮮明に見たい場合などに行うコントラストの強調処理である。そして、この判定結果が肯定の場合にはS41に移行するが、否定の場合にはS42に移行して、それぞれの処理を行う。
なお、このコントラスト強調のオン/オフを自動化することもできる。この場合の処理の例として、例えば、m=1の場合に、平均値が黒または白に近い場合にはオンとする処理を行うようにして自動化する。また、m=2の場合には、x、yの分散と平均が小さく、zの分散が大きいときには白(黒)背景に黒(白)の文字と判断してオンとする処理を行うようにして自動化する。
コントラスト強調を行わない判定の場合には、S42において、各クラスの代表色を求める。すなわち、この場合、閾値によってm個のクラスに分類された画素の各クラス毎の平均をそのクラスの代表色とする。
また、コントラスト強調を行う判定の場合には、S41において、m=1か否かが判定され、結果が肯定(1色)の場合にはS44に移行して、代表色を白または黒のみとするが、否定の場合にはS43に移行する。S43において、各クラスの代表色を白と黒(m=2の場合)にして、代表色の情報をコード化しない。この処理によって視認性を高めると同時に、データ圧縮率を高めることができる。
図6は、クラス分類処理(S11)における射影軸決定処理(S34)を詳細に示すフローチャートである。ここで閾値を求めるための射影軸の求め方について説明する。射影による2乗誤差が最小なものは主成分分析の主軸である。但し、主成分分析を使う方法は処理の負荷が重くなる。そこで、図6のフローチャートに示すような処理により、準最適な方法により射影軸を決定する処理を行う。この処理では、まず、S45において、各x,y,z軸毎に分散を求める。次に、S46において、最大の分散を持つ軸を射影軸に選定する。この方法によって、軸を求める計算量が1/2以下になる。この方法は最大の分散を持つ軸に射影していることに相当する。
図7は、クラスマップ作成処理(S12)を詳細に示すフローチャートである。このクラスマップ作成処理では、まず、S50において、分類された各画素を0〜(m−1)で表現してクラスマップを作る。前述した図2(b)には、m=2(ブロックサイズ=8×8)の場合のクラスマップの内容例を示している。図示されるように、例えば、m=2の場合には、クラスマップは1画素当たり1ビットのビットマップデータとなっている。なお、m=1(1色)の場合にはクラスマップは作成されない。
次に、S51において、m=2か否かが判定され、結果が肯定の場合にはS52に移行するが、否定の場合にはS53に移行する。S52においては、公知のビットマップ用のデータ圧縮手法によりデータ圧縮を行う。2値データの情報量に基づいて動的に圧縮を行う方法として、例えば、MELコード方式を用いることができる。MELコードは、ハフマン符号化における各通報の出現確率に起因する冗長性が抑制されており、さらに、算術符号型により、符号語のためのメモリサイズを少なくできる。また、MELコードに限らず、JBIG2やJPEG2000で使用される公知のMQ−Coderなど、2値画像の圧縮符号化方式なら何でも適用可能である。
S51の判定においてm=2の判定結果が否定の場合に、S53において、濃淡画像用のデータ圧縮手法によりデータ圧縮を行う。このデータ圧縮の一例として、例えば、JPEGやJPEG−LS、JPEG2000などによりデータ圧縮を行う。また、各画素をビットプレーンにスライスして、それぞれのプレーンをS52の処理と同様に符号化するようにしてもよい。なお、S52、53におけるデータ圧縮の圧縮方式としては、例えばZIP,LZW,PACKBITSなど、画像ではなく一般的なデータの圧縮符号化方式を採用してもよい。
なお、代表色情報は、ブロックを1つの画素と見なすと、m=2の場合、通常1ブロックに2つの代表色が存在する。そこで、輝度の大きな方の代表色のみおよび輝度の小さな方の代表色のみを集めたものをそれぞれ1つのカラー画像データとみなすことができる。したがって、これらのカラー画像データを公知の方法によってデータ圧縮する。
図8は、クラス代表値圧縮処理(S13)の詳細な処理を示すフローチャートである。クラス代表値圧縮処理について説明する。このクラス代表値圧縮処理では、まず、S60において、公知のコンテクストモデリングの処理を行う。このコンテクストモデリングの処理では、注目画素の周辺の特定の画素値からコンテクストと言われる指標を求める。コンテクストの種類は、例えば、注目画素の周辺の4画素の相対値を量子化して、最初は729種類用意し、その後、冗長性等により削減する。コンテクストの種類に応じて注目画素の補正値を変え、注目画素の予測誤差のバイアスが0になるようにする。
次に、S61において、代表値を順に1つ抽出する。そして、S62において前値と同じであるか否かを判定する。この判定においては、ランモードでない場合には代表値が周辺の4画素と値が同じか否かが判定され、ランモードの場合には、代表値が左隣の画素の値と同じか否かが判定される。判定の結果が肯定の場合にはS63に移行するが、否定の場合にはS65に移行する。S63に移行した場合、S63において、ランモード(ランレングス符号化モード)にセットする。次に、S64において、ラン長を計数(カウンタを+1)してS70に移行する。
また、S65に移行した場合、S65において、ランモードをリセットする。次に、S66において、直前がランモードだったか否かを判定し、結果が否定の場合にはS68に移行するが、肯定の場合にはS67に移行して、S67において、予測誤差情報の伝送中に割り込ませて伝送するラン長データを符号化する。そして、次のS68において、予測器処理を行う。S69においては、予測誤差を符号化する。
クラス代表値の表現形式としては、階調が多値である場合に対応したものが利用される。このため、クラス代表値の可逆符号化には、表現形式、圧縮率、処理の容易さなどの観点から予測符号化、ゴーロム符号化の組み合わせを用い、予測器により求められた予測値と実際の画素値との差分をゴーロム符号化を用いて符号化する。この符号化方式は、次のような3点の特徴を挙げることができる。
(1)符号化復号化が単純なため、高速な処理が可能。
(2)単純な処理にしては、高圧縮が望める。
(3)パラメータ指定により、可逆符号化の他に、復号画像の画素値が誤差範囲内に必ず収まる準可逆符号化も可能。
ゴーロム符号においては、極端に長い符号が現れるのを防ぐために有限長ゴーロム符号化を行う。有限長ゴーロム符号化では、ゴーロム符号化の対象となるデータ群がある限られた範囲に収まっている場合に、符号語の最大長を定めることにより極端に長い符号語が現れる弊害を防ぐことができる。極端に長い符号が出現するときは、有限長ゴーロム符号化をし、その他は通常のゴーロム符号化を行う。
そして、次のS70において、全ての代表値の処理が完了したか否かを判定し、処理が完了していれば、ここでの処理を終了する。この判定結果が否定の場合にはS61に戻る。なお、圧縮手法としては、例えばTIFF(LZW)、JPEG2000など、上記方法以外の可逆圧縮手法でもよいし、例えば非可逆圧縮手法(例えばJPEG−LS)によりコード化してもよい。
図9は、本発明によるデータ圧縮方法において圧縮された画像データのデータ構造の例を示す説明図である。図9(a)は、各ブロック毎にクラスマップデータとクラス代表値データとを組み合わせて収納しているデータ構造の例であり、図9(b)は、クラスマップデータとクラス代表値データ毎にまとめて収納しているデータ構造の例である。
図10は、本発明によるデータ圧縮装置におけるパラメータ制御処理を説明するフローチャートである。このパラメータ制御処理は、データ圧縮装置を利用する場合において、予め実行され、また、環境の状態に変化が生じた場合に必要に応じてその都度実行される。この処理では、まず、S80においてデータ伝送速度を測定する。例えば、単位時間当たりの伝送成功パケット数などから、データ伝送速度を測定する。次に、S81において、復元装置から送信されるモード情報等を受信し、S82において、伝送速度情報およびモード情報に基づいて、各種の制御パラメータを決定する。制御パラメータとしては、例えば画像サイズ(解像度)、ブロックサイズ、カラー/モノクロ指定、クラス数(m)、階調数、文字用コントラスト強調、暗画像用コントラスト増幅、高画質化、高画質化領域、交通信号用変換処理、伝送速度などが用いられる。各モードおよび伝送速度情報に基づき各パラメータをどのような値に設定するかは実験等を行うことにより決定する。
図11は、本発明によるデータ圧縮装置を利用する視覚障害者遠隔支援システムの構成例を示すブロック図である。ここに利用されるデータ圧縮装置においては、上述したパラメータ制御処理が、所定のタイミングの割り込み処理により実行される。システム構成について説明すると、図11において、カメラ20は、例えば、視覚障害者の頭部やめがねなどに装着され、視覚障害者の視線の方向の画像を撮像して動画データとして出力する。圧縮装置21は、本発明によるデータ圧縮装置であり、データ圧縮処理を行う。したがって、カメラ20から入力される画像データは、データ圧縮処理が実行される。なお、圧縮パラメータは前述した処理方法によって動的に適応制御される。
この圧縮装置21としては、CPUを含む専用のハードウェアを設計、製造してもよいが、市販のノートパソコン、PDA、ウェアラブルコンピュータ携帯電話機など携帯できるデータ処理装置において本発明によるデータ圧縮処理を実行するためのプログラムをインストールすることによって実現することもできる。また、市販されている周知の携帯電話機22および30は、圧縮装置21と支援用の復元装置31との間のデータ通信機能および音声による通話機能を提供する。スピーカ23、32およびマイク24、33は別に装備してもよいし、携帯電話機に内蔵されているものを使用してもよい。
復元装置31は、圧縮装置21によりデータ圧縮処理されたデータを復元処理する処理装置であり、例えば、遠隔地にいる支援者が使用する周知のパソコンに本発明によるデータ復元処理を実行するためのプログラムをインストールすることにより実現できる。表示器34は復元した画像を表示する。表示器34、操作パネル35はそれぞれパソコンのディスプレイおよびキーボード、マウスであってもよい。支援者は表示器の画像を見ながら視覚障害者と会話し、必要な情報を音声で伝達する。
また、支援者は必要に応じて操作パネルからモード情報を入力することによって画像の圧縮モードを直接指定することができる。圧縮モードとしては、カラーモード、モノクロモード、文字モード、色優先モード、特定領域高画質モードなどがある。
カラーモードは通常のモードであり、色数の自動制御機能を含んでいる。また、色優先モード、特定領域高画質モードとの組み合わせも可能である。色優先モードは、形状情報よりも色情報を優先させるモードであり、ブロックを小さくして色数は1とすることにより、クラスマップ情報を送らないので、同じ情報量でも正確な色情報を送れるモードである。代表色はS空間上での最頻値としてもよい。モノクロモードは輝度(濃淡)情報のみとすることにより、同じ情報量で形状等の情報をより詳細に送るモードである。
文字モードは色情報を伝送せずに代表色を強制的に白あるいは黒とすることによりコントラストを強調して文字を認識しやすくするモードである。なお、色情報をR、BG(青緑)、Y、Nの4色のみとしてもよく、この場合には代表色情報を2ビットで伝送可能である。特定領域高画質モードは例えば画像の中心部のみ、支援者の指定した領域のみ、あるいは画像の動き、変化のある領域を自動的に検出してそのブロックを更に細分化して、データ量の増加を抑えながら高画質化するモードである。
本発明において基礎となるBTC符号化(復号化)方式によるデータ圧縮処理およびデータ復元処理を示すフローチャートである。 本発明において処理される画像データおよびクラスマップの構成を示す説明図である。 ブロック分割処理(S10)を詳細に示すフローチャートである。 本発明において採用する色空間であるS空間を説明する説明図である。 クラス分類処理(S11)を詳細に示すフローチャートである。 クラス分類処理(S11)における射影軸決定処理(S34)を詳細に示すフローチャートである。 クラスマップ作成処理(S12)を詳細に示すフローチャートである。 クラス代表値圧縮処理(S13)の詳細な処理を示すフローチャートである。 本発明によるデータ圧縮方法において圧縮された画像データの構造例を示す説明図である。 本発明によるデータ圧縮装置におけるパラメータ制御処理を説明するフローチャートである。 本発明によるデータ圧縮装置を利用する視覚障害者遠隔支援システムの構成例を示すブロック図である。
符号の説明
10 画像データ
11、12、13 ブロック
14 画素のクラス値
20 カメラ
21 圧縮装置
22、30 携帯電話機
23、32 スピーカ
24、33 マイク
31 復元装置
34 表示器
35 操作パネル

Claims (12)

  1. データ圧縮する画像データを複数のブロックに分割するブロック分割処理手段と、
    前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理手段と、
    分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第1コード化処理手段と、
    各クラスを代表する代表値をデータ圧縮しコード化する第2コード化処理手段と、
    前記コード化したクラスマップのデータおよび代表値のデータを1つのデータストリームにまとめる統合処理手段と
    を備えるデータ圧縮装置において、
    RGBカラー画像のRGBデータを所定の表色系の色空間の色データに変換する色変換手段を備え、
    前記クラス分類処理手段は前記色変換手段によりデータ圧縮する画像データを色変換した後に複数のクラスに分類する分類処理を行う
    ことを特徴とするデータ圧縮装置。
  2. 請求項1に記載のデータ圧縮装置において、
    所定の表色系の色空間としては、カラー画像を表現する3つの直交座標軸として、青から黄への座標軸である第1軸、緑から赤への座標軸である第2軸、明るさを表す座標軸である第3軸を用い、第1軸および第2軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いる
    ことを特徴とするデータ圧縮装置。
  3. 請求項1に記載のデータ圧縮装置において、
    所定の表色系の色空間として下記の数式1で表された3つのx,y,zの座標軸で表現される色空間を用いることを特徴とするデータ圧縮装置。
    Figure 2005304010
    ここで、R,G,BはRGBカラー画像の赤色成分,緑色成分,青色成分の各データであり、C,Cは正規化定数である。
  4. 請求項3に記載のデータ圧縮装置において、
    前記所定の表色系の色空間の空間軸のx,y,zの各軸について分散を求め、分散が最大の軸を射影軸として選定すると共に、クラスを判別する閾値として平均値を用いる
    ことを特徴とするデータ圧縮装置。
  5. 請求項3に記載のデータ圧縮装置において、
    各ブロックの画素を分類するクラスは、x−y平面上においてR(赤),Y(黄),BG(青緑),N(無彩色)の4色に分類する
    ことを特徴とするデータ圧縮装置。
  6. 請求項1に記載のデータ圧縮装置において、
    射影軸に基づいてクラス分類を行う場合に射影軸上の最大値と最小値との差情報に基づいてクラスの色数を制御する
    を特徴とするデータ圧縮装置。
  7. 請求項1に記載のデータ圧縮装置において、
    各クラスを代表するクラスの代表値を強制的に白および黒にする
    を特徴とするデータ圧縮装置。
  8. 請求項1に記載のデータ圧縮装置において、
    前記ブロック分割処理手段は指定された特定の領域のブロックサイズを細分化する
    ことを特徴とするデータ圧縮装置。
  9. 請求項1に記載のデータ圧縮装置において、更に、
    外部からのパラメータ指定あるいは測定された伝送速度に基づき、画像サイズ、ブロックサイズ、色数を含む符号化制御パラメータを動的に変更するパラメータ制御手段
    を備えたことを特徴とするデータ圧縮装置。
  10. データ圧縮する画像データを複数のブロックに分割するブロック分割処理ステップと、
    前ブロック分類処理により分割した各ブロックに属する画素を複数のクラスに分類するクラス分類処理ステップと、
    分類された各ブロックに属する画素を表現するクラスマップを作成し当該クラスマップをデータ圧縮してコード化する第1コード化処理ステップと、
    各クラスを代表する代表値をデータ圧縮しコード化する第2コード化処理ステップと、
    前記コード化したクラスマップのデータおよび代表値のデータを1つのデータストリームにまとめる統合処理ステップと、
    の処理をコンピュータの処理により実行するデータ圧縮方法であって、
    前記クラス分類処理ステップにおいては、データ圧縮する画像データのRGBカラー画像のRGBデータを所定の表色系の色空間の色データに変換する色変換ステップの処理を実行した後に複数のクラスに分類する分類処理を行う
    ことを特徴とするデータ圧縮方法。
  11. 請求項9に記載のデータ圧縮方法において、
    所定の表色系の色空間としては、カラー画像を表現する3つの直交座標軸として、青から黄への座標軸である第1軸、緑から赤への座標軸である第2軸、明るさを表す座標軸である第3軸を用い、第1軸および第2軸からつくられる平面上において、原点からの距離が彩度を表す空間を用いる
    ことを特徴とするデータ圧縮方法。
  12. 請求項9に記載のデータ圧縮方法において、
    所定の表色系の色空間として下記の数式1で表された3つのx,y,zの座標軸で表現される色空間を用いることを特徴とするデータ圧縮方法。
    Figure 2005304010
    ここで、R,G,BはRGBカラー画像の赤色成分,緑色成分,青色成分の各データであり、C,Cは正規化定数である。
JP2005080013A 2004-03-18 2005-03-18 データ圧縮装置およびデータ圧縮方法 Expired - Fee Related JP4411411B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005080013A JP4411411B2 (ja) 2004-03-18 2005-03-18 データ圧縮装置およびデータ圧縮方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004079134 2004-03-18
JP2005080013A JP4411411B2 (ja) 2004-03-18 2005-03-18 データ圧縮装置およびデータ圧縮方法

Publications (2)

Publication Number Publication Date
JP2005304010A true JP2005304010A (ja) 2005-10-27
JP4411411B2 JP4411411B2 (ja) 2010-02-10

Family

ID=35334947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005080013A Expired - Fee Related JP4411411B2 (ja) 2004-03-18 2005-03-18 データ圧縮装置およびデータ圧縮方法

Country Status (1)

Country Link
JP (1) JP4411411B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010074406A (ja) * 2008-09-17 2010-04-02 Konica Minolta Business Technologies Inc 画像処理方法、画像処理装置、および画像処理プログラム
JP2010076193A (ja) * 2008-09-25 2010-04-08 Fuji Xerox Co Ltd 画像形成装置および画像形成制御プログラム
JP2011015041A (ja) * 2009-06-30 2011-01-20 Konica Minolta Business Technologies Inc 画像処理方法、画像処理装置
US7876816B2 (en) 2005-10-31 2011-01-25 Fujitsu Semiconductor Limited Moving picture coding program, program storage medium, and coding apparatus

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7876816B2 (en) 2005-10-31 2011-01-25 Fujitsu Semiconductor Limited Moving picture coding program, program storage medium, and coding apparatus
JP2010074406A (ja) * 2008-09-17 2010-04-02 Konica Minolta Business Technologies Inc 画像処理方法、画像処理装置、および画像処理プログラム
JP2010076193A (ja) * 2008-09-25 2010-04-08 Fuji Xerox Co Ltd 画像形成装置および画像形成制御プログラム
JP4661932B2 (ja) * 2008-09-25 2011-03-30 富士ゼロックス株式会社 画像形成装置および画像形成制御プログラム
US8310728B2 (en) 2008-09-25 2012-11-13 Fuji Xerox Co., Ltd. Image forming apparatus and computer readable medium for controlling image form
JP2011015041A (ja) * 2009-06-30 2011-01-20 Konica Minolta Business Technologies Inc 画像処理方法、画像処理装置

Also Published As

Publication number Publication date
JP4411411B2 (ja) 2010-02-10

Similar Documents

Publication Publication Date Title
EP1598781B1 (en) Adaptive compression of multi-level images
CN108696761B (zh) 一种图片文件处理方法及其设备、系统
EP3367657A1 (en) Image signal conversion method and apparatus, and terminal device
JP5208218B2 (ja) 画像符号化装置、デジタルスチルカメラ、デジタルビデオカメラ、撮像素子、および画像符号化方法
US7668383B2 (en) Image processing, compressing, decompressing, transmitting, sending and receiving devices and methods, programs thereof and displaying device
JP2000050268A (ja) 画像符号化装置
US8917931B2 (en) Color conversion based on an HVS model
US5491564A (en) Data compression method and apparatus for binary image using Markov model encoding
JP4411411B2 (ja) データ圧縮装置およびデータ圧縮方法
CN109151503B (zh) 一种图片文件处理方法及其设备
JP2016213527A (ja) 画像符号化装置、画像処理装置、画像符号化方法
JP4552400B2 (ja) 画像表示装置、画像表示方法及び画像表示プログラム
CN112887722A (zh) 一种图像无损压缩方法
JP2007295130A (ja) 画像データ符号化装置、プログラム、コンピュータ読み取り可能な記録媒体、及び画像データ符号化方法
JP2019140477A (ja) 画像符号化装置、画像符号化方法、画像符号化システム、記録媒体
JP2009027556A (ja) 画像処理回路
US20210019915A1 (en) Processing display data
JP4419136B2 (ja) 画像符号化装置、画像符号化方法及びそのプログラム
JP4011580B2 (ja) 画像データ伝送システム
JP2002290763A (ja) 画像処理方法及び画像処理装置
JP2005086226A (ja) 撮像装置
JP2003299120A (ja) カラー画像圧縮方法
CN116156177A (zh) 图像编码或解码或处理的方法、装置、设备及介质
JP2000092328A (ja) 可逆符号化方法
JPH0795412A (ja) 画像データ圧縮方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091013

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4411411

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees