JP2969047B2 - データ圧縮装置 - Google Patents

データ圧縮装置

Info

Publication number
JP2969047B2
JP2969047B2 JP6152006A JP15200694A JP2969047B2 JP 2969047 B2 JP2969047 B2 JP 2969047B2 JP 6152006 A JP6152006 A JP 6152006A JP 15200694 A JP15200694 A JP 15200694A JP 2969047 B2 JP2969047 B2 JP 2969047B2
Authority
JP
Japan
Prior art keywords
data
audio data
discrete cosine
cosine transform
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6152006A
Other languages
English (en)
Other versions
JPH0816192A (ja
Inventor
彰 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kanebo Ltd
Original Assignee
Kanebo Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kanebo Ltd filed Critical Kanebo Ltd
Priority to JP6152006A priority Critical patent/JP2969047B2/ja
Publication of JPH0816192A publication Critical patent/JPH0816192A/ja
Application granted granted Critical
Publication of JP2969047B2 publication Critical patent/JP2969047B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ圧縮を行うデー
タ圧縮装置およびデータ圧縮方法に関する。
【0002】
【従来の技術】従来より、情報通信においてデータの伝
送量を削減して通信効率を高めるために、種々のデータ
圧縮技術が開発されている。画像データの圧縮技術とし
ては、例えば離散コサイン変換(DCT)方式が国際標
準の1つとして採用されている。
【0003】一方、音声データ(オーディオデータ)の
圧縮技術としては、例えば適応差分PCM(ADPC
M)方式がある。この適応差分PCM方式では、高品質
の音声が得られるが、量子化ビット数はあまり削減でき
ない。
【0004】そこで、音声データの高能率なデータ圧縮
を実現するために、特開平6−67699号公報に二次
元離散コサイン変換を音声データに適用する方法が開示
されている。
【0005】ここで、まず、図25〜図27を参照しな
がら画像データ圧縮のために用いられる二次元離散コサ
イン変換方式について説明する。図25は離散コサイン
変換方式を実行するためのシステムの基本構成を示すブ
ロック図である。
【0006】符号化側では、DCT装置100が、入力
される原画像データの二次元離散コサイン変換を行い、
DCT係数を出力する。量子化器200は、量子化テー
ブル400を参照してDCT係数に量子化処理を行い、
量子化されたDCT係数(以下、量子化DCT係数と呼
ぶ)を出力する。エントロピー符号化器300は、符号
化テーブル500を参照して量子化DCT係数にエント
ロピー符号化処理を行い、圧縮データを出力する。エン
トロピー符号化の方式としてハフマン符号化方式が用い
られる。
【0007】復号化側では、エントロピー復号器600
が、符号化テーブル500を参照して圧縮データにエン
トロピー復号化処理を行い、量子化DCT係数を出力す
る。逆量子化器700は、量子化テーブル400を参照
して量子化DCT係数に逆量子化処理を行い、DCT係
数を出力する。逆DCT装置800は、DCT係数に逆
二次元離散コサイン変換を行い、再生画像データを出力
する。
【0008】次に、二次元離散コサイン変換方法を説明
する。まず、図26に示すように、画像データを複数の
8×8画素ブロックに分割する。図27に示すように、
1つの8×8画素ブロック内の各画素データの値をP
X Y (X,Y=0,…,7)で示す。ここで、X,Yが
ブロック内の画素データの位置を表わしている。
【0009】分割された各8×8画素ブロックに対し
て、数1による二次元離散コサイン変換を行う。
【0010】
【数1】
【0011】ここで、SU V (U,V=0,…,7)は
DCT係数を表わし、U,VはDCT係数の位置を表わ
す。U=V=0の場合にはCU =CV =1/√2とな
り、その他の場合にはCU =CV =1となる。さらに、
画素データPX Y のビット精度が8ビットの場合にはL
S =128となり、画素データPX Y のビット精度が1
2ビットの場合にはLS =2048となる。
【0012】二次元離散コサイン変換の結果、64個の
DCT係数SU V が得られる。DCT係数S0 0 はDC
係数と呼ばれ、残りの63個DCT係数はAC係数と呼
ばれる。
【0013】DC係数は8×8画素データの平均値(直
流成分)を示している。数1に示されるように、各画素
データPX Y よりLS を引くことにより、DC係数の期
待値を0にレベルシフトしている。
【0014】図27に示すように、二次元離散コサイン
変換されたブロックの左上および右下がそれぞれDCT
係数S0 0 ,S7 7 に対応している。二次元離散コサイ
ン変換されたブロックの左から右に進むにつれて高周波
の水平周波数成分を多く含み、上から下に進むにつれて
高周波の垂直周波数成分を多く含むことになる。
【0015】一方、数2に示す逆二次元離散コサイン変
換によりDCT係数SU V から64個の画素データP
X Y (X,Y=0,…,7)を得ることができる。
【0016】
【数2】
【0017】数2に示されるように、各画素データにL
S を加えることにより、レベルシフト分を元に戻してい
る。DCT係数SU V は、係数位置ごとに異なる量子化
テーブルQU V を用いて、数3により線型量子化され、
量子化DCT係数rU V が得られる。
【0018】
【数3】rU V =round(SU V /QU V ) roundは、最も近い整数への整数化を意味する。
【0019】復号化側では、逆量子化が行われる。ハフ
マン復号化で得られた量子化DCT係数をrU V とする
と、数4により逆量子化を行う。
【0020】
【数4】SU V =rU V ×QU V 量子化テーブルQU V の値を変化させることにより画質
を制御することができる。量子化テーブルQU V の値を
小さく設定すると、量子化DCT係数rU V の値が大き
くなり、画質の良い画像を符号化することができる。逆
に、量子化テーブルQU V の値を大きく設定すると、量
子化DCT係数rU V の値が小さくなり、符号化情報量
は減少するが、画質は劣化する。
【0021】このように、量子化テーブルQU V の値を
変えることにより、画質および符号化情報を自由に制御
することができる。次に、特開平6−67699号公報
に開示された二次元離散コサイン変換を用いた音声デー
タの圧縮方法を図28を参照して説明する。
【0022】図28の(a)に示すように、一連の音声
データをD1,D2,…,D64とする。音声データは
一次元性を有するので、そのままの形では二次元離散コ
サイン変換を行うことはできない。
【0023】そこで、図28の(b)に示すように、一
連の音声データD1,D2,…,D64を例えば8×8
のマトリクスに配列し、疑似的に二次元マトリクスを形
成する。ここで、マトリクスのX方向の座標およびY方
向の座標をそれじれX=0,1,…,7、Y=0,1,
…,7とする。
【0024】まず、マトリクスのY=0の行に音声デー
タD1,D2,…,D8をX方向に順に配列し、Y=1
の行に音声データD9,D10,…,D15をX方向に
順に配列する。同様にして、Y=2,3,…,7の各行
に音声データD17,D18,…,D64をX方向に順
に配列する。このようにして、音声データD1,D2,
…,D64が二次元マトリクスに配列される。
【0025】このようにして配列された音声データD
1,D2,…,D64に上記の二次元離散コサイン変換
を行うことにより音声データを圧縮することができる。
【0026】
【発明が解決しようとする課題】しかしながら、図28
に示した従来の音声データ圧縮方法においては、X方向
に隣接する音声データどうしは相互に相関性を有する
が、Y方向に隣接する音声データどうしは相関性を有し
ない。すなわち、X方向には連続する音声データが順に
配列されているが、Y方向には全く関連のない音声デー
タが配列されることになる。したがって、このように配
列された音声データに二次元離散コサイン変換を行った
場合、圧縮比をあまり大きくすることができないという
問題がある。
【0027】一方、音声データの聴覚重み付け符号化に
おいて、符号データのデータ長を一定の長さ以下に固定
化するように重み付けを行った場合、音声データの内容
によって良い音質および悪い音質が出現するという問題
がある。
【0028】さらに、図25に示した方式では、DCT
係数の量子化処理においてデータ量が削減されるが、そ
の量子化処理により量子化誤差が生じるという問題があ
る。それゆえに、本発明の目的は、高い音質を維持しつ
つ圧縮率が向上された音声データの圧縮装置を提供する
ことである。
【0029】本発明の他の目的は、高い音質を維持しつ
つデータ長を一定の長さ以下に固定化しかつデータ長を
短縮することができる音声データの圧縮方法を提供する
ことである。
【0030】本発明のさらに他の目的は、量子化誤差が
低減された画像データおよび音声データの圧縮装置を提
供することである。
【0031】
【課題を解決するための手段】(1)第1の発明 第1の発明に係るデータ圧縮装置は、配列手段および変
換手段を備える。配列手段は、一連の音声データを水平
方向および垂直方向に相関性を有するように二次元マト
リクスに配列する。変換手段は、配列手段により配列さ
れた二次元マトリクスの音声データに二次元離散コサイ
ン変換を行う。配列手段は、連続する音声データを水平
方向に順に配列しかつ垂直方向に1つずつシフトして一
連の音声データを水平方向および垂直方向に相関性を有
するように2次元マトリクスに配列してもよい。 配列手
段は、連続する音声データを水平方向に順に配列しかつ
垂直方向に2つずつシフトして一連の音声データを水平
方向および垂直方向に相関性を有するように2次元マト
リクスに配列してもよい。 配列手段は、連続する2つの
音声データの平均値を順に配列して一連の音声データを
水平方向および垂直方向に相関性を有するように2次元
マトリクスに配列してもよい。
【0032】(2)第2の発明 第2の発明に係るデータ圧縮方法は、一連の音声データ
を複数の周波数帯域に分割し、その分割により得られた
各周波数帯域の音声データを二次元マトリクスに配列す
る。各周波数帯域ごとに二次元マトリクスの音声データ
に二次元離散コサイン変換を行い、二次元離散コサイン
変換により得られた各周波数帯域ごとのデータから主た
るデータを所定の選択条件で選択する。符号データの長
さが所定の長さ以下に固定化されるように選択条件を修
正しつつ選択された主たるデータを符号化する。
【0033】(3)第3の発明 第3の発明に係るデータ圧縮装置は、第1の変換手段、
分離手段、第2の変換手段、第1の符号化手段および第
2の符号化手段を備える。
【0034】第1の変換手段は、mビットのデータに二
次元離散コサイン変換を行ってnビットのデータを得
る。分離手段は、第1の変換手段により得られたnビッ
トのデータを上位n−kビットのデータおよび下位kビ
ットのデータに分離する。第2の変換手段は、分離手段
により得られた下位kビットのデータに二次元離散コサ
イン変換を行う。第1の符号化手段は、第2の変換手段
により得られたデータを符号化する。第2の符号化手段
は、分離手段により得られた上位n−kビットのデータ
を符号化する。
【0035】第1の変換手段および第2の変換手段は1
つの変換手段で兼用してもよい。また、第1の符号化手
段および第2の符号化手段は1つの符号化手段で兼用し
てもよい。
【0036】
【作用】
(1)第1の発明 第1の発明に係るデータ圧縮装置においては、一連の音
声データが水平方向および垂直方向に相関性を有するよ
うに配列が行われるので、二次元離散コサイン変換にお
いて高い圧縮率が得られる。したがって、音声データの
圧縮において、高い音質を維持しつつ圧縮率を向上させ
ることが可能となる。
【0037】(2)第2の発明 第2の発明に係るデータ圧縮方法においては、一連の音
声データが複数の周波数帯域に分割され、各周波数帯域
ごとに二次元離散コサイン変換、主たるデータの選択お
よび符号化が行われる。その際、符号データのデータ長
が所定の長さ以下に固定化されるように、選択条件を修
正しつつ符号化が行われるので、高い音質を維持しつつ
データ長を一定の長さ以下に固定化しかつデータ長を短
縮することができる。
【0038】(3)第3の発明 第3の発明に係るデータ圧縮装置においては、mビット
のデータに二次元離散コサイン変換が行われ、nビット
(n>m)のデータ(DCT係数)が得られる。nビッ
トのデータは、上位n−kビットのデータと下位kビッ
トのデータとに分離される。下位kビットのデータは再
び二次元離散コサイン変換された後、符号化される。上
位n−kビットのデータはそのまま符号化される。
【0039】二次元離散コサイン変換により得られたn
ビットのデータを量子化因子で量子化した場合、下位k
ビットのデータは量子化誤差となる。第3の発明に係る
データ圧縮装置においては、量子化誤差となる下位kビ
ットのデータに二次元離散コサイン変換を再び行うの
で、量子化誤差の発生がなくなり、データ圧縮による誤
差は二次元離散コサイン変換による誤差のみとなる。し
たがって、データ圧縮において、量子化誤差を低減する
ことができる。
【0040】
【実施例】
(1)第1の実施例 図1は第1の実施例によるDCT装置の構成を示すブロ
ック図である。図1において、DCT装置1は、A/D
変換器2、レジスタ3、マトリクス用メモリ4、アドレ
スセレクタ5および二次元DCT部6を含む。
【0041】A/D変換器2は、アナログ音声信号を一
連のディジタル音声データに変換してレジスタ3に与え
る。レジスタ3はその音声データを一時的に保持する。
マトリクス用メモリ4はN×N(Nは正の整数)の記憶
領域を有する。ここでは、マトリクス用メモリ4が8×
8の記憶領域を有するものとする。アドレスセレクタ5
はマトリクス用メモリ4のアドレス指定を行う。
【0042】レジスタ3に保持された音声データは、ア
ドレスセレクタ5のアドレス指定によりマトリクス用メ
モリ4内に順次書き込まれて配列される。また、アドレ
スセレクタ5のアドレス指定により順次音声データが読
み出され、二次元DCT部6に与えられる。二次元DC
T部6は、8×8の音声データに二次元離散コサイン変
換を行い、8×8のDCT係数を出力する。
【0043】次に、マトリクス用メモリ4における音声
データの配列方法を説明する。図2は音声データの第1
の配列方法を示す図である。図2において、マトリクス
用メモリ4のX方向のアドレスをX=0,1,…,7と
し、Y方向のアドレスをY=0,1,…,7とする。ま
た、一連の音声データをD0,D1,D2,…とする。
【0044】第1の配列方法では、Y=0の行に音声デ
ータD0,D1,…,D7をX方向に順に配列し、Y=
1の行に音声データD1,D2,…,D8をX方向に順
に配列し、Y=2の行に音声データD2,D3,…,D
9をX方向に順に配列する。同様にして、Y=3,4,
…,7の各行に先頭の音声データを1つずつシフトしな
がら連続する8個の音声データをX方向に順に配列す
る。
【0045】その結果、15個の音声データD0,D
1,…,D14がX方向およびY方向に相関性を有する
ように二次元に配列される。例えば、Y=0の行には連
続する音声データD0,D1,…,D7が配列され、X
=0の列にも連続する音声データD0,D1,…,D7
が配列される。この音声データの配列は、図1のアドレ
スセレクタ5によるアドレス指定により行われる。
【0046】このように、一連の音声データがX方向お
よびY方向に相関性を有するように配列されているの
で、これらの音声データを図1の二次元DCT部6によ
り二次元離散コサイン変換した場合、圧縮率が高くな
る。
【0047】二次元DCT部6により得られたDCT係
数は、必要に応じて図26に示した量子化器200によ
り量子化された後、エントロピー符号化器300により
ハフマン符号化される。それにより、ハフマン符号が得
られる。なお、量子化器200による量子化を行わなく
てもよい。
【0048】図3は音声データの第2の配列方法を示す
図である。第2の配列方法では、Y=0の行に音声デー
タD0,D1,…,D7をX方向に順に配列し、Y=1
の行に音声データD2,D3,…D9をX方向に順に配
列し、Y=2の行に音声データD4,D5,…,D11
をX方向に順に配列する。同様にして、先頭の音声デー
タを2つずつシフトしながらY=3,4,…,7の各行
に連続する8個の音声データをX方向に順に配列する。
【0049】その結果、X方向に連続する音声データが
順に配列され、Y方向に1つおきの音声データが順に配
列される。このようにして、22個の音声データD0,
D1,…,D21がX方向およびY方向に相関性を有す
るように二次元マトリクスに配列される。
【0050】第2の配列方法では、第1の配列方法に比
べてY方向の音声データの相関性が若干低くなるが、1
つのマトリクスに配列される音声データの数が増加す
る。図4は音声データの第3の配列方法を示す図であ
る。図4において、“+”は2つの音声データの平均を
表わしている。
【0051】第3の配列方法では、Y=0の行に音声デ
ータD0,D1の平均値,音声データD2,D3の平均
値,…,音声データD14,D15の平均値をX方向に
順に配列する。次に、Y=1の行に音声データD2,D
3の平均値,音声データD4,D5の平均値,…,音声
データD16,D17の平均値をX方向に順に配列す
る。さらに、Y=2の行に音声データD4,D5の平均
値,音声データD6,D7の平均値,…,音声データD
18,D19の平均値を順に配列する。同様にして、Y
=3,4,…,7の各行に連続する2つの音声データの
平均値を順に配列する。
【0052】このようにして、音声データD0,D1,
…,D29において各連続する2つの音声データの平均
値がX方向およびY方向に相関性を有するように配列さ
れる。第3の配列方法によれば、1つのマトリクスに配
列される音声データの数が30個となる。
【0053】図5、図6、図7、図8および図9はそれ
ぞれ1kHz、2.5kHz、5kHz、9kHzおよ
び17kHzの正弦波を40kHzでサンプリングして
図1のDCT装置1により二次元離散コサイン変換した
結果を示す。
【0054】図5に示すように、1kHzの正弦波のD
CT係数は低域に集中している。また、図6に示すよう
に、2.5kHzの正弦波のDCT係数は低域から中域
に分布しており、図7に示すように、5kHzの正弦波
のDCT係数は主として中域に分布しており、図8に示
すように、9kHzの正弦波のDCT係数は中域から高
域に分布している。さらに、図9に示すように、17k
Hzの正弦波のDCT係数は主として高域に分布してい
る。
【0055】このように、図1のDCT装置1によれ
ば、音声信号の周波数に応じてDCT係数がある周波数
領域に偏って現れるので、データの圧縮率が高くなる。
従来のADPCMによれば、音声データの圧縮比は1/
2となるが、第1の実施例によれば、音声データの圧縮
比は1/6となった。また、第1の実施例によれば、A
DPCMとほぼ同等のS/Nが得られ、音質はADPC
Mと同程度となった。
【0056】(2)第2の実施例 図10は本発明の第2の実施例によるデータ圧縮方法を
示す図である。まず、図10の(a)に示すように、Q
MF(Quartz Mirror Filter) 等を用いて音声データを
複数の帯域に分割する。ここでは、音声データの全帯域
を0〜20kHzとする。0〜20kHzの帯域を0〜
10kHzの帯域と10〜20kHzの帯域とに分割す
る。さらに、0〜10kHzの帯域を0〜5kHzの帯
域と5〜10kHzの帯域とに分割し、10〜20kH
zの帯域を10〜15kHzの帯域と15〜20kHz
の帯域とに分割する。このようにして、音声データを4
つの帯域に分割する。
【0057】次に、図10の(b)に示すように、分割
された帯域ごとに音声データを二次元マトリクスに配列
し、二次元離散コサイン変換を行ってDCT係数を得
る。二次元マトリクスへの配列方法は、第1の実施例に
おける配列方法を用いる。
【0058】さらに、図10の(c)に示すように、二
次元離散コサイン変換により得られた各帯域のDCT係
数から主たるDCT係数を、次の(A)〜(C)のいず
れかの方法を用いてあるいはそれらの方法を組み合わせ
て選択する。
【0059】(A)あるしきい値以上のDCT係数のみ
を選択する。 (B)DCT係数の二次元マトリクスを低域から高域に
かけて複数の領域に分割し、各領域内で代表的なDCT
係数を選択する。
【0060】(C)ある値以上の高周波数成分またはあ
る値以下の低周波成分を一律にカットして残りのDCT
係数を選択する。 各帯域ごとに上記の(A),(B),(C)のいずれか
または2つ以上を組み合わせてDCT係数の選択を行
う。
【0061】次に、ある帯域において選択されたDCT
係数を仮にハフマン符号化し、得られた符号データのデ
ータ長からすべての帯域の符号データのデータ長を推測
する。そして、図10の(d),(e)に示すように、
DCT係数の選択条件を修正することにより符号データ
のデータ長が所定の長さ以下になるようにデータ長を固
定化する。すなわち、方法(A)ではしきい値を変更
し、方法(B)では領域の分割方法を変更し、方法
(C)では高周波成分または低周波成分をカットする周
波数の値を変更する。修正された選択条件で、図10の
(c)示すDCT係数の選択を行う。
【0062】その後、図10の(d)に示すように、各
帯域において選択されたDCT係数をハフマン符号化
し、符号データを得る。このようにして、所定の長さ以
下のデータ長に固定化された符号データが得られる。
【0063】例えば、1kHzの正弦波をデータ圧縮す
る例を説明する。図11は1kHzの音声データを第1
の実施例の図2に示す方法で二次元マトリクスに配列し
た状態を示す。図11に示すように配列された音声デー
タに二次元離散コサイン変換を行うと、図12に示すよ
うなDCT係数が得られる。
【0064】図12に示すDCT係数は、主として低域
L1に集中している。したがって、上記の方法(C)を
用いて高域H1の高周波成分を一律にカットし、低域L
1の“1589”,“−299”,“−299”を選択
する。それにより、図13に示すようなDCT係数が得
られる。
【0065】図13のDCT係数を二次元逆離散コサイ
ン変換により復号化すると、図14に示すような音声デ
ータが得られる。図14に示す復号化後の音声データ
は、図11に示す二次元離散コサイン変換前の音声デー
タとほぼ一致していることがわかる。
【0066】図15は2.5kHzの音声データのDC
T係数に上記の方法(B)を適用した状態を示す図であ
る。図15に示すように、DCT係数のマトリクスを低
域L2、中域M2および高域H2に分割し、低域L2の
代表値“320”および中域M2の代表値“−389”
を選択する。それにより、図16に示すようなDCT係
数が得られる。
【0067】図17は5kHzの音声信号のDCT係数
に上記の(B)を適用した状態を示す図である。図17
に示すように、DCT係数のマトリクスを低域L3、中
域M3および高域H3に分割し、中域M3の代表値“8
60”および“−670”を選択する。それにより、図
18に示すDCT係数が得られる。
【0068】図19は9kHzの音声信号のDCT係数
に上記の方法(B)を適用した状態を示す図である。図
19に示すように、DCT係数のマトリクスを低域L
4、中域M4および高域H4に分割し、中域M4の代表
値“904”および高域H4の代表値“−723”を選
択する。それにより、図20に示すDCT係数が得られ
る。
【0069】図21は17kHzの音声データのDCT
係数に上記の方法(C)を適用した状態を示す図であ
る。図21に示すように、DCT係数のマトリクスにお
いて低域L5の周波数成分を一律にカットし、高域H5
の“707”,“708”,“−477”を選択する。
それにより、図22に示すDCT係数が得られる。
【0070】(3)第3の実施例 図23は第3の実施例によるデータ圧縮装置の構成の一
例を示すブロック図である。図23に示すように、デー
タ圧縮装置20は、二次元DCT部21,23、分離部
22およびハフマン符号化部24,25を含む。
【0071】まず、データ圧縮装置20による8ビット
の画像データのデータ圧縮を説明する。二次元DCT部
21は、8ビットの入力データに二次元離散コサイン変
換を行い、11ビットのデータ(DCT係数)を出力す
る。分離部22は、二次元DCT部21から出力された
11ビットのデータを量子化因子“128”で割ること
により、11ビットのデータを上位7ビットのデータお
よび下位4ビットのデータに分離する。下位4ビットの
データが量子化誤差となる。
【0072】二次元DCT部23は、分離部22により
得られた下位4ビットのデータに二次元離散コサイン変
換を行い、7ビットのデータ(DCT係数)を得る。ハ
フマン符号化部24は、二次元DCT部23により得ら
れた7ビットのデータにハフマン符号化を行い、下位側
の符号データDDを得る。
【0073】一方、ハフマン符号化部25は、分離部2
2により得られた上位7ビットのデータにハフマン符号
化を行い、上位側の符号データUDを得る。セレクタ2
6は、ハフマン符号化部25から得られた上位側の符号
データUDとハフマン符号化部24により得られた下位
側の符号データDDとを8×8のブロックごとに交互に
選択して伝送する。
【0074】図23において、括弧内のビット数は音声
データ(オーディオデータ)のビット数を示す。次に、
データ圧縮装置20による16ビットの音声データのデ
ータ圧縮を説明する。
【0075】二次元DCT部21は、16ビットの音声
データに二次元離散コサイン変換を行い、19ビットの
データ(DCT係数)を出力する。分離部22は、二次
元DCT部21から出力された19ビットのデータを上
位11ビットのデータと下位8ビットのデータとに分離
する。二次元DCT部23は、分離部22により得られ
た下位8ビットのデータに二次元離散コサイン変換を行
い、11ビットのデータ(DCT係数)を得る。ハフマ
ン符号化部24は、二次元DCT部23により得られた
11ビットのデータにハフマン符号化を行い、下位側の
符号データDDを出力する。
【0076】一方、ハフマン符号化部25は、分離部2
2により得られた上位11ビットのデータにハフマン符
号化を行い、上位側の符号データをUDを出力する。セ
レクタ26は、ハフマン符号化部25により得られた上
位側の符号データUDとハフマン符号化部24により得
られた下位側の符号データDDとを8×8のブロックご
とに交互に選択して伝送する。
【0077】このように、本実施例のデータ圧縮装置2
0では、従来の量子化において量子化誤差となる下位4
ビットのデータまたは下位8ビットのデータに再び二次
元離散コサイン変換を行った後、ハフマン符号化してい
るので、データ圧縮における誤差が二次元離散コサイン
変換による誤差のみとなる。したがって、高品質な画像
データまたは音声データが得られる。
【0078】図24は本発明の第3の実施例によるデー
タ圧縮装置の構成の他の例を示すブロック図である。図
24において、データ圧縮装置30は、セレクタ31,
34、二次元DCT部32、分離部33およびハフマン
符号化部35を含む。
【0079】ここでは、入力データが8ビットの画像デ
ータの場合を説明する。まず、セレクタ31が、その8
ビットの入力データを選択して出力する。二次元DCT
部32は、セレクタ31から出力される8ビットの入力
データに二次元離散コサイン変換を行い、11ビットの
データ(DCT係数)を出力する。分離部33は、二次
元DCT部32から出力された11ビットのデータを上
位7ビットのデータと下位4ビットのデータとに分離
し、下位4ビットのデータをセレクタ31に戻し、上位
7ビットのデータをセレクタ34に与える。
【0080】セレクタ34は、まず、分離部33から出
力された上位7ビットのデータを選択して出力する。ハ
フマン符号化部35は、セレクタ34から出力された上
位7ビットのデータにハフマン符号化を行い、符号デー
タを出力する。
【0081】一方、セレクタ31は、分離部33により
得られた下位4ビットのデータを選択して出力する。二
次元DCT部32は、セレクタ31から出力された下位
4ビットのデータに二次元離散コサイン変換を行い、7
ビットのデータ(DCT係数)を出力し、セレクタ34
に与える。セレクタ34は、二次元DCT部32から出
力された7ビットのデータを選択して出力する。ハフマ
ン符号化部35は、セレクタ34から出力された7ビッ
トのデータにハフマン符号化を行い、符号データを出力
する。
【0082】このように、図24のデータ圧縮装置30
においては、セレクタ31,34を用いることにより二
次元DCT部32が図23のデータ圧縮装置20におけ
る2つの二次元DCT部21,23の働きを行い、ハフ
マン符号化部35が2つのハフマン符号化部24,25
の働きを行う。
【0083】なお、図24においても、括弧内は音声デ
ータのビット数を示す。入力データが16ビットの音声
データの場合にも、同様にしてデータ圧縮が行われる。
【0084】
【発明の効果】第1の発明によれば、一連の音声データ
が水平方向および垂直方向に相関性を有するように二次
元マトリクスに配列され、二次元離散コサイン変換が行
われるので、データの圧縮率が高くなる。したがって、
高い音質を維持しつつビットレートを改善することがで
きる。
【0085】第2の発明によれば、一連の音声データが
複数の周波数帯域に分割され、各周波数帯域ごとに二次
元離散コサイン変換および主たるデータの選択が行わ
れ、かつ符号データのデータ長が所定の長さ以下になる
ように選択条件を修正しつつ符号化が行われるので、低
ビットレートで良好な音質が得られるとともに、符号デ
ータのデータ長が一定の長さ以下に固定化され、かつデ
ータ長が短縮される。
【0086】第3の発明によれば、二次元離散コサイン
変換により得られたデータのうち量子化誤差となるデー
タにさらに二次元離散コサイン変換が行われた後、符号
化が行われるので、データ圧縮の誤差が二次元離散コサ
イン変換による誤差のみとなる。したがって、高品質な
データ圧縮が可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施例によるDCT装置の構成
を示すブロック図である。
【図2】第1の実施例における音声データの第1の配列
方法を示す図である。
【図3】第1の実施例における音声データの第2の配列
方法を示す図である。
【図4】第1の実施例における音声データの第3の配列
方法を示す図である。
【図5】1kHzの正弦波を二次元離散コサイン変換す
ることにより得られたDCT係数の一例を示す図であ
る。
【図6】2.5kHzの正弦波を二次元離散コサイン変
換することにより得られたDCT係数の一例を示す図で
ある。
【図7】5kHzの正弦波を二次元離散コサイン変換す
ることにより得られたDCT係数の一例を示す図であ
る。
【図8】9kHzの正弦波を二次元離散コサイン変換す
ることにより得られたDCT係数の一例を示す図であ
る。
【図9】17kHzの正弦波を二次元離散コサイン変換
することにより得られたDCT係数の一例を示す図であ
る。
【図10】本発明の第2の実施例によるデータ圧縮方法
を示す図である。
【図11】1kHzの音声データを第1の実施例におけ
る第1の配列方法により配列した状態を示す図である。
【図12】図11の音声データを二次元離散コサイン変
換することにより得られたDCT係数を示す図である。
【図13】図12のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
【図14】図13のDCT係数のハフマン符号化により
得られた符号データを二次元逆離散コサイン変換するこ
とにより復号された音声データを示す図である。
【図15】2.5kHzの音声データを二次元離散コサ
イン変換することにより得られたDCT係数を示す図で
ある。
【図16】図15に示すDCT係数から主たるDCT係
数を第2の実施例における選択方法により選択した状態
を示す図である。
【図17】5kHzの音声データを二次元離散コサイン
変換することにより得られたDCT係数を示す図であ
る。
【図18】図17のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
【図19】9kHzの音声データを二次元離散コサイン
変換することにより得られたDCT係数を示す図であ
る。
【図20】図19のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
【図21】17kHzの音声データを二次元離散コサイ
ン変換することにより得られたDCT係数を示す図であ
る。
【図22】図21のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
【図23】本発明の第3の実施例によるデータ圧縮装置
の構成の一例を示すブロック図である。
【図24】本発明の第3の実施例によるデータ圧縮装置
の構成の他の例を示すブロック図である。
【図25】DCT方式の画像データ圧縮システムの基本
構成を示すブロック図である。
【図26】画像データのブロック化を示す図である。
【図27】8×8画素ブロックおよび二次元離散コサイ
ン変換されたブロックを示す図である。
【図28】二次元離散コサイン変換を用いた従来の音声
データの圧縮方法を示す図である。
【符号の説明】
1 DCT装置 2 A/D変換器 3 レジスタ 4 マトリクス用メモリ 5 アドレスセレクタ 6 二次元DCT部 20,30 データ圧縮装置 21,23,32 二次元DCT部 22,33 分離部 24,25,35 ハフマン符号化部 26,31,34 セレクタ なお、各図中同一符号は同一または相当部分を示す。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/20 H03M 7/30 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 連続する音声データを水平方向に順に配
    列しかつ垂直方向に1つずつシフトして一連の音声デー
    タを水平方向および垂直方向に相関性を有するように二
    次元マトリクスに配列する配列手段と、 前記配列手段により配列された二次元マトリクスの音声
    データに二次元離散コサイン変換を行う変換手段とを備
    えたデータ圧縮装置。
  2. 【請求項2】 連続する音声データを水平方向に順に配
    列しかつ垂直方向に2つずつシフトして一連の音声デー
    タを水平方向および垂直方向に相関性を有するように二
    次元マトリクスに配列する配列手段と、 前記配列手段により配列された二次元マトリクスの音声
    データに二次元離散コサイン変換を行う変換手段とを備
    えたデータ圧縮装置。
  3. 【請求項3】 連続する2つの音声データの平均値を順
    に配列して一連の音声データを水平方向および垂直方向
    に相関性を有するように二次元マトリクスに配列する配
    列手段と、 前記配列手段により配列された二次元マトリクスの音声
    データに二次元離散コサイン変換を行う変換手段とを備
    えたデータ圧縮装置。
  4. 【請求項4】 一連の音声データを複数の周波数帯域に
    分割し、前記分割により得られた各周波数帯域の音声デ
    ータを二次元マトリクスに配列し、各周波数帯域ごとに
    二次元マトリクスの音声データに二次元離散コサイン変
    換を行い、前記二次元離散コサイン変換により得られた
    各周波数帯域ごとのデータから主たるデータを所定の選
    択条件に基づいて選択し、符号データの長さが所定の長
    さ以下になるように前記選択条件を修正しつつ選択され
    た主たるデータを符号化することを特徴とするデータ圧
    縮方法。
  5. 【請求項5】 mビットのデータに二次元離散コサイン
    変換を行ってnビットのデータを得る第1の変換手段
    と、 前記第1の変換手段により得られたデータを上位n−k
    ビットのデータおよび下位kビットのデータに分離する
    分離手段と、 前記分離手段により得られた前記下位kビットのデータ
    に二次元離散コサイン変換を行う第2の変換手段と、 前記第2の変換手段により得られたデータを符号化する
    第1の符号化手段と、前記分離手段により得られた前記
    上位n−kビットのデータを符号化する第2の符号化手
    段とを備えたデータ圧縮装置。
JP6152006A 1994-07-04 1994-07-04 データ圧縮装置 Expired - Fee Related JP2969047B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6152006A JP2969047B2 (ja) 1994-07-04 1994-07-04 データ圧縮装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6152006A JP2969047B2 (ja) 1994-07-04 1994-07-04 データ圧縮装置

Publications (2)

Publication Number Publication Date
JPH0816192A JPH0816192A (ja) 1996-01-19
JP2969047B2 true JP2969047B2 (ja) 1999-11-02

Family

ID=15531011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6152006A Expired - Fee Related JP2969047B2 (ja) 1994-07-04 1994-07-04 データ圧縮装置

Country Status (1)

Country Link
JP (1) JP2969047B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3255034B2 (ja) 1996-08-09 2002-02-12 日本電気株式会社 音声信号処理回路
KR101037931B1 (ko) 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
US11308045B2 (en) 2017-07-04 2022-04-19 Nec Corporation Information processing apparatus, control method, and program

Also Published As

Publication number Publication date
JPH0816192A (ja) 1996-01-19

Similar Documents

Publication Publication Date Title
US8135226B2 (en) Image encoder, image encoding method, image decoder, and image decoding method
JP3339054B2 (ja) データ符号化方法及び装置、データ復号方法及び装置、並びに記録媒体
JP4198757B2 (ja) ウェーブレット状及び逆ウェーブレット状にデジタルデータを変換するためのシステム及び方法
US5534925A (en) Image compression by optimal reconstruction
JP4037271B2 (ja) 信号圧縮装置及び方法
JP4768728B2 (ja) 値のブロックをエンコードする方法および装置
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
JPH05206867A (ja) データ圧縮装置及び方法並びにこれに用いるデータ配列器
EP0683568A1 (en) Variable length code look-up table having separate code length determination
JP3466080B2 (ja) デジタルデータの符号化/復号化方法及び装置
JP3255022B2 (ja) 適応変換符号化方式および適応変換復号方式
JP2969047B2 (ja) データ圧縮装置
JP2001045484A (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2705377B2 (ja) 帯域分割符号化方法
JP2552102B2 (ja) ディジタルデータのフォーマッチング/ディフォーマッチング回路
JP2001188563A (ja) オーディオ符号化のための効果的なセクション化法
JP2543345B2 (ja) 音声符号化方式
JPH08275153A (ja) 画像圧縮装置および画像復元装置
JPH02131671A (ja) 画像データ圧縮方法
JP3845208B2 (ja) 画像圧縮装置および画像伸張装置
JP2521050B2 (ja) 音声符号化方式
JPH1188183A (ja) ウェーブレット変換装置およびその方法並びにウェーブレット逆変換装置およびその方法並びに画像符号化装置およびその方法並びに画像復号化装置およびその方法
JP2521052B2 (ja) 音声符号化方式
JPH08317393A (ja) 画像データ処理装置
JPH03243066A (ja) 画像符号化方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees