JPH09230894A - 音声圧縮伸張装置及び音声圧縮伸張方法 - Google Patents

音声圧縮伸張装置及び音声圧縮伸張方法

Info

Publication number
JPH09230894A
JPH09230894A JP8032006A JP3200696A JPH09230894A JP H09230894 A JPH09230894 A JP H09230894A JP 8032006 A JP8032006 A JP 8032006A JP 3200696 A JP3200696 A JP 3200696A JP H09230894 A JPH09230894 A JP H09230894A
Authority
JP
Japan
Prior art keywords
quantization
information
band
divided
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8032006A
Other languages
English (en)
Inventor
Shogo Nakamura
尚五 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Soft Inc
Original Assignee
Fuji Soft Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Soft Inc filed Critical Fuji Soft Inc
Priority to JP8032006A priority Critical patent/JPH09230894A/ja
Publication of JPH09230894A publication Critical patent/JPH09230894A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】 【目的】 高い圧縮率を実現するとともに、音声情報の
再現性も良い音声圧縮伸張が可能な音声圧縮伸張装置を
提供する。 【構成】 デジタル音声信号を帯域分割部12で8チャ
ンネルの等帯域に分割し、判定部13で分割した各帯域
を所定時間毎に時分割し、時分割した各分割帯域の音声
信号エネルギーを検出して検出エネルギーが所定閾値以
上の区間のみ量子化の対象とする。そして、量子化の対
象となった区間の各分割チャンネルのエネルギーが当該
区間の全チャンネルのトータルエネルギーの5%以上か
否かを判断し、量子化部14は5%以上と判断された帯
域の音声信号のみを、予め計算した入力対誤差の計算結
果を登録したマッピングテーブル15を参照して高振幅
か低振幅かで異なるテーブルより入力信号に対応するマ
ッピングデータを読み出してきて量子化を行う。伸張時
には、このデータより逆の順序で伸張処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声情報を圧縮する
音声圧縮装置及び圧縮音声情報を伸長する音声伸長装置
及び方法並びに音声圧縮伸長装置及び方法に関するもの
である。
【0002】
【従来の技術】音声情報を例えば通信媒体を介して他の
装置に送信する際には、音声情報を一旦デジタル情報に
変換し、変換したデジタル情報に所定圧縮処理を施して
から送信している。そして、受信側で再び圧縮情報を伸
張する方法が用いられている。
【0003】従来は、この音声情報波形を直接圧縮する
方法としては、音声情報の差分を基に圧縮を行うADP
CMによる圧縮方法が用いられていた。
【0004】係る点を解消するために、本願発明者は特
願平6−237885号において、デジタル音声信号を
帯域分割部12で8チャンネルの等帯域に分割して分割
領域を更に有音域と無音域に分け、有音域のみを量子化
誤差を最少とする折れ線テーブル15に予め登録されて
いる折れ線で近似させる折れ線量子化を行なう方法を提
案した。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
圧縮方法では折れ線テーブルより得られた折れ線一次関
数を用いた演算により量子化を行なう必要があり、どう
しても演算処理が避けられず、高速での処理が困難であ
った。
【0006】
【課題を解決するための手段】本発明は上述の課題を解
決することを目的としてなされたもので、話の内容が判
別できるとともに、話者が誰であるかということが判別
できる音声情報の圧縮伸張を可能とすることを目的とす
る。そして、係る目的を達成する一手段として以下の構
成を備える。
【0007】即ち、デジタル音声信号を複数の等帯域に
分割する音声信号分割手段と、前記音声信号分割手段で
分割した各帯域の所定時間毎のブロックの各分割帯域の
音声信号エネルギーを検出するエネルギー検出手段と、
前記エネルギー検出手段での全分割帯域のエネルギー値
の総和が所定閾値以上か否かを判別する第1の判別手段
と、前記第1の判別手段での判別の結果、所定閾値以上
であると判別されたブロックの各分割帯域毎のエネルギ
ー占有率が所定閾値以上か否かを判別する第2の判別手
段と、前記第2の判別手段が所定閾値以上と判断された
帯域の音声信号のみを量子化する量子化手段とを備え、
前記量子化手段による量子化は、予め必要な所定の量子
化関数を用いて入力情報を量子化した際の量子化結果を
予め計算して前記入力情報と関連して量子化テーブルと
して登録しておき、入力情報に従って前記量子化テーブ
ルを検索し、所望の量子化結果を読み出すことにより行
なうことを特徴とする音声圧縮装置とする。
【0008】そして例えば、前記量子化手段の量子化テ
ーブルには、量子化対象ブロックの入力情報に低振幅の
占有率が多い場合と高振幅の占有率が多い場合とで異な
る量子化関数を用いて量子化関数毎の入力情報と量子化
結果とを対応付けて登録し、前記量子化手段は、量子化
対象ブロックの入力情報の振幅の占有率に従って適応す
る量子化関数による量子化結果を選択することを特徴と
する。
【0009】更に、例えば前記量子化手段での量子化情
報と前記第1及び第2の判別手段の判別結果を出力する
出力手段を備えることを特徴とする。そして、例えば前
記出力での出力情報は、無音ブロックの場合には無音区
間を示す情報と無音区間の長さ情報であり、有音ブロッ
クの場合には有音区間を示す情報と有音帯域を示す情
報、各帯域中の原情報の最大値、量子化テーブルにおけ
る選択情報及び量子化結果を含むことを特徴とする。
【0010】また、前記音声圧縮装置の出力手段よりの
出力情報を受け取る受信手段と、前記受信手段で受信し
た前記量子化手段での量子化情報に従って量子化情報を
伸張復元する伸張手段と、前記伸張手段で伸張した各帯
域の復元情報を前記受信手段で受信した前記第1及び第
2の判別手段の判別結果に従って混合して分割音声情報
を復元する混合手段を備えることを特徴とする音声伸長
装置とする。
【0011】
【作用】以上の構成において、簡単な処理で高い圧縮率
を実現するとともに、音声情報の再現性も良い音声圧縮
伸張が可能となる。
【0012】
【発明の実施の形態】以下、図面を参照して本発明に係
る発明の実施の形態の一例を詳細に説明する。
【0013】図1は本発明に係る発明の実施の形態の一
例の音声圧縮伸張装置の構成を示すブロック図である。
図中、11はマイクロホン17より入力されるアナログ
音声情報を対応するデジタル音声情報に変換するアナロ
グ−デジタル変換部(A/D変換部)であり、本例にお
いては64Kバイト/秒のデータ量を持つ音声データに
変換することが可能である。12はデジタル化された8
ビット、8kHzのデータ量を持つ音声データをサブバ
ンドフィルタを用いて1kHz毎の8つのチャンネルに
帯域分割している。8チャンネルの等帯域分割(本例で
は1000Hz毎の等帯域)するウエーブレットフィル
タによる帯域分割を行う帯域分割部である。
【0014】又、13は音声データの量子化にあたっ
て、入力された音声データの無音区間/有音区間の判定
及び各分割帯域(チャネンル)毎のデータの有無を判定
する判定部であり、本例においては、全チャンネル毎の
有音区間と無音区間とを判別する有音区間判別部分と、
有音区間判別部分で有音区間であると判別された場合
に、この有音区間のどのチャンネルが有音チャネルであ
るかを判別する有音チャンネル判別部分とで構成されて
いる。本例では、同時刻の全チャンネルの20ms毎のブ
ロックのエネルギーを計算する。そして、全チャンネル
のエネルギー量の多いブロックを有音ブロックと判定
し、次に判定したブロックのうちのエネルギー占有率の
高いチャンネルのみを量子化して伝送するように制御し
ており、このための伝送チャンネルをここで判定してい
る。
【0015】14は詳細を後述するマッピングテーブル
15に登録されているマッピングデータに従って当該帯
域の音声データを量子化する量子化部である。
【0016】15は量子化部14での量子化のためのマ
ッピングデータを所定数保持するマッピングテーブルで
ある。マッピングテーブル15の詳細は後述する。16
は判定部13での判定結果情報及び量子化部14での量
子化データとを関連付けてパケット化し、送信データと
して他の装置宛出力可能な出力部である。又、17は音
声を対応するアナログ信号に変換するマイクロホンであ
る。
【0017】更に、21は他の装置よりの量子化情報及
び量子化に対する相手装置判定部の判定結果を包含する
相手装置よりの受信データを受け取る入力部である。2
2は受信データ中の上記相手装置判定部の判定結果を受
け取り、送られてきた量子化データがどの帯域のデータ
か等を判別し、伸張処理をすべきチャンネル(有音区
間)を判定する有音区間判定部、23は有音区間判定部
22で判定した有音区間チャンネルについて、マッピン
グテーブル15を参照して該当チャンネルの伸張処理を
行い量子化以前の音声データに変換して時系列合成部2
4に出力する伸張部である。
【0018】24は伸張部23よりの各チャネル毎の一
定区間の音声データを時系列合成する時系列合成部、2
5は先の帯域分割部と同様のウエーブレットフィルタに
より時系列合成部で時系列に合成された各チャンネル毎
に分割された帯域毎の音声データを合成する帯域合成
部、26は帯域合成部25よりのデジタル音声データを
対応するアナログ信号に変換するデジタル−アナログ変
換部(D/A変換部)である。また、27はアナログ音
声信号を音響出力するスピーカである。
【0019】本例においては、上述したようにマイク1
7よりのアナログデータを処理して量子化して出力する
とともに、受取った量子化データを対応するアナログ信
号に変換してスピーカ27より出力することもできる
が、デジタル音声データを直接帯域分割部12に入力す
ることができる。また、同様に帯域合成部25よりの合
成デジタル音声データとして出力することも可能に構成
されており、コンピュータ等よりのデジタルデータや、
記憶装置に記憶されているデジタル音声データを再現性
に優れ、且つ高い圧縮率での圧縮処理を施し、少ない量
のデータとして別の記憶装置に記憶したり、転送したり
することが可能となる。そして、必要に応じて本例の伸
長部で伸長してデジタル音声データとして出力すること
もできる。
【0020】以上の構成を備える本例の各部の詳細を以
下に説明する。まず帯域分割部の機能構成を図2に示
す。
【0021】本例のサブフィルタは、図2に示すように
合計7のサブフィルタで構成されている。1つのサブフ
ィルタにおいては、入力をローパスフィルタH0及びハ
イパスフィルタH1の2つの分解フィルタに入力させ、
この2つのフィルタを通過した後(1/2)にデシメー
ションされて2つの帯域に夫々分割される様に動作す
る。このように、1段で(1/2)のデシメーションを
行うので、例えば8KHzの帯域を有する入力データを
1KHZ毎の8つのチャンネルに分割する場合には、図
2に示す様に7つのサブフィルタ構成で合計3段のデシ
メーションを行ない、1/8のデータ数に分割して8チ
ャンネルの各帯域に分割すればよい。
【0022】このフィルタ(ウエーブレットフィルタ)
の具体的な構成例を図3に、図3に示すフィルタによる
合計3段のフィルタリングのタイミングチャートを図4
に示す。図4に示すように、第1段のステージ、第2段
のステージ、第3段のステージの各分割動作は同時に並
行して行われる。
【0023】本例においては、図3に示すように、サブ
フィルタプロセッサ部30、入力データを一次保持する
データメモリとして、入力データを保持する第1段メモ
リ41、第1段目の分割結果を保持する第2段メモリ4
2、第2段目の分割結果を保持する第3段メモリ43の
合計3つのデータメモリ及び各メモリ41〜43のいず
れかのメモリ読み出しデータを選択してサブフィルタプ
ロセッサ部30に供給するセレクタ44、ウェーブレッ
ト係数を保持するウェーブレット係数テーブル50とよ
り構成されている。
【0024】そして、サブフィルタプロセッサ部30
は、入力信号を一次保持するD−タイプのフリップフロ
ップ31、出力する分割後の信号を一次保持するD−タ
イプのフリップフロップ34、乗算器32、加算器3
3、各チャンネルの分割処理を時分割で行なうことよ
り、時分割処理信号を一次保持する分割データの6デー
タ分の記憶容量を有するシフトレジスタ(ディレイメモ
リ)35より構成されている。
【0025】フリップフロップ31の出力は第1段メモ
リ41に送られ、入力信号が第1段メモリ41に記憶さ
れるようになっている。ここには、そして、乗算器32
にはセレクタ44を介して入力されるデータメモリより
のデータと、ウェーブレット係数テーブル50よりのウ
ェーブレット係数が入力されており、データメモリに記
憶された入力データを分割周波数で定まるウエーブレッ
ト係数で乗算する。
【0026】そしてこの乗算器32の出力は加算器33
を介して第2段メモリ42と第3段メモリ43、及びフ
リップフロップ34に出力される。レジスタ35は、最
終出力が8つに分割された帯域のデータであるため、後
述する第4図に示すタイミングで最終分割データの各チ
ャンネルの出力データを生成する時に、この生成に必要
な6チャンネル分の分割データを一次保持するためのも
のである。そして、この最終出力を行なう時に順次読み
出されて加算器33に送られ、加算器33、フリップフ
ロップを介して出力信号として出力されることになる。
【0027】本例においては、以上の構成を備え、図4
に示すような動作を行なう。第1段のサブフィルタにお
いては、例えば最初のタイミングで入力される入力1、
2が第1ステージの第1のタイミングで12Hと12L
とに2分割される。続いて第2のタイムングにおいては
入力3、4が34Hと34Lとに2分割され、第3のタ
イミングでは入力5、6が56Hと56Lとに2分割さ
れ、第4のタイミングで入力7、8が78Hと78Lと
に2分割される。以下同様に次の入力に対しても同様の
タイミングでの分割が行われる。
【0028】一方、第2ステージにおいては、第3のタ
イミングにおいて、第1のタイミング及び第2のタイミ
ングで第1ステージのサブフィルタで分割した12Hと
34Hを入力し、これを2分割して1−4HHと1−4
HLを出力する。同様に、第4のタイミングにおいて、
第1のタイミング及び第2のタイミングで第1ステージ
のサブフィルタで分割した12Lと34Lを入力し、こ
れを2分割して1−4LHと1−4LLを出力する。
【0029】続いて第5のタイミングで第3のタイミン
グ及び第4のタイミングで第1ステージのサブフィルタ
で分割した56Hと78Hを入力し、これを2分割して
5−8HHと5−8HLを出力する。更に第6のタイミ
ングで第3のタイミング及び第4のタイミングで第1ス
テージのサブフィルタで分割した56Lと78Lを入力
し、これを2分割して5−8LHと5−8LLを出力す
る。
【0030】更に、第3ステージにおいては、第6のタ
イミングにおいて、第3のタイミング及び第5のタイミ
ングで第2ステージのサブフィルタで分割した1−4H
Hと5−8HHを入力し、これを2分割して1−8HH
Hと1−8HHLを出力する。続いて第7のタイミング
において、第3のタイミング及び第5のタイミングで第
2ステージのサブフィルタで分割した1−4HLと5−
8HLを入力し、これを2分割して1−8HLHと1−
8HLLを出力する。
【0031】更に、第8のタイミングにおいて、第4の
タイミング及び第6のタイミングで第2ステージのサブ
フィルタで分割した1−4LHと5−8LHを入力し、
これを2分割して1−8LHHと1−8LHLを出力す
る。続いて第9のタイミングにおいて、第4のタイミン
グ及び第6のタイミングで第2ステージのサブフィルタ
で分割した1−4LLと5−8LLを入力し、これを2
分割して1−8LLHと1−8LLLを出力する。
【0032】以上の動作をするサブフィルタにおいて、
第1段(第1ステージ)動作として、入力信号の1、2
を第1段メモリの(0)に、3、4を第1段メモリの
(1)に、5、6を第1段メモリの(2)に、7、8を
第1段メモリの(3)にそれぞれ順次格納する。そし
て、1、2を第1段メモリの(0)に格納すると、上記
第1のタイミング(3、4を第1段メモリの(1)に格
納するタイミング)でこれを読み出してきてセレクタ4
4を介して乗算器32に入力させる。同時にウェーブレ
ット係数テーブル50より第1段のウェーブレット係数
H(3)、L(3)を読み出してきて乗算し、第1段の
帯域分割を行い、上述したタイミングで入力情報を2つ
に分割する。分割結果は順次第2段メモリに格納され
る。
【0033】第2段で分割された結果は第3段メモリ4
3に格納され、第3段で分割された分割結果はフリップ
フロップ34を介して出力信号として順次出力される。
各ステージにおいて乗算器に供給するウェーブレット係
数H(n)、L(n)は、上述した第1段ではH
(3)、L(3)を、第2段ではH(2)、L(2)を
第3段ではH(1)、L(1)を使用し、最後の出力の
場合にH(0)、L(0)を用いる。
【0034】本例においては、以上の第1段より第3段
の各フイルタリング処理は、図3に示すサブフィルタプ
ロセッサを図4に示すタイミングで時分割して行なって
おり、最終的な出力においてはチャンネル1よりチャン
ネル8に8分割した分割データが出力することになる。
これは、本例におけるサブフィルタは、入力データを、
分割周波数で定まるウェーブレット係数テーブル50に
記憶されたウエーブレット係数で乗算する乗算器により
構成されており、このウエーブレット係数を変更するの
みで任意の周波数での分割が可能であることより可能と
なるものである。図3に示すように、1つのサブフィル
タを、時分割動作させることにより構成を簡略化でき
る。
【0035】尚、後述する帯域合成部25における合成
フィルタもフィルタ部構成については全く同様の構成と
なっている。図2、及び図3に示すサブフィルタの周波
数特性を図5に、図3におけるウエーブレット係数の使
用例を図6に示す。以上に説明したウエーブレットフィ
ルタの原理を以下で詳細に説明する。
【0036】本例で用いている離散ウエーブレット変換
は、信号の解析手段として用いられているものであり、
原理的には以下に示す式1で表されるように、入力され
る信号をウエーブレット母関数ψ0より作られる族ψn,m
=ψ0(k-2nm)・・・によって作られる空間に展開し
たものである。
【0037】
【数1】 ここで、n=1,2,・・・はスケールパラメータであ
り、m=1,2,・・・はシフトを表す。
【0038】しかし、実際の利用においては、有限のス
ケールで表す必要があり、本例においては有限なウエー
ブレット空間とその補空間とに分割されて表される以下
に示す式2を用いてウエーブレット変換を行う。
【0039】
【数2】 なお、本例においては、8ビット、8kHzのデータ量
を持つ音声データを、1kHz毎の8つのチャンネルに
帯域分割している。
【0040】しかし、帯域分割の例は以上の例に限定さ
れるものではなく、任意の数に、また任意の帯域で分割
しても良いことは勿論である。伸長部23においいて
は、後述する量子化部14と同様にマッピングテーブル
を参照して量子化された圧縮データを量子化の際に用い
たマッピングテーブルを逆に利用して8ビットの復調デ
ータを読み出すことにより復調処理を行なう。
【0041】次に、帯域合成部25の詳細構成を説明す
る。帯域合成部25は図7に示す構成を備えている。即
ち、帯域分割部12とは逆に8チャンネルの分割帯域デ
ータを合成するものであり、(1/8)にデシメーショ
ンされた信号を、図7に破線で分離した2つの(×2)
デシメーション部、ローパスフィルタG0及びハイパス
フィルタG1とを1ブロックとした合成フィルタ構成を
採用しており、このブロックを分割帯域数に従って分割
フィルタと同様7ブロック備える構成としている。
【0042】具体的には、各フィルタはすべて分割フィ
ルタと同様に図3に示す構成となっており、入力データ
を一次記憶するデータメモリ31、フィルタ特性を決定
するウエーブレット係数を保持して乗算器33に出力す
るウエーブレット係数出力部32、及びデータメモリ3
1よりの入力データにウエーブレット係数を乗算する乗
算器33で構成されている。次に図1に示す判定部13
の詳細を図8のフローチャートを参照して説明する。判
定部12では、まずステップS1に示すように、帯域分
割部12で分割された8チャンネルの出力を所定区間、
例えば20msec(データ数にすると20点)毎に区切
り、これを1つの判定区間とする。そして、この1つの
区間における8チャンネル分の全ての帯域のエネルギー
を加算し、それを8チャンネル分すべて合計する。そし
てこの合計値をある時刻の区間におけるトータルエネル
ギーとする。
【0043】次にステップS2において、ステップS1
で求めたトータルエネルギーより入力された音声信号
(トータルエネルギー)が所定の閾値レベル以下かを調
べる。トータルエネルギーが所定閾値以下であればステ
ップS3に進み、すべてのチャンネルについて無音区間
とし、量子化部14での量子化を行わずにステップS4
で出力部16には全チャンネル無音区間であることを示
す信号を出力するのみで足りる。
【0044】一方、この区間のトータルエネルギーが所
定閾値以下でなければステップS5に進み、有音区間で
あると判別する。そして、続いてステップS6で各チャ
ンネル毎の帯域分割部12出力を上記トータルエネルギ
ーと比較する。そして各チャンネルの出力がトータルエ
ネルギーと比較して所定レベル以上であるか否かを調べ
る。そして所定レベルに達していないチャンネルはカッ
トし、所定レベル以上のチャンネルのみを抽出する。カ
ットしたチャンネルは以下の量子化処理を行なわず信号
成分としないように制御する。
【0045】この所定レベルの取り方によって圧縮率及
び音声信号の原音と再生音の誤差が大きな影響を受ける
ことになる。このため、発明者はこのカットレベルを種
々変更して原音と再生音との誤差を比較し、圧縮率と忠
実な再声音とのバランスを考慮して最適なカットレベル
としてトータルエネルギーの5%を設定した。即ち、本
例では各チャンネルの出力がトータルエネルギーの5%
以下のチャンネルはカットするように制御する。
【0046】以後は、ステップS7に示すように抽出チ
ャンネルのみ量子化するように量子化部14に指示し、
抽出チャンネル情報を出力部16に出力する。
【0047】この判定部13の判定の結果及び出力部1
6よりの出力圧縮情報の例を図9に示す。図9上部の1
マスが1チャンネルの20msの区間を表し、黒で示し
た区間のみ圧縮(量子化)対象となることを示してい
る。種々の音声信号に対して統計を取った結果略この段
階で少なくとも(3/8)程度の信号圧縮が実現してい
る。
【0048】そして、本例では更に圧縮を進めるために
量子化部14で以下に説明する量子化を行ない、最終的
な出力部16出力の段階では平均圧縮率(1/12)を
達成している。
【0049】本例における量子化処理を図10を参照し
て以下に説明する。本例においては、量子化部14にお
ける量子化は、量子化テーブル15を参照して行われ
る。量子化テーブル15には、量子化対象ブロックの入
力情報に低振幅の占有率が多い場合と高振幅の占有率が
多い場合とで異なる量子化関数を用いて量子化関数毎の
入力情報と量子化結果とを対応付けて登録しておく。そ
して、量子化部14は、量子化対象ブロックの入力情報
の振幅の占有率に従って適応する量子化関数による量子
化結果を選択して読み出すことにより行なう。
【0050】具体的には、図10にで示す入力Xn
が、fによってに示すようにyn=f(xn)とな
る。更に、(yn)がy軸上で量子化されたものをym
=(Q )[f(xn)]とする。(Q )はアナログ
−デジタル変換に相当する量子化関数である。
【0051】そして、y(m)を復調したときの誤差を
求めるため、に示すf (yn)を求め、5でそれを
x軸上で量子化してxmを求める。xm=Q [f
(ym)]であり、Q はx軸上での量子化関数であ
る。
【0052】従って、符号化、復号化の結果を考慮する
と、xnの入力に対してxm−xnの量子化誤差が発生
することになる。この誤差は、入力であるxnが定まれ
ば一義的に定まるものであり、このような入力対誤差の
関係を全ての入力格子点について予め計算し、登録して
おけば、結果としてf(x)、f (x)の計算を省略
することが可能である。
【0053】本例においては、以上の点を応用して、こ
の入力xnに対するxm−xnの量子化誤差を全ての格
子点について予め計算し、マッピングテーブル15に登
録しておくことにより、f(x)、f (x)の計算を
省略している。そして、以上の誤差も、入力信号の振幅
により2通りの量子化関数に対するものを記憶してお
り、入力が高振幅の場合と低振幅の場合とで2種類を登
録している。尚、この登録種類は2種類に何ら限定され
るものではない。
【0054】このようにして求めたマッピングテーブル
の例を図11及び図12に示す。図11がこの量子化ブ
ロックの最大振幅が所定閾値以下である低振幅の場合の
マッピングテーブルを、図12は高振幅である場合のマ
ッピングテーブルの例を示している。また、図13は入
力対誤差の関係の計算結果をグラフ化して示した図であ
る。130が入力と出力間に誤差がない場合、131が
図11に示すマッピングテーブル1を、132が図12
に示すマッピングテーブル2を示している。
【0055】本例においては、以上の入力対誤差の量と
共に、図11及び図12に示す様に出力ビットが4ビッ
トの場合と出力5ビットの場合の出力8ビットの復調出
力等が登録されており、入力の値に応じて出力が直ちに
得られ、簡単な操作で且つ高速で量子化処理を行なうこ
とができる。
【0056】以上説明したように本例によれば、入力対
量子化(復号化)誤差を予め全ての入力値に対して計算
してテーブルに登録しておくことにより、量子化の場合
における量子化関数の演算計算を省略することができ、
量子化に際しての負荷を大きく低減することができる。
また、出力が一定閾値以上のチャンネルのみ上記量子化
を行うことにより、誤差が最少で且つ高い圧縮率の音声
情報圧縮が実現する。
【0057】以上説明したように本例によれば、音声情
報を8チャンネルの等帯域に分割し、各チャンネル毎に
一定の区間で音声信号レベルが低い場合に、信号をカッ
トすることにより、優れた圧縮率が得られ、且つその後
の量子化テーブル(マッピングテーブル)を参照するの
みで関数計算を行なうこと無く量子化することを実現
し、量子化に係る負荷を大きく削減するとともに、更な
る高い圧縮率を実現しながら、優れた再現性の得られる
音声圧縮が提供できる。この結果、圧縮音声情報を他の
装置に送信する場合にも、少ない送信データ量で済み、
送受信双方の必要メモリ容量が削減できると共に、通信
時間も短縮することができる。
【0058】この本例における出力部16よりの出力
は、出力部16に判定部13より入力される無音区間で
あることを示すデータ、有音区間である場合に量子化し
たチャンネル情報及び当該チャンネルの振幅のもっとも
大きな音声信号の最大値情報、量子化部14よりの量子
化データを図9の下部に示すフォーマットで出力する。
この出力部16よりの出力データは、通信媒体を介して
他の装置に転送されても良く、また外部磁気記憶装置等
に記憶されてもよい。
【0059】出力部16よりの出力は、判定部13より
の判定の結果、出力しようとする区間が無音区間である
場合には、先頭ビットに(0)を割り当て、以下の7ビ
ットに無音区間の継続ブロック長を格納する。本例にお
いては1区間(1ブロック)20msであるので、7ビ
ットで最大2、5秒間分の無音区間情報を一括して8ビ
ットのデータとして表現することができる。
【0060】一方、有音区間であった場合には先頭ビッ
トに(1)を割り当て、続く8ビットで帯域分割部12
で分割した8チャンネルの各チャンネルのどのチャンネ
ルを量子化したかを示す。即ち、量子化したチャンネル
のみ(1)をセットする。続いて、順次有音チャンネル
をブロック後とに適応量子化関数の番号(マッピングテ
ーブルの番号)、オリジナルデータのブロック中の最大
値、量子化データの順で出力される。なお、無音チャン
ネルがある場合にはそのチャンネルの情報は伝送しな
い。
【0061】以上の様にすることで圧縮後のデータ量を
少ないものとできる。
【0062】本例の圧縮及び伸長処理のシュミレーショ
ンを行なった結果の例を図14に示す。図14は、8ビ
ット、8KHzの10秒間の音声入力のシュミレーショ
ン結果を示す図である。図14において、(a)は帯域
分割部12への入力信号波形、(b)は帯域分割部で分
割した有音ブロックの1チャンネルの帯域データ、
(c)は量子化部14で量子化した量子化データ、
(d)はこのデータを伸長部で伸長し、、時系列合成部
で合成した復調データの夫々の波形例を示している。
【0063】以上の本例の音声圧縮伸張処理を行った結
果、再合成された音声が、「誰がそのスピーチを行って
いるか?」、「何を喋っているか?」といった条件を満
たす圧縮を行ないながら平均で(1/12)という高い
圧縮率が得られた。
【0064】尚、以上の説明は入出力をアナログ信号と
したが、コンピュータ等での処理データを送受信する場
合には、入出力データはデジタルデータとなり、変換部
11,26が不要となる。又、本例はあらゆる音声情報
の圧縮伸張処理に適用可能であり、圧縮した音声情報を
記憶装置に記憶しておき、これを後で再生するような場
合にも適用可能なことは勿論である。
【0065】以上説明した様に本例によれば、マッピン
グテーブルを参照するのみで特別の演算なしに量子化す
ることができ、高速で且つ簡単な制御で量子化処理を行
なうことができる。このため、コンピュータ制御等で係
る量子化処理を行なっても、コンピュータの負荷を少な
いものとできる。
【0066】また、量子化に先立って入力音声信号を所
定時間毎に区切り、この時間(区間)内の入力信号が無
音区間か、或は有音区間かを判別し、無音区間について
はその区間についての量子化を行なわず、有音区間であ
っても音声信号を8チャンネルの帯域に分割して、チャ
ンネル内のエネルギーが所定量以上のチャンネルのみを
有音チャンネルとして量子化し、エネルギーの低いチャ
ンネルについての量子化を行なわないように制御するた
め、大きな圧縮効果を得ることができる。
【0067】しかも、上記有音チャンネルの判別に際し
て、有音チャンネルか否かを単に一定の閾値を基準に判
断するのではなく、このチャンネルが含まれる区間の全
チャンネルの総エネルギーを基準に閾値を変更すること
により、確実に有音チャンネルのみを選択することがで
き、非常に高精度且つ効率の良い圧縮処理が行なえる。
【0068】この結果、圧縮音声情報を他の装置に送信
する場合にも、少ない送信データ量で済み、送受信双方
の必要メモリ容量が削減できると共に、通信時間も短縮
することができる。なお、以上の説明は音声情報波形の
圧縮・伸長方法を例に説明を行なったが、本発明は音声
の波形圧縮・伸長方法に限定されるものではなく、種々
の波形情報の圧縮・伸長処理に広く適用することができ
る。この場合においても、以上に説明した構成をそのま
ま用いることができ、各種信号波形の圧縮・伸長に多大
の効果が得られる。発明者が多大な圧縮・伸長効果が得
られるものとして確認した波形情報としては、各種生体
測定情報(心電図情報等)の圧縮・伸長処理があり、特
に長時間の測定を行なうホルター心電計の心電図波形の
圧縮に用いることにより、高い圧縮率が実現でき、小型
で長時間の心電図情報記録が実現する。生体情報の場合
には、信号波形の現れる帯域も比較的限定されており、
特に本発明による圧縮効果が期待できる。また、人工衛
星よりの各種観測情報の転送に上述の圧縮方法を用いる
ことにより、従来に比しCPU等の負荷が少なくすると
ともに、高い圧縮率での信号送信が可能となる。この
他、信号波形を直接圧縮伸張するものであれば全てに高
い圧縮率が実現し、あらゆる信号波形を直接圧縮する処
理を行う全ての場合に適用できる。
【0069】
【発明の効果】以上説明した様に本発明によれば、マッ
ピングテーブルを参照するのみで特別の演算なしに量子
化することができ、高速で且つ簡単な制御で量子化処理
を行なうことができる。このため、コンピュータ制御等
で係る量子化処理を行なっても、コンピュータの負荷を
少ないものとでき、高い圧縮率を実現しながら、優れた
再現性の得られる音声圧縮伸張が提供できる。この結
果、圧縮音声情報を他の装置に送信する場合にも、少な
い送信データ量で済み、送受信双方の必要メモリ容量が
削減できると共に、通信時間も短縮することができる。
【0070】
【図面の簡単な説明】
【図1】本発明に係る発明の実施の形態の一例を示すブ
ロック図である。
【図2】図1に示す本例の帯域分割部の詳細構成例を示
す図である。
【図3】図2に示す本例の帯域分割部のサブフィルタの
詳細構成例を示す図である。
【図4】本例の図3に示すサブフィルタの動作タイミン
グチャートである。
【図5】本例の分割フィルタの振幅特性を示す図であ
る。
【図6】本例の分割フィルタのフィルタ係数を示す図で
ある。
【図7】図2に示す本例の帯域合成部の詳細構成例を示
す図である。
【図8】本例における図1に示す判定部の動作を説明す
るための図である。
【図9】本例の分割チャネルの各区間のエネルギー分布
の例を示す図である。
【図10】本例の量子化部における量子化原理を説明す
るための図である。
【図11】本例におけるマッピングテーブルの例を示す
図である。
【図12】本例におけるマッピングテーブルの例を示す
図である。
【図13】本例におけるマッピングテーブルに登録され
ている入力と量子化、復調化後の発生誤差の計算例を示
す図である。
【図14】本例における入力音声信号波形と圧縮伸張処
理後の出力波形の例を示す図である。
【符号の説明】
11 アナログ−デジタル変換部(A/D変換部) 12 帯域分割部 13 判定部 14 量子化部 15 マッピングテーブル 16 出力部 17 マイクロホン 21 入力部 22 有音区間判定部 23 伸張部 24 時系列合成部 25 帯域合成部 26 デジタル−アナログ変換部(D/A変換部) 27 スピーカ 30 サブフィルタプロセッサ部 41 第1段メモリ 42 第2段メモリ 43 第3段メモリ 44 セレクタ 50 ウェーブレット係数テーブル

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 デジタル音声信号を複数の等帯域に分割
    する音声信号分割手段と、 前記音声信号分割手段で分割した各帯域の所定時間毎の
    ブロックの各分割帯域の音声信号エネルギーを検出する
    エネルギー検出手段と、 前記エネルギー検出手段での全分割帯域のエネルギー値
    の総和が所定閾値以上か否かを判別する第1の判別手段
    と、 前記第1の判別手段での判別の結果、所定閾値以上であ
    ると判別されたブロックの各分割帯域毎のエネルギー占
    有率が所定閾値以上か否かを判別する第2の判別手段
    と、 前記第2の判別手段が所定閾値以上と判断された帯域の
    音声信号のみを量子化する量子化手段とを備え、 前記量子化手段による量子化は、予め必要な所定の量子
    化関数を用いて入力情報を量子化した際の量子化結果を
    予め計算して前記入力情報と関連して量子化テーブルと
    して登録しておき、入力情報に従って前記量子化テーブ
    ルを検索し、所望の量子化結果を読み出すことにより行
    なうことを特徴とする音声圧縮装置。
  2. 【請求項2】 前記量子化手段の量子化テーブルには、
    量子化対象ブロックの入力情報に低振幅の占有率が多い
    場合と高振幅の占有率が多い場合とで異なる量子化関数
    を用いて量子化関数毎の入力情報と量子化結果とを対応
    付けて登録し、前記量子化手段は、量子化対象ブロック
    の入力情報の振幅の占有率に従って適応する量子化関数
    による量子化結果を選択することを特徴とする請求項1
    記載の音声圧縮装置。
  3. 【請求項3】 更に、前記量子化手段での量子化情報と
    前記第1及び第2の判別手段の判別結果を出力する出力
    手段を備えることを特徴とする請求項1又は請求項2の
    いずれかに記載の音声圧縮装置。
  4. 【請求項4】 前記出力での出力情報は、無音ブロック
    の場合には無音区間を示す情報と無音区間の長さ情報で
    あり、有音ブロックの場合には有音区間を示す情報と有
    音帯域を示す情報、各帯域中の原情報の最大値、量子化
    テーブルにおける選択情報及び量子化結果を含むことを
    特徴とする請求項3記載の音声圧縮装置。
  5. 【請求項5】 請求項3又は請求項4のいずれかに記載
    の音声圧縮装置の出力手段よりの出力情報を受け取る受
    信手段と、 前記受信手段で受信した前記量子化手段での量子化情報
    に従って量子化情報を伸張復元する伸張手段と、 前記伸張手段で伸張した各帯域の復元情報を前記受信手
    段で受信した前記第1及び第2の判別手段の判別結果に
    従って混合して分割音声情報を復元する混合手段を備え
    ることを特徴とする音声伸張装置。
  6. 【請求項6】 前記請求項3又は請求項4のいずれかに
    記載の音声圧縮装置の構成と、前記請求項5記載の音声
    伸長装置の構成を備えることを特徴とする音声圧縮伸長
    装置。
  7. 【請求項7】 デジタル音声信号を複数の等帯域に分割
    し、分割した各帯域の所定時間毎のブロックの各分割帯
    域の音声信号エネルギーを検出し、検出した全分割帯域
    のエネルギー値の総和が所定閾値以上か否かを判別し、
    判別の結果、所定閾値以下のブロックを無音ブロックと
    し、検出した全分割帯域のエネルギー値の総和が所定閾
    値以上であると判別されたブロックを有音ブロックと
    し、更に有音ブロックの各分割帯域毎のエネルギー占有
    率が所定閾値以上か否かを判別し、所定閾値以上と判断
    された帯域の音声信号のみを量子化する音声圧縮方法で
    あって、 前記量子化は、予め必要な所定の量子化関数を用いて入
    力情報を量子化した際の量子化結果を予め計算して前記
    入力情報と関連して量子化テーブルとして登録してお
    き、入力情報に従って前記量子化テーブルを検索し、所
    望の量子化結果を読み出すことにより行なうことを特徴
    とする音声圧縮方法。
  8. 【請求項8】 前記量子化の際の量子化テーブルには、
    量子化対象ブロックの入力情報に低振幅の占有率が多い
    場合と高振幅の占有率が多い場合とで異なる量子化関数
    を用いて量子化関数毎の入力情報と量子化結果とを対応
    付けて登録し、量子化対象ブロックの入力情報の振幅の
    占有率に従って適応する量子化関数による量子化結果を
    選択することを特徴とする請求項7記載の音声圧縮方
    法。
  9. 【請求項9】 更に、他の装置に前記量子化の際の量子
    化情報と前記判別の結果無音ブロックの場合には無音区
    間を示す情報と無音区間の長さ情報を、有音ブロックの
    場合には有音区間を示す情報と有音帯域を示す情報、各
    帯域中の原情報の最大値、量子化テーブルにおける選択
    情報を出力することを特徴とする請求項8記載の音声圧
    縮方法。
  10. 【請求項10】 請求項9記載の出力情報を受け取り、
    受取った前記量子化情報に従って量子化情報を伸張復元
    すると共に、 前記伸張復元した各帯域の復元情報を前記受取った前記
    判別の結果無音ブロックの場合には無音区間を示す情報
    と無音区間の長さ情報を、有音ブロックの場合には有音
    区間を示す情報と有音帯域を示す情報、各帯域中の原情
    報の最大値、量子化テーブルにおける選択情報に従って
    混合して分割音声情報を復元することを特徴とする音声
    伸張方法。
  11. 【請求項11】 前記請求項9記載の音声圧縮方法によ
    り音声情報を圧縮し、前記請求項10記載の音声伸長方
    法により圧縮音声情報を伸長することを特徴とする音声
    圧縮伸長方法。
JP8032006A 1996-02-20 1996-02-20 音声圧縮伸張装置及び音声圧縮伸張方法 Withdrawn JPH09230894A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8032006A JPH09230894A (ja) 1996-02-20 1996-02-20 音声圧縮伸張装置及び音声圧縮伸張方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8032006A JPH09230894A (ja) 1996-02-20 1996-02-20 音声圧縮伸張装置及び音声圧縮伸張方法

Publications (1)

Publication Number Publication Date
JPH09230894A true JPH09230894A (ja) 1997-09-05

Family

ID=12346803

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8032006A Withdrawn JPH09230894A (ja) 1996-02-20 1996-02-20 音声圧縮伸張装置及び音声圧縮伸張方法

Country Status (1)

Country Link
JP (1) JPH09230894A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005328533A (ja) * 2004-05-12 2005-11-24 Samsung Electronics Co Ltd 区間別の線形量子化を利用したデジタル信号符号化/復号化方法及び装置
JP2006506913A (ja) * 2002-11-15 2006-02-23 クゥアルコム・インコーポレイテッド 多重記述符合化のための装置及び方法
JP2009518659A (ja) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
US7995849B2 (en) 2003-03-17 2011-08-09 Qualcomm, Incorporated Method and apparatus for improving video quality of low bit-rate video

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006506913A (ja) * 2002-11-15 2006-02-23 クゥアルコム・インコーポレイテッド 多重記述符合化のための装置及び方法
US7995849B2 (en) 2003-03-17 2011-08-09 Qualcomm, Incorporated Method and apparatus for improving video quality of low bit-rate video
JP2005328533A (ja) * 2004-05-12 2005-11-24 Samsung Electronics Co Ltd 区間別の線形量子化を利用したデジタル信号符号化/復号化方法及び装置
US7983346B2 (en) 2004-05-12 2011-07-19 Samsung Electronics Co., Ltd. Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
US8149927B2 (en) 2004-05-12 2012-04-03 Samsung Electronics Co., Ltd. Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JP2009518659A (ja) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置

Similar Documents

Publication Publication Date Title
JP2904472B2 (ja) ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置
US5091944A (en) Apparatus for linear predictive coding and decoding of speech using residual wave form time-access compression
JP4396683B2 (ja) 音声符号化装置、音声符号化方法、及び、プログラム
JP3278900B2 (ja) データ符号化装置及び方法
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JPH0632036B2 (ja) 信号をコーディングし,デコードし,分析し,そして合成するための装置
KR100352351B1 (ko) 정보부호화방법및장치와정보복호화방법및장치
US20030220801A1 (en) Audio compression method and apparatus
US5673364A (en) System and method for compression and decompression of audio signals
KR100309727B1 (ko) 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법
JPH09230894A (ja) 音声圧縮伸張装置及び音声圧縮伸張方法
JP3472279B2 (ja) 音声符号化パラメータ符号化方法及び装置
JP4645869B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JPH07183857A (ja) 伝送システム
JP2552102B2 (ja) ディジタルデータのフォーマッチング/ディフォーマッチング回路
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP4538705B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JPH05268098A (ja) 反復性をもつサンプル化アナログ信号をコード化しデコードするための方法およびその装置
JPH08101698A (ja) 音響信号圧縮伸張装置及び音響信号圧縮伸張方法
JPH11145846A (ja) 信号圧縮伸張装置及び方法
JP2778128B2 (ja) 適応変換符号化の方法及び装置
JP2018146652A (ja) 音声のコーディング・デコーディング方法
JP3146121B2 (ja) 符号化復号化装置
JP3930596B2 (ja) 音声信号符号化方法
JP4024784B2 (ja) オーディオ復号装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030506