JPH09230894A

JPH09230894A - 音声圧縮伸張装置及び音声圧縮伸張方法

Info

Publication number: JPH09230894A
Application number: JP8032006A
Authority: JP
Inventors: Shogo Nakamura; 尚五中村
Original assignee: Fuji Soft Inc
Current assignee: Fuji Soft Inc
Priority date: 1996-02-20
Filing date: 1996-02-20
Publication date: 1997-09-05

Abstract

(57)【要約】【目的】高い圧縮率を実現するとともに、音声情報の
再現性も良い音声圧縮伸張が可能な音声圧縮伸張装置を
提供する。【構成】デジタル音声信号を帯域分割部１２で８チャ
ンネルの等帯域に分割し、判定部１３で分割した各帯域
を所定時間毎に時分割し、時分割した各分割帯域の音声
信号エネルギーを検出して検出エネルギーが所定閾値以
上の区間のみ量子化の対象とする。そして、量子化の対
象となった区間の各分割チャンネルのエネルギーが当該
区間の全チャンネルのトータルエネルギーの５％以上か
否かを判断し、量子化部１４は５％以上と判断された帯
域の音声信号のみを、予め計算した入力対誤差の計算結
果を登録したマッピングテーブル１５を参照して高振幅
か低振幅かで異なるテーブルより入力信号に対応するマ
ッピングデータを読み出してきて量子化を行う。伸張時
には、このデータより逆の順序で伸張処理を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声情報を圧縮する
音声圧縮装置及び圧縮音声情報を伸長する音声伸長装置
及び方法並びに音声圧縮伸長装置及び方法に関するもの
である。

【０００２】

【従来の技術】音声情報を例えば通信媒体を介して他の
装置に送信する際には、音声情報を一旦デジタル情報に
変換し、変換したデジタル情報に所定圧縮処理を施して
から送信している。そして、受信側で再び圧縮情報を伸
張する方法が用いられている。

【０００３】従来は、この音声情報波形を直接圧縮する
方法としては、音声情報の差分を基に圧縮を行うＡＤＰ
ＣＭによる圧縮方法が用いられていた。

【０００４】係る点を解消するために、本願発明者は特
願平６−２３７８８５号において、デジタル音声信号を
帯域分割部１２で８チャンネルの等帯域に分割して分割
領域を更に有音域と無音域に分け、有音域のみを量子化
誤差を最少とする折れ線テーブル１５に予め登録されて
いる折れ線で近似させる折れ線量子化を行なう方法を提
案した。

【０００５】

【発明が解決しようとする課題】しかしながら、上記の
圧縮方法では折れ線テーブルより得られた折れ線一次関
数を用いた演算により量子化を行なう必要があり、どう
しても演算処理が避けられず、高速での処理が困難であ
った。

【０００６】

【課題を解決するための手段】本発明は上述の課題を解
決することを目的としてなされたもので、話の内容が判
別できるとともに、話者が誰であるかということが判別
できる音声情報の圧縮伸張を可能とすることを目的とす
る。そして、係る目的を達成する一手段として以下の構
成を備える。

【０００７】即ち、デジタル音声信号を複数の等帯域に
分割する音声信号分割手段と、前記音声信号分割手段で
分割した各帯域の所定時間毎のブロックの各分割帯域の
音声信号エネルギーを検出するエネルギー検出手段と、
前記エネルギー検出手段での全分割帯域のエネルギー値
の総和が所定閾値以上か否かを判別する第１の判別手段
と、前記第１の判別手段での判別の結果、所定閾値以上
であると判別されたブロックの各分割帯域毎のエネルギ
ー占有率が所定閾値以上か否かを判別する第２の判別手
段と、前記第２の判別手段が所定閾値以上と判断された
帯域の音声信号のみを量子化する量子化手段とを備え、
前記量子化手段による量子化は、予め必要な所定の量子
化関数を用いて入力情報を量子化した際の量子化結果を
予め計算して前記入力情報と関連して量子化テーブルと
して登録しておき、入力情報に従って前記量子化テーブ
ルを検索し、所望の量子化結果を読み出すことにより行
なうことを特徴とする音声圧縮装置とする。

【０００８】そして例えば、前記量子化手段の量子化テ
ーブルには、量子化対象ブロックの入力情報に低振幅の
占有率が多い場合と高振幅の占有率が多い場合とで異な
る量子化関数を用いて量子化関数毎の入力情報と量子化
結果とを対応付けて登録し、前記量子化手段は、量子化
対象ブロックの入力情報の振幅の占有率に従って適応す
る量子化関数による量子化結果を選択することを特徴と
する。

【０００９】更に、例えば前記量子化手段での量子化情
報と前記第１及び第２の判別手段の判別結果を出力する
出力手段を備えることを特徴とする。そして、例えば前
記出力での出力情報は、無音ブロックの場合には無音区
間を示す情報と無音区間の長さ情報であり、有音ブロッ
クの場合には有音区間を示す情報と有音帯域を示す情
報、各帯域中の原情報の最大値、量子化テーブルにおけ
る選択情報及び量子化結果を含むことを特徴とする。

【００１０】また、前記音声圧縮装置の出力手段よりの
出力情報を受け取る受信手段と、前記受信手段で受信し
た前記量子化手段での量子化情報に従って量子化情報を
伸張復元する伸張手段と、前記伸張手段で伸張した各帯
域の復元情報を前記受信手段で受信した前記第１及び第
２の判別手段の判別結果に従って混合して分割音声情報
を復元する混合手段を備えることを特徴とする音声伸長
装置とする。

【００１１】

【作用】以上の構成において、簡単な処理で高い圧縮率
を実現するとともに、音声情報の再現性も良い音声圧縮
伸張が可能となる。

【００１２】

【発明の実施の形態】以下、図面を参照して本発明に係
る発明の実施の形態の一例を詳細に説明する。

【００１３】図１は本発明に係る発明の実施の形態の一
例の音声圧縮伸張装置の構成を示すブロック図である。
図中、１１はマイクロホン１７より入力されるアナログ
音声情報を対応するデジタル音声情報に変換するアナロ
グ−デジタル変換部（Ａ／Ｄ変換部）であり、本例にお
いては６４Ｋバイト／秒のデータ量を持つ音声データに
変換することが可能である。１２はデジタル化された８
ビット、８ｋＨｚのデータ量を持つ音声データをサブバ
ンドフィルタを用いて１ｋＨｚ毎の８つのチャンネルに
帯域分割している。８チャンネルの等帯域分割（本例で
は１０００Ｈｚ毎の等帯域）するウエーブレットフィル
タによる帯域分割を行う帯域分割部である。

【００１４】又、１３は音声データの量子化にあたっ
て、入力された音声データの無音区間／有音区間の判定
及び各分割帯域（チャネンル）毎のデータの有無を判定
する判定部であり、本例においては、全チャンネル毎の
有音区間と無音区間とを判別する有音区間判別部分と、
有音区間判別部分で有音区間であると判別された場合
に、この有音区間のどのチャンネルが有音チャネルであ
るかを判別する有音チャンネル判別部分とで構成されて
いる。本例では、同時刻の全チャンネルの２０ms毎のブ
ロックのエネルギーを計算する。そして、全チャンネル
のエネルギー量の多いブロックを有音ブロックと判定
し、次に判定したブロックのうちのエネルギー占有率の
高いチャンネルのみを量子化して伝送するように制御し
ており、このための伝送チャンネルをここで判定してい
る。

【００１５】１４は詳細を後述するマッピングテーブル
１５に登録されているマッピングデータに従って当該帯
域の音声データを量子化する量子化部である。

【００１６】１５は量子化部１４での量子化のためのマ
ッピングデータを所定数保持するマッピングテーブルで
ある。マッピングテーブル１５の詳細は後述する。１６
は判定部１３での判定結果情報及び量子化部１４での量
子化データとを関連付けてパケット化し、送信データと
して他の装置宛出力可能な出力部である。又、１７は音
声を対応するアナログ信号に変換するマイクロホンであ
る。

【００１７】更に、２１は他の装置よりの量子化情報及
び量子化に対する相手装置判定部の判定結果を包含する
相手装置よりの受信データを受け取る入力部である。２
２は受信データ中の上記相手装置判定部の判定結果を受
け取り、送られてきた量子化データがどの帯域のデータ
か等を判別し、伸張処理をすべきチャンネル（有音区
間）を判定する有音区間判定部、２３は有音区間判定部
２２で判定した有音区間チャンネルについて、マッピン
グテーブル１５を参照して該当チャンネルの伸張処理を
行い量子化以前の音声データに変換して時系列合成部２
４に出力する伸張部である。

【００１８】２４は伸張部２３よりの各チャネル毎の一
定区間の音声データを時系列合成する時系列合成部、２
５は先の帯域分割部と同様のウエーブレットフィルタに
より時系列合成部で時系列に合成された各チャンネル毎
に分割された帯域毎の音声データを合成する帯域合成
部、２６は帯域合成部２５よりのデジタル音声データを
対応するアナログ信号に変換するデジタル−アナログ変
換部（Ｄ／Ａ変換部）である。また、２７はアナログ音
声信号を音響出力するスピーカである。

【００１９】本例においては、上述したようにマイク１
７よりのアナログデータを処理して量子化して出力する
とともに、受取った量子化データを対応するアナログ信
号に変換してスピーカ２７より出力することもできる
が、デジタル音声データを直接帯域分割部１２に入力す
ることができる。また、同様に帯域合成部２５よりの合
成デジタル音声データとして出力することも可能に構成
されており、コンピュータ等よりのデジタルデータや、
記憶装置に記憶されているデジタル音声データを再現性
に優れ、且つ高い圧縮率での圧縮処理を施し、少ない量
のデータとして別の記憶装置に記憶したり、転送したり
することが可能となる。そして、必要に応じて本例の伸
長部で伸長してデジタル音声データとして出力すること
もできる。

【００２０】以上の構成を備える本例の各部の詳細を以
下に説明する。まず帯域分割部の機能構成を図２に示
す。

【００２１】本例のサブフィルタは、図２に示すように
合計７のサブフィルタで構成されている。１つのサブフ
ィルタにおいては、入力をローパスフィルタＨ０及びハ
イパスフィルタＨ１の２つの分解フィルタに入力させ、
この２つのフィルタを通過した後（１／２）にデシメー
ションされて２つの帯域に夫々分割される様に動作す
る。このように、１段で（１／２）のデシメーションを
行うので、例えば８ＫＨｚの帯域を有する入力データを
１ＫＨＺ毎の８つのチャンネルに分割する場合には、図
２に示す様に７つのサブフィルタ構成で合計３段のデシ
メーションを行ない、１／８のデータ数に分割して８チ
ャンネルの各帯域に分割すればよい。

【００２２】このフィルタ（ウエーブレットフィルタ）
の具体的な構成例を図３に、図３に示すフィルタによる
合計３段のフィルタリングのタイミングチャートを図４
に示す。図４に示すように、第１段のステージ、第２段
のステージ、第３段のステージの各分割動作は同時に並
行して行われる。

【００２３】本例においては、図３に示すように、サブ
フィルタプロセッサ部３０、入力データを一次保持する
データメモリとして、入力データを保持する第１段メモ
リ４１、第１段目の分割結果を保持する第２段メモリ４
２、第２段目の分割結果を保持する第３段メモリ４３の
合計３つのデータメモリ及び各メモリ４１〜４３のいず
れかのメモリ読み出しデータを選択してサブフィルタプ
ロセッサ部３０に供給するセレクタ４４、ウェーブレッ
ト係数を保持するウェーブレット係数テーブル５０とよ
り構成されている。

【００２４】そして、サブフィルタプロセッサ部３０
は、入力信号を一次保持するＤ−タイプのフリップフロ
ップ３１、出力する分割後の信号を一次保持するＤ−タ
イプのフリップフロップ３４、乗算器３２、加算器３
３、各チャンネルの分割処理を時分割で行なうことよ
り、時分割処理信号を一次保持する分割データの６デー
タ分の記憶容量を有するシフトレジスタ（ディレイメモ
リ）３５より構成されている。

【００２５】フリップフロップ３１の出力は第１段メモ
リ４１に送られ、入力信号が第１段メモリ４１に記憶さ
れるようになっている。ここには、そして、乗算器３２
にはセレクタ４４を介して入力されるデータメモリより
のデータと、ウェーブレット係数テーブル５０よりのウ
ェーブレット係数が入力されており、データメモリに記
憶された入力データを分割周波数で定まるウエーブレッ
ト係数で乗算する。

【００２６】そしてこの乗算器３２の出力は加算器３３
を介して第２段メモリ４２と第３段メモリ４３、及びフ
リップフロップ３４に出力される。レジスタ３５は、最
終出力が８つに分割された帯域のデータであるため、後
述する第４図に示すタイミングで最終分割データの各チ
ャンネルの出力データを生成する時に、この生成に必要
な６チャンネル分の分割データを一次保持するためのも
のである。そして、この最終出力を行なう時に順次読み
出されて加算器３３に送られ、加算器３３、フリップフ
ロップを介して出力信号として出力されることになる。

【００２７】本例においては、以上の構成を備え、図４
に示すような動作を行なう。第１段のサブフィルタにお
いては、例えば最初のタイミングで入力される入力１、
２が第１ステージの第１のタイミングで１２Ｈと１２Ｌ
とに２分割される。続いて第２のタイムングにおいては
入力３、４が３４Ｈと３４Ｌとに２分割され、第３のタ
イミングでは入力５、６が５６Ｈと５６Ｌとに２分割さ
れ、第４のタイミングで入力７、８が７８Ｈと７８Ｌと
に２分割される。以下同様に次の入力に対しても同様の
タイミングでの分割が行われる。

【００２８】一方、第２ステージにおいては、第３のタ
イミングにおいて、第１のタイミング及び第２のタイミ
ングで第１ステージのサブフィルタで分割した１２Ｈと
３４Ｈを入力し、これを２分割して１−４ＨＨと１−４
ＨＬを出力する。同様に、第４のタイミングにおいて、
第１のタイミング及び第２のタイミングで第１ステージ
のサブフィルタで分割した１２Ｌと３４Ｌを入力し、こ
れを２分割して１−４ＬＨと１−４ＬＬを出力する。

【００２９】続いて第５のタイミングで第３のタイミン
グ及び第４のタイミングで第１ステージのサブフィルタ
で分割した５６Ｈと７８Ｈを入力し、これを２分割して
５−８ＨＨと５−８ＨＬを出力する。更に第６のタイミ
ングで第３のタイミング及び第４のタイミングで第１ス
テージのサブフィルタで分割した５６Ｌと７８Ｌを入力
し、これを２分割して５−８ＬＨと５−８ＬＬを出力す
る。

【００３０】更に、第３ステージにおいては、第６のタ
イミングにおいて、第３のタイミング及び第５のタイミ
ングで第２ステージのサブフィルタで分割した１−４Ｈ
Ｈと５−８ＨＨを入力し、これを２分割して１−８ＨＨ
Ｈと１−８ＨＨＬを出力する。続いて第７のタイミング
において、第３のタイミング及び第５のタイミングで第
２ステージのサブフィルタで分割した１−４ＨＬと５−
８ＨＬを入力し、これを２分割して１−８ＨＬＨと１−
８ＨＬＬを出力する。

【００３１】更に、第８のタイミングにおいて、第４の
タイミング及び第６のタイミングで第２ステージのサブ
フィルタで分割した１−４ＬＨと５−８ＬＨを入力し、
これを２分割して１−８ＬＨＨと１−８ＬＨＬを出力す
る。続いて第９のタイミングにおいて、第４のタイミン
グ及び第６のタイミングで第２ステージのサブフィルタ
で分割した１−４ＬＬと５−８ＬＬを入力し、これを２
分割して１−８ＬＬＨと１−８ＬＬＬを出力する。

【００３２】以上の動作をするサブフィルタにおいて、
第１段（第１ステージ）動作として、入力信号の１、２
を第１段メモリの（０）に、３、４を第１段メモリの
（１）に、５、６を第１段メモリの（２）に、７、８を
第１段メモリの（３）にそれぞれ順次格納する。そし
て、１、２を第１段メモリの（０）に格納すると、上記
第１のタイミング（３、４を第１段メモリの（１）に格
納するタイミング）でこれを読み出してきてセレクタ４
４を介して乗算器３２に入力させる。同時にウェーブレ
ット係数テーブル５０より第１段のウェーブレット係数
Ｈ（３）、Ｌ（３）を読み出してきて乗算し、第１段の
帯域分割を行い、上述したタイミングで入力情報を２つ
に分割する。分割結果は順次第２段メモリに格納され
る。

【００３３】第２段で分割された結果は第３段メモリ４
３に格納され、第３段で分割された分割結果はフリップ
フロップ３４を介して出力信号として順次出力される。
各ステージにおいて乗算器に供給するウェーブレット係
数Ｈ（ｎ）、Ｌ（ｎ）は、上述した第１段ではＨ
（３）、Ｌ（３）を、第２段ではＨ（２）、Ｌ（２）を
第３段ではＨ（１）、Ｌ（１）を使用し、最後の出力の
場合にＨ（０）、Ｌ（０）を用いる。

【００３４】本例においては、以上の第１段より第３段
の各フイルタリング処理は、図３に示すサブフィルタプ
ロセッサを図４に示すタイミングで時分割して行なって
おり、最終的な出力においてはチャンネル１よりチャン
ネル８に８分割した分割データが出力することになる。
これは、本例におけるサブフィルタは、入力データを、
分割周波数で定まるウェーブレット係数テーブル５０に
記憶されたウエーブレット係数で乗算する乗算器により
構成されており、このウエーブレット係数を変更するの
みで任意の周波数での分割が可能であることより可能と
なるものである。図３に示すように、１つのサブフィル
タを、時分割動作させることにより構成を簡略化でき
る。

【００３５】尚、後述する帯域合成部２５における合成
フィルタもフィルタ部構成については全く同様の構成と
なっている。図２、及び図３に示すサブフィルタの周波
数特性を図５に、図３におけるウエーブレット係数の使
用例を図６に示す。以上に説明したウエーブレットフィ
ルタの原理を以下で詳細に説明する。

【００３６】本例で用いている離散ウエーブレット変換
は、信号の解析手段として用いられているものであり、
原理的には以下に示す式１で表されるように、入力され
る信号をウエーブレット母関数ψ0より作られる族ψn,m
＝ψ0（k-2nｍ）・・・によって作られる空間に展開し
たものである。

【００３７】

【数１】ここで、ｎ＝１，２，・・・はスケールパラメータであ
り、ｍ＝１，２，・・・はシフトを表す。

【００３８】しかし、実際の利用においては、有限のス
ケールで表す必要があり、本例においては有限なウエー
ブレット空間とその補空間とに分割されて表される以下
に示す式２を用いてウエーブレット変換を行う。

【００３９】

【数２】なお、本例においては、８ビット、８ｋＨｚのデータ量
を持つ音声データを、１ｋＨｚ毎の８つのチャンネルに
帯域分割している。

【００４０】しかし、帯域分割の例は以上の例に限定さ
れるものではなく、任意の数に、また任意の帯域で分割
しても良いことは勿論である。伸長部２３においいて
は、後述する量子化部１４と同様にマッピングテーブル
を参照して量子化された圧縮データを量子化の際に用い
たマッピングテーブルを逆に利用して８ビットの復調デ
ータを読み出すことにより復調処理を行なう。

【００４１】次に、帯域合成部２５の詳細構成を説明す
る。帯域合成部２５は図７に示す構成を備えている。即
ち、帯域分割部１２とは逆に８チャンネルの分割帯域デ
ータを合成するものであり、（１／８）にデシメーショ
ンされた信号を、図７に破線で分離した２つの（×２）
デシメーション部、ローパスフィルタＧ０及びハイパス
フィルタＧ１とを１ブロックとした合成フィルタ構成を
採用しており、このブロックを分割帯域数に従って分割
フィルタと同様７ブロック備える構成としている。

【００４２】具体的には、各フィルタはすべて分割フィ
ルタと同様に図３に示す構成となっており、入力データ
を一次記憶するデータメモリ３１、フィルタ特性を決定
するウエーブレット係数を保持して乗算器３３に出力す
るウエーブレット係数出力部３２、及びデータメモリ３
１よりの入力データにウエーブレット係数を乗算する乗
算器３３で構成されている。次に図１に示す判定部１３
の詳細を図８のフローチャートを参照して説明する。判
定部１２では、まずステップＳ１に示すように、帯域分
割部１２で分割された８チャンネルの出力を所定区間、
例えば２０msec（データ数にすると２０点）毎に区切
り、これを１つの判定区間とする。そして、この１つの
区間における８チャンネル分の全ての帯域のエネルギー
を加算し、それを８チャンネル分すべて合計する。そし
てこの合計値をある時刻の区間におけるトータルエネル
ギーとする。

【００４３】次にステップＳ２において、ステップＳ１
で求めたトータルエネルギーより入力された音声信号
（トータルエネルギー）が所定の閾値レベル以下かを調
べる。トータルエネルギーが所定閾値以下であればステ
ップＳ３に進み、すべてのチャンネルについて無音区間
とし、量子化部１４での量子化を行わずにステップＳ４
で出力部１６には全チャンネル無音区間であることを示
す信号を出力するのみで足りる。

【００４４】一方、この区間のトータルエネルギーが所
定閾値以下でなければステップＳ５に進み、有音区間で
あると判別する。そして、続いてステップＳ６で各チャ
ンネル毎の帯域分割部１２出力を上記トータルエネルギ
ーと比較する。そして各チャンネルの出力がトータルエ
ネルギーと比較して所定レベル以上であるか否かを調べ
る。そして所定レベルに達していないチャンネルはカッ
トし、所定レベル以上のチャンネルのみを抽出する。カ
ットしたチャンネルは以下の量子化処理を行なわず信号
成分としないように制御する。

【００４５】この所定レベルの取り方によって圧縮率及
び音声信号の原音と再生音の誤差が大きな影響を受ける
ことになる。このため、発明者はこのカットレベルを種
々変更して原音と再生音との誤差を比較し、圧縮率と忠
実な再声音とのバランスを考慮して最適なカットレベル
としてトータルエネルギーの５％を設定した。即ち、本
例では各チャンネルの出力がトータルエネルギーの５％
以下のチャンネルはカットするように制御する。

【００４６】以後は、ステップＳ７に示すように抽出チ
ャンネルのみ量子化するように量子化部１４に指示し、
抽出チャンネル情報を出力部１６に出力する。

【００４７】この判定部１３の判定の結果及び出力部１
６よりの出力圧縮情報の例を図９に示す。図９上部の１
マスが１チャンネルの２０ｍｓの区間を表し、黒で示し
た区間のみ圧縮（量子化）対象となることを示してい
る。種々の音声信号に対して統計を取った結果略この段
階で少なくとも（３／８）程度の信号圧縮が実現してい
る。

【００４８】そして、本例では更に圧縮を進めるために
量子化部１４で以下に説明する量子化を行ない、最終的
な出力部１６出力の段階では平均圧縮率（１／１２）を
達成している。

【００４９】本例における量子化処理を図１０を参照し
て以下に説明する。本例においては、量子化部１４にお
ける量子化は、量子化テーブル１５を参照して行われ
る。量子化テーブル１５には、量子化対象ブロックの入
力情報に低振幅の占有率が多い場合と高振幅の占有率が
多い場合とで異なる量子化関数を用いて量子化関数毎の
入力情報と量子化結果とを対応付けて登録しておく。そ
して、量子化部１４は、量子化対象ブロックの入力情報
の振幅の占有率に従って適応する量子化関数による量子
化結果を選択して読み出すことにより行なう。

【００５０】具体的には、図１０にで示す入力Ｘｎ
が、ｆによってに示すようにｙｎ＝ｆ（ｘｎ）とな
る。更に、（ｙｎ）がｙ軸上で量子化されたものをｙｍ
＝（Ｑ）［ｆ（ｘｎ）］とする。（Ｑ）はアナログ
−デジタル変換に相当する量子化関数である。

【００５１】そして、ｙ（ｍ）を復調したときの誤差を
求めるため、に示すｆ（ｙｎ）を求め、５でそれを
ｘ軸上で量子化してｘｍを求める。ｘｍ＝Ｑ［ｆ
（ｙｍ）］であり、Ｑはｘ軸上での量子化関数であ
る。

【００５２】従って、符号化、復号化の結果を考慮する
と、ｘｎの入力に対してｘｍ−ｘｎの量子化誤差が発生
することになる。この誤差は、入力であるｘｎが定まれ
ば一義的に定まるものであり、このような入力対誤差の
関係を全ての入力格子点について予め計算し、登録して
おけば、結果としてｆ（ｘ）、ｆ（ｘ）の計算を省略
することが可能である。

【００５３】本例においては、以上の点を応用して、こ
の入力ｘｎに対するｘｍ−ｘｎの量子化誤差を全ての格
子点について予め計算し、マッピングテーブル１５に登
録しておくことにより、ｆ（ｘ）、ｆ（ｘ）の計算を
省略している。そして、以上の誤差も、入力信号の振幅
により２通りの量子化関数に対するものを記憶してお
り、入力が高振幅の場合と低振幅の場合とで２種類を登
録している。尚、この登録種類は２種類に何ら限定され
るものではない。

【００５４】このようにして求めたマッピングテーブル
の例を図１１及び図１２に示す。図１１がこの量子化ブ
ロックの最大振幅が所定閾値以下である低振幅の場合の
マッピングテーブルを、図１２は高振幅である場合のマ
ッピングテーブルの例を示している。また、図１３は入
力対誤差の関係の計算結果をグラフ化して示した図であ
る。１３０が入力と出力間に誤差がない場合、１３１が
図１１に示すマッピングテーブル１を、１３２が図１２
に示すマッピングテーブル２を示している。

【００５５】本例においては、以上の入力対誤差の量と
共に、図１１及び図１２に示す様に出力ビットが４ビッ
トの場合と出力５ビットの場合の出力８ビットの復調出
力等が登録されており、入力の値に応じて出力が直ちに
得られ、簡単な操作で且つ高速で量子化処理を行なうこ
とができる。

【００５６】以上説明したように本例によれば、入力対
量子化（復号化）誤差を予め全ての入力値に対して計算
してテーブルに登録しておくことにより、量子化の場合
における量子化関数の演算計算を省略することができ、
量子化に際しての負荷を大きく低減することができる。
また、出力が一定閾値以上のチャンネルのみ上記量子化
を行うことにより、誤差が最少で且つ高い圧縮率の音声
情報圧縮が実現する。

【００５７】以上説明したように本例によれば、音声情
報を８チャンネルの等帯域に分割し、各チャンネル毎に
一定の区間で音声信号レベルが低い場合に、信号をカッ
トすることにより、優れた圧縮率が得られ、且つその後
の量子化テーブル（マッピングテーブル）を参照するの
みで関数計算を行なうこと無く量子化することを実現
し、量子化に係る負荷を大きく削減するとともに、更な
る高い圧縮率を実現しながら、優れた再現性の得られる
音声圧縮が提供できる。この結果、圧縮音声情報を他の
装置に送信する場合にも、少ない送信データ量で済み、
送受信双方の必要メモリ容量が削減できると共に、通信
時間も短縮することができる。

【００５８】この本例における出力部１６よりの出力
は、出力部１６に判定部１３より入力される無音区間で
あることを示すデータ、有音区間である場合に量子化し
たチャンネル情報及び当該チャンネルの振幅のもっとも
大きな音声信号の最大値情報、量子化部１４よりの量子
化データを図９の下部に示すフォーマットで出力する。
この出力部１６よりの出力データは、通信媒体を介して
他の装置に転送されても良く、また外部磁気記憶装置等
に記憶されてもよい。

【００５９】出力部１６よりの出力は、判定部１３より
の判定の結果、出力しようとする区間が無音区間である
場合には、先頭ビットに（０）を割り当て、以下の７ビ
ットに無音区間の継続ブロック長を格納する。本例にお
いては１区間（１ブロック）２０ｍｓであるので、７ビ
ットで最大２、５秒間分の無音区間情報を一括して８ビ
ットのデータとして表現することができる。

【００６０】一方、有音区間であった場合には先頭ビッ
トに（１）を割り当て、続く８ビットで帯域分割部１２
で分割した８チャンネルの各チャンネルのどのチャンネ
ルを量子化したかを示す。即ち、量子化したチャンネル
のみ（１）をセットする。続いて、順次有音チャンネル
をブロック後とに適応量子化関数の番号（マッピングテ
ーブルの番号）、オリジナルデータのブロック中の最大
値、量子化データの順で出力される。なお、無音チャン
ネルがある場合にはそのチャンネルの情報は伝送しな
い。

【００６１】以上の様にすることで圧縮後のデータ量を
少ないものとできる。

【００６２】本例の圧縮及び伸長処理のシュミレーショ
ンを行なった結果の例を図１４に示す。図１４は、８ビ
ット、８ＫＨｚの１０秒間の音声入力のシュミレーショ
ン結果を示す図である。図１４において、（ａ）は帯域
分割部１２への入力信号波形、（ｂ）は帯域分割部で分
割した有音ブロックの１チャンネルの帯域データ、
（ｃ）は量子化部１４で量子化した量子化データ、
（ｄ）はこのデータを伸長部で伸長し、、時系列合成部
で合成した復調データの夫々の波形例を示している。

【００６３】以上の本例の音声圧縮伸張処理を行った結
果、再合成された音声が、「誰がそのスピーチを行って
いるか？」、「何を喋っているか？」といった条件を満
たす圧縮を行ないながら平均で（１／１２）という高い
圧縮率が得られた。

【００６４】尚、以上の説明は入出力をアナログ信号と
したが、コンピュータ等での処理データを送受信する場
合には、入出力データはデジタルデータとなり、変換部
１１，２６が不要となる。又、本例はあらゆる音声情報
の圧縮伸張処理に適用可能であり、圧縮した音声情報を
記憶装置に記憶しておき、これを後で再生するような場
合にも適用可能なことは勿論である。

【００６５】以上説明した様に本例によれば、マッピン
グテーブルを参照するのみで特別の演算なしに量子化す
ることができ、高速で且つ簡単な制御で量子化処理を行
なうことができる。このため、コンピュータ制御等で係
る量子化処理を行なっても、コンピュータの負荷を少な
いものとできる。

【００６６】また、量子化に先立って入力音声信号を所
定時間毎に区切り、この時間（区間）内の入力信号が無
音区間か、或は有音区間かを判別し、無音区間について
はその区間についての量子化を行なわず、有音区間であ
っても音声信号を８チャンネルの帯域に分割して、チャ
ンネル内のエネルギーが所定量以上のチャンネルのみを
有音チャンネルとして量子化し、エネルギーの低いチャ
ンネルについての量子化を行なわないように制御するた
め、大きな圧縮効果を得ることができる。

【００６７】しかも、上記有音チャンネルの判別に際し
て、有音チャンネルか否かを単に一定の閾値を基準に判
断するのではなく、このチャンネルが含まれる区間の全
チャンネルの総エネルギーを基準に閾値を変更すること
により、確実に有音チャンネルのみを選択することがで
き、非常に高精度且つ効率の良い圧縮処理が行なえる。

【００６８】この結果、圧縮音声情報を他の装置に送信
する場合にも、少ない送信データ量で済み、送受信双方
の必要メモリ容量が削減できると共に、通信時間も短縮
することができる。なお、以上の説明は音声情報波形の
圧縮・伸長方法を例に説明を行なったが、本発明は音声
の波形圧縮・伸長方法に限定されるものではなく、種々
の波形情報の圧縮・伸長処理に広く適用することができ
る。この場合においても、以上に説明した構成をそのま
ま用いることができ、各種信号波形の圧縮・伸長に多大
の効果が得られる。発明者が多大な圧縮・伸長効果が得
られるものとして確認した波形情報としては、各種生体
測定情報（心電図情報等）の圧縮・伸長処理があり、特
に長時間の測定を行なうホルター心電計の心電図波形の
圧縮に用いることにより、高い圧縮率が実現でき、小型
で長時間の心電図情報記録が実現する。生体情報の場合
には、信号波形の現れる帯域も比較的限定されており、
特に本発明による圧縮効果が期待できる。また、人工衛
星よりの各種観測情報の転送に上述の圧縮方法を用いる
ことにより、従来に比しＣＰＵ等の負荷が少なくすると
ともに、高い圧縮率での信号送信が可能となる。この
他、信号波形を直接圧縮伸張するものであれば全てに高
い圧縮率が実現し、あらゆる信号波形を直接圧縮する処
理を行う全ての場合に適用できる。

【００６９】

【発明の効果】以上説明した様に本発明によれば、マッ
ピングテーブルを参照するのみで特別の演算なしに量子
化することができ、高速で且つ簡単な制御で量子化処理
を行なうことができる。このため、コンピュータ制御等
で係る量子化処理を行なっても、コンピュータの負荷を
少ないものとでき、高い圧縮率を実現しながら、優れた
再現性の得られる音声圧縮伸張が提供できる。この結
果、圧縮音声情報を他の装置に送信する場合にも、少な
い送信データ量で済み、送受信双方の必要メモリ容量が
削減できると共に、通信時間も短縮することができる。

【００７０】

【図面の簡単な説明】

【図１】本発明に係る発明の実施の形態の一例を示すブ
ロック図である。

【図２】図１に示す本例の帯域分割部の詳細構成例を示
す図である。

【図３】図２に示す本例の帯域分割部のサブフィルタの
詳細構成例を示す図である。

【図４】本例の図３に示すサブフィルタの動作タイミン
グチャートである。

【図５】本例の分割フィルタの振幅特性を示す図であ
る。

【図６】本例の分割フィルタのフィルタ係数を示す図で
ある。

【図７】図２に示す本例の帯域合成部の詳細構成例を示
す図である。

【図８】本例における図１に示す判定部の動作を説明す
るための図である。

【図９】本例の分割チャネルの各区間のエネルギー分布
の例を示す図である。

【図１０】本例の量子化部における量子化原理を説明す
るための図である。

【図１１】本例におけるマッピングテーブルの例を示す
図である。

【図１２】本例におけるマッピングテーブルの例を示す
図である。

【図１３】本例におけるマッピングテーブルに登録され
ている入力と量子化、復調化後の発生誤差の計算例を示
す図である。

【図１４】本例における入力音声信号波形と圧縮伸張処
理後の出力波形の例を示す図である。

【符号の説明】

１１アナログ−デジタル変換部（Ａ／Ｄ変換部）１２帯域分割部１３判定部１４量子化部１５マッピングテーブル１６出力部１７マイクロホン２１入力部２２有音区間判定部２３伸張部２４時系列合成部２５帯域合成部２６デジタル−アナログ変換部（Ｄ／Ａ変換部）２７スピーカ３０サブフィルタプロセッサ部４１第１段メモリ４２第２段メモリ４３第３段メモリ４４セレクタ５０ウェーブレット係数テーブル

Claims

【特許請求の範囲】

【請求項１】デジタル音声信号を複数の等帯域に分割
する音声信号分割手段と、前記音声信号分割手段で分割した各帯域の所定時間毎の
ブロックの各分割帯域の音声信号エネルギーを検出する
エネルギー検出手段と、前記エネルギー検出手段での全分割帯域のエネルギー値
の総和が所定閾値以上か否かを判別する第１の判別手段
と、前記第１の判別手段での判別の結果、所定閾値以上であ
ると判別されたブロックの各分割帯域毎のエネルギー占
有率が所定閾値以上か否かを判別する第２の判別手段
と、前記第２の判別手段が所定閾値以上と判断された帯域の
音声信号のみを量子化する量子化手段とを備え、前記量子化手段による量子化は、予め必要な所定の量子
化関数を用いて入力情報を量子化した際の量子化結果を
予め計算して前記入力情報と関連して量子化テーブルと
して登録しておき、入力情報に従って前記量子化テーブ
ルを検索し、所望の量子化結果を読み出すことにより行
なうことを特徴とする音声圧縮装置。
【請求項２】前記量子化手段の量子化テーブルには、
量子化対象ブロックの入力情報に低振幅の占有率が多い
場合と高振幅の占有率が多い場合とで異なる量子化関数
を用いて量子化関数毎の入力情報と量子化結果とを対応
付けて登録し、前記量子化手段は、量子化対象ブロック
の入力情報の振幅の占有率に従って適応する量子化関数
による量子化結果を選択することを特徴とする請求項１
記載の音声圧縮装置。
【請求項３】更に、前記量子化手段での量子化情報と
前記第１及び第２の判別手段の判別結果を出力する出力
手段を備えることを特徴とする請求項１又は請求項２の
いずれかに記載の音声圧縮装置。
【請求項４】前記出力での出力情報は、無音ブロック
の場合には無音区間を示す情報と無音区間の長さ情報で
あり、有音ブロックの場合には有音区間を示す情報と有
音帯域を示す情報、各帯域中の原情報の最大値、量子化
テーブルにおける選択情報及び量子化結果を含むことを
特徴とする請求項３記載の音声圧縮装置。
【請求項５】請求項３又は請求項４のいずれかに記載
の音声圧縮装置の出力手段よりの出力情報を受け取る受
信手段と、前記受信手段で受信した前記量子化手段での量子化情報
に従って量子化情報を伸張復元する伸張手段と、前記伸張手段で伸張した各帯域の復元情報を前記受信手
段で受信した前記第１及び第２の判別手段の判別結果に
従って混合して分割音声情報を復元する混合手段を備え
ることを特徴とする音声伸張装置。
【請求項６】前記請求項３又は請求項４のいずれかに
記載の音声圧縮装置の構成と、前記請求項５記載の音声
伸長装置の構成を備えることを特徴とする音声圧縮伸長
装置。
【請求項７】デジタル音声信号を複数の等帯域に分割
し、分割した各帯域の所定時間毎のブロックの各分割帯
域の音声信号エネルギーを検出し、検出した全分割帯域
のエネルギー値の総和が所定閾値以上か否かを判別し、
判別の結果、所定閾値以下のブロックを無音ブロックと
し、検出した全分割帯域のエネルギー値の総和が所定閾
値以上であると判別されたブロックを有音ブロックと
し、更に有音ブロックの各分割帯域毎のエネルギー占有
率が所定閾値以上か否かを判別し、所定閾値以上と判断
された帯域の音声信号のみを量子化する音声圧縮方法で
あって、前記量子化は、予め必要な所定の量子化関数を用いて入
力情報を量子化した際の量子化結果を予め計算して前記
入力情報と関連して量子化テーブルとして登録してお
き、入力情報に従って前記量子化テーブルを検索し、所
望の量子化結果を読み出すことにより行なうことを特徴
とする音声圧縮方法。
【請求項８】前記量子化の際の量子化テーブルには、
量子化対象ブロックの入力情報に低振幅の占有率が多い
場合と高振幅の占有率が多い場合とで異なる量子化関数
を用いて量子化関数毎の入力情報と量子化結果とを対応
付けて登録し、量子化対象ブロックの入力情報の振幅の
占有率に従って適応する量子化関数による量子化結果を
選択することを特徴とする請求項７記載の音声圧縮方
法。
【請求項９】更に、他の装置に前記量子化の際の量子
化情報と前記判別の結果無音ブロックの場合には無音区
間を示す情報と無音区間の長さ情報を、有音ブロックの
場合には有音区間を示す情報と有音帯域を示す情報、各
帯域中の原情報の最大値、量子化テーブルにおける選択
情報を出力することを特徴とする請求項８記載の音声圧
縮方法。
【請求項１０】請求項９記載の出力情報を受け取り、
受取った前記量子化情報に従って量子化情報を伸張復元
すると共に、前記伸張復元した各帯域の復元情報を前記受取った前記
判別の結果無音ブロックの場合には無音区間を示す情報
と無音区間の長さ情報を、有音ブロックの場合には有音
区間を示す情報と有音帯域を示す情報、各帯域中の原情
報の最大値、量子化テーブルにおける選択情報に従って
混合して分割音声情報を復元することを特徴とする音声
伸張方法。
【請求項１１】前記請求項９記載の音声圧縮方法によ
り音声情報を圧縮し、前記請求項１０記載の音声伸長方
法により圧縮音声情報を伸長することを特徴とする音声
圧縮伸長方法。