JPS63108819A - 音声圧縮方式 - Google Patents

音声圧縮方式

Info

Publication number
JPS63108819A
JPS63108819A JP25407886A JP25407886A JPS63108819A JP S63108819 A JPS63108819 A JP S63108819A JP 25407886 A JP25407886 A JP 25407886A JP 25407886 A JP25407886 A JP 25407886A JP S63108819 A JPS63108819 A JP S63108819A
Authority
JP
Japan
Prior art keywords
data
value
difference
scale
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP25407886A
Other languages
English (en)
Inventor
Yuichi Kadokawa
雄一 門川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP25407886A priority Critical patent/JPS63108819A/ja
Priority to US07/111,102 priority patent/US4870685A/en
Priority to DE19873736193 priority patent/DE3736193A1/de
Publication of JPS63108819A publication Critical patent/JPS63108819A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 且!じ辷腎 本発明は、音声圧縮方式に関する。
丈來挟夏 例えば、高速デジタル回線を用いて音声信号を伝送した
り、音声応答装置のために音声信号を蓄積および合成す
るなど音声信号をデジタル処理するとき、この音声信号
をなんらかの方法でデジタル信号に変換する必要がある
基本的には音声信号は周波数帯域が0.3〜3.4KH
zのアナログ信号であり、これをデジタル信号に変換す
るには、例えばサンプリング周波数8KHzで分解能が
8ビツトのアナログ/デジタル変換器で変換すればよい
(PCM(Pulse Cods Modulatio
n)符号化)。
そして、このデジタル信号を元の音声信号に戻すには、
サンプリング周波数8KHzで分解能が8ビツトのデジ
タル/アナログ変換器でアナログ信号に変換し、さらに
ローパスフィルタを通して波形整形してやればよい。こ
のとき、アナログlデジタル変換器およびデジタル/ア
ナログ変換器の分解能(すなわちPCM符号のビット幅
)が大きいほど再生した音声の品質が高い。
ところで、このようなPCM符号化された音声信号は1
秒あたりのビット速度(データ速度;以下ビットレート
という)が64Kbpsとなり、このように高いビット
レートの音声信号を伝送するには非常に高速な伝送路を
必要とし、また、かかる音声信号を蓄積するためには厖
大な記憶容量のメモリを必要とする。そこで、従来から
、音声信号のビットレートを低減するための種々の提案
がなされている。
その1つに、時系列的に隣接するPCM符号の差分を形
成する差分PCM符号化方式がある。この差分PCM符
号化方式は、音声波形の相関性に基づく冗長性を利用し
たものであり、隣接したサンプル間の限られた範囲に含
まれることから、1サンプルあたりのビット数を低減す
ることができる。この差分PCM符号化方式をさらに進
めた適応差分PCM符号化方式の1つである、CCIT
Y(国際電信電話諮問委員会)勧告による適応差分PC
M方式(ADPCMf)では。
32Kbpsのビットレートを実現している。
この他には、音声信号の非安在性と線形予測可能性を利
用したAPC−AB(Adaptive Predic
tion Co−ding with Adaptiv
e Bit A11ocation)方式、または、音
声分析合成手法によるLSP(Line Spectr
umPair)方式などがある。
しかしながら、このようなADPCMf方式、APC−
AB方式およびLSP方式は、符号化および復号化の処
理が非常に複雑であり、それらを実現するための装置は
非常に高価なものとなるという不都合がある。
一方、放送衛星用の高品位なPCM音声伝送方式の1つ
に準瞬時圧伸方式がある。この準瞬時圧伸方式は、PC
M符号化された音声データを時系列に所定数ごとのブロ
ックに分割し、おのおののブロックにおける信号絶対値
の最大値に対応した最上位桁をあらわすスケールデータ
を識別し、その最上位桁を含む所定ビット数のデータを
符号データに整形するものであり、比較的符号化処理が
簡単で、かつ、容易に1サンプルのビット数を低減する
ことが可能である。しかしながら、このような準瞬時圧
伸方式は、効率的には充分なものではなを)。
そこで、この準瞬時圧伸方式の効率を改善する手法とし
てr差分PCM方式と準瞬時圧伸との結合」が考えられ
るが、一般に単に準瞬時圧伸を差分PCM方式に適用し
ただけでは、圧縮時の欠落ビットが伝送誤差を生じ、受
信側の積分器で誤差が累積して受信不能となる。
次にこの点について説明する。
いま準瞬時圧伸を差分P側方式に適用した符号化方式に
よって、第9図(a)に示したような音声信号を符号化
することを考える。まず、差分PCM符号化のためにこ
の音声信号を例えば8KHzのサンプリング周波数でサ
ンプリングしてサンプル間の差分値を形成する。ここで
は、隣接するサンプル間の差分値を符号付の8ビツトの
データすなわち2の補数表現の8ビツトデータであられ
す、そして、準瞬時圧伸のための条件は、8サンプルで
1ブロツクを構成し、伝送データは1サンプルあたり3
ビツトとする。また、スケールデータは3ビツトである
ここで、8つのサンプル#1〜#8における差分値が第
10図(a)のように得られたものとする。このブロッ
ク内において差分値の絶対値が最大になるものは、サン
プル#1であり、したがって、このときのスケール位置
PO5は、このサンプル#1のビットバタンの最上位桁
であるビット4となり、スケール位置posの値は(1
00)1になる。
これにより、各サンプルの伝送ビット(伝送データ;す
なわち符号データ)は、このスケール位置PO8よりも
1つ上位桁で、符号値をあらわすビット5(サインビッ
ト)から3ビツトのデータ、すなわち、ビット5,4.
3のデータとなる。
したがって、このブロックでは、最初にスケール位置P
O8を、それに続いてサンプル#1−#8の伝送ビット
を順次連続して配置して構成した伝送データ(符号デー
タ)は、同図(b)に示したようなものとなる。
このような符号データを復号するとき、まず。
lブロック分の符号データを3ビツトずつに分解し、そ
の最初の3ビツトの値からスケール位[PO5を識別す
る。そして、後続する3ビツトの符号データを8ビツト
のデータに伸張するときには、スケール位1tposよ
りも1つ上位桁に符号データのMSB (最上位ビット
)を一致させ、そのMSBよりも上位桁の各桁には符号
ビットの値をセットし、そのLSB (最下位ビット)
よりも下位桁の各桁には0をセットする。
これにより、同図(C)に示したデータが、復号後のデ
ータとして得られる。このデータと、符号化前のデータ
とを比較すると、復号データでは伝送ビットよりも下位
桁の情報(直流成分)が欠落していることがわかる(第
9図(b)参照)、すなわち、情報に欠落ビットを生じ
ている。
このような復号データに基づいて音声信号を再生すると
、第9図(C)に一点鎖線で示したように、欠落ビット
分の誤差が蓄積して負の直流シフトを生じ、同図に破線
で示した元の波形よりも右下がりの波形となり、その結
果、適正に情輔を伝送することができない。
このような問題を解決する1つの方法として、「欠落・
ビットのアキュムレーションによる差分圧伸PCM(D
C−PCM)J(高橋ほか、電子通信学会論文誌’84
/10 Vol、J67−B No、10)が提案され
ている。
しかしながら、この方法は15ビット程度の差分データ
を8ビット程度に圧縮する場合に有効であり、8ビツト
の差分データを3ビット程度に圧縮するような低ビツト
レートの符号化方式には適用できない。
すなわち、このような低ビツトレートの場合にはブロッ
ク間において音声波形の振幅が大幅に変化したときなど
ブロック間でスケール位置が大幅に変動することがあり
、そのためにアキュムレーションされている誤差信号の
方が伝送すべき有効なデータよりも大きな値となること
がある。かかる場合には、伝送すべきデータが誤差信号
に埋もれてしまい、適正なデータ伝送を実現できない。
本出願人は、上述した従来技術の不都合を解決するため
、先に、低ビツトレートで、簡単な処理により、高品質
な音声を再現できる音声符号化方式を提供した。
第11図は、本出願人が先に提案した音声符号化装置の
一例を説明するための図で、この例は、差分PCM符号
化方式に準瞬時圧伸を適用したものであり、準瞬時圧伸
を施したさいにもとまるブロック化した圧縮差分データ
を順次復号し、原信号と比較することで圧縮ビット数内
で誤差の少ない差分データとなるようにサンプル点毎に
補正している。またこの例では、8KHzのサンプリン
グ周波数で音声信号をサンプリングしてサンプル間の差
分値を2の補数表現の8ビツトデータであられし、′8
サンプルで準瞬時圧伸のための1ブロツクを構成し、伝
送データは1サンプルあたり3ビツト、および、スケー
ルデータは3ピクトとする。
同図において、入力音声信号SSは、ローパスフィルタ
1によって帯域制限されたのちにアナログ/デジタル変
換器2に加えられて8ビツトのデジタル信号口Sに変換
される。このアナログ/デジタル変換器2は、サンプリ
ング周波数が8KHzで直線量子化するものである。
デジタル信号DSは、1ブロツクをなす8サンプル分の
記憶容量をもつバッファ3に蓄積され、このバッファ3
に蓄積されたデジタル信号DSdは、差分データを形成
するための加減算器4のプラス入力端に加えられている
この加減算器4から出力される9ビツトの差分データD
Dsは、最大値制限回路5によって8ビツトの差分デー
タDDに変換される。このようにして差分データの最大
値を制限したのは、次のような理由による。
すなわち、差分データDDsをそのまま準瞬時圧縮した
場合、突発的に大きな差分データを含むブロックにおい
てはそれに対応とた大きなスケール値が設定され、その
ために他の小さな差分データに対する準瞬時圧縮後のデ
ータの追従性が悪化する。その結果、復元した音声信号
が、聴覚上、ギクシャクした感じを与える。そこで、こ
のように差分データの最大値をある程度に制限すること
により、このような聴覚上の問題を解決することができ
る。
この差分データDOは、8サンプル分の記憶容量をもつ
バッファ6、準瞬時圧縮のためのスケール値を設定する
ためのスケール値設定部7および加算器8の一入力端に
加えられている。
この加算器8の出力はレジスタ9に加えられ、このレジ
スタ9の出力は加減算器4のマイナス入力端、加算器8
の低入力端、および、8サンプル分の記憶容量をもつバ
ッファlOに加えられている。
このようにして、最大値制限回路5によって8ビツトに
制限された差分データDOの積算値が加算器8によって
形成され、このデータが差分データtlDsを形成する
ための直前のサンプルのデータとして用いられている。
バッファ6の記憶データは、サンプル毎に準瞬時圧縮符
号化する準瞬時圧縮部11に加えられている。
スケール値設定部7は、最大値制限回路5から出力され
る差分データDDの連続する8サンプルのうち、最も絶
対値の大きいものを識別し、そのビットパタンの最上位
桁を判別してそのビット位置を3ビツトのスケールデー
タDKで出力する。このスケールデータDKは、準瞬時
圧縮部11、準瞬時圧縮部11から出力される圧縮差分
データDCを最適なデータに変換するための最適化処理
部12、lブロック分のデータを所定の信号形式に整形
するためのマルチプレクサ13の一入力端、および、最
適化された圧縮差分データを伸張するための準瞬時伸張
部14に加えられている。
またバッファ10の記憶データは、レジスタ9から出力
される差分データDDを積算して形成された復号データ
であり、符号化の対象である元の音声信号(以下原信号
という)として最適化処理部12に加えられている。
準瞬時圧縮部11は、バッファ6から加えられる8ビツ
トの差分データDDについて、おのおののサンプル毎に
、スケール値設定部7から加えられるスケールデータD
Kがあられすスケール位置よりも1ビツト上位桁をMS
Bとする3ビツトのデータを抜きだしてそれを圧縮差分
データDCとして最適化処理部12に出力する。
最適化処理部12は、準瞬時圧縮部11から加えられる
1ブロツク分の圧縮差分データDCを順次復号し、バッ
ファ10から加えられる原信号と比較することにより、
圧縮ビット数内で誤差の少ない差分データとなるように
サンプル点毎に圧縮差分データDCを補正し、これを最
適化差分データDCoとしてマルチプレクサ13の低入
力端および準瞬時伸張部14に加えている。
マルチプレクサ13は、第12図に示したように。
スケール値設定部7から出力されたスケールデータ囲を
先頭に配置し、それに続いて各サンプルの最適化差分デ
ータDCoを順次配置して構成した信号を、1ブロツク
分の符号化データDLとして形成して次段装置(例えば
データ伝送装置、あるいは、データ記憶装置等)に出力
する。
準瞬時伸張部14は、スケール値設定部7から加えられ
るスケールデータDKが示している桁よりも1つ上位桁
にMSBが一致すやように、最適化処理部12から出力
される3ビツトの最適化差分データDC。
を配置するとともに、それよりも上位桁には最適化差分
データDCoの符号データの値を配置し、下位桁には0
を配置して8ビツトの復号データDBを形成するもので
あり、その復号データDEは積分部15に加えられる。
積分部15は、準瞬時伸張部14から出力される復号デ
ータDF、を積算し、符号化データDLを実際に復号化
処理して復元したときの復元データSDを形成し、この
復元データSDをレジスタ9に出力している。レジスタ
9では、この復元データSDを、1つのブロックの処理
を終了して次のブロックの処理を開始する直前で取り込
む。
これにより、準瞬時圧伸に特有な欠落ビットによる誤差
の累積を1次のブロックの最初のサンプルデータを形成
するときに解消することができ。
その結果、より正確な符号化データDLを形成すること
ができる。
このようにして、本実施例では、最適化処理部12によ
って元の音声信号により追従するように圧縮差分データ
DCを補正するとともに、積分部15で形成した復元デ
ータSDによってブロック内の累積誤差を次のブロック
に反映させているので、準瞬時圧伸による低ビツトレー
トの音声符号化処理をより精度よく実現することができ
る。
次に、最適化処理部12が実行する圧縮差分データの最
適化処理について説明する。
いま、第13図(a)に示したような音声波形を符号化
することを考える。サンプル#Oを基準としてサンプル
#1j2.#3の差分をそれぞれ8ビツトで形成したと
き、この場合の差分の絶対値はサンプル#1が最大にな
る。したがって、このときの3ビツトの圧縮差分データ
はこのサンプル#1を基準に形成され、スケール値はそ
のビットバタンの最上位桁の桁位置となる。
さて、圧縮差分データを3ビツトであられした場合、表
現できるデータはスケール値よりも1ビツト下位桁の量
子化幅のものであり、したがって、おのおののサンプル
$142.#3の値は、この量子化幅で表現可能なデー
タに置換される1例えば、サンプル#1の圧縮差分デー
タはこの表現できるデータのうち実際の値pHよりも下
の値P12(=(010)s:ただしこの場合LSBは
スケール位置よりも1ビツト下位桁、以下同じ)になる
ところで、この量子化幅で表現できるデータのうち、P
I3よりも1つ大きな値P13(=(011)、)に対
応したデータの方がよりサンプル11の実際の値pHに
近い、したがって、この値P13をサンプル#1の圧縮
差分データとすれば、復号化したときの音声信号(復号
値)の誤差を小さくすることができる。
すなわち、このときの復号値の誤差は、最大でもこの圧
縮差分データの量子化幅の1/2に抑えることができる
同様に、サンプル12.#3について考えると、その復
号値が符号化前の信号の値(サンプル#2では値P21
.サンプル#3では値P31)に最も近くなる圧縮差分
データを選択すればよい。
すなわち、この場合、サンプル#2については、値P2
1よりも小さい値P22に基づいた復号値に較べて値P
21よりも大きい値P23に基づいた復号値の方がより
値P21に近いので、サンプル#1の復号値である値P
13と値P23との差分(=(010)、)を圧縮差分
データに設定する。またサンプル#3については、値P
31が圧縮差分データであられし得る復号値に一致する
ので、サンプル#2の復号値である値P23と値P31
との差分(=(010)、)を圧縮差分データに設定す
る。
このようにして、元の音声信号に対する追従性が向上し
た圧縮差分データを形成することができる。そのための
処理である最適化差分ビットルーチンの一例を第14図
(a)、(b)に示す。
まず、準瞬時圧縮部11から圧縮差分データ(OC)を
入力しく処理101)、その圧縮差分データdの値が、
圧縮ビット数(この場合は3ビツト)であられすことの
できる正の最大値MAX(=(011)、)より大きい
か、あるいは、負の最大値*xN(=(too)、)よ
り小さいかを判別しく判断102.103) 1判断1
02の結果がyEsになるときには圧縮差分データdに
値MAXを代入しく処理104)、判断103の結果が
YESになるときに圧縮差分データdに値MINを代入
する(処理105)。
次に、圧縮差分データdよりもLSB(=(001)ハ
だけ小さな値dmと圧縮差分データdよりもLSBだけ
大きな値dPを形成しく処理106,107)、値dl
lが値MINよりも小さくなった場合には値d+aに値
MINを代入しく判断108.処理109)、値dpが
値WAXよりも大きくなった場合には値dpに値MAX
を代入する(判断110゜処理111)。
このようにして値dp、daを形成すると、スケールデ
ータDKに基づいて値ct、dptd■を準瞬時伸張し
たときの8ビツトの値dd、ddp、dd飄を算出する
(処理112)、そして、この値dd、ddp、dd■
をそれぞれ1サンプル前のデータの復号値daoを加算
し、おのおのの値d、dp、daに対応したローカル復
号値d a t d a p vdamを形成する(処
理113)、なお処理112および113でローカル復
号処理を実現しており、そのために、直前のサンプルの
復号値daoを記憶しておく。
次に、当該サンプルに対応した原信号の値daiをバッ
ファ10から読み込み、この原信号の値daiと、おの
おののローカル復号値da、dap、damとの差の絶
対値DaeDPwDmを算出しく処理114)、原信号
の値daiがローカル復号値daよりも大きいかどうか
を調べる(判断115)。
この判断115の結果がYESになるときには、絶対値
Daが絶対値Dpよりも大きいかどうかを調べ(判断1
16)、この判断116の結果がYESになるときには
、値dに値dPを代入しく処理117)処理106へと
戻り、判断116の結果がNOになるときには、値dを
最適化差分データDCoとして出力する(処理118)
また判断115の結果がNOになるときには、絶対値D
aが絶対値opよりも大きいかどうかを調べ(判断11
9)、この判断119の結果がYESになるときには、
値dに値d肩を代入しく処理120)処理106へと戻
り、判断119の結判がNOになるときには処理118
を実行する。
すなわち、第13図(b)の左側に示したように、原信
号の値daiが復号値daよりも復号値dapに近いと
きには、圧縮差分データdをLSBだけ大きい値dpに
更新して、その値を最適化差分データDCoとして出力
する。また、その反対に原信号の値daiが復号値da
よりも復号値da園に近いときには、圧縮差分データd
をLSBだけ小さい値6層に更新して、その値を最適化
差分データDCoとして出力する。なお、1回の処理で
最適な値が得られなかった場合には、この処理を繰り返
し実行する。
このようにして、準瞬時圧伸で得られた圧縮差分データ
に圧縮ビットのLSBを加算、減算する操作をサンプル
点毎に繰り返し行ない、復号値と原信号との誤差を少な
くするように差分データを補正している。
なお、バッファ10に原信号として記憶するデータとし
ては、最大値制限回路5に入力される前のバッファ3の
出力データを用いることもできる。
したがって、例えば第15図(a)に示したような音声
信号(第9図(a)と同じ)をこのような最適化差分ビ
ットルーチンを用いた準瞬時圧縮によって符号化するこ
とを考える。
まず、この音声信号の8つのサンプル#1〜#8におけ
る差分値が第16図(a)のように得られ、したがって
、このときのスケール位置PO8は、サンプル11のビ
ットバタンの最上位桁であるビット4となり、スケール
位it posの値は(100)、になる、これにより
、準瞬時圧縮部11によって形成される圧縮差分データ
DCは、おのおののサンプル#1〜I8について、それ
ぞれ第16図(b)に示したものとなる。
そして、この圧縮差分データDCは、おのおののサンプ
ル#1−#8について、それぞれ上述の最適化差分ビッ
トルーチンにより第16図(e)に示したような最適化
差分データDCoにそれぞれ補正される。
その結果、後述する音声復号化装置では、この最適化差
分データDCoのおのおののサンプル$1−18の値が
第16図(d)に示したように8ビツトの差分データに
伸張され、この差分データに基づいて、音声信号が第1
5図(c)に実線で示したように復号される。ここで、
上述した圧縮差分データDCをそのまま符号化データに
用いた場合の再生された音声信号を第15図(c)に一
点鎖線で示す。
これらの比較かられかるように、最適化差分データDC
oに基づいて再生された音声信号は、第15図(c)に
破線で示した符号化前の音声信号にまとわりつくような
ものとなり、符号化前の音声信号に対する追従性が大き
く向上している。
第17図は、音声復号化装置の一例を示してい 。
るが、この音声復号化装置は、上述した音声符号化装置
によって符号化された符号化データDLを復号して音声
信号を出力するものである。
同図において9例えばデータ受信装置あるいはデータ記
憶装置等の前段装置(図示時)から出力された符号化デ
ータDLは、デマルチプレクサz1に加えられ、おのお
ののブロック毎に、先頭の3ビツトがスケール値SCと
して識別されて準瞬時伸張部22のスケール値入力端に
加えられ、それ以外のコードデータ(圧縮差分データ)
は、準瞬時伸張部22のコードデータ入力端に加えられ
る。
準瞬時伸張部22は、加えられるコードデータを3ビツ
トずつに区切るとともに、8ビツトデータにおいて入力
したスケールデータSCに対応したビット位置にその3
ビツトのデータを配置し、そのコードデータよりも上位
桁には符号ビットの内容を、下位桁には0を配置して8
ビツトデータ(第16図(d)参照)に伸張し、この8
ビツトデータを積分部23に出力する。
積分部23は、順次入力される8ビツトデータを積算し
て音声信号の各サンプルにおける信号値を形成し、これ
をデジタルlアナログ変換器24に出力する。
デジタルlアナログ変換器24は、受入した信号値を8
KHzの変換周波数で対応するアナログ信号(レベル信
号)に変換し、これをローパスフィルタ25に出力する
。このアナログ信号は、ローパスフィルタ25によって
波形整形されたのち、再生音声信号として次段装置(例
えば音声出力装置等)に出力される。
このようにして符号化データを復号するための音声復号
化装置の構成は、非常に簡単なものとなり、したがって
1例えば、汎用の8ビツトマイクロプロセツサを用いて
この音声復号化装置を実現することもでき、コストを極
く小さく抑えることができる。
ところで、準瞬時圧伸においては、1つのブロック内に
おいて信号値の絶対値が最大になるビットバタンに基づ
いてスケール位置を設定しているので、例えば、そのブ
ロックにおいて突発的に大きな値をとるサンプルがあっ
た場合、その大きな値に対応したスケール値が設定され
るため、他の小さい値に対する符号化データの追従性が
悪くなり、聴覚上好ましくないという不都合を生じるこ
とがある。
次に、このような不都合を解消できるようにした例につ
いて説明する。
さて、上述した不都合を解消するには、そのブロックに
おいて最も誤差の少ない符号化データを形成すればよく
、そのためには適切なスケール位置(値)を設定すれば
よい。
そこで、最初に設定したスケール位置に基づいて準瞬時
圧縮したときと、そのスケール位置よりも1桁上位桁を
スケール位置に設定した場合にそのスケール位置に基づ
いて準瞬時圧縮したときと。
その最初のスケール位置よりも1桁下位桁をスケール位
置に設定した場合にそのスケール位置に基づいて準瞬時
圧縮したときとで、おのおののサンプルにおいて復号値
と符号化前の音声信号の値との誤差を算出してそれらに
基づいてそれぞれのスケール位置での評価値を形成し、
この評価値に基づき、それらのスケール位置のもののう
ち最も良好なものを選択するようにしている。なお、こ
の評価値としては、おのおののサンプルにおける元の音
声信号と復号値との差の総和や、その差を自乗した値の
総和(誤差パワ)を用いることができる。
すなわち1例えば第18図(c)に示したような音声信
号があったとき、この音声信号の各サンプル#1〜#8
のうち差分値が最も大きいサンプル#1に基づいてスケ
ール値が決定され、その状態が同図であるとする。
これに対し、スケール値を1つ小さくした場合にはサン
プル値の量子化幅が1段階小さくなるので同図(b)の
状態になり、スケール値を1つ大きくした場合にはサン
プル値の量子化幅が1段階大きくなるので同図(C)の
状態となる。
また、おのおのの状態で、上述した最適化差分ビットル
ーチンによる最適化処理を実行したとき。
各サンプルにおける符号ビットは、次の表のようになる
糞 ここで、は第18図(a)の場合のスケール値を。
5C−1はSC0よりも1だけ小さい同図(b)の場合
のスケール値を、SCユはSC0よりも1だけ大きい同
図(c)の場合のスケール値をそれぞれ示している。
このようにスケール値を変更すると、当然のことながら
元の音声信号と復号値との差の総和あるいは誤差パワは
、そのブロックにおける音声信号の変化に対応していず
れか1つのスケール値のものが最小となり、その最小と
なるものが当該ブロックにおいて音声信号に対する追従
性が最良である。
例えば、実験によれば統計的にみて、スケール値SC,
のものの誤差パワが最も小さくなるのはブロック総数の
うち60%程度であり、スケール値5C−1のものの誤
差パワが最も小さくなるのはブロック総数のうち30%
程度であり、スケール値S01のものの誤差パワが最も
小さくなるのはブロック総数のうち10%程度である。
このよう楊して、ブロック毎に使用するスケール値を選
択することで、再生した音声信号の音質(聴覚上の)が
向上する。
第19図は、上述のごとき点を考慮した音声符号化装置
の一例を示す図で、同図において第11図と同一部分に
は同一符号を付し、相当する部分にはそれと同一符号に
サブイクスを付加してその説明を省略する。またこの装
置は、準瞬時圧縮の1ブロック単位に作動する。
同図において、スケール値設定部7aは、最大値制限回
路5から出力される差分データDDの連続する8サンプ
ルからなるブロックでスケール値を判別するとともに、
そのスケール値よりも1つ大きな値および1つ小さな値
を形成し、それぞれスケールデータDK、 、DKl、
DK−1として出力する。これらのスケールデータDK
、 、DK、 、DK−8は、上述したスケール値sc
、 、sc、 、5c−1にそれぞれ相当する。
スケールデータDK、は、準瞬時圧縮部1111、最適
化処理部12い準瞬時伸張部14゜およびセレクタ31
の一入力端に加えられ、スケールデータDK、は、準瞬
時圧縮部11工、最適化処理部12い準瞬時伸張部14
1およびセレクタ31の種入力端に加えられ、スケール
データDK−1は、準瞬時圧縮部11−1、最適化処理
部12−1、準瞬時伸張部14−□およびセレクタ31
のさらに他の入力端に加えられている。
準瞬時圧縮部11゜はスケールデータDK、に基づきバ
ッファ6の出力データから圧縮差分データDC,を形成
し、最適化処理部12゜はこの圧縮差分データDC,に
上述した最適化差分ビットルーチンを適用して最適化差
分データDCoI、を形成し、この最適化差分データD
Collは準瞬時伸張部14Ilおよびセレクタ32の
一入力端に加えられる。準瞬時伸張部14゜は入力され
る最適化差分データDCo、をスケールデータDK6を
基準として8ビツトデータのデータDH。
に伸張し、このデータDB、は積分部15゜によって積
算されて復号され、その復号値SD、は比較部33の一
入力端およびセレクタ34の一入力端に加えられている
また、準瞬時圧縮部11.はスケールデータDK、に基
づきバッファ6の出力データから圧縮差分データDC1
を形成、し、最適化処理部121はこの圧縮差分データ
DC1に上述した最適化差分ビットルーチンを適用して
最適化差分データDCo、を形成し、この最適化差分デ
ータDCoユは準瞬時伸張部141およびセレクタ32
の一入力端に加えられる。準瞬時伸張部14.は入力さ
れる最適化差分データDCo、をスケールデータDK1
を基準として8ビツトデータのデータOH1に伸張し、
このデータDE、は積分部15.によって積算されて復
号され、その復号値SD1は比較部33の一入力端およ
びセレクタ34の一入力端に加えられている。
同様に、準瞬時圧縮部11−1はスケールデータDK−
1に基づきバッファ6の出力データから圧縮差分データ
DC−1を形成し、最適化処理部12−1はこの圧縮差
分データDC−,に上述した最適化差分ビットルーチン
を適用して最適化差分データDCo−1を形成し、この
最適化差分データDCo−,は準瞬時伸張部14−1お
よびセレクタ32の一入力端に加えられる。
準瞬時伸張部14−1は入力される最適化差分データD
Co−1をスケールデータDK−,を基準として8ビツ
トデータのデータDE−,に伸張し、このデータDE−
,は積分部15−1によって積算されて復号され、その
復号値5O−0は比較部33の一入力端およびセレクタ
34の一入力端に加えられている。
また、最大値制限回路5から出力される差分データDD
は、バッファ10aによって1ブロツク分が蓄積され、
このバッファ10aの出力は積分部15aによって順次
積算されて圧縮されていない音声信号(すなわち原信号
)が形成され、それに対応したデータSDaが最適化処
理部12..12□12−1および比較部33に加えら
れている。
このように、比較部33には、原信号に対応したデータ
SDa、スケール値SC,(スケールデータDK、 )
に対応した最適化差分データDCo、を復号したときの
復号値SDいスケール値5C1(スケールデータDK、
)に対応した最適化差分データDCo□を復号したとき
の復号値SD1.および、スケール値5C−1(スケー
ルデータDに−1)に対応した最適化差分データDCo
−,を復号したときの復号値SD−,が、サンプル毎に
それぞれ加えられる。
比較部33番主1データSDaと復号値SD、 、SD
l、SD−。
に基づき、それらの復号値SD、 、SD、 、5D−
1におけるデータSDaからの誤差をそれぞれのサンプ
ル毎に形成し、1ブロツクにおける誤差パワをおのおの
の復号値SD、 、SDl、5D−1について算出し、
それらの中で最小値をとるものを判別する。
そして、復号値SD、についての誤差パワが最小になる
ときには、セレクタ31によってスケールデータDK、
を選択してこれをマルチプレクサ13に出力するととも
にセレクタ32によって最適化差分データDCo、を選
択してこれをマルチプレクサ13に出力する。またセレ
クタ34によって符号値SD、を選択し、これをレジス
タ9に取り込ませるデータとする。
また、復号値SD1についての誤差パワが最小になると
きは、セレクタ31によってスケールデータDK、を選
択してこれをマルチプレクサ13に出力するとともにセ
レクタ32によって最適化差分データDCo1を選択し
てこれをマルチプレクサ13に出力する。またセレクタ
34によって符号値SD1を選択し、これをレジスタ9
に取り込ませるデータとする。
同様に、復号値SD−,についての誤差パワが最小にな
るときは、セレクタ31によってスケールデータDK−
1を選択してこれをマルチプレクサ13に出力するとと
もにセレクタ32によって最適化差分データDCo−,
を選択してこれをマルチプレクサ13に出力する。また
セレクタ34によって符号値5D−8を選択し、これを
レジスタ9に取り込ませるデータとする。
したがって、マルチプレクサ13からは、そのブロック
において最も誤差パワが小さくなる符号化データDLが
出力される。
比較部33が実行する比較ルーチンの一例を第19図に
示す、まず、データSDaおよび復号値SD、 、SD
、。
SD−、をサンプル毎に入力するとともに(処理201
)、それらの入力したデータに基づき、次式を演算して
、復号値SD、 、SDl、SD−、におのおの対応し
た誤差パワPMS11.PMS□、 PMS−1をそれ
ぞれ算出する(処理202)。
2MSk=(Σ(SDaj−SDkj)”)”j=1 ここで、k=o、1.−1、jはブロック内におけるサ
ンプル番号、 5Dajはブロック内のおのおののサン
プルにおけるデータ、5Dkjはブロック内のおのおの
のサンプルにおける符号値SDkをあらわす。
そして、いずれの誤差パ’7 RMS、 、RMS、 
、RMS−1が最も小さいかを識別しく判断203,2
04,205)、最小の誤差パワRMS−=RMSt−
RMS−1に対応したスケールデータDK、、DK1.
DK−1と最適化差分データDCo、 。
DCol、DCo−1をそれぞれ選択する(処理206
,207゜208)。
なお、この比較ルーチンにおいて、おのおのの復号値S
D、 、SD、 、SD−□とデータSDaとの誤差に
基づいた評価値としては、上述した誤差パワ以外に、例
えば、おのおののサンプルにおけるデータSDaと復号
値SD、 、SD、 、SO−、との差の総和等を用い
ることができる。しかしながら、上記音声圧縮符号化方
式においては、符号化に多くの処理を必要とし。
リアルタイムでの処理がむずかしいといった欠点がある
■−−五 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、低ビツトレートで自然な音声を符号化、復号化す
る音声圧縮方式の高速化を図ることを目的としてなされ
たものである。
豊−一双 本発明は、上記目的を達成するために、PCM符号化さ
れた音声データの差分を取り、ブロック分割し、各ブロ
ックにおける絶対値の最大値に対応した最上位桁をあら
bすスケールデータを識別し、その最上位桁を含む所定
ビット数のデータを符号データに整形し、その符号デー
タから復元されるデータと原音声の誤差が小さくなる様
に補正する音声圧縮方式において、前記差分データに符
号データで有効な最も小さい値の1/2を加算して準瞬
時圧縮して補正することを特徴としたものである。以下
1本発明の実施例に基づいて説明する。
本発明は、上述のごとき本出願人が先に提案した音声圧
縮符号化方式を高速化するために、同一の符号データを
高速に算出するようにしたものであり、特に、第11図
に示した準瞬時圧縮部、最適化処理部、準瞬時伸張部を
改良して高速化を図ったものである。
前述のように、第12図には、1ブロツクを8サンプル
とした例を、第13図に、その音声波形を示すが、#1
サンプルのデータpHは、PllとPI3を比べた場合
P13に近いのでPI3を選ぶ、これは、一点鎖線で示
したPI3とPllの中間点よりpHがPll。
PI3のどちらに近いかを判断している。これは、Pl
lに量子比重の最小値(以下LSBと呼ぶ)の172を
加えて準瞬時圧縮を行うと判断部を持たなくても符号デ
ータを得られることを意味している。この計算の様子(
A/D変換を8ビツトで行い、3ビツトへ圧縮)を第8
図に示す、第8図(a)は、音声データをA/D変換し
たデータを、(b)はスケール値を求めるため、(a)
のデータの差分を示す、なお、 11の前はOとする。
ここで、このブロック内の各データの絶対値の最大は、
#1であり。
スケール値はb4である0図ではPOSでスケール値を
示している。(C)は、(a)の音声データと、一つ前
のデータを符号、復号して得られるローカル復号の値(
g)との差分を示す、また、(g)の#lの前は0とす
る。(d)は(c)にLSBの172 (b、がスケー
ル値であるからLSBはす、となりLSBの1/2の値
は00000100)を加算したものであり、これを準
瞬時圧縮したものが(e)である、さらに(e)をもと
に復号したものが(f)であり、(f)を積分した復号
音声データが(g)である。
第1図は、本発明の一実施例を説明するためのブロック
線図で1図中、40は加算部、41は制御部を示し、そ
の低溶11図に示した先行技術と同様の作用をする部分
には第11図の場合と同一の参照番号が付しである。而
して1本発明において、音声波形SSは、LPFIを通
し、A/D変換器2でサンプリング周波数の172以下
に帯域圧縮してからA/D変換器2でA/D変換されて
量子化され、このA/D変換されたデータDSをバッフ
ァ3に蓄える。バッファ3から1ブロツク分のデータを
最大値制限回路5を通って差分をとり、スケール値設定
部7ヘデータを送る。スケール値設定部7では各差分デ
ータの絶対値をとり。
その最大値から有効最大桁すなわちスケール値を求める
。バッファ3に蓄えたデータと積分部15でローカル復
号したデータの差分をとり、1/2LSB加算器40に
データを送る。1/2LSB加算器40では、スケール
値に基づいて伝送ビットの最下位(L S B)の1/
2の値を加算する。
ただし、加算することによりスケール値を越えてしまう
場合は、伝送できる最大の値をとる。この1/2LSB
加算されたデータを、準瞬時圧縮部11では、下位ビッ
トを切り捨てたデータをローカル復号用の積分部15に
送り、伝送するデータをマルチプレクサ13へ送る。マ
ルチプレクサ13では、スケール値とデータをまとめて
出力する。
制御部41は、スケール値を求める動作と符号化を行う
動作を切り替えている。スケール値を求める場合は、積
分部15、マルチプレクサ13の出力の動作を止め、レ
ジスタ9の入力を加算器に切り替え、スケール値設定部
7の動作をアクティブにする。符号化を行うときは、積
分部15.マルチプレクサ13の出力の動作をアクティ
ブにしてレジスタ9の入力を積分部15の出力に切り替
え。
スケール値設定部7では、動作を止めスケール値の出力
を保持する。また、1つのブロックの終りに、ローカル
復号のデータをスケール値設定部の差分を取るレジスタ
に送る。
第2図は1本発明の他の実施例を説明するためのブロッ
ク線図で2図中、第1図に示した実施例と同様の作用を
する部分には第1図の場合と同一の参照番号が付しであ
る。而して、この実施例と第1図に示した実施例との相
違は、A/D変換されたデータを、スケール値を求める
間バッファ3に入れて符号化を行なっている点にある。
この結果、第1図に示した実施例に加算器42.43と
最大値制限回路44を付加することにより制御部をなく
すことができ、かつ、リアルタイム処理ができる。
第3図は、本発明の他の実施例を説明するためのブロッ
ク線図で、この実施例は、第19図に示した先行技術を
第1図に示した実施例に対応する方式で改良したもので
、各部の動作は第1図及び第19図の動作と同じである
が、この実施例は、ブロック毎にスケール値に−1,O
,+1加えたスケール値を用い一番原音に近いものを送
出するようにしたものである。1ブロツクの動作を終了
すると、比較部33で選ばれたスケール値の積分部のデ
ータを他の2つの積分部へ送るようにしている。
第4図は1本発明の更に他の実施例を説明するためのブ
ロック線図で、この実施例は、第19図に示した先行技
術を第2図に示した実施例に対応する方式で改良したも
ので、各部の動作は第2図及び第19図の動作と同じで
あり、この実施例は。
ブロック毎にスケール値に−1,O,+1加えたスケー
ル値を用い一番原音に近いものを送出するようにしたも
のである。1ブロツクの動作を終了すると、比較部で選
ばれたスケール値の積分部のデータを他の2つの積分部
へデータを送る。
上述のように1本発明によると、低ビツトレートで高音
質な音声圧縮符号化を高速で行うことができるが、更に
、本発明によると処理が簡単であるため、CPUを用い
てソフト処理が可能である。
第5図は、上記ソフト処理を行う場合の全体構成図で、
図中、50はマイク、51はり、P、F、。
52はA/D変換器、53はデータバス、54はCPU
%55はROM、56はRAM、57はD/A変換器、
58はり、P、F、、59はスピーカで、第6図は、全
体のフローチャート、第7図は、圧縮処理のフローチャ
ートで、本発明に係るデータ圧縮処理は上述のごとくし
てROM、RAMを用いてCPU内で行われる。
夏−−i 以上の説明から明らかなように、本発明によると、低ビ
ツトレートで高音質な音声圧縮符号化を高速で行うこと
ができる。
【図面の簡単な説明】
第1図乃至第4図は、それぞれ本発明の詳細な説明する
ためのブロック線図、第5図乃至第7図は、ソフトウェ
アで実行する場合の構成図及びフローチャート、第8図
は1本発明による準瞬時圧縮の動作原理を説明するため
の図、第9図は、従来技術の説明図、第10図(a)〜
(c)は、従来技術の符号化復号化の状況を説明するた
めの信号配置図、第11図乃至第20図は1本発明の先
行技術を説明するための図で、第11図は音声符号化装
置を示したブロック図、第12図は符号化データの信号
形式を例示した信号配置図、第13図(a)は最適化処
理を説明するための波形図、同図(b)は最適化差分ビ
ットルーチンの作用を説明するための信号配置図、第1
4図(a)。 (b)は最適化差分ビットルーチンの一例を示したフロ
ーチャート、第15図は最適化処理の効果の説明図、第
16図(a)〜(d)は最適化の様子を示した信号配置
図、第17図は音声復号化装置の一例を示したブロック
図、第18図(a)〜(c)は他の例の原理の説明図、
第19図は他の実施例にかかる音声符号化装置を示した
ブロック図、第20図は比較ルーチンの一例を示したブ
ローチヤードである。 1.25・・・ローパスフィルタ、2・・・アナログ/
デジタル変換器、  3.6.10,10..101,
10−8,10a、10b。 10c・・・バッファ、4・・・加減算器、5・・・最
大値制限回路、7.7a・・・スケール値設定部、8・
・・加算器。 9・・・レジスタ、 11,11..11..11−2
・・・準瞬時圧縮部。 12.12..12工、12−□・・・最適化処理部、
13・・・マルチプレクサ、 14,14゜、148,
14−1.22・・・準瞬時伸張部。 15、15゜、15..15−、.15a、23・・・
積分部、21・・・デマルチプレクサ、24・・・デジ
タル/アナログ変換器。 31.32,34・・・セレクタ、33・・・比較部。 40・・・1/2 L、S、B加算器、41・・・制御
器、42゜43・・・加算器、44・・・最大値制限回
路。 i、lI− 第9図 第10図 (a) (b) 第+4 lXJ 第 +4 1m (b) !  15  図 第16 ”1 1 17  till ′第旧図 (a) (b) #O@l  12  ヰ3 第18図 (C) 第20図 手続補正書(自発) 昭和61年12月17日 特許庁長官   黒 1)明 雄  殿2、発明の名称 音声圧縮方式 3、補正をする者 事件との関係  特許出願人 オオタ り ナカマゴメ 住所  東京都大田区中馬込1丁目3番6号氏名(名称
)  (674)株式会社リコー代表者  浜  1)
  広 4、代理人 住 所    〒231 横浜市中区不老町1−2−7
6、補正の対象 (1)、明細書の発明の詳細な説明の欄7、補正の内容 (1)、同第4頁第19行目に記載の[(ADPCMf
)」をr (ADPCM) Jに補正する。 (2)、同第5頁第6行目に記載の「このようなADP
CNf方式、」を「このようなADPCM方式、」に補
正する。 (3)、第13図(a)を別紙の通り補正する。 第13図 (G)

Claims (7)

    【特許請求の範囲】
  1. (1)PCM符号化された音声データの差分を取り、ブ
    ロックに分割し、各ブロックにおける絶対値の最大値に
    対応した最上位桁をあらわすスケールデータを識別し、
    その最上位桁を含む所定ビット数のデータを符号データ
    に整形し、その符号データから復号されるデータと原音
    声の誤差が小さくなるように補正する音声圧縮方式にお
    いて、前記差分データに符号データで有効な最も小さい
    値の1/2を加算して準瞬時圧縮して補正することを特
    徴とする音声圧縮方式。
  2. (2)各ブロックの最初の差分を取る場合、前ブロック
    の最後の復号データを用いて差分を取ることを特徴とす
    る特許請求の範囲第(1)項に記載の音声圧縮方式。
  3. (3)スケールデータを基に符号化されたデータから復
    号したデータと次の原音声との差分を取ることを特徴と
    する特許請求の範囲第(1)項に記載の音声圧縮方式。
  4. (4)スケールデータを予め+1、0、−1の3種類に
    ついて符号化し、復号したデータが原音声に最も近い符
    号データを採用することを特徴とする特許請求の範囲第
    (1)項に記載の音声圧縮方式。
  5. (5)各ブロックの終りで符号データを採用した符号方
    式内の復号部の値を他の復号部へ転送することを特徴と
    する特許請求の範囲第(4)項に記載の音声圧縮方式。
  6. (6)各ブロックの最初の差分を取る場合、前ブロック
    の最後の復号データを用いて差分を取ることを特徴とす
    る特許請求の範囲第(4)項又は第(5)項に記載の音
    声圧縮方式。
  7. (7)スケールデータを基に符号化されたデータから復
    号したデータと、次の原音声の差分を取ることを特徴と
    する特許請求の範囲第(4)項又は第(5)項に記載の
    音声圧縮方式。
JP25407886A 1986-10-26 1986-10-26 音声圧縮方式 Pending JPS63108819A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP25407886A JPS63108819A (ja) 1986-10-26 1986-10-26 音声圧縮方式
US07/111,102 US4870685A (en) 1986-10-26 1987-10-22 Voice signal coding method
DE19873736193 DE3736193A1 (de) 1986-10-26 1987-10-26 Sprachsignal-kodierverfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25407886A JPS63108819A (ja) 1986-10-26 1986-10-26 音声圧縮方式

Publications (1)

Publication Number Publication Date
JPS63108819A true JPS63108819A (ja) 1988-05-13

Family

ID=17259914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25407886A Pending JPS63108819A (ja) 1986-10-26 1986-10-26 音声圧縮方式

Country Status (1)

Country Link
JP (1) JPS63108819A (ja)

Similar Documents

Publication Publication Date Title
US4870685A (en) Voice signal coding method
US7230551B2 (en) Floating-point type digital signal reversible encoding method, decoding method, apparatuses therefor, and programs therefor
US5214741A (en) Variable bit rate coding system
JP3339335B2 (ja) 圧縮符号化復号方式
WO1998000837A1 (fr) Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio
JPH02123828A (ja) サブバンドコーディング方法および装置
JPH01296300A (ja) 音声信号符号化方法
JPH0685509B2 (ja) デジタルオーディオ圧伸およびエラー調節
JP2754741B2 (ja) 符号化装置
JPS63142399A (ja) 音声分析合成方法及び装置
US7072830B2 (en) Audio coder
JPS63108819A (ja) 音声圧縮方式
JP2652371B2 (ja) 音声符号化方法
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
JPS63238729A (ja) 音声圧縮方式
JPH01167899A (ja) 音声符号化方式
JPH01167900A (ja) 音声圧縮及び復号方式
JPS63236415A (ja) 音声符号化方式
JPS5875341A (ja) 差分によるデ−タ圧縮装置
JP2521050B2 (ja) 音声符号化方式
JP2543345B2 (ja) 音声符号化方式
JP2521052B2 (ja) 音声符号化方式
JP2521051B2 (ja) 音声符号化方式
JPH01161300A (ja) 音声区間検出方式
JP2004061646A (ja) Tfo機能を有する音声符号化器および方法