JPS63238729A - 音声圧縮方式 - Google Patents

音声圧縮方式

Info

Publication number
JPS63238729A
JPS63238729A JP7266287A JP7266287A JPS63238729A JP S63238729 A JPS63238729 A JP S63238729A JP 7266287 A JP7266287 A JP 7266287A JP 7266287 A JP7266287 A JP 7266287A JP S63238729 A JPS63238729 A JP S63238729A
Authority
JP
Japan
Prior art keywords
data
value
difference
scale
quasi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7266287A
Other languages
English (en)
Inventor
Yuichi Kadokawa
雄一 門川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7266287A priority Critical patent/JPS63238729A/ja
Priority to US07/111,102 priority patent/US4870685A/en
Priority to DE19873736193 priority patent/DE3736193A1/de
Publication of JPS63238729A publication Critical patent/JPS63238729A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 五亙分互 本発明は、音声圧縮方式に関し5例えば、ボイスメール
、ボイスメモ、通信、各種機器のガイドメツセージ装置
などに適用可能なものである。
灸末筑先 例えば、高速デジタル回線を用いて音声信号を伝送した
り、音声応答装置のために音声信号を蓄積および合成す
るなど音声信号をデジタル処理するとき、この音声信号
をなんらかの方法でデジタル信号に変換する必要がある
法本的には音声信号は周波数帯域が0.3〜3.4KI
(zのアナログ信号であり、これをデジタル信号に変換
するには、例えばサンプリング周波数8KI(zで分解
能が8ビツトのアナログ/デジタル変換器で変換すれば
よい(PCM(Pulse Code Modulat
ion)符号化)。
そして、このデジタル信号を元の音声信号に戻すには、
サンプリング周波数8KI(zで分解能が8ビツトのデ
ジタル/アナログ変換器でアナログ信号に変換し、さら
にローパスフィルタを通して波形整形してやればよい。
このとき、アナログ/デジタル変換器およびデジタル/
アナログ変換器の分解能(すなわちPCM符号のビット
幅)が大きいほど再生した音声の品質が高い6 ところで、このようなPCM符号化された音声信号は1
秒あたりのビット速度(データ速度;以下ビットレート
という)が64Kbpsとなり、このように高いビット
レートの音声信号を伝送するには非常に高速な伝送路を
必要とし、また、かかる音声信・号を蓄積するためには
厖大な記憶容量のメモリを必要とする。そこで、従来か
ら、音声信号のビットレートを低減するための種々の提
案がなされている。
その1つに、時系列的に隣接するPCM符号の差分を形
成する差分PCM符号化方式がある。この差分PCM符
号化方式は、音声波形の相関性に基づく冗長性を利用し
たものであり、隣接したサンプル間の限られた範囲に含
まれることから、1サンプルあたりのビット数を低減す
ることができる。この差分PCM符号化方式をさらに進
めた適応差分PCM符号化方式の1つである、CCIT
T(国際電信電話諮問委員会)勧告による適応差分PC
M方式では、32Kbpsのビットレートを実現してい
る。
この他には、音声信号の非安在性と線形予測可能性を利
用したAPC−AB(Adaptive Predic
tion Co−dingwith Adaptive
 Bit A11ocation)方式、または、音声
分析合成手法によるLSP(Line Spectru
mPair)方式などがある。
しかしながら、このような適応差分PCM方式、APC
−AB方式およびLSP方式は、符号化および復号化の
処理が非常に複雑であり、それらを実現するための装置
は非常に高価なものとなるという不都合がある。
一方、放送衛星用の高品位なPCM音声伝送方式の1つ
に準瞬時圧伸方式がある。この準瞬時圧伸方式は、 P
CM符号化された音声データを時系列に所定数ごとのブ
ロックに分割し、おのおののブロックにおける信号絶対
値の最大値に対応した最上位桁をあらわすスケールデー
タを識別し、その最上位桁を含む所定ビット数のデータ
を符号データに整形するものであり、比較的符号化処理
が簡単で、かつ、容易に1サンプルのビット数を低減す
ることが可能である。しかしながら、このような準瞬時
圧伸方式は、効率的には充分なものではない。
そこで、この準瞬時圧伸方式の効率を改善する手法とし
てr差分PCM方式と準瞬時圧伸との結合」が考えられ
るが、一般に単に準瞬時圧伸を差分PCM方式に適用し
ただけでは、圧縮時の欠落ビットが伝送誤差を生じ、受
信側の積分器で誤差が累積して受信不能となる。
次にこの点について説明する。
いま準瞬時圧伸を差分PCM方式に適用した符号化方式
によって、第9図(a)に示したような音声信号を符号
化することを考える。まず、差分PCM符号化のために
この音声信号を例えば8KHzのサンプリング周波数で
サンプリングしてサンプル間の差分値を形成する。ここ
では、隣接するサンプル間の差分値を符号材の8ビツト
のデータすなわち2の補数表現の8ビツトデータであら
れす。そして、準瞬時圧伸のための条件は、8サンプル
で1ブロツクを構成し、伝送データはlサンプルあたり
3ビツトとする。また、スケールデータは3ビツトであ
る。
ここで、8つのサンプル#1〜#8における差分値が第
10図(a)のように得られたものとする。このブロッ
ク内において差分値の絶対値が最大になるものは、サン
プル#1であり、したがって、このときのスケール位m
 posは、このサンプル#1のビットパタンの最上位
桁であるビット4となり、スケール位置PO8の値は(
100)2になる。
これにより、各サンプルの伝送ビット(伝送データ;す
なわち符号データ)は、このスケール位v1posより
も1つ上位桁で、符号値をあらわすビット5(サインビ
ット)から3ビツトのデータ、すなわち、ビット5,4
.3のデータとなる。
したがって、このブロックでは、最初にスケール位置P
O8を、それに続いてサンプル#1〜tt8の伝送ビッ
トを順次連続して配置して構成した伝送データ(符号デ
ータ)は、同図(b)に示したようなものとなる。
このような符号データを復号するとき、まず、1ブロツ
ク分の符号データを3ビツトずつに分解し、その最初の
3ビツトの値からスケール位置PO8を識別する。そし
て、後続する3ビツトの符号データを8ビツトのデータ
に伸張するときには、スケール位置PO8よりも1つ上
位桁に符号データのMSB (最」二位ビット)を一致
させ、そのMSBよりも上位桁の各桁には符号ビットの
値をセットし、そのLSB(最下位ビット)よりも下位
桁の各桁にはOをセットする。
これにより、同図(Q)に示したデータが、復号後のデ
ータとして得られる。このデータと、符号化前のデータ
とを比較すると、復号データでは伝送ビットよりも下位
桁の情報(直流成分)が欠落していることがわかる(第
9図(b)参照)。すなわち、情報に欠落ビットを生じ
ている。
このような復号データに基づいて音声信号を再生すると
、第9図(c)に一点鎖線で示したように、欠落ビット
分の誤差が蓄積して負の直流シフトを生じ、同図に破線
で示した元の波形よりも右下がりの波形となり、その結
果、適正に情報を伝送することができない。
このような問題を解決する1つの方法として、「欠落ビ
ットのアキュムレーションによる差分圧伸PCM(DC
−PCM)J(高橋ほか、電子通信学会論文誌’84/
10 Vol、J67  B No、10)が提案され
ている。
しかしながら、この方法は15ビット程度の差分データ
を8ビット程度に圧縮する場合に有効であり、8ビツト
の差分データを3ビット程度に圧縮すルヨうな低ビツト
レートの符号化方式には適用できない。
すなわち、このような低ビツトレートの場合にはブロッ
ク間において音声波形の振幅が大幅に変化したときなど
ブロック間でスケール位置が大幅に変動することがあり
、そのためにアキュムレーションされている誤差信号の
方が伝送すべき有効なデータよりも大きな値となること
がある。かかる場合には、伝送すべきデータが誤差信号
に埋もれてしまい、適正なデータ伝送を実現できない。
本出願人は、上述した従来技術の不都合を解決するため
、先に、低ビツトレートで、簡単な処理により、高品質
な音声を再現できる音声符号化方式を提供した。
第11図は、本出願人が先に提案した音声符号化装置の
一例を説明するための図で、この例は、差分PCM符号
化方式に準瞬時圧伸を適用したものであり、準瞬時圧伸
を施したさいにもとまるブロック化した圧縮差分データ
を順次復号し、原信号と比較することで圧縮ビット数内
で誤差の少ない差分データとなるようにサンプル点毎に
補正している。またこの例では、8KHzのサンプリン
グ周波数で音声信号をサンプリングしてサンプル間の差
分値を2の補数表現の8ビツトデータであられし、8サ
ンプルで準瞬時圧伸のための1ブロツクを構成し、伝送
データはlサンプルあたり3ビツト、および、スケール
データは3ビツトとする。
同図において、入力音声信号SSは、ローパスフィルタ
1によって帯域制限されたのちにアナログ/デジタル変
換器2に加えられて8ビツトのデジタル信号DSに変換
される。このアナログ/デジタル変換器2は、サンプリ
ング周波数が8KHzで直線量子化するものである。
デジタル信号DSは、1ブロツクをなす8サンプル分の
記憶容量をもつバッファ3に蓄積され、このバッファ3
に蓄積されたデジタル信号DSdは、差分データを形成
するための加減算器4のプラス入力端に加えられている
この加減算器4から出力される9ビツトの差分データD
Dsは、最大値制限回路5によって8ビツトの差分デー
タDDに変換される。このようにして差分データの最大
値を制限したのは、次のような理由による・ すなわち、差分データDDsをそのまま$瞬時圧縮した
場合、突発的に大きな差分データを含むブロックにおい
てはそれに対応とた大きなスケール値が設定され、その
ために他の小さな差分データに対する準瞬時圧縮後のデ
ータの追従性が悪化する。その結果、復元した音声信号
が、聴覚上、ギクシャクした感じを与える。そこで、こ
のように差分データの最大値をある程度に制限すること
により、このような聴覚上の問題を解決することができ
る。
この差分データDDは、8サンプル分の記憶容量をもつ
バッファ6、準瞬時圧縮のためのスケール値を設定する
ためのスケール値設定部7および加算器8の一入力端に
加えられているに の加算器8の出力はレジスタ9に加えられ、このレジス
タ9の出力は加減算器4のマイナス入力端、加算器8の
他入力端、および、8サンプル分の記憶容量をもつバッ
ファ10に加えられている。
このようにして、最大値制限回路5によって8ビツトに
制限された差分データDDの積算値が加算器8によって
形成され、このデータが差分データDDsを形成するた
めの直前のサンプルのデータとして用いられている。
バッファ6の記憶データは、サンプル毎に準瞬時圧縮符
号化する準瞬時圧縮部11に加えられている。
スケール値設定部7は、最大値制限回路5から出力され
る差分データDOの連続する8サンプルのうち、最も絶
対値の大きいものを識別し、そのビットパタンの最上位
桁を判別してそのビット位置を3ビツトのスケールデー
タDKで出力する。このスケールデータDKは、準瞬時
圧縮部11、準瞬時圧縮部11から出力される圧縮差分
データI)Cを最適なデータに変換するための最適化処
理部12.1ブロック分のデータを所定の信号形式に整
形するためのマルチプレクサ13の一入力端、および、
最適化された圧縮差分データを伸張するための準瞬時伸
張部14に加えられている。
またバッファ10の記憶データは、レジスタ9から出力
される差分データDDを積算して形成された復号データ
であり、符号化の対象である元の音声信号(以下原信号
という)として最適化処理部12に加えられている・ 準瞬時圧縮部11は、バッファ6から加えられる8ビツ
トの差分データDDについて、おのおののサンプル毎に
、スケール値設定部7から加えられるスケールデータD
Kがあられすスケール位置よりも1ビツト上位桁をMS
Bとする3ビツトのデータを抜きだしてそれを圧縮差分
データDCとして最適化処理部12に出力する。
最適化処理部12は、準瞬時圧縮部11から加えられる
1ブロック分の圧縮差分データDCを順次復号し、バッ
ファ10から加えられる原信号と比較することにより、
圧縮ビット数内で誤差の少ない差分データとなるように
サンプル点毎に圧縮差分データDCを補正し、これを最
適化差分データDCoとしてマルチプレクサ13の他入
力端および準瞬時伸張部14に加えている。
マルチプレクサ13は、第12図に示したように、スケ
ール値設定部7から出力されたスケールデータDKを先
頭に配置し、それに続いて各サンプルの最適化差分デー
タDCoを順次配置して構成した信号を、1ブロック分
の符号化データDLとして形成して次段装置(例えばデ
ータ伝送装置、あるいは、データ記憶装置等)に出力す
る。
準瞬時伸張部14は、スケール値設定部7から加えられ
るスケールデータDKが示している桁よりも1つ上位桁
にMSBが一致するように、最適化処理部12から出力
される3ビツトの最適化差分データDC。
を配置するとともに、それよりも上位桁には最適化差分
データDCoの符号データの値を配置し、下位桁には0
を配置して8ビツトの復号データDEを形成するもので
あり、その復号データDHは積分部15に加えられる。
積分部15は、準瞬時伸張部14から出力される復号デ
ータDHを積算し、符号化データDLを実際に復号化処
理して復元したときの復元データSDを形成し、この復
元データSDをレジスタ9に出力している。レジスタ9
では、この復元データSDを、1つのブロックの処理を
終了して次のブロックの処理を開始する直前で取り込む
これにより、準瞬時圧伸に特有な欠落ビットによる誤差
の累積を、次のブロックの最初のサンプルデータを形成
するときに解消することができ、その結果、より正確な
符号化データDLを形成することができる。
このようにして、本実施例では、最適化処理部12によ
って元の音声信号により追従するように圧縮差分データ
DCを補正するとともに、積分部15で形成した復元デ
ータSDによってブロック内の累積誤差を次のブロック
に反映させているので、準瞬時圧伸による低ビツトレー
トの音声符号化処理をより精度よく実現することができ
る。
次に、最適化処理部12が実行する圧縮差分データの最
適化処理について説明する。
いま、第13図(a)に示したような音声波形を符号化
することを考える。サンプルttOを基準としてサンプ
ル#IJ2.#3の差分をそれぞれ8ビツトで形成した
とき、この場合の差分の絶対値はサンプル11が最大に
なる。したがって、このときの3ビツトの圧縮差分デー
タはこのサンプル#1を基準に形成され、スケール値は
そのビットパタンの最上位桁の桁位置となる。
さて、圧縮差分データを3ビツトであられした場合、表
現できるデータはスケール値よりも1ビツト下位桁の量
子化幅のものであり、したがって、おのおののサンプル
#IJ2.#3の値は、この量子化幅で表現可能なデー
タに置換される。例えば、サンプルft1の圧縮差分デ
ータはこの表現できるデータのうち実際の値pHよりも
下の値P12(=(010)、 ;ただしこの場合LS
Bはスケール位置よりも1ビツト下位桁。以下同じ)に
なる。
ところで、この量子化幅で表現できるデータのうち、P
I3よりも1つ大きな値P13(=(011)、)に対
応したデータの方がよりサンプル#1の実際の値pHに
近い。したがって、この値P13をサンプルft1の圧
縮差分データとすれば、復号化したときの音声信号(復
号値)の誤差を小さくすることができる。
すなわち、このときの復号値の誤差は、最大でもこの圧
縮差分データの量子化幅の172に抑えることができる
同様に、サンプル#2.#3について考えると、その復
号値が符号化前の信号の値(サンプル#2では値P21
、サンプル#3では値P31)に最も近くなる圧縮差分
データを選択すればよい。
すなわち、この場合、サンプル#2については、値P2
1よりも小さい値P22に基づいた復号値に較べて値P
21よりも大きい値P23に基づいた復号値の方がより
値P21に近いので、サンプル#1の復号値である値P
13と値P23との差分(=(010)2)を圧縮差分
データに設定する。またサンプル#3については、値P
31が圧縮差分データであられし得る復号値に一致する
ので、サンプル#2の復号値である値P23と値P31
との差分(=(010)、)を圧縮差分データに設定す
る。
このようにして1元の音声信号に対する追従性が向上し
た圧縮差分データを形成することができる。そのための
処理である最適化差分ビットルーチンの一例を第14図
(a)、(b)に示す。
まず、準瞬時圧縮部11から圧縮差分データ(DC)を
入力しく処理101)、その圧縮差分データdの値が、
圧縮ビット数(この場合は3ビツト)であられすことの
できる正の最大値MAX(=(011)z)より大きい
が、あるいは、負の最大値MIN(=(100)2)よ
り小さいかを判別しく判断102.103)、判断10
2の結果が’/ESになるときには圧縮差分データdに
値MAXを代入しく処理104)、判断103の結果が
YESになるときに圧縮差分データdに値MINを代入
する(処理105)。
次に、圧縮差分データdよりもLSB(”(001)z
)だけ小さな値dmと圧縮差分データdよりもLSBだ
け大きな値dpを形成しく処理106.107)、値d
n+が値阿INよりも小さくなった場合には値dmに値
MINを代入しく判断108.処理109)、値dpが
値MAXよりも大きくなった場合には値dpに値MAX
を代入する(判断110゜処理111)。
このようにして値dp、d+nを形成すると、スケール
データDKに基づいて値d、dp、d11を準瞬時伸張
したときの8ビツトの値dd、ddp、ddmを算出す
る(処理112)。そして、この値dd、ddp、dd
mをそれぞれ1サンプル前のデータの復号値daoを加
算し、おのおのの値d、dp、dn+に対応したローカ
ル復号値da、daρ。
damを形成する(処理113)、なお処理112およ
び113でローカル復号処理を実現しており、そのため
に、直前のサンプルの復号値daoを記憶しておく。
次に、当該サンプルに対応した原信号の値daiをバッ
ファ10から読み込み、この原信号の値daiと、おの
おののローカル復号値da、dap、damとの差の絶
対値Da 、 Dp 、 Daを算出しく処理114)
、原信号の値daiがローカル復号値daよりも大きい
かどうかを調べる(判断115)。
この判断115の結果がYESになるときには、絶対値
Daが絶対値opよりも大きいかどうかを調べ(判断1
16)、この判断116の結果がYESになるときには
、値dに値dρを代入しく処理117)処理106へと
戻り。
判断116の結果がNOになるときには、値dを最適化
差分データDCoとして出力する(処理118)。
また判断115の結果がNoになるときには、絶対値D
aが絶対値opよりも大きいかどうかを調べ(判断11
9)、この判断119の結果がYESになるときには、
値dに値daを代入しく処理120)処理106へと戻
り、判断119の結判がNoになるときには処理118
を実行する。
すなわち、第13図(b)の左側に示したように、原信
号の値daiが復号値daよりも復号値dapに近いと
きには、圧縮差分データdi−LSBだけ大きい値dp
に更新して、その値を最適化差分データDCoとして出
力する。また、その反対に原信号の値daiが復号値d
aよりも復号値damに近いときには、圧縮差分データ
dをLSBだけ小さい値dmに更新して、その値を最適
化差分データDCoとして出力する。なお、1回の処理
で最適な値が得られなかった場合には、この処理を繰り
返し実行するに のようにして、準瞬時圧伸で得られた圧縮差分データに
圧縮ビットのLSBを加算、減算する操作をサンプル点
毎に繰り返し行ない、復号値と原信号との誤差を少なく
するように差分データを補正している。
なお、バッファ10に原信号として記憶するデータとし
ては、最大値制限回路5に入力される前のバッファ3の
出力データを用いることもできる。
したがって、例えば第15図(、)に示したような音声
信号(第9図(a)と同じ)をこのような最適化差分ビ
ットルーチンを用いた準瞬時圧縮によって符号化するこ
とを考える。
まず、この音声信号の8つのサンプル#1〜#8におけ
る差分値が第16図(a)のように得られ、したがって
、このときのスケール位置posは、サンプル#1のビ
ットパタンの最上位桁であるビット4となり、スケール
位置PO8の値は(ioo)、になる、これにより、準
瞬時圧縮部11にjって形成される圧縮差分データDC
は、おのおののサンプル#1〜#8について、それぞれ
第16図(b)に示したものとなる。
そして、この圧縮差分データDCは、おのおののサンプ
ル#1〜#8について、それぞれ上述の最適化差分ビッ
トルーチンにより第16図(C)に示したような最適化
差分データDCoにそれぞれ補正される。
その結果、後述する音声復号化装置では、この最適化差
分データDCoのおのおののサンプル#1〜I8の値が
第16図(d)に示したように8ビツトの差分データに
伸張され、この差分データに基づいて、音声信号が第1
5図(Q)に実線で示したように復号される。ここで、
上述した圧縮差分データDCをそのまま符号化データに
用いた場合の再生された音声信号を第15図(c)に一
点鎖線で示す。
これらの比較かられかるように、最適化差分データDC
oに基づいて再生された音声信号は、第15図(c)に
破線で示した符号化前の音声信号にまとわりつくような
ものとなり、符号化前の音声信号に対する追従性が大き
く向上している。
第17図は、音声復号化装置の一例を示しているが、こ
の音声復号化装置は、上述した音声符号化装置によって
符号化された符号化データOLを復号して音声信号を出
力するものである。
同図において、例えばデータ受信装置あるいはデータ記
憶装置等の前段装置(図示略)から出力された符号化デ
ータDLは、デマルチプレクサ21に加えられ、おのお
ののブロック毎に、先頭の3ビツトがスケール値SCと
して識別されて準瞬時伸張部22のスケール値入力端に
加えられ、それ以外のコ−ドデータ(圧縮差分データ)
は、準瞬時伸張部22のコードデータ入力端に加えられ
る。
準瞬時伸張部22は、加えられるコードデータを3ビツ
トずつに区切るとともに、8ビツトデータにおいて入力
したスケールデータSCに対応したビット位置にその3
ビツトのデータを配置し、そのコードデータよりも上位
桁には符号ビットの内容を、下位桁にはOを配置して8
ビツトデータ(第16図(d)参照)に伸張し、この8
ビツトデータを積分部23に出力する。
積分部23は、順次入力される8ビツトデータを積算し
て音声信号の各サンプルにおける信号値を形成し、これ
をデジタル/アナログ変換器24に出力する。
デジタル/アナログ変換器24は、受入した信号値を8
KHzの変換周波数で対応するアナログ信号(レベル信
号)に変換し、これをローパスフィルタ25に出力する
。このアナログ信号は、ローパスフィルタ25によって
波形整形されたのち、再生音声信号として次段装置(例
えば音声出力装置等)に出力される。
このようにして符号化データを復号するための音声復号
化装置の構成は、非常に簡単なものとなり、したがって
、例えば、汎用の8ビツトマイクロプロセツサを用いて
この音声復号化装置を実現することもでき、コストを極
く小さく抑えることができる。
ところで、準瞬時圧伸においては、1つのブロック内に
おいて信号値の絶対値が最大になるビットパタンに基づ
いてスケール位置を設定しているので、例えば、そのブ
ロックにおいて突発的に大きな値をとるサンプルがあっ
た場合、その大きな値に対応したスケール値が設定され
るため、他の小さい値に対する符号化データの追従性が
悪くなり、聴覚上好ましくないという不都合を生じるこ
とがある。
次に、このような不都合を解消できるようにした例につ
いて説明する。
さて、上述した不都合を解消するには、そのブロックに
おいて最も誤差の少ない符号化データを形成すればよく
、そのためには適切なスケール位置(値)を設定すれば
よい。
そこで、最初に設定したスケール位置に基づいて準瞬時
圧縮したときと、そのスケール位置よりも1桁上位桁を
スケール位置に設定した場合にそのスケール位置に基づ
いて準瞬時圧縮したときと。
その最初のスケール位置よりも1桁下位桁をスケール位
置に設定した場合にそのスケール位置に基づいて準瞬時
圧縮したときとで、おのおののサンプルにおいて復号値
と符号化前の音声信号の値との誤差を算出してそれらに
基づいてそれぞれのスケール位置での評価値を形成し、
この評価値に基づき、それらのスケール位置のもののう
ち最も良好なものを選択するようにしている。なお、こ
の評価値としては、おのおののサンプルにおける元の音
声信号と復号値との差の絶対値の総和や、その差を自乗
した値の総和または平方根(誤差パワー)を用いること
ができる。
すなわち、例えば第18図(c)に示したような音声信
号があったとき、この音声信号の各サンプル#1〜#8
のうち差分値が最も大きいサンプル#1に基づいてスケ
ール値が決定され、その状態が同図であるとする。
これに対し、スケール値を1つ小さくした場合にはサン
プル値の量子化幅が1段階小さくなるので同図(b)の
状態になり、スケール値を1つ大きくした場合にはサン
プル値の量子化幅が1段階大きくなるので同図(c)の
状態となる。
また、おのおのの状態で、上述した最適化差分ビットル
ーチンによる最適化処理を実行したとき、各サンプルに
おける符号ビットは、次の表のようになる。
退− ここでは、第18図(a)の場合のスケール値を、5C
−1はS00よりも1だけ小さい同図(b)の場合のス
ケール値を、S01はSCoよりも1だけ大きい同図(
Q)の場合のスケール値をそれぞれ示している。
このようにスケール値を変更すると、当然のことながら
元の音声信号と復号値との差の総和あるいは誤差パワー
は、そのブロックにおける音声信号の変化に対応してい
ずれか1つのスケール値のものが最小となり、その最小
となるものが当該ブロックにおいて音声信号に対する追
従性が最良である。
例えば、実験によれば統計的にみて、スケール値S00
のものの誤差パワーが最も小さくなるのはブロック総数
のうち60%程度であり、スケール値5C−1のものの
誤差パワーが最も小さくなるのはブロック総数のうち3
0%程度であり、スケール値SC1のものの誤差パワー
が最も小さくなるのはブロック総数のうち10%程度で
ある。
このようにして、ブロック毎に使用するスケール値を選
択することで、再生した音声信号の音質(聴覚上の)が
向上する。
第19図は、上述のごとき点を考慮した音声符号化装置
の一例を示す図で、同図において第11図と同一部分に
は同一符号を付し、相当する部分にはそれと同一符号に
サフィクスを付加してその説明を省略する。またこの装
置は、準瞬時圧縮の1ブロック単位に作動する。
同図において、スケール値設定部7aは、最大値制限回
路5から出力される差分データDDの連続する8サンプ
ルからなるブロックでスケール値を判別するとともに、
そのスケール値よりも1つ大きな値および1つ小さな値
を形成し、それぞれスケールデータDK、 、DK□、
0K−1として出力する。これらのスケールデータDK
、、DK□、DK−1は、上述したスケール値sc、 
、scl、sc−□にそれぞれ相当する。
スケールデータDK、は、準瞬時圧縮部11゜、最適化
処理部12゜、準瞬時伸張部14I、およびセレクタ3
1の一入力端に加えられ、スケールデータDK1は、準
瞬時圧縮部11□、最適化処理部12い準瞬時伸張部1
41およびセレクタ31の他入方端に加えられ、スケー
ルデータDK−2は、準瞬時圧縮部11−1、最適化処
理部12−1、準瞬時伸張部14−0およびセレクタ3
1のさらに他の入力端に加えられている。
準瞬時圧縮部1工。はスケールデータDK、に基づきバ
ッファ6の出力データから圧縮差分データDC0を形成
し、最適化処理部12゜はこの圧縮差分データDC,に
上述した最適化差分ビットルーチンを適用 ゛して最適
化差分データDCo、を形成し、この最適化差分データ
DCooは準瞬時伸張部14゜およびセレクタ32の一
入力端に加えられる。準瞬時伸張部14゜は入力される
最適化差分データDCo、をスケールデータDK、を基
準として8ビツトデータのデータDH。
に伸張し、このデータDH,は積分部15゜によって積
算されて復号され、その復号値SD0は比較部33の一
入力端およびセレクタ34の一入力端に加えられている
また、準瞬時圧縮部11.はスケールデータDK工に基
づきバッファ6の出力データから圧縮差分データDC1
を形成し、最適化処理部12□はこの圧縮差分データD
C1に上述した最適化差分ビットルーチンを適用して最
適化差分データDCo1を形成し、この最適化差分デー
タDCo1は準瞬時伸張部141およびセレクタ32の
一入力端に加えられる。準瞬時伸張部141は入力され
る最適化差分データD(1:olをスケールデータDK
1を基準として8ビツトデータのデータDE1に伸張し
、このデータDE、は積分部151によって積算されて
復号され、その復号値SD1は比較部33の一入力端お
よびセレクタ34の一入力端に加えられている。
同様に、準瞬時圧縮部11−1はスケールデータDK−
1に基づきバッファ6の出力データから圧縮差分データ
DC−4を形成し、最適化処理部12−□はこの圧縮差
分データDC−□に上述した最適化差分ビットルーチン
を適用して最適化差分データDCo−,を形成し、この
最適化差分データDCo −、は準瞬時伸張部14−1
およびセレクタ32の一入力端に加えられる。
準瞬時伸張部14−1は入力される最適化差分データD
Co−1をスケールデータDK−1を基準として8ビツ
トデータのデータDH−1に伸張し、このデータDE−
,は積分部15−1によって積算されて復号され、その
復号値5D−0は比較部33の一入力端およびセレクタ
34の−入力端に加えられている。
また、最大値制限回路5から出力される差分データDD
は、バッファ10aによって1ブロツク分が蓄積され、
このバッファ10aの出力は積分部15aによって順次
積算されて圧縮されていない音声信号(すなわち原信号
)が形成され、それに対応したデータSDaが最適化処
理部12..12□、12−1および比較部33に加え
られている。
このように、比較部33には、原信号に対応したデータ
SDa、スケール値SC,(スケールデータDK、 )
に対応した最適化差分データDCo、を復号したときの
復号値SD0、スケール値SC工(スケールデータDK
1)に対応した最適化差分データDCo1を復号したと
きの復号値SD工、および、スケール値5C−1(スケ
ールデータDK−1)に対応した最適化差分データDC
:o−,を復号したときの復号値5D−2が、サンプル
毎にそれぞれ加えられる。
比較部33は、データSDaと復号値SD0.SD、 
、5D−1に基づき、それらの復号値SD、 、SDl
、SD−、におけるデータSDaからの誤差をそれぞれ
のサンプル毎に形成し、1ブロツクにおける誤差パワー
をおのおのの復号値SD、、SD工、SD−□について
算出し、それらの中で最小値をとるものを判別する。
そして、復号値SD、についての誤差パワーが最小にな
るときには、セレクタ31によってスケールデータDK
、を選択してこれをマルチプレクサ13に出力するとと
もにセレクタ32によって最適化差分データDCo、を
選択してこれをマルチプレクサ13に出力する。またセ
レクタ34によって符号値SD、を選択し、これをレジ
スタ9に取り込ませるデータとする。
また、復号値SDiについての誤差パワーが最小になる
ときは、セレクタ31によってスケールデータDK、を
選択してこれをマルチプレクサ13に出力するとともに
セレクタ32によって最適化差分データDCo、を選択
してこれをマルチプレクサ13に出力する。またセレク
タ34によって符号値SD1を選択し、これをレジスタ
9に取り込ませるデータとする。
同様に、復号値5D−1についての誤差パワーが最小に
なるときは、セレクタ31によってスケールデータDK
−1を選択してこれをマルチプレクサ13に出力すると
ともにセレクタ32によって最適化差分データDCo−
2を選択してこれをマルチプレクサ13に出力する。ま
たセレクタ34によって符号値5D−1を選択し、これ
をレジスタ9に取り込ませるデータとする。
したがって、マルチプレクサ13からは、そのブロック
において最も誤差パワーが小さくなる符号化データDL
が出力される。
比較部33が実行する比較ルーチンの一例を第19図に
示す。まず、データSDaおよび復号値SD、 、SD
l。
5D−1をサンプル毎↓こ入力するとともに(処理20
1)、それらの入力したデータに基づき、次式を演算し
て、復号値SD、 、SD、 、5D−1におのおの対
応した誤差パワーPMS、 、PMSl、PMS−、を
それぞれ算出する(処理202)。
2MSk=(Σ(5Daj −5Dkj )” )”j
=1 ここで、k=o、1.−1、jはブロック内におけるサ
ンプル番号、5Dajはブロック内のおのおののサンプ
ルにおけるデータ、 5Dkjはブロック内のおのおの
のサンプルにおける符号値SDkをあらわす。
そして、いずれの誤差パワーRMS、 、RMS工、R
MS−4が最も小さいかを識別しく判断203,204
,205) 、最小の誤差パワーRMS、 、 RMS
工、RMS−zに対応したスケールデータDKo、DK
1.OK−、と最適化差分データDCo、 。
DCol、DCo−1をそれぞれ選択する(処理206
,207゜208)。
なお、この比較ルーチンにおいて、おのおのの復号値S
O0,SD1.SD−□とデータSDaとの誤差に基づ
いた評価値としては、上述した誤差パワー以外に、例え
ば、おのおののサンプルにおけるデータSDaと復号値
SD、 、SDl、5D−1との差の総和等を用いるこ
とができる。しかしながら、上記音声圧縮符号化方式に
おいては、符号化に多くの処理を必要とし、リアルタイ
ムでの処理がむずかしいといった欠点がある。
1−一旗 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、低ビツトレートで自然な音声を符号化、復号化す
る音声圧縮方式の高速化を図ることを目的としてなされ
たものである。
1−一双 本発明は、上記目的を達成するために、PCM符号化さ
れた音声データの差分を取り、ブロックに分割し、各ブ
ロックにおける絶対値に対応した最上位桁をあらわすス
ケール値を識別し、その最上位桁を含む所定ビット数の
データを符号データに整形し、その符号データから復号
されるデータと原音声の誤差が小さくなるように補正す
る音声圧縮方式において、前ブロックの最終データを各
サンプル点の値から引き、符号データで有効な最も小さ
い値の1/2を加算し、予め決められたスケール値にも
とづいて準瞬時圧縮を行ない、その差分を出力とするこ
とを特徴としたものである6以下1本発明の実施例に基
いて説明する。
第1図は、本発明の一実施例を説明するためのブロック
線図であるが、本発明は、上述の従来技術における準瞬
時圧縮部、最適化処理部、準瞬時伸長部等を改良して高
速化を図ったものであり、図中、41はレジスタ、42
は1/2LSB部、43は切り捨て回路、44は制限回
路、45はデータ変換部、46は“0”設定部、47は
セレクタ、48はレジスタ、49a〜49dは加算回路
、50は制御部で、その他、第11図に示した従来技術
と同様の作用をする部分には、第11図の場合と同一の
参照番号が付しである。
今、1ブロツクを、第12図に示したように、8サンプ
ルする例につき、音声波形が第12図に示すものである
場合について説明すると、#1サンプルのデータpHは
、PI3.PI3と比べ、PI3に近いのでPI3を選
ぶ、#2サンプルのデータP21は、P23.P22と
比べ、P23に近いのでP23を選び、#1のデータP
13とP23の差を出力する。すなわち、前のブロック
の最終のデータから伝送できる最小値(以下LSBと呼
ぶ)毎に格子点を決め、サンプル毎に近い格子点を求め
、その差分を伝送する。また、近い格子点を求め、る方
法としてLSBの1/2を加え、LSBより小さいビッ
トを切り捨てるようにしてもよい。
第2図は、上述の計算の様子を示す図で(A/D変換を
8ビツトで行ない、3ビツトへ圧縮)、前のブロックの
最終データを06Hとする。(a)図は、音声データを
A/D変換したデータを示す図、(b)図は、前のサン
プルとの差をとったデータを示す図で、ここで、このブ
ロック内の各データの絶対値の最大は#8であり、スケ
ール値はb4である。図ではPOSでスケール値を示し
ている。(Q)図は、前のブロックの置注データ06H
との差を求めたものである。(d)図は、(Q)図に1
/2LSB加えたデータを示す。(e)図は、(d)図
のデータの前サンプルとの差を取ったデータである。た
だし、#1は(e)図と同じデータとする。(g)図は
、 pos位置で3ビツトに準瞬時圧縮し、 posを
加え、1ブロツクの送出するデータを示している。さら
に(g)図をもとに受信側で復号したものが(h)図で
ある。
第1図において、音声波形SSは、LPFでA/D変換
器2のサンプリング周波数の1/2以下に帯域圧縮して
からA/D変換器2で量子化を行なう、このA/D変換
されたデータDSをバッファ3に蓄え、バッファ3から
1ブロツク分のデータを最大値制御回路5を通して差分
をとり、スケール値設定部7ヘデータを送る。スケール
値設定部7では各差分データの絶対値をとり、その最大
値から有効最大桁すなわちスケール値を求める。
同時に、前記A/D変換されたデータをDSバッファ6
に蓄え1、前ブロックの最終の復号データとの差分をと
り、その差分データに1/2LSBを加算し、LSBよ
り小さいビットを切り捨て回路43で切り捨てる。切り
捨て回路43の出力の差分を取り、制限回路44で準瞬
時圧縮を行なったときにオーバーフローしないようにし
ている。また、ブロックの先頭のデータは、差分を取ら
ないので、セレクタ47で引く値を°“0”にしている
この差分データをデータ変換部でビット巾の縮めを行な
いスケール値とともにマルチプレクサで混ぜて出力する
。これを準瞬時伸長部と積分部で送出データからローカ
ル復号を行ないブロックの最終データを各レジスタヘセ
ットする。制御部5oでスケール値を求める動作と符号
化を行なう動作を切り替えている。スケール値を求める
場合は、積分部15とマルチプレクサ13の出力の動作
、及び、バッファ6の動作を止め、レジスタ9の入力を
加算器8に切り替え、バッファ3の動作とスケール値設
定部7の動作をアクティブにする。
符号化を行なうときは、積分部15とマルチプレクサ1
3の出力の動作、及びバッファ6の動作をアクティブに
し、バッファ3の動作を止め、スケール値設定部7では
動作を止めてスケール値の出力を保持する。また、ブロ
ックの最初のワードの符号化のときセレクタを“0″に
切り替え、積分部の出力を各レジスタへ出力する。
第3図は、本発明の他の実施例を示すブロック線図で、
この実施例は、第1図に示した実施例のローカル復号の
部分をなくしたもので、第1図に示した実施例との相違
のみを説明すると、前ブロックの最終データとしてのレ
ジスタ48の出力をレジスタ51ヘブロツクの最後にス
トアし、これにより、第1図に示した実施例において必
要とした準瞬時伸長部及び積分部を不必要にしている。
第4図は、本発明の他の実施例を示すブロック線図で、
この実施例は、第3図に示した実施例を改良したもので
ある。すなわち、第3図に示した実施例においては、レ
ジスタ9ヘデータを出力するには、レジスタ48の出力
をレジスタ51を通して出力しているが、本実施例では
、レジスタ48から直接レジスタ9ヘデータを出力して
おり、これにより、制御部50の手順が2段から1段と
なり簡単になっている。
第5図は、本発明の他の実施例を示すブロック線図で、
この実施例は、第4図に示した実施例を更に改良したも
のである。すなわち、第4図に示した実施例においては
、バッファ6から切り捨て回路43までの間に加算器を
2回通っているが。
本実施例では1回になっている。これは、前ブロックの
最終データと1/2LBSを引いたものを加えれば、同
じ結果が得られるからである。
以上に、本発明の各実施例について説明したが、本発明
によると、処理が簡単であるため、凡用のCPUで処理
可能である。
第6図は、その処理のフローを示す図で、前ブロックの
最終データを示すRDを0に初期設定する。1ブロック
分のデータをA/D変換器より入力し、圧縮処理をした
後、圧縮データのストアないし送出を行なう、この動作
を圧縮を行なう間くり返す。
第7図は、圧縮処理のフローチャートを示す図で、この
ときのハードの実施例を第8図に示す。
第8図において、60はマイクロフォン%61はローパ
スフィルタ(L P F)、62はアナログ・デジタル
(A/D)変換回路、63はバス、64はCPU、65
はROM、6SRAM、67はデジタル・アナログ(D
/A)変換回路、68はローパスフィルタ(LPE)、
69はスピーカで、マイクロフォン60で音声信号を電
気信号に変換し、LPF61で帯域圧縮を行ない、A/
D変換回路62でサンプリングと量子化を行なう。この
データをCPU64で圧縮を行ないRAM66ヘデータ
をストアする。また、復号するときは、RAM66、R
OM65のデータをCPU64で復号し、D/A変換器
67で電圧に変換し、LPF68で帯域圧縮を行なって
スピーカ69より音声信号として出力する。
羞−一米 以上の説明から明らかなように1本発明によると、低ビ
ツトレートで高音質な音声符号化方式を高速で実現でき
る。また、処理が簡単であるためCPUを用いてソフト
処理が可能である等の利点がある。
【図面の簡単な説明】
第1図は、本発明による音声圧縮方式の一実施例を説明
するためのブロック線図、第2図は、本発明の動作説明
をするための図、第3図乃至第5図は、それぞれ本発明
の他の実施例を説明するためのブロック線図、第6図は
、CPU処理のフローを示す図、第7図は、圧縮処理の
フローを示す図、第8図は、圧縮処理回路の一例を示す
図、第9図は、従来技術の説明図、第10図(a)〜(
c)は、従来技術の符号化復号化の状況を説明するため
の信号配置図、第11図乃至第20図は。 本発明の先行技術を説明するための図で、第11図は音
声符号化装置を示したブロック図、第12図は符号化デ
ータの信号形式を例示した信号配置図、第13図(a)
は最適化処理を説明するための波形図、同図(b)は最
適化差分ビットルーチンの作用を説明するための信号配
置図、第14図(a)、(b)は最適化差分ピクトルー
チンの一例を示したフローチャート、第15図は最適化
処理の効果の説明図、第16図(a)〜(d)は最適化
の様子を示した信号配置図、第17図は音声復号化装置
の一例を示したブロック図、第18図(a)〜(c)は
他の例の原理を説明するための図、第19図は他の実施
例にかかる音声符号化装置を示したブロック図、第20
図は比較ルーチンの一例を示したフローチャートである
。 1・・・ローパスフィルタ、2・・・アナログ/デジタ
ル変換器、3,6.10・・・バッファ、4・・・加減
算器、5・・・最大値制限回路、7・・・スケール値設
定部、8・・・加算器、9・・・レジスタ、11・・・
準瞬時圧縮部、12・・・最適化処理部、13・・・マ
ルチプレクサ。 14・・・準瞬時伸張部、15・・・積分部、41・・
・レジスタ、42・・・1/2LSB部、43・・・切
り捨て回路、44・・・制限回路、45・・・データ変
換部、46・・・1′0”設定部、47・・・セレクタ
、48・・・レジスタ、49a〜49d・・・加算回路
、50・・・制御部。 51・・・レジスタ。 特許出願人   株式会社 リコー 第2図 第2 閃 第6tz 第8図 第9図 第 IO図 第 121 LX 第13図 (a) (b) dq、w5← 第14図 第14図 (b) 第15図 第 16  図 第17図 第18図 (a) (b) 第 18 図 (C) 第 20 図 手続補正書防式) 昭和62年9月2日 特許庁長官  小 川 邦 夫  殿 1、事件の表示                  
     を2昭和62年 特許願第72662号 2、発明の名称 音声圧縮方式 3、補正をする者 事件との関係  特許出願人 オオタ り ナカマゴメ 住所  東京都大田区中馬込1丁目3番6号氏名(名称
)  (674)株式会社リコー代表者  浜  1)
  広 4、代理人 住 所    〒231 横浜市中区不老町1−2−7
シヤトレーイン横浜807号 図面

Claims (3)

    【特許請求の範囲】
  1. (1)、PCM符号化された音声データの差分を取り、
    ブロックに分割し、各ブロックにおける絶対値に対応し
    た最上位桁をあらわすスケール値を識別し、その最上位
    桁を含む所定ビット数のデータを符号データに整形し、
    その符号データから復号されるデータと原音声の誤差が
    小さくなるように補正する音声圧縮方式において、前ブ
    ロックの最終データを各サンプル点の値から引き、符号
    データで有効な最も小さい値の1/2を加算し、予め決
    められたスケール値にもとづいて準瞬時圧縮を行ない、
    その差分を出力とすることを特徴とする音声圧縮方式。
  2. (2)、各ブロックスケール値を求める際に、各ブロッ
    クの先頭のデータの差分を取る場合に、前ブロックの最
    後の復号データを用いて差分をとることを特徴とする特
    許請求の範囲第(1)項に記載の音声圧縮方式。
  3. (3)、前ブロックの最終データから符号データで有効
    な最も小さい値の1/2を引いておき、この値を各サン
    プルのデータから引くことを特徴とする特許請求の範囲
    第(1)項又は第(2)項に記載の音声圧縮方式。
JP7266287A 1986-10-26 1987-03-26 音声圧縮方式 Pending JPS63238729A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7266287A JPS63238729A (ja) 1987-03-26 1987-03-26 音声圧縮方式
US07/111,102 US4870685A (en) 1986-10-26 1987-10-22 Voice signal coding method
DE19873736193 DE3736193A1 (de) 1986-10-26 1987-10-26 Sprachsignal-kodierverfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7266287A JPS63238729A (ja) 1987-03-26 1987-03-26 音声圧縮方式

Publications (1)

Publication Number Publication Date
JPS63238729A true JPS63238729A (ja) 1988-10-04

Family

ID=13495802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7266287A Pending JPS63238729A (ja) 1986-10-26 1987-03-26 音声圧縮方式

Country Status (1)

Country Link
JP (1) JPS63238729A (ja)

Similar Documents

Publication Publication Date Title
US4870685A (en) Voice signal coding method
JP3339335B2 (ja) 圧縮符号化復号方式
JPS59153346A (ja) 音声符号化・復号化装置
JP2754741B2 (ja) 符号化装置
US7072830B2 (en) Audio coder
JPH0473333B2 (ja)
JPS63142399A (ja) 音声分析合成方法及び装置
JPH1020897A (ja) 適応変換符号化方式および適応変換復号方式
JPS63238729A (ja) 音声圧縮方式
JP2652371B2 (ja) 音声符号化方法
JPS63108819A (ja) 音声圧縮方式
JP2521052B2 (ja) 音声符号化方式
JP2521050B2 (ja) 音声符号化方式
JPS63236415A (ja) 音声符号化方式
JPH01167899A (ja) 音声符号化方式
JPH01167900A (ja) 音声圧縮及び復号方式
JPS6314523A (ja) 音声符号化方式
JPH0319734B2 (ja)
JPS5866440A (ja) 波形符号化方式
JP3130834B2 (ja) 移動電話機
EP0599653B1 (en) Digital sound level control in a telephone system
JPH01161300A (ja) 音声区間検出方式
JPS6319919A (ja) 音声符号化方式
JPH1020893A (ja) 符号器及び復号器
JP2582763B2 (ja) 音声分析合成装置