JPS6314524A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPS6314524A
JPS6314524A JP15800886A JP15800886A JPS6314524A JP S6314524 A JPS6314524 A JP S6314524A JP 15800886 A JP15800886 A JP 15800886A JP 15800886 A JP15800886 A JP 15800886A JP S6314524 A JPS6314524 A JP S6314524A
Authority
JP
Japan
Prior art keywords
data
value
code data
block
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP15800886A
Other languages
English (en)
Other versions
JP2652371B2 (ja
Inventor
Hiroki Uchiyama
博喜 内山
Wasaku Yamada
山田 和作
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61158008A priority Critical patent/JP2652371B2/ja
Publication of JPS6314524A publication Critical patent/JPS6314524A/ja
Application granted granted Critical
Publication of JP2652371B2 publication Critical patent/JP2652371B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [技術分野] 本発明は、音声符号化方式に関する。
[従来技術] 例えば、高速デジタル回線を用いて音声信号を伝送した
り、音声応答装置のために音声信号を蓄積および合成す
るなど音声信号をデジタル処理するとき、この音声信号
をなんらかの方法でデジタル信号に変換する必要がある
基本的には音声信号は周波数帯域が0.3〜3 、4K
Hzのアナログ信号であり、これをデジタル信号に変換
するには1例えばサンプリング周波数8KHzで分解能
が8ビツトのアナログlデジタル変換器で変換すればよ
い(PCM(Pulse Code Modulati
on)符号化)。
そして、このデジタル信号を元の音声信号に戻すには、
サンプリング周波数8KHzで分解能が8ビツトのデジ
タル/アナログ変換器でアナログ信号に変換し、さらに
ローパスフィルタを通して波形整形してやればよい。こ
のとき、アナログ/デジタル変換器およびデジタル/ア
ナログ変換器の分解能(すなわちPCM符号のビット幅
)が大きいほど再生した音声の品質が高い。
ところで、このようなPCM符号化された音声信号は1
秒あたりのビット速度(データ速度;以下ビットレート
という)が64Kbpsとなり、このように高いビット
レートの音声信号を伝送するには非常に高速な伝送路を
必要とし、また、かかる音声信号を蓄積するためには厖
大な記憶容量のメモリを必要とする。そこで、従来から
、音声信号のビットレートを低減するための種々の提案
がなされている。
その1つに、時系列的に隣接するPCM符号の差分を形
成する差分PCM符号化方式がある。この差分PCM符
号化方式は、音声波形の相関性に基づく冗長性を利用し
たものであり、隣接したサンプル間の値の変化が、多く
の場合ダイナミック・レンジの限られた範囲に含まれる
ことから、lサンプルあたりのビット数を低減すること
ができる。この差分PCM符号化方式をさらに進めた適
応差分PCM符号化方式の1つである、CCITY (
国際電信電話諮問委員会)勧告による適応差分PCM方
式(ADPCMf)では。
32Kbpsのビットレートを実現している。
この他には、音声信号の非定在性と線形予測可能性を利
用したAPC−AB(Adaptive Predic
tion Co−ding with Adaptiv
e Bit A11ocation)方式、または、音
声分析合成手法によるLSP(Line Spectr
umPair)方式などがある。
しかしながら、このようなADPCMf方式、APC−
AB方式およびLSP方式は、符号化および復号化の処
理が非常に複雑であり、それらを実現するための装置は
非常に高価なものとなるという不都合がある。
一方、放送衛星用の高品位なPCM音声伝送方式の1つ
に準瞬時圧伸方式がある。この準瞬時圧伸方式は、PC
M符号化された音声データを時系列に所定数ごとのブロ
ックに分割し、おのおののブロックにおける信号絶対値
の最大値に対応した最上位桁をあらわすスケールデータ
を識別し、その最上位桁を含む所定ビット数のデータを
符号データに整形するものであり、比較的符号化処理が
簡単で、かつ、容易に1サンプルのビット数を低減する
ことが可能である。しかしながら、このような準瞬時圧
伸方式は、効率的には充分なものではない。
そこで、この準瞬時圧伸方式の効率を改善する手法とし
てr差分PCM方式と準瞬時圧伸との結合」が考えられ
るが、一般に単に準瞬時圧伸を差分PCN方式に適用し
ただけでは、圧縮時の欠落ビットが伝送誤差を生じ、受
信側の積分器で誤差が累積して受信不能となる6 次にこの点について説明する。
いま準瞬時圧伸を差分PCM方式に適用した符号化方式
によって、第11図(a)に示したような音声信号を符
号化することを考える。まず、差分PCM符号化のため
にこの音声信号を例えば8KHzのサンプリング周波数
でサンプリングしてサンプル間の差分値を形成する。こ
こでは、隣接するサンプル間の差分値を符号付の8ビツ
トのデータすなわち2の補数表現の8ビツトデータであ
られす、そして、準瞬時圧伸のための条件は、8サンプ
ルで1ブロツクを構成し、伝送データは1サンプルあた
り3ビツトとする。また、スケールデータは3ビツトで
ある。
ここで、8つのサンプル#1〜#8における差分値が第
12図(a)のように得られたものとする。このブロッ
ク内において差分値の絶対値が最大になるものは、サン
プルx1であり、したがって、このときのスケール位置
PO8は、このサンプル#1のビットパタンの最上位桁
であるビット4となり、スケール位置posの値は(1
00)2になる。
これにより、各サンプルの伝送ビット(伝送データ;す
なわち符号データ)は、このスケール位置PO8よりも
1つ上位桁で、符号値をあらわすビット5(サインビッ
ト)から3ビツトのデータ、すなわち、ビット5,4.
3のデータとなる。
したがって、このブロックでは、最初にスケール位@p
osを、それに続いてサンプル#1〜#8の伝送ビット
を順次連続して配置して構成した伝送データ(符号デー
タ)は、同図(b)に示したようなものとなる。
このような符号データを復号するとき、まず、1ブロツ
ク分の符号データを3ビツトずつに分解し。
その最初の3ビツトの値からスケール位@PO3を識別
する。そして、後続する3ビツトの符号データを8ビツ
トのデータに伸張するときには、スケール位[PO3よ
りも1つ上位桁に符号データのMSB (最上位ビット
)を一致させ、そのMSBよりも上位桁の各桁には符号
ビットの値をセットし、そのLSB (最下位ビット)
よりも下位桁の各桁には0をセットする。
これにより、同図(c)に示したデータが、復号後のデ
ータとして得られる。このデータと、符号化前のデータ
とを比較すると、復号データでは伝送ビットよりも下位
桁の情報(直流成分)が欠落していることがわかる(第
11図(b)参照)。すなわち、情報に欠落ビットを生
じている。
このような復号データに基づいて音声信号を再生すると
、第11図(c)に一点鎖線で示したように。
欠落ビット分の誤差が蓄積して負の直流シフトを生じ、
同図に破線で示した元の波形よりも右下がりの波形とな
り、その結果、適正に情報を伝送することができない。
このような問題を解決する1つの方法として、「欠落ビ
ットのアキュムレーションによる差分圧伸PCM (D
C−PCM) J (高橋ほか、電子通信学会論文誌’
84/10 Vol、J67−B No、10)が提案
されている。
しかしながら、この方法は15ビット程度の差分データ
を8ビット程度に圧縮する場合に有効であり、8ビツト
の差分データを3ビット程度に圧縮するような低ビツト
レートの符号化方式には適用できない。
すなわち、このような低ビツトレートの場合にはブロッ
ク間において音声波形の振幅が大幅に変化したときなど
ブロック間でスケール位置が大幅に変動することがあり
、そのためにアキュムレーションされている誤差信号の
方が伝送すべき有効なデータよりも大きな値となること
がある。かかる場合には、伝送すべきデータが誤差信号
に埋もれてしまい、適正なデータ伝送を実現できない。
[目的] 本発明は、上述した従来技術の不都合を解決するために
なされたものであり、低ビツトレートで。
簡単な処理により、高品質な音声を再現できる音声符号
化方式を提供することを目的としている。
[構成] 本発明は、準瞬時圧伸のさいにもとまる圧縮データをそ
の量子化ビット内で原信号に最も近くなるように補正す
ることで、上記した目的を達成している。
以下、添付図面を参照しながら、本発明の実施例を詳細
に説明する。
第1図は、本発明の一実施例にかかる音声符号化装置を
示している。この実施例は、差分PCM符号化方式に準
瞬時圧伸を適用したものであり、準瞬時圧伸を施したさ
いにもとまるブロック化した圧縮差分データを順次復号
し、原信号と比較することで圧縮ビット数内で誤差の少
ない差分データとなるようにサンプル点毎に補正してい
る。またこの実施例では、8 K Hzのサンプリング
周波数で音声信号をサンプリングしてサンプル間の差分
値を2の補数表現の8ビツトデータであられし、8サン
プルで準瞬時圧伸のための1ブロツクを構成し。
伝送データは1サンプルあたり3ビツト、および、スケ
ールデータは3ビツトとする。
同図において、入力音声信号SSは、ローパスフィルタ
1によって帯域制限されたのちにアナログ/デジタル変
換器2に加えられて8ビツトのデジタル信号O3に変換
される。このアナログ/デジタル変換器2は、サンプリ
ング周波数が8KHzで直線量子化するものである。
デジタル信号DSは、1ブロツクをなす8サンプル分の
記憶容量をもつバッファ3に蓄積され、このバッファ3
に蓄積されたデジタル信号DSdは、差分データを形成
するための加減算器4のプラス入力端に加えられている
この加減算器4から出力される9ビツトの差分データD
Dsは、最大値制限回路5によって8ビツトの差分デー
タDDに変換される。このようにして差分データの最大
値を制限したのは、次のような理由による。
すなわち、差分データDDsをそのまま準瞬時圧縮した
場合、突発的に大きな差分データを含むブロックにおい
てはそれに対応した大きなスケール値が設定され、その
ために他の小さな差分データに対する準瞬時圧縮後のデ
ータの追従性が悪化する。その結果、復元した音声信号
が、聴覚上、ギクシャクした感じを与える。そこで、こ
のように差分データの最大値をある程度に制限すること
により、このような聴覚上の問題を解決することができ
る。
この差分データDDは、8サンプル分の記憶容量をもつ
バッファ6、準瞬時圧縮のためのスケール値を設定する
ためのスケール値設定部7および加算器8の一入力端に
加えられている。
この加算器8の出力はレジスタ9に加えられ、このレジ
スタ9の出力は加減算器4のマイナス入力端、加算器8
の他入力端、および、8サンプル分の記憶容量をもつバ
ッファ10に加えられている。
このようにして、最大値制限回路5によって8ビツトに
制限された差分データDDの積算値が加算器8によって
形成され、このデータが差分データDDsを形成するた
めの直前のサンプルのデータとして用いられている。
バッファ6の記憶データは、サンプル毎に準瞬時圧縮符
号化する準瞬時圧縮部11に加えられている。
スケール値設定部7は、最大値制限回路5から出力され
る差分データDDの連続する8サンプルのうち、最も絶
対値の大きいものを識別し、そのビットパタンの最上位
桁を判別してそのビット位置を3ビツトのスケールデー
タDKで出力する。このスケールデータDKは、準瞬時
圧縮部11、準瞬時圧縮部11から出力される圧縮差分
データDCを最適なデータに変換するための最適化処理
部12、lプロ2ク分のデータを所定の信号形式に整形
するためのマルチプレクサ13の一入力端、および、最
適化された圧縮差分データを伸張するための準瞬時伸張
部14に加えられている。
またバッファ10の記憶データは、レジスタ9がら出力
される差分データDDを積算して形成された復号データ
であり、符号化の対象である元の音声信号(以下原信号
という)として最適化処理部12に加えられている。
準瞬時圧縮部11は、バッファ6から加えられる8ビツ
トの差分データDDについて、おのおののサンプル毎に
、スケール値設定部7から加えられるスケールデータD
Kがあられすスケール位置よりも1ビツト上位桁をMS
Bとする3ビツトのデータを抜きだしてそれを圧縮差分
データDCとして最適化処理部12に出力する。
最適化処理部12は、準瞬時圧縮部11から加えられる
1ブロック分の圧縮差分データDCを順次復号し、バッ
ファ10から加えられる原信号と比較することにより、
圧縮ビット数内で誤差の少ない差分データとなるように
サンプル点毎に圧縮差分データDCを補正し、これを最
適化差分データDCoとしてマルチプレクサ13の他入
力端および準瞬時伸張部14に加えている。
マルチプレクサ13は、第2図に示したように。
スケール値設定部7から出力されたスケールデータDK
を先頭に配置し、それに続いて各サンプルの最適化差分
データDCoを順次配置して構成した信号を、1ブロッ
ク分の符号化データDLとして形成して次段装置(例え
ばデータ伝送装置、あるいは。
データ記憶装置等)に出力する。
準瞬時伸張部14は、スケール値設定部7から加えられ
るスケールデータDKが示している桁よりも1つ上位桁
にMSBが一致するように、最適化処理部12から出力
される3ビツトの最適化差分データDC。
を配置するとともに、それよりも上位桁には最適化差分
データDCoの符号データの値を配置し、下位桁には0
を配置して8ビツトの復号データDHを形成するもので
あり、その復号データDEは積分部15に加えられる。
積分部15は、準瞬時伸張部14から出力される復号デ
ータDEを積算し、符号化データOLを実際に復号化処
理して復元したときの復元データSDを形成し、この復
元データSDをレジスタ9に出力している。レジスタ9
では、この復元データSDを、1つのブロックの処理を
終了して次のブロックの処理を開始する直前で取り込む
これにより、準瞬時圧伸に特有な欠落ビットによる誤差
の累積を、次のブロックの最初のサンプルデータを形成
するときに解消することができ、その結果、より正確な
符号化データDLを形成することができる。
このようにして、本実施例では、最適化処理部12によ
って元の音声信号により追従するように圧縮差分データ
DCを補正するとともに、積分部15で形成した復元デ
ータSDによってブロック内の累積誤差を次のブロック
に反映させているので、準瞬時圧伸による低ビツトレー
トの音声符号化処理をより精度よく実現することができ
る。
次に、最適化処理部12が実行する圧縮差分データの最
適化処理について説明する。
いま、第3図(a)に示したような音声波形を符号化す
ることを考える。サンプル10を基準としてサンプル#
IJ2.#3の差分をそれぞれ8ビツトで形成したとき
、この場合の差分の絶対値はサンプル#1が最大になる
。したがって、このときの3ビツトの圧縮差分データは
このサンプル#lを基準に形成され、スケール値はその
ビットパタンの最上位桁の桁位置となる。
さて、圧縮差分データを3ビツトであられした場合1表
現できるデータはスケール値よりも1ビツト下位桁の量
子化幅のものであり、したがうて、おのおののサンプル
#1,12J3の値は、この量子化幅で表現可能なデー
タに置換される0例えば、サンプル#1の圧縮差分デー
タはこの表現できるデータのうち実際の値P11よりも
下の値P12(=(010)2;ただしこの場合LSB
はスケール位置よりも1ビツト下位桁。以下同じ)にな
る。
ところで、この量子化幅で表現できるデータのうち、P
I3よりも1つ大きな値P13(”(011)2)に対
応したデータの方がよりサンプル11の実際の値pHに
近い。したがって、この値P13をサンプル#1の圧縮
差分データとすれば、復号化したときの音声信号(復号
値)の誤差を小さくすることができる。
すなわち、このときの復号値の誤差は、最大でもこの圧
縮差分データの量子化幅の172に抑えることができる
同様に、サンプル$2.#3について考えると、その復
号値が符号化前の信号の値(サンプル#2では値P21
、サンプル#3では値P31)に最も近くなる圧縮差分
データを選択すればよい。
すなわち、この場合、サンプルI2については、値P2
1よりも小さい値P22に基づいた復号値に較べて値P
21よりも大きい値P23に基づいた復号値の方がより
値P21に近いので、サンプル#1の復号値である値P
11と値P23との差分(=(110)2)を圧縮差分
データに設定する。またサンプル#3については、値P
31が圧縮差分データであられし得る復号値に一致する
ので、サンプルI2の復号値である値P23と値P31
との差分(”(001)z)を圧縮差分データに設定す
る。
このようにして、元の音声信号に対する追従性が向上し
た圧縮差分データを形成することができる。そのための
処理である最適化差分ビットルーチンの一例を第4図(
a)、(b)に示す。
まず、準瞬時圧縮部11から圧縮差分データd (DC
)を入力しく処理101)、その圧縮差分データdの値
が、圧縮ビット数(この場合は3ビツト)であられすこ
とのできる正の最大値MAX(=(011)2)より大
きいか。
あるいは、負の最大値MIN(=(100)2)より小
さいかを判別しく判断102,103)、判断102の
結果がYESになるときには圧縮差分データdに値MA
Xを代入しく処理104) 、判断103の結果がYE
Sになるときに圧縮差分データdに値MINを代入する
(処理105)。
次に、圧縮差分デ・−タdよりもLSB(=(001)
Z)だけ小さな値dmと圧縮差分データdよりもLSB
だけ大きな値dPを形成しく処理106,107)、値
dmが値WINよりも小さくなった場合には値dIIに
値MINを代入しく判断108、処理109)、値dp
が値MAXよりも大きくなった場合には値dPに値MA
Xを代入する(判断110、処理111)。
このようにして値dp、dIoを形成すると、スケール
データDKに基づいて値d、dp、dsを準瞬時伸張し
たときの8ビツトの値dd 、 ddp 、 ddmを
算出する(処理112)。そして、この値dd、ddp
、ddmにそれぞれ1サンプル前のデータの復号値da
oを加算し、おのおのの値d、dp、daに対応したロ
ーカル復号値da、dap。
damを形成する(処理113)。なお処理112およ
び113でローカル復号処理を実現しており、そのため
に、直前のサンプルの復号値daoを記憶しておく。
次に、当該サンプルに対応した原信号の値daiをバッ
ファ10から読み込み、この原信号の値daiと、おの
おののローカル復号値da 、 dap 、 damと
の差の絶対値Da、Op、Dmを算出しく処理114)
、原信号の値daiがローカル復号値daよりも大きい
かどうかを調べる(判断115)。
この判断115の結果がYESになるときには、絶対値
Daが絶対値opよりも大きいかどうかを調べ(判断1
16)、この判断116の結果がYESになるときには
、値dに値dPを代入しく処理117)処理106へと
戻り。
判断116の結果がNOになるときには、値dを最適化
差分データOCoとして出力する(処理ttg)。
また判断115の結果がNoになるときには、絶対値D
aが絶対値opよりも大きいかどうかを調べ(判断11
9)、この判断119の結果がYESになるときには、
値dに値dIIlを代入しく処理120)処理106へ
と戻り。
判断119の結果がNOになるときには処理118を実
行する。
すなわち、第3図(b)の左側に示したように、原信号
の値daiが復号値daよりも復号値dapに近いとき
には、圧縮差分データdをLSBだけ大きい値dρに更
新して、その値を最適化差分データDCoとして出力す
る。また、その反対に原信号の値daiが復号値daよ
りも復号値damに近いときには、圧縮差分データdを
LSBだけ小さい値dfflに更新して、その値を最適
化差分データDCoとして出方する6なお、1回の処理
で最適な値が得られなかった場合には、この処理を繰り
返し実行する。
このようにして、準瞬時圧伸で得られた圧縮差分データ
に圧縮ビットのLSBを加算、減算する操作をサンプル
点毎に繰り返し行ない、復号値と原信号との誤差を少な
くするように差分データを補正している。
なお、バッファ10に原信号として記憶するデータとし
ては1、最大値制限回路5に入力される前のバッファ3
の出力データを用いることもできる。
したがって、例えば第5図(a)に示したような音声信
号(第11図(a)と同じ)をこのような最適化差分ビ
ットルーチンを用いた準瞬時圧縮によって符号化するこ
とを考える。
まず、この音声信号の8つのサンプル#1〜#8におけ
る差分値が第6図(a)のように得られ、したがって、
このときのスケール値1tPO5は、サンプル#1のビ
ットパタンの最上位桁であるビット4となり、スケール
位置PO8の値は(100)zになる。これにより、準
瞬時圧縮部11によって形成される圧縮差分データDC
は、おのおののサンプル#1−#8について、それぞれ
第6図(b)に示したものとなる。
そして、この圧縮差分データDCは、おのおののサンプ
ル#1−18について、それぞれ上述の最適化差分ビッ
トルーチンにより第6図(C)に示したような最適化差
分データDCoにそれぞれ補正される。
その結果、後述する音声復号化装置では、この最適化差
分データDCoのおのおののサンプル11−18の値が
第6図(d)に示したように8ビツトの差分データに伸
張され、この差分データに基づいて、音声信号が第5図
(C)に実線で示したように復号される。ここで、上述
した圧縮差分データDCをそのまま符号化データに用い
た場合の再生された音声信号を第5図(c)に一点鎖線
で示す。
これらの比較かられかるように、最適化差分データDC
oに基づいて再生された音声信号は、第5図(c)に破
線で示した符号化前の音声信号にまとわりつくようなも
のとなり、符号化前の音声信号に対する追従性が大きく
向上している。
なお、上述した最適化差分ビットルーチン以外で、上述
したような圧縮差分データの最適化処理を実現すること
ができる0例えば、スケール値を決定した後には、おの
おののサンプルについて、そのスケール値に対応した量
子化幅でとりうる復号値のうち最もサンプリング値に近
いものを順次選択し、その復号値に対応した圧縮差分デ
ータを形成することで、圧縮差分データを最適化するこ
とができる。
第7図は1本発明の一実施例にががる音声復号化装置の
一例を示している。この音声復号化装置は、上述した音
声符号化装置によって符号化された符号化データOLを
復号して音声信号を出方するものである。
同図において1例えばデータ受信装置あるいはデータ記
憶装置等の前段装置(図示路)から出方された符号化デ
ータDLは、デマルチプレクサ21に加えられ、おのお
ののブロック毎に、先頭の3ビツトがスケール値sCと
して識別されて準瞬時伸張部22のスケール値入力端に
加えられ、それ以外のコードデータ(圧縮差分データ)
は、準瞬時伸張部22のコードデータ入力端に加えられ
る。
準瞬時伸張部22は、加えられるコードデータを3ビツ
トずつに区切るとともに、8ビツトデータにおいて入力
したスケールデータSCに対応したビット位置にその3
ビツトのデータを配置し、そのコートデータよりも上位
桁には符号ビットの内容を、下位桁には0を配置して8
ビツトデータ(第6図(d)参照)に伸張し、この8ビ
ツトデータを積分部23に出力する。
積分部23は、順次入力される8ビツトデータを積算し
て音声信号の各サンプルにおける信号値を形成し、これ
をデジタル/アナログ変換器24に出力する。
デジタル/アナログ変換器24は、受入した信号値を8
KHzの変換周波数で対応するアナログ信号(レベル信
号)に変換し、これをローパスフィルタ25に出力する
。このアナログ信号は、ローパスフィルタ25によって
波形整形されたのち、再生音声信号として次段装置(例
えば音声出力装置等)に出力される。
このように、本発明にかかる符号化データを復号するた
めの音声復号化装置の構成は、非常に簡単なものとなる
。したがって、例えば、汎用の8ビツトマイクロプロセ
ツサを用いてこの音声復号化装置を実現することもでき
、コストを極く小さく抑えることができる。
ところで、準瞬時圧伸においては、1つのブロック内に
おいて信号値の絶対値が最大になるビットパタンに基づ
いてスケール位置を設定しているので、例えば、そのブ
ロックにおいて突発的に大きな値をとるサンプルがあっ
た場合、その大きな値に対応したスケール値が設定され
るため、他の小さい値に対する符号化データの追従性が
悪くなり、@党上好ましくないという不都合を生じるこ
とがある。
次に、このような不都合を解消できる、本発明にかかる
他の実施例について説明する。
さて、上述した不都合を解消するには、そのブロックに
おいて最も誤差の少ない符号化データを形成すればよく
、そのためには適切なスケール位置(値)を設定すれば
よい。
そこで、本実施例では、最初に設定したスケール位置に
基づいて準瞬時圧縮したときと、そのスケール位置より
も1桁上位桁をスケール位置に設定した場合にそのスケ
ール位置に基づいて準瞬時圧縮したときと、その最初の
スケール位置よりも1桁下位桁をスケール位置に設定し
た場合にそのスケール位置に基づいて準瞬時圧縮したと
きとで。
おのおののサンプルにおいて復号値と符号化前の音声信
号の値との誤差を算出してそれらに基づいてそれぞれの
スケール位置での評価値を形成し、この評価値に基づき
、それらのスケール位置のもののうち最も良好なものを
選択するようにしている。なお、この評価値としては、
おのおののサンプルにおける元の音声信号と復号値との
差の総和や、その差を自乗した値の総和(誤差パワ)を
用いることができる。
すなわち、例えば第8図(a)に示したような音声信号
があったとき、この音声信号の各サンプルI11〜#8
のうち差分値が最も大きいサンプル#1に基づいてスケ
ール値が決定され、その状態が同図であるとする。
これに対し、スケール値を1つ小さくした場合にはサン
プル値の量子化幅が1段階小さくなるので同図(b)の
状態になり、スケール値を1つ大きくした場合にはサン
プル値の量子化幅が1段階大きくなるので同図(C)の
状態となる。
また、おのおのの状態で、上述した最適化差分ビットル
ーチンによる最適化処理を実行したとき、各サンプルに
おける符号ビットは、次の表のようになる。
嚢 ここで、 SCoは第8図(a)の場合のスケール値を
、SC−1はSCoよりも1だけ小さい同図(b)の場
合のスケール値を、SC1はSCoよりも1だけ大きい
同図(c)の場合のスケール値をそれぞれ示している。
このようにスケール値を変更すると、当然のことながら
元の音声信号と復号値との差の総和あるいは誤差パワは
5そのブロックにおける音声信号の変化に対応していず
れか1つのスケール値のものが最小となり、その最小と
なるものが当該ブロックにおいて音声信号に対する追従
性が最良である。
例えば、発明者等の実験によれば統計的にみて、スケー
ル値SC◎のものの誤差パワが最も小さくなるのはブロ
ック総数のうち60%程度であり、スケール値SC−1
のものの誤差パワが最も小さくなるのはブロック総数の
うち30%程度であり、スケール値SCIのものの誤差
パワが最も小さくなるのはブロック総数のうち10%程
度である。
このようにして、ブロック毎に使用するスケール値を選
択することで、再生した音声信号の音質(聴覚上の)が
向上する。
この実施例にかかる音声符号化装置の一例を第9図に示
す。なお、同図において第1図と同一部分には同一符号
を付し、相当する部分にはそれと同一符号にサフィック
スを付加してその説明を省略する。またこの装置は、準
瞬時圧縮の1ブロック単位に作動する。
同図において、スケール値設定部7aは、最大値制限回
路5から出力される差分データDDの連続する8サンプ
ルからなるブロックでスケール値を判別するとともに、
そのスケール値よりも1つ大きな値および1つ小さな値
を形成し、それぞれスケールデータDKo、DKz、D
K−tとして出力する。これらのスケールデータDKo
、DK1.DK−tは、上述したスケール値5CII、
SCI、5C−1にそれぞれ相当する。
スケールデータDKoは、準瞬時圧縮部11o、最適化
処理部12o、準瞬時伸張部14oおよびセレクタ31
の一入力端に加えられ、スケールデータDK1は、準瞬
時圧縮部111、最適化処理部121、準瞬時伸張部1
41およびセレクタ31の他入力端に加えられ、スケー
ルデータDK−1は、準瞬時圧縮部11−1、最適化処
理部12−1、準瞬時伸張部14−1およびセレクタ3
1のさらに他の入力端に加えられている。
準瞬時圧縮部11oはスケールデータDKoに基づきバ
ッファ6の出力データから圧縮差分データDC+1を形
成し、最適化処理部12oはこの圧縮差分データDCo
に上述した最適化差分ビットルーチンを適用して最適化
差分データDConを形成し、この最適化差分データD
Cooは準瞬時伸張部14oおよびセレクタ32の一入
力端に加えられる。準瞬時伸張部14゜は入力される最
適化差分データDConをスケールデータDKoを基準
として8ビツトデータのデータDE。
に伸張し、このデータDEaは積分部150によって積
算されて復号され、その復号値SD[+は比較部33の
一入力端およびセレクタ34の一入力端に加えられてい
る。
また、準瞬時圧縮部111はスケールデータDKIに基
づきバッファ6の出力データから圧縮差分データDC1
を形成し、最適化処理部121はこの圧縮差分データD
C1に上述した最適化差分ビットルーチンを適用して最
適化差分データDCo1を形成し、この最適化差分デー
タDCo1は準瞬時伸張部141およびセレクタ32の
一入力端に加えられる。i!!瞬時伸張部141は入力
される最適化差分データDCo 1をスケールデータD
K1を基準として8ビツトデータのデータDEIに伸張
し、このデータDEtは積分部151によって積算され
て復号され、その復号値SDzは比較部33の一入力端
およびセレクタ34の一入力端に加えられている。
同様に、準瞬時圧縮部11−1はスケールデータDK−
1に基づきバッファ6の出力データから圧縮差分データ
DC−1を形成し、最適化処理部12−1はこの圧縮差
分データDC−1に上述した最適化差分ビットルーチン
を適用して最適化差分データDCo−1を形成し、この
最適化差分データDCo−1は準瞬時伸張部14−1お
よびセレクタ32の一入力端に加えられる。
準瞬時伸張部14−1は入力される最適化差分データD
Co−1をスケールデータDK−1を基準として8ビツ
トデータのデータI)E−1に伸張し、このデータDE
−1は積分部15−1によって積算されて復号され、そ
の復号値5D−1は比較部33の一入力端およびセレク
タ34の一入力端に加えられている。
また、最大値制限回路5から出力される差分デ−タDD
は、バッファ10aによって1ブロツク分が蓄積され、
このバッファ10aの出力は積分部15aによって順次
積算されて圧縮されていない音声信号(すなわち原信号
)が形成され、それに対応したデータSDaが最適化処
理部120,121.12−1および比較部33に加え
られている。
このように、比較部33には、原信号に対応したデータ
SDa、スケール値5Co(スケールデータDKo)に
対応した最適化差分データDCooを復号したときの復
号値SDo、スケール値5Cr(スケールデータDK1
)に対応した最適化差分データDCo 1を復号したと
きの復号値SD1、および、スケール値SC−1(スケ
ールデータDK−1)に対応した最適化差分データDC
o−+を復号したときの復号値5D−1が、サンプル毎
にそれぞれ加えられる。
比較部33は、データSDaと復号値SDo、SDx、
5D−tに基づき、それらの復号値SD0,501,5
D−1におけるデータSDaからの誤差をそれぞれのサ
ンプル毎に形成し、1ブロツクにおける誤差パワをおの
おのの復号値5011,501,5D−1について算出
し、それらの中で最小値をとるものを判別する。
そして、復号値SDoについての誤差パワが最小になる
ときには、セレクタ31によってスケールデータDKo
を選択してこれをマルチプレクサ13に出力するととも
にセレクタ32によって最適化差分データDConを選
択してこれをマルチプレクサ13に出力する。またセレ
クタ34によって符号値SD[+を選択し、これをレジ
スタ9に取り込ませるデータとする。
また、復号値SDIについての誤差パワが最小になると
きには、セレクタ31によってスケールデータDKlを
選択してこれをマルチプレクサ13に出力するとともに
セレクタ32しこよって最適化差分データDC01を選
択してこれをマルチプレクサ13に出力する。またセレ
クタ34によって符号値SDzを選択し、これをレジス
タ9に取り込ませるデータとする。
同様に、復号値SD−1についての誤差パワが最小にな
るときには、セレクタ31によってスケールデータDK
−1を選択してこれをマルチプレクサ13に出力すると
ともにセレクタ32によって最適化差分データDCo−
1を選択してこれをマルチプレクサ13に出力する。ま
たセレクタ34によって符号値SD−1を選択し、これ
をレジスタ9に取り込ませるデータとする。
したがって、マルチプレクサ13からは、そのブロック
において最も誤差パワが小さくなる符号化データDLが
出力される。
比較部33が実行する比較ルーチンの一例を第1O図に
示す。
まず、データSDaおよび復号値SDn、SDt、5D
−xをサンプル毎に入力するとともに(処理201)、
それらの入力したデータに基づき、次式を演算して、復
号値500.SDI、5D−1におのおの対応した誤差
パワRMSO,RMSI、RMS−1をそれぞれ算出す
る(処理202)。
RMSk=(Σ(SDaa−5Dvi)2)1′”ここ
で、k=0.1.−1、コはブロック内におけるサンプ
ル番号、SDa =はブロック内のおのおののサンプル
におけるデータ、 5Dijはブロック内のおのおのの
サンプルにおける符号値SDkをあらわす。
そして、いずれの誤差パワRMS口、RMS11RMS
−xが最も小さいかを識別しく判断203.204.2
05)、最小の誤差パワRMSII、RMSI、RMS
−1に対応したスケールデータDKo、DK1.DK−
tと最適化差分データDCoo。
DCo 1 、 DCo−1をそれぞれ選択する(処理
206,207゜208)。
なお、この比較ルーチンにおいて、おのおのの復号値S
D[1lSDl、5D−1とデータSDaとの誤差に基
づいた評価値としては、上述した誤差パワ以外に、例え
ば、おのおののサンプルにおけるデータSDaと復号値
SDo 、SDl、5D−zとの差の総和等を用いるこ
とができる。
また、この実施例によって形成された符号化データDL
を復号化する音声復号化装置は、第7図と同一のものを
用いることができる。
ところで、以上説明した各実施例においては、差分PC
M符号について準瞬時圧伸を適用する場合について述べ
たが、本発明は、 PCM符号について準瞬時圧伸を適
用する場合についても、同様にして適用することができ
る。
なお、上述した各実施例における各種定数は、本発明を
実施する上での一例を示したものであり、それらに限る
ことはない。
[効果] 以上説明したように、本発明によれば、準瞬時圧伸のさ
いにもとまる圧縮データをその量子化ビット内で原信号
に最も近くなるように補正しているので、低ビツトレー
トで、簡単な処理により、高品質な音声を再現できると
いう優れた効果を奏することができる。
【図面の簡単な説明】
第1図は本発明の一実施例にかかる音声符号化装置を示
したブロック図、第2図は符号化データの信号形式を例
示した信号配置図、第3図(a)は最適化処理を説明す
るための波形図、同図(b)は最適化差分ビットルーチ
ンの作用を説明するための信号配置図、第4図(a)、
(b)は最適化差分ビットルーチンの一例を示したフロ
ーチャート、第5図は最適化処理の効果の説明図、第6
図(a)−(d)は最適化の様子を示した信号配置図、
第7図は本発明の一実施例にかかる音声復号化装置の一
例を示したブロック図、第8図(a)−(c)は本発明
の他の実施例の原理の説明図、第9図は本発明の他の実
施例にかかる音声符号化装置を示したブロック図、第1
0図は比較ルーチンの一例を示したフローチャート、第
11図は従来技術の説明図、第12図(a)〜(c)は
従来技術の符号化復号化の状況を説明するための信号配
置図である。 1.25・・・ローパスフィルタ、2・・・アナログ/
デジタル変換器、3,6,10,10a・・・バッファ
、4・・・加減算器、5・・・最大値制限回路、7,7
a・・・スケール値設定部、8・・・加算器、9・・・
レジスタ、11、llo、llx、11−t・・・準瞬
時圧縮部、12.120,121.12−1・・・最適
化処理部、13・・・マルチプレクサ、14,140,
141.14−1.22・・・準瞬時伸張部、15.1
5o、15x、15−t、15a、23−積分部、21
・・・デマルチプレクサ、24・・・デジタル/アナロ
グ変換器、31.32,34・・・セレクタ、33・・
・比較部。 、/−□、、 4−          +70・ノフ(b) ap CB+   −二am−−−1−o−−−−−!5己( ぜam−一→− 第4図 (a) (M軍り 匿S]丁101 [F] 第4図 (b) 第5図 (a)( 第6図 弓7図 第8図 (a) (b) 第8図 (C)    ′ 第10図 第11図 (a)1 第12図 手続補正書(帥) 昭和61年10月6日

Claims (10)

    【特許請求の範囲】
  1. (1)PCM符号化された音声データを時系列に所定数
    ごとのブロックに分割し、おのおののブロックにおける
    信号絶対値の最大値に対応した最上位桁をあらわすスケ
    ールデータを識別し、その最上位桁を含む所定ビット数
    のデータを符号データに整形して上記音声データを圧縮
    する音声符号化方式において、上記符号データの復号値
    と当該符号データに対応した上記音声データとの誤差が
    最も小さくなるように当該符号データを補正することを
    特徴とする音声符号化方式。
  2. (2)PCM符号化された音声データのうち隣接するサ
    ンプル間で直前サンプルとの差分値を形成してその差分
    値を時系列に所定数ごとのブロックに分割し、おのおの
    のブロックにおける差分値の絶対値の最大値に対応した
    最上位桁をあらわすスケールデータを識別し、その最上
    位桁を含む所定ビット数のデータを符号データに整形し
    て上記音声データを圧縮する音声符号化方式において、
    上記符号データの復号値と当該符号データに対応した上
    記音声データとの誤差が最も小さくなるように当該符号
    データを補正するとともに、後続するブロックの最初の
    サンプルの差分値を算出するときには当該ブロックの最
    後のサンプルの復号値を基準とすることを特徴とする音
    声符号化方式。
  3. (3)特許請求の範囲第2項記載において、前記差分値
    は、その絶対値の最大値が制限されることを特徴とする
    音声符号化方式。
  4. (4)PCM符号化された音声データを時系列に所定数
    ごとのブロックに分割し、おのおののブロックにおける
    信号絶対値の最大値に対応した最上位桁をあらわすスケ
    ールデータを識別し、その最上位桁を含む所定ビット数
    のデータを符号データに整形して上記音声データを圧縮
    する音声符号化方式において、上記最上位桁およびこの
    最上位桁にそれぞれに隣接する桁に対応した複数のスケ
    ールデータにそれぞれ基づいて上記符号データを整形し
    複数の符号データ系列を形成するとともに、おのおのの
    符号データ系列を構成する個別の符号データに対応する
    復号値と当該符号データに対応した上記音声データとの
    誤差が最も小さくなるように当該符号データを補正して
    上記複数の符号データ系列をそれぞれ補正し、それらの
    補正された符号データ系列のうちブロック内における誤
    差が最も小さくなる符号データ系列を当該ブロックの符
    号データ系列として選択することを特徴とする音声符号
    化方式。
  5. (5)特許請求の範囲第4項記載において、前記誤差は
    、おのおのの符号データ系列のブロック内における誤差
    パワであることを特徴とする音声符号化方式。
  6. (6)特許請求の範囲第4項記載において、前記誤差は
    、おのおのの符号データ系列のブロック内の各サンプル
    における誤差の絶対値の総和であることを特徴とする音
    声符号化方式。
  7. (7)PCM符号化された音声データのうち隣接するサ
    ンプル間で直前サンプルとの差分値を形成してその差分
    値を時系列に所定数ごとのブロックに分割し、おのおの
    のブロックにおける差分値の絶対値の最大値に対応した
    最上位桁をあらわすスケールデータを識別し、その最上
    位桁を含む所定ビット数のデータを符号データに整形し
    て上記音声データを圧縮する音声符号化方式において、
    上記最上位桁およびこの最上位桁にそれぞれに隣接する
    桁に対応した複数のスケールデータにそれぞれ基づいて
    上記符号データを整形し複数の符号データ系列を形成す
    るとともに、おのおのの符号データ系列を構成する個別
    の符号データに対応する復号値と当該符号データに対応
    した上記音声データとの誤差が最も小さくなるように当
    該符号データを補正して上記複数の符号データ系列をそ
    れぞれ補正し、それらの補正された符号データ系列のう
    ちブロック内における誤差パワが最も小さくなる符号デ
    ータ系列を当該ブロックの符号データ系列として選択し
    、後続するブロックの最初のサンプルの差分値を算出す
    るときには当該ブロックで選択した符号データ系列の最
    後のサンプルの復号値を基準とすることを特徴とする音
    声符号化方式。
  8. (8)特許請求の範囲第7項記載において、前記誤差は
    、おのおのの符号データ系列のブロック内における誤差
    パワであることを特徴とする音声符号化方式。
  9. (9)特許請求の範囲第7項記載において、前記誤差は
    、おのおのの符号データ系列のブロック内の各サンプル
    における誤差の絶対値の総和であることを特徴とする音
    声符号化方式。
  10. (10)特許請求の範囲第7項記載において、前記差分
    値は、その絶対値の最大値が制限されることを特徴とす
    る音声符号化方式。
JP61158008A 1986-07-07 1986-07-07 音声符号化方法 Expired - Fee Related JP2652371B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61158008A JP2652371B2 (ja) 1986-07-07 1986-07-07 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61158008A JP2652371B2 (ja) 1986-07-07 1986-07-07 音声符号化方法

Publications (2)

Publication Number Publication Date
JPS6314524A true JPS6314524A (ja) 1988-01-21
JP2652371B2 JP2652371B2 (ja) 1997-09-10

Family

ID=15662240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61158008A Expired - Fee Related JP2652371B2 (ja) 1986-07-07 1986-07-07 音声符号化方法

Country Status (1)

Country Link
JP (1) JP2652371B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6314523A (ja) * 1986-07-07 1988-01-21 Ricoh Co Ltd 音声符号化方式

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5627546A (en) * 1979-08-13 1981-03-17 Nec Corp Block compressing coder
JPS6314523A (ja) * 1986-07-07 1988-01-21 Ricoh Co Ltd 音声符号化方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5627546A (en) * 1979-08-13 1981-03-17 Nec Corp Block compressing coder
JPS6314523A (ja) * 1986-07-07 1988-01-21 Ricoh Co Ltd 音声符号化方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6314523A (ja) * 1986-07-07 1988-01-21 Ricoh Co Ltd 音声符号化方式

Also Published As

Publication number Publication date
JP2652371B2 (ja) 1997-09-10

Similar Documents

Publication Publication Date Title
JP3336617B2 (ja) 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体
US7230551B2 (en) Floating-point type digital signal reversible encoding method, decoding method, apparatuses therefor, and programs therefor
US4870685A (en) Voice signal coding method
US7126501B2 (en) Floating point type digital signal reversible encoding method, decoding method, devices for them, and programs for them
JPH01233500A (ja) 複数レート音声エンコーデイング方法
EP0145788B1 (en) Method and apparatus for transmitting digital signal
JPS63142399A (ja) 音声分析合成方法及び装置
JP3255022B2 (ja) 適応変換符号化方式および適応変換復号方式
US6480550B1 (en) Method of compressing an analogue signal
JP2775857B2 (ja) デジタル信号の帯域圧縮回路
JPS60251733A (ja) デイジタル信号伝送装置
JPS6314524A (ja) 音声符号化方法
JP2007142547A (ja) 符号化方法及び復号化方法とその符号器及び復号器
JP3465697B2 (ja) 信号記録媒体
JPH01167900A (ja) 音声圧縮及び復号方式
JPS63238729A (ja) 音声圧縮方式
JPH01167899A (ja) 音声符号化方式
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JPS63236415A (ja) 音声符号化方式
JP2521052B2 (ja) 音声符号化方式
JPS6314523A (ja) 音声符号化方式
JPS63108819A (ja) 音声圧縮方式
JPS6318728A (ja) 音声符号化方式
JP2521051B2 (ja) 音声符号化方式
JPH01161300A (ja) 音声区間検出方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees