JPS58204632A - 音声符号化方法とその装置 - Google Patents

音声符号化方法とその装置

Info

Publication number
JPS58204632A
JPS58204632A JP57087483A JP8748382A JPS58204632A JP S58204632 A JPS58204632 A JP S58204632A JP 57087483 A JP57087483 A JP 57087483A JP 8748382 A JP8748382 A JP 8748382A JP S58204632 A JPS58204632 A JP S58204632A
Authority
JP
Japan
Prior art keywords
prediction
envelope
signal
information
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57087483A
Other languages
English (en)
Inventor
Taku Arazeki
卓 荒関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP57087483A priority Critical patent/JPS58204632A/ja
Publication of JPS58204632A publication Critical patent/JPS58204632A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、低ビツトレートの音声符号化法の改良に関す
る。
音声信号をディジタル化し処理を施しビット数を削減し
て通信あるいは記憶する必要性が増々高まっている。デ
ィジタル化した音P信号のビット数を減らす方法として
、音声信号の相関性を利用することが良く行われる。具
体的には線形予測法を用いることが多い。この植の音声
圧縮法として、音声46号をパラメータに変換して符号
化するいわゆるボコーダと、音声信号の予測残差を量子
化して符号化する波形符号化方式とがある。前者を用い
ると1〜2K b p sで了解性のある音声符号化法
が得られ、後者を用いると10〜30Kbpsでかなり
原音に近い音声符号化法が得られる。これら二つの符号
化法の間に位11tする方法として、残差励振型ボコー
ダが提案されている。この方法は、ボコーダに比ベビッ
ト数は増加するが、ボコーダでの問題点、例えば自然性
が失われる点、あるいは話者依存性、つまり発話者によ
って再生音の品質が大いに変化するという点、その他の
種々の問題点が改善される。従来のボコーダにおける問
題点およ氏らの’ The Rzsidual −Ex
cited Linear Pre −diction
 Vocoder  with  Transmiss
ion  Rateα)1’lJ −23、NO,12
,DhCEMBE)L 1975.PP、 1466−
1473)・ を瓢照して知ることができるので、ここ
では、上記発明および論文等で代表される従来の残差励
振型ボコーダの原理を藺導に述べるにとどめる。
残差励振型ボコーダは、符号器において、先ず音声信号
をあらかじめ定められたサンプル毎にスペクトル分析し
、音声信号の予測残差を求めるためのフィルタ係数を求
める。前記発明においてはこのフィルタの係数として部
分自己相関係数(PA[)R係数)を用いている。次に
、求まったフィルタ係数を用いて音声信号をフィルタリ
ングして得られた予測残差信号の高域を除くため低域フ
ィルタに通す。符号器では、フィルタ係数とともに、こ
のようにして得られた予測残差の低域成分のみを低い周
波数で再サンプルして量子化して出力する。再サンプル
の周波数を低くすることにより、もとの予測残差をその
ま\のサンプリング周波数で量子化するよりもビット数
を減らすことができる。これが残差励振型ボコーダでビ
ット削減がロエ能となる理由である。さて、復号器にお
いては、原理的には残差信号を正しいサンプリング周波
数に変換した後符号器のフィルタと逆特性のフィルタに
通1ことにより原音声が再生できるはずである。しかし
ながら、前述のように残差信号の高域は除かれているた
めこのままでは音声信号の再生はできない。従って、入
力した残差信号から高域成分を再生する必要がある。こ
のよ引と、残差励振型ボコーダでは復号器側にはサンプ
リング変換のための補間回路と高域再生のための回路が
加わる。
このような残差励振型ボコーダは通當4〜9 Kbps
程度のビットレートで用いられる。ボコーダに比べ、ピ
ッチ抽出等の判定過程を含まないため品質□ はかなり改善できるが、高域再生iこまだ問題かある。
高調波を発生するには基本的には非線形回路を通すこと
により得られるが、未だ十分な品質の得られる高周波成
分再生法は確立していない。
本発明の目的は、低ビツトレートで自然性、了解性とも
十分な音声符号化法の提供にある。
本発明によれば、音声信号を分析し予測情報を算出し予
測残差を求め前記予測残差の包絡情報を計算し前記包絡
情報に基きビット割り当てを行い紬記予側残差の量子化
を行い前記予測情報と前記包絡情報と前記量子化結果と
を出力する符号化部と、前記符号化部から出力された信
号をもとに予測残差を復元し音声信号を再生する復号部
とから成る音声符号化方法が得られる。
本発明によればさらに、入力された音声信号を分析し予
測情報を出力する分析部と、前記予測情報に基き予測残
差を出力するフィルタ部と、前記予測残差の包絡情報を
求め前記包絡情報に基きビット割り当てを行う包絡分析
部と、前記包絡分析部出力に基き前記予測残差を量子化
する手段とを有することを特徴とする音声符号化装置が
得られる。
本発明によればさらにまた、符号化された信号から予測
情報を復号する手段と、前記符号化された信号から包絡
情報を復号しビット割り当てを行う包絡情報復号部と、
前記包絡情報復号部の出力に基き前記符号化された信号
から予測残差を復号する残走復号部と、前記予測情報に
基き前記予測IA差から音声信号を再生する合成フィル
タ部とを有することを特徴とする脩PN号装置が得られ
る。
図を用いて本発明のさらに詳細な説明を続ける。
第1図は本発明による第1の実施例である。第2Mは各
部の波形を示す図である。
送信側においては、原音声46号XはA/D変換器10
によりディジクルイメ号XJに変換される。ここで、j
はサンプリング時刻を出す。ディジタル化された音声信
号Xjは予御1分析回路100’に入力される。予測分
析回路100においては音声信号xjをあらかじめ定ま
ったサンプル数N(例えば256)をにまとめて1つの
ブロックにして分析する。その方法は、まず、XIの自
己相関lも(i) (i=l、2゜・・・p)を求める
。次に、自己相関係tY川i)からPA[’OR係数k
t (を二1,2.・・・p)を求め量子化して出力す
る。これら一連の処理は板倉氏の[新しい音声分析合成
方式″″FAI(COル“[と題する論文°(日米4エ
レクトロニクス、 1973=12.12. pp。5
8−、ニ ア5)に詳しく解説されているので、ここでは詳細な説
明を省略する。このようにして求まるPfflυR係数
は量子化されてマルチプレクサ150に入力される。ま
た量子化さ?”したPARCOR係数を予測係数a I
(1−1、2,・・・p)に変換して予測フィルタ12
0に入力する。予測フィルタ120の伝達特性は1 ・
−Ps := l−a、z−1−a27r−2−、−−
−3NZ″″Nで表わされる。遅延回路11(1は、予
測分析回路100で発生する遅延を補正するために挿入
するものである。予測フィルタ120では音声信号XI
 の予IIを行い、それらの差を出力することになる。
X。
が有声音の場合には、出力Yjは第2図yJ で示すよ
うなパルス性の信号となる。包絡分析回路130は残差
18号yjの包絡線を求め、それを少ないビット数で表
現してマルチプレクサ150に出力する。包絡線の求め
方については後述する。包絡分析回路130で得られた
包絡線を第2図のeで示す。包絡分析IL!l路130
はさらに包絡線Cから残差信号Yjの各サンプルを何ビ
ットで量子化するか決定する。このビット割り当ての行
い方は、先ず、5dH毎の閾値を決め包晶″″線を6d
r−(毎に分割し大きなレベルから順に、例えば、3,
2,1.Oo、)順にビットを割り撮り、総ビット数が
所望の値とならない場合には閾値を設定しなおしてビッ
トを゛削り振りしなおす。この結果は第2図Bのように
なる。
縦軸は割り当てられたビット数である。量子化器140
においては、残差信号Yj を包絡線Cで振幅の正規化
を行った後、上のビット割り当に従って量子化して符号
としてマルチプレクサ150に加える。マルチプレクサ
150は予測に関する情報と包絡に関する情報と残差の
量子化結果とを組み合わせて端子2から送り出す。
次に受信側では、送信路から端子3を介して入力された
信号はデマルチプレクサ200により分割される。包絡
に関する情報は包絡復元回路210に入力され、予測に
関する情報は予測係数復元回路230に入力され、残差
信号の量子化結果は復号回路220に入力される。包絡
復元回路210は残差信号の包絡線を復元し、さらに残
差の各サンプルの量子化ビット数を計算する。包絡復元
回路210での復元方法を包絡分析回路130での分析
方法と同じ規則で行うようにしておけば、送信側と受信
側とで同じビット割り当てが行われることになる。
復号回路220においては、上で求まったビット割り当
て番こ基き逆量子化(を子化と逆のi)を行った後、上
で求まった包絡線eを乗じて残差信号を復号する。予測
係数復元回路230は予測係数”i””’e2e ”’
 e N)を求めて合成フィルタ260に入力する。合
成フィルタ260は予測フィルタ120と逆の特性、つ
まり  −Ps なる伝達特性を持っており、IA差信号の復号16号9
 から音声信号4゛j を再生することができる。
ここで、本実施例での諸元を示す。サンプリング周波数
はg kHzでTフレーム256サンプルである。予測
に関する情報としてはPARCOR係数を用いており、
N=toとして40ビツト、包絡に関する情報は後述の
とうり(資)ビット、残差の量子化は約70ビツトで、
全部で153ビツトとなり4800ピッV秒の転送レー
トとなる。このように残差の量子化に11Jしては1サ
ンプル当りで1ビツト以下の割り当てとなる。
上のようなビット配分をすると、有声音や破裂音の場合
には時間的に信号が局部に集中するため上述の方法が有
効となる。しかし、Svb等の子音は振幅レベルが25
6サンプルでは殆んど変化しないため、上述のようなビ
ット割り当てを行うと品質が低下する。本実施例では、
白色雑音発生器240において白色雑音を発生し、包絡
復元回路210から得られる包絡線で信号振幅を制御し
て出力する。スイッチ250は復号回路220の出力め
るいは白色雑音発生器2.10の出力のいずれかを選び
合成フィルタ260に入力する。二つの信号の選択は、
包絡復元回路210において包絡縁の形状から判断され
た結果に基いて行われる。
次に包絡分析回路130の動作について説明する。
第3図は包絡分析回路130の実施例である。信号yj
 は端子31から入力され整流回路131で全波整流さ
れる。その後でDCT &換回w!!!132で離散コ
サイン変換(1)CT)を行い周波数軸上のDCT係数
に変換する。このようにして得られたDCT係数の低周
波成分とピッチ周波数の^調波成分を選択的に出力して
符号化することにより整流した信号の平均値を少ないビ
ット数で伝送することができる。この平均値適当な値を
乗すると包絡線が得られる。DCT係数符号器133の
動作は次のようになる。つまり、先ず、直流成分を表わ
すDC’T係数を量子化する。この値は対数変換しdB
にした後1dB毎に′Ik−f、化すればよい。この際
6ビツトあれば十分なダイナミックレンジの振幅の量子
化ができる。次に、直流成分の0.1倍より小さな振幅
のDeT係数をすべて0にする。その後低い周波数から
順に0.1倍より大きな振幅の係数のみ0.1〜0.4
 、−0.1〜−0.4の範囲で4ビツト盪子化を行う
。符号化を行うとき、上のように0以外の振幅の量子化
のときは4ピツ)M子化しその上に1ビツト′1#を追
加し5ビツトとする。0の理数がいくつか続いた場合に
は0の続いた数を4ビツトで表わしその上に1ビツト′
0″を追加し5ビツトとCる。このようなランレンクス
符号化と呼ばれる符号化法を用いると低周波成分とピッ
チのA11m波成分合成率良く符号化できる。
以上述べたような方法で符号化された信号は端子31か
ら包絡線に関する情報として出力されるっ次に、この符
号化された信号をDCT係数復号器134でDC’T係
数に復元する。この方法はI)0′係数符号器133で
行った操作の逆を行うことになる。逆1) CT変換回
路135はDCT係数から時間軸上の信号1こ変換する
回路であり、包絡線(第2図C)を出力する。包絡線e
は端子33から出力される。ここで述べたDCT変換に
ついてけAhmed氏等のし文(’ Discrete
 Co51ne i’ransform“。
IFiEg TR−イ(NSACTIONS  ON 
 COD、IPUTTi:R8,VOI 、C−25、
I)り、90−−93 、 、Tannary 197
4)にi;T述されているのでここでは説明を省略すA
0ビ・ント配分回路136は包絡線Cをもとに信号yj
 に対するビ・ソト割り当てを行う。ビット割り当ての
考え方は既に述べたとうりである。そのH体的な方法は
管肺昭55 579Qn ヲs”21!I(j7 テ実
現すZ+コとカテきろ。
このようにして求°1ったビット割り当て信号Bは端子
31から出力さ11る。
第41:4は本発明による第2の実姉例を示す図である
。@5図は第2の実施例の各部の波形を示す図である。
本実施例は第1の実施例と共通な回路が多い。送信側に
おいてはA/l)変換器10、予測分析回路100、遅
延回路110、予測フィルタ12o1包絡分析回路13
0、量子化器140およびマルチプレクサ150は第1
の実施例で用いた回路とまったく同じである。また、受
信側においては、デマルチプレクサ200、包絡復元回
路210.復号回路22o1予#j係数復元回m 23
0 s白色雑音発生器24o1スイッチ250、合成フ
ィルタ260、およびD/A変換器加は第1の実施例の
それらと同じである。送gM@においては、第1の実施
例と同様に、音声信。
号Xはディジタル化され予測残差yj が得られる。
さらに、包絡分析回路130で包絡線eが求まり、包絡
に関する情報はマルチプレクサ150に出力される。包
絡@eはピッチ切り出し回路131に入力される。ピッ
チ切り出し回路139は包絡Iweがらピッチを抽出し
、その1区間のみを散り出して新たな包結線e′を作り
ビット割り当てを行い童子化@ 140に入力する。新
たな包絡Me’およびそれによるビット割り当ての結果
は第5図e′とBに示すとうりである。受信側において
は、包絡復元回路210で包絡線eを復元し、ピッチ切
り出し回路211で新たな包絡線C′を作り、復号回路
220に入力する。復号回路220は第5図91のよう
な1ピッチ分の残差信号を再生する。補間回路221は
包絡線直す。このようにして作られたy、あるいは白色
雑音発生器240の出力のいずれかが選ばれて合成フィ
ルタにより音声信号仝、が再生される。
第2の実施例を用いると第1の実施例に比べ残差の符号
化に割り当てるビット数が少なくても良い。従って48
00 b p s以下で十分な品質の符号化音声品質と
なる。
なお、本発明の実施例において、予測分析回路ではPA
[’OR分析を行っている→、LAP等の他の分析法を
用いても良い。また包絡縁は直交変換により表現したが
他の方法を用いても良い。
以上述べたごとく、本発明によれば低ピットレー1で品
質の良い符号化方法が実現できる。
【図面の簡単な説明】
8g1図は本発明による゛第1の実施例を示すブロック
図、第2図は第1の実施例の各部の波形を示す図、第3
図は包絡分析回路の実施例を示すブロック図、第4図は
本発明による第2の実施例を示すブロック図、第5図は
第2の実施例の各部の波形を示す図である。 第1図、第3図および第4図において、1,2゜3.4
は端子、10はA/D変換器、加はD/A変換器、10
0は予測分析回路、11Oは遅延回路、120は予測フ
ィルタ、130は包絡分析回路、131は整流回路、1
32はD C’1’変換回路、133は1)CT係数符
号器、134はDCT係数復号器、135は逆DCTg
換回路、139はピッチ切り出し回路、140は量子化
器、150はマルチプレクサ、200はデマルチプレク
サ、21Oは包絡復元回路、211はピッ、[:。 ナ切り出し回路、220は・復号回路、221は補間回
路、230は予測像e偵元回路、240は白色雑音発箋
 l目 を−〇 230 勇5図 (52−

Claims (1)

  1. 【特許請求の範囲】 1、音声信号を分析し予測情報を算出し予測残差を求め
    前記予測残差の包絡情報を計算し前記包絡情報に基きビ
    ット割り当てを行い前記予測残差の量子化を行い前記予
    測情報と前記包絡情報と前ml量子化結果とを出力する
    符号化部と、前記符号化部から出゛力された信号をもと
    に予6III残差を復元し音声信号を再生する復号部と
    から成る音声符号化方法。 2、入力された音声信号を分析し予測情報を出力する分
    析部と、前記予測情報に基き予測残差を出力するフィル
    タ部と、前記予測残差の包絡情報を求め前記包絡情報に
    暴きビット割り当てを行う包絡分析部と、繭記包籟分析
    部出力に基き前記予測残差を量子化する手段とを有する
    ことをtVf黴とする背戸符号化装置。 3、符号化された信号から予測情報を復号する手段と、
    藺紀符号化された信号から包絡情報を復号しビット割り
    当てを行う包絡情報復号部と、前記包絡情報復号部の出
    力に基き前記符号化された信号から予測残差を復号する
    残差復号部と、前記予測情報に基き前記予測残差から音
    声信号を再生する合成フィルタ部とを有することを特徴
    とする音声符号化法。
JP57087483A 1982-05-24 1982-05-24 音声符号化方法とその装置 Pending JPS58204632A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57087483A JPS58204632A (ja) 1982-05-24 1982-05-24 音声符号化方法とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57087483A JPS58204632A (ja) 1982-05-24 1982-05-24 音声符号化方法とその装置

Publications (1)

Publication Number Publication Date
JPS58204632A true JPS58204632A (ja) 1983-11-29

Family

ID=13916185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57087483A Pending JPS58204632A (ja) 1982-05-24 1982-05-24 音声符号化方法とその装置

Country Status (1)

Country Link
JP (1) JPS58204632A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274741A (en) * 1989-04-28 1993-12-28 Fujitsu Limited Speech coding apparatus for separately processing divided signal vectors
US7107212B2 (en) * 1996-11-07 2006-09-12 Koninklijke Philips Electronics N.V. Bitstream data reduction coding by applying prediction

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274741A (en) * 1989-04-28 1993-12-28 Fujitsu Limited Speech coding apparatus for separately processing divided signal vectors
US7107212B2 (en) * 1996-11-07 2006-09-12 Koninklijke Philips Electronics N.V. Bitstream data reduction coding by applying prediction

Similar Documents

Publication Publication Date Title
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
US4757517A (en) System for transmitting voice signal
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
US7835907B2 (en) Method and apparatus for low bit rate encoding and decoding
JPS5997242A (ja) 音声信号符号化方法
JPS6161305B2 (ja)
JP2002372996A (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
KR20100095509A (ko) 신호 처리 방법 및 장치
JPH11177434A (ja) 音声符号化復号方式
JP3519859B2 (ja) 符号器及び復号器
JP4245288B2 (ja) 音声符号化装置および音声復号化装置
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
JP3444131B2 (ja) 音声符号化及び復号装置
US6792402B1 (en) Method and device for defining table of bit allocation in processing audio signals
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
JPS58204632A (ja) 音声符号化方法とその装置
US5231669A (en) Low bit rate voice coding method and device
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3137550B2 (ja) 音声符号化・復号化装置
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
JPH04249300A (ja) 音声符復号化方法及びその装置
JPS59116796A (ja) 音声合成方法
JPS5936280B2 (ja) 音声の適応変換符号化方式
KR100221186B1 (ko) 음성 부호화 및 복호화 장치와 그 방법
JPH0437999B2 (ja)