JPH0343800A - 音声信号符号化復合化方式 - Google Patents

音声信号符号化復合化方式

Info

Publication number
JPH0343800A
JPH0343800A JP1178256A JP17825689A JPH0343800A JP H0343800 A JPH0343800 A JP H0343800A JP 1178256 A JP1178256 A JP 1178256A JP 17825689 A JP17825689 A JP 17825689A JP H0343800 A JPH0343800 A JP H0343800A
Authority
JP
Japan
Prior art keywords
sound source
driving sound
amplitude
quantization range
code representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1178256A
Other languages
English (en)
Inventor
Yoshihiro Unno
海野 義博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1178256A priority Critical patent/JPH0343800A/ja
Publication of JPH0343800A publication Critical patent/JPH0343800A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声信号の低ビツトレート波形符号化復号化方
式、特に伝送情報量を16にヒフ1フ秒以下とするよう
な音声符号化方式に関する。
〔従来の技術〕
音声信号を16kbps程度で符号化する方法として、
声道の特性をデジタルフィルタで表し、駆動音源を等間
隔のパルス列の組合せで表すピッチ予測レギュラーパル
ス音声符号化法(Regular PulseExci
tation−Long Tern Predicti
ve Coder以下RPE−LTP)が知られている
。この方法ではフィルタの係数と音源パルスの情報(パ
ルスの初期位相、振幅)を20ns程度のフレーム毎に
求めて伝送する。この方式の詳細については、例えば、
GSHFULL RATE 5PEECHTRANSC
ODING (CEPT/CCH/GSM RECOH
HENDATION 06.10 FEB、 1519
88 ) (文献1)に詳細に説明されている。
〔発明が解決しようとする課題〕
しかしながら、前記従来法は、再生音声の量子化歪が大
きく、再生音声の品質が低いという欠点がある。これは
、10kbps程度のビットレイトではf源パルス振幅
の量子化ビットに割り当てられるビット数が少なく、ま
た、駆動音源パルス系列の振幅を量子化する量子化器の
量子化範囲をあらかじめ定められた十分大きな値に固定
しているため、量子化誤差が大きくなり、量子化歪が大
きくなるという理由による。
本発明の目的は、従来法よりも量子化歪が小さく、はる
かに良好な音質が得られる音声信号符号化復号化方式を
提供することにある。
(課題を解決するための手段) 前記目的を達成するため、本発明による音声信号符号化
方式は、離散的な音声信号系列を入力し、音声のピッチ
微細構造を含むスペクトルを表すスペクトルパラメータ
を抽出し符号化し、さらに前記スペクトルパラメータを
もとに前記音声信号系列の予測残差信号を計算する手段
と、前記予測残差信号を用いて駆動音源の初期位相を求
めて符号化する手段と、前記スペクトルパラメータを表
す符号、前記駆動音源の初期位相を表す符号及び駆動音
源振幅系列を表す符号を組み合わせて出力する手段とを
備えたビ・ダチ予測レギュラーパルス音声符号化方式に
おいて、前フレームの駆動音源振幅及び前フレームの音
声信号の駆動音源振幅量子化範囲から現フレームの前記
量子化範囲をフレームごとに適応的に計算する手段と、
前記予測残差信号及び前記初期位相並びに前記量子化範
囲を用いて前記駆動音源振幅系列を求めて符号化する手
段とを有するものである。
本発明による音声信号復号化方式は、音声信号のピッチ
微細構造を含むスペクトルパラメータを表す符号と駆動
音源の初期位相を表す符号と駆動音源振幅系列を表す符
号を入力して分離する手段と、前記駆動音源の初期位相
を表す符号を復号化し駆動音源の初期位相を求める手段
と、前記ピッチ微細構造を含むスペクトルパラメータを
表す符号を復号化し駆動音源系列を用いて音声信号を再
生する手段とを備えたピッチ予測レギュラーパルス音声
復号化方式において、前フレームの駆動音源振幅及び前
フレームの音声信号の駆動音源振幅の量子化範囲から駆
動音源振幅の逆量子化範囲をフレームごとに適応的に計
算する手段と、前記駆動音源振幅系列を表す符号を復号
化し前記駆動音源の初期位相及び前記駆動音源振幅の逆
量子化範囲を用いて前記駆動音源系列を求める手段とを
有するものである。
〔作用〕
本発明では、ピッチ予測レギュラーパルス音声符号化法
において、駆動音源の振幅は各フレーム間の相関がある
ことを利用し、前のフレームでの駆動音源振幅最大値と
量子化器の振幅量子化範囲から適応的に現フレームの量
子化器の振幅量子化範囲を推定して、駆動音源の振幅の
小さいときには振幅量子化範囲を小さくし、逆に駆動音
源が大きい時には振幅量子化範囲を大きくするので、量
子化ビット数が同じ場合駆動音源信号の量子化誤差を小
さくできる。
〔実施例〕
以下、本発明の一実施例を図により説明する。
第1図は本発明の音声符号化方式の一実施ρ1を示すブ
ロック図、第2図は本発明の音声復号化方式の一実施例
を示すブロック図である。
第1図において、100は符号器入力端子を示し、A/
D変換された音声入力系列があらかじめ定められた長さ
の1フレーム(例えば8 kHzサンプリングの場合で
フレーム長を201sとすると 160サンプル)毎に
LPG分析回路110に入力される。Lpc分析回路1
10は、前記フレームの音声信号を周知の方法によりL
PG分析しフレーム毎の音声信号のスペクトル包絡を表
すLPCf$数をあらかじめ定められた次数だけ求める
。さらにLPG分析回路110はLPG係数を量子化し
符号化し短時間分析フィルタ回路120とマルチプレク
サ210に出力する。短時間分析フィルタ回1¥112
0は上記しPC係数を復号化し、LPG係数を用いて構
成される短時間分析フィルタに入力音声系列を入力し短
時間予測残差を得て、減算回路130とピッチ分析回路
140に出力する。ピッチ分析回路140は前記短時間
予測残差と後述する足し算回路160の出力系列をもと
に音声のピッチ構造を表すピッチパラメータを求め符号
化し、ピッチ分析フィルタ回路150とマルチプレクサ
210に出力する。減算回路130は短時間予測残差か
らピッチ構造に由来する成分を減算して予測残差を求め
、初期位相計算回路180と駆動音源計算回路200に
出力する。初期位相計算回路180は前記予81I残差
のもとに駆動音源パルスの初期位相を求め駆動音源計算
回路200とパルス再発生回路170に出力し、さらに
前記初期位相を符号化し、その符号をマルチプレクサ2
10に出力する。上記の方法は例えば前記文献1を参照
することができる。
量子化範囲計算回路190は、パルス再発生回路170
から前フレームの音源パルスの最大値P′1aXcを入
力し、また、前フレームのパルス振幅量子化範囲Q′n
axcを記憶しており、これらをもとに現在のフレーム
のパルス振幅量子化範囲を適応的に計算する。まず、量
子化範囲計算回路190は、(1)式に従って現在のフ
レームのパルス振幅量子化範囲Q 1laXcを計算す
る。
Qnaxc= r −Q ’ naxc    r >
 O−(1)ここで係数rは、x= l P′maxc
/Q′1axclの関数であり、あらかじめ定められた
関数である。
(1)式は、予測残差の振幅値は数フレーム程度の時間
では相関があるということに基いている。
P ’ 1aXc/ Q ′l1aXClが1より十分
小さいときには量子化範囲をもつと小さくして量子化誤
差を小さくすることができるので、r>1とする。逆に
I P ’ 1axc/ Q ’ riaxc Iが1
に近いかあるいは1以上の場合は量子化範囲を大きくす
る必要があるので、r>1とする。ただし、現フレーム
で計算されたQ l1aXCが、あらかじめ定められた
最大値よりも大きい場合には前記最大値とし、あらかじ
め定められた最小値よりも小さい場合には前記最小値と
する。係数rの値の一例を第3図に示す。
係数rの求め方ニツイては文献2 (P、 CUTlI
liSkel/。
N、 S、 Jayant、 and J、 L、 F
lanagan、 ”AdaptiveQuantiz
ation in Differential PCH
Coding ofSpeech”、 Be1l 5y
stelTech、 J、、 Vol 52. No。
7、 pp、1105−1118. Septembe
r t973 )などを参照することができる。量子化
範囲計算回路190は、(1)式にしたがって求めたパ
ルス振幅量子化範囲を駆動音源計算回路200とパルス
再発生回路170に出力する。
駆動音源計算回路200は駆動音源のパルスの振幅を前
記量子化範囲内で量子化し、符号化しパルス再発生回路
170とマルチプレクサ210に出力する。パルスの量
子化方法としてはlフレーム内のパルス系列の振幅の絶
対値の最大値を前記量子化範囲で量子化した値を正規化
係数として各パルス振幅を正規化したのちに各パルスの
振幅を量子化する方法も考えられる。
パルス再発生回路170は初期位相計算回路180と駆
動音源計算回路200において求められた符号を復号化
し、量子化範囲計算回路190で求められた量子化範囲
内で逆量子化を行い駆動音源信号を求め、足し算回I!
@160に出力する。また、パルス再発生回路170は
駆動音源パルスの最大値を求め、量子化範囲計算回路1
90に出力する0足し算回路160はパルス再発生回路
170によって求められた駆動音源信号とピッチ分析フ
ィルタ回1i11150からの出力系列の和を計算しピ
ッチ分析フィルタ回路150とピッチ分析回路140に
出力する。ピッチ分析フィルタ回路150はピッチ分析
回路140で得られたピッチパラメータをもとにピッチ
分析フィルタを構成し、前記足し算回路160の出力系
列をピッチ分析フィルタに入力する。ピッチ分析フィル
タの出力系列は足し算回路160にフィードバックされ
、また減算回jY1130に出力される。マルチプレク
サ210はLPG分析回路110の出力符号と、初期位
相計算回l¥1180、駆動音源計算回路200の出力
符号とピッチ分析回路140の出力符号を入力し、これ
らを組み合わせて送信出力端子220より通信路へ出力
する。
以下、第2図を用いて説明する。第2図において、30
0は受信端子(復号器入力端子)を示し、符号器の出力
系列が入力される。デマルチプレクサ310は、入力系
列から、スペクトル包絡特性を表す符号とピッチ特性を
表す符号と初期位相を表す符号と駆動音源のパルス振幅
を表す符号に分離して出力する。
逆量子化範囲計算回路320は、前フレームのパルス振
幅の最大値P′1aXdを駆動音源発生回路330から
入力し、また、前フレームのパルス振幅逆量子範囲Q′
naxdを記憶しており、これらをもとに現在のフレー
ムのパルス振幅逆量子化範囲内 Qlaxd=r−Q′1axd    r>O−(2)
ここで係数rは、x= l P′1axd/Q′1ax
dlの関数であり、符号器の(1)式に用いたものと同
じ関数である。求められた逆量子化範囲を駆動音源発生
口F&330に出力する。
駆動音源発生回路330は、駆動音源のパルス振幅を表
す符号を復号化しパルス振幅逆量子化範囲内で逆量子化
し、また初期位相を用いて駆動音源パルスを発生させて
出力する。ピッチ再生フィルタ350はピッチ特性を表
す符号を復号化してピッチ再生フィルタを構成し、駆動
音源パルスからピッチ再生信号を計算する。スペクトル
包絡再生予測フィルタ360はスペクトル包絡特性を表
す符号を復号化してスペクトル包絡フィルタを構成し、
ピッチ再生信号から出力音声信号を再生して出力端子3
70から出力する。この方法については文献1を参照す
ることができる。
上述した実施例はあくまで本発明の一実施例に過ぎずそ
の変形例も種々考えられる。
前述の実施ρIにおいては、ピッチ特性、パルス系列の
計算はフレーム単位で行ったが、フレームをいくつかの
サブフレームに分割し、そのサブフレーム毎に計算する
ような構成にしてもよい、もちろん、同等の特性は得ら
れる。
前述の実比例においては、量子化範囲を計算する際に、
前フレームのパルスの最大値を用いたが、前フレームの
パルスの平均振幅を用いるような構成にすることもでき
る。
〔発明の効果〕
以上述べたように本発明によれば、同一の伝送情報量の
場合に、より良好な品質を得ることができるという効果
がある。
【図面の簡単な説明】
第1図は本発明の構成による音声符号化方式の一実施例
を示すブロック図、第2図は本発明の構成による音声復
号化方式の一実施例を示すブロック図、第3図はXとr
の関係の一例を示す図である。 100・・・入力端子    110・・・LPC分析
回路120・・・短時間分析フィルタ回路 130・・・減算回路    140・・・ピッチ分析
回路150・・・ピッチ分析フィルタ回路 160・・・足し算回路 170・・・パルス再発生回路 180・・・初期位相計算回路 190・・・量子化範囲計算回路 200・・・駆動音源振幅計算回路 210・・・マルチプレクサ 220・・・送信端子3
00・・・受信端子 310・・・デマルチプレクサ 320・・・逆量子化範囲計算回路 330・・・駆動音声発生回路 350・・・ピッチ再生フィルタ 360・・・スペクトル包絡再生予測フィルタ370・
・・出力端子

Claims (2)

    【特許請求の範囲】
  1. (1)離散的な音声信号系列を入力し、音声のピッチ微
    細構造を含むスペクトルを表すスペクトルパラメータを
    抽出し符号化し、さらに前記スペクトルパラメータをも
    とに前記音声信号系列の予測残差信号を計算する手段と
    、前記予測残差信号を用いて駆動音源の初期位相を求め
    て符号化する手段と、前記スペクトルパラメータを表す
    符号、前記駆動音源の初期位相を表す符号及び駆動音源
    振幅系列を表す符号を組み合わせて出力する手段とを備
    えたピッチ予測レギュラーパルス音声符号化方式におい
    て、前フレームの駆動音源振幅及び前フレームの音声信
    号の駆動音源振幅の量子化範囲から現フレームの前記量
    子化範囲をフレームごとに適応的に計算する手段と、前
    記予測残差信号及び前記初期位相並びに前記量子化範囲
    を用いて前記駆動音源振幅系列を求めて符号化する手段
    とを有することを特徴とする音声信号符号化方式。
  2. (2)音声信号のピッチ微細構造を含むスペクトルパラ
    メータを表す符号と駆動音源の初期位相を表す符号と駆
    動音源振幅系列を表す符号を入力して分離する手段と、
    前記駆動音源の初期位相を表す符号を復号化し駆動音源
    の初期位相を求める手段と、前記ピッチ微細構造を含む
    スペクトルパラメータを表す符号を復号化し駆動音源系
    列を用いて音声信号を再生する手段とを備えたピッチ予
    測レギュラーパルス音声復号化方式において、前フレー
    ムの駆動音源振幅及び前フレームの音声信号の駆動音源
    振幅の量子化範囲から駆動音源振幅の逆量子化範囲をフ
    レームごとに適応的に計算する手段と、前記駆動音源振
    幅系列を表す符号を復号化し前記駆動音源の初期位相及
    び前記駆動音源振幅の逆量子化範囲を用いて前記駆動音
    源系列を求める手段とを有することを特徴とする音声信
    号復号化方式。
JP1178256A 1989-07-11 1989-07-11 音声信号符号化復合化方式 Pending JPH0343800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1178256A JPH0343800A (ja) 1989-07-11 1989-07-11 音声信号符号化復合化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1178256A JPH0343800A (ja) 1989-07-11 1989-07-11 音声信号符号化復合化方式

Publications (1)

Publication Number Publication Date
JPH0343800A true JPH0343800A (ja) 1991-02-25

Family

ID=16045314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1178256A Pending JPH0343800A (ja) 1989-07-11 1989-07-11 音声信号符号化復合化方式

Country Status (1)

Country Link
JP (1) JPH0343800A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
US6260009B1 (en) CELP-based to CELP-based vocoder packet translation
US20210375296A1 (en) Methods, Encoder And Decoder For Linear Predictive Encoding And Decoding Of Sound Signals Upon Transition Between Frames Having Different Sampling Rates
US7263481B2 (en) Method and apparatus for improved quality voice transcoding
JP3354138B2 (ja) 音声符号化
KR20070038041A (ko) 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치
JP2004517348A (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
EP1181687B1 (en) Multipulse interpolative coding of transition speech frames
JP4558205B2 (ja) スピーチコーダパラメータの量子化方法
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3248215B2 (ja) 音声符号化装置
JPH0934499A (ja) 音声符号化通信方式
JP3050978B2 (ja) 音声符号化方法
JPH0343800A (ja) 音声信号符号化復合化方式
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
Drygajilo Speech Coding Techniques and Standards
JPH034300A (ja) 音声符号化復号化方式
JP3350340B2 (ja) 音声符号化方法および音声復号化方法