JPH01205200A

JPH01205200A - 音声符号化方式

Info

Publication number: JPH01205200A
Application number: JP63030198A
Authority: JP
Inventors: Yasumi Matsuyuki; 松雪　康巳; Yasuhiko Tada; 康彦多田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1988-02-12
Filing date: 1988-02-12
Publication date: 1989-08-17

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】「産業上の利用分野」この発明は音声信号を周波数領域に変換し、変換係数を
振幅と位相成分に分けて符号化する音声符号化方式（二
関するものである。

「従来の技術」従来、音声信号を周波数領域に変換して、その変換され
たスペクトルヲ伝送パラメータとして符号化する音声符
号化方式としてＡ　Ｔ　Ｃ（ＡｄａｐｔｉｖｅＴｒａｎ
ｓｆｏｒｍ　Ｃｏｄｉｎｇ　）方式がある。この方式で
は周波数領域の信号の全てを符号化するため、９．６ｋ
ｂｐｓ程度以下のピットレートでは情報に割り当てられ
るビット数が不足し、十分な符号化品質を得ることがで
きない。

一方、音声信号を周波数領域に変換して、その変換され
たスペクトルを振幅成分と位相成分に分けて符号化する
場合には、変換されたスペクトルの振幅成分からそのピ
ークを抽出し、離散値である周波数位置とその点におけ
る振幅、位相ｔパラメータとして各パラメータを量子化
する音声符号化方式がある。この方式では伝送すべき情
報が必要最小限に限られているため符号化効率は良＜９
．６ｋｂｐｓｌＪ以下のビットレートでも、ある程度の
符号化品質は得られる。

しかしながらこの方式では抽出されたピーク値は離散値
であり、正確にスペクトルのピーク（調Ｓ　ｉ分）が検
出されていないため、音声の特徴抽出が十分ではなく、
符号化音声の劣化を招く、また周波数位置、振幅、位相
の３つのパラメータを同時に量子化するため、各々に量
子化誤差が生じて周波数位置に対する振幅、位相が不整
合となることにより、符号化品質の劣化が生じる。

「課題を解決するための手段」上記問題点を解決するために、この発明では振幅成分の
ピークを抽出した後、例えば抽出した振幅成分のピーク
点とその両側の２点を含む３点による二次補間によって
、実際のビーク乞詳細に定め、ピーク位置の周波数を決
定する。さらに抽出したピークの周波数情報乞量子化し
局部復号化して、その局部復号された周波数位置におけ
る振幅、位相を補間して新たに定めることにより、音声
の特徴抽出を十分に行う。また周波数位置の情報を予め
局部復号化することにより、周波数、振幅、位相の各パ
ラメータの不整合を防止し、Ｓ　ｋｂｐｓ　Ｄ下の低ビ
ツトレートでも高い符号化品質が得られる。

「実施例」以下（二この発明の実施例を図面を用いて説明する。弗
１図はこの発明の符号化方式の一実施例を示す。端子か
らの入力音声信号１は直交変換部２で１フレームを単位
に、例えば離散的フーリエ変換（ＤＦＴ）により周波数
領域の信号、即ちスペクトルに変換される。次に補助情
報抽出部３において音声パワとスペクトルの帯域（例え
ば０〜１゜１〜２，２〜４ＫＨｚ）毎のパワとが補助情
報として抽出された後、量子化され、さらに補助情報局
部復号化部４において補助情報はあらかじめ符号器にお
いて復号化される。変換されたスペクトルは振幅・位相
成分抽出部６で振幅成分と位相成分とに分けられ、ピー
ク抽出部７で調波構造をもつ振幅成分の各ピークが抽出
される。ピーク抽出部７では振幅スペクトルの尖端、例
えばある点を中心として前後２点を含む５点の振幅スペ
クトル値が中心から順に小さくなっている場合にその点
をピークとして抽出する。検出された複数個のピークの
うち第１番目のピークを基本周波数ｆ、とみなし、全帯
域におけるピーク数をｋ　ｍａｘとしたとき、ピーク数
ｋ　ｍａｘは、８ＫＨｚサンプリング音声の場合、音声
帯域は４ＫＨｚであるからｋｍａｘ　＝　４０００／　ｆｐと決める。これはピーク数を決定された基本周波数に対
して一意に決めることにより各ピークの周波数を量子化
する際の効率を上げるためである。

第２図に示すように基本周波数ｆ、の幅を持つ区間にお
いて複数個のピークが検出された場合には、例えばその
区間内の最大の振幅を有するピークを残すという方法に
より、１個のみを残し、その区間内の他のピークは削除
する。また基本周波数ｆ。

の幅をもつ区間においてピークが検出されなかった場合
には、基本周波数ｆｐの整数倍の周波数位置をピーク点
として新たに追加する。このようにしてピークは１区間
に１個とし、ピーク数の総計がｋ　ｍａｘになるように
する。

次に周波数情報補間部８で抽出した振幅成分のピーク点
とその両側の２点を含む３点による二次補間によって、
実際のピークとなる周波数を詳細（二定める。この周波
数（Ｉ　ｉは弗３図に示すよう（＝、抽出したピークの
周波数をｆｉ、振幅値ｙｒｍｉ、その両側の２点の振幅
値Ｚ各々ｒｌｉ　−１、ｍｉ＋ｌとすると、として決定される。さらに決定されたピークの周波数位
置？、先に抽出した補助情報（音声の帯域毎のパワ）に
より、適応情報割当部５で帯域毎のパワに応じたビット
配分を行って割り当てられたビット数で、周波数情報量
子化部９で量子化する。

周波数情報量子化部９では、先に抽出した基本周波数（
第１番目のピーク）はそのまま量子化するが、先にピー
クの削除、追加を行ってピーク数を決定しているので、
第２番目以降のピークの周波数は、基本周波数の整数倍
の値との差分を量子化する。

局部復号化部１０でこの周波数情報のみを復号化して、
その復号された周波数位置仝ｉにおける振幅、位相を新
たに定める。決定方法は上記と同様に、振幅情報補間部
１１で、局部復号化した周波数仝ｉに最も近い点とその
両側の２点を含む３点による二次補間な行い、周波数＋
ｉに対応する振幅令を決定する。また位相については、
位相補間部１２において、周波数仝ｉの両側の点の位相
による線形補間を行い、周波数仝ｉに対応する位相９＝
を決定する。周波数ｆ　ｉ−１、ｆ　ｉ　、　ｆ　ｉ＋
１に対する位相なψｉ−１．ψｉ、ψｉ＋１とすると求
める位相９＝は次′式となる。

◇ｉ＝、１＋ヱ早ヱ止ユ、全１−ｆｉ）ｆＩ−ｆｉ−１ °＜ｒｉ−１＜仝！＜ｆｉのとき） ψｉ＋１−ψ１Ｑｉ＝ψｉ＋□（全１−ｆｉ）ｆｉ−１−１−ｆｉ（ｆｉ≦仝１（ｆｉ−１−１のとき）以上の方法で決定された振幅１位相の各パラメータを先
に求めておいた袖助情報にもとづいて、適応情報割当部
５で適応情報割当（ビット配分）を行い、振幅情報量子
化部１３、位相情報量子１ヒ部１４で各々量子化する。

振幅情報量子化部１３では第１ピークの振幅値はそのま
まの値を量子化し、以降は次々に差分な電子化する。位
相情報部１４では各々のピークの位相を線形量子化する
。

一方、受信側では伝送されたパラメータをもとこ音声信
号を再生する。補助情報復号化部１７で復号化された補
助情報を用いて、符号器で用いたものと同じ適応情報割
当部５で割り当てられるピット数によって、各復号化部
１８〜２０で復号化された伝送パラメータの周波数をｆ
ｉ、振幅なｍｉ。

位相をΦｉとしたとき、音声信号ｓ　（ｔ）は音声波形
再生部２１でとして再生され、符号化音声出力２２を得ることができ
る。

ここでは音声信号を周波数領域に変換した信号を符号化
する方法について述べたが、この発明の方式は音声信号
を線形予測分析した線形予測係数により制御されるフィ
ルタ係数を有する逆フィルタの出力である。残差音声信
号に対しても用いることができる。

「発明の効果」以上述べたようにこの発明によれば、音声信号を周波数
領域に変換して周波数、振幅、位相を主な伝送パラメー
タとして符号化する場合において、振幅、位相の補間な
行い、また周波数情報を予め局部復号化するため、９．
５ｋｂｐｓ程度以下の低ピットの符号化においても高い
符号化品質が得られる。

【図面の簡単な説明】

第１図はこの発明の一実施例を示すブロフク図、第２図
はピーク検出と削除、追加を説明する図、第３図は周波
数、振幅、位相の補間方法を説明する図である。特許出願人　　日本電信電話株式会社

Claims

【特許請求の範囲】

（１）入力音声信号を一定時間間隔で標本化してその標
本値を取り出し、一定数記憶して１フレームとし、１フ
レーム毎に、その記憶した音声信号を周波数領域に変換
して符号化する音声符号化方式において、その変換したスペクトルを周波数軸上でブロックに分割
し、各ブロック毎のパワを音声のパワとともに量子化し
て補助情報として符号化する補助情報抽出手段と、その補助情報を復号する局部復号化手段と、その復号さ
れた補助情報を使って適応的に情報割当を行う適応情報
割当手段と、上記変換したスペクトルを離散的な振幅成分と位相成分
に分ける手段と、その振幅成分のピーク（調波成分）を抽出する手段と、その抽出したピークによりピークとなる周波数情報を補
間して求める手段と、その補間して求めた周波数情報を、上記割当情報によっ
て量子化する手段と、その量子化された周波数情報を局部復号化する手段と、その局部復号された周波数における振幅、位相を補間し
て定める手段と、上記割当情報によって上記補間して定められた振幅と位
相を量子化する手段とを具備することを特徴とする音声
符号化方式。