JP2001296900A - 音声信号符号復号化システム - Google Patents

音声信号符号復号化システム

Info

Publication number
JP2001296900A
JP2001296900A JP2000111440A JP2000111440A JP2001296900A JP 2001296900 A JP2001296900 A JP 2001296900A JP 2000111440 A JP2000111440 A JP 2000111440A JP 2000111440 A JP2000111440 A JP 2000111440A JP 2001296900 A JP2001296900 A JP 2001296900A
Authority
JP
Japan
Prior art keywords
signal
output
unit
linear prediction
khz
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000111440A
Other languages
English (en)
Inventor
Nobuaki Kawahara
伸章 川原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2000111440A priority Critical patent/JP2001296900A/ja
Publication of JP2001296900A publication Critical patent/JP2001296900A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 分析合成符号化方式の1つであるMELPボ
コーダにおける各帯域の強度情報の算出を省き、再生音
声品質を劣化させることなく処理量およびビットレート
の低減を可能とした音声信号符号復号化システムを提供
する。 【解決手段】 音声符号化では、利得量子化手段と有声
強度量子化手段と線スペクトル対量子化手段とピッチ周
期量子化手段の各出力をビットストリーム列に配列する
して出力するフレーミング手段とを備え、音声復号化で
は、復号された線形予測係数を各周波数帯の包絡情報に
見立てて、線形予測係数の各次数と対応する周波数帯の
エネルギを用いて励起フィルタ係数を算出する手段と、
利得信号を復号した信号と前記線形予測合成した信号と
を利得調整して再生音声信号として出力する再生音声手
段とを備えたことを特徴とする音声信号符号復号化シス
テム。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はディジタル移動体通
信に係わり、無線周波数の狭帯域化により周波数利用効
率を向上する低ビットレート化に対応し、かつ劣悪な特
性を有する伝搬路において低ビットレートでも、再生音
声品質を保持できる音声信号符号復号化システムに関す
る。
【0002】
【従来の技術】従来、音声信号符号復号化システムは、
適用される変復調方式より伝送レートが決定し、それに
よりPCMに代表される波形符号化、CELPに代表されるハ
イブリッド符号化、そしてLPCボコーダに代表される分
析合成符号化を使い分けることが通常である。
【0003】ここで特性が劣悪な伝搬路で音声符号化を
用いた音声通信を行う場合、伝送レートが低くなるた
め、通常音声符号化方式として分析合成符号化を採用す
る。現存する分析合成符号化としてはFS1015(LPC-10e)
が代表的である。
【0004】現在、FS1015として標準化されている方式
はLPC-10eであるが、この方式に改良を加えたMELP
という方式が存在する。LPC-10eとMELPの相違点は
帯域別に有声強度を算出し除法化する点、線形予測係数
の量子化手段(多段ベクトル量子化の採用)、そして復
号側において各帯域別に有声/無声を復元しそれらを合
成することで音源信号を生成する点である。ここで、音
源信号とは復号側において音声信号の特徴パラメータで
あるスペクトラム包絡情報を付加する前段階の信号のこ
とである。音源信号は符号化側における残差信号に対応
する信号であり、主にピッチ周期、利得値などにより構
成するのが分析合成符号化においては一般的であるが、
MELPではさらに帯域別の強度情報を与えることによ
り、再生音声の自然性の向上が図られている。
【0005】分析合成符号化は、復号側において音源信
号を特徴的パラメータにより再生するという特徴から、
低ビットレート化が容易であるが、高ビットレート化し
てもあるレベル以上の再生音声品質の向上が見込めない
という長所及び短所がある。逆に考えれば低ビットレー
ト化しても再生音声品質の劣化を低く押さえることがで
きるために、低ビットレート音声符号化の研究が最も為
されている方式である。
【0006】MELPボコーダにて特徴となっている音
源信号の帯域別強度情報の付加は、符号化側にて各帯域
の強度情報を算出し、各1ビット量子化する。ここで、
線形予測情報は入力信号のスペクトラム包絡情報であ
り、言い換えれば各帯域の強度を表している情報である
と言える。故に各帯域の強度情報の算出は、線形予測情
報の算出と重複した処理であり、処理と情報の重複とな
る。
【0007】
【発明が解決しようとする課題】本発明では、分析合成
符号化方式の1つであるMELPボコーダにおける各帯
域の強度情報の算出を省き、再生音声品質を劣化させる
ことなく処理量およびビットレートの低減を可能とした
音声信号符号復号化システムを提供することを目的とす
る。
【0008】また本発明では、MELPボコーダにおけ
る特徴である音源信号生成の際に与える帯域別強度情報
の算出及び符号化を省くことにより処理量及びビットレ
ートを低減し、かつ再生音声品質を劣化させない音声信
号符号復号化システムを提供することを目的とする。
【0009】
【課題を解決するための手段】課題を解決するため請求
項1は、音声信号符号化装置において、入力したデジタ
ル信号を利得算出して量子化する利得量子化手段と、前
記デジタル信号を低域通過させて低域有声強度を算出
し、及び、初期ピッチ周期を検出し、さらに、周期性情
報を検出して各々出力する手段と、前記デジタル信号を
高域通過させて該高域の有声強度を量子化して出力する
高域有声強度量子化手段と、前記デジタル信号を線形予
測することで線スペクトル対量子化する線スペクトル対
量子化手段と、線形予測分析を行って前記低域有声強度
と初期ピッチ周期と周期性情報とを演算してピッチ周期
を量子化して出力するピッチ周期量子化手段と、より構
成され、前記の利得量子化手段と有声強度量子化手段と
線スペクトル対量子化手段とピッチ周期量子化手段の各
出力をビットストリーム列に配列するして出力するフレ
ーミング手段とを備えたことを特徴としている。
【0010】課題を解決するため請求項2は、音声信号
復号化装置において、受信入力した信号を線スペクトル
対、ピッチ周期、有声強度、利得の各情報信号に分離し
て各々出力する受信データ再配置手段と、前記各々の情
報信号を復号する復号手段と、前記線スペクトル対、ピ
ッチ周期、有声強度の各情報信号を復号した信号を演算
して線形予測合成する手段と、前記利得信号を復号した
信号と前記線形予測合成した信号とを利得調整して再生
音声信号として出力する再生音声手段とを備えたことを
特徴としている。また、復号された線形予測係数を各周
波数帯の包絡情報に見立てて、線形予測係数の各次数と
対応する周波数帯のエネルギを用いて励起フィルタ係数
を算出するため、有効な再生信号を得ることができる。
【0011】課題を解決するため請求項3は、前記請求
項1記載の音声信号符号化装置と、前記請求項2記載の
音声信号復号化装置とを備えたことを特徴としている。
【0012】課題を解決するため請求項4は、音声信号
を符号化する方式において、A/Dされた入力信号を1フ
レーム分のサンプル数格納する入力信号格納バッファ
と、上述の入力信号格納バッファに格納されている入力
信号を500Hz低域通過フィルタリングし、出力結果であ
る500HzLPF出力信号を格納する500HzLPF部と、入力信号
格納バッファに格納されている入力信号を1kHz低域通過
フィルタリングし、出力結果である1kHzLPF出力信号を
格納する1kHzLPF部と、入力信号格納バッファに格納さ
れている入力信号を1kHz高域通過フィルタリングし、出
力結果である1kHzHPF出力信号を格納する1kHzHPF部と、
1kHzHPF部の出力結果である1kHzHPF出力信号の時間軸上
における波形形状を算出し、出力結果である波形形状出
力信号を格納する波形形状算出部と、1kHzHPF部の出力
結果と波形形状算出部の出力結果より、1kHz高域部の有
声強度値を算出する1kHz高域有声強度算出部と、1kHz高
域有声強度算出部の結果である1kHz高域有声強度値を量
子化する1kHz高域有声強度量子化部と、入力信号格納バ
ッファに格納されている入力信号から線形予測係数を算
出する線形予測部と、線形予測部にて算出された線形予
測係数を、線スペクトル対に変換する線スペクトル対変
換部と、線形予測部にて算出された線形予測係数中の絶
対最大値を探索し、絶対最大値で線形予測係数を除算し
た結果を格納する線スペクトル対量子化重み係数算出部
と、線スペクトル対変換部の出力である線スペクトル対
に、線スペクトル対量子化重み係数算出部の出力である
線スペクトル対量子化重み係数を乗じ、その結果を量子
化する線スペクトル対量子化部と、1kHzLPF部の出力で
ある1kHzLPF出力信号と、500HzLPF部の出力である500Hz
LPF出力信号から初期ピッチ周期を検出する初期ピッチ
検出部と、1kHzLPF部の出力である1kHzLPF出力信号から
信号の周期性の有無を検出する信号周期性情報検出部
と、500HzLPF部の出力である500HzLPF出力信号から、50
0Hz定期部の有声強度値を算出する500Hz低域有声強度算
出部と、線形予測部にて算出された線形予測係数をタッ
プ係数とし、入力信号をFIRフィルタリングすることで
線形予測分析フィルタリングを行い、その結果を残差信
号として格納する線形予測分析部と、線形予測分析部の
出力である残差信号を1kHz低域通過フィルタリングし、
出力結果である1kHzLPF残差信号を格納する1kHzLPF残差
信号算出部と、線形予測分析部の出力である残差信号か
ら、自乗値と絶対値の比を算出する自乗/絶対値比算出
部と、入力信号と1kHzLPF残差信号、および初期ピッチ
周期から最終的なピッチ周期を検出する最終ピッチ周期
検出部と、最終ピッチ周期と信号周期性情報と自乗/絶
対値比、および500Hz低域有声強度値からピッチ周期の
量子化を行うピッチ周期量子化部と、入力信号と500Hz
低域有声強度値から利得を算出する利得算出部と、利得
算出部で算出された利得を量子化する利得量子化部と、
線スペクトル対量子化部の出力である線スペクトル対量
子化値と、ピッチ周期量子化部の出力であるピッチ周期
量子化値と、1kHz高域有声強度量子化部の出力である1k
Hz高域有声強度量子化値と、利得量子化部の出力である
利得量子価値をビットストリーム列に配置するフレーミ
ング部と、によって構成されることを特徴としている。
【0013】課題を解決するため請求項5は、符号化さ
れた音声信号を復号する音声復号方式において、受信し
たビットストリーム列から1フレーム分の符号化データ
を分離し、さらに予め配置されているデータ順から符号
化された線スペクトル対情報、ピッチ周期情報、利得情
報、および1kHz高域有声強度情報を分離する受信データ
再配置部と、符号化された各情報をそれぞれ復号する情
報復号部と、復号されたピッチ情報から有声/無声/有
無声情報を検出する、有声/無声/有無声情報検出部
と、復号された1kHz高域有声強度情報と、有声/無声/
有無声情報から、分割された各帯域の有声/無声を切り
替え、さらに復号された線スペクトル対情報を線形予測
係数へ変換し、分割された各帯域に対応すべき線形予測
情報から、後に行うパルス信号励起および雑音信号励起
に必要なフィルタ係数を算出する、信号励起フィルタ係
数算出部と、復号されたピッチ周期から1パルスを発生
させるパルス信号生成部と、復号されたピッチ周期と、
雑音テーブルの呼び出しにより雑音信号を生成する雑音
信号生成部と、パルス信号生成部により出力されるパル
ス信号を、信号励起フィルタ係数算出部にて算出された
信号励起フィルタ係数によりFIRフィルタリングし励起
させる、パルス信号励起部と、雑音信号生成部により出
力される雑音信号を、信号励起フィルタ係数算出部にて
算出された信号励起フィルタ係数によりFIRフィルタリ
ングし励起させる、雑音信号励起部と、パルス信号励起
部の出力であるパルス励起信号と、雑音信号励起部の出
力である雑音励起信号とを合成する信号合成部と、復号
された線スペクトル対情報を線形予測係数に変換し、変
換された線形予測係数に重みを与えタップ係数とし、信
号合成部の出力である合成信号をFIRフィルタリングお
よびIIRフィルタリングする事により、合成信号のスペ
クトラムを強調するスペクトラム強調フィルタと、復号
された線スペクトル対情報を線形予測係数に変換し、変
換された線形予測係数をタップ係数として、スペクトラ
ム強調フィルタの出力であるスペクトラム強調合成信号
をIIRフィルタリングすることにより線形予測合成を行
う線形予測合成フィルタ部と、線形予測合成フィルタ部
の出力である線形予測合成信号を、復号された利得値に
より利得調整を行う利得調整部と、利得調整部の出力で
ある利得調整後線形予測合成信号を、時間軸上にて分散
することにより聴感上のザラつき感を低減するために、
予め用意されているフィルタ係数にてFIRフィルタリン
グするパルス分散フィルタ部と、パルス分散フィルタ部
の出力である分散線形予測合成信号を1フレーム分のサ
ンプル数分ため込み、再生音声信号として出力する信号
制御部と、によって構成されることを特徴としている。
【0014】課題を解決するため請求項6は、前記請求
項4記載の音声信号符号化装置と、前記請求項5記載の
音声信号復号化装置とを備えたことを特徴としている。
また、前記請求項3記載または前記請求項6記載の音声
信号符号復号化システムとしているため好適なMELP
ボコーダとすることができる。
【0015】
【発明の実施の形態】本発明の実施の形態について、図
面を参照しながら説明する。図1は本発明の実施の形態
に係る音声符号化装置の実施例である。A/D変換された
入力音声信号(1-a)は500HzLPF部(1-01)に入力さ
れ、500HzLPF信号(1-b)が出力される。A/D変換された
入力音声信号(1-a)は1kHzLPF部(1-02)に入力され、
1kHzLPF信号(1-c)が出力される。A/D変換された入力
音声信号(1-a)は1kHzHPF部(1-03)に入力され、1kHz
HPF信号(1-d)が出力される。1kHzHPF信号(1-d)は波
形形状算出部(1-04)に入力され、波形形状信号(1-
e)が出力される。1kHzHPF信号(1-d)と波形形状信号
(1-e)は1kHz高域有声強度算出部(1-05)に入力さ
れ、1kHz高域有声強度情報(1-f)が算出、出力され
る。出力された1kHz高域有声強度情報(1-f)は1kHz高
域有声強度量子化部(1-06)にて量子化され、量子化結
果(1-g)が出力される。
【0016】A/D変換された入力音声信号(1-a)は線形
予測部(1-07)に入力され、線形予測係数(1-h)が算
出される。算出された線形予測係数(1-h)は線スペク
トル対変換部(1-08)と、線スペクトル対量子化重み係
数算出部(1-09)に入力され、それぞれ線スペクトル対
(1-i)および線スペクトル対量子化重み係数(1-j)が
算出、出力される。線スペクトル対(1-i)および線ス
ペクトル対量子化重み係数(1-j)は線スペクトル対量
子化部(1-10)にて量子化され、線スペクトル対量子化
結果(1-k)が出力される。
【0017】500HzLPF信号(1-b)は500Hz低域有声強度
算出部(1-13)に入力され、500Hz低域有声強度(1-n)
が算出、出力される。また、500HzLPF信号(1-b)およ
び1kHzLPF信号(1-c)は初期ピッチ周期検出部(1-11)
に入力され、初期ピッチ周期値(1-l)が算出、出力さ
れる。初期ピッチ周期値(1-l)は信号周期性情報検出
部(1-12)に入力され、信号周期性情報(1-m)が検
出、出力される。
【0018】線形予測係数(1-h)およびA/D変換された
入力音声信号は線形予測分析部(1-14)に入力され、線
形予測分析され残差信号(1-o)が算出、出力される。
残差信号(1-o)は1kHzLPF残差信号算出部(1-15)にて
1kHzLPFフィルタリングされ、1kHzLPF残差信号(1-p)
が算出、出力される。また、残差信号(1-o)は自乗/
絶対値比算出部(1-16)に入力され、自乗/絶対値比値
(1-q)が算出、出力される。1kHzLPF残差信号(1-p)
と初期ピッチ周期値(1-l)およびA/D変換された入力音
声信号は最終ピッチ周期検出部(1-17)に入力され、最
終ピッチ周期値(1-r)が算出、出力される。最終ピッ
チ周期値(1-r)と自乗/絶対値比値(1-q)と信号周期
性情報(1-m)および500Hz有声強度(1-n)はピッチ周
期量子化部(1-18)に入力され、ピッチ周期量子化値
(1-s)が出力される。
【0019】A/D変換された入力音声信号(1-a)と500H
z低域有声強度(1-n)は利得算出部(1-19)に入力さ
れ、利得値(1-t)が算出、出力される。利得値(1-t)
は利得量子化部(1-20)に入力され、利得量子化値(1-
u)が出力される。
【0020】上述してきた各量子化値(1kHz高域有声強
度量子化値(1-g)、線スペクトル対量子化値(1-k)、
ピッチ周期量子化値(1-s)、利得量子価値(1-u))は
フレーミング部(1-21)に入力され、ビットストリーム
列(1-v)が出力される。
【0021】次に図2を参照しつつ復号の動作を以下に
説明する。図2は本発明の実施の形態に係る音声復号化
装置の実施例である。受信されたビットストリーム列
(2-a)は受信データ再配置部(2-01)に入力され、符
号化された順序を基にピッチ周期情報(2-b)、線スペ
クトル対情報(2-c)、1kHz高域有声強度情報(2-d)お
よび利得情報(2-e)に分離され、各データ復号部(2-0
2)に入力されそれぞれ復号処理される。ピッチ周期情
報(2-b)はピッチ周期復号部に入力されピッチ周期復
号結果(2-f)として出力される。線スペクトル対情報
(2-c)は線スペクトル対復号部に入力され線スペクト
ル対復号結果(2-h)として出力される。1kHz高域有声
強度情報(2-d)は1kHz高域有声強度復号部に入力され1
kHz高域有声強度復号結果(2-i)がとして出力される。
利得情報(2-e)は利得復号部に入力され利得復号結果
(2-s)として出力される。ピッチ周期復号結果(2-f)
は有声/無声/有無声情報検出部(2-03)に入力され、
有声/無声/有無声情報(2-g)が検出、出力される。
【0022】1kHz高域有声強度復号結果(2-i)および
有声/無声/有無声情報(2-g)は信号励起フィルタ係
数算出部(2-04)に入力され、信号励起フィルタ係数
(2-j)が算出、出力される。ピッチ周期復号結果(2-
f)はパルス信号生成部(2-05)および雑音信号生成部
(2-06)に入力され、それぞれパルス信号(2-k)、雑
音信号(2-l)が生成、出力される。パルス信号(2-k)
と信号励起フィルタ係数(2-j)はパルス信号励起部(2
-07)に入力され、パルス励起信号(2-n)が算出、出力
される。同様に雑音信号(2-l)と信号励起フィルタ係
数(2-j)は雑音信号励起部(2-08)に入力され、雑音
励起信号(2-m)が算出、出力される。パルス励起信号
(2-n)および雑音励起信号(2-m)は信号合成部(2-0
9)に入力され、合成励起信号(2-o)が算出、出力され
る。
【0023】線スペクトル対復号結果(2-h)は線形予
測係数への変換部(2-10)に入力され、線形予測係数
(2-p)が算出、出力される。線形予測係数(2-p)はス
ペクトラム強調フィルタ部(2-11)に入力され重みを与
えられた後、同様に入力される合成励起信号(2-o)を
与えられた重みに従ってFIRフィルタリングおよびIIRフ
ィルタリングするためのタップ係数となる。結果スペク
トラム強調合成励起信号(2-q)がスペクトラム強調フ
ィルタ部(2-11)より算出、出力される。線形予測係数
(2-p)とスペクトラム強調合成励起信号(2-q)は線形
予測合成フィルタ部(2-12)に入力され、線形予測合成
信号(2-r)が算出、出力される。線形予測合成信号(2
-r)と利得復号結果(2-s)は利得調整部(2-13)に入
力され、利得調整済線形予測合成信号(2-t)が算出、
出力される。利得調整済線形予測合成信号(2-t)はパ
ルス分散フィルタ部(2-14)に入力され、パルス分散後
合成信号(2-u)として算出、出力される。パルス分散
後合成信号(2-u)は信号制御部(2-15)に入力され、
1フレーム分のサンプル数が格納されるまで出力信号を
出力しない制御を行う。出力結果は再生出力音声信号
(2-v)として出力される。
【0024】次に、本発明の音声符号化装置及び音声復
号化装置をMELPボコーダに適用した実施例を説明す
る。MELPボコーダでは本来入力信号を500Hz以下、5
00〜1kHz、1k〜2kHz、2kHz〜3kHzそして3kHz〜4kHzの各
帯域に分割し、それぞれの帯域における強度情報を算出
する。しかし、本発明では入力信号を500Hz以下、1kHz
以下そして1k〜4kHzの各帯域に分割する。1kHz以下の信
号は基準ピッチ周期を算出するために必要なものであ
り、また500Hz以下の信号の帯域別強度情報はピッチ周
期情報に持たせるため、帯域別強度情報を算出するため
に必要な信号は1k〜4kHzの信号のみである。この1k〜4k
Hzの帯域別強度情報には1BITを割り当て、「0」か
「1」を符号化する。
【0025】復号側では、1k〜4kHzの帯域強度が「1」
である場合に、復号された10次の線形予測情報の4次
〜6次の絶対値の合計を1k〜2kHzの強度情報、6次〜8
次の絶対値の合計を2k〜3kHzの強度情報、8次〜10次
の絶対値の合計を3k〜4kHzの強度情報とし、さらに算出
された3つの強度情報の中で最大の値で各情報を除算す
ることで最終的な各帯域の強度情報とする。上述の方法
により算出された各帯域の強度情報を用いて以後のME
LPボコーダ処理を行うことで、再生音声品質を劣化さ
せずに処理量及びビットレートを低減させることが可能
となる。
【0026】本発明の実施例によるMELPボコーダの
ビット削減量を算出すると以下のようになる。 MELPボコーダのフレーム長 : 22.5ms->22.5ms MELPボコーダのサンプリング周波数 : 8kHz->8kHz MELPボコーダのビット数/1フレーム: 54bit/FRAME->51bit/FRAME MELPボコーダのビットレート : 2400bps->2266.7bps
【0027】以上説明したように本発明によれば、音声
符号化装置では、利得量子化手段と有声強度量子化手段
と線スペクトル対量子化手段とピッチ周期量子化手段の
各出力をビットストリーム列に配列するして出力するフ
レーミング手段とを備え、音声復号化装置では、利得信
号を復号した信号と前記線形予測合成した信号とを利得
調整して再生音声信号として出力する再生音声手段とを
備えたことを特徴とする音声信号符号復号化システムを
提供することができる。
【0028】
【発明の効果】本発明である音声符号化復号化システム
を用いることにより、再生音声品質の劣化を極力少なく
しつつ低ビットレート化および低演算量化を実現するこ
とができる。
【0029】さらに低ビットレート化を図る場合は、線
スペクトル対に与える量子化ビットを削減する、ハーモ
ニクスについては削除する。また、フレーム長の伸長を
も含めることにより1000bpsまでの低ビットレート化を
実現し、2400bpsMELPボコーダとほぼ同等の再生音
声を得ることができる。
【0030】
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声符号化装置の実
施例である。
【図2】本発明の実施の形態に係る音声復号化装置の実
施例である。
【符号の説明】
1−21 フレーミング部 1−a 入力音声信号 1−v ビットストリーム列(符号化出力) 2−01 受信データ再配置部 2−a ビットストリーム列(復号化入力) 2−v 再生出力音声信号

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】音声信号符号化装置において、入力したデ
    ジタル信号を利得算出して量子化する利得量子化手段
    と、前記デジタル信号を低域通過させて低域有声強度を
    算出し、及び、初期ピッチ周期を検出し、さらに、周期
    性情報を検出して各々出力する手段と、前記デジタル信
    号を高域通過させて該高域の有声強度を量子化して出力
    する高域有声強度量子化手段と、前記デジタル信号を線
    形予測することで線スペクトル対量子化する線スペクト
    ル対量子化手段と、線形予測分析を行って前記低域有声
    強度と初期ピッチ周期と周期性情報とを演算してピッチ
    周期を量子化して出力するピッチ周期量子化手段と、よ
    り構成され、前記の利得量子化手段と有声強度量子化手
    段と線スペクトル対量子化手段とピッチ周期量子化手段
    の各出力をビットストリーム列に配列するして出力する
    フレーミング手段とを備えたことを特徴とする音声信号
    符号化装置。
  2. 【請求項2】音声信号復号化装置において、受信入力し
    た信号を線スペクトル対、ピッチ周期、有声強度、利得
    の各情報信号に分離して各々出力する受信データ再配置
    手段と、前記各々の情報信号を復号する復号手段と、前
    記線スペクトル対、ピッチ周期、有声強度の各情報信号
    を復号した信号を演算して線形予測合成する手段と、前
    記利得信号を復号した信号と前記線形予測合成した信号
    とを利得調整して再生音声信号として出力する再生音声
    手段とを備えたことを特徴とする音声信号復号化装置。
  3. 【請求項3】前記請求項1記載の音声信号符号化装置
    と、前記請求項2記載の音声信号復号化装置とを備えた
    ことを特徴とする音声信号符号復号化システム。
  4. 【請求項4】音声信号を符号化する方式において、A/D
    された入力信号を1フレーム分のサンプル数格納する入
    力信号格納バッファと、上述の入力信号格納バッファに
    格納されている入力信号を500Hz低域通過フィルタリン
    グし、出力結果である500HzLPF出力信号を格納する500H
    zLPF部と、入力信号格納バッファに格納されている入力
    信号を1kHz低域通過フィルタリングし、出力結果である
    1kHzLPF出力信号を格納する1kHzLPF部と、入力信号格納
    バッファに格納されている入力信号を1kHz高域通過フィ
    ルタリングし、出力結果である1kHzHPF出力信号を格納
    する1kHzHPF部と、1kHzHPF部の出力結果である1kHzHPF
    出力信号の時間軸上における波形形状を算出し、出力結
    果である波形形状出力信号を格納する波形形状算出部
    と、1kHzHPF部の出力結果と波形形状算出部の出力結果
    より、1kHz高域部の有声強度値を算出する1kHz高域有声
    強度算出部と、1kHz高域有声強度算出部の結果である1k
    Hz高域有声強度値を量子化する1kHz高域有声強度量子化
    部と、入力信号格納バッファに格納されている入力信号
    から線形予測係数を算出する線形予測部と、線形予測部
    にて算出された線形予測係数を、線スペクトル対に変換
    する線スペクトル対変換部と、線形予測部にて算出され
    た線形予測係数中の絶対最大値を探索し、絶対最大値で
    線形予測係数を除算した結果を格納する線スペクトル対
    量子化重み係数算出部と、線スペクトル対変換部の出力
    である線スペクトル対に、線スペクトル対量子化重み係
    数算出部の出力である線スペクトル対量子化重み係数を
    乗じ、その結果を量子化する線スペクトル対量子化部
    と、1kHzLPF部の出力である1kHzLPF出力信号と、500HzL
    PF部の出力である500HzLPF出力信号から初期ピッチ周期
    を検出する初期ピッチ検出部と、1kHzLPF部の出力であ
    る1kHzLPF出力信号から信号の周期性の有無を検出する
    信号周期性情報検出部と、500HzLPF部の出力である500H
    zLPF出力信号から、500Hz定期部の有声強度値を算出す
    る500Hz低域有声強度算出部と、線形予測部にて算出さ
    れた線形予測係数をタップ係数とし、入力信号をFIRフ
    ィルタリングすることで線形予測分析フィルタリングを
    行い、その結果を残差信号として格納する線形予測分析
    部と、線形予測分析部の出力である残差信号を1kHz低域
    通過フィルタリングし、出力結果である1kHzLPF残差信
    号を格納する1kHzLPF残差信号算出部と、線形予測分析
    部の出力である残差信号から、自乗値と絶対値の比を算
    出する自乗/絶対値比算出部と、入力信号と1kHzLPF残
    差信号、および初期ピッチ周期から最終的なピッチ周期
    を検出する最終ピッチ周期検出部と、最終ピッチ周期と
    信号周期性情報と自乗/絶対値比、および500Hz低域有
    声強度値からピッチ周期の量子化を行うピッチ周期量子
    化部と、入力信号と500Hz低域有声強度値から利得を算
    出する利得算出部と、利得算出部で算出された利得を量
    子化する利得量子化部と、線スペクトル対量子化部の出
    力である線スペクトル対量子化値と、ピッチ周期量子化
    部の出力であるピッチ周期量子化値と、1kHz高域有声強
    度量子化部の出力である1kHz高域有声強度量子化値と、
    利得量子化部の出力である利得量子価値をビットストリ
    ーム列に配置するフレーミング部と、によって構成され
    ることを特徴とする音声信号符号化装置。
  5. 【請求項5】符号化された音声信号を復号する音声復号
    方式において、受信したビットストリーム列から1フレ
    ーム分の符号化データを分離し、さらに予め配置されて
    いるデータ順から符号化された線スペクトル対情報、ピ
    ッチ周期情報、利得情報、および1kHz高域有声強度情報
    を分離する受信データ再配置部と、符号化された各情報
    をそれぞれ復号する情報復号部と、復号されたピッチ情
    報から有声/無声/有無声情報を検出する、有声/無声
    /有無声情報検出部と、復号された1kHz高域有声強度情
    報と、有声/無声/有無声情報から、分割された各帯域
    の有声/無声を切り替え、さらに復号された線スペクト
    ル対情報を線形予測係数へ変換し、分割された各帯域に
    対応すべき線形予測情報から、後に行うパルス信号励起
    および雑音信号励起に必要なフィルタ係数を算出する、
    信号励起フィルタ係数算出部と、復号されたピッチ周期
    から1パルスを発生させるパルス信号生成部と、復号さ
    れたピッチ周期と、雑音テーブルの呼び出しにより雑音
    信号を生成する雑音信号生成部と、パルス信号生成部に
    より出力されるパルス信号を、信号励起フィルタ係数算
    出部にて算出された信号励起フィルタ係数によりFIRフ
    ィルタリングし励起させる、パルス信号励起部と、雑音
    信号生成部により出力される雑音信号を、信号励起フィ
    ルタ係数算出部にて算出された信号励起フィルタ係数に
    よりFIRフィルタリングし励起させる、雑音信号励起部
    と、パルス信号励起部の出力であるパルス励起信号と、
    雑音信号励起部の出力である雑音励起信号とを合成する
    信号合成部と、復号された線スペクトル対情報を線形予
    測係数に変換し、変換された線形予測係数に重みを与え
    タップ係数とし、信号合成部の出力である合成信号をFI
    RフィルタリングおよびIIRフィルタリングする事によ
    り、合成信号のスペクトラムを強調するスペクトラム強
    調フィルタと、復号された線スペクトル対情報を線形予
    測係数に変換し、変換された線形予測係数をタップ係数
    として、スペクトラム強調フィルタの出力であるスペク
    トラム強調合成信号をIIRフィルタリングすることによ
    り線形予測合成を行う線形予測合成フィルタ部と、線形
    予測合成フィルタ部の出力である線形予測合成信号を、
    復号された利得値により利得調整を行う利得調整部と、
    利得調整部の出力である利得調整後線形予測合成信号
    を、時間軸上にて分散することにより聴感上のザラつき
    感を低減するために、予め用意されているフィルタ係数
    にてFIRフィルタリングするパルス分散フィルタ部と、
    パルス分散フィルタ部の出力である分散線形予測合成信
    号を1フレーム分のサンプル数分ため込み、再生音声信
    号として出力する信号制御部と、によって構成されるこ
    とを特徴とする音声信号復号化装置。
  6. 【請求項6】前記請求項4記載の音声信号符号化装置
    と、前記請求項5記載の音声信号復号化装置とを備えた
    ことを特徴とする音声信号符号復号化システム。
JP2000111440A 2000-04-13 2000-04-13 音声信号符号復号化システム Pending JP2001296900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000111440A JP2001296900A (ja) 2000-04-13 2000-04-13 音声信号符号復号化システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000111440A JP2001296900A (ja) 2000-04-13 2000-04-13 音声信号符号復号化システム

Publications (1)

Publication Number Publication Date
JP2001296900A true JP2001296900A (ja) 2001-10-26

Family

ID=18623765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000111440A Pending JP2001296900A (ja) 2000-04-13 2000-04-13 音声信号符号復号化システム

Country Status (1)

Country Link
JP (1) JP2001296900A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020145472A1 (ko) * 2019-01-11 2020-07-16 네이버 주식회사 화자 적응형 모델을 구현하고 합성 음성 신호를 생성하는 뉴럴 보코더 및 뉴럴 보코더의 훈련 방법
CN114582365A (zh) * 2022-05-05 2022-06-03 阿里巴巴(中国)有限公司 音频处理方法和装置、存储介质和电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020145472A1 (ko) * 2019-01-11 2020-07-16 네이버 주식회사 화자 적응형 모델을 구현하고 합성 음성 신호를 생성하는 뉴럴 보코더 및 뉴럴 보코더의 훈련 방법
CN114582365A (zh) * 2022-05-05 2022-06-03 阿里巴巴(中国)有限公司 音频处理方法和装置、存储介质和电子设备
CN114582365B (zh) * 2022-05-05 2022-09-06 阿里巴巴(中国)有限公司 音频处理方法和装置、存储介质和电子设备

Similar Documents

Publication Publication Date Title
RU2764287C1 (ru) Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
JP3490685B2 (ja) 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP5009910B2 (ja) レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
US20080297380A1 (en) Signal decoding apparatus and signal decoding method
CN103180899B (zh) 立体声信号的编码装置、解码装置、编码方法及解码方法
US8078459B2 (en) Method and device for updating status of synthesis filters
JP4438127B2 (ja) 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
JP2006525533A5 (ja)
ZA200205695B (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals.
CA2392640A1 (en) A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
EP2590164A2 (en) Method and device for processing audio signal
JP2001296900A (ja) 音声信号符号復号化システム
JP2008139447A (ja) 音声符号化装置及び音声復号装置
JP4236675B2 (ja) 音声符号変換方法および装置
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP4826580B2 (ja) 音声信号の再生方法及び装置
Holters et al. Delay-free lossy audio coding using shelving pre-and post-filters