JPH05323997A - 音声符号化器、音声復号化器、音声符号化装置 - Google Patents
音声符号化器、音声復号化器、音声符号化装置Info
- Publication number
- JPH05323997A JPH05323997A JP3095391A JP9539191A JPH05323997A JP H05323997 A JPH05323997 A JP H05323997A JP 3095391 A JP3095391 A JP 3095391A JP 9539191 A JP9539191 A JP 9539191A JP H05323997 A JPH05323997 A JP H05323997A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- speech
- time axis
- separator
- driving sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 音声符号化器で入力音声をフレーム単位で時
間軸圧縮した後に符号化することにより、時間軸圧縮に
伴う付加的な遅延を生じることなく、少ない情報量で高
品質の音声を得る。 【構成】 音声符号化器は、入力音声の予測残差をフレ
ーム毎に求める逆フィルタ器と、前記予測残差を時間軸
上でフレーム単位で圧縮する時間軸圧縮器と、圧縮予測
残差から聴覚重み付き入力音声を生成する重み付き合成
フィルタ器と、音声符号化器と、前記圧縮された聴覚重
み付き入力音声のフレーム間のピッチ周期位相のずれを
補正する重み付き合成フィルタ状態更新器および適応コ
ードブック更新器とで構成される。
間軸圧縮した後に符号化することにより、時間軸圧縮に
伴う付加的な遅延を生じることなく、少ない情報量で高
品質の音声を得る。 【構成】 音声符号化器は、入力音声の予測残差をフレ
ーム毎に求める逆フィルタ器と、前記予測残差を時間軸
上でフレーム単位で圧縮する時間軸圧縮器と、圧縮予測
残差から聴覚重み付き入力音声を生成する重み付き合成
フィルタ器と、音声符号化器と、前記圧縮された聴覚重
み付き入力音声のフレーム間のピッチ周期位相のずれを
補正する重み付き合成フィルタ状態更新器および適応コ
ードブック更新器とで構成される。
Description
【0001】
【産業上の利用分野】本発明はディジタル通信やボイス
メールなどに利用する音声符号化器、音声復号化器、音
声符号化装置に関する。
メールなどに利用する音声符号化器、音声復号化器、音
声符号化装置に関する。
【0002】
【従来の技術】図6は従来のCELP(符号帳駆動線形
予測)音声符号化装置の符号化側の構成を示すブロック
図であり、図7は復号化側の構成を示すブロック図であ
る。
予測)音声符号化装置の符号化側の構成を示すブロック
図であり、図7は復号化側の構成を示すブロック図であ
る。
【0003】図6において、1は入力音声のLPC分析
を行うLPC分析器、2はこのLPC分析器1に接続さ
れ、入力音声に聴覚重み付けを行う重み付けフィルタ
器、3,4は駆動音源を生成するために使用する適応コ
ードブックおよび確率的コードブック格納器、5はこれ
らの適応コードブック格納器3および確率コードブック
格納器4に接続され、駆動音源を生成する駆動音源生成
器、6はLPC分析器1、重み付けフィルタ器2および
この駆動音源生成器5に接続され、後者の出力の駆動音
源から合成音声を生成する重み付き合成フィルタ器、7
は重み付けフィルタ器2および重み付き合成フィルタ器
6に接続され、後者からの駆動音源を符号化する駆動音
源符号化器、8は駆動音源符号化器7およびLPC分析
器1に接続され、これから出力された駆動音源および線
形予測係数を復号化側に伝送すべき情報として入力して
多重化し、音声符号化データを送出する多重化器であ
る。図7において、復号化側では、9は上記符号化側で
多重化された音声符号化データを分離する分離器、1
0,11は駆動音源を生成するために使用する適応コー
ドブック格納器および確率的コードブック格納器、12
は分離器9、適応コードブック格納器10、および確率
的コードブック格納器11に接続され、分離器9から音
声符号化データを分離して得られた駆動音源符号を入力
され、また適応コードブックおよび確率コードブックを
後の2者から入力され、これらに基づいて駆動音源を生
成出力する駆動音源生成器、13は分離器9および駆動
音源生成器12に接続され、分離器9から線形予測係数
を入力され、また駆動音源生成器12から駆動音源を入
力されて復号音声を合成出力する合成フィルタ器であ
る。
を行うLPC分析器、2はこのLPC分析器1に接続さ
れ、入力音声に聴覚重み付けを行う重み付けフィルタ
器、3,4は駆動音源を生成するために使用する適応コ
ードブックおよび確率的コードブック格納器、5はこれ
らの適応コードブック格納器3および確率コードブック
格納器4に接続され、駆動音源を生成する駆動音源生成
器、6はLPC分析器1、重み付けフィルタ器2および
この駆動音源生成器5に接続され、後者の出力の駆動音
源から合成音声を生成する重み付き合成フィルタ器、7
は重み付けフィルタ器2および重み付き合成フィルタ器
6に接続され、後者からの駆動音源を符号化する駆動音
源符号化器、8は駆動音源符号化器7およびLPC分析
器1に接続され、これから出力された駆動音源および線
形予測係数を復号化側に伝送すべき情報として入力して
多重化し、音声符号化データを送出する多重化器であ
る。図7において、復号化側では、9は上記符号化側で
多重化された音声符号化データを分離する分離器、1
0,11は駆動音源を生成するために使用する適応コー
ドブック格納器および確率的コードブック格納器、12
は分離器9、適応コードブック格納器10、および確率
的コードブック格納器11に接続され、分離器9から音
声符号化データを分離して得られた駆動音源符号を入力
され、また適応コードブックおよび確率コードブックを
後の2者から入力され、これらに基づいて駆動音源を生
成出力する駆動音源生成器、13は分離器9および駆動
音源生成器12に接続され、分離器9から線形予測係数
を入力され、また駆動音源生成器12から駆動音源を入
力されて復号音声を合成出力する合成フィルタ器であ
る。
【0004】以上のように構成された従来の音声符号化
装置の動作は次のようになる。図6の符号化側におい
て、入力音声に対してLPC分析器1で得られた線形予
測係数を用いて、重み付けフィルタ器2により聴覚重み
付き入力音声を生成する。一方、駆動音源生成器5およ
び重み付き合成フィルタ器6を通して合成音声を生成
し、駆動音源符号化器7においてこの合成音声と、上記
重み付けフィルタ器2で得られた重み付き入力音声との
二乗誤差を最小にするような駆動音源を適応コードブッ
クおよび確率的コードブックから選択し、符号化する。
更に、復号化側に伝送すべき情報(線形予測係数および
駆動音源)を多重化器8により多重化する。一方、図7
の復号化側において、分離器9で上記符号化側からの音
声符号化データを線形予測係数、駆動音源の各情報に分
離し、この駆動音源情報および適応コードブック格納器
10と確率的コードブック格納器11の適応コードブッ
クと確率的コードブックに基づいて駆動音源生成器12
により駆動音源を生成し、合成フィルタ器13で復号音
声を合成する。
装置の動作は次のようになる。図6の符号化側におい
て、入力音声に対してLPC分析器1で得られた線形予
測係数を用いて、重み付けフィルタ器2により聴覚重み
付き入力音声を生成する。一方、駆動音源生成器5およ
び重み付き合成フィルタ器6を通して合成音声を生成
し、駆動音源符号化器7においてこの合成音声と、上記
重み付けフィルタ器2で得られた重み付き入力音声との
二乗誤差を最小にするような駆動音源を適応コードブッ
クおよび確率的コードブックから選択し、符号化する。
更に、復号化側に伝送すべき情報(線形予測係数および
駆動音源)を多重化器8により多重化する。一方、図7
の復号化側において、分離器9で上記符号化側からの音
声符号化データを線形予測係数、駆動音源の各情報に分
離し、この駆動音源情報および適応コードブック格納器
10と確率的コードブック格納器11の適応コードブッ
クと確率的コードブックに基づいて駆動音源生成器12
により駆動音源を生成し、合成フィルタ器13で復号音
声を合成する。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
ような従来の音声符号化装置では、音声の符号化レート
が低い場合(4〜5kb/s以下)には、符号化の情報
量が少ないために高品質な音声が得られないという問題
点があった。
ような従来の音声符号化装置では、音声の符号化レート
が低い場合(4〜5kb/s以下)には、符号化の情報
量が少ないために高品質な音声が得られないという問題
点があった。
【0006】本発明は、上記従来の問題点を解決するも
ので、符号化側でフレーム単位で入力音声を時間軸圧縮
した後に符号化することにより、時間軸圧縮に伴う付加
的な遅延を生じることなく少ない情報量で高品質な音声
を得ることができる音声符号化装置を提供することを目
的とする。
ので、符号化側でフレーム単位で入力音声を時間軸圧縮
した後に符号化することにより、時間軸圧縮に伴う付加
的な遅延を生じることなく少ない情報量で高品質な音声
を得ることができる音声符号化装置を提供することを目
的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明による音声符号化器は、入力音声の予測残差
をフレーム毎に求める逆フィルタ器と、この逆フィルタ
器に接続され、前記予測残差を時間軸上でフレーム単位
で圧縮する時間軸圧縮器と、この時間軸圧縮器に接続さ
れ、時間軸圧縮された予測残差から聴覚重み付き入力音
声を生成する重み付き合成フィルタ器と、この重み付き
合成フィルタ器に接続され、前記聴覚重み付き入力音声
をCELP符号化(符号帳駆動線形予測符号化)するC
ELP符号化器と、前記重み付き合成フィルタ器に接続
され、前記CELP符号化時に圧縮された聴覚重み付き
入力音声のフレーム間のピッチ周期位相のずれを補正す
るための重み付き合成フィルタ状態更新器および適応コ
ードブック更新器とで構成される。
に、本発明による音声符号化器は、入力音声の予測残差
をフレーム毎に求める逆フィルタ器と、この逆フィルタ
器に接続され、前記予測残差を時間軸上でフレーム単位
で圧縮する時間軸圧縮器と、この時間軸圧縮器に接続さ
れ、時間軸圧縮された予測残差から聴覚重み付き入力音
声を生成する重み付き合成フィルタ器と、この重み付き
合成フィルタ器に接続され、前記聴覚重み付き入力音声
をCELP符号化(符号帳駆動線形予測符号化)するC
ELP符号化器と、前記重み付き合成フィルタ器に接続
され、前記CELP符号化時に圧縮された聴覚重み付き
入力音声のフレーム間のピッチ周期位相のずれを補正す
るための重み付き合成フィルタ状態更新器および適応コ
ードブック更新器とで構成される。
【0008】更に、本発明による音声復号化器は、音声
符号化器から得られた駆動音源符号を受けて駆動音源符
号,ピッチ周期,線形予測係数などの情報に分離して出
力する分離器と、この分離器に接続され、その出力の駆
動音源符号から駆動音源を生成する駆動音源生成器と、
この駆動音源生成器および前記分離器に接続され、前記
分離器からのピッチ周期情報に基づいて前記駆動音源生
成器からの駆動音源をフレーム単位で時間軸伸張する時
間軸伸張器と、この時間軸伸張器および前記分離器に接
続され、前記分離器からの線形予測係数情報に基づいて
前記時間軸伸張器からの伸張駆動音源から音声を復号す
る合成フィルタ器と、前記駆動音源生成器に接続され、
この駆動音源生成器による駆動音源の生成に供する適応
コードブックおよび確率的コードブックを格納する格納
器と、前記駆動音源生成器の出力および前記適応コード
ブック格納器に接続され、前記符号化装置に合わせて適
応コードブックを更新する適応コードブック更新器とで
構成される。
符号化器から得られた駆動音源符号を受けて駆動音源符
号,ピッチ周期,線形予測係数などの情報に分離して出
力する分離器と、この分離器に接続され、その出力の駆
動音源符号から駆動音源を生成する駆動音源生成器と、
この駆動音源生成器および前記分離器に接続され、前記
分離器からのピッチ周期情報に基づいて前記駆動音源生
成器からの駆動音源をフレーム単位で時間軸伸張する時
間軸伸張器と、この時間軸伸張器および前記分離器に接
続され、前記分離器からの線形予測係数情報に基づいて
前記時間軸伸張器からの伸張駆動音源から音声を復号す
る合成フィルタ器と、前記駆動音源生成器に接続され、
この駆動音源生成器による駆動音源の生成に供する適応
コードブックおよび確率的コードブックを格納する格納
器と、前記駆動音源生成器の出力および前記適応コード
ブック格納器に接続され、前記符号化装置に合わせて適
応コードブックを更新する適応コードブック更新器とで
構成される。
【0009】更に、本発明による音声符号化装置は前記
音声符号化器と前記音声復号化器を組み合わせて構成さ
れる。
音声符号化器と前記音声復号化器を組み合わせて構成さ
れる。
【0010】
【作用】以上に示した構成により、音声符号化器で入力
音声を予測残差上フレーム単位で時間軸圧縮し、圧縮後
の音声のフレーム間のピッチ周期位相のずれを補正して
CELP符号化を施し、これを音声復号化器で復号する
ことにより、時間軸圧縮に伴う付加的な遅延を生じるこ
となしに少ない情報量で高品質の音声を得ることができ
る。
音声を予測残差上フレーム単位で時間軸圧縮し、圧縮後
の音声のフレーム間のピッチ周期位相のずれを補正して
CELP符号化を施し、これを音声復号化器で復号する
ことにより、時間軸圧縮に伴う付加的な遅延を生じるこ
となしに少ない情報量で高品質の音声を得ることができ
る。
【0011】
【実施例】図1および図2は本発明の一実施例の構成を
示すブロック図で、図1は音声符号化器を、図2は音声
復号化器をそれぞれ示している。なお、図中、図6およ
び図7の従来例と同一部位には同一の符号を付し、その
説明は適宜省略する。
示すブロック図で、図1は音声符号化器を、図2は音声
復号化器をそれぞれ示している。なお、図中、図6およ
び図7の従来例と同一部位には同一の符号を付し、その
説明は適宜省略する。
【0012】図1において、1は入力音声のLPC分析
を行うLPC分析器、14はLPC分析器1に接続さ
れ、このLPC分析器1で分離された線形予測係数に基
づいて入力音声の予測残差を求める逆フィルタ器、15
はこの逆フィルタ器14に接続され、その出力の予測残
差からピッチ周期を求めて出力するピッチ抽出器、16
は逆フィルタ器14およびピッチ抽出器15に接続さ
れ、逆フィルタ器14からの予測残差をピッチ抽出器1
5からのピッチ周期に基づいてフレーム単位で時間軸圧
縮し圧縮残差を出力する時間軸圧縮器、17はLPC分
析器1および時間軸圧縮器16に接続され、LPC分析
器1からの線形予測係数に基づいて時間軸圧縮器16か
らの圧縮残差の聴覚重み付き合成を行い、重み付き入力
音声を出力する重み付き合成フィルタ器、3,4は駆動
音源を生成するために使用する適応コードブックおよび
確率的コードブックを格納する適応コードブック格納器
および確率的コードブック格納器、5はこれらの適応コ
ードブック格納器3および確率的コードブック格納器4
に接続され、駆動音源を生成する駆動音源生成器、1
8,19は、それぞれ、重み付き合成フィルタ器17、
および駆動音源生成器5と適応コードブック格納器3に
接続され、時間軸圧縮音声のフレーム間のピッチ周期位
相のずれを補正するように、重み付き合成フィルタ状態
および適応コードブックの更新を制御する重み付き合成
フィルタ状態更新器、および適応コードブック更新器、
6は駆動音源生成器5、LPC分析器1に接続され、L
PC分析器1からの線形予測係数に基づいて駆動音源生
成器5からの駆動音源から合成音声を生成し、出力する
重み付き合成フィルタ器、7は重み付き合成フィルタ器
17,6に接続され、後者からの駆動音源を符号化する
駆動音源符号化器、8はピッチ抽出器15、LPC分析
器1、駆動音源符号化器7に接続され、復号化側に伝送
するデータを多重化する多重化器である。
を行うLPC分析器、14はLPC分析器1に接続さ
れ、このLPC分析器1で分離された線形予測係数に基
づいて入力音声の予測残差を求める逆フィルタ器、15
はこの逆フィルタ器14に接続され、その出力の予測残
差からピッチ周期を求めて出力するピッチ抽出器、16
は逆フィルタ器14およびピッチ抽出器15に接続さ
れ、逆フィルタ器14からの予測残差をピッチ抽出器1
5からのピッチ周期に基づいてフレーム単位で時間軸圧
縮し圧縮残差を出力する時間軸圧縮器、17はLPC分
析器1および時間軸圧縮器16に接続され、LPC分析
器1からの線形予測係数に基づいて時間軸圧縮器16か
らの圧縮残差の聴覚重み付き合成を行い、重み付き入力
音声を出力する重み付き合成フィルタ器、3,4は駆動
音源を生成するために使用する適応コードブックおよび
確率的コードブックを格納する適応コードブック格納器
および確率的コードブック格納器、5はこれらの適応コ
ードブック格納器3および確率的コードブック格納器4
に接続され、駆動音源を生成する駆動音源生成器、1
8,19は、それぞれ、重み付き合成フィルタ器17、
および駆動音源生成器5と適応コードブック格納器3に
接続され、時間軸圧縮音声のフレーム間のピッチ周期位
相のずれを補正するように、重み付き合成フィルタ状態
および適応コードブックの更新を制御する重み付き合成
フィルタ状態更新器、および適応コードブック更新器、
6は駆動音源生成器5、LPC分析器1に接続され、L
PC分析器1からの線形予測係数に基づいて駆動音源生
成器5からの駆動音源から合成音声を生成し、出力する
重み付き合成フィルタ器、7は重み付き合成フィルタ器
17,6に接続され、後者からの駆動音源を符号化する
駆動音源符号化器、8はピッチ抽出器15、LPC分析
器1、駆動音源符号化器7に接続され、復号化側に伝送
するデータを多重化する多重化器である。
【0013】図2において、9は符号化側で多重化され
た音声符号化データを分離する分離器、10,11は駆
動音源を生成するために使用する適応コードブックおよ
び確率的コードブックを格納する適応コードブック格納
器および確率的コードブック格納器、12は適応コード
ブック格納器10、確率的コードブック格納器11に接
続され、これらからの適応コードブックおよび確率的コ
ードブックを用いて駆動音源を生成する駆動音源生成
器、20は駆動音源生成器12および適応コードブック
格納器10に接続され、適応コードブックの更新を制御
する適応コードブック更新器、21は分離器9、駆動音
源生成器12に接続され、駆動音源をフレーム単位で時
間軸伸張する時間軸伸張器、13はこの時間軸伸張器2
1および分離器9に接続され、駆動音源から復号音声を
合成する合成フィルタ器である。次に、上記実施例の動
作について説明する。図1の音声符号化器において、入
力音声に対しLPC分析器1で得られた線形予測係数を
用い、逆フィルタ器14によりフレーム単位で予測残差
を求める。予測残差からピッチ抽出器15により求めら
れたピッチ周期を用いて時間軸圧縮器16により予測残
差をフレーム単位で時間軸圧縮し、重み付き合成フィル
タ器17により時間軸圧縮された聴覚重み付き入力音声
を生成し、駆動音源符号化器7に送出する。一方、駆動
音源生成器5および重み付き合成フィルタ器6を通して
合成音声を生成し、これを駆動音源符号化器7に送出す
る。駆動音源符号化器7はこの合成音声を上記の重み付
き入力音声を入力され、これらの二乗誤差を最小にする
ような駆動音源を適応コードブックおよび確率的コード
ブックから選択し、それを符号化し、出力する。また、
上記時間軸圧縮音声のフレーム間のピッチ周期位相のず
れを補正するため、重み付き合成フィルタ状態更新器1
8および適応コードブック更新器19により重み付き合
成フィルタ状態および適応コードブックの更新を制御す
る。各フレーム処理の最後に、復号化側に伝送すべき情
報である線形予測係数,ピッチ周期,駆動音源情報を多
重化器13で多重化し、送出する。次に、図2の音声復
号化器において、分離器9により入力された音声符号化
データを線形予測係数,ピッチ周期,駆動音源の各情報
に分離し、駆動音源情報および適応コードブック、確率
的コードブックから駆動音源生成器12により駆動音源
を生成し、時間軸伸張器21によりピッチ周期を用いて
フレーム単位で駆動音源を時間軸伸張し、合成フィルタ
器13で復号音声を合成する。
た音声符号化データを分離する分離器、10,11は駆
動音源を生成するために使用する適応コードブックおよ
び確率的コードブックを格納する適応コードブック格納
器および確率的コードブック格納器、12は適応コード
ブック格納器10、確率的コードブック格納器11に接
続され、これらからの適応コードブックおよび確率的コ
ードブックを用いて駆動音源を生成する駆動音源生成
器、20は駆動音源生成器12および適応コードブック
格納器10に接続され、適応コードブックの更新を制御
する適応コードブック更新器、21は分離器9、駆動音
源生成器12に接続され、駆動音源をフレーム単位で時
間軸伸張する時間軸伸張器、13はこの時間軸伸張器2
1および分離器9に接続され、駆動音源から復号音声を
合成する合成フィルタ器である。次に、上記実施例の動
作について説明する。図1の音声符号化器において、入
力音声に対しLPC分析器1で得られた線形予測係数を
用い、逆フィルタ器14によりフレーム単位で予測残差
を求める。予測残差からピッチ抽出器15により求めら
れたピッチ周期を用いて時間軸圧縮器16により予測残
差をフレーム単位で時間軸圧縮し、重み付き合成フィル
タ器17により時間軸圧縮された聴覚重み付き入力音声
を生成し、駆動音源符号化器7に送出する。一方、駆動
音源生成器5および重み付き合成フィルタ器6を通して
合成音声を生成し、これを駆動音源符号化器7に送出す
る。駆動音源符号化器7はこの合成音声を上記の重み付
き入力音声を入力され、これらの二乗誤差を最小にする
ような駆動音源を適応コードブックおよび確率的コード
ブックから選択し、それを符号化し、出力する。また、
上記時間軸圧縮音声のフレーム間のピッチ周期位相のず
れを補正するため、重み付き合成フィルタ状態更新器1
8および適応コードブック更新器19により重み付き合
成フィルタ状態および適応コードブックの更新を制御す
る。各フレーム処理の最後に、復号化側に伝送すべき情
報である線形予測係数,ピッチ周期,駆動音源情報を多
重化器13で多重化し、送出する。次に、図2の音声復
号化器において、分離器9により入力された音声符号化
データを線形予測係数,ピッチ周期,駆動音源の各情報
に分離し、駆動音源情報および適応コードブック、確率
的コードブックから駆動音源生成器12により駆動音源
を生成し、時間軸伸張器21によりピッチ周期を用いて
フレーム単位で駆動音源を時間軸伸張し、合成フィルタ
器13で復号音声を合成する。
【0014】次に、図3および図4によりフレーム単位
の時間軸圧縮・伸張の動作について説明する。まず、時
間軸圧縮は、図3において、フレーム単位の予測残差の
先頭から各2ピッチ周期分A,Bから図中破線で示した
重みをつけて加算し、(ATB)圧縮残差として出力す
る。2ピッチ周期に満たない区間(C,D)に対して
は、そのうちの長さLrの区間Cはそのまま出力し、こ
のフレームの圧縮動作を終了する。
の時間軸圧縮・伸張の動作について説明する。まず、時
間軸圧縮は、図3において、フレーム単位の予測残差の
先頭から各2ピッチ周期分A,Bから図中破線で示した
重みをつけて加算し、(ATB)圧縮残差として出力す
る。2ピッチ周期に満たない区間(C,D)に対して
は、そのうちの長さLrの区間Cはそのまま出力し、こ
のフレームの圧縮動作を終了する。
【0015】また、時間軸伸張は、図4において、ま
ず、フレームの先頭の1ピッチ周期区間(A1)を2回
繰り返しそのまま出力する。以降の各1ピッチ周期区間
(Ai)は隣り合う2ピッチ周期区間(Ai-1,Ai)の
重み付き加算(Ai-1+Ai)と、そのままの区間
(Ai)を出力する。1ピッチ周期に満たない区間
(C)はそのまま出力し、残りの区間(D)は伸張後出
力信号の1ピッチ周期前の長さLrの区間(E)を再度
出力し、このフレームの伸張動作を終了する。
ず、フレームの先頭の1ピッチ周期区間(A1)を2回
繰り返しそのまま出力する。以降の各1ピッチ周期区間
(Ai)は隣り合う2ピッチ周期区間(Ai-1,Ai)の
重み付き加算(Ai-1+Ai)と、そのままの区間
(Ai)を出力する。1ピッチ周期に満たない区間
(C)はそのまま出力し、残りの区間(D)は伸張後出
力信号の1ピッチ周期前の長さLrの区間(E)を再度
出力し、このフレームの伸張動作を終了する。
【0016】次に、図5により、時間軸圧縮後の音声の
フレーム間のピッチ周期位相ずれを補正するための重み
付き合成フィルタ状態および適応コードブックの更新の
制御について説明する。図において、1は2フレームの
予測残差、2,3は1の各フレーム(i−1,i)の圧
縮残差である。この場合の2フレームの圧縮残差の接続
部は、1の区間Aがi−1フレームの圧縮残差2に出力
されないので長さLrのピッチ周期位相のずれが生じ
る。これを補正するため、iフレームの圧縮残差3を
2,3で示したような位置として考え、ピッチ周期の位
相を合わせるようにする。これに対応するように、iフ
レームの重み付き入力音声は位置aから合成を始めるよ
うに重み付き合成フィルタ状態を制御する。同様に、i
フレームの駆動音源の生成は、7の位置bから行うよう
に適応コードブックの更新を制御する。このような重み
付き合成フィルタ状態および適応コードブックの更新の
制御を行うことにより時間軸圧縮に伴う音声フレーム間
のピッチ周期位相のずれを補正して復号化を行う。
フレーム間のピッチ周期位相ずれを補正するための重み
付き合成フィルタ状態および適応コードブックの更新の
制御について説明する。図において、1は2フレームの
予測残差、2,3は1の各フレーム(i−1,i)の圧
縮残差である。この場合の2フレームの圧縮残差の接続
部は、1の区間Aがi−1フレームの圧縮残差2に出力
されないので長さLrのピッチ周期位相のずれが生じ
る。これを補正するため、iフレームの圧縮残差3を
2,3で示したような位置として考え、ピッチ周期の位
相を合わせるようにする。これに対応するように、iフ
レームの重み付き入力音声は位置aから合成を始めるよ
うに重み付き合成フィルタ状態を制御する。同様に、i
フレームの駆動音源の生成は、7の位置bから行うよう
に適応コードブックの更新を制御する。このような重み
付き合成フィルタ状態および適応コードブックの更新の
制御を行うことにより時間軸圧縮に伴う音声フレーム間
のピッチ周期位相のずれを補正して復号化を行う。
【0017】
【発明の効果】以上のように本発明は、時間軸圧縮後の
音声を符号化することにより、少ない情報量で高品質の
音声符号化を行える効果があり、また時間軸圧縮・伸張
をフレーム単位で行うことにより、圧縮・伸張に伴う付
加的な遅延を排除することができ、更に圧縮・伸張時に
ピッチ周期信号の重み付け加算を行うことにより滑らか
な圧縮・伸張を行うことができる効果がある。更に、重
み付き合成フィルタ状態および適応コードブックの更新
を制御することにより、時間軸圧縮後の音声のフレーム
間のピッチ周期位相ずれを補正して時間軸圧縮に伴う音
声品質の劣化を抑えて符号化を行うことができる効果が
ある。
音声を符号化することにより、少ない情報量で高品質の
音声符号化を行える効果があり、また時間軸圧縮・伸張
をフレーム単位で行うことにより、圧縮・伸張に伴う付
加的な遅延を排除することができ、更に圧縮・伸張時に
ピッチ周期信号の重み付け加算を行うことにより滑らか
な圧縮・伸張を行うことができる効果がある。更に、重
み付き合成フィルタ状態および適応コードブックの更新
を制御することにより、時間軸圧縮後の音声のフレーム
間のピッチ周期位相ずれを補正して時間軸圧縮に伴う音
声品質の劣化を抑えて符号化を行うことができる効果が
ある。
【図1】本発明による音声符号化器の一実施例の構成を
示すブロック図
示すブロック図
【図2】本発明による音声復号化器の一実施例の構成を
示すブロック図
示すブロック図
【図3】図1の実施例における時間軸圧縮動作を示す説
明図
明図
【図4】図2の実施例における時間軸伸張動作を示す説
明図
明図
【図5】時間軸圧縮後の音声のフレーム間のピッチ周期
位相ずれの補正方法を示す説明図
位相ずれの補正方法を示す説明図
【図6】従来のCELP音声符号化装置の符号化側の構
成を示すブロック図
成を示すブロック図
【図7】従来のCELP音声符号化装置の復号化側の構
成を示すブロック図
成を示すブロック図
1 LCP分析器 3 適応コードブック格納器 4 確率的コードブック格納器 5 駆動音源生成器 6 重み付き合成フィルタ器 7 駆動音源符号化器 8 多重化器 9 分離器 10 適応コ−ドブック格納器 11 確立的コ−ドブック格納器 12 駆動音源生成器 13 合成フィルタ器 14 逆フィルタ器 15 ピッチ抽出器 16 時間軸圧縮器 17 重み付き合成フィルタ器 18 重み付き合成フィルタ状態更新器 19 適応コードブック更新器 20 適応コ−ドブック更新器 21 時間軸伸張器
Claims (3)
- 【請求項1】 入力音声の予測残差をフレーム毎に求め
る逆フィルタ器と、この逆フィルタ器に接続され、前記
予測残差を時間軸上でフレーム単位で圧縮する時間軸圧
縮器と、この時間軸圧縮器に接続され、時間軸圧縮され
た予測残差から聴覚重み付き入力音声を生成する重み付
き合成フィルタ器と、この重み付き合成フィルタ器に接
続され、前記聴覚重み付き入力音声をCELP符号化
(符号帳駆動線形予測符号化)するCELP符号化器
と、前記重み付き合成フィルタ器に接続され、前記CE
LP符号化時に圧縮された聴覚重み付き入力音声のフレ
ーム間のピッチ周期位相のずれを補正するための重み付
き合成フィルタ状態更新器および適応コードブック更新
器とを備えた音声符号化器。 - 【請求項2】 入力駆動音源符号から駆動音源符号、ピ
ッチ周期、線形予測係数などの情報に分離して出力する
分離器と、この分離器に接続され、その出力の駆動音源
符号から駆動音源を生成する駆動音源生成器と、この駆
動音源生成器および前記分離器に接続され、前記分離器
からのピッチ周期情報に基づいて前記駆動音源生成器か
らの駆動音源をフレーム単位で時間軸伸張する時間軸伸
張器と、この時間軸伸張器および前記分離器に接続さ
れ、前記分離器からの線形予測係数情報に基づいて前記
時間軸伸張器からの伸張駆動音源から音声を復号する合
成フィルタ器と、前記駆動音源生成器に接続され、この
駆動音源生成器による駆動音源の生成に供する適応コー
ドブックおよび確率的コードブックを格納する格納器
と、前記駆動音源生成器の出力および前記適応コードブ
ック格納器に接続され、符号化側に合わせて適応コード
ブックを更新する適応コードブック更新器とを備えた音
声復号化器。 - 【請求項3】 入力音声の予測残差をフレーム毎に求め
る逆フィルタ器と、この逆フィルタ器に接続され、前記
予測残差を時間軸上でフレーム単位で圧縮する時間軸圧
縮器と、この時間軸圧縮器に接続され、時間軸圧縮され
た予測残差から聴覚重み付き入力音声を生成する重み付
き合成フィルタ器と、この重み付き合成フィルタ器に接
続され、前記聴覚重み付き入力音声をCELP符号化
(符号帳駆動線形予測符号化)するCELP符号化器
と、前記重み付き合成フィルタ器に接続され、前記CE
LP符号化時に圧縮された聴覚重み付き入力音声のフレ
ーム間のピッチ周期位相のずれを補正するための重み付
き合成フィルタ状態更新器および適応コードブック更新
器とで構成される音声符号化器と、入力駆動音源符号か
ら駆動音源符号、ピッチ周期、線形予測係数などの情報
に分離して出力する分離器と、この分離器に接続され、
その出力の駆動音源符号から駆動音源を生成する駆動音
源生成器と、この駆動音源生成器および前記分離器に接
続され、前記分離器からのピッチ周期情報に基づいて前
記駆動音源生成器からの駆動音源をフレーム単位で時間
軸伸張する時間軸伸張器と、この時間軸伸張器および前
記分離器に接続され、前記分離器からの線形予測係数情
報に基づいて前記時間軸伸張器からの伸張駆動音源から
音声を復号する合成フィルタ器と、前記駆動音源生成器
に接続され、この駆動音源生成器による駆動音源の生成
に供する適応コードブックおよび確率的コードブックを
格納する格納器と、前記駆動音源生成器の出力および前
記適応コードブック格納器に接続され、符号化側に合わ
せて適応コードブックを更新する適応コードブック更新
器とで構成される音声復号化器とを組み合わせて構成す
ることを特徴とする音声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3095391A JPH05323997A (ja) | 1991-04-25 | 1991-04-25 | 音声符号化器、音声復号化器、音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3095391A JPH05323997A (ja) | 1991-04-25 | 1991-04-25 | 音声符号化器、音声復号化器、音声符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05323997A true JPH05323997A (ja) | 1993-12-07 |
Family
ID=14136351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3095391A Pending JPH05323997A (ja) | 1991-04-25 | 1991-04-25 | 音声符号化器、音声復号化器、音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05323997A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6324501B1 (en) * | 1999-08-18 | 2001-11-27 | At&T Corp. | Signal dependent speech modifications |
JPWO2004097798A1 (ja) * | 2003-05-01 | 2006-07-13 | 富士通株式会社 | 音声復号化装置、音声復号化方法、プログラム、記録媒体 |
-
1991
- 1991-04-25 JP JP3095391A patent/JPH05323997A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6324501B1 (en) * | 1999-08-18 | 2001-11-27 | At&T Corp. | Signal dependent speech modifications |
JPWO2004097798A1 (ja) * | 2003-05-01 | 2006-07-13 | 富士通株式会社 | 音声復号化装置、音声復号化方法、プログラム、記録媒体 |
US7606702B2 (en) | 2003-05-01 | 2009-10-20 | Fujitsu Limited | Speech decoder, speech decoding method, program and storage media to improve voice clarity by emphasizing voice tract characteristics using estimated formants |
JP4786183B2 (ja) * | 2003-05-01 | 2011-10-05 | 富士通株式会社 | 音声復号化装置、音声復号化方法、プログラム、記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7184953B2 (en) | Transcoding method and system between CELP-based speech codes with externally provided status | |
US6427135B1 (en) | Method for encoding speech wherein pitch periods are changed based upon input speech signal | |
EP2157572B1 (en) | Signal processing method, processing appartus and voice decoder | |
RU2584463C2 (ru) | Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием | |
KR102173422B1 (ko) | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 | |
KR20040095205A (ko) | Celp를 기반으로 하는 음성 코드간 변환코딩 방식 | |
JPH07160298A (ja) | マルチパルス符号化方法とその装置並びに分析器及び合成器 | |
JPH05323997A (ja) | 音声符号化器、音声復号化器、音声符号化装置 | |
JP3329216B2 (ja) | 音声符号化装置及び音声復号装置 | |
JP3303580B2 (ja) | 音声符号化装置 | |
US20020052745A1 (en) | Speech encoding method, speech decoding method and electronic apparatus | |
JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
JPH0546199A (ja) | 音声符号化装置 | |
JP3178732B2 (ja) | 音声符号化装置 | |
JPH06202699A (ja) | 音声符号化装置及び音声復号化装置及び音声符号化復号化方法 | |
JP3166673B2 (ja) | ボコーダ符号化復号装置 | |
JPH06266399A (ja) | 符号化装置及び音声符号化復号化装置 | |
JP3128226B2 (ja) | 音声符号化方法 | |
JP2004020676A (ja) | 音声符号化/復号化方法及び音声符号化/復号化装置 | |
JPH11272298A (ja) | 音声通信方法及び音声通信装置 | |
JPH0458299A (ja) | 音声符号化装置 | |
JPH09297597A (ja) | 高能率音声伝送方法及び高能率音声伝送装置 | |
JPH05165498A (ja) | 音声符号化方法 | |
JPH0437999B2 (ja) | ||
JPH10105200A (ja) | 音声符号化/復号化方法 |