JPH10105197A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH10105197A
JPH10105197A JP8258585A JP25858596A JPH10105197A JP H10105197 A JPH10105197 A JP H10105197A JP 8258585 A JP8258585 A JP 8258585A JP 25858596 A JP25858596 A JP 25858596A JP H10105197 A JPH10105197 A JP H10105197A
Authority
JP
Japan
Prior art keywords
sound source
excitation
adaptive
extended
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8258585A
Other languages
English (en)
Other versions
JP3874851B2 (ja
Inventor
Koji Yoshida
田 幸 司 吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP25858596A priority Critical patent/JP3874851B2/ja
Publication of JPH10105197A publication Critical patent/JPH10105197A/ja
Application granted granted Critical
Publication of JP3874851B2 publication Critical patent/JP3874851B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 携帯電話等に使用されるCELP型の音声符
号化装置において、音声の立ち上がり等、適応音源符号
帳が有効に機能しない区間での品質劣化を改善すること
を目的とする。 【解決手段】 過去の駆動音源の特徴が保持されている
拡張適応音源符号帳103を新たに設け、適応音源符号
帳105出力または拡張適応音源符号帳103出力のい
ずれかと固定音源符号帳108出力との和で駆動音源を
表現し、適応音源および拡張適応音源いずれか最適な音
源を選択する。拡張適応音源符号帳103は、符号化音
源ベクトル長以上のサイズを有する一つ以上の符号帳ベ
クトルからなり、その拡張適応音源符号帳の更新は、拡
張適応音源符号帳内で過去の駆動音源ベクトルと類似な
区間を探索により決定し、その区間にその駆動音源ベク
トルを加重加算することにより行われる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ディジタル携帯電
話等のディジタル移動通信端末やボイスメール等に必須
な音声信号の符復号化を行う音声符号化装置に関する。
【0002】
【従来の技術】従来、4〜8kbps程度のビットレートの
音声符号化装置はCELP(Code Excited Linear Predi
ction)型が主流であり、"Code Excited Linear Predict
ion(CELP): High-Quality Speech at Very Low Bit Rat
e" (by M.R.Schroeder and B.S.Atal, Proc.ICASSP'85,
pp.937-940,1985), "Improved Speech Quality and Eff
icient Vector Quantization in SELP" (by W.B.Kleij
n, et.al., Proc.ICASSP'88,pp.155-158,1988) に記載
されたものが知られている。図7は従来のCELP音声
符号化装置の符号化側の構成を示したもので、入力音声
に対してLPC分析および量子化を行うLPC分析・ 量
子化器901、入力音声に対して聴感重み付けを行う聴
感重み付けフィルタ902、過去の駆動音源を蓄え適応
音源符号帳探索時に使用する適応音源符号帳903、適
応音源にゲインを乗算するゲイン乗算器904、雑音音
源ベクトルを格納する雑音音源符号帳905、雑音音源
にゲインを乗算するゲイン乗算器906、適応音源と雑
音音源を加算する加算器907、加算器907により得
られた駆動音源に対し、聴感重み付きLPC合成を行う
聴感重み付きLPC合成フィルタ908、聴感重み付け
フィルタ902により得られる聴感重み付き入力音声か
ら聴感重み付きLPC合成フィルタ908により得られ
る聴感重み付き合成音声を減算する減算器909、減算
器909により得られた誤差信号の二乗誤差を最小にす
るような適応音源符号、雑音音源符号およびそれらのゲ
イン符号を決定する聴感重み付き二乗誤差最小化器91
0、符号化により得られるLPC符号、適応音源符号、
雑音音源符号およびそれらのゲイン符号を多重化する多
重化器911から構成されている。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化装置において、適応音源符号帳は、音声
の音源信号に含まれるピッチ予測信号を効率的に生成す
るために設けられたもので、音声信号の母音等の定常区
間には有効に機能するが、音声の立ち上がりや周囲雑音
の存在する信号には十分に機能せず、低ビットレートで
の高音声品質を実現することが困難であるという問題を
有していた。
【0004】本発明は、上記従来の問題を解決するもの
で、低ビットレートでの高音声品質を実現することがで
きる優れた音声符号化装置を提供することを目的とす
る。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、適応音源符号帳に加え、過去の駆動音源
により符号帳の更新を行うことにより過去の駆動音源の
特徴が保持される拡張適応音源符号帳を新たに備え、適
応音源符号帳と拡張適応音源符号帳の出力のいずれかを
選択できるようにしたものであり、適応音源が有効に働
かない場合に、より過去の駆動音源の特徴が保持された
拡張適応音源を用いることにより、低ビットレートにお
いて高い音声品質を実現できる。
【0006】
【発明の実施の形態】本発明の請求項1から4および5
に記載の第1の発明は、CELP型音声符号化の音源符
号帳として、過去の駆動音源を順次蓄える適応音源符号
帳、過去の駆動音源により符号帳の更新を行うことによ
り過去の駆動音源の特徴が保持される拡張適応音源符号
帳、および固定の音源符号ベクトルを蓄えた固定符号帳
を備え、さらに拡張適応音源符号帳を過去の駆動音源に
より更新する拡張適応音源符号帳更新器、適応音源符号
帳と拡張適応音源符号帳の出力のいずれかを選択する適
応音源/拡張適応音源選択器とを備えたものであり、適
応音源または拡張適応音源のいずれかと固定音源との和
で音源の符号化を行う構成において、適応音源探索およ
び拡張適応音源探索の結果により、いずれか聴感重み付
き二乗誤差の小さい方の音源を選択することにより、よ
り高い音声品質を実現することができるという作用を有
する。
【0007】また、本発明の請求項1から4および6に
記載の第2の発明は、CELP型音声符号化の音源符号
帳として、過去の駆動音源を順次蓄える適応音源符号
帳、過去の駆動音源により符号帳の更新を行うことによ
り過去の駆動音源の特徴が保持される拡張適応音源符号
帳、および固定の音源符号ベクトルを蓄えた固定符号帳
を備え、さらに拡張適応音源符号帳を過去の駆動音源に
より更新する拡張適応音源更新器、適応音源符号帳と拡
張適応音源符号帳の出力のいずれかを選択する適応音源
/拡張適応音源選択器とを備えたものであり、適応音源
または拡張適応音源のいずれかと固定音源との和で音源
の符号化を行う構成において、適応音源探索、拡張適応
音源探索およびそれらにより得られた音源各々に対する
固定音源探索の結果から、いずれか聴感重み付き二乗誤
差の小さい方の音源を選択することにより、固定音源探
索の結果も含めたより高い音声品質を実現することがで
きるという作用を有する。
【0008】また、本発明の請求項7に記載の第3の発
明は、入力音声または聴感重み付き入力音声に対してピ
ッチ分析を行い、ピッチ予測ゲイン等のピッチ周期性度
合いを表す値を出力するピッチ分析器を備えたものであ
り、適応音源/拡張適応音源選択器における適応音源と
拡張適応音源の選択時にピッチ周期性度合いの値を参照
し、ピッチ周期性度合いがあるしきい値以上に高い場合
に、適応音源が無条件で選択されるようにして、入力音
声の定常区間で拡張適応音源が選択される場合に生じう
る音声品質の劣化を防ぐという作用を有する。
【0009】また、本発明の請求項8に記載の第4の発
明は、適応音源の出力ラグ値、拡張適応音源信号、過去
の駆動音源信号を入力とし、拡張適応音源が選択された
場合を含めて、当該区間におけるピッチ周期ラグ値を固
定音源へ出力するピッチ周期ラグ算出器を備えたもので
あり、拡張適応音源選択時にも、固定音源探索時にピッ
チ周期情報を用いる方法を適用することができ、より音
声品質の向上を図ることができるという作用を有する。
【0010】以下、本発明の実施の形態について、図1
から図6を用いて説明する。 (実施の形態1)図1は第1の発明のCELP型音声符
号化装置の符号化側のブロック図を示したものである。
図1において、101は入力音声に対してLPC分析お
よび量子化を行うLPC分析・量子化器、102は入力
音声に対して聴感重み付けを行う聴感重み付けフィル
タ、103は過去の駆動音源の特徴が保持されている拡
張適応音源符号帳である。この拡張適応音源符号帳10
3は、符号化音源ベクトル長以上のサイズを有する一つ
以上の符号帳ベクトルからなる。ここで、符号帳ベクト
ルが一つの場合、その符号帳ベクトルを、EAC n , n=0,
1,...,L+N-1とすると、この符号帳から得られる第k 番
目の拡張適応音源ベクトルdk n は、 dk n = EAC k+n , n=0,1,...,N-1;k=0,1,...,L-1 と表される。ただし、Lは符号帳サイズ、Nは音源ベク
トル長である。104は拡張適応音源符号帳出力に対し
てゲインを乗じるゲイン乗算器、105は過去の駆動音
源を蓄え適応音源符号帳探索時に使用する適応音源符号
帳、106は適応符号音源に対してゲインを乗じるゲイ
ン乗算器、107は拡張適応音源符号帳103と適応音
源符号帳105の出力のいずれかを選択する適応音源/
拡張適応音源選択器、108は固定の音源符号ベクトル
を格納した固定符号帳、109は固定音源にゲインを乗
算するゲイン乗算器、110は適応音源/拡張適応音源
のいずれかと固定音源を加算する加算器、111は加算
器110により得られた駆動音源に対し聴感重み付きL
PC合成を行う聴感重み付きLPC合成フィルタ、11
2は聴感重み付けフィルタ102により得られる聴感重
み付き入力音声から聴感重み付きLPC合成フィルタ1
11により得られる聴感重み付き合成音声を減算する減
算器、減算器112により得られた誤差信号の二乗誤差
を最小にするような適応音源または拡張適応音源符号と
適応音源/拡張適応音源選択情報、雑音音源符号および
それらのゲイン符号を決定する聴感重み付き二乗誤差最
小化器、114は符号化後の駆動音源を用いて拡張適応
音源符号帳を更新する拡張適応音源符号帳更新器、11
5は符号化により得られるLPC符号、適応音源または
拡張適応音源符号と適応音源/拡張適応音源選択情報、
固定音源符号およびそれらのゲイン符号を多重化する多
重化器である。
【0011】以上のように構成された音声符号化装置に
ついて、図1を用いてその動作を説明する。まず従来の
CELP符号化装置と同様、入力音声に対してLPC分
析・量子化器101によりLPC分析および量子化を行
い、得られた量子化LPC係数を用いて聴感重み付けフ
ィルタ102により聴覚重み付き入力音声を得る。一
方、拡張適応音源符号帳103とゲイン乗算器104ま
たは適応音源符号帳105とゲイン乗算器106により
得られる拡張適応音源または適応音源と、固定符号帳1
08とゲイン乗算器109により得られる固定音源とを
加算器110により加算して得られる駆動音源信号を聴
感重み付きLPC合成フィルタ111により合成し、得
られた合成信号を聴覚重み付き入力音声から減算器11
2により減算し、得られた誤差信号の二乗誤差を最小に
するような適応音源または拡張適応音源符号と適応音源
/拡張適応音源選択情報、雑音音源符号およびそれらの
ゲイン符号を決定する。
【0012】ここで、聴感重み付き二乗誤差を最小にす
るような適応音源または拡張適応音源符号と適応音源/
拡張適応音源選択情報、雑音音源符号およびそれらのゲ
イン符号の決定は、図2に示すような手順で順次決定す
る。まず、拡張適応音源符号帳探索および適応音源符号
帳探索を各々独立に行い(S101、S102)、拡張
適応音源符号帳および適応音源符号帳から最適な符号ベ
クトルを決定する。ここで、拡張適応音源符号帳探索に
おいては、拡張適応音源符号帳内で、聴感重み付き二乗
誤差を最小にする符号ベクトルdk n (n=0 〜N-1)を求め
るか、または入力音声からLPC予測によりLPC残差
信号を求めその残差信号との相関を最大にするような拡
張適応音源符号ベクトルを求めてもよい。あるいは、残
差信号との相関最大化により複数の符号ベクトル候補を
求めておき、その中から聴感重み付き二乗誤差を最小に
するものを選択してもよい。次に、得られた拡張適応音
源と適応音源のうち、聴感重み付き二乗誤差の小さい方
の音源を選択する(S103)。そして、選択された音
源(拡張適応音源または適応音源)に対して固定音源探
索を行う(S104)。最後に、選択された拡張適応音
源または適応音源および固定音源に対するゲイン符号を
ゲイン探索により決定し、駆動音源符号化を終了する
(S105)。なお、ゲイン探索は図2の手順に示すよ
うな音源符号化の最後にまとめて行う方法以外に、拡張
適応音源または適応音源のゲインと固定音源のゲインを
逐次的に決定することも可能である。
【0013】音源符号化により決定された適応音源また
は拡張適応音源符号と適応音源/拡張適応音源選択情
報、雑音音源符号およびそれらのゲイン符号は、LPC
分析および量子化を行うLPC分析・量子化器101に
より得られるLPC符号と共に、多重化器115により
多重化され、符号化データとして出力される。また、拡
張適応音源符号帳および適応音源符号帳は、符号化され
た駆動音源信号を用いて更新される。このうち、拡張適
応音源符号帳の更新は、拡張適応音源符号帳更新器11
4を用いて以下のように行われる。まず、更新前の拡張
適応音源符号帳ベクトルEAC n (n=0〜L+N-1)(符号帳ベ
クトルが一つの場合)に対して、符号化駆動音源e n (n
=0〜N-1)と符号帳ベクトル内で類似する区間を探索す
る。方法としては、拡張適応音源符号帳ベクトルと駆動
音源との相互相関最大化またはゲイン正規化後予測ゲイ
ン最大化等による。それにより得られた符号帳内の類似
区間に対して、以下により符号帳を更新する。 EAC n = α×EAC n , n =0 〜M-1 α×EAC n + (1-α) ×e n-M , n = M 〜M+N-1 α×EAC n , n = M+N 〜L+N-1 ここで、 M:類似区間先頭サンプル α:更新係数
【0014】次に、本実施の形態におけるCELP型音
声符号化装置の復号側構成を図3を参照して説明する。
図3において、151は符号化データに対して、LPC
符号、適応音源または拡張適応音源符号と適応音源/拡
張適応音源選択情報、雑音音源符号およびそれらのゲイ
ン符号を分離する分離器、152は過去の駆動音源の特
徴が保持されている拡張適応音源符号帳であり、その内
容は符号化側と同様である。153は拡張適応音源符号
帳出力に対して拡張適応音源ゲイン符号から得られるゲ
インを乗じるゲイン乗算器、154は過去の駆動音源を
蓄えた適応音源符号帳、155は適応音源に対して適応
音源ゲイン符号から得られるゲインを乗じるゲイン乗算
器、156は拡張適応音源符号帳152と適応音源符号
帳154の出力のいずれかを選択する適応音源/拡張適
応音源選択器、157は固定の音源符号ベクトルを格納
した固定符号帳、158は固定音源に固定音源ゲイン符
号から得られるゲインを乗算するゲイン乗算器、159
は適応音源/拡張適応音源のいずれかと固定音源を加算
する加算器、160はLPC符号からLPC係数を復号
するLPC復号器、161は加算器159により得られ
た駆動音源に対しLPC合成を行うLPC合成フィルタ
である。
【0015】以上のように、構成された音声符号化装置
の復号側について、図3を用いてその動作を説明する。
まず分離器151により符号化データに対して、LPC
符号、適応音源または拡張適応音源符号と適応音源/拡
張適応音源選択情報、固定音源符号およびそれらのゲイ
ン符号を分離する。次に、適応音源/拡張適応音源選択
情報により、適応音源または拡張適応音源とそのゲイン
符号より適応音源または拡張適応音源いずれか符号化側
で選択された音源を生成し、固定音源符号およびそのゲ
イン符号を用いて生成された固定音源と加算器159で
加算し、駆動音源を生成する。そして、LPC復号器1
60で復号されたLPC係数を用いてLPC合成フィル
タ161で駆動音源に対しLPC合成を行い復号音声を
得る。最後に、拡張適応音源符号帳152および適応音
源符号帳154が、符号化された駆動音源信号を用いて
拡張適応音源符号帳更新器162により更新される。拡
張適応音源符号帳の更新方法は符号化側と同様である。
【0016】以上のように、本発明の第1の実施の形態
によれば、過去の駆動音源の特徴が保持されている拡張
適応音源符号帳を新たに設け、適応音源または拡張適応
音源のいずれかと固定音源との和で駆動音源を表現し、
適応音源探索および拡張適応音源探索の結果から、いず
れか聴感重み付き二乗誤差の小さい方の音源を選択する
ことにより、特に音声の立ち上がりや周囲騒音を含む信
号に対し、従来の適応音源のみではうまく表現できなか
った音源をより正確に表現でき、より高い音声品質を実
現することができる。
【0017】なお、図1に示したCELP型の全体構成
は一つの典型的な例であり、本発明は他のCELP型の
構成にも適用可能である。
【0018】(実施の形態2)次に、本発明の第2の実
施の形態について説明する。第2の実施の形態における
CELP型音声符号化装置の構成は、図1に示す符号化
側および図3に示す復号側の構成と同じであるが、音源
探索の動作手順が異なる。図4は第2の実施の形態の音
源探索の動作手順を示したもので、第1の実施の形態と
は異なり、拡張適応音源符号帳探索および適応音源符号
帳探索それぞれに対して固定符号帳探索を行った結果に
対して拡張適応音源か適応音源の選択をするものであ
る。図4において、まず適応音源符号帳探索を行い(S
201)、それにより得られた適応音源に対して固定音
源探索を行った後(S202)、適応音源と固定音源の
ゲイン符号化を行い(S203)、最適な適応音源、固
定音源およびそれらのゲイン符号を決定する。次に、拡
張適応音源に対しても同様に拡張適応音源符号帳探索、
固定音源探索およびゲイン符号化を行い(S204、S
205、S206)、最適な拡張適応音源、固定音源お
よびそれらのゲイン符号を決定する。そして、得られた
適応音源とそれに対応する固定音源および拡張適応音源
とそれに対応する固定音源の組み合わせのうち、聴感重
み付き二乗誤差が小さい方を最終的に選択する(S20
7)。なお、ゲイン符号化は、図4では固定音源探索後
に行うようになっているが、適応音源符号帳探索または
拡張適応音源符号帳探索直後にそれらのゲインを単独で
符号化する方法も可能である。なお、上記した以外の動
作は、拡張適応音源符号帳の更新も含め第1の実施の形
態と同様である。
【0019】以上のように、本発明の第2の実施の形態
によれば、過去の駆動音源の特徴が保持されている拡張
適応音源符号帳を新たに設け、適応音源または拡張適応
音源のいずれかと固定音源との和で駆動音源を表現し、
適応音源および拡張適応音源いずれか最適な音源を選択
できるようにし、更に適応音源と拡張適応音源の選択法
として、適応音源探索および拡張適応音源探索各々に対
して固定音源探索を行った結果に対して聴感重み付き二
乗誤差の小さい方の音源を選択するように動作すること
により、特に音声の立ち上がりや周囲騒音を含む信号に
対し、従来の適応音源のみではうまく表現できなかった
音源をより正確に表現でき、より高い音声品質を実現す
ることができる。
【0020】(実施の形態3)図5は本発明の第3の実
施の形態におけるCELP型音声符号化装置の符号化側
の構成を示したものである。図5において、101〜1
15までは第1および第2の実施の形態を示す図1と同
一であり、図1と異なるのは、入力音声信号に対してピ
ッチ分析を行い、ピッチ予測ゲイン等のピッチ周期性度
合いを表す値を出力するピッチ分析器501を備えてい
ることである。
【0021】以上のように構成された音声符号化装置に
ついて、図5を用いてその動作を説明する。ここでは、
第1および第2の実施の形態と異なるピッチ分析器50
1とその結果に基づいた適応音源/拡張適応音源選択器
107の動作についてのみ説明する。それ以外の動作は
第1および第2の実施の形態と同一である。ピッチ分析
器501では、入力音声を用いてピッチ分析を行い、ピ
ッチ予測ゲインや正規化最大相互相関値等のピッチ周期
性度合いを表す値を出力する。なお、ピッチ分析は、図
5では入力音声に対して行うようになっているが、聴感
重み付けされた入力信号に対して行うことも可能であ
る。そして、適応音源/拡張適応音源選択器107にお
ける適応音源と拡張適応音源の選択時に、ピッチ周期性
度合いの値を参照し、ピッチ周期性度合いがあるしきい
値以上に高い場合に、適応音源が無条件で選択されるよ
うに動作する。音声の母音定常区間等のピッチ周期性度
合いが高い場合は、一般に適応音源の方が拡張適応音源
より望ましく、このような区間で拡張適応音源が選択さ
れた場合、稀にかえって劣化を招く場合があり、本実施
形態のような構成により、それを防ぐことができる。な
お、本実施の形態は、第1および第2の実施の形態のい
ずれに対しても適用することができる。
【0022】(実施の形態4)図6は本発明の第4の実
施の形態におけるCELP型音声符号化装置の符号化側
の構成を示したものである。図6において、101〜1
15までは第1および第2の実施の形態を示す図1と同
じであり、図1と異なるのは、適応音源の出力ラグ値、
拡張適応音源信号、過去の駆動音源信号を入力とし、拡
張適応音源が選択された場合を含めて、当該区間におけ
るピッチ周期ラグ値を固定音源符号帳へ出力するピッチ
周期ラグ算出器601を備えたことである。
【0023】以上のように構成された音声符号化装置に
ついて、図6を用いてその動作を説明する。ここでは、
第1および第2の実施の形態と異なるピッチ周期ラグ算
出器601と固定音源探索の動作についてのみ説明す
る。それ以外の動作は第1および第2の実施の形態と同
一である。ピッチ周期ラグ算出器601において、適応
音源の出力ラグ値、拡張適応音源信号、過去の駆動音源
信号を入力とし、拡張適応音源が選択された場合を含め
て、当該区間におけるピッチ周期ラグ値を固定音源符号
帳へ出力する。ここで、適応音源が選択された場合は、
その探索の結果得られる適応音源ラグをそのまま出力す
る。一方、拡張適応音源が選択された場合にも、当該区
間のピッチ周期ラグに相当する値を算出して出力する。
算出方法としては、当該区間の拡張適応音源信号および
過去の駆動音源信号から最大残差相関算出等によりピッ
チ周期ラグを求めるか、または当該区間の前区間で得ら
れた適応音源ラグ(前区間が適応音源が選択されていな
い場合は、その以前の適応音源ラグ)をそのまま用い
る。ただし、最大残差相関値が小さい等、ピッチ周期性
が低い場合は、そのような状態である旨の情報を出力す
る。そして、出力されたピッチ周期ラグは、その情報が
必要なタイプの固定音源探索において使用される。これ
は、例えば雑音音源をラグの周期で音源符号化長の長さ
だけ繰り返す処理や、パルス音源をやはりラグの周期で
繰り返し立てるというような場合である。拡張適応音源
は主に音声の立ち上がり等、適応音源が有効に機能しな
い区間で効果を出すことができるが、母音等の定常区間
において拡張適応音源が選択される場合もあり、そのよ
うな場合や、音源符号化区間長より短いピッチ周期ラグ
を持つような音声に対してその立上り区間で拡張適応音
源が選択された場合に、ピッチ周期ラグ算出器601に
より得られるピッチ周期ラグを算出し、ピッチ周期ラグ
を必要とするタイプの固定音源探索に用いることによ
り、より高品質な符号化を行うことができる。
【0024】
【発明の効果】本発明は、上記第1の実施の形態から明
らかなように、過去の駆動音源の特徴が保持されている
拡張適応音源符号帳を新たに設け、適応音源または拡張
適応音源のいずれかと固定音源との和で駆動音源を表現
し、適応音源探索および拡張適応音源探索の結果から、
いずれか聴感重み付き二乗誤差の小さい方の音源を選択
することにより、特に音声の立ち上がりや周囲騒音を含
む信号に対し、従来の適応音源のみではうまく表現でき
なかった音源をより正確に表現でき、より高い音声品質
を実現することができる。
【0025】また本発明は、上記第2の実施の形態から
明らかなように、過去の駆動音源の特徴が保持されてい
る拡張適応音源符号帳を新たに設け、適応音源または拡
張適応音源のいずれかと固定音源との和で駆動音源を表
現し、適応音源および拡張適応音源いずれか最適な音源
を選択できるようにし、更に適応音源と拡張適応音源の
選択法として、適応音源探索および拡張適応音源探索各
々に対して固定音源探索を行った結果に対して聴感重み
付き二乗誤差の小さい方の音源を選択することにより、
特に音声の立ち上がりや周囲騒音を含む信号に対し、従
来の適応音源のみではうまく表現できなかった音源をよ
り正確に表現でき、より高い音声品質を実現することが
できる。
【0026】また本発明は、上記第3の実施の形態から
明らかなように、ピッチ分析器により得られるピッチ周
期性度合いを表す値を、適応音源/拡張適応音源選択器
における適応音源と拡張適応音源の選択時に参照し、ピ
ッチ周期性度合いがあるしきい値以上に高い場合に、適
応音源を無条件で選択することにより、音声の母音定常
区間等のピッチ周期性度合いが高い区間に拡張適応音源
が選択された場合に生じうる劣化を防ぐことができる。
【0027】また本発明は、上記第4の実施の形態から
明らかなように、適応音源の出力ラグ値、拡張適応音源
信号、過去の駆動音源信号を入力とし、拡張適応音源が
選択された場合を含めて、当該区間におけるピッチ周期
ラグ値を固定音源へ出力するピッチ周期ラグ算出器を備
えることにより、拡張適応音源選択時にも、固定音源探
索時にピッチ周期情報を用いる方法を適用することがで
き、より音声品質の向上を図ることができるという効果
を有する。
【図面の簡単な説明】
【図1】本発明の実施の形態1、2における音声符号化
装置の符号化側のブロック図
【図2】本発明の実施の形態1における音源符号化部の
動作手順を示すフロー図
【図3】本発明の実施の形態1、2における音声符号化
装置の復号側のブロック図
【図4】本発明の実施の形態2における音源符号化部の
動作手順を示すフロー図
【図5】本発明の実施の形態3における音声符号化装置
の符号化側のブロック図
【図6】本発明の実施の形態4における音声符号化装置
の符号化側のブロック図
【図7】従来の音声符号化装置のブロック図
【符号の説明】 101 LPC分析・量子化器 102 聴感重み付けフィルタ 103 拡張適応音源符号帳 104 ゲイン乗算器 105 適応音源符号帳 106 ゲイン乗算器 107 適応音源/拡張適応音源選択器 108 固定音源符号帳 109 ゲイン乗算器 110 加算器 111 聴感重み付きLPC合成フィルタ 112 減算器 113 二乗誤差最小化器 114 拡張適応音源符号帳更新器 115 多重化器 151 分離器 152 拡張適応音源符号帳 153 ゲイン乗算器 154 適応音源符号帳 155 ゲイン乗算器 156 適応音源/拡張適応音源選択器 157 固定音源符号帳 158 ゲイン乗算器 159 加算器 160 LPC復号器 161 LPC合成フィルタ 501 ピッチ分析器 601 ピッチ周期ラグ算出器 901 LPC分析・量子化器 902 聴感重み付けフィルタ 903 適応音源符号帳 904 ゲイン乗算器 905 固定音源符号帳 906 ゲイン乗算器 907 加算器 908 聴感重み付きLPC合成フィルタ 909 減算器 910 二乗誤差最小化器 911 多重化器

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 一定区間毎の音源信号の符号化に用いる
    音源符号帳として、過去の符号化駆動音源を用いて更新
    することにより得られる拡張適応音源符号帳を少なくと
    も備えた音声符号化装置。
  2. 【請求項2】 CELP(Code Excited Linear Predict
    ion)型音声符号化装置であって、その音源符号帳の一つ
    として請求項1記載の拡張適応音源符号帳を備えた音声
    符号化装置。
  3. 【請求項3】 拡張適応音源符号帳が符号化音源ベクト
    ル長以上のサイズを有する一つ以上の符号帳ベクトルか
    らなり、その拡張適応音源符号帳の更新が、拡張適応音
    源符号帳内で過去の駆動音源ベクトルと類似な区間を探
    索により決定し、その区間にその駆動音源ベクトルを加
    重加算する請求項1または2記載の音声符号化装置。
  4. 【請求項4】 CELP型音声符号化の音源符号帳とし
    て、過去の駆動音源を順次蓄える適応音源符号帳と、過
    去の符号化駆動音源を用いて更新することにより得られ
    る拡張適応音源符号帳またはその拡張適応音源符号帳が
    符号化音源ベクトル長以上のサイズを有する一つ以上の
    符号帳ベクトルからなり、その拡張適応音源符号帳の更
    新が、拡張適応音源符号帳内で過去の駆動音源ベクトル
    と類似な区間を探索により決定し、その区間にその駆動
    音源ベクトルを加重加算する拡張適応音源符号帳と、固
    定の音源符号ベクトルを蓄えた固定符号帳とを備え、さ
    らに、前記拡張適応音源符号帳を過去の駆動音源により
    更新する拡張適応音源符号帳更新器と、前記適応音源符
    号帳と拡張適応音源符号帳の出力のいずれかを選択する
    適応音源/拡張適応音源選択器とを備え、適応音源また
    は拡張適応音源のいずれかと固定音源との和で音源の符
    号化を行う音声符号化装置。
  5. 【請求項5】 適応音源/拡張適応音源選択器が、適応
    音源探索および拡張適応音源探索の結果により、いずれ
    か聴感重み付け二乗誤差の小さい方の音源を選択する請
    求項4記載の音声符号化装置。
  6. 【請求項6】 適応音源/拡張適応音源選択器が、適応
    音源探索、拡張適応音源探索およびそれらにより得られ
    た音源各々に対する固定音源探索の結果により、いずれ
    か聴覚重み付け二乗誤差の小さい方の音源を選択する請
    求項4記載の音声符号化装置。
  7. 【請求項7】 入力音声または聴感重み付け入力音声に
    対してピッチ分析を行い、ピッチ予測ゲイン等のピッチ
    周期性度合いを表す値を出力するピッチ分析器を備え、
    前記、適応音源/拡張適応音源選択器における適応音源
    と拡張適応音源の選択時に前記ピッチ周期性度合いの値
    を参照し、ピッチ周期性度合いがあるしきい値以上に高
    い場合に、適応音源が無条件で選択される請求項5また
    は6記載の音声符号化装置。
  8. 【請求項8】 適応音源の出力ラグ値、拡張適応音源信
    号、過去の駆動音源信号を入力とし、拡張適応音源が選
    択された場合を含めて、当該区間におけるピッチ周期ラ
    グ値を算出し、固定音源符号帳へ出力するピッチ周期ラ
    グ算出器を備えた請求項5または6記載の音声符号化装
    置。
  9. 【請求項9】 請求項1から8のいずれかに記載の音声
    符号化装置をソフトウェアで実現するためのプログラム
    を記録した磁気ディスク、光磁気ディスクまたはROM
    カートリッジ等の記録媒体。
JP25858596A 1996-09-30 1996-09-30 音声符号化装置 Expired - Lifetime JP3874851B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25858596A JP3874851B2 (ja) 1996-09-30 1996-09-30 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25858596A JP3874851B2 (ja) 1996-09-30 1996-09-30 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH10105197A true JPH10105197A (ja) 1998-04-24
JP3874851B2 JP3874851B2 (ja) 2007-01-31

Family

ID=17322309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25858596A Expired - Lifetime JP3874851B2 (ja) 1996-09-30 1996-09-30 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3874851B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003001709A1 (en) * 2001-06-26 2003-01-03 Sony Corporation Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
WO2003001709A1 (en) * 2001-06-26 2003-01-03 Sony Corporation Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus
US7366660B2 (en) 2001-06-26 2008-04-29 Sony Corporation Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus

Also Published As

Publication number Publication date
JP3874851B2 (ja) 2007-01-31

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
KR100566713B1 (ko) 음향 파라미터 부호화, 복호화 방법, 장치 및 프로그램, 음성 부호화, 복호화 방법, 장치 및 프로그램
EP0926660B1 (en) Speech encoding/decoding method
JP3357795B2 (ja) 音声符号化方法および装置
JPH08272395A (ja) 音声符号化装置
US6768978B2 (en) Speech coding/decoding method and apparatus
JP3275247B2 (ja) 音声符号化・復号化方法
JP3148778B2 (ja) 音声の符号化方法
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3268750B2 (ja) 音声合成方法及びシステム
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPH08292797A (ja) 音声符号化装置
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP3874851B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3232701B2 (ja) 音声符号化方法
JPH11259098A (ja) 音声符号化/復号化方法
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3024467B2 (ja) 音声符号化装置
JP3232728B2 (ja) 音声符号化方法
JP3099836B2 (ja) 音声の励振周期符号化方法
JP3479495B2 (ja) 音響信号符号化方法、その装置、音響信号復号化方法、その装置及びそれらのプログラム記録媒体
JPH08185198A (ja) 符号励振線形予測音声符号化方法及びその復号化方法
JPH0612097A (ja) 音声の予測符号化方法および装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061025

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131102

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term