JPH10105196A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH10105196A
JPH10105196A JP8254882A JP25488296A JPH10105196A JP H10105196 A JPH10105196 A JP H10105196A JP 8254882 A JP8254882 A JP 8254882A JP 25488296 A JP25488296 A JP 25488296A JP H10105196 A JPH10105196 A JP H10105196A
Authority
JP
Japan
Prior art keywords
path
frame
delay
pitch
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8254882A
Other languages
English (en)
Inventor
Keiichi Funaki
慶一 舟木
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8254882A priority Critical patent/JPH10105196A/ja
Publication of JPH10105196A publication Critical patent/JPH10105196A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 8〜4kb/s程度の音声符号化方式におい
て、長期予測におけるピッチ推定の効率を上げ、定クロ
ックでも良好な符号化音を実現する。 【解決手段】 前フレームの最終サブフレームで決定さ
れた遅延を基準にして、先頭サブフレームから最終サブ
フレームに向かってパス推定を行い、そのパス(フレー
ム間パス)が求まり易いように評価尺度に重みを掛け、
フレーム間パスで求めたパスより評価尺度が小さい場
合、フレーム間パスを選択する。

Description

【発明の詳細な説明】
【発明の属する技術分野】本発明は、音声信号を低いビ
ットレート、特に8〜4kb/s程度で高品質に符号化
するためのCELP方式による音声符号化方式に関し、
特に、長期予測部の予測精度向上に関する。
【0001】
【従来の技術】近年、無線を媒介にした自動車電話やコ
ードレス電話のディジタル化が急がれている。無線では
使用できる周波数帯域が少ないため、音声信号を低ビッ
トレートで符号化する方式の開発は重要である。音声信
号を8〜4kb/s程度の低いビットレートで符号化す
る方式として、例えば、アメリカのアタルらによるアイ
キャスプ プロシーディング記載のコードエキサイテッ
ド リニア プレディクション:ハイクオリティ スピ
ーチ アト ロウビットレーツ(M.Schroede
r and B.S.Atal,“Code−exci
ted linear prediction:Hig
h quality speech atlow bi
t rates,”ICASSP Proc.,pp.
937−940,1985.)と題した論文(以後文献
1と呼ぶ)等に記載されているCELP(Code E
xcited Linear Prediction)
が知られている。
【0002】図9を用いて、CELP方式による、送信
側の符号化処理を説明する。先ずフレーム毎(例えば2
0ms)に音声信号から音声の周波数特性を表す短期予
測符号を抽出する(短期予測)。
【0003】次にフレームをさらに小区間のサブフレー
ム(例えば5ms)に分割する。サブフレーム毎に、
(あらかじめ用意された)音声のピッチ相関を表す遅延
符号の組と過去の音源信号からなる適応コードブックと
を用いて、最適な遅延符号を次の(1)〜(3)の手順
で決定する(長期予測)。
【0004】(1)遅延符号をあらかじめ用意された分
変化(試行)させ、音声のピッチに相当する各遅延符号
に対する遅延値だけ、過去の音源信号を遅延させること
により適応コードベクトルを抽出する。
【0005】(2)抽出された適応コードベクトルを用
いて合成信号を生成し音声信号との誤差電力(評価尺
度)を算出する。
【0006】(3)算出された距離が最小になる最適遅
延符号と、最適遅延符号に対応する適応コードベクトル
とそのゲインを決定する(適応コードブック探索)。
【0007】次に、あらかじめ用意された種類の音源の
量子化符号である雑音信号(音源コードブック)から抽
出した音源コードベクトルによる合成信号と、長期予測
して求められた残差信号との距離が最小になる音源コー
ドベクトルとゲインを決定する(音源探索)。決定され
た適応コードベクトルならびに音源コードベクトルの種
類を表すインデックスと各々の音源信号のゲインならび
にスペクトルパラメータの種類を表すインデックスを伝
送する。
【0008】具体的な適応コードベクトルの遅延符号の
探索法は次の手順で行われる。
【0009】先ず、入力された音声信号x[n] に対し聴
感上の重み付け、過去の影響信号の減算を行った信号z
[n] を算出する。次に、短期予測で求められた、量子
化、逆量子化されたスペクトルパラメータで構成される
合成フィルタHを遅延符号dに対応する適応コードベク
トルed [n] で駆動して合成信号H・ed [n] を算出す
る。そして、z[n] とH・ed [n] の誤差電力(評価尺
度)である、第(1)式のEd が最小になる遅延符号d
を求める。
【0010】
【数1】 ここで、Ns はサブフレーム長を、Hは合成フィルタを
実現する行列を、gdは適応コードベクトルed のゲイ
ンを表す。実際には式(1)は、次式のように展開され
る。
【0011】
【数2】 第(2)式の分子Cd は相互相関、分母Gd は自己相関
であり、次式で算出できる。
【0012】
【数3】 ここで、ed [n] は、過去のフレームにおける符号化処
理により求められた音源信号を遅延符号dに相当する遅
延値分遅らせたベクトルである。以上の処理を適応コー
ドブック探索と呼ぶ。
【0013】第(2)式で記述される適応コードブック
探索は、各々のサブフレーム内で最適化されたものであ
るため、複数のサブフレームにわたる遅延値の変化、す
なわち、ピッチパスは必ずしもスムーズにはならず、度
々、大きなギャップが生じる。ピッチパスにおけるギャ
ップは符号化音において不連続音や波形の揺らぎを引き
起こし、音質劣化の原因になっている。そこで、各サブ
フレーム毎に音声信号そのものの整合であるオープンル
ープ処理で遅延符号の候補を求め、フレーム全体で遅延
値(ピッチ)が滑らかに変化するようにピッチパスを求
める方法が提案されている。これは、例えば、アメリカ
のガーソンらによる、アイトリプルイージャーナル記載
のテクニックズ フォー インプルービング ザ パフ
ォーマンス オブ セルプタイプ スピーチ コーダー
ズ(I.A.Gerson and M.A.Jasi
uk,“Techniques for Improv
ing the Performance of CE
LP−Type Speech Coders,”IE
EE Journal on SelectedAre
as)(以下、文献2とする。)に示されている。
【0014】この方法を、図10を用いて説明する。先
ず、全サブフレームの全遅延dに対し、遅延音声ベクト
ルxd を生成する。各遅延音声ベクトルxd に対し、各
サブフレームの音声信号xを用いて、相互相関値<x,
xd >と自己相関値<xd ,xd >を算出する。ここ
で、<a,b>はベクトルaとベクトルbの内積を表
す。算出された相関値を用いて、音声信号と遅延音声ベ
クトルとの誤差エネルギを表す評価尺度E=<x,xd
>2 /<xd ,xd >を算出し、最適な値(最大値)を
取る遅延を持つサブフレームを基準サブフレームiopt
にする(基準サブフレーム決定回路:300)。
【0015】次に、基準サブフレームにおいて、M個
(Mは例えば5)の遅延の候補(L0,L1,L2,L
3,L4)をE=<x,xd >2 /<xd ,xd >を基
準に求める(基準フレーム遅延候補決定回路:31
0)。
【0016】そして、求められたM個の各遅延候補に対
し、次の(1),(2)の手順でフレーム内のピッチパ
スをM本求める(パス推定回路:320)。
【0017】(1)iopt +k+1サブフレームで、i
opt +kサブフレームの各候補の近傍の遅延の中から評
価尺度Eが最適になる遅延を、k=0からiopt +k+
1サブフレームが最初のサブフレームになるまで繰り返
すことで求める。
【0018】(2)iopt −k−1サブフレームで、i
opt −kサブフレームの各候補の近傍の遅延の中から評
価尺度Eが最適になる遅延を、k=0からiopt −k−
1サブフレームが最初のサブフレームになるまで繰り返
すことで求める。
【0019】次に、M本の各ピッチパスにおいて全サブ
フレームの評価尺度Eの合計(D0,D1,D2,D
3,D4)が最適になるピッチパスを最適ピッチパスと
して決定する(最適パス決定回路:330−1)。
【0020】最後に、各サブフレームにおいて、最適ピ
ッチパスの前後の遅延に対し、従来の適応コードブック
探索を行い、各サブフレームで最適遅延符号を求める
(適応コードブック探索回路:340)。
【0021】この方法により、推定される遅延符号で表
される遅延値すなわちピッチの変化がフレーム内で滑ら
かになるため音質が向上する。
【0022】
【発明が解決しようとする課題】文献2で述べられてい
るピッチパス推定は、あくまでもフレーム内でピッチが
スムーズに変化するような推定である。したがって、隣
接フレーム間で遅延の不連続(ギャップ)が生じること
もあり、音質劣化の原因になっている。本発明の目的
は、長期予測において、フレーム間で滑らかなピッチパ
スを高精度に推定し、より良好な音質を得ることにあ
る。
【0023】
【課題を解決するための手段】本発明における音声符号
化装置は、音声信号の一定区間を表すフレーム内でフレ
ームを分割した複数のサブフレームにおいてピッチ相関
が最も高い基準サブフレームを求める基準サブフレーム
決定部と、基準サブフレームにおいてピッチ相関を表す
遅延符号の複数の候補を求める基準サブフレーム遅延候
補決定部と、複数の候補の中から1つ過去のフレームで
決定された遅延符号に比べてあらかじめ定められた値以
上の変化を有する遅延符号の候補を除外する遅延候補除
外部と、除外されなかった候補をもとに遅延符号がサブ
フレーム間であらかじめ定められた値以上変化しないよ
うにしてフレーム全体にわたる少なくとも1つのピッチ
パスを推定し評価尺度を算出するパス推定部と、ピッチ
パスから評価尺度を用いて最適なピッチパスを決定する
最適パス決定部とを備えることを特徴とする。
【0024】さらに本発明は、上記の構成の内基準サブ
フレーム決定部および基準サブフレーム遅延候補決定部
以外の構成を、夫々以下に示す組合せとすることを特徴
とする。
【0025】複数の候補をもとに遅延符号がサブフレー
ム間であらかじめ定められた値以上変化しないようにし
てフレーム全体にわたる少なくとも1つのピッチパスを
推定し評価尺度を算出し、1つ過去のフレームで決定さ
れた遅延符号に応じて評価尺度に重みをかける重み付け
パス推定部と、ピッチパスから評価尺度を用いて最適な
ピッチパスを決定する最適パス決定部。
【0026】複数の候補の中から1つ過去のフレームで
決定された遅延符号に比べてあらかじめ定められた値以
上の変化を有する遅延符号の候補を除外する遅延候補除
外部と、除外されなかった候補をもとに遅延符号がサブ
フレーム間であらかじめ定められた値以上変化しないよ
うにしてフレーム全体にわたる少なくとも1つのピッチ
パスを推定し評価尺度を算出し、1つ過去のフレームで
決定された遅延符号に応じて評価尺度に重みをかける重
み付けパス推定部と、ピッチパスから評価尺度を用いて
最適なピッチパスを決定する最適パス決定部。
【0027】複数の候補をもとに遅延符号がサブフレー
ム間であらかじめ定められた値以上変化しないようにし
てフレーム全体にわたる少なくとも1つのピッチパスを
推定し評価尺度を算出するパス推定部と、1つ過去のフ
レームで決定された遅延符号を基準にして遅延符号がサ
ブフレーム間であらかじめ定められた値以上変化しない
ようにしてフレーム全体にわたる1つのピッチパスを推
定し評価尺度を算出するフレーム間パス推定部と、パス
推定部とフレーム間パス推定部で求められたピッチパス
から評価尺度を用いて最適なピッチパスを決定する最適
パス決定部。
【0028】複数の候補の中から1つ過去のフレームで
決定された遅延符号に比べてあらかじめ定められた値以
上の変化を有する遅延符号の候補を除外する遅延候補除
外部と、除外されなかった候補をもとに遅延符号がサブ
フレーム間であらかじめ定められた値以上変化しないよ
うにしてフレーム全体にわたる少なくとも1つのピッチ
パスを推定し評価尺度を算出するパス推定部と、1つ過
去のフレームで決定された遅延符号を基準にして遅延符
号がサブフレーム間であらかじめ定められた値以上変化
しないようにしてフレーム全体にわたる1つのピッチパ
スを推定し評価尺度を算出するフレーム間パス推定部
と、パス推定部とフレーム間パス推定部で求められたピ
ッチパスから評価尺度を用いて最適なピッチパスを決定
する最適パス決定部。
【0029】複数の候補をもとに遅延符号がサブフレー
ム間であらかじめ定められた値以上変化しないようにし
てフレーム全体にわたる少なくとも1つのピッチパスを
推定し評価尺度を算出し、1つ過去のフレームで決定さ
れた遅延符号に応じて評価尺度に重みをかける重み付け
パス推定部と、1つ過去のフレームで決定された遅延符
号を基準にして遅延符号がサブフレーム間であらかじめ
定められた値以上変化しないようにしてフレーム全体に
わたる1つのピッチパスを推定し評価尺度を算出するフ
レーム間パス推定部と、パス推定部とフレーム間パス推
定部で求められたピッチパスから評価尺度を用いて最適
なピッチパスを決定する最適パス決定部。
【0030】複数の候補の中から1つ過去のフレームで
決定された遅延符号に比べてあらかじめ定められた値以
上の変化を有する遅延符号の候補を除外する遅延候補除
外部と、除外されなかった候補をもとに遅延符号がサブ
フレーム間であらかじめ定められた値以上変化しないよ
うにしてフレーム全体にわたる少なくとも1つのピッチ
パスを推定し評価尺度を算出し、1つ過去のフレームで
決定された遅延符号に応じて評価尺度に重みをかける重
み付けパス推定部と、1つ過去のフレームで決定された
遅延符号を基準にして遅延符号がサブフレーム間であら
かじめ定められた値以上変化しないようにしてフレーム
全体にわたる1つのピッチパスを推定し評価尺度を算出
するフレーム間パス推定部と、パス推定部とフレーム間
パス推定部で求められたピッチパスから評価尺度を用い
て最適なピッチパスを決定する最適パス決定部。
【0031】以上の構成により、本発明は長期予測にお
けるピッチパス推定を、従来のフレーム内だけでなく前
フレームの遅延を用いて決定する。この決定法として、
以下の基準を用いる。
【0032】(1)前フレームの代表となる遅延より、
現在の遅延が数倍長ければ、パス候補から除外する。
【0033】(2)前フレームの代表となる遅延より、
現在の遅延が数倍長ければ、評価尺度に1以下の重みを
かける。
【0034】(3)前フレームの代表となる遅延を用い
て、最初のサブフレームから最終のサブフレームに向か
ってパス推定を行い、そのパスに対し1以上の重みをか
ける。
【0035】これらおよびその組合せにより、従来のフ
レーム内のみで行うピッチ推定に比べ、倍ピッチ等の誤
りの少ないピッチパスの推定を実現する。
【0036】
【発明の実施の形態】
〔第1の実施の形態〕図1、図2は第1の実施の形態を
表す構成図である。
【0037】図1の(a)は符号化処理、(b)は復号
化処理を表す。
【0038】各構成モジュールを以下に示す。
【0039】音声入力端子である入力端子100、音声
信号を記憶するバッファ110、音声のスペクトルパラ
メータであるLPC係数を抽出する音声分析回路12
0、LPC係数を量子化するパラメータ量子化回路13
0、音声信号に対し聴感重み付けを行う重み付け回路1
40、適応コードベクトルが蓄えられている適応コード
ブック150、ピッチ相関を表す遅延符号(適応コード
ベクトル)を探索する長期予測回路160−2、音源コ
ードベクトルが蓄えられた音源コードブック170、音
源コードベクトル探索を行う音源探索回路180、適応
コードベクトルと音源コードベクトルのゲイン項を表す
パラメータが蓄積されているゲインコードブック19
0、適応コードベクトルと音源コードベクトルの量子化
ゲインをゲインコードブックから決定するゲイン探索回
路200、符号系列を組み合わせて出力するマルチプレ
クサ210、符号化されたコードを符号系列にデコード
するデマルチプレクサ220、生成された音源と音声合
成フィルタより音声信号を再生する合成フィルタ23
0、音声出力端子である出力端子240。
【0040】図2は、図1の長期予測回路160−2の
部分を詳細に表す第1の実施の形態の構成図である。
【0041】以下、図2の各構成モジュールを説明す
る。
【0042】基準サブフレーム決定回路300は、フレ
ーム内の全サブフレームで、一定区間の遅延d(例えば
16から96)に対する自己相関Gd と相互相関Cd を
算出し、全ての遅延dの中から評価尺度E=Cd 2 /G
d が最も大きくなる、最適な遅延dが存在するサブフレ
ームを基準サブフレームiopt として決定する回路であ
る。基準サブフレーム遅延候補決定回路310は、30
0で決定された基準サブフレームにおいて、M個(例え
ばMは5)の遅延の候補(L0,L1,L2,L3,L
4)を評価尺度Eが大きく、かつ互いに一定値以上離れ
るように決定する回路である。遅延候補除外回路350
は、310で求められた遅延候補(L0,L1,L2,
L3,L4)が、前フレームの最終のサブフレームで求
められた遅延よりN倍(Nは例えば2.0)以上の時、
その遅延を候補から除外する回路である。パス推定回路
320は、基準サブフレームの遅延候補に対し、従来の
方法でピッチが滑らかに変化するピッチパスを推定し、
各パスの評価尺度の合計(全サブフレームのEの総和)
を算出する回路である。最適パス決定回路330−1
は、320で推定された各パスの中から評価尺度が最適
になるパスを最適パスとして決定する回路である。適応
コードブック探索回路340は、各サブフレーム毎に最
適パスの前後の遅延に対し、適応コードブック探索を行
う回路である。
【0043】第1の実施の形態の処理の流れを図1を用
いて説明する。まず(a)の符号化処理では、入力ポー
ト100より、音声信号が入力されバッファ110に保
存される。バッファ110に蓄えられた一定区間の音声
信号を用いて音声分析回路120で短期予測分析され、
音声信号のスペクトル特性を表すLPC係数を算出す
る。LPC分析により求められたスペクトルパラメータ
はパラメータ量子化回路130で量子化され、LPC係
数の量子化符号がマルチプレクサ210に送られると共
に、逆量子化され以後の符号化処理に用いられる。
【0044】バッファ110に蓄えられた音声信号は量
子化/逆量子化されたLPC係数を用いて重み付け回路
140で聴感上の重み付けがされ、以降のコードブック
探索に用いられる。
【0045】次に、適応コードブック150、音源コー
ドブック170、ゲインコードブック190を用いてコ
ードブック探索が行われる。まず、最初に長期予測回路
160−2で長期予測を行い、ピッチ相関を表す最適遅
延符号を決定し、その符号(遅延符号)をマルチプレク
サ210に転送するとともに適応コードベクトルの生成
を行う。次に、求められた適応コードベクトルの影響を
減算後、音源探索回路180で音源コードブック探索を
行い、音源の量子化符号を決定し音源コードベクトルを
生成すると共に、その符号をマルチプレクサ210に転
送する。適応コードベクトルと音源コードベクトルが求
められた後、ゲインコードブック探索回路200で2つ
の音源のゲインを算出し、その符号をマルチプレクサ2
10に転送する。マルチプレクサ210では、各コード
を組み合わせて伝送コードに変換して出力する。
【0046】(b)の復号化処理では、デマルチプレク
サで、入力された伝送符号を各符号に分解する。LPC
係数を表す符号よりフィルタ係数をデコードし、合成フ
ィルタ230に転送する。そして、遅延符号より適応コ
ードブック150を用いて適応コードベクトルを生成
し、音源の量子化符号より音源コードブック170を用
いて音源コードベクトルを生成する。さらに、ゲインコ
ードより適応コードベクトルと音源コードベクトルのゲ
インを算出し、各音源にゲイン項を掛け合わせて合成フ
ィルタの入力信号を生成する。最後に入力信号を用いて
合成フィルタ230で音声信号の合成を行う。
【0047】次に第1の実施の形態における長期予測部
を、図2を用いて説明する。図2は、図1の160−2
の長期予測回路の処理を詳細に記述している。
【0048】まず、基準サブフレーム決定回路300
で、フレーム内の全サブフレームにおける、遅延d(例
えば16から96)の自己相関Gd と相互相関Cd を求
め、評価尺度E=Cd 2 /Gd を最大にする遅延を持つ
サブフレームを基準サブフレームiopt とする。次に、
基準サブフレーム遅延候補決定回路310で、基準サブ
フレームiopt におけるM個(例えばM=5)の遅延d
の候補(L0,L1,L2,L3,L4)を評価尺度E
の値が大きい順に、互いに一定値以上離れるよう(|L
j−Lk|>F、j,k=0,1,…,M−1、j≠
k、Fは例えば16)に求める、次に、遅延候補除外回
路350で、求められたM個の遅延(L0,L1,L
2,L3,L4)が前フレームの最終のサブフレームの
遅延Lpre のN倍(例えばN=2)より大きい場合(L
k>N・Lpre 、k=0,1,…,M−1)、候補から
除外する。ここでは、L2を除外する。パス推定回路3
20では、遅延候補L0,L1,L3,L4に対してピ
ッチパス推定を文献2に示される従来の方法で行い、各
候補に対する評価尺度の合計D0,D1,D3,D4を
算出し最適パス決定回路330−1で、評価尺度の合計
D0,D1,D3,D4を最大にする最適パスを決定す
る。そして、適応コードブック探索回路340で、各サ
ブフレーム毎に最適パスの前後の遅延に対して従来の適
応コードブック探索を行い、最適遅延を求める。 〔第2の実施の形態〕次に、第2の実施の形態を図3を
用いて説明する。図3は、図1の長期予測回路160−
2の部分であり、その他の部分は第1の実施の形態と同
じである。
【0049】図3において、重み付けパス推定回路36
0は、前フレームの最終のサブフレームの遅延Lpre の
隣接度に応じて、評価尺度の合計に1以下の重みを掛け
ることにより、前フレームの遅延より大きく異なる遅延
を求めにくくする回路である。また、最適パス決定回路
330−2は、360で推定された各パスの中から評価
尺度が最適になるパスを最適パスとして決定する回路で
ある。
【0050】第2の実施の形態の処理の流れを説明す
る。まず、基準サブフレーム決定回路300で、フレー
ム内の全サブフレームにおける、遅延d(例えば16か
ら96)の自己相関Gd と相互相関Cd を求め、評価尺
度E=Cd 2 /Gd を最大にする遅延を持つサブフレー
ムを基準サブフレームiopt とする。次に、基準サブフ
レーム遅延候補決定回路310で、基準サブフレームi
opt におけるM個(例えばM=5)の遅延の候補を評価
尺度が大きい順に、互いに一定値以上離れるよう(|L
j−Lk|>F、j,k=0,1,…,M−1、j≠
k、Fは例えば16)に求める。次に、重み付けパス推
定回路360で、遅延候補L0,L1,L2,L3,L
4に対して、ピッチパス推定を文献2に示される従来の
方法で行い、各候補に対する評価尺度の合計D0,D
1,D2,D3,D4を算出する。ここで、遅延候補L
0,L1,L2,L3,L4が前フレームの最終のサブ
フレームの遅延Lpre よりP倍(例えばP=1.8)以
上の時(Lk>P・Lpre 、k=0,1,…,M−
1)、その評価尺度の合計に1以下の重み(例えば0.
8倍)を掛け、選ばれにくくする。そして、最適パス決
定回路330−2で、評価尺度の合計D0,D1,D
2,D3,D4を最大にする最適パスを決定し、適応コ
ードブック探索回路340で、各サブフレーム毎に最適
パスの前後の遅延に対して従来の適応コードブック探索
を行い、最適遅延を求める。 〔第3の実施の形態〕次に、第3の実施の形態を図4を
用いて説明する。図4は、図1の長期予測回路160−
2の部分であり、その他の部分は第1の実施の形態と同
じである。
【0051】図4において、重み付けパス推定回路36
0は、前フレームの最終のサブフレームの遅延Lpre の
隣接度に応じて、評価尺度の合計に1以下の重みを掛け
ることにより、前フレームの遅延より大きく異なる遅延
を求めにくくする回路である。また、最適パス決定回路
330−2は、360で推定された各パスの中から評価
尺度が最適になるパスを最適パスとして決定する回路で
ある。
【0052】第3の実施の形態の処理の流れを説明す
る。まず、基準サブフレーム決定回路300で、フレー
ム内の全サブフレームにおける、遅延d(例えば16か
ら96)の自己相関Gd と相互相関Cd を求め、評価尺
度E=Cd 2 /Gd を最大にする遅延を持つサブフレー
ムを基準サブフレームiopt とする。次に、基準サブフ
レーム遅延候補決定回路310で、基準サブフレームi
opt におけるM個(例えばM=5)の遅延の候補(L
0,L1,L2,L3,L4)を評価尺度が大きい順
に、互いに一定値以上離れるよう(|Lj−Lk|>
F、j,k=0,1,…,M−1、j≠k、Fは例えば
16)に求める。次に、遅延候補除外回路350で、求
められたM個の遅延(L0,L1,L2,L3,L4)
が前フレームの最終のサブフレームの遅延Lpre のN倍
(例えばN=2)より大きい場合(Lk>N・Lpre 、
k=0,1,…,M−1)、候補から除外する。ここで
は、L2を除外する。重み付けパス推定回路360で
は、遅延候補L0,L1,L3,L4に対して、ピッチ
パス推定を文献2に示される従来の方法で行い、各候補
に対する評価尺度の合計D0,D1,D3,D4を算出
する。ここで、遅延候補が前フレームの最終のサブフレ
ームの遅延Lpre よりP倍(例えばP=1.8)以上の
時(Lk>P・Lpre 、k=0,1,…,M−1)、そ
の評価尺度の合計に1以下の重み(例えば0.8倍)を
掛け、選ばれにくくする。そして、最適パス決定回路3
30−2で、評価尺度の合計D0,D1,D3,D4を
用いて、最適パスを決定し、適応コードブック探索回路
340で、各サブフレーム毎に最適パスの前後の遅延に
対して従来の適応コードブック探索を行い、最適遅延を
求める。 〔第4の実施の形態〕次に、第4の実施の形態を図5を
用いて説明する。図5は、図1の長期予測回路160−
2の部分であり、その他の部分は第1の実施の形態と同
じである。
【0053】図5において、フレームパス推定回路37
0は、前フレームの最終のサブフレームの遅延Lpre に
対して、ピッチパスを最初のサブフレームから最終のサ
ブフレームまで推定し、1以上の重みを掛けた評価尺度
の合計(Eの全サブフレームの合計)を求める回路であ
る。また、最適パス決定回路330−3は、320と3
70で推定された各パスの中から評価尺度が最適になる
パスを最適パスとして決定する回路である。
【0054】第4の実施の形態の処理の流れを説明す
る。まず、基準サブフレーム決定回路300で、フレー
ム内の全サブフレームにおける、遅延d(例えば16か
ら96)の自己相関Gd と相互相関Cd を求め、評価尺
度E=Cd 2 /Gd を最大にする遅延を持つサブフレー
ムを基準サブフレームiopt とする。次に、基準サブフ
レーム遅延候補決定回路310で、基準サブフレームi
opt におけるM個(例えばM=5)の遅延の候補(L
0,L1,L2,L3,L4)を評価尺度が大きい順
に、互いに一定値以上離れるよう(|Lj−Lk|>
F、j,k=0,1,…,M−1、j≠k、Fは例えば
16)に求める。次に、パス推定回路320で、遅延候
補L0,L1,L2,L3,L4に対して、ピッチパス
推定を文献2に示される従来の方法で行い、各候補に対
する評価尺度の合計D0,D1,D2,D3,D4を算
出する。フレームパス推定回路370では、前フレーム
の最終のサブフレームの遅延Lpre を用いて、最初のサ
ブフレームから最終のサブフレームの順に文献2で示さ
れるピッチパス(フレーム間パス)の推定を行い、評価
尺度の合計(Eの全サブフレームの合計)D5を算出す
る。この場合、フレーム間パスが選択され易くするた
め、評価尺度の合計D5に1以上の重み(例えば1.2
倍)を掛ける。そして、最適パス決定回路330−3
で、評価尺度の合計D0,D1,D2,D3,D4,D
5を最大化する最適パスを決定し、適応コードブック探
索回路340で、各サブフレーム毎に最適パスの前後の
遅延に対して従来の適応コードブック探索を行い、最適
遅延を求める。 〔第5の実施の形態〕次に、第5の実施の形態を図6を
用いて説明する。図6は、図1の長期予測回路160−
2の部分であり、その他の部分は第1実施の形態と同じ
である。
【0055】図6において、フレームパス推定回路37
0は、前フレームの最終のサブフレームの遅延Lpre に
対して、パスを最初のサブフレームから最終のサブフレ
ームまで推定し、1以上の重みを掛けた評価尺度の合計
(Eの全サブフレームの合計)を求める回路である。ま
た、最適パス決定回路330−3は、320と370で
推定された各パスの中から評価尺度が最適になるパスを
最適パスとして決定する回路である。
【0056】第5の実施の形態の処理の流れを説明す
る。まず、基準サブフレーム決定回路300で、フレー
ム内の全サブフレームにおける、遅延d(例えば16か
ら96)の自己相関Gd と相互相関Cd を求め、評価尺
度E=Cd 2 /Gd を最大にする遅延を持つサブフレー
ムを基準サブフレームiopt とする。次に、基準サブフ
レーム遅延候補決定回路310で、基準サブフレームi
opt におけるM個(例えばM=5)の遅延の候補(L
0,L1,L2,L3,L4)を評価尺度が大きい順
に、互いに一定値以上離れるよう(|Lj−Lk|>
F、j,k=0,1,…,M−1、j≠k、Fは例えば
16)に求める。次に、遅延候補除外回路350で、求
められたM個の遅延(L0,L1,L2,L3,L4)
が前フレームの最終のサブフレームの遅延Lpre のN倍
(例えばN=2)より大きい場合(Lk>N・Lpre 、
k=0,1,…,M−1)、候補から除外する。ここで
は、L2を除外する。パス推定回路320では、遅延候
補L0,L1,L3,L4に対して、ピッチパス推定を
文献2に示される従来の方法で行い、各候補に対する評
価尺度の合計D0,D1,D3,D4を算出する。フレ
ームパス推定回路370では、前フレームの最終のサブ
フレームの遅延Lpre を用いて、最初のサブフレームか
ら最終のサブフレームの順に文献2に示されるピッチパ
ス(フレーム間パス)の推定を行い、評価尺度の合計
(Eの全サブフレームの合計)D5を算出する。この場
合、フレーム間パスが選択され易くするため、評価尺度
の合計D5に1以上の重み(例えば1.2倍)を掛け
る。そして、最適パス決定回路330−3で、評価尺度
の合計D0,D1,D3,D4,D5を最大化する最適
パスを決定し、適応コードブック探索回路340で、各
サブフレーム毎に最適パスの前後の遅延に対して従来の
適応コードブック探索を行い、最適遅延を求める。 〔第6の実施の形態〕次に、第6の実施の形態を図7を
用いて説明する。図7は、図1の長期予測回路160−
2の部分であり、その他の部分は第2の実施の形態と同
じである。
【0057】図7において、フレームパス推定回路37
0は、前フレームの最終のサブフレームの遅延Lpre に
対して、パスを最初のサブフレームから最終のサブフレ
ームまで推定し、1以上の重みを掛けた評価尺度の合計
(Eの全サブフレームの合計)を求める回路である。ま
た、最適パス決定回路330−4は、360と370で
推定された各パスの中から評価尺度が最適になるパスを
最適パスとして決定する回路である。
【0058】第6の実施の形態の処理の流れを説明す
る。まず、基準サブフレーム決定回路300で、フレー
ム内の全サブフレームにおける、遅延d(例えば16か
ら96)の自己相関Gd と相互相関Cd を求め、評価尺
度E=Cd 2 /Gd を最大にする遅延を持つサブフレー
ムを基準サブフレームiopt とする。次に、基準サブフ
レーム遅延候補決定回路310で、基準サブフレームi
opt におけるM個(例えばM=5)の遅延の候補(L
0,L1,L2,L3,L4)を評価尺度が大きい順
に、互いに一定値以上離れるよう(|Lj−Lk|>
F、j,k=0,1,…,M−1、j≠k、Fは例えば
16)に求める。次に、重み付けパス推定回路360
で、遅延候補L0,L1,L2,L3,L4に対して、
ピッチパス推定を文献2に示される従来の方法で行い、
各候補に対する評価尺度の合計D0,D1,D2,D
3,D4を算出する。ここで、遅延候補が前フレームの
最終サブフレームの遅延Lpre よりN倍(例えばN=
1.8)以上の時(Lk>N・Lpre 、k=0,1,
…,M−1)、その評価尺度の合計に1以下の重み(例
えば0.8倍)を掛け、選ばれにくくする。フレームパ
ス推定回路370では、前フレームの最終のサブフレー
ムの遅延Lpre を用いて、最初のサブフレームから最終
のサブフレームの順に文献2に示されるピッチパス(フ
レーム間パス)の推定を行い、評価尺度の合計(Eの全
サブフレームの合計)D5を算出する。この場合、フレ
ーム間パスが選択され易くするため、評価尺度の合計D
5に1以上の重み(例えば1.2倍)を掛ける。そし
て、最適パス決定回路330−4で、評価尺度の合計D
0,D1,D2,D3,D4を最大化する最適パスを決
定し、適応コードブック探索回路340で、各サブフレ
ーム毎に最適パスの前後の遅延に対して従来の適応コー
ドブック探索を行い、最適遅延を求める。 〔第7の実施の形態〕次に、第7の実施の形態を図8を
用いて説明する。図8は、図1の長期予測回路160−
2の部分であり、その他の部分は第3の実施の形態と同
じである。
【0059】図8において、フレームパス推定回路37
0は、前フレームの最終のサブフレームの遅延Lpre に
対して、パスを最初のサブフレームから最終のサブフレ
ームまで推定し、1以上の重みを掛けた評価尺度の合計
(Eの全サブフレームの合計)を求める回路である。ま
た、最適パス決定回路330−4は、360と370で
推定された各パスの中から評価尺度が最適になるパスを
最適パスとして決定する回路である。
【0060】第7の実施の形態の処理の流れを説明す
る。まず、基準サブフレーム決定回路300で、フレー
ム内の全サブフレームにおける、遅延d(例えば16か
ら96)の自己相関Gd と相互相関Cd を求め、評価尺
度E=Cd 2 /Gd を最大にする遅延を持つサブフレー
ムを基準サブフレームiopt とする。次に、基準サブフ
レーム遅延候補決定回路310で、基準サブフレームi
opt におけるM個(例えばM=5)の遅延の候補(L
0,L1,L2,L3,L4)を評価尺度が大きい順
に、互いに一定値以上離れるよう(|Lj−Lk|>
F、j,k=0,1,…,M−1、j≠k、Fは例えば
16)に求める。次に、遅延候補除外回路350で、求
められたM個の遅延(L0,L1,L2,L3,L4)
が前フレームの最終のサブフレームの遅延Lpre のN倍
(例えばN=2)より大きい場合(Lk>N・Lpre 、
k=0,1,…,M−1)、候補から除外する。ここで
は、L2を除外する。重み付けパス推定回路360で
は、遅延候補L0,L1,L3,L4に対して、ピッチ
パス推定を文献2に示される従来の方法で行い、各候補
に対する評価尺度の合計D0,D1,D3,D4を算出
する。ここで、遅延候補(L0,L1,L3,L4)が
前フレームの最終のサブフレームの遅延Lpre よりP倍
(例えばP=1.8)以上の時(Lk>P・Lpre 、k
=0,1,…,M−1)、その評価尺度の合計に1以下
の重み(例えば0.8倍)を掛け、選ばれにくくする。
フレームパス推定回路370では、前フレームの最終の
サブフレームの遅延Lpre を用いて、最初のサブフレー
ムから最終のサブフレームの順に文献2に示されるピッ
チパス(フレーム間パス)の推定を行い、評価尺度の合
計(Eの全サブフレームの合計)D5を算出する。この
場合、フレーム間パスが選択され易くするため、評価尺
度の合計D5に1以上の重み(例えば1.2倍)を掛け
る。そして、最適パス決定回路330−4で、評価尺度
の合計D0,D1,D3,D4,D5を最大化する最適
パスを決定する。適応コードブック探索回路340で、
各サブフレーム毎に最適パスの前後の遅延に対して従来
の適応コードブック探索を行い、最適遅延を求める。
【0061】なお、各形態では、距離に相互相関2 /自
己相関を用いたが、相互相関2 でも、誤差信号のエネル
ギでも同様の効果が得られる。自己相関、相互相関の算
出については、オープンループを用いていたが、クロー
ズドループによる方法を用いても同様の効果が得られ
る。フレーム間推定については、前フレームの最終サブ
フレームの遅延を用い行っていたが、前フレームのどの
サブフレームの遅延でも平均値でも同様の効果が得られ
る。また、基準サブフレームのM個の候補選択時に一定
値以上離して候補を求めているが、その制約をなくして
も同様の効果が得られる。適応コードブック探索につい
ては、ピッチパスをM個求めた後で1個に絞り、行って
いたが、M個のパスと適応コードブック探索のディレイ
ドディシジョンを行っても、同様の効果が得られる。最
適遅延符号については、1個に絞っているが、候補を複
数求めて、次のステップ(音源コードブック探索やゲイ
ンコードブック探索)で本選択を行ったり、以後のコー
ドブック探索で同時最適探索を行っても同様の効果が得
られる。音源探索には音源コードブック探索を用いた
が、マルチパルスや残差の波形符号化のような音源信号
の量子化法を用いても同様の効果が得られる。音源コー
ドブックについては具体的に規定していないが、雑音コ
ードブックでも、ベクトル量子化(VQ)アルゴリズム
により学習された学習コードブックでも同様の効果が得
られる。音声分析回路についてはLPC分析を用いて説
明を行ったが、スペクトルパラメータを抽出するBUR
G法等の他の分析法においても同様の効果が得られる。
また、実施の形態ではLPC係数を用いて説明したが、
PARCOR係数やLSP係数のような他のスペクトル
パラメータでも同様な効果が得られることは明白であ
る。音源コードブック探索回路については1段構成にし
たが、多段構成にしても同様の効果が得られることも明
白である。
【0062】
【発明の効果】本発明は、上述した構成により、従来の
フレーム内ピッチパス推定に、前フレームの遅延を用い
たフレーム間パス推定を導入するため、倍ピッチ等の誤
推定、すなわち、ピッチのギャップが少なくなり、符号
化音声の音質が向上する。
【図面の簡単な説明】
【図1】本発明の第1,2,3,4,5,6,7の実施
の形態の音声符号化処理全体の構成図である。
【図2】本発明の第1の実施の形態の構成図である。
【図3】本発明の第2の実施の形態の構成図である。
【図4】本発明の第3の実施の形態の構成図である。
【図5】本発明の第4の実施の形態の構成図である。
【図6】本発明の第5の実施の形態の構成図である。
【図7】本発明の第6の実施の形態の構成図である。
【図8】本発明の第7の実施の形態の構成図である。
【図9】従来の音声符号化処理全体の構成図である。
(a)は符号化処理を、(b)は復号化処理を表す。
【図10】長期予測の従来の発明の構成図である。
【符号の説明】
100 音声入力ポート 110 バッファ 120 音声分析回路 130 パラメータ量子化回路 140 重み付け回路 150 適応コードブック 160−1,160−2 長期予測回路 170 音源コードブック 180 音源探索回路 190 ゲインコードブック 200 ゲイン探索回路 210 マルチプレクサ 220 デマルチプレクサ 230 合成フィルタ 240 音声出力端子 300 基準サブフレーム決定回路 310 基準サブフレーム遅延候補決定回路 320 パス推定回路 330−1,330−2,330−3,330−4
最適パス決定回路 340 適応コードブック探索回路 350 遅延候補除外回路 360 重み付けパス推定回路 370 フレーム間パス推定回路

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声信号の一定区間を表すフレーム内で
    当該フレームを分割した複数のサブフレームにおいてピ
    ッチ相関が最も高い基準サブフレームを求める基準サブ
    フレーム決定部と、前記基準サブフレームにおいてピッ
    チ相関を表す遅延符号の複数の候補を求める基準サブフ
    レーム遅延候補決定部と、前記複数の候補の中から1つ
    過去のフレームで決定された遅延符号に比べあらかじめ
    定められた値以上の変化を有する遅延符号の候補を除外
    する遅延候補除外部と、除外されなかった候補をもとに
    前記遅延符号がサブフレーム間であらかじめ定められた
    値以上変化しないようにしてフレーム全体にわたる少な
    くとも1つのピッチパスを推定し評価尺度を算出するパ
    ス推定部と、前記ピッチパスから前記評価尺度を用いて
    最適なピッチパスを決定する最適パス決定部とを備える
    ことを特徴とする音声符号化装置。
  2. 【請求項2】 音声信号の一定区間を表すフレーム内で
    前記フレームを分割した複数のサブフレームにおいてピ
    ッチ相関が最も高い基準サブフレームを求める基準サブ
    フレーム決定部と、前記基準サブフレームにおいてピッ
    チ相関を表す遅延符号の複数の候補を求める基準サブフ
    レーム遅延候補決定部と、複数の候補をもとに前記遅延
    符号がサブフレーム間であらかじめ定められた値以上変
    化しないようにしてフレーム全体にわたる少なくとも1
    つのピッチパスを推定し評価尺度を算出し、1つ過去の
    フレームで決定された遅延符号に応じて前記評価尺度に
    重みをかける重み付けパス推定部と、前記ピッチパスか
    ら前記評価尺度を用いて最適なピッチパスを決定する最
    適パス決定部とを備えることを特徴とする音声符号化装
    置。
  3. 【請求項3】 音声信号の一定区間を表すフレーム内で
    前記フレームを分割した複数のサブフレームにおいてピ
    ッチ相関が最も高い基準サブフレームを求める基準サブ
    フレーム決定部と、前記基準サブフレームにおいてピッ
    チ相関を表す遅延符号の複数の候補を求める基準サブフ
    レーム遅延候補決定部と、前記複数の候補の中から1つ
    過去のフレームで決定された遅延符号に比べあらかじめ
    定められた値以上の変化を有する遅延符号の候補を除外
    する遅延候補除外部と、除外されなかった候補をもとに
    前記遅延符号がサブフレーム間であらかじめ定められた
    値以上変化しないようにしてフレーム全体にわたる少な
    くとも1つのピッチパスを推定し評価尺度を算出し、1
    つ過去のフレームで決定された遅延符号に応じて前記評
    価尺度に重みをかける重み付けパス推定部と、前記ピッ
    チパスから前記評価尺度を用いて最適なピッチパスを決
    定する最適パス決定部とを備えることを特徴とする音声
    符号化装置。
  4. 【請求項4】 音声信号の一定区間を表すフレーム内で
    前記フレームを分割した複数のサブフレームにおいてピ
    ッチ相関が最も高い基準サブフレームを求める基準サブ
    フレーム決定部と、前記基準サブフレームにおいてピッ
    チ相関を表す遅延符号の複数の候補を求める基準サブフ
    レーム遅延候補決定部と、複数の候補をもとに前記遅延
    符号がサブフレーム間であらかじめ定められた値以上変
    化しないようにしてフレーム全体にわたる少なくとも1
    つのピッチパスを推定し評価尺度を算出するパス推定部
    と、1つ過去のフレームで決定された遅延符号を基準に
    して前記遅延符号がサブフレーム間であらかじめ定めら
    れた値以上変化しないようにしてフレーム全体にわたる
    1つのピッチパスを推定し評価尺度を算出するフレーム
    間パス推定部と、前記パス推定部と前記フレーム間パス
    推定部で求められたピッチパスから前記評価尺度を用い
    て最適なピッチパスを決定する最適パス決定部とを備え
    ることを特徴とする音声符号化装置。
  5. 【請求項5】 1つ過去のフレームで決定された遅延符
    号を基準にして前記遅延符号がサブフレーム間であらか
    じめ定められた値以上変化しないようにしてフレーム全
    体にわたる1つのピッチパスを推定し評価尺度を算出す
    るフレーム間パス推定部と、前記パス推定部と前記フレ
    ーム間パス推定部で求められたピッチパスから前記評価
    尺度を用いて最適なピッチパスを決定する最適パス決定
    部とを備えることを特徴とする請求項1記載の音声符号
    化装置。
  6. 【請求項6】 1つ過去のフレームで決定された遅延符
    号を基準にして前記遅延符号がサブフレーム間であらか
    じめ定められた値以上変化しないようにしてフレーム全
    体にわたる1つのピッチパスを推定し評価尺度を算出す
    るフレーム間パス推定部と、前記パス推定部と前記フレ
    ーム間パス推定部で求められたピッチパスから前記評価
    尺度を用いて最適なピッチパスを決定する最適パス決定
    部とを備えることを特徴とする請求項2記載の音声符号
    化装置。
  7. 【請求項7】 1つ過去のフレームで決定された遅延符
    号を基準にして前記遅延符号がサブフレーム間であらか
    じめ定められた値以上変化しないようにしてフレーム全
    体にわたる1つのピッチパスを推定し評価尺度を算出す
    るフレーム間パス推定部と、前記パス推定部と前記フレ
    ーム間パス推定部で求められたピッチパスから前記評価
    尺度を用いて最適なピッチパスを決定する最適パス決定
    部とを備えることを特徴とする請求項3記載の音声符号
    化装置。
JP8254882A 1996-09-26 1996-09-26 音声符号化装置 Pending JPH10105196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8254882A JPH10105196A (ja) 1996-09-26 1996-09-26 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8254882A JPH10105196A (ja) 1996-09-26 1996-09-26 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH10105196A true JPH10105196A (ja) 1998-04-24

Family

ID=17271152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8254882A Pending JPH10105196A (ja) 1996-09-26 1996-09-26 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH10105196A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114220444A (zh) * 2021-10-27 2022-03-22 安徽讯飞寰语科技有限公司 语音解码方法、装置、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114220444A (zh) * 2021-10-27 2022-03-22 安徽讯飞寰语科技有限公司 语音解码方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US6202046B1 (en) Background noise/speech classification method
JP6316398B2 (ja) Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法
JPH04363000A (ja) 音声パラメータ符号化方式および装置
JP3196595B2 (ja) 音声符号化装置
JP3254687B2 (ja) 音声符号化方式
US20060074643A1 (en) Apparatus and method of encoding/decoding voice for selecting quantization/dequantization using characteristics of synthesized voice
JP3143956B2 (ja) 音声パラメータ符号化方式
JPH09281998A (ja) 音声符号化装置
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3087591B2 (ja) 音声符号化装置
JPH10177398A (ja) 音声符号化装置
JP2000112498A (ja) 音声符号化方法
EP0694907A2 (en) Speech coder
US10115408B2 (en) Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
JPH10105196A (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3335650B2 (ja) 音声符号化方式
JP3024467B2 (ja) 音声符号化装置
JPH0844398A (ja) 音声符号化装置
JP3146511B2 (ja) 音声符号化方式
JPH1055198A (ja) 音声符号化装置
JPH07199994A (ja) 音声符号化方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000704