JP3984048B2 - 音声/音響信号の符号化方法及び電子装置 - Google Patents

音声/音響信号の符号化方法及び電子装置 Download PDF

Info

Publication number
JP3984048B2
JP3984048B2 JP2001392714A JP2001392714A JP3984048B2 JP 3984048 B2 JP3984048 B2 JP 3984048B2 JP 2001392714 A JP2001392714 A JP 2001392714A JP 2001392714 A JP2001392714 A JP 2001392714A JP 3984048 B2 JP3984048 B2 JP 3984048B2
Authority
JP
Japan
Prior art keywords
signal
weight information
weighted
obtaining
impulse response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001392714A
Other languages
English (en)
Other versions
JP2003195899A (ja
Inventor
公生 三関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001392714A priority Critical patent/JP3984048B2/ja
Publication of JP2003195899A publication Critical patent/JP2003195899A/ja
Application granted granted Critical
Publication of JP3984048B2 publication Critical patent/JP3984048B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は音声/音響信号の符号化方法及び電子装置に関するものである。
【0002】
【従来の技術】
音声信号を圧縮符号化する方法としてCELP(Code-Excited LinearPrediction)方式が知られている。CELP方式については、例えば、["Code-Excited Linear Prediction(CELP):High-quality Speech at Very Low Rates" Proc.ICASSP' 85,25,1.1.pp.937-940,1985]に記載されている。
【0003】
CELP方式では、音声信号を合成フィルタとこれを駆動する音源信号に分けてモデル化している。符号化後の合成音声信号は音源信号を合成フィルタに通過させることにより生成される。
【0004】
音源信号は、過去の音源信号を格納する適応符号帳から生成される適応符号ベクトルと、雑音符号帳から生成される雑音ベクトルという2つの符号ベクトルを結合することにより生成される。
【0005】
適応符号ベクトルは主に有声音区間の音源信号の特徴であるピッチ周期による波形の繰返しを表わす役割がある。
【0006】
一方、雑音符号ベクトルは適応符号ベクトルでは表わしきれない音源信号に含まれる成分を補う役割を持ち、合成音声信号をより自然なものにするために用いられる。適応符号ベクトルもしくは雑音符号ベクトルだけを音源信号と言うこともある。
【0007】
CELP方式では、音源信号の符号化は聴覚重み付けられた音声信号のレベルで歪を評価することにより、符号化歪が知覚されにくくなるようにしている点に特徴がある。
【0008】
図12は、聴覚重み付き合成により音源信号から聴覚重み付き合音声信号が生成される過程を示したものである。音源信号発生部300からの残差レベルの音源信号の候補が経路305を経て聴覚重み付き合成部301に入力され、出力端子304に聴覚重み付き合成音声信号が出力される。
【0009】
聴覚重みを用いることにより符号化歪が知覚されにくくなるのは、音声信号のスペクトルの形状に符号化歪のスペクトルがマスクされるように聴覚重み付けが行なわれるためで、周波数マスキングを利用している。聴覚重み付けは、符号化区間毎に音声信号から求め、同一の符号化区間の中では同じ聴覚重み特性が用いられる。
【0010】
このように従来の符号化では、聴覚重み付けは符号化区間毎に音声信号から求め、符号化区間の中で同じ重み特性を用いて音源信号の符号化を行なうことが特徴である。
【0011】
このような従来方法では符号化ビットレートを例えば音声信号の場合、4kbit/s程度にまで低下させると、音源信号を表現するために割り当てられるビット数が不足するため、符号化による歪が音として知覚されるようになる。結果として音がかすれたり、雑音が混じるなどの音質の劣化が顕著となってしまう。
【0012】
このためビットレートを低下させても高品質な合成音声を生成できる高効率の符号化が求められている。このような要求は音響信号の符号化についても同様である。
【0013】
【発明が解決しようとする課題】
上記したように従来の音声/音響信号の符号化方法では、聴覚重み付けは符号化区間毎に音声信号から求め、符号化区間の中で同じ重み特性を用いて音源信号の符号化を行なっているため、低ビットレートでは高品質の合成音声が得難いという問題点があった。
【0014】
本発明はこのような課題に着目してなされたものであり、その目的とするところは、低ビットレートでも高品質な音声信号/音響信号を生成できる音声/音響信号の符号化方法及び電子装置を提供することにある。
【0015】
【課題を解決するための手段】
上記の目的を達成するために、本発明の第1の態様は、CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、入力信号の短時間スペクトルを表わすパラメータを取得するパラメータ取得ステップと、取得した短時間スペクトルを表わすパラメータを基にインパルス応答を計算するインパルス応答計算ステップと、前記入力信号に対して予測しきれなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、合成音信号の歪を、前記インパルス応答計算ステップにおいて計算したインパルス応答と、前記重み情報取得ステップにおいて取得した重み情報を用いた歪み評価値により評価する評価ステップと、前記評価ステップによる評価の結果に基づいて合成音信号の歪が小さくなるように音源信号のパラメータの符号選択を行う符号選択ステップと
を具備する。
【0016】
また、本発明の第2の態様は、CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、入力信号の短時間スペクトルを表わすパラメータを取得するパラメータ取得ステップと、取得した短時間スペクトルを表わすパラメータを基にインパルス応答を計算するインパルス応答計算ステップと、前記入力信号に対して予測し切れなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、前記インパルス応答計算ステップにおいて計算したインパルス応答の相関値に、前記重み情報取得ステップにおいて取得した重み情報を用いた重み付けをすることにより位置重み付き相関値を求める位置重み付き相関値計算ステップと、合成音信号の歪を、前記位置重み付き相関値計算ステップで計算された位置重み付き相関値を用いた歪み評価値により評価する評価ステップと、前記評価ステップによる評価の結果にもとづいて合成音信号の歪が小さくなるように音源信号のパラメータの符号選択を行う符号選択ステップとを具備する。
【0017】
また、本発明の第3の態様は、CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、入力信号の短時間スペクトルを表わすパラメータを取得するパラメータ取得ステップと、取得した短時間スペクトルを表わすパラメータを基にインパルス応答を計算するインパルス応答計算ステップと、入力信号から目標信号を計算する目標信号計算ステップと、入力信号に対して予測し切れなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、前記インパルス応答計算ステップにおいて計算したインパルス応答の相関値に、前記重み情報取得ステップにおいて取得した重み情報を用いた重み付けをすることにより位置重み付き相関値を計算する位置重み付き相関値計算ステップと、前記インパルス応答計算ステップにおいて計算したインパルス応答の相関値と、前記目標信号計算ステップで計算した目標信号と、前記重み情報取得ステップにおいて取得した重み情報とを用いた演算により位置重み付き相互相関値を計算する位置重み付き相互相関値計算ステップと、合成音信号の歪を、前記位置重み付き相関値計算ステップで計算した位置重み付き相関値と、前記位置重み付き相互相関値計算ステップで計算した位置重み付き相互相関値とを歪み評価値として用いて評価する評価ステップと、前記評価ステップによる評価の結果に基づいて合成音信号と目標信号との歪が小さくなるように音源信号のパラメータの符号選択を行う符号選択ステップと、を具備する。
【0018】
また、本発明の第4の態様は、第1の態様から第3の態様のいずれか1つに係る音声/音響信号の符号化方法において、前記音源信号のパラメータの符号選択は、代数符号帳を用いる。
【0019】
また、本発明の第5の態様は、第1の態様から第4の態様のいずれか1つに係る音声/音響信号の符号化方法において、前記時系列信号は、前記入力信号と、前記パラメータ取得ステップで取得した短時間スペクトルを表わすパラメータとを用いて求められる残差信号である。
【0020】
また、本発明の第6の態様は、第5の態様に係る音声/音響信号の符号化方法において、前記符号選択ステップで行う音源信号のパラメータの符号選択では、パルス位置情報の選択を行う。
【0021】
また、本発明の第7の態様は、第1の態様から第6の態様のいずれか1つに係る音声/音響信号の符号化方法において、前記位置重み情報を用いた重み付けと聴覚重み付けとを用いて、前記歪み評価を行う。
【0022】
また、本発明の第8の態様は、CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、入力信号に対して予測しきれなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、音源信号を表わすための候補信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと合成フィルタを介して第 1 の合成信号を生成する第1の位置重み付け合成ステップと、入力信号から求めた目標残差信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと合成フィルタを介して第2の合成信号を生成する第2の位置重み付け合成ステップと、前記 1 の合成信号と前記第2の合成信号との歪を小さくするように音源信号のパラメータの符号選択を行う符号選択ステップとを具備する。
【0023】
また、本発明の第9の態様は、CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、入力信号に対して予測しきれなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、音源信号を表わすための候補信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと聴覚重み付き合成フィルタを介して第 1 の合成信号を生成する第1の位置重み付け合成ステップと、入力信号から求めた目標残差信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと聴覚重み付き合成フィルタを介して第2の合成信号を生成する第2の位置重み付け合成ステップと、前記 1 の合成信号と前記第2の合成信号との歪を小さくするように音源信号のパラメータの符号選択を行う符号選択ステップとを具備する。
【0024】
また、本発明の第10の態様は、音声/音響信号を入力するための入力部と、前記入力部を介して入力された音声/音響信号に対して符号化処理を施す符号化部と、前記符号化部で符号化された音声/音響信号を送信する送信部と、符号化された音声/音響信号を受信する受信部と、前記受信部を介して受信された音声/音響信号に対して復号化処理を施す復号化部と、前記復号化部で復号された音声/音響信号を出力する出力部と、を具備し、前記符号化部は、請求項1から9のいずれか1つに記載の符号化方法を実行する。
【0025】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0026】
図1は、本発明の符号化方法における残差レベル位置重み付けの原理的構成を示したものである。同図において、音源信号発生部300からの残差レベルの音源信号の候補が経路308を経て、残差レベル位置重み付け部302に入力される。ここで残差レベルの位置重み付けが為された音源信号の候補は、次に、経路309を経て聴覚重み付き合成部303に入力され、出力端子310に残差レベル位置重み付きの聴覚重み付き合音声信号が出力される。
【0027】
このような残差レベル位置重み付き聴覚重み付き合成音声信号を用いて音源信号を表す符号の選択を行なうことにより、残差信号レベルで位置的に重要な信号の情報をより精度良く符号化に反映しながら、聴覚重み付けによるマスキング効果も取り入れることができるようになるため、符号化の性能が向上する。
【0028】
図2は、残差信号レベルの位置重み付けと聴覚重み付き合成レベルでの歪み評価を用いて雑音符号帳の符号選択を行なう本発明の符号化方法の原理的な構成を示すもので、入力信号を表すために用いる音源信号の符号化の主要な部分を表したものである。目標残差信号生成部901は、スペクトルパラメータ処理部900で獲得した入力信号の短時間スペクトルを表すパラメータを用いて目標残差信号を生成する。目標残差信号は音源信号の理想信号に相当するものである。
【0029】
一方、雑音符号帳902は符号ベクトル候補を出力する。残差レベル位置重み獲得部903は入力信号と短時間スペクトルを表すパラメータを用いて残差レベルの位置重み付けに適した位置重み情報を獲得する。残差レベル位置重み付け部904および残差レベル位置重み付け部905はそれぞれ目標残差信号と符号ベクトル候補という残差レベルの信号対し位置重み付けを行なう機能を有する。
【0030】
聴覚重み付き合成部906は位置重み付き目標残差信号を位置重み付きの聴覚重み付き目標信号にして歪み評価部909に出力する。同様に、聴覚重み付き合成部907は位置重み付き符号ベクトル候補を位置重み付きの聴覚重み付き合成符号ベクトル候補にし、さらにゲイン乗算部908でゲインを乗じてこれを歪み評価部909に出力する。ここで目標に対し符号候補の歪み評価値を求める。この操作を雑音符号帳902の所定の符号候補についてそれぞれ行ない、歪み評価値がより好適な値を示す符号候補を符号選択部910にて選択し、その符号Cを出力することで音源信号の符号化が実現される。
【0031】
図3は、本発明の音声/音響信号の符号化方法を実現する符号化部の一例を示すブロック図である。ここでは音声信号のCELP符号化に本発明を適用した例を説明することにする。
【0032】
マイクなどの音声入力手段(図示せず)から入力された入力音声はA/D変換を施され、所定の時間区間毎に図3のスペクトルパラメータ分析・符号化部500に入力される。通常この時間区間は10〜30ms程度の長さが用いられ、フレームと呼ばれることがある。
【0033】
CELP方式では音声の生成過程のモデルとして、声帯信号を音源信号に対応させ、声道が表すスペクトル包絡特性を合成フィルタにより表し、音源信号を合成フィルタに入力させ、合成フィルタの出力で音声信号を表現する。本発明は、入力音声信号と合成音声信号との波形歪みが小さくなるように音源信号の符号選択を行うという大枠では従来のCELP方式と同じである。
【0034】
しかしながら、本発明では、(1)符号帳探索の中に位置重みを導入して波形歪みの評価を行なう点、(2)音声波形レベルの信号ではなく、残差信号レベルの信号である音源信号や音源パルスへの位置重み付けを導入している点が従来と大きく異なる。ここでは音源パルスを表すための符号帳として代数符号帳(Algebraic codebook)の使用を想定して説明するが、本発明の骨子はあくまでも上記(1)(2)にあり、符号帳自体の構造は音源パルスを表す代数符号帳に限定されるものではない。例えば、符号帳がマルチパルスを表すための符号帳であったとしても本発明は有効である。本発明ではこれらの符号帳を総称して雑音符号帳と呼ぶことにする。
【0035】
スペクトルパラメータ分析・符号化部500は音声信号をフレーム毎に入力し、入力された音声信号を分析することによりスペクトルパラメータを抽出する。次に、抽出されたスペクトルパラメータを用いて、予め用意しているスペクトルパラメータ符号帳を探索し、入力された信号のスペクトル包絡をより良く表現することのできる符号帳のインデックス(スペクトルパラメータ符号)Aを選択し、これを出力する。通常、CELP方式ではスペクトル包絡を符号化する際に用いるスペクトルパラメータとしてLSP(Line Spectrum Pair)パラメータを用いるが、これに限られるものではなく、スペクトル包絡を表現できるパラメータであればLPC係数などの他のパラメータも有効である。
【0036】
目標信号計算部511は入力された音声信号とスペクトルパラメータ分析・符号化部500からのスペクトルパラメータと後で述べる音源信号生成部510からの音源信号を用いて、適応符号帳探索部504での符号化の目標信号X(n)を計算する。
【0037】
インパルス応答計算部501は、スペクトルパラメータ分析・符号化部500からのスペクトルパラメータをもとに、インパルス応答h(n)を求める。このインパルス応答は典型的にはLPC係数を用いた合成フィルタと聴覚重みフィルタを組み合わせた特性の聴覚重み付き合成フィルタH(z)を用いて計算される。
【0038】
【数1】
Figure 0003984048
【0039】
残差信号計算部502は入力音声とスペクトルパラメータ分析・符号化部500からのスペクトルパラメータを用いて残差信号を計算する。具体例としては、抽出されたスペクトルパラメータとしてLPC係数を用い、これを用いた予測フィルタA(z)で音声信号をフィルタリングすることにより予測残差信号を求める。予測残差信号r(n)は音声信号s(n)を用いて、例えば次のようにして求めることができる。
【0040】
【数2】
Figure 0003984048
【0041】
ここでαiは量子化しないLPC係数であるが、量子化したLPC係数で代用してもr(n)と類似の予測残差信号を求めることができる。(2)式はLPC係数を用いた近接のPサンプルのデータを用いた予測であるから、この方法で得られる残差信号は正確には短期予測残差信号という。また、予測残差信号は残差信号と呼ばれたり、単に残差と呼ばれたりすることもある。以降の説明では残差信号または残差と呼ぶことにする。
【0042】
位置重み設定部503は残差信号計算部502で得られた残差信号をもとに位置重みを求め、これを位置重み付き相関計算部505、位置重み付き相互相関計算部506にそれぞれ出力する。本実施形態では、説明の簡単化のため、代数符号帳の符号探索にだけ位置重みを用いる例を説明するが、適応符号帳探索部504やゲイン符号帳探索部509にも位置重みを適用可能であることは言うまでもない。その場合は、位置重みが適応符号帳探索部504やゲイン符号帳探索部509にも出力される。
【0043】
図4(A)〜(C)及び図5(A)、(B)は、位置重み設定部503にて位置重みを求める方法の一例を説明するための図である。ここでは説明の簡単化のため、フレーム長が24サンプル(=位置が24個)とするが、例えばフレームを複数のサブフレームに分割してサブフレーム毎に位置重みや符号帳の符号探索を行なう場合であっても本発明に含まれることは言うまでも無い。
【0044】
図4(A)は符号化前の音声信号s(n)の離散波形例である。同図では位置n=iの音声信号の波形振幅をs(i)と表している。図4(B)は図4(A)の音声信号から求めた残差信号r(n)の波形例である。残差信号は音声信号を予測したときの誤差信号であるから、残差信号の振幅が大きな位置は予測によって十分表現できなかった位置であるということができる。そしてその位置の残差信号には、振幅が小さな他の位置に比べ、予測によって表現できない音声の特徴がより多く含まれていると考えられる。
【0045】
従って、残差信号の振幅が大きな位置を他の位置より精度良く(即ち歪みを少なく)符号化する仕組みを音源信号の符号化に導入することにより、より高品質の合成音声を提供することが可能となる。
【0046】
本発明は、残差信号を基にその特徴をとらえることにより、どの位置で歪みをより小さくするべきかを分析し、そのような位置については歪み評価のペナルティーが大きくなるように、位置重みを相対的に大きく設定する。
【0047】
残差信号の各振幅値r(n)の相対的な大小関係に応じ、各位置nの位置重みv(n)を設定するための具体例は、次のようになる。
【0048】
r(n)からしきい値THを計算し、
|r(n)|> TH ならば v(n)=k1
|r(n)|≦ TH ならば v(n)=k2
ここで、k1、k2はk1>k2>0なる関係にすると絶対値振幅が大きい位置に大きな位置重みk1が設定されることになる。k1=k2とすると位置重みを用いないことと等価になる。
【0049】
以下に、図4(C)を参照しながら、残差信号から位置重みを設定する方法の一例を説明する。
【0050】
同図では、残差信号の各位置に置ける絶対値振幅と所定の方法で決まるしきい値レベル49とを比較し、その大小関係で位置重みを設定する最も簡単な方法を示している。即ち、各位置における残差信号の絶対値振幅がしきい値49よりも小さいならば位置重みを相対的に小さく設定し、逆に、絶対値振幅がしきい値49よりも大きいならば位置重みを相対的に大きく設定する。
【0051】
実際、図4(C)の例では、50で示す絶対値振幅はしきい値49よりも小さいのでこの位置の位置重みは相対的に小さく設定され、51で示す絶対値振幅はしきい値49よりも大きいのでこの位置の位置重みは相対的に大きく設定される。
【0052】
なお、しきい値THは1種類としたが、TH1、TH2を使うなどして複数種類のしきい値を使ってより細かく位置重みの値を設定する方法も効果がある。また、しきい値は、例えば、残差信号の2乗和平均の平方根や絶対値平均、または分散などを基に決めることができる。残差信号の振幅を正規化したものを用いると、しきい値はほぼ固定値として位置重みを設定することが可能となる。
【0053】
図5(A)にこの結果得られる位置重みv(n)の例を示す。この例では、位置重みv(n)の値は大(k1)と小(k2)の2種類の値としている。また、同図から判るように、本発明の位置重みv(n)はすべて同一の極性(同図ではすべて正:v(n)>0)を持っている。このことは、位置重みがサンプル位置nに対して対応付けされた重み関数であることを示している。
【0054】
サンプル位置nはサンプルリングされた時系列信号の位置nを示すものであるから、本発明で言う位置nとは、時間n、または時刻nと考えてもよい。従って、位置に関する重みv(n)は対象とする符号化の区間内のサンプル位置に関する位置重みでもあると言えるし、この区間内で定義される時刻nに関する時間重み(または時刻重み)であるとも言ってもよい。このような時間位置に関する重み付けは、時系列信号の個々のサンプル毎に乗じるように定義される重み付けであって、従来の聴覚重み付けで用いるフィルタ演算や畳み込み演算によって実現される重み付けとは全く異なる重み付けである。
【0055】
図5(B)は残差の絶対値振幅が非常に小さい位置での位置重みを小さな値に設定する方法も取り入れ、位置重みの大きさを3種類に設定した例である。例えば、同図で位置重みv(21)の値が図5(A)のv(21)の値より小さくなっているのは、図4(C)で位置n=21での残差の絶対値振幅が非常に小さいことを反映するようにしたためである。
【0056】
位置重みの別な設定方法としては、残差信号r(n)または残差信号を正規化した信号を用いて、その絶対値を量子化したものを位置重みv(n)とする方法も有効である。即ち、v(n)=Q[abs(r(n))]とする。ここでabs( )は絶対値を表す関数、Q[x]は所定の量子器Qにxを入力したときの量子化出力を表す。量子化出力が2値の量子化器を用いる構成にした場合は、図5(A)と同様に2種類の大きさの位置重み設定をすることができる。
【0057】
同様に、量子化出力が3値の量子化器を用いる構成にした場合は、図5(B)と同様に3種類の大きさの位置重みを設定することができる。位置重みの大きさの種類は4種類以上であってもよい。また、v(n)=abs(Q[r(n)])としてもよい。量子化器に絶対値処理が組みこまれている場合は単にv(n)=Q[r(n)]とすればよい。
【0058】
また、別な位置重みの設定方法としては、r(n)の代わりに残差信号の2乗信号{r(n)}を用いて上記の例に示した方法で位置重みを設定することも可能である。
【0059】
また、残差信号の代わりに残差信号に比較的近い形状を有する模擬信号を用いる方法も本発明に含まれる。このような残差信号の模擬信号としては、例えば、これから述べるところの適応符号ベクトルが考えられ、適応符号ベクトルを残差信号の代りに用いて位置重みを求めることも有効である。
【0060】
このように位置重みの設定方法としては様々なものが考えられるが、要は、位置毎の重要度を位置重みに反映できるような仕組みなっていればよく、どのような位置重みの決め方であっても本発明に含まれる。
【0061】
以上で図4(A)〜(C)及び図5(A)、(B)の説明を終わる。
【0062】
ここで図3に戻って説明を続ける。
【0063】
適応符号帳探索部504は音源信号の中に含まれるピッチ周期で繰り返す成分を表現するために用いる。CELP方式では、符号化された過去の音源信号を所定の長さだけ適応符号帳として格納し、これを音声符号化部と音声復号化部の両方で持つことにより、指定されたピッチ周期に対応して繰り返す信号を適応符号帳から引き出すことができる構造になっている。
【0064】
適応符号帳では符号帳からの出力信号とピッチ周期が一対一に対応するためピッチ周期を適応符号帳のインデックスに対応させることができる。このような構造の下、適応符号帳探索部504では、適応符号帳からの出力信号を合成フィルタで合成したときの合成信号と目標信号との歪みが小さくなるようなピッチ周期を探索する。そして、探索されたピッチ周期に対応したインデックス(適応符号)Lを出力する。
【0065】
適応符号帳探索部504では、インデックス(適応符号)Lに対応したピッチ周期で得られる適応符号帳からの出力信号(適応符号ベクトル)と、適応符号ベクトルをスペクトルパラメータまたはインパルス応答で合成することによって得られる合成された適応符号ベクトルを出力する。さらに、適応符号ベクトルからの寄与分を目標信号X(n)から差し引くことにより次の雑音符号帳探索で使用する目標信号X2(n)(以下では目標ベクトルX2とも呼ぶ)を出力する。
【0066】
位置重み付き相関計算部505は位置重みとインパルス応答h(n)を用いて位置重み付き相関を計算する。位置重み付き相互相関計算部506は位置重みとインパルス応答h(n)と目標信号X2(n)とを用いて位置重み付き相互相関を計算する。
【0067】
次に、計算された位置重み付き相関と位置重み付き相互相関を用いた雑音符号帳の探索を行なう訳であるが、その前に、位置重みを導入した相関と相互相関を用いた符号帳探索法の原理について以下で説明をしておく。
【0068】
位置重みを導入した場合の符号帳探索による誤差ベクトルEは以下のようにして表される。
【0069】
【数3】
Figure 0003984048
【0070】
ここで、Hはインパルス応答h(n)から構成されるインパルス応答行列、Vは位置重み行列、ckは符号帳から出力される符号kに対応する符号ベクトル、gはゲイン、r2は目標残差ベクトルに相当し、X2=Hr2の関係がある。位置重み行列Vは本実施形態では主対角成分viiが位置重みv(i)で、それ以外の要素は値が零である行列とする。
【0071】
【数4】
Figure 0003984048
【0072】
X3は、位置重み付き目標ベクトルである。インパルス応答行列Hは、聴覚重み付き合成フィルタH(z)による畳み込み演算を行列の形で表したもので、主対角成分にh(0)をもつ下三角行列で、対角要素が同じ行列である。
【0073】
【数5】
Figure 0003984048
【0074】
従って、(3)式で定義される誤差Eは、符号ベクトルckを位置重み付けしたベクトルVckを聴覚重み付き合成フィルタH(z)で合成し、これにゲインgを乗じたベクトルgHVckと位置重み付き目標ベクトルX3との間の誤差であることがわかる。Vr2とVckはぞれぞれ、位置重み付きの目標残差ベクトル、位置重み付き符号ベクトルと呼ぶことができる。
【0075】
従って、HVr2(=X3)は位置重み付きの目標ベクトル、HVckは位置重み付き合成符号ベクトルである。また、(1)式で符号ベクトルckや残差ベクトルr2という残差レベルのベクトルに対して位置重み付けが適用され、さらに、これに聴覚重み付き合成を行なったレベルで誤差Eが定義されていることに注意されたい。
【0076】
上記で少し触れたが、r2は目標残差ベクトルで、目標ベクトルX2からインパルス応答による畳み込み合成の影響を取り去ったもので、X2=Hr2の関係がある。従って、r2は目標ベクトルX2とインパルス応答h(n)を用いることにより、r2=H-1X2として計算することができる。この計算は表現を変えると、以下と同じである。
【0077】
【数6】
Figure 0003984048
ここでLはベクトルの次元数を表す。
【0078】
目標残差ベクトルr2(n)は目標信号(目標ベクトル)X(n)から生成された一種の短期予測残差信号であるから、これにも音源信号の重要位置に関する情報が含まれていると考えられる。従って、目標残差ベクトルr2(n)を残差信号r(n)の代わりに使用しても位置重みの情報抽出は可能であることをここで追記しておく。
【0079】
従来法で行なわれる代数符号帳の探索では、インパルス応答から求められる相関は目標信号とインパルス応答との相互相関(行列で表現するとX2Hに相当、tは行列の転置を表す)、および、インパルス応答の自己相関(行列で表現するとHHに相当)の計算が必要である。これらの相関を用いて高速に代数符号帳を探索するアルゴリズムは代数符号帳(Algebraic Codebook)探索法として広く知られており、日本国内で使われている携帯電話のPDC―EFR規格のACELP方式や、ITU−T標準の音声符号化方式であるG.729、さらには3GPP規格の音声符号化方式であるAMRなど各種の公知な音声符号化規格において採用されている。
【0080】
これに対し、本発明による位置重みを用いた代数符号帳の探索は以下のようになる。
【0081】
いま、(3)式の誤差ベクトルEの誤差パワEEを最小にするゲインgを求めると
【数7】
Figure 0003984048
となり、これを(3)式に代入すると、誤差パワの最小値(EE)minは
【数8】
Figure 0003984048
となる。符号帳の探索は(8)式の右辺第2項の評価値
(X3HVck)/(ckVHVck)
を最大にする符号ベクトルの符号kを探索することである(右辺第1項は符号kに依存しない固定値なので無視することができる)。
【0082】
一方、従来法の位置重みを用いない符号帳の探索では、評価値
(X2Hck)/(ckHck)
を最大にする符号ベクトルの符号kを探索する。従来法では、相互相関X2H、自己相関HHを探索前に事前に求めておくことで、これらの値を用いて誤差パワを最小化するような好適な符号kを高速に探索することができる。しかしながら、位置重みを導入した条件では誤差パワを最小化するような好適な符号kを高速に探索する方法はこれまで考えられておらず、本発明はこの方法を提供するものである。
【0083】
従来法と本発明の方法で得られた上記評価値の対比から、位置重み付き相互相関X3HV(=r2VHV)と、位置重み付き自己相関VHVを符号帳探索の前に事前に求めておけば、従来の代数符号帳の探索法を利用して高速に最適な符号を選択できることが判る。従って、位置重み付き相互相関と位置重み付き自己相関を少ない計算量で求めることができるようにすれば、本発明の位置重みを用いた符号帳探索に要する計算量を従来法と同程度の量に抑えることができ、より実用に適した符号化方法を提供することができる。
【0084】
まず、本発明による位置重み付き自己相関を求める方法の具体例について説明する。従来のインパルス応答の自己相関HHのi行j列の要素φ(i,j)は、
【数9】
Figure 0003984048
で計算することができ、HHは対称行列になるのでφ(j,i)=φ(i,j)なる関係がある。一方、本発明の方法では位置重み付き自己相関VHVの計算が必要であるが、位置重み行列Vが(4)式で定義される対角行列の場合は、VHVのi行j列の要素Φ(i,j)は、以下のようにして計算できる。
【0085】
【数10】
Figure 0003984048
【0086】
ここで、v(i)は位置重みであり、常に正(即ち、v(i)>0)の値で与えられる。
【0087】
Vが対角行列の場合、位置重み付き自己相関VHVも対称行列になるので、Φ(j,i)=Φ(i,j)なる関係がある。従って、本発明の方法による位置重み付き自己相関を求めるための計算量の増加は、従来法で得られるインパルス応答の自己相関φ(i,j)にv(i)v(j)を乗じるだけでよいことが判る。
【0088】
さらに、予め限定した個数の位置にだけ、1と異なる位置重みを用いるように位置重みを設定すると、更に(10)式の計算量をさらに少なくできることは明かである。
【0089】
典型的な代数符号帳探索法では、音源パルス位置の探索の前に位置毎のパルス振幅が+1か−1の何れかに定め、位置毎のパルス振幅を反映した自己相関φ’(i,j)を用いてパルス位置の探索を行なうことで探索の計算量を少なくする。すなわち従来法によるφ’(i,j)は、
【数11】
Figure 0003984048
で求めることができる。これに対し、本発明による位置毎のパルス振幅を反映した位置重み付き自己相関Φ’(i,j)は次のようになる。
【0090】
【数12】
Figure 0003984048
【0091】
【数13】
Figure 0003984048
【0092】
位置毎のパルス振幅を反映した位置重み付き自己相関についてもΦ’(j,i)=Φ’(i,j)なる関係がある。dは位置毎のパルス振幅の事前推定に使用する信号または関数である。典型的なdとしては、d=X2H(相互相関)を用いることができる。すなわち、
【数14】
Figure 0003984048
であり、sign(d(i))はn=iの位置におけるd(i)の極性を表す。すなわち、sign(d(i))やsign(d(j))は+1か−1のいずれかの値である。ここに示した位置毎のパルス振幅の推定に使用する関数dは一例であってこれに限られるものではない。位置毎のパルス振幅を反映した位置重み付き自己相関Φ’(i,j)はインパルス応答の自己相関φ(i,j)に位置iと位置jのパルス振幅sign(d(i))、sign(d(j))を乗じる以外に、位置iと位置jの位置重みv(i)、v(j)を乗じることで計算することができる。位置重みv(i)とv(j)は正の値であり、位置iと位置jで位置の重要度が異なる場合にはv(i)とv(j)は異なる値とすることができる(例えば、位置重みの設計によっては、v(i)=1.25、v(j)=0.75となることもある)。
【0093】
また位置毎にパルス振幅と位置重みを乗じた位置重み付きパルス振幅としてvs(i)=v(i)×sign(d(i))を定義すると、(13)式は
【数15】
Figure 0003984048
と書くことができる。すなわち、位置重み付きパルス振幅vs(i)を予め計算しておいてから、これを自己相関φ(i,j)に乗じることにより位置毎のパルス振幅を反映した位置重み付き自己相関Φ’(i,j)を求める方法も有効である。これにさらに(7)式を代入すれば
【数16】
Figure 0003984048
が得られる。この(16)式を使用すればφ(i,j)を介さずにインパルス応答と位置重み付きパルス振幅を用いて位置重み付き自己相関を求めることができる。
【0094】
図6は、図3の位置重み付き相関計算部505のより詳細な構成例である。同図では、まず相関計算部520でインパルス応答計算部501からのインパルス応答の自己相関を計算し、計算された自己相関に位置重み付け部521にて位置重みを反映することにより、位置重み付き自己相関を求める方法を示している。
【0095】
図7は、図6の位置重み付け部521をさらに詳細に表した一例である。位置重み付け部521は振幅計算部522、位置重み付け部523、乗算部524から構成されている。振幅計算部522はパルス振幅の計算を行なうもので、実現の一例としては、d=X2H(相互相関)をもとに上述した方法で位置毎のパルス振幅を求める。
【0096】
別な方法としては、これから述べる、位置重みを反映した相互相関(X3HV)を用いて位置毎のパルス振幅を求める方法も有効である。この方法を用いると、従来の位置重み付けをしない相互相関(X2H)の計算が不要になるので計算量が減るという効果がある。位置重み付け部523は位置毎のパルス振幅に位置重みを乗じることにより、位置重み付きパルス振幅vs(i)を出力する。これを乗算部524で自己相関に乗じることにより、位置毎のパルス振幅を反映した位置重み付き自己相関Φ’(i,j)が計算される。
【0097】
次に、位置重み付き相互相関X3HV(=r2VHV)の求め方の一例について説明する。
【0098】
X3はX3=HVr2であり、r2はr2=H-1X2であるから、まず、(6)式により目標残差ベクトルr2を求め、次に、これに位置重みを乗じ、位置重み付き目標残差ベクトルVr2を求める。すなわち、ベクトルq=Vr2とおくと、その要素q(n)は
【数17】
Figure 0003984048
と計算できる。次に、位置重み付き目標残差ベクトルqにインパルス応答を畳み込み、位置重み付き目標ベクトルX3(=H(Vr2)=Hq)を得る。
【0099】
【数18】
Figure 0003984048
【0100】
次に位置重み付き目標ベクトルX3とインパルス応答との相関計算によりベクトルX3Hの要素γ(n)を求める。
【0101】
【数19】
Figure 0003984048
【0102】
最後に、X3Hの要素γ(n)に位置重みv(n)を乗じ、位置重み付きの相互相関X3HVの要素f(n)を求める。
【0103】
【数20】
Figure 0003984048
【0104】
位置毎のパルス振幅が与えられている場合、これを反映した位置重み付き相互自己相関f’(n)は
【数21】
Figure 0003984048
となる。ここで、d(n)は位置毎のパルス振幅の事前推定に使用する信号または関数である。d(n)としては位置重みなしの相互相関や位置重み付きの相互相関f(n)を用いることができる。すなわち、
【数22】
Figure 0003984048
【0105】
図8は、図3の位置重み付き相互相関計算部506のより詳細な構成例である。同図で、位置重み付き相互相関計算部506は位置重み付き目標ベクトル計算部525、相互相関計算部529、位置重み付け部530から構成されている。位置重み付き目標ベクトル計算部525はインパルス応答と位置重みと、適応符号帳探索部504の影響を差し引いた目標ベクトルをもとに位置重み付き目標ベクトルを計算する。
【0106】
次に相互相関計算部529でインパルス応答と位置重み付き目標ベクトルとの相互相関を計算し、これに位置重み付け部530で位置重みを乗じることにより位置重み付き相互相関を得る。
【0107】
図9は、図8の位置重み付き目標ベクトル計算部525をさらに詳細に表した一例である。位置重み付き目標ベクトル計算部525は目標残差ベクトル計算部526、位置重み付け部527、フィルタリング部528から構成されている。目標残差ベクトル計算部526は適応符号帳探索部504の影響を差し引いた目標ベクトルとインパルス応答を用いて目標残差ベクトルを計算する。位置重み付け部527は目標残差ベクトルに位置重みを乗じて位置重み付き目標残差ベクトルを出力する。次に、フィルタリング部528で位置重み付き目標残差ベクトルにインパルス応答を畳み込むことで位置重み付き目標ベクトルを得る。
【0108】
本発明は、位置重みとインパルス応答を用いて計算される歪み評価値を用いて符号帳探索を行なうことがその趣旨であり、位置重み付きの相関や位置重み付きの相互相関を基に符号探索を行なう方法は本発明の方法を少ない計算量で実現するための一つの手法である。従って、本実施形態の方法と類似の別な方法や、計算を簡略的に行なう手法が存在するが、そのような場合も基本的に本発明に含まれることはいうまでもない。
【0109】
例えば、位置重み付きの相互相関を求める別な方法として、次の方法が存在する。すなわち、位置重み付き相互相関X3HVがr2HVと等しいことを利用し、目標残差ベクトルr2と上述の位置重み付き自己相関Φ(i,j)(=VHVの要素)を用いることにより、位置重み付きの相互相関X3HVの要素f(n)が
【数23】
Figure 0003984048
を用いて計算できる。
【0110】
従来法の(9)式の計算がLの3乗のオーダであることと比較すると、本発明による計算量の増加は以上述べた方法のいずれを使用するにしても、高々Lの2乗のオーダであり、本発明の方法は実用的な方法であると言える。
【0111】
以上で、本発明の位置重み付き自己相関の計算方法、および、位置重み付き相互相関の計算方法についての説明を終わる。
【0112】
ここで図3に戻って説明を続ける。
【0113】
雑音符号帳探索部507では、代数符号帳を用いて歪みが最小となる符号ベクトルの符号kの検索を行なう。この際に、位置重み付き相関と位置重み付き相互相関を用いる。代数符号帳は予め定められたNp個のパルスの振幅がとり得る値を+1、−1に限定し、パルスの位置情報と振幅情報(すなわち極性情報)の組合せで符号ベクトルを表わす符号帳である。代数符号帳の特徴としては、符号ベクトルそのものを直接には格納する必要がないため符号帳を表わすメモリ量が少なくて済み、符号ベクトルを選択するための計算量が少ないにもかかわらず、比較的高品質に音源情報に含まれる雑音成分を表わすことができることが挙げられる。このように音源信号の符号化に代数符号帳を用いるものはACELP方式,ACELPベースの方式と呼ばれ、比較的歪の少ない合成音声が得られることが知られている。
【0114】
このような構造の下、雑音符号帳探索部507では、符号帳からの出力信号(符号ベクトル)を用いて再生される合成音声信号と雑音符号帳探索部において目標となる目標信号(修正された目標ベクトルX2)との歪みを位置重み付き相関(VHV)と位置重み付き相互相関(X3HV)を用いて評価し、その歪みが小さくなるようなインデックス(雑音符号)Cを探索する。この際用いる評価値は、先に説明したように、(8)式の右辺第2項の歪み評価値
(X3HVck)/(ckHVck)
であり、この値を最大にする符号ベクトルの符号kを探索することが最も歪みが小さくなる符号を選択することと等価である。そして、探索された雑音符号Cとこの符号に対応する雑音符号ベクトルcを出力する。
【0115】
雑音符号帳が代数符号帳で実現される場合、数個(ここではNp個)の非零のパルスから構成されるようになっているため、(8)式の右辺第2項の評価値の分子側のX3HVckはさらに
【数24】
Figure 0003984048
と表すことができる。ここで、miは第i番目のパルスの位置、
【数25】
Figure 0003984048
は第i番目のパルスの振幅、f(n)は位置重み付きの相互相関ベクトルX3HVの要素である。また、(8)式の右辺第2項の評価値の分母側のckHVckは
【数26】
Figure 0003984048
と表すことができる。さらに、位置毎のパルス振幅が求められている条件では、これを反映した位置重み付きの相関を使うと
【数27】
Figure 0003984048
【数28】
Figure 0003984048
となる。これらを基に歪み評価値(X3HVck)/(ckHVck)が最大となるようなパルス位置mi(i=0〜Np)を探索することでパルス位置情報の選択が完了する。この際、f’(n)とΦ’(i,j)(もしくはf(n)とΦ(i,j))が探索の前に計算されているので、符号選択の際に要する計算量は非常に少ないものとなる。選択されたパルス位置情報はパルス振幅情報と共に雑音符号として出力される。
【0116】
本発明では、位置重み付けと従来の聴覚重み付けを組み合わせることでより効果的に歪みが聞こえにくい符号を選択することができる効果がある。聴覚重み付けを用いるには、前述したようにインパルス応答h(n)を(1)式で示したような聴覚重み付き合成フィルタH(z)から求めることが必要である。
【0117】
ゲイン符号帳探索部509は音源のゲイン成分を表現するために用いる。典型的なCELP方式では、ピッチ成分に用いるゲインと雑音成分に用いるゲインの2種類のゲインをゲイン符号帳探索部509で符号化する。ここでは説明の簡単のためゲイン符号帳探索部509については位置重みを用いない構成で説明するが、位置重みをゲイン符号帳探索部509で用いる構成であってもよいことは言うまでもない。
【0118】
ゲイン符号帳探索においては、符号帳から引き出されるゲイン候補を用いて再生される合成音声信号と目標とする音声信号との歪みが小さくなるようなインデックス(ゲイン符号)Gを探索する。そして、探索されたゲイン符号Gとそれに対応するゲインを出力する。
【0119】
ここでは雑音符号帳探索だけに位置重みを用いる方法を説明したが、本発明はこれに限られるものではなく、様々な変形例が可能であることは言うまでもない。例えば、適応符号帳探索、雑音符号帳探索、ゲイン符号帳探索における3つの符号帳の探索のそれぞれに位置重みを用いる方法も有効である。
【0120】
また別の実現例においては、適応符号帳探索と雑音符号帳の2つの探索部にだけ位置重みを用いる方法も有効である。さらに別の実現例においては、ゲイン符号帳探索だけに位置重みを用いる方法も有効である。
【0121】
このように、本発明は様々な適用形態が考えられるが、どのような使用法においても、音声信号から求められた位置重みを残差信号(または音源信号)レベルの時系列信号の符号化に用いることにより、重要な位置の信号サンプルをより精度良く符号化することができる。
【0122】
音源信号生成部510は、適応符号帳探索部504からの適応符号ベクトル、雑音符号帳探索部507からの雑音符号ベクトル、ゲイン符号帳探索部509からのゲインを用いて音源信号を生成する。生成された音源信号は次の符号化区間において適応符号帳探索部504で利用できるように適応符号帳に格納される。さらに、生成された音源信号は、次の符号化区間において適応符号帳探索部504で利用できるように適応符号帳に格納される。生成された音源信号は目標信号計算部511において、次区間での符号化の目標信号を計算するために使用される。
【0123】
以上で図3の音声符号化の説明を終る。
【0124】
図10は、本発明の一実施形態に係る符号化方法をフローチャートにしたものである。所定の符号化区間毎に音声信号を入力し(ステップS1)、スペクトルパラメータの分析とその符号帳探索を行なう(ステップS2)。次に、現区間の符号化の目標信号を計算する(ステップS3)。次に、スペクトルパラメータをもとにインパルス応答を求める(ステップS4)。
【0125】
さらに、音声信号から第1の信号(例:残差信号)を求め(ステップS5)、第1の信号を用いて位置重みを設定する(ステップS6)。例としては、残差信号の絶対値振幅や残差信号のパワの外形など、極性に依存しない形状情報を介して位置重みを決定する。そして、適応符号帳探索を行なう(ステップS7)。
【0126】
次に、位置重み付き相関と位置重み付き相互相関を計算し(ステップS8)、これらを用いて雑音符号帳を探索し、雑音符号を選択する(ステップS9)。次に、ゲイン符号帳を探索する(ステップS10)。こうして得られたスペクトルパラメータ符号、適応符号L、雑音符号C、ゲイン符号Gを符号化部から出力し(ステップS11)、次区間の符号化に備えて音源信号を計算する(ステップS12)。次の区間の符号化を行なう場合はステップS1にて次の区間の音声信号を入力し、そうでない場合はステップS13にて符号化部の処理を終了する。
【0127】
以上で図10のフローチャートを用いた符号化部の処理の説明を終わる。
【0128】
本発明は、符号化側で行なうパラメータの符号選択に用いる重み付けに関するものであるため、復号化の方法は従来法と同じでよい。ここでは、復号化の方法について図11を参照して簡単に説明することにする。
【0129】
図11において、符号化部からの符号化データは入力端子160から入力され、符号化データ分離部19において各符号A,L,C,Gに分離される。スペクトルパラメータ復号部14は、符号Aを基にスペクトルパラメータを再生する。適応音源復号部11は、符号Lを基に適応符号ベクトルを再生する。雑音音源復号部12は、符号Cを基に雑音符号ベクトルを再生する。ゲイン復号部13は、符号Gを基に、ゲインを再生する。音源再生部15では再生された適応符号ベクトル、雑音符号ベクトル、ゲインを用いて音源信号を再生する。
【0130】
合成フィルタ16は、スペクトルパラメータ復号部14で再生されたスペクトルパラメータを用いて合成フィルタを構成し、これに音源再生部15からの音源信号を通過させることにより、合成音声信号を生成する。ポストフィルタ17は、この合成音声信号に含まれる符号化歪みを整形して聞きやすい音となるようにするポストフィルタリング処理を行う。処理された合成音声信号は出力端子195から出力される。
【0131】
以上で、本実施形態の説明を終わる。
【0132】
【発明の効果】
本発明によれば、低ビットレートでも高品質な音声信号/音響信号を生成できる音声/音響信号の符号化方法及び電子装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の符号化方法における残差レベル位置重み付けの原理的構成を示す図である。
【図2】残差信号レベルの位置重み付けと聴覚重み付き合成レベルでの歪み評価を用いて雑音符号帳の符号選択を行なう本発明の符号化方法の原理的な構成を示す図である。
【図3】本発明の音声/音響信号の符号化方法を実現する符号化部の一例を示すブロック図である。
【図4】位置重み設定部503にて位置重みを求める方法の一例を説明するための図(その1)である。
【図5】位置重み設定部503にて位置重みを求める方法の一例を説明するための図(その2)である。
【図6】図3の位置重み付き相関計算部505のより詳細な構成例を示す図である。
【図7】図6の位置重み付け部521をさらに詳細に表した一例を示す図である。
【図8】図3の位置重み付き相互相関計算部506のより詳細な構成例を示す図である。
【図9】図8の位置重み付き目標ベクトル計算部525をさらに詳細に表した一例を示す図である。
【図10】本発明の一実施形態に係る符号化方法をフローチャートにした図である。
【図11】復号化の方法について説明するための図である。
【図12】聴覚重み付き合成により音源信号から聴覚重み付き合音声信号が生成される過程を示す図である。
【符号の説明】
300 音源信号(残差レベル)
302 残差レベル位置重み付け部
303 聴覚重み付き合成部
308、309 経路
310 出力端子
500 スペクトルパラメータ分析・符号化部
501 インパルス応答計算部
502 残差信号計算部
503 位置重み設定部
504 適応符号帳探索部
505 位置重み付き相関計算部
506 位置重み付き相互相関計算部
507 雑音符号帳探索部
509 ゲイン符号帳探索部
510 音源信号生成部
511 目標信号計算部
900 スペクトルパラメータ処理部
901 目標残差信号生成部
902 雑音符号帳
903 残差レベル位置重み獲得部
904、905 残差レベル位置重み付け部
906、907 聴覚重み付き合成部
908 ゲイン乗算部
909 歪み評価部
910 符号選択部

Claims (10)

  1. CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、
    入力信号の短時間スペクトルを表わすパラメータを取得するパラメータ取得ステップと、
    取得した短時間スペクトルを表わすパラメータを基にインパルス応答を計算するインパルス応答計算ステップと、
    前記入力信号に対して予測しきれなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、
    合成音信号の歪を、前記インパルス応答計算ステップにおいて計算したインパルス応答と、前記重み情報取得ステップにおいて取得した重み情報を用いた歪み評価値により評価する評価ステップと、
    前記評価ステップによる評価の結果に基づいて合成音信号の歪が小さくなるように音源信号のパラメータの符号選択を行う符号選択ステップと
    を具備することを特徴とする音声/音響信号の符号化方法。
  2. CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、
    入力信号の短時間スペクトルを表わすパラメータを取得するパラメータ取得ステップと、
    取得した短時間スペクトルを表わすパラメータを基にインパルス応答を計算するインパルス応答計算ステップと、
    前記入力信号に対して予測し切れなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、
    前記インパルス応答計算ステップにおいて計算したインパルス応答の相関値に、前記重み情報取得ステップにおいて取得した重み情報を用いた重み付けをすることにより位置重み付き相関値を求める位置重み付き相関値計算ステップと、
    合成音信号の歪を、前記位置重み付き相関値計算ステップで計算された位置重み付き相関値を用いた歪み評価値により評価する評価ステップと、
    前記評価ステップによる評価の結果にもとづいて合成音信号の歪が小さくなるように音源信号のパラメータの符号選択を行う符号選択ステップと
    を具備することを特徴とする音声/音響信号の符号化方法。
  3. CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、
    入力信号の短時間スペクトルを表わすパラメータを取得するパラメータ取得ステップと、
    取得した短時間スペクトルを表わすパラメータを基にインパルス応答を計算するインパルス応答計算ステップと、
    入力信号から目標信号を計算する目標信号計算ステップと、
    入力信号に対して予測し切れなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、
    前記インパルス応答計算ステップにおいて計算したインパルス応答の相関値に、前記重み情報取得ステップにおいて取得した重み情報を用いた重み付けをすることにより位置重み付き相関値を計算する位置重み付き相関値計算ステップと、
    前記インパルス応答計算ステップにおいて計算したインパルス応答の相関値と、前記目標信号計算ステップで計算した目標信号と、前記重み情報取得ステップにおいて取得した重み情報とを用いた演算により位置重み付き相互相関値を計算する位置重み付き相互相関値計算ステップと、
    合成音信号の歪を、前記位置重み付き相関値計算ステップで計算した位置重み付き相関値と、前記位置重み付き相互相関値計算ステップで計算した位置重み付き相互相関値とを歪み評価値として用いて評価する評価ステップと、
    前記評価ステップによる評価の結果に基づいて合成音信号と目標信号との歪が小さくなるように音源信号のパラメータの符号選択を行う符号選択ステップと、
    を具備することを特徴とする音声/音響信号の符号化方法。
  4. 前記音源信号のパラメータの符号選択は、代数符号帳を用いることを特徴とする請求項1から3のいずれか1つに記載の音声/音響信号の符号化方法。
  5. 前記時系列信号は、前記入力信号と、前記パラメータ取得ステップで取得した短時間スペクトルを表わすパラメータとを用いて求められる残差信号であることを特徴とする請求項1から4のいずれか1つに記載の音声/音響信号の符号化方法。
  6. 前記符号選択ステップで行う音源信号のパラメータの符号選択では、パルス位置情報の選択を行うことを特徴とする請求項5に記載の音声/音響信号の符号化方法。
  7. 前記位置重み情報を用いた重み付けと聴覚重み付けとを用いて、前記歪み評価を行うことを特徴とする請求項1から6のいずれか1つに記載の音声/音響信号の符号化方法。
  8. CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、
    入力信号に対して予測しきれなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、
    音源信号を表わすための候補信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと合成フィルタを介して第 1 の合成信号を生成する第1の位置重み付け合成ステップと、
    入力信号から求めた目標残差信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと合成フィルタを介して第2の合成信号を生成する第2の位置重み付け合成ステップと、
    前記 1 の合成信号と前記第2の合成信号との歪を小さくするように音源信号のパラメータの符号選択を行う符号選択ステップと
    を具備することを特徴とする音声/音響信号の符号化方法。
  9. CELP方式に基づいた符号化方式を用いた音声/音響信号の符号化方法であって、
    入力信号に対して予測しきれなかった成分に相当する時系列信号を求め、この時系列信号のパワーの大きいサンプル位置の歪をより小さくするための位置重み情報を取得する重み情報取得ステップと、
    音源信号を表わすための候補信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと聴覚重み付き合成フィルタを介して第 1 の合成信号を生成する第1の位置重み付け合成ステップと、
    入力信号から求めた目標残差信号に対して前記重み情報取得ステップで取得した位置重み情報を用いた位置重み付けと聴覚重み付き合成フィルタを介して第2の合成信号を生成する第2の位置重み付け合成ステップと、
    前記 1 の合成信号と前記第2の合成信号との歪を小さくするように音源信号のパラメータの符号選択を行う符号選択ステップと
    を具備することを特徴とする音声/音響信号の符号化方法。
  10. 音声/音響信号を入力するための入力部と、
    前記入力部を介して入力された音声/音響信号に対して符号化処理を施す符号化部と、
    前記符号化部で符号化された音声/音響信号を送信する送信部と、
    符号化された音声/音響信号を受信する受信部と、
    前記受信部を介して受信された音声/音響信号に対して復号化処理を施す復号化部と、
    前記復号化部で復号された音声/音響信号を出力する出力部と、
    を具備し、
    前記符号化部は、請求項1から9のいずれか1つに記載の符号化方法を実行することを特徴とする電子装置。
JP2001392714A 2001-12-25 2001-12-25 音声/音響信号の符号化方法及び電子装置 Expired - Fee Related JP3984048B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001392714A JP3984048B2 (ja) 2001-12-25 2001-12-25 音声/音響信号の符号化方法及び電子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001392714A JP3984048B2 (ja) 2001-12-25 2001-12-25 音声/音響信号の符号化方法及び電子装置

Publications (2)

Publication Number Publication Date
JP2003195899A JP2003195899A (ja) 2003-07-09
JP3984048B2 true JP3984048B2 (ja) 2007-09-26

Family

ID=27599934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001392714A Expired - Fee Related JP3984048B2 (ja) 2001-12-25 2001-12-25 音声/音響信号の符号化方法及び電子装置

Country Status (1)

Country Link
JP (1) JP3984048B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding
JP5732624B2 (ja) 2009-12-14 2015-06-10 パナソニックIpマネジメント株式会社 ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法

Also Published As

Publication number Publication date
JP2003195899A (ja) 2003-07-09

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
EP0898267B1 (en) Speech coding system
JP3094908B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
US9972325B2 (en) System and method for mixed codebook excitation for speech coding
JPH0990995A (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JPH09160596A (ja) 音声符号化装置
JP3558031B2 (ja) 音声復号化装置
JPH09319398A (ja) 信号符号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3308764B2 (ja) 音声符号化装置
JP3984048B2 (ja) 音声/音響信号の符号化方法及び電子装置
JP3583945B2 (ja) 音声符号化方法
JP3003531B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3144284B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3984021B2 (ja) 音声/音響信号の符号化方法及び電子装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3192051B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110713

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120713

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130713

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees