JPH06259097A - コード駆動音源音声符号化装置 - Google Patents

コード駆動音源音声符号化装置

Info

Publication number
JPH06259097A
JPH06259097A JP5047920A JP4792093A JPH06259097A JP H06259097 A JPH06259097 A JP H06259097A JP 5047920 A JP5047920 A JP 5047920A JP 4792093 A JP4792093 A JP 4792093A JP H06259097 A JPH06259097 A JP H06259097A
Authority
JP
Japan
Prior art keywords
codebook
search
probability
subframe
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5047920A
Other languages
English (en)
Inventor
Noriyuki Otsuka
則幸 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP5047920A priority Critical patent/JPH06259097A/ja
Publication of JPH06259097A publication Critical patent/JPH06259097A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】確率コードブックの探索をフレーム内若しくは
複数フレームで、サブフレーム毎の音声の特徴量によっ
て、確率コードブックの内容を適応的に変更し、探索を
複数回行って音質を向上させる。 【構成】符号側は、入力音声1を取り込む線形予測分析
器2、重み付け合成フィルタ3及び聴覚重み付けフィル
タ4、エネルギー計算部22、探索回数セット部23
と、確率コードブック6、適応コードブック7、ゲイン
器8及び9、加算器10、差分器5、差分器11と、評
価器12、バッファ13で構成される。また、復号側
は、符号側から送出されたLPCパラメータαを係数と
する合成フィルタ14、確率コードブック15、適応コ
ードブック17、ゲイン器16及び18、加算器19と
バッファ20で構成されて合成音声21を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明はコード駆動音源音声符
号化装置に関し、特にCELPの音質向上を図るのに好
適なコード駆動音源音声符号化装置に関するものであ
る。
【0002】
【従来の技術】従来、音声信号を4.8〜8kbps程
度の低ビットレートで符号化する方法としては、M.S
chroeder and B.Atal,“Code
−excited linear predictio
n:Highquality speech at v
ery low bit rates”(Proc.I
CASSP,pp.937−940,1985)の論文
に記載されているようなCELP(Code−exci
ted linearprediction)という手
法が、現在盛んに研究されている。この手法は、音声信
号からピッチ成分を取り除き、コードブック内の白色雑
音から音声を合成して、A−b−S(Analysis
−by−Synthesis)により最適な音源を求
め、そのコードブックのインデックスとゲインをLPC
(Linear Predictive Coeffi
cients)パラメータまたはPARCOR係数の組
と共に送り、復号側では、そのインデックスとゲインと
LPCパラメータを基に音声を合成するというものであ
る。
【0003】上記CELPで用いられるコードブック
は、確率コードブックが用いられており、その内容は白
色雑音またはスパースコードブックが通常用いられる。
また、ピッチ成分を取り除く方法としては、適応コード
ブックが用いられることが多い。適応コードブックの1
形態については、“FEDERAL STANDARD
1016;TELECOMMUNICATIONS:A
NALOG TODIGITAL CONVERSIO
N OF RADIO VOICE BY 4,800
BIT/SECOND CODE EXCITEDL
INEAR PREDICTION(CELP)”,
(NationalCommunications S
ystem Office OfTechnology
& Standards,Feb.14,1991)
に詳しく述べられているので、ここでは説明を省略す
る。
【0004】図15(a)は、従来のCELPの代表例
として、確率コードブックと共に適応コードブックを使
用する符号側のブロック図を示したものである。入力音
声1は、例えば8kHz、フレーム長だけサンプリング
される。いま、例えばフレーム長を30msとすると、
240サンプルが線形予測分析器2に送られる。線形予
測分析器2では、重み付け合成フィルタ3の係数と聴覚
重み付けフィルタ4の係数とを、例えばLPCパラメー
タαの組として与える。音声信号は、聴覚重み付けフィ
ルタ4で聴覚的な重み付けがなされる。そして、フレー
ム長を、例えば4分割した7.5msのサブフレーム、
すなわちデータ60サンプル毎に処理され、重み付け合
成フィルタ3からの零入力応答が、差分器5で差し引か
れる。
【0005】一方、確率コードブック6と適応コードブ
ック7には、入力音声データと同じ数のデータ60サン
プルが納められている。音源信号は、それぞれのコード
ブック6及び7の出力にゲイン器8及び9でゲインをか
けた内容の和で表される。加算器10で加えられた合成
音声信号は、音源信号を重み付け合成フィルタ3に通す
ことによって得られる。
【0006】最適なコードブックのインデックスとゲイ
ンを得るために、差分器11で重み付けされた入力音声
から零入力応答が差し引かれた信号と、コードブックか
ら再生した合成音声信号との差をとる。次いで、誤差の
自乗を評価器12で評価し、その値が最小のインデック
スの組を求めるようにコードブックを探索する。そし
て、コードブックのインデックスが決定されると、確率
コードブック6のインデックスisで指し示された内容
にゲインgsをかけ合わせたものと、適応コードブック
7のインデックスiaで指し示された内容にゲインga
をかけ合わせたものとの和を取ったものが、音源信号と
して決定される。
【0007】同時に、音源信号は、適応コードブック7
の更新のため、バッファ13に入力され、その内容を基
に適応コードブック7の内容をサブフレーム毎に書き換
える。復号側には、LPCパラメータαと確率コードブ
ックのインデックスisと、ゲインgsと、適応コード
ブック7のインデックスia及びゲインgaが送られ
る。
【0008】図15(b)は、図15(a)で符号化さ
れた従来例の復号側のブロック図を示している。復号側
では、符号側から送出されたLPCパラメータαを合成
フィルタ14の係数として用い、同様に送出された確率
コードブック15のインデックスis及びゲイン器16
のゲインgsと、適応コードブック17のインデックス
ia及びゲイン器18のゲインgaから、音源信号を作
成する。そして、加算器19を経て、合成フィルタ14
に通して音声を合成すると同時に、適応コードブック1
7の更新のため、バッファ20に入力される。こうし
て、その内容を基に、適応コードブック17の内容をサ
ブフレーム毎に書き換える。尚、21は合成音声であ
る。
【0009】
【発明が解決しようとする課題】一般的に、確率コード
ブックは、1024種類や512種類という、数多くの
種類から選ばれている。しかしながら、この確率コード
ブック探索に要する時間が、A−b−Sを行って処理さ
れるため、処理の約50%を占めることも多く、これが
CELPの実時間処理の妨げとなっていた。また、確率
コードブックによっても、まだ音声の立ち上がり等で十
分な音質が得られていないという点も問題となってい
た。
【0010】また、この問題点を解決する方法として、
従来から知られている多段ベクトル量子化と称されてい
る方法がある。これは、ベクトル探索を複数回行うこと
で合成音声の音質を上げるというものであるが、従来の
多段ベクトル量子化は、予め決められた回数だけ探索を
行っている。
【0011】例えば、特開平3−243998号公報
は、ピッチ周期を除いた残差に対して、学習コードブッ
クと雑音コードブックの縦続接続により励起信号を形成
している。しかしながら、探索回数は各コードブックに
対し1回ずつに固定されており、励起信号のゲインによ
る適応化や、音声のサブフレーム毎の状態による適応化
は行なわれていないものであった。
【0012】この発明は上記課題に鑑みてなされたもの
で、CELPの実時間処理を妨げることなく、音声の立
ち上がり等でも十分な音質を得ることのできるコード駆
動音源音声符号化装置を提供することを目的とする。
【0013】
【課題を解決するための手段】すなわちこの発明は、入
力音声に対してフレームを線形予測分析する線形予測分
析手段と、サブフレーム毎に上記入力音声の特徴量を算
出する算出手段と、この算出手段で求められた上記サブ
フレーム毎の特徴量を検出する検出手段と、音声中の雑
音成分を格納する確率コードブックと、この確率コード
ブックと共に音声中のピッチ成分を検出するピッチ検出
手段と、上記確率コードブックからの音声信号と上記ピ
ッチ検出手段の信号と上記線形予測分析手段から求めら
れた係数とから音源信号を作成し、その音源信号から合
成音声を合成する合成フィルタと、この合成フィルタで
合成された合成音声と上記入力音声とを比較する比較手
段とを具備し、上記確率コードブックは上記検出手段と
上記比較手段の状態によってその内容を適応的に変更し
て探索を適応的に行うことを特徴とする。
【0014】
【作用】この発明のコード駆動音源音声符号化装置にあ
っては、フレーム内、若しくは複数のフレームからサブ
フレーム毎に音声信号の特徴量、例えば音声信号のサブ
フレーム毎のエネルギーや、残差信号のサブフレーム毎
のエネルギー等を計算する。そして、隣り合うサブフレ
ーム間でその特徴量の差または比が大きいサブフレーム
を選択する。このサブフレームに対して、複数回探索を
行うことで、音質向上を可能にしている。
【0015】
【実施例】以下、図面を参照してこの発明の実施例を説
明する。
【0016】図1(a)は、ピッチ検出手段として適応
コードブックを使用する、第1の実施例の符号側のブロ
ック図である。尚、上述した従来例と構成が同じ部分
は、同一参照番号を付している。
【0017】入力音声1は、線形予測分析器2を介して
重み付け合成フィルタ3及び聴覚重み付けフィルタ4に
供給される。この聴覚重み付けフィルタ4の出力は、エ
ネルギー計算部22、探索回数セット部23を介して確
率コードブック6に供給される。また、聴覚重み付けフ
ィルタ4の出力は、重み付け合成フィルタ3からの零入
力応答が差分器5にて差し引かれ、更に差分器11に至
る。
【0018】一方、確率コードブック6と適応コードブ
ック7の出力は、ゲイン器8及び9、加算器10、重み
付けフィルタ3を介して上記差分器11へ供給される。
この差分器11にて、差分器5からの信号とコードブッ
クから再生した合成音声信号との差がとられ、更に誤差
の自乗が評価器12で評価される。また、バッファ13
は、適応コードブック7の更新のために音源信号が入力
され、その内容を基に適応コードブック7の内容をサブ
フレーム毎に書き換えるべく出力が適応コードブック7
に供給される。
【0019】このような構成に於いて、入力音声1は、
例えば8kHz、フレーム長サンプリングされる。30
msを1フレームとすると、フレーム長240サンプル
分のデータが読み込まれて、保持される。そして、24
0サンプルが線形予測分析器2に送られる。この線形予
測分析器2では、重み付け合成フィルタ3の係数と聴覚
重み付けフィルタ4の係数を、LPCパラメータαの組
として与える。そして、音声信号は、フレーム長を、例
えば4分割した7.5msのサブフレーム、すなわちデ
ータ60サンプル毎に処理を行う。次いで、聴覚重み付
けフィルタ4で聴覚的な重み付けがなされ、重み付け合
成フィルタ3からの零入力応答が差分器11で差し引か
れる。
【0020】また、適応コードブック7には、入力音声
データと同じ数のデータが、サブフレーム分、すなわち
60サンプル分納められている。音声信号は、先ず適応
コードブック7から探索され、この適応コードブック7
のインデックスiaとゲインgaが求められる。次い
で、確率コードブック6の計算のために入力音声データ
から差し引かれ、次に確率コードブックの探索が行われ
る。
【0021】この際用いられる確率コードブックは、通
常1024種類や512種類用意されるが、例えば、確
率コードブックを64種類用意しておき、その代わりに
フレーム内または複数フレームで、予め決めておいた数
だけ複数回探索を行うことで、音質向上を達成すること
ができる。いま、音声信号の特徴量として、音声のサブ
フレーム毎のエネルギーを選択し、複数回探索をフレー
ム毎に行う処理について述べる。
【0022】例えば、1フレーム内で、6回の確率コー
ドブック探索を行うこととすると、予め1フレームのデ
ータから音声のサブフレーム毎のエネルギーを音声信号
の振幅の自乗和として、エネルギー計算部22により計
算し、隣り合うサブフレームのエネルギーの差を前処理
として抽出する。探索回数セット部23では、エネルギ
ー計算部22の結果により、サブフレーム毎の探索回数
をセットする。具体的には、前サブフレームとのエネル
ギーの差があるスレッシュホールドより大きく、それが
最大となる部分についてはサブフレーム毎の確率コード
ブック探索回数を3回とセットし、それ以外のサブフレ
ームでは確率コードブック探索回数を1回にセットす
る。差がスレッシュホールドを越えるようなフレームの
構造は、音声の無声(無音)から音声への急激な立ち上
がりや、有声から無声(無音)への急激な立ち下がりを
含むと考えられ、複数回の探索が必要である。
【0023】また、無声(無音)の例を図2(a)、音
声の定常部を図2(b)に示すように、その差はスレッ
シュホールドレベル以下である。したがって、フレーム
毎に6回の確率コードブックの探索を行う場合は、フレ
ーム毎のビットレートを一定に保つ目的のために、従来
の1サブフレームにつき1回の確率コードブックの探索
に加えて、複数回の確率コードブックの探索は隣接する
サブフレームのエネルギーの差の大きいサブフレームか
ら2サブフレーム分1回余分に探索が行われ、計6回の
確率コードブック探索が行われる。例えば、図2(a)
と図2(b)の場合には、第2サブフレームと第4サブ
フレームでは、サブフレーム毎の確率コードブック探索
回数を2回とセットされ、第1サブフレームと第3サブ
フレームでは、サブフレーム毎の確率コードブック探索
回数を1回とセットされて確率コードブック探索が行わ
れる。
【0024】例えば、図3に示されるように、第3サブ
フレームに音声の立ち上がりがあった場合、第1、第
2、第4サブフレームでは、従来と同様の確率コードブ
ック探索処理を行うが、第3サブフレームに於いては、
従来の探索に加えて更に2回分探索を行う。図4は、こ
の様子をサブフレーム毎の処理として表したフローチャ
ートである。以下、このフローチャートを参照して説明
する。
【0025】音声は、先ず、適応コードブックのインデ
ックスiaで指し示された内容にゲインgaを掛け合わ
せたものを音源信号として、重み付け合成フィルタ3に
より合成された信号が引かれ、確率コードブック探索を
行う。つまり、サブフレーム単位の音声を入力し(ステ
ップS1)、適応コードブックを探索した後(ステップ
S2)、適応コードブックの影響を取り除く(ステップ
S3)。確率コードブックは、先ずそのサブフレームを
探索する回数nがセットされ(ステップS4)、確率コ
ードブック探索が行われる(ステップS5)。
【0026】すなわち、第3サブフレーム以外のサブフ
レームではnに1が、第3サブフレームではnに3が探
索回数としてセットされる。確率コードブックの探索
は、この値をデクリメントし(ステップS6)、値が0
になったときに終了する(ステップS7)。確率コード
ブックの探索は、先ず適応コードブックの合成信号を引
いた信号に対し行われ、上記回数をデクリメントして0
であれば処理を終了するが、そうでなければ処理を続行
する(ステップS8)。
【0027】2回目以降は、確率コードブックのインデ
ックスisで指し示された内容にゲインgsをかけ合わ
せたものから合成された信号が引かれた信号に対して探
索が行なわれる。音源信号は、適応コードブックのイン
デックスで指定された内容にゲインを掛けたものと、求
まった確率コードブック群のインデックスで指し示され
た内容にそれぞれのゲインを掛け合わせた信号の1次結
合として表される。以上で、1サブフレームの処理が終
了する。
【0028】図5は、符号側から復号側に送られるコー
ドの1例を示したものである。フレーム毎に復号側へ送
られるパラメータは、確率コードブックの探索回数が1
回の場合“0”がセットされる。一方、確率コードブッ
クを複数回探索する場合は、継続フラグ“1”がセット
され、継続フラグが“0”となるまで探索が続けられ
る。また探索回数を各サブフレーム毎に記録しておく方
法も考えられる。
【0029】更に、フレーム内で1つもサブフレーム間
のエネルギー差がスレッシュホールドレベルに達してい
ないときには、1サブフレームにつき確率コードブック
の探索回数を始めから1回にセットする。但し、この場
合は、ビットレートが可変となる。
【0030】このような探索を行なう理由は、こういっ
たフレームでは複数探索によって得られる音質の向上
は、あまり期待できず、むしろ処理を簡単にして処理ス
ピードを上げた方がよいといった場合である。音質の向
上があまり期待できない理由は、無声(無音)部では、
音質が悪いが、もともと振幅が小さいために主観評価に
はほとんど効いてこないことや、有声の定常部では、逆
にもともと音質が良いため、主観評価には少しぐらい良
くなっても全体としては影響がないということに基いて
いる。
【0031】また、音声の特徴量として音声信号のサブ
フレーム毎のエネルギーを選択したが、音声信号の他に
音声信号から得られるサブフレーム毎の残差エネルギー
や、音声信号を重み付け合成フィルタの逆フィルタに通
して得られる信号のサブフレーム毎のエネルギー等、音
声信号の状態を表す量であれば何でもよい。尚、この実
施例では、演算として差分を使用しているが、この演算
は差分に限定されておらず、例えば比をとってもよい。
【0032】図1(b)に示される復号側には、LPC
パラメータαと、適応コードブック17のインデックス
ia及びゲインgaと、n回サーチした確率コードブッ
ク15のインデックスis及びゲインgsが探索の度に
送られる。そして、符号側から送出されたLPCパラメ
ータαを合成フィルタ14の係数として用い、音源信号
として適応コードブック17のインデックスiaで指し
示された内容にゲインgaを掛け合わせたものと、n回
サーチした確率コードブック15のインデックスisで
指し示された内容にゲインgsを掛け合わせたものとの
1次結合を、音源信号として合成フィルタ14に通すこ
とで音声が合成される(合成音声21)。
【0033】また、複数フレームの場合に於いても、同
様な処理を行う。すなわち、複数フレームでのコードブ
ック探索を(総サブフレーム数+β)回行うことで、無
声(無音)状態から有声への立ち上がり、または有声か
ら無声(無音)への立ち下がりを、複数フレームに渡っ
てどのサブフレームを複数探索するかを、回数β内に適
応的に割り当てることで、より自由度を増すことができ
る。
【0034】尚、線形予測分析で求められるパラメータ
は、LPCパラメータとしたが、この係数はLSP(L
ine Spectrum Pair)パラメータでも
良い。また、確率コードブックの内容は、スパースコー
ドや白色雑音や予め学習されたコードであっても構わな
いことはもちろんである。加えて、その種類を上述した
実施例より多くしても少なくしてもよい。更に、適応コ
ードブックの合成フィルタの応答と各探索で得られた確
率コードブックの合成フィルタの応答を直交させておく
ことが望ましい。
【0035】このような処理を行うことによって、確率
コードブックの処理を、音声の立上りや立ち下がり等、
音声が急激に変化する場合でも、音質の低下を最小限に
して実現することができる。次に、この発明の第2の実
施例について説明する。
【0036】上述した第1の実施例では、確率コードブ
ック探索の打ち切りを回数によって指定したが、この第
2の実施例では、回数と確率コードブックのインデック
スで指し示された内容にかけられるゲインとによって打
ち切りを決定するようにしている。
【0037】図6は、この第2の実施例に於ける構成の
ブロック図である。上述した第1の実施例と異なってい
る部分は、確率コードブック探索に於けるゲインによ
り、探索を打ち切る働きを加えるという点である。すな
わち、確率コードブック6のゲインが、予め定められた
規定値を下回ったことを探索打切り器24により検出
し、探索打切り信号によってサブフレームの確率コード
ブック6の探索を停止するというものである。ピッチ検
出手段としては、適応コードブック6を使用し、その適
応コードブックサーチまでは、上述した第1の実施例と
同様なので説明を省略し、確率コードブックの探索のみ
を詳しく説明する。尚、以下に述べる実施例に於いて、
上述した従来例、第1の実施例と同じ部分には同一の参
照番号を付してその説明を省略するものとする。
【0038】確率コードブック6は、先ずそのサブフレ
ームを探索する回数が、1フレームのデータから音声の
サブフレーム毎のエネルギーを音声信号の振幅の自乗和
としてエネルギー計算部22により計算される。そし
て、隣り合うサブフレームのエネルギーの差が前処理と
して抽出される。探索回数セット部23では、エネルギ
ー計算部22の結果により、サブフレーム毎の探索回数
がセットされる。例えば、そのフレーム毎の回数を第1
の実施例と同様、6回とし、そのときのフレームの状態
が、図3に示されるように、第3サブフレームに音声の
立ち上がりがあったとする。
【0039】先ず第1、第2サブフレームに於いて、従
来と同様のサブフレームにつき1回の確率コードブック
探索処理を行うが、第3サブフレームに於いては、従来
の探索に加えてあと2回分探索、すなわち探索回数を3
とセットする。確率コードブック6の探索は、この値を
デクリメントし、値が0になったときに終了すると同時
に、探索を行ったときのゲインgsが、ある値より小さ
くなったときに探索打切り器24が探索打切り信号を発
生し、探索回数セット部23が探索回数nを現時点での
回数にセットし直すことで、確率コードブック6のサブ
フレームの探索を停止する。ここで、このような処理を
行う理由について述べる。
【0040】コードブックのインデックスiは、音声信
号と合成音声信号の歪みエネルギーを最小にするインデ
ックスが選択される。しかしながら、実際の探索で用い
られる評価式は、コードブック内のインデックスiのコ
ードワードをCiとし、そのコードワードのn番目の成
分の合成フィルタ応答をqi(n)、n番目の音声信号
をp(n)とすると、下記(1)式を最大にするインデ
ックスiのコードワードCiが選択される。
【0041】
【数1】 このときのゲインgsは、(2)式で求められる。
【0042】
【数2】
【0043】この式をみてみると、ゲインgsの成分
は、インデックスiのコードワードの合成フィルタ応答
をqi(n)と音声信号p(n)との相互相関をとった
ものであるので、音声信号とコードブックの内容が無相
関に近くなれば、ゼロに近付いていく。これを踏まえ
て、ゲインgsが、ある値、例えば1より小さくなった
ときも、探索回数と共に確率コードブック探索の終了条
件とすることができる。図7のフローチャートは、この
処理の様子を表したもので、以下、サブフレーム毎の処
理として説明する。
【0044】音声は、先ず適応コードブック7のインデ
ックスiaで指し示された内容にゲインgaを掛け合わ
せたものを音源信号として、重み付け合成フィルタ3に
より合成された信号が引かれ、確率コードブック6の探
索が行われる。つまり、サブフレーム単位の音声を入力
し(ステップS11)、適応コードブックを探索した後
(ステップS12)、適応コードブックの影響を取り除
く(ステップS13)。確率コードブックは、先ずその
サブフレームを探索する回数nがセットされ(ステップ
S14)、確率コードブック探索が行われる(ステップ
S15)。
【0045】すなわち、第3サブフレーム以外のサブフ
レームのうち、第1、第2サブフレームで1がセットさ
れ、第3サブフレームでは3が探索回数としてセットさ
れる。確率コードブックの探索は、先ず適応コードブッ
クの合成信号を引いた信号に対し行われる。そして、上
記回数をデクリメントして(ステップS16)0であれ
ば処理を終了する(ステップS17)か、若しくはゲイ
ンが規定値より小さくなった(ステップS18)ところ
で終了するが、そうでなければ処理を続行する(ステッ
プS19)。
【0046】2回目以降は、1の確率コードブックのイ
ンデックスisで指し示された内容にゲインを掛け合わ
せたものから、重み付け合成フィルタ3により合成され
た信号が引かれた信号に対して探索が行われる。探索
は、回数が規定値に達したときか、ゲインが規定値を下
回るまで続行される。そして、第4サブフレームの適応
コードブックと確率コードブックの探索を1回ずつ行
う。
【0047】いま、第3サブフレームで、3回探索する
予定が2回目の探索に於いてゲインが規定値を既に下回
ったとすると、残った探索を第4サブフレームにまわ
す。また、第4サブフレームに於いては、ゲインが既定
値を下回った場合、探索をその時点で打ち切り、それ以
降の探索を無効にするという意味で、残りの探索回数分
だけ確率コードブックのゲインを0にセットする。
【0048】また、ゲインが規定値より小さくなる場合
は、サブフレームの位置に無関係に起こり得るので、複
数回探索の結果、ゲインが小さくなったサブフレーム
が、第1、第2、第3サブフレームの場合、複数回探索
で残った探索回数を次のサブフレームにまわし、一方第
4サブフレームの場合は、ゲインが規定値を下回った時
点で探索を打ち切り、ゲインを0にして残りの探索回数
を無効とする。
【0049】更に、第4サブフレームの場合には、ゲイ
ンが規定値を下回った時点で上述した第1の実施例の継
続フラグを“0”に戻し、それ以降の探索の打ち切りを
表してもよい。但し、第4サブフレームでゲインが規定
値より下がった場合に継続フラグを0とする場合、ビッ
トレートはフレーム毎に異なり、可変長符号となる。
【0050】このとき、音源信号は、適応コードブック
7のインデックスで指定された内容にゲインを掛けたも
のと、確率コードブック6群のインデックスで指定され
た内容にそれぞれのゲインを掛け合わせた信号の1次結
合として表される。比較用の合成音声信号は、音源信号
を重み付け合成フィルタ3に通すことによって得られ
る。以上で、1サブフレームの符号化処理が終了する。
【0051】更に、探索の終了条件として今ゲインを使
用したが、サブフレーム毎に求められる残差信号から、
探索によって得られるコードブックの音源信号を引い
て、残差信号のエネルギーを計算し直し、その残差信号
のエネルギーが、複数探索に於いてある値を割り込んだ
ことを探索の終了条件としても構わない。また、適応コ
ードブックの合成フィルタの応答と、各探索で得られた
確率コードブックの合成フィルタの応答を、直交させて
おくことが望ましい。また、探索毎にゲインの量子化幅
を適応的に変化させることもできる。
【0052】図8及び図9は、この発明の第3の実施例
を示したものである。同実施例のブロック図の符号側を
図8(a)、復号側を図8(b)に示す。上述した第1
の実施例と異なっているのは、符号側で確率コードブッ
ク6のゲインの値を量子化する量子化テーブル25と、
この量子化テーブル25を書き替える量子化テーブル書
き替え器26が追加された点と、復号側でインデックス
igを受け取る量子化テーブル27と、この量子化テー
ブル27を書き替える量子化テーブル書き替え器28が
追加された点である。
【0053】量子化の方法としては、例えばテーブル内
のゲインのうちで、実際のゲインと最も誤差の小さいも
のを選択し、そのインデックスigと量子化されたゲイ
ンgsnを求める。gsnは、ゲイン器8と量子化テー
ブル書き替え器26に送出され、量子化テーブル25を
書き換える。そして、そのインデックスigを復号側に
送出する。
【0054】復号側ではインデックスigを受け取り、
igを量子化テーブル27によって量子化されたゲイン
の値gsnに変換する。量子化テーブルの出力gsn
は、ゲインg16と量子化テーブル書き替え器28に送
出され、量子化テーブル27を書き替えるといった動作
を行う。以下、どのような手順で量子化テーブルの書き
替え作業を行うかについて説明する。
【0055】上述した第2の実施例で述べたゲインは、
通常値を表すのに1サブフレーム当り11〜13ビット
必要である。したがって、量子化テーブル25によって
量子化されて送られる。ゲインを量子化する際には、一
般的に、図9に示されるように、値が大きいところでは
粗に、値が0に近付くほど密になるよう不均一量子化さ
れる。同図では、実際のゲインを16分割しているの
で、必要なビット数は4ビットとなり、1サブフレーム
当り7ビット〜9ビットの情報の圧縮になっている。
【0056】図9に基いてこの第3の実施例を説明する
と、ゲインの最大値を±gsmaxとし、1回目の確率
コードブック探索に於いて、±gsmaxの中から量子
化されたゲイン−gs1 (−gsmax≦gs1 ≦gs
max)がその値を示すゲインインデックスigによっ
て選ばれたとする。次の探索で得られるゲインをgsと
すると、gsは±gs1 の間(−gs1 ≦gs≦g
1 )にある。そこで、次に探索されるゲインの最大値
を±gs1として、gs1 /gsmaxを16分割され
た量子化テーブルに掛け、分割比率を保ったまま量子化
テーブル書き替え器26の量子化テーブルを書き替え
る。
【0057】図9で破線で表されたものが、±gs1を
最大値とした新しい量子化テーブルである。書き替えを
行った量子化テーブルでgsが探索が行われ、gs2に
量子化され、gs2を示すゲインインデックスigが復
号側へ送出される。以下同様にして、n回探索された量
子化されたゲインgsnを求める際には、その値gsn
が1つ前の探索で求まったゲイン−gsn-1とgsn-1
の間にあることを利用して、量子化幅を変更することが
できる。以上で1サブフレームの処理が終了し、量子化
されたゲインgsnと分割幅をgsmaxとgsmax
を基準とした分割幅に戻しておく。
【0058】一方、復号側では、符号側で得られたgs
maxを基準に作成されたゲインインデックスigか
ら、ゲインgs1 を量子化テーブル27によって求め、
その値を確率コードブック15に掛け合わせると共に、
量子化テーブル書き替え器28に送り、その値±gs1
を最大値に持つテーブルを符号側と同じ演算を使って作
成し、次のゲインインデックスigを待つ。以降同様に
して、gsnを1つ前の量子化されたゲイン±gsn-1
から得ることができる。
【0059】以上で1サブフレームの処理が終了し、量
子化されたゲインgsnと分割幅をgsmaxとgsm
axを基準とした分割幅に戻しておく。この処理によっ
て1回目は粗く、処理を行う毎にゲインの量子化幅を細
かくするといった処理を実現することができる。
【0060】尚、ここでは分割数を16としたが、これ
に限られずに何分割としても構わない。また、分割の際
の演算として分割比を一定にするような演算を選択した
が、分割の際の演算は符号側と復号側で一致させておけ
ばよく、演算に左右されないことはもちろんである。例
えば演算の一例として、最大値が±gsn-1のとき、そ
の中でgsnが探索によって選択されたとすると、gs
-1からgsnに移ったとき余った個数を、次回の探索
の際に±gsnの量子化されたゲインの補間として割り
当てても良い。その際には、符号側と復号側で同一の補
間規則にする必要がある。また、上述した第2の実施例
で述べた探索の打ち切り処理を加えても良いことはもち
ろんである。次に、この発明の第4の実施例について説
明する。
【0061】上述した第1の実施例では、確率コードブ
ック探索に用いる確率コードブックは、同一のものとし
たが、この第4の実施例では、確率コードブックを探索
を行う毎に変化させる方法を述べる。いま、例として音
声信号の特徴量として、音声のサブフレーム毎のエネル
ギーを使用するものとする。
【0062】図10(a)及び(b)は、同実施例の符
号側と復号側のブロック図である。同図に於いて、図1
(a)及び(b)と異なっている部分は、符号側の確率
コードブック探索に於いて、その回数nにより確率コー
ドブック6の切り替えを行う13の確率コードブック切
り替え器29が、復号側で確率コードブック切り替え器
30が備わっており点である。そして、符号化に於いて
回数nによって異なる確率コードブックのインデックス
isn及びゲインgsnを復号側に探索回数nと共に送
る点と、回数nによって復号側でコードブックを切り替
え、切り替えたコードブックのインデックスisn及び
ゲインgsnにより復号を行うという点が異なる。適応
コードブックサーチまでは、上述した第1の実施例と同
様なので省略し、確率コードブックの探索のみを詳しく
説明する。
【0063】確率コードブックは、先ずそのサブフレー
ムを探索する回数がセットされる。例えば、その回数を
第1の実施例と同様、フレーム毎に6回とすると、図3
に示されるように、第3サブフレームに音声の立ち上が
りがあった場合、先ず第1、第2、第4サブフレームに
於いて、従来と同様の確率コードブック探索処理を行
う。しかしながら、第3サブフレームに於いては、従来
の探索に加えてあと2回分探索、すなわち探索回数を3
とセットする。確率コードブックの探索は、この値をデ
クリメントし、値が0になったときに終了する。このと
きに第の1実施例と異なるのは、探索に用いる確率コー
ドブックが、確率コードブック切り替え器29によって
探索の度に異なるという点である。
【0064】この様子を、図11のフローチャートを参
照して、サブフレーム毎の処理として説明する。音声
は、先ず適応コードブックのインデックスiaで指し示
された内容にゲインgaを掛け合わせたものを音源信号
として、重み付け合成フィルタ3により合成された信号
が引かれ、確率コードブック探索が行われる。つまり、
サブフレーム単位の音声を入力し(ステップS21)、
適応コードブックを探索した後(ステップS22)、適
応コードブックの影響を取り除く(ステップS23)。
確率コードブックは、先ずそのサブフレームを探索する
回数nがセットされ(ステップS24)、確率コードブ
ック探索が行われる(ステップS25)。
【0065】すなわち、第3サブフレーム以外のサブフ
レームのうち第1、第2、第4サブフレームで1がセッ
トされ、第3サブフレームでは3が探索回数としてセッ
トされる。確率コードブックの探索は、先ず適応コード
ブックの合成信号を引いた信号に対し行われ、前の回数
をデクリメントして(ステップS26)、0であれば処
理を終了し(ステップS27)、そうでなければ処理を
続行する(ステップS28、S29)。
【0066】2回目以降は、確率コードブックのインデ
ックスis1で指し示された内容にゲインgs1を掛け
合わせたものから合成された信号が引かれた信号に対し
て探索が行われる。探索は、回数が規定値に達したとき
まで続行される。この際に、使用される確率コードブッ
クは、2回目以降の探索に対し、最適なコードを学習に
よって得ておくことが望ましい。この学習によって、よ
り最適なコードブックを最小の探索で得ることができ
る。更に、確率コードブックは、同一のエネルギーを持
つことが望ましい。
【0067】このときに音源信号は、適応コードブック
のインデックスで指定された内容にゲインを掛けたもの
と、それぞれの異なる確率コードブックのインデックス
で指し示された内容にそれぞれの探索によって得られた
ゲインを掛け合わせた信号の1次結合として表される。
合成音声信号は、音源信号を重み付け合成フィルタ3に
通すことによって得られる。以上で、1サブフレームの
符号化処理が終了する。
【0068】また、復号側には、LPCパラメータα
と、適応コードブック17のインデックスiaとゲイン
gaと、n回サーチした確率コードブック15のインデ
ックスisnとゲインgsnが、例えば図5に示された
データ形式で、サブフレーム毎にn個分送られる。そし
て、符号側から送出されたLPCパラメータαを合成フ
ィルタ14の係数として用い、音源信号として適応コー
ドブック17のインデックスiaで指し示された内容に
ゲインgaを掛け合わせたものと、探索毎にそれぞれの
確率コードブックとを、確率コードブック切り替え器3
0によって切り替える。ここで切り替えられたそれぞれ
の確率コードブック6から、確率コードブックnのイン
デックスis1からisnで指し示された内容に、ゲイ
ンgs1からgsnをそれぞれ掛け合わせたものとの1
次結合を音源信号として、その音源信号を合成フィルタ
14に通すことで音声が合成される。
【0069】尚、この第4の実施例では、あくまで処理
内容の一例を述べたものであって、確率コードブックの
内容に影響されない。また、上述した第2の実施例で述
べた探索の打ち切り処理を加えても良く、適応コードブ
ックの合成フィルタの応答と各探索で得られた確率コー
ドブックの合成フィルタの応答を直交させておくことが
望ましい。次に、この発明の第5の実施例について説明
する。
【0070】上述した第4の実施例では、確率コードブ
ック探索に用いる確率コードブックは、探索に最適化さ
れていたが、この第5の実施例では、確率コードブック
を探索を行う毎に変化させるが、その内容は必ずしも探
索に最適化されていないものの確率コードブックのエネ
ルギーが一定で、且つメモリの大幅な削減につながる方
法について述べる。
【0071】例として、音声信号の特徴量として、音声
のサブフレーム毎のエネルギーを使用するものとする。
図12(a)及び(b)は、第5の実施例の符号側と復
号側のブロック図である。尚、図10(a)及び(b)
と構成が同じ部分は、同一の参照番号を付している。
【0072】図12(a)及び(b)に於いて、図10
(a)及び(b)と異なっている部分は、次の通りであ
る。すなわち、符号側では、確率コードブック探索に於
いて、その回数nにより確率コードブック6を探索の度
毎にループさせるループ器31が確率コードブック切り
替え器の代わりに備わっている。これにより、符号化に
於いて探索の度毎に異なる確率コードブックを容易に作
成可能となる。また、復号側では、確率コードブック1
5を探索の度毎にループ器32を用いてループさせ、ル
ープさせたコードブックのインデックスisn及びゲイ
ンgsnを用いて復号を行うという点である。
【0073】ループ器31及び32を用いることで、確
率コードブックを複数持つことがなくなり、結果として
メモリの大幅な削減ができ、且つ同一のエネルギーを持
つ確率コードブックを容易に作成することができる。
尚、適応コードブックサーチまでは、上述した第1の実
施例と同様なので以下の説明では省略し、確率コードブ
ックの探索のみを詳しく説明する。
【0074】確率コードブック6は、先ずそのサブフレ
ームを探索する回数がセットされる。例えば、その回数
を第1の実施例と同様、フレーム毎に6回とすると、図
3に示されるように、第3サブフレームに音声の立ち上
がりがあった場合、先ず第1、第2、第4サブフレーム
に於いて、従来と同様の確率コードブック探索処理を
行。しかしながら、第3サブフレームに於いては、従来
の探索に加えてあと2回分探索、すなわち探索回数を3
とセットする。確率コードブックの探索は、この値をデ
クリメントし、値が0になったときに終了する。このと
きに第1の実施例と異なるのは、探索に用いる確率コー
ドブック6の内容が、ループ器31によって探索の度に
異なるという点である。
【0075】この様子を、図13のフローチャートに従
って、サブフレーム毎の処理として説明する。音声は、
先ず適応コードブックのインデックスiaで指し示され
た内容にゲインgaを掛け合わせたものを音源信号とし
て、重み付け合成フィルタ3より合成された信号が引か
れ、確率コードブック6の探索が行われる。つまり、サ
ブフレーム単位の音声を入力し(ステップS31)、適
応コードブックを探索した後(ステップS32)、適応
コードブックの影響を取り除く(ステップS33)。確
率コードブックは、先ずそのサブフレームを探索する回
数nがセットされ(ステップS34)、確率コードブッ
ク探索が行われる(ステップS35)。
【0076】すなわち、第3サブフレーム以外のサブフ
レームのうち第1、第2、第4サブフレームで1がセッ
トされ、第3サブフレームでは3が探索回数としてセッ
トされる。確率コードブックの探索は、先ず適応コード
ブックの合成信号を引いた信号に対し行われ、前の回数
をデクリメントして(ステップS36)、0であれば処
理を終了するが(ステップS37)、そうでなければ処
理を続行する(ステップS38、S39)。
【0077】2回目以降は、探索の前に、図14に示さ
れるように、確率コードブック6の内容をループさせ、
結果として元のコードブックと異なった内容にしてお
き、探索を行う。そして、探索の結果得られたインデッ
クスの内容にゲインを掛け合わせたものから合成された
信号が引かれた信号に対して、再度探索を行う。探索
は、探索回数が規定値に達したときまで続行される。
【0078】このとき、音源信号は、適応コードブック
7のインデックスで指定された内容にゲインを掛けたも
のと、確率コードブック6のインデックスで指定された
内容を何度目の探索で選ばれたかによって、その度毎に
ループ処理が施され、探索によって得られたゲインを掛
け合わせた信号の1次結合として表される。合成音声信
号は、音源信号を重み付け合成フィルタ3に通すことに
よって得られる。以上で、1サブフレームの符号化処理
が終了する。
【0079】これに対し、復号側には、LPCパラメー
タαと、適応コードブック17のインデックスiaとゲ
インgaと、n回サーチした確率コードブック15のイ
ンデックスisnとゲインgsnが、例えば図5に示さ
れたデータ形式で、サブフレーム毎にn個分送られる。
そして、符号側から送出されたLPCパラメータαを、
合成フィルタ14の係数として用いる。また、音源信号
として適応コードブック17のインデックスiaで指し
示された内容にゲインgaを掛け合わせたものと、探索
毎にそれぞれの確率コードブックをループ器32によっ
てループさせ、ループさせたそれぞれの確率コードブッ
ク1から確率コードブックnのインデックスis1から
isnで指し示された内容にゲインgs1からgsnを
それぞれ掛け合わせたものとの1次結合を、音源信号と
して、その音源信号を合成フィルタ14に通すことで音
声が合成される。
【0080】この処理を行うことで、複数の確率コード
ブックを1種類の確率コードブックの組を持つだけで実
現し、且つループ処理により確率コードブックの持つエ
ネルギーが一定となる処理が実現できる。尚、この第5
の実施例では、あくまで処理内容の一例を述べたもので
あって、確率コードブックの内容やループの回数には影
響されない。
【0081】また、上述した第2の実施例の探索の打ち
切り処理を加えても良く、適応コードブックの合成フィ
ルタの応答と各探索で得られた確率コードブックの合成
フィルタの応答を直交させておくことが望ましい。
【0082】
【発明の効果】以上のようにこの発明によれば、CEL
Pの実時間処理を妨げることなく、音声の立ち上がり等
でも十分な音質を得ることのできるコード駆動音源音声
符号化システムを提供することができる。
【図面の簡単な説明】
【図1】(a)は、ピッチ検出手段として適応コードブ
ックを使用する、この発明の第1の実施例の符号側のブ
ロック図、(b)は(a)で符号化された復号側のブロ
ック図である。
【図2】音声波形、サブフレームエネルギ―、エネルギ
―差分のコードを示したもので、(a)は無声(無音)
の例を示した図、(b)は音声の定常部を示した図であ
る。
【図3】第3サブフレームに音声の立ち上がりがあった
場合の音声波形、サブフレームエネルギ―、エネルギ―
差分のコードを示した図である。
【図4】第1の実施例によるサブフレーム毎の処理動作
を説明するフローチャートである。
【図5】符号側から復号側に送られるコードの1例を示
した図である。
【図6】この発明の第2の実施例に於ける構成の符号側
のブロック図である。
【図7】第2の実施例によるサブフレーム毎の処理動作
を説明するフローチャートである。
【図8】この発明の第3の実施例に於ける構成を示すも
ので、(a)は符号側のブロック図、(b)は復号側の
ブロック図である。
【図9】実際のゲインと量子化されたゲインとの関係を
示した図である。
【図10】この発明の第4の実施例に於ける構成を示す
もので、(a)は符号側のブロック図、(b)は復号側
のブロック図である。
【図11】第4の実施例によるサブフレーム毎の処理動
作を説明するフローチャートである。
【図12】この発明の第5の実施例に於ける構成を示す
もので、(a)は符号側のブロック図、(b)は復号側
のブロック図である。
【図13】第5の実施例によるサブフレーム毎の処理動
作を説明するフローチャートである。
【図14】確率コードブック6に於ける1回目からn回
目までの探索例を示した図である。
【図15】(a)は従来のCELPの代表例として、確
率コードブックを適応コードブックと共に使用する符号
側のブロック図、(b)は(a)で符号化された従来例
の復号側のブロック図である。
【符号の説明】
1…入力音声、2…線形予測分析器、3…重み付け合成
フィルタ、4…聴覚重み付けフィルタ、5、11…差分
器、6、15…確率コードブック、7、17…適応コー
ドブック、8、9、16、18…ゲイン器、10、19
…加算器、12…評価器、13、20…バッファ、14
…合成フィルタ、21…合成音声、22…エネルギー計
算部、23…探索回数セット部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力音声に対してフレームを線形予測分
    析する線形予測分析手段と、 サブフレーム毎に上記入力音声の特徴量を算出する算出
    手段と、 この算出手段で求められた上記サブフレーム毎の特徴量
    を検出する検出手段と、 音声中の雑音成分を格納する確率コードブックと、 この確率コードブックと共に音声中のピッチ成分を検出
    するピッチ検出手段と、 上記確率コードブックからの音声信号と上記ピッチ検出
    手段の信号と上記線形予測分析手段から求められた係数
    とから音源信号を作成し、その音源信号から合成音声を
    合成する合成フィルタと、 この合成フィルタで合成された合成音声と上記入力音声
    とを比較する比較手段とを具備し、 上記確率コードブックは上記検出手段と上記比較手段の
    状態によってその内容を適応的に変更して探索を適応的
    に行うことを特徴とするコード駆動音源音声符号化装
    置。
JP5047920A 1993-03-09 1993-03-09 コード駆動音源音声符号化装置 Withdrawn JPH06259097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5047920A JPH06259097A (ja) 1993-03-09 1993-03-09 コード駆動音源音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5047920A JPH06259097A (ja) 1993-03-09 1993-03-09 コード駆動音源音声符号化装置

Publications (1)

Publication Number Publication Date
JPH06259097A true JPH06259097A (ja) 1994-09-16

Family

ID=12788811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5047920A Withdrawn JPH06259097A (ja) 1993-03-09 1993-03-09 コード駆動音源音声符号化装置

Country Status (1)

Country Link
JP (1) JPH06259097A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006035810A1 (ja) * 2004-09-30 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006035810A1 (ja) * 2004-09-30 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
US7904292B2 (en) 2004-09-30 2011-03-08 Panasonic Corporation Scalable encoding device, scalable decoding device, and method thereof

Similar Documents

Publication Publication Date Title
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
CA2430111C (en) Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs
EP0415675B1 (en) Constrained-stochastic-excitation coding
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP3357795B2 (ja) 音声符号化方法および装置
EP1096476B1 (en) Speech signal decoding
CA2290859C (en) Speech encoding method and speech encoding system
US6768978B2 (en) Speech coding/decoding method and apparatus
JPH0944195A (ja) 音声符号化装置
JPH04344699A (ja) 音声符号化・復号化方法
JP3353852B2 (ja) 音声の符号化方法
US6842732B2 (en) Speech encoding and decoding method and electronic apparatus for synthesizing speech signals using excitation signals
JP3050978B2 (ja) 音声符号化方法
JPH06259097A (ja) コード駆動音源音声符号化装置
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP3232701B2 (ja) 音声符号化方法
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3153075B2 (ja) 音声符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JPH09179593A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000509