JP2000132199A

JP2000132199A - 音声符号化装置／復号化装置

Info

Publication number: JP2000132199A
Application number: JP11343086A
Authority: JP
Inventors: Kazutoshi Yasunaga; 和敏安永; Toshiyuki Morii; 利幸森井
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1999-12-02
Filing date: 1999-12-02
Publication date: 2000-05-12

Abstract

(57)【要約】【課題】音声情報を効率的に符号化／復号化し、品質
の高い合成音声を提供する。【解決手段】パルスベクトル生成部１０１と、拡散パ
タン格納・選択部１０２と、パルスベクトル拡散部１０
３と、拡散ベクトル加算部１０４とを備え、拡散パタン
格納・選択部には、歪み評価基準式をコスト関数とし、
当該コスト関数の値がより小さくなるように予め学習し
て得られた拡散パタンが各チャネル毎に格納されている
ものとする。このようにすることで、実際の雑音音源情
報の形状と類似した形状の音源ベクトルを生成すること
ができるようになる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声情報を効率的
に符号化／復号化するための、音源ベクトル生成装置、
及び音声符号化装置／復号化装置、音声信号通信システ
ム、並びに音声信号記録システムに関する。

【０００２】

【従来の技術】従来の音声符号化技術としては、Code E
xcited Linear Prediction："High Quality Speech at
Low Bit Rate"，M. R. Schroeder, Proc. ICASSP'85, p
p.937-940 （文献１）に記載のＣＥＬＰ音声符号化装置
がある。この音声符号化装置は、入力音声を一定時間で
区切ったフレーム毎に線形予測を行い、フレーム毎の線
形予測による予測残差（励振信号）を、過去の駆動音源
を格納した適応符号帳と複数の雑音符号ベクトルを格納
した雑音符号帳を用いて符号化する装置である。

【０００３】ここではまず、この従来のＣＥＬＰ音声符
号化装置を、図６を用いて詳しく説明する。

【０００４】線形予測分析部１２は、ＣＥＬＰ音声符号
化装置に入力された音声信号１１を分析し、線形予測係
数を算出する。ここで、線形予測係数とは、音声信号の
周波数スペクトルの包絡特性を表すパラメータである。
線形予測分析部１２で得られた線形予測係数は、線形予
測係数符号化部１３において量子化された後、線形予測
係数復号化部１４へ送られる。なお、この時に得られる
量子化番号は、線形予測符号として符号出力部２４へ出
力される。線形予測係数復号化部２４は、線形予測係数
符号化部１３で量子化された線形予測係数を復号化して
合成フィルタの係数を得、合成フィルタ１５へ出力す
る。

【０００５】適応符号帳１７は、適応符号ベクトルの候
補を複数種類出力する符号帳であり、駆動音源を過去数
フレーム分格納したバッファによって構成される。な
お、適応符号ベクトルとは、入力音声内の周期成分を表
現する時系列ベクトルである。

【０００６】雑音符号帳１８は、雑音符号ベクトルの候
補を複数種類（割り当てられたビット数に対応する種
類）格納した符号帳である。なお、雑音符号ベクトルと
は、入力音声内の非周期成分を表現する時系列ベクトル
である。

【０００７】適応符号ゲイン重み付け部１９および雑音
符号ゲイン重み付け部２０は、適応符号帳１７および雑
音符号帳１８から出力される候補ベクトルそれぞれに対
して、重み符号帳２１から読みだした適応符号ゲインと
雑音符号ゲインをそれぞれ乗じ、加算部２２へ出力す
る。なお、重み符号帳とは、適応符号ベクトル候補に乗
じる重みと、雑音符号ベクトル候補に乗じる重みをそれ
ぞれ複数種類（割り当てられたビット数に対応する種
類）ずつ格納したメモリである。

【０００８】加算部２２は、適応符号ゲイン重み付け部
１９、雑音符号ゲイン重み付け部２０においてそれぞれ
重み付けられた適応符号ベクトル候補と雑音符号ベクト
ル候補を加算して駆動音源ベクトル候補を生成し、合成
フィルタ１５へ出力する。合成フィルタ１５は、線形予
測係数復号化部１４で得られた合成フィルタの係数によ
って構成される全極型フィルタであり、加算部２２から
の駆動音源ベクトル候補を入力すると、合成音声ベクト
ル候補を出力する機能を有している。

【０００９】歪み計算部１６は、合成フィルタ１５の出
力である合成音声ベクトル候補と入力音声１１との歪み
を計算し、得られた歪みの値を符号番号特定部２３に出
力する。符号番号特定部２３は、歪み計算部１６で算出
する歪みを最小化するような３種類の符号番号（適応符
号番号、雑音符号番号、重み符号番号）を、３種類の符
号帳（適応符号帳、雑音符号帳、重み符号帳）それぞれ
について特定する。そして、符号番号特定部２３で特定
された３種類の符号番号は、符号出力部２４へ出力され
る。符号出力部２４は、線形予測係数符号化部１３で得
られた線形予測符号番号と、符号番号特定部２３で特定
された適応符号番号、雑音符号番号、重み符号番号をま
とめて、伝送路へ出力する。

【００１０】次に、図７を用いて従来のＣＥＬＰ音声復
号化装置の動作を説明する。

【００１１】音声復号化装置（図７）では、まず、符号
入力部３１が、音声符号化装置（図６）から送信された
符号を受信し、受信した符号に対応する線形予測符号番
号と、適応符号番号、雑音符号番号、重み符号番号に分
解し、分解して得られた符号をそれぞれ、線形予測係数
復号化部３２、適応符号帳３３、雑音符号帳３４、重み
符号帳３５へ出力する。

【００１２】次に、線形予測係数復号化部３２が符号入
力部３１で得られた線形予測符号番号を復号化して合成
フィルタの係数を得、合成フィルタ３９へ出力する。そ
して、適応符号帳内の適応符号番号と対応する位置から
適応符号ベクトルが読みだされ、雑音符号帳から雑音符
号番号と対応する雑音符号ベクトルが読みだされ、さら
に、重み符号帳から重み符号番号と対応した適応符号ゲ
インと雑音符号ゲインが読みだされる。そして、適応符
号ベクトル重付け部３６において、適応符号ベクトルに
適応符号ゲインが乗じられ加算部３８へと送られる。ま
た同様に、雑音符号ベクトル重付け部３７において、雑
音符号ベクトルに雑音符号ゲインが乗じられ加算部３８
へ送られる。

【００１３】加算部３８は、上記２つの符号ベクトルが
加算して駆動音源ベクトルを生成し、生成された駆動音
源はバッファ更新のために適応符号帳３３へ、また、フ
ィルタを駆動のために合成フィルタ３９へと送られる。
合成フィルタ３９は、加算部３８で得られた駆動音源ベ
クトルで駆動され、線形予測係数復号化部３２の出力を
用いて合成音声を再生する。

【００１４】なお、ＣＥＬＰ音声符号化装置の歪み計算
部１６では、一般に、次の（数１）により求められる歪
みＥが計算される。

【００１５】

【数１】

【００１６】ここで、（数１）の歪みＥを最小化するた
めには、適応符号番号、雑音符号番号、重み符号番号の
全組合せについて閉ループで歪みを算出し、各符号番号
を特定することが理想である。しかし、（数１）を閉ル
ープ探索すると演算処理量が大きくなりすぎるため、一
般的には、まず、適応符号帳を用いてベクトル量子化に
より適応符号番号を特定し、次に雑音符号帳を用いたベ
クトル量子化により雑音符号番号を特定し、最後に、重
み符号帳を用いたベクトル量子化により重み符号番号を
特定する。ここでは、この場合について、雑音符号帳を
用いたベクトル量子化処理をさらに詳しく説明する。

【００１７】適応符号番号および適応符号ゲインが、先
にもしくは暫定的に決まっている場合には、（数１）の
歪み評価式は次の（数２）に変形される。

【００１８】

【数２】

【００１９】ただし、（数２）内のベクトルｘは、先に
もしくは暫定的に特定した適応符号番号と適応符号ゲイ
ンを用いた、次の（数３）によって求められる雑音音源
情報（雑音符号番号特定用のターゲットベクトル）であ
る。

【００２０】

【数３】

【００２１】雑音符号番号を特定した後に雑音符号ゲイ
ンgcを特定する場合には、（数２）内のgcが任意の値を
とり得ると仮定できるので、（数２）を最小化する雑音
符号ベクトルの番号を特定する処理（雑音音源情報のベ
クトル量子化処理）は、次の（数４）の分数式を最大化
する雑音符号ベクトルの番号特定に置き換えられること
が一般に知られている。

【００２２】

【数４】

【００２３】すなわち、適応符号番号および適応符号ゲ
インが前もってもしくは暫定的に特定されている場合、
雑音音源情報のベクトル量子化処理とは、歪み計算部１
６で算出する（数４）の分数式を最大化する雑音符号ベ
クトル候補の番号を特定する処理となる。

【００２４】初期のＣＥＬＰ符号化装置／復号化装置で
は、割り当てられたビット数に対応する種類のランダム
数列をメモリに格納したものが雑音符号帳として用いら
れていた。しかし、非常に多くのメモリ容量が必要にな
るとともに、雑音符号ベクトル候補それぞれについて
（数４）の歪みを計算するための演算処理量が膨大にな
るという課題があった。

【００２５】従来、この課題を解決する一方法として
は、"8KBIT/S ACELP CODING OF SPEECH WITH 10 MS SPE
ECH-FRAME：A CANDIDATE FOR CCITT STANDARDIZATIO
N"：R. Salami, C. Laflamme, J-P. Adoul, ICASSP'94,
pp.II-97〜II-100，1994（文献２）などに記載される
ように、代数的に音源ベクトルを生成する代数的音源ベ
クトル生成部を用いたＣＥＬＰ音声符号化装置／復号化
装置が挙げられる。

【００２６】

【発明が解決しようとする課題】しかしながら、上記代
数的音源生成部を雑音符号帳に用いたＣＥＬＰ音声符号
化装置／復号化装置では、（数３）によって求めた雑音
音源情報（雑音符号番号特定用のターゲット）を、少数
本のパルスで常に近似表現しているため、音声品質の向
上を図る上で限界がある。このことは、（数３）の雑音
音源情報ｘの要素を実際に調べると、それが少数本のパ
ルスだけによって構成される場合がほとんどないことか
ら明らかである。

【００２７】本発明は、音声信号を実際に分析した時に
得られる音源ベクトルの形状と、統計的に類似性の高い
形状の音源ベクトルを生成することができる新たな音源
ベクトル生成装置を提供すること、さらに、上記音源ベ
クトル生成装置を雑音符号帳として用いることで、代数
的音源生成部を雑音符号帳として用いる場合より品質の
高い合成音声を得ることが可能なＣＥＬＰ音声符号化装
置／復号化装置、音声信号通信システム、音声信号記録
システムを提供することを目的とする。

【００２８】

【課題を解決するための手段】この課題を解決するため
に本発明は、ベクトル軸上のある１要素に極性付き単位
パルスが立ったパルスベクトルを生成するチャネルをＮ
個（Ｎ≧１）備えたパルスベクトル生成部と、前記Ｎ個
のチャネルごとにＭ種類（Ｍ≧２）の拡散パタンを格納
する機能と、格納したＭ種類の拡散パタンからある１種
類の拡散パタンを選択する機能とを併せ持つ拡散パタン
格納・選択部と、前記パルスベクトル生成部から出力さ
れるパルスベクトルと前記拡散パタン格納・選択部から
選択される拡散パタンとの重畳演算をチャネルごとに行
い、Ｎ個の拡散ベクトルを生成する機能を有するパルス
ベクトル拡散部と、前記パルスベクトル拡散部により生
成されるＮ個の拡散ベクトルを加算して音源ベクトルを
生成する機能を有する拡散ベクトル加算部とを備えた音
源ベクトル生成装置を雑音符号帳として用い、前記雑音
符号帳で雑音音源情報をベクトル量子化することにより
得られ、かつ、拡散パタンが、雑音音源情報をベクトル
量子化した際に生じる量子化歪みをより小さくするよう
に予め学習して得られたものであることで、従来の代数
的音源生成部を雑音符号帳に用いた音声符号化装置／復
号化装置よりも、より実際の形状に近い音源ベクトルを
生成することができ、よって、より品質の高い合成音声
を出力することが可能な音声符号化装置／復号化装置が
得られる。

【００２９】

【発明の実施の形態】以下、本発明の実施の実施の形態
について、図１から図５を用いて説明する。

【００３０】（実施の形態１）図１は本実施の形態にお
ける音源ベクトル生成装置の構成ブロック図を示す。図
１において、１０１はベクトル軸上のある１要素に極性
付き単位パルスが立ったベクトル（以下：パルスベクト
ルと呼ぶ）を生成するチャネルをＮ個（本実施の形態で
は、Ｎ＝３の場合について説明する）備えたパルスベク
トル生成部、１０２は前記Ｎ個のチャネルごとにＭ種類
（本実施の形態では、Ｍ＝２の場合について説明する）
の拡散パタンを格納する機能と、格納したＭ種類の拡散
パタンからある１種類の拡散パタンを選択する機能とを
併せ持つ拡散パタン格納・選択部、１０３は前記パルス
ベクトル生成部１０１から出力されるパルスベクトルと
前記拡散パタン格納・選択部１０２から選択される拡散
パタンとの重畳演算をチャネルごとに行い、Ｎ個の拡散
ベクトルを生成する機能を有するパルスベクトル拡散
部、１０４は前記パルスベクトル拡散部１０３により生
成されるＮ個の拡散ベクトルを加算して音源ベクトルを
生成する機能を有する拡散ベクトル加算部、１０５は生
成された音源ベクトルである。なお、本実施の形態で
は、パルスベクトル生成部１が、下記の（表１）記載の
規則に従ってＮ個（Ｎ=３）のパルスベクトルを代数的
に生成する場合について説明する。

【００３１】

【表１】

【００３２】以上のように構成された音源ベクトル生成
装置の動作を、図１を用いて説明する。拡散パタン格納
・選択部１０２は、チャネル毎に２種類ずつ格納した拡
散パタンから１種類ずつ選択し、パルスベクトル拡散部
１０３へ出力する。ただしここで、選択された拡散パタ
ンの組合せ（組合せ総数：Ｍ＾Ｎ＝８通り）に対応し
て、番号が割り当てられることとする。次に、パルスベ
クトル生成部１０１が、（表１）記載の規則に従い代数
的にパルスベクトルをチャネル数分（本実施の形態では
３個）生成する。

【００３３】パルスベクトル拡散部１０３は、拡散パタ
ン格納・選択部１０２で選択されたパターンと、パルス
ベクトル生成部１０１で生成されたパルスとを、下記
（数５）による重畳演算に用いて、チャネル毎に拡散ベ
クトルを生成する。

【００３４】

【数５】

【００３５】拡散ベクトル加算部１０４は、パルスベク
トル拡散部１０３で生成された３個の拡散ベクトルを、
下記（数６）により加算して、音源ベクトル１０５を生
成する。

【００３６】

【数６】

【００３７】このように構成された音源ベクトル生成装
置では、拡散パタン格納・選択部が選択する拡散パタン
の組合せ方や、パルスベクトル生成部が生成するパルス
ベクトル内のパルスの位置および極性に変化を持たせる
ことで、多様な音源ベクトルを生成することが可能にな
る。そして、このように構成された音源ベクトル生成装
置では、拡散パタン格納・選択部１０２が選択する拡散
パタンの組合せ方と、パルスベクトル生成部１０１が生
成するパルスベクトルの形状（パルス位置およびパルス
極性）の組合せ方の２種類の情報に対して、それぞれ１
対１に対応する番号を割り当てておくことが可能であ
る。また、拡散パタン格納・選択部１０２には、実際の
音源情報をもとに予め学習を行い、その学習の結果得ら
れる拡散パタンを格納しておくことが可能である。

【００３８】また、上記音源ベクトル生成装置を音声符
号化装置／復号化装置の音源情報生成部に用いれば、拡
散パタン格納・選択部が選択した拡散パタンの組合せ番
号と、パルスベクトル生成部が生成したパルスベクトル
の組合わせ番号（パルス位置およびパルス極性を特定で
きる）との２種類の番号を伝送することで、雑音音源情
報の伝送を実現できるようになる。

【００３９】また、上記のように構成した音源ベクトル
生成部を用いると、代数的に生成したパルス音源を用い
る場合よりも、実際の音源情報に似た形状（特性）の音
源ベクトルを生成することが可能になる。

【００４０】なお、本実施の形態では、拡散パタン格納
・選択部１０２が１チャネルあたり２種類の拡散パタン
を格納している場合について説明したが、各チャネルに
対して２種類以外の拡散パタンを割り当てた場合にも、
同様の作用・効果が得られる。

【００４１】なおまた、本実施の形態では、パルスベク
トル生成部１０１が３チャネル構成かつ（表１）記載の
パルス生成規則に基づいている場合について説明した
が、チャネル数が異なる場合や、パルス生成規則として
（表１）記載以外のパルス生成規則を用いた場合にも、
同様の作用・効果が得られる。

【００４２】また、上記音源ベクトル生成装置あるいは
音声符号化装置／復号化装置を有する、音声信号通信シ
ステムまたは音声信号記録システムを構成することによ
り、上記音源ベクトル生成装置の有する作用・効果を得
ることができる。

【００４３】（実施の形態２）図２は本実施の形態にお
けるＣＥＬＰ音声符号化装置の構成ブロック図を示し、
図３はＣＥＬＰ型音声復号化装置の構成ブロック図を示
す。

【００４４】図２は、従来のＣＥＬＰ音声符号化装置の
雑音符号帳（図６内の１８）に、実施の形態１記載の音
源ベクトル生成装置（図１）を適用したものであり、図
３は、従来のＣＥＬＰ音声符号化装置の雑音符号帳（図
７内の３４）に、上記実施の形態１記載の音源ベクトル
生成装置を適用したものである。よって雑音音源情報の
ベクトル量子化処理以外の処理は、従来技術の項に記載
した内容と同様であり、本実施の形態では、図２および
図３における雑音音源情報のベクトル量子化処理を中心
に、音声符号化装置、音声復号化装置の説明を行う。ま
た、実施の形態１と同様に、チャネル数Ｎ＝３，１チャ
ネルの拡散パタン数Ｍ＝２，パルスベクトルの生成は
（表１）によるものとする。

【００４５】図２の音声符号化装置における雑音音源情
報のベクトル量子化処理は、（数４）の基準値を最大化
するような２種類の番号（拡散パタンの組合せ番号、パ
ルス位置とパルス極性の組合せ番号）を特定する処理で
ある。図１の音源ベクトル生成装置を雑音符号帳として
用いた場合に、拡散パタンの組合せ番号（８種類）とパ
ルスベクトルの組合せ番号（極性を考慮した場合：１６
３８４種類）を閉ループで特定するためには、拡散パタ
ン格納・選択部２１５が、まず始めに、自ら格納してい
る２種類の拡散パタンのうち、どちらか一方の拡散パタ
ンを選択し、パルスベクトル拡散部２１７へ出力する。
その後、パルスベクトル生成部２１６が、（表１）記載
の規則に従い代数的にパルスベクトルをチャネル数分
（本実施の形態では３個）生成し、パルスベクトル拡散
部２１７へ出力する。パルスベクトル拡散部２１７は、
拡散パタン格納・選択部２１５で選択された拡散パタン
と、パルスベクトル生成部２１６で生成されたパルスベ
クトルとを、（数５）による重畳演算に用いて、チャネ
ル毎に拡散ベクトルを生成する。拡散ベクトル加算部２
１８は、パルスベクトル拡散部２１７で得られた拡散ベ
クトルを加算して、音源ベクトル（雑音符号ベクトルの
候補となる）を生成する。そして、歪み計算部２０６
が、拡散ベクトル加算部２１８で得られた雑音符号ベク
トル候補を用いた（数４）の値を算出する。この（数
４）の値の算出を、（表１）記載の規則によって生成さ
れるパルスベクトルの組合せ全てについて行い、その中
から（数４）の値が最大になる時の拡散パタンの組合せ
番号、パルスベクトルの組合せ番号（パルス位置とその
極性の組合せ）、およびその時の最大値を符号番号特定
部２１３へ出力する。

【００４６】次に、拡散パタン格納・選択部２１５は、
格納している拡散パタンから、先ほどと異なる組合せの
拡散パタンを選択する。そして新たに選択しなおした拡
散パタンの組合せについて、上記と同様に（表１）の規
則に従ってパルスベクトル生成部２１６で生成されるパ
ルスベクトルの全組合せについて、（数４）の値を算出
する。そして、その中から、（数４）を最大にする時
の、拡散パタンの組合せ番号、パルスベクトルの組合せ
番号、および最大値を符号番号特定部２１３へ再度出力
する。

【００４７】この処理を、拡散パタン格納・選択部２１
５が格納している拡散パタンから選択できる全組合せ
（本実施の形態の説明では、組合せ総数は８）について
繰り返す。

【００４８】符号番号特定部２１３は、歪み計算部２０
６によって算出されたトータル８個の最大値を比較し、
その中から一番大きいものを選択し、その最大値を生成
した時の２種類の組合せ番号（拡散パタンの組合せ番
号、パルスベクトルの組合せ番号）を特定し、雑音符号
番号として符号出力部２１４へ出力する。

【００４９】一方、図３の音声復号化装置では、符号入
力部３０１が、音声符号化装置（図２）から送信される
符号を受信し、受信した符号を対応する線形予測符号番
号と、適応符号番号、雑音符号番号（拡散パタンの組合
せ番号、パルスベクトルの組合せ番号の２種類から構成
されている）、および重み符号番号に分解し、分解して
得られた符号をそれぞれ、線形予測係数復号化部３０
２、適応符号帳３０３、雑音符号帳３０４、重み符号帳
３０５へ出力する。なおここで、雑音符号番号のうち、
拡散パタンの組合せ番号は拡散パタン格納・選択部３１
１へ出力され、パルスベクトルの組合せ番号はパルスベ
クトル生成部３１２へ出力されるものとする。

【００５０】そして、線形予測係数復号化部３０２が線
形予測符号番号を復号化して合成フィルタの係数を得、
合成フィルタ３０９へ出力する。適応符号帳３０３で
は、適応符号番号と対応する位置から適応符号ベクトル
が読みだされる。

【００５１】雑音符号帳３０４では、拡散パタン格納・
選択部３１１が拡散パルスの組合せ番号に対応する拡散
パタンをチャネル毎に読みだしてパルスベクトル拡散部
３１３へ出力し、パルスベクトル生成部３１２がパルス
ベクトルの組合せ番号に対応したパルスベクトルをチャ
ネル数分生成してパルスベクトル拡散部３１３へ出力
し、パルスベクトル拡散部３１３が拡散パタン格納・選
択部３１１から受けた拡散パタンとパルスベクトル生成
部３１２から受けたパルスベクトルとを（数５）記載の
重畳演算に用いて拡散ベクトルを生成し、拡散ベクトル
加算部３１４へ出力する。拡散ベクトル加算部３１４が
パルスベクトル拡散部３１３で生成した各チャネルの拡
散ベクトルを加算して雑音符号ベクトルを生成する。

【００５２】そして、重み符号帳３０５から重み符号番
号と対応した適応符号ゲインと雑音符号ゲインが読みだ
され、適応符号ベクトル重付け部３０６において適応符
号ベクトルに適応符号ゲインが乗じられ、同様に雑音符
号ベクトル重付け部３０７において雑音符号ベクトルに
雑音符号ゲインが乗じられ、加算部３０８へ送られる。
加算部３０８は、ゲインが乗じられた上記２つの符号ベ
クトルを加算して駆動音源ベクトルを生成し、生成した
駆動音源ベクトルを、バッファ更新のために適応符号帳
３０３へ、また、合成フィルタを駆動するために合成フ
ィルタ３０９へと出力する。

【００５３】合成フィルタ３０９は、加算部３０８で得
られた駆動音源ベクトルで駆動され、合成音声３１０を
再生する。また適応符号帳３０３は、加算部３０８より
受けた駆動音源ベクトルでバッファを更新する。

【００５４】ただし、図２および図３内の拡散パタン格
納・選択部には、（数６）記載の音源ベクトルを（数
２）内のｃに代入した下記（数７）の歪み評価基準式を
コスト関数とし、当該コスト関数の値がより小さくなる
ように予め学習して得られた拡散パタンが各チャネル毎
に格納されているものとする。このようにすることで、
実際の雑音音源情報（（数４）内のベクトルｘ）の形状
と類似した形状の音源ベクトルを生成することができる
ようになるため、代数的音源ベクトル生成部を雑音符号
帳に用いたＣＥＬＰ音声符号化装置／復号化装置より
も、品質の高い合成音声を得ることが可能になる。

【００５５】

【数７】

【００５６】なお、本実施の形態では、拡散パタン格納
・選択部が、（数７）記載のコスト関数の値をより小さ
くするように予め学習して得られた拡散パタンをチャネ
ル毎にＭ個ずつ格納しておいた場合について説明した
が、実際にはＭ個の拡散パタン全てが学習によって得ら
れたものである必要はなく、学習によって得られた拡散
パタンを各チャネル毎に少くとも１種類格納しておくよ
うにすれば、そのような場合にも合成音声の品質を向上
させる作用・効果を得ることができる。

【００５７】なおまた、本実施の形態では、拡散パタン
格納・選択部が格納する拡散パタンの全組合せ、およ
び、パルスベクトル生成部６が生成するパルスベクトル
の位置候補の全組合せから、（数４）の基準値を最大化
する組合せ番号を閉ループで特定する場合について説明
したが、雑音符号帳の番号特定以前に求めたパラメータ
（適応符号ベクトルの理想ゲインなど）を基に予備選択
を行ったり、開ループで探索するなどしても同様の作用
・効果を得ることができる。

【００５８】また、上記音声符号化装置／復号化装置を
有する、音声信号通信システムまたは音声信号記録シス
テムを構成することにより、実施の形態１で記載した音
源ベクトル生成装置の有する作用・効果を得ることがで
きる。

【００５９】（実施の形態３）図４は本実施の形態にお
けるＣＥＬＰ音声符号化装置の構成ブロック図である。

【００６０】図４は、実施の形態１の音源ベクトル生成
装置（図１）を雑音符号帳に用いたＣＥＬＰ音声符号化
装置において、雑音符号帳を探索する以前に求まってい
る理想適応符号ゲインの値を用いて、拡散パタン格納・
選択部に格納された拡散パタンの予備選択を行う方法を
説明するための図であり、雑音符号帳周辺部以外は図２
記載のＣＥＬＰ音声符号化装置と同一である。よって本
実施の形態の説明は、図４記載のＣＥＬＰ音声符号化装
置における雑音音源情報のベクトル量子化処理について
の説明にとどめる。

【００６１】図４において、４０７は適応符号帳、４０
９は適応符号ゲイン重み付け部、４０８は実施の形態１
で説明した音源ベクトル生成装置によって構成された雑
音符号帳、４１０は雑音符号ゲイン重み付け部、４０５
は合成フィルタ、４０６は歪み計算部、４１３は符号番
号特定部、４１５は拡散パタン格納・選択部、４１６は
パルスベクトル生成部、４１７はパルスベクトル拡散
部、４１８は拡散ベクトル加算部、４１９は適応ゲイン
判定部である。ただし、本実施の形態において、上記拡
散パタン格納・選択部４１５が格納する格納するＭ種類
（Ｍ≧２）の拡散パタンのうちすくなくとも１種類は、
雑音音源情報をベクトル量子化する際に生じる量子化歪
みをより小さくするように予め学習し、当該学習の結果
得られた拡散パタンであることとする。

【００６２】本実施の形態では、説明簡単化のため、パ
ルスベクトル生成部のチャネル数Ｎは３、拡散パタン格
納・選択部が格納しているチャネルあたりの拡散パルス
の種類数Ｍは２とし、さらに、Ｍ種類（Ｍ＝２）の拡散
パタンは、１つが上記学習によって得られた拡散パタン
であり、もう一方は、乱数ベクトル生成装置によって生
成される乱数ベクトル列（以下：ランダムパタンと呼
ぶ）である場合として説明を行う。ちなみに、上記学習
によって得られる拡散パタンは、図１内のｗ11の様に、
長さは比較的短く、パルス的な形状の拡散パタンになる
ことがわかっている。

【００６３】図４のＣＥＬＰ音声符号化装置において
は、雑音音源情報のベクトル量子化の前に適応符号帳の
番号特定処理が行われる。よって、雑音音源情報のベク
トル量子化処理を行う時点では、適応符号帳のベクトル
番号（適応符号番号）および、理想適応符号ゲイン（暫
定的に決っている）を参照することが可能である。本実
施の形態では、このうちの理想適応符号ゲインの値を使
って、拡散パルスの予備選択を行う。

【００６４】具体的にはまず、適応符号帳探索の終了直
後に符号番号特定部４１３に保持されている適応符号ゲ
インの理想値が、歪み計算部４０６へ出力される。歪み
計算部４０６は、符号番号特定部４１３から受けた適応
符号ゲインを適応ゲイン判定部４１９へ出力する。適応
ゲイン判定部４１９は、まず始めに、歪み計算部４０６
より受けた理想適応符号ゲインの値と予め設定されたし
きい値との大小比較を行う。次に適応ゲイン判定部４１
９は、上記大小比較の結果に基づき、拡散パタン格納・
選択部４１５に予備選択用の制御信号を送る。制御信号
の内容は、上記大小比較において適応符号ゲインが大き
い場合には、雑音音源情報をベクトル量子化する際に生
じる量子化歪みをより小さくするように予め学習して得
られた拡散パタンを選択するように指示するものであ
り、上記大小比較において適応符号ゲインが大きくない
場合には、学習の結果得られた拡散パタンとは別の拡散
パタンを予備選択するように指示するものである。

【００６５】すると、拡散パタン格納・選択部４１５に
おいて、各チャネルが格納しているＭ種類（Ｍ＝２）の
拡散パタンから学習によって得られた側の拡散パタンだ
けが予備選択されることになり、拡散パタンの組合せ数
を大幅に削減できるようになる。その結果、拡散パタン
の全組合せ番号についての歪み計算をする必要がなくな
り、雑音音源情報のベクトル量子化処理を少い演算量で
効率的に行うことが可能になる。

【００６６】そして、さらに、雑音符号ベクトルの形状
は、適応ゲインの値が大きい時（有声性が強い時）には
パルス的な形状になり、適応ゲインの値が小さい時（有
声性が弱い時）にはランダム的な形状になる。よって、
音声信号の有声区間および無声区間に対して、それぞれ
適した形状の雑音符号ベクトルを利用できるようになる
ため、合成音声の品質を向上させることが可能になる。

【００６７】なお、本実施の形態では説明簡単化のた
め、パルスベクトル生成部のチャネル数Ｎは３、拡散パ
タン格納・選択部が格納しているチャネルあたりの拡散
パルスの種類数Ｍは２の場合に限定して説明を行った
が、パルスベクトル生成部のチャネル数、拡散パタン格
納・選択部内のチャネルあたりの拡散パタン数が上記説
明と異なる場合についても、同様の効果・作用が得られ
る。

【００６８】また、本実施の形態では説明簡単化のた
め、各チャネルあたり格納するＭ種類（Ｍ＝２）の拡散
パタンのうち、一種類は上記学習によって得られた拡散
パタン、もう一種類はランダムパタンである場合につい
て説明を行ったが、学習によって得られた拡散パタンを
各チャネル毎に少くとも１種類格納しておくようにすれ
ば、上記のような場合でなくても、同様の効果・作用を
期待することができる。

【００６９】なおまた、本実施の形態では、拡散パタン
を予備選択するための手段として、適応符号ゲインの大
小情報をもちいる場合について説明したが、適応ゲイン
の大小情報以外の音声信号の短時間的特徴を表すパラメ
ータを併用すると、なお一層の効果・作用を期待するこ
とができる。

【００７０】また、上記音声符号化装置を有する、音声
信号通信システムまたは音声信号記録システムを構成す
ることにより、実施の形態１で記載した音源ベクトル生
成装置の有する作用・効果を得ることができる。

【００７１】（実施の形態４）図５は本実施の形態にお
けるＣＥＬＰ音声符号化装置の構成ブロック図である。

【００７２】図５は、実施の形態１の音源ベクトル生成
装置（図１）を雑音符号帳に用いたＣＥＬＰ音声符号化
装置において、雑音音源情報をベクトル量子化する時点
で利用可能な情報を使って拡散パタン格納・選択部に格
納された複数の拡散パタンの予備選択を行うことを目的
としており、予備選択の基準として適応符号帳の番号特
定を行った時に生じる符号化歪み（Ｓ／Ｎ比で表現）の
大小を使うことを特徴としている。なお、図５の雑音符
号帳周辺部以外は図２記載のＣＥＬＰ音声符号化装置と
同一である。よって本実施の形態の説明は、図５記載の
ＣＥＬＰ音声符号化装置における雑音音源情報のベクト
ル量子化処理についてだけの説明にとどめる。

【００７３】図５において、５０７は適応符号帳、５０
９は適応符号ゲイン重み付け部、５０８は実施の形態１
で説明した音源ベクトル生成装置によって構成された雑
音符号帳、５１０は雑音符号ゲイン重み付け部、５０５
は合成フィルタ、５０６は歪み計算部、５１３は符号番
号特定部、５１５は拡散パタン格納・選択部、５１６は
パルスベクトル生成部、５１７はパルスベクトル拡散
部、５１８は拡散ベクトル加算部、５１９は歪みパワ判
定部である。ただし、本実施の形態において、上記拡散
パタン格納・選択部５１５が格納する格納するＭ種類
（Ｍ≧２）の拡散パタンのうちすくなくとも１種類は、
ランダムパタンであることとする。

【００７４】本実施の形態では、説明簡単化のため、パ
ルスベクトル生成部のチャネル数Ｎは３、拡散パタン格
納・選択部が格納しているチャネルあたりの拡散パルス
の種類数Ｍは２とし、さらに、Ｍ種類（Ｍ＝２）の拡散
パタンのうち１種類はランダムパタン、もう１種類は雑
音音源情報をベクトル量子化することにより生じる量子
化歪みをより小さくするように予め学習し、当該学習の
結果得られた拡散パタンであるとする。

【００７５】図５のＣＥＬＰ音声符号化装置において
は、雑音音源情報のベクトル量子化処理の前に適応符号
帳の番号特定処理が行われる。よって、雑音音源番号の
ベクトル量子化処理を行う時点では、適応符号帳のベク
トル番号（適応符号番号）、理想適応符号ゲイン（暫定
的に決っている）および、適応符号帳探索用のターゲッ
トベクトルを参照することができる。本実施の形態で
は、上記３つの情報から算出できる適応符号帳の符号化
歪み（Ｓ／Ｎ比で表現）を使って、拡散パルスの予備選
択を行う。

【００７６】具体的にはまず、適応符号帳探索の終了直
後に符号番号特定部５１３に保持されている適応符号番
号および適応符号ゲイン（理想ゲイン）の値が歪み計算
部５０６へ出力される。歪み計算部５０６は、符号番号
特定部５１３から受けた適応符号番号および適応符号ゲ
インと適応符号帳探索用のターゲットベクトルを用い
て、適応符号帳の番号特定によって生じた符号化歪み
（Ｓ／Ｎ比）を算出する。算出したＳ／Ｎ比を歪みパワ
判定部５１９へ出力する。

【００７７】歪みパワ判定部５１９は、まず始めに、歪
み計算部５０６より受けたＳ／Ｎ比と予め設定されたし
きい値との大小比較を行う。次に歪みパワ判定部５１９
は、上記大小比較の結果に基づき、拡散パタン格納・選
択部５１５に予備選択用の制御信号を送る。制御信号の
内容は、上記大小比較においてＳ／Ｎ比が大きい場合に
は、雑音符号帳探索用ターゲットベクトルを符号化する
ことにより生じる符号化歪みをより小さくするように予
め学習した結果得られる拡散パタンを選択するように指
示するものであり、上記大小比較においてＳ／Ｎ比が小
さい場合には、ランダムパタンの拡散パタンを選択する
ように指示するものである。

【００７８】すると、拡散パタン格納・選択部５１５に
おいて、各チャネルが格納しているＭ種類（Ｍ＝２）の
拡散パタンから１種類だけが予備選択されることにな
り、拡散パタンの組合せを大幅に削減できるようにな
る。その結果、拡散パタンの全組合せ番号についての歪
み計算をする必要がなくなり、雑音符号番号の特定を少
い演算量で効率的に行うことができることになる。そし
て、さらに、雑音符号ベクトルの形状は、Ｓ／Ｎ比が大
きい時にはパルス的な形状になり、Ｓ／Ｎ比が小さい時
にはランダム的な形状になる。よって、音声信号の短時
間的な特徴に応じて、雑音符号ベクトルの形状を変化さ
せることが可能になるため、合成音声（特に、ノイズ区
間）の品質を向上させることが可能になる。

【００７９】なお、本実施の形態では説明簡単化のた
め、パルスベクトル生成部のチャネル数Ｎは３、拡散パ
タン格納・選択部が格納しているチャネルあたりの拡散
パルスの種類数Ｍは２の場合に限定して説明を行った
が、パルスベクトル生成部のチャネル数、チャネルあた
りの拡散パタンの種類数が上記説明と異なる場合につい
ても、同様の効果・作用が得られる。

【００８０】また、本実施の形態では説明簡単化のた
め、さらに、各チャネルあたり格納するＭ種類（Ｍ＝
２）の拡散パタンのうち、一種類は上記学習によって得
られた拡散パタン、もう一種類はランダムパタンである
場合について説明を行ったが、ランダムパタンの拡散パ
タンを各チャネル毎に少くとも１種類格納しておくよう
にすれば、上記のような場合でなくても、同様の効果・
作用を期待することができる。

【００８１】なおまた、本実施の形態では、拡散パタン
を予備選択するための手段として、適応符号番号の特定
によって生じる符号化歪み（Ｓ／Ｎ比で表現）の大小情
報だけを用いたが、音声信号の短時間的特徴をさらに正
確に表せる情報を併用すると、なお一層の効果・作用を
期待することができる。

【００８２】また、上記音声符号化装置を有する、音声
信号通信システムまたは音声信号記録システムを構成す
ることにより、実施の形態１で記載した音源ベクトル生
成装置の有する作用・効果を得ることができる。

【００８３】

【発明の効果】以上のように本発明の音源ベクトル生成
装置によれば、実際の音源情報を分析もしくはそれをも
とに学習して得られた拡散パタンの形状（特性）をパル
スベクトルに反映することができるため、実際の音源ベ
クトルと類似性の高い形状（特性）の音源ベクトルを生
成することができる。

【００８４】また、前記音源ベクトル生成装置を雑音符
号帳として用いたＣＥＬＰ音声符号化装置／復号化装置
を構成することにより、音声信号を実際に分解（分析）
して得られる雑音符号ベクトル探索用ターゲットベクト
ルと統計的に近い形状（特性）の雑音符号ベクトルを生
成できるため、代数的音源生成部を雑音符号帳に用いる
場合より品質の高い合成音声を得ることができる。

【００８５】また、前記音声符号化装置を有する、音声
信号通信システムまたは音声信号記録システムを構成す
ることにより、前記音源ベクトル生成装置の有する効果
を持つシステムを得ることができる。

【図面の簡単な説明】

【図１】本発明の一実施の形態による音源ベクトル生成
装置の構成ブロック図

【図２】本発明の一実施の形態による音声符号化装置の
構成ブロック図

【図３】本発明の一実施の形態による音声復号化装置の
構成ブロック図

【図４】本発明の一実施の形態による音声符号化装置の
構成ブロック図

【図５】本発明の一実施の形態による音声符号化装置の
構成ブロック図

【図６】従来のＣＥＬＰ型音声符号化装置の構成ブロッ
ク図

【図７】従来のＣＥＬＰ型音声復号化装置の構成ブロッ
ク図

【符号の説明】

１０１、２１６、４１６、５１６パルスベクトル生成
部１０２、２１５、４１５、５１５拡散パタン格納・選
択部１０３、２１７、４１７、５１７パルスベクトル拡散
部１０４、２１８、４１８、５１８拡散ベクトル加算部１０５音源ベクトル２０１、４０１、５０１入力音声２０２、４０２、５０２線形予測分析部２０３、４０３、５０３線形予測係数符号化部２０４、３０２、４０４、５０４線形予測係数復号化
部２０５、３０９、４０５、５０５合成フィルタ２０６、４０６、５０６歪み計算部２０７、３０３、４０７、５０７適応符号帳２０８、３０４、４０８、５０８雑音符号帳２０９、３０６、４０９、５０９適応符号ゲイン重み
付け部２１０、３０７、４１０、５１０雑音符号ゲイン重み
付け部２１１、３０５、４１１、５１１重み符号帳２１２、３０８、４１２、５１２加算部２１３、４１３、５１３符号番号特定部２１４、４１４、５１４符号出力部３０１符号入力部３１０合成音声４１９適応ゲイン判定部５１９歪みパワ判定部

Claims

【特許請求の範囲】

【請求項１】ベクトル軸上のある１要素に極性付き単
位パルスが立ったパルスベクトルを生成するチャネルを
Ｎ個（Ｎ≧１）備えたパルスベクトル生成部と、前記Ｎ
個のチャネルごとにＭ種類（Ｍ≧２）の拡散パタンを格
納する機能と、格納したＭ種類の拡散パタンからある１
種類の拡散パタンを選択する機能とを併せ持つ拡散パタ
ン格納・選択部と、前記パルスベクトル生成部から出力
されるパルスベクトルと前記拡散パタン格納・選択部か
ら選択される拡散パタンとの重畳演算をチャネルごとに
行い、Ｎ個の拡散ベクトルを生成する機能を有するパル
スベクトル拡散部と、前記パルスベクトル拡散部により
生成されるＮ個の拡散ベクトルを加算して音源ベクトル
を生成する機能を有する拡散ベクトル加算部とを備えた
音源ベクトル生成装置を雑音符号帳として用い、前記雑
音符号帳で雑音音源情報をベクトル量子化することによ
り得られ、かつ、拡散パタンが、雑音音源情報をベクト
ル量子化した際に生じる量子化歪みをより小さくするよ
うに予め学習して得られたものであることを特徴とする
音声符号化装置／復号化装置。
【請求項２】生成される音源ベクトルに対して１対１
に番号を割り当て、かつ、パルス位置、パルス極性、拡
散パタンを特定するインデクスを雑音符号番号とするこ
とを特徴とするＣＥＬＰ音声符号化装置／復号化装置。
【請求項３】拡散パタン格納・選択部において、各チ
ャネルで選択された拡散パタンの組合せを示す組合せ番
号を、雑音音源情報をベクトル量子化した際に生じる量
子化歪みが最小化されるように、拡散パタンのとりうる
Ｍ＾Ｎ通り（”＾”はべき乗を示す）の全組合せ中から
閉ループで特定することを特徴とする請求項２記載のＣ
ＥＬＰ音声符号化装置／復号化装置。
【請求項４】拡散パタン格納・選択部において、各チ
ャネルで選択された拡散パタンの組合せを示す組合せ番
号を、雑音音源情報のベクトル量子化した際に生じる量
子化歪みが最小化されるように、あらかじめ求まってい
る音声パラメータを用いて拡散パタンの組合せの予備選
択を行い、前記予備選択された拡散パタンの組合せの中
から特定することを特徴とする請求項２記載のＣＥＬＰ
音声符号化装置／復号化装置。