JP2605256B2 - Lspパタンマツチングボコーダ - Google Patents

Lspパタンマツチングボコーダ

Info

Publication number
JP2605256B2
JP2605256B2 JP60057327A JP5732785A JP2605256B2 JP 2605256 B2 JP2605256 B2 JP 2605256B2 JP 60057327 A JP60057327 A JP 60057327A JP 5732785 A JP5732785 A JP 5732785A JP 2605256 B2 JP2605256 B2 JP 2605256B2
Authority
JP
Japan
Prior art keywords
vector
pattern
standard
lsp
pattern memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60057327A
Other languages
English (en)
Other versions
JPS61215599A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60057327A priority Critical patent/JP2605256B2/ja
Priority to CA000504517A priority patent/CA1245363A/en
Publication of JPS61215599A publication Critical patent/JPS61215599A/ja
Priority to US07/522,411 priority patent/US5027404A/en
Application granted granted Critical
Publication of JP2605256B2 publication Critical patent/JP2605256B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はLSPパタンマッチングボコーダに関する。
〔従来の技術〕
LSPパタンマッチングボコーダの分析側と合成側とに
備える標準ベクトルパタンは従来から等スペクトル距離
でクラスタリングしたものを使用し、この標準ベクトル
パタンと入力音声から抽出したLSP係数ベクトルパタン
とを照合(マッチング)する形式で入力音声信号の合成
を行なっている。
〔発明が解決しようとする問題点〕 しかしながら、従来の標準ベクトルパタンとマッチン
グさせるべきLSP係数のベクトル空間における発生密度
は必らずしも一定でなく、従ってこの条件を無視して等
スペクトル距離でクラスタリングされた標準ベクトルパ
タン群と照合して選択された標準ベクトルパタンと入力
音声信号のLSP係数ベクトルとの差、すなわちパタンマ
ッチングにおける量子化歪の低減には限度があるという
問題点がある。
本発明の目的は上述した欠点を除去し、スペクトル包
絡ベクトルの発生分布に対応したクラスタリングによっ
て分割した標準ベクトルパタンを記憶したメモリを備え
ることにより量子化歪を大幅に低減しうるLSPパタンマ
ッチングボコーダを提供することにある。
〔問題点を解決するための手段〕
本発明のボコーダは、音声資料のLSP(Line Spectrum
Pairs、線スペクトル対)係数のベクトル空間分布に関
する標準ベクトルパタンと入力音声信号を分析して得ら
れるLSP係数のベクトルパタンと照合しつつ入力音声信
号の合成を行うLSPパタンマッチングボコーダにおい
て、入力音声信号のスペクトル包絡ベクトルの発生分布
密度が高いベクトル空間には高い密度で代表ベクトルを
配置し、発生分布密度が低いベクトル空間には低い密度
で代表ベクトルを配置し、これらの代表ベクトルによる
標準ベクトルパタンを記憶した第1の標準パタンメモリ
を備えるものである。
〔実施例〕
次に図面を参照して本発明を詳細に説明する。第1図
は本発明によるLSPパタンマッチングボコーダの一実施
例の構成を示すブロック図である。
第1図に示す実施例は第1の標準パタンメモリと第2
の標準パタンメモリとを備えた場合を例としているが、
これを第1の標準パタンメモリのみを有するものとして
構成しても勿論差支えない。
第1図に示す実施例のLSPパタンマッチングボコーダ
は分析側1および合成側2から成り、さらに分析側1は
LSP分析器11,音源情報分析器12,パタン照合器13,標準パ
タンメモリ(1)14,標準パタンメモリ(2)15および
マルチプレクサ16を備えて構成され、また合成側2はデ
マルチプレクサ21,パタン復号器22,音源合成器23,LSP合
成器24,D/Aコンバータ25,LPF(Low Pass Filter)26の
ほか分析側と同様な標準パタンメモリ(1)14を備えて
構成される。
分析側1は入力ライン1001を介して入力した入力音声
信号をLSP分析器11と音源情報分析器12とに供給する。
LSP分析器11は入力音声信号をLPFを通して不要な高域
を除去したのち所定のビット数で量子化し、そのあとこ
の量子化音声信号に分析フレーム周期ごとに窓関数の乗
算を実施する。こうして得られた分析フレームごとの量
子化データに対してLPC(Linear Prediction Coefficie
nt,線形予測係数)分析を行ない所定の次数、本実施例
の場合は10次のLPCを公知の手段で抽出したのちこのLPC
からLSP係数を誘導する。
LPCからLSP係数を誘導する公知の手段として知られて
いるものに、LPCをニュートン(Newton)の反復法を利
用した高次方程式を解く方法と、零点探索法とがあるが
本実施例では前者の手法を利用している。
こうして得られた基本フレームごとのLSP係数列は可
変長フレームデータに変換してパタン照合器13に供給さ
れる。この可変長フレーム変換は次のようにして実施さ
れる。
LSP分析器11は後述する音源情報分析器12から入力音
声信号に関する有声/無声/無音判別データを入力しつ
つ予め設定する数の分析フレームより成る区分ごとに近
似関数による近似処理を行ない、区分ごとの有音/無声
から成る有音区間と無音区間とで異るそれぞれ予め設定
する最大数以下の代表フレームを選定し、全フレーム情
報を送出する代りにこれら代表フレームと、代表フレー
ムによって表現されるフレーム数に関する情報のみを合
成側に供給する。このような可変長フレーム変換の際に
各代表フレームによって示される分析フレーム数に関す
る情報はレピートビットデータとしてマルチプレクサ16
に供給される。
パタン照合器13はスペクトル距離の計測を介して標準
パタンメモリ(1)14および標準パタンメモリ(2)15
に記載されている各標準パタンベクトルとの予備選択を
前提とするパタンマッチングを行なう。
LSP係数もLPC係数と同様に空間ベクトルであり10次の
LSP係数は、10次元のベクトル空間に分布される。これ
らの空間ベクトルのひとつひとつを構成する標準ベクト
ルパタンと、分析されたLSP係数ベクトルパタンとのマ
ッチングは次の(1)式で示すスペクトル距離Dijが基
本的尺度となる。
(1)式は演算量が膨大となるため通常この近似式と
しての(2)式が利用されている。
(1)および(2)式においてi,jはLSP分析における
処理単位区間のフレームナンバー,Si(ω),Sj(ω)は
周波数ωの関数としてのフレームi,jの対数スペクト
ル,PK (i),PK (j)はフレームi,jにおけるN次のLSP係
数,WKはN次のLSPスペクトル感度である。なお、LSP係
数の次数はLSP係数によって実現すべき声道フィルタを
構成するための全極型ディジタルフィルタの次数とも対
応する。また、N次のLSPスペクトル感度WKはN次のLSP
係数の微少変化によって起るスペクトル変化の程度を示
す ものであり、通常はLSP周波数に対応して決定され
るLSP周波数スペクトル感度が利用される。
さて、標準ベクトルパタンとのベクトルパタンマッチ
ングは(2)式で示されるいわゆる簡易スペクトル距離
計測を介して行なわれ、その内容は分析された入力音声
信号の空間ベクトルとしてのN次のLSP係数PK (i)と、標
準ベクトルパタンに登録されている空間ベクトルPK (j)
との内積を各次数のLSP係数ごとに求めたうえLSP係数の
次数に対応するLSP周波数ごとに予め設定する重みづけ
係数としてのWKを乗じて、可変長フレームのそれぞれの
フレームごとに計測,算出する。
さて、標準パタンメモリ(1)14および標準パタンメ
モリ(2)15に記憶されている標準ベクトルパタンは予
め別のコンピュータを利用するか、もしくは本実施例の
ホコーダを利用するかして作成し登録されている。
まず、等スペクトル距離でクラスタリングされる第2
の標準パタンメモリ(2)15に記憶されている標準ベク
トルパタンの作成について説明する。
この標準ベクトルパタンは基本的には次のようにして
決定される。
予め用意した音声資料を利用し、LPC分析等の手法に
よって無音区間の除去,不要な近接フレームの除去,有
声/無声/無音による分類等の前処理を行なったのち次
の〜のクラスタリングで呼ばれる手順に従って標準
パタンの決定,登録を行なう。
10次元,一般的にはM次元のLSP係数ベクトル空間
UにN個のベクトルパタンが含まれているとする。
N個のベクトルパタンのおのおのについて(2)式
で示すスペクトル距離Dijを算出し、この値が予め設定
する判定域値θdB2以下であるベクトルパタン数を求め
このパタン数をMi(i=1,2……N)とする。
max{Mi}を有するベクトルパタンPLを見出す。
PLにθdB2以内で含まれるすべてのベクトルパタン
をPLを含みベクトル空間Uから除去し、PLは標準ベクト
ルパタンとして登録する。また、NPL=max{Mi}も登録
しておく。
残ったベクトルパタンについて上記〜を繰返し
つつUに含まれるベクトルパタンが零になるまで繰返
す。
以上〜の手法によって次次と標準パタンが決定さ
れ、各標準ベクトルパタンは10次元のベクトル空間を分
割するそれぞれのベクトル空間領域の代表として登録さ
れる。このようなクラスタリングは従来の分割手法によ
るものであり、ベクトルパタンの発生密度は無視したク
ラスタリングである。
そこで本実施例では上記クラスタリングにおけるの
スペクトル距離θdB2の値を通常の等スペクトル距離ク
ラスタリングよりも予め設定するレベルだけ大きくし、
N個のベクトルパタンを通常のクラスタリングよりは十
分大きいベクトル空間領域で分割するものとする。この
ような大領域分割におけるθdB2の値の設定は数多くの
音声資料に関する先験的情報等にもとづいてほぼ最適値
を推定することが容易にでき、またこの処理も上記〜
の手順に準じて容易に実施しうる。
こうして、通常の等スペクトル距離クラスタリングに
よる分割よりも十分多いベクトルパタンをそれぞれが含
むような基準の小分割数で大領域分割されたそれぞれを
代表する標準ベクトルパタンが標準パタンメモリ(2)
15に記憶される。
パタン照合器13に供給された入力音声信号の可変長フ
レームごとのLSP係数ベクトルパタンは、先ず標準パタ
ンメモリ(2)15に記憶された標準ベクトルパタンと
(2)式によるスペクトル距離の計測を介して最小のス
ペクトル距離を示すものを決定し、これを予備選択とし
て次に標準パタンメモリ(1)14との最終選択を次のよ
うにして実施する。
標準パタンメモリ(1)14はベクトルパタンの発生密
度、すなわち本実施例の場合は10次元のベクトル空間に
おけるスペクトル包絡ベクトルの分布密度と関連づけて
クラスタリングされた標準ベクトルパタンを記憶する。
発生密度に対応したクラスタリングはスペクトル包絡ベ
クトルパタンが前述したNPLとなる標準パタンPLにθdB2
以内で含まれるベクトル空間を等スペクトル距離分割の
〜の手順に従って再分割するものとし、かつこの場
合の再分割数の設定、すなわちθdB2の設定は、たとえ
ばNPLに比例させたものとするなど発生密度の大小と対
応するパラメータを利用するものとする。従って本発明
においてはLSP係数のベクトル空間において、発生分布
密度が高いベクトル空間には高い密度で代表ベクトルを
配置し、発生分布密度が低いベクトル空間には低い密度
で代表ベクトルを配置して標準パタンを用意する。この
ような再分割を行なった標準ベクトルパタンを用意する
ことによって発生密度の高いLSP係数ベクトルパタンと
標準ベクトルパタンとのマッチングがより高精度で実施
でき、従ってパタンマッチングにおける量子化歪もより
効果的に減少せしめることができる。
このようにして、等スペクトルによってクラスタリン
グされた標準ベクトルパタンを記憶する第2の標準パタ
ンメモリとしての標準パタンメモリ(2)15と、スペク
トル包絡ベクトルの発生密度に対応してクラスメタリン
グされた標準ベクトルパタンを記憶する第1の標準パタ
ンメモリ(1)14とを備えた分析側1では、先ずLSP分
析器11から供給を受けたLSP係数ベクトルパタンと標準
パタンメモリ(2)15に記憶されている標準パタン群と
のパタンマッチングをパタン照合器13で実施して最終決
定すべき標準パタンに対する予備選択を行なったのち標
準パタンメモリ(1)14に記憶されている標準パタン群
とのパタンマッチングを実施し最もスペクトル距離の小
さい標準パタンを最終選択し、この標準パタン指定番号
データをマルチプレクサ16に供給する。このような予備
選択を前提とする標準パタンの選択によって選択処理の
効率も大幅に改善されている。
音源情報分析器12は入力音声信号の分析フレームごと
に公知の技術によってピッチ周期データ,有声/無声/
無音判別データ、および音源の強さに関するデータを抽
出しこれら音源情報をマルチプレクサ16に供給するとと
もに有声/無声/無音判別データはLSP分析器11にも供
給する。
マルチプレクサ16はレピートピットデータを含むこれ
ら入力を量子化したうえ所定の形成で多重化したあと伝
送路1002を介して合成側2に伝送する。
合成側2ではデマルチプレクサ21が分析側1から伝送
された多重化信号の多重化分離と復号化を行い、標準パ
タン番号指定データはパタン復号器22に、レピートビッ
トデータはLSP合成器24に、また音源情報データは音源
合成器23にそれぞれ供給する。
パタン復号器22は、入力標準パタン番号指定コードに
もとづいて標準パタンメモリ(1)14から番号指定され
た標準パタンの内容を読出しこれをLSP合成器24に供給
する。
標準パタンメモリ(1)14は分析側に備えたものと同
じものであり、可変長フレームごとのLSP係数列が読出
されLSP合成器24に供給されることとなる。LSP合成器24
はレピートビットデータとLSP係数列とを利用し分析フ
レームごとのLSP係数を再生し、これを全極型の10次の
ディジタルフィルタによって構成する音声合成フィルタ
の係数として利用する。
音源合成器23は音源情報データを利用し公知の技術に
よって分析フレームごとの音源を合成し、この音源電力
をLSP合成器24に供給してLSP合成器24内蔵の前記音声合
成フィルタを駆動しディジタル量の入力音声信号を合
成,出力せしめる。
LSP合成器24で合成されたディジタル量の入力音声信
号はD/Aコンバータでアナログ化されたのちLPF26で不要
な高域成分を除去し出力ライン2001に出力される。
本発明はLSPパタンマッチングボコーダにおいて、ス
ペクトル包絡ベクトルの発生密度に対応したクラスタリ
ングによって分割された標準ベクトルパタンを備えてパ
タンマッチングを行なう点に基本的特徴を有するもので
あり、第1図の実施例の変形も種種考えられる。
たとえば第1図の実施例では予備選択を行なうために
等スペクトル距離でクラスタリングされた標準ベクトル
パタンを記憶した第2の標準パタンメモリを備えている
が、予備選択を行なわないでパタンマッチングを実施す
るときには、これは不要であり、発生密度と関連づけて
クラスタリングした標準ベクトルパタンを記憶する第1
の標準パタンメモリのみ利用してマッチング処理を行え
ばよい。
また、本実施例では可変長フレーム方式でLSP係数列
を利用しているが、これは固定フレームとしても一向に
差支えなく、この場合はレピートビットデータの送受は
不要となる。
さらに本発明では音源情報はピッチ周期,有声/無声
/無音情報,音源の強さでモデル化して取扱っている
が、これをマルチパルス等の如く波形情報を利用する形
成で取扱ってもよく、以上はすべて本発明の主旨を損な
うことなく容易に実施しうるものである。
〔発明の効果〕
以上説明した如く本発明によれば、LSPパタンマッチ
ングボコーダにおいて、スペクトル包絡ベクトルの発生
分布に対応したクラスタリングによって分割した標準ベ
クトルパタンを備えてパタンマッチングを実施すること
により、パタンマッチングにおける量子化歪を大幅に低
減しうるパタンマッチングボコーダが実現できるという
効果がある。
【図面の簡単な説明】
第1図は本発明のLSPパタンマッチングボコーダの一実
施例の構成を示すブロック図である。 1……分析側、2……合成側、11……LSP分析器、12…
…音源情報分析器、13……パターン照合器、14……標準
パタンメモリ(1),15……標準パタンメモリ(2)、1
6……マルチプレクサ、21……デマルチプレクサ、22…
…パタン復号器、23……音源合成器、24……LSP合成
器、25……D/Aコンバータ、26……LPF。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】音声資料のLSP(Line Spectrum Pairs,線
    スペクトル対)係数のベクトル空間分布に関する標準ベ
    クトルパタンと入力音声信号を分析して得られるLSP係
    数のベクトルパタンと照合しつつ入力音声信号の合成を
    行なうLSPパタンマッチングボコーダにおいて、入力音
    声信号のスペクトル包絡ベクトルの発生分布密度が高い
    ベクトル空間には高い密度で代表ベクトルを配置し、発
    生分布密度が低いベクトル空間には低い密度で代表ベク
    トルを配置し、これらの代表ベクトルによる標準ベクト
    ルパタンを記憶した第1の標準パタンメモリを備えて成
    ることを特徴とするLSPパタンマッチングボコーダ。
  2. 【請求項2】前記第1の標準パタンメモリに加え等スペ
    クトル距離によってクラスタリングされた標準ベクトル
    パタンを記憶した第2の標準パタンメモリを有しこの第
    2の標準パタンメモリに記憶した標準ベクトルパタンを
    介して予備選択しつつベクトルパタンの照合を実施する
    ことを特徴とする特許請求の範囲(1)項記載のLSPパ
    タンマッチングボコーダ。
JP60057327A 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ Expired - Lifetime JP2605256B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60057327A JP2605256B2 (ja) 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ
CA000504517A CA1245363A (en) 1985-03-20 1986-03-19 Pattern matching vocoder
US07/522,411 US5027404A (en) 1985-03-20 1990-05-11 Pattern matching vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60057327A JP2605256B2 (ja) 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ

Publications (2)

Publication Number Publication Date
JPS61215599A JPS61215599A (ja) 1986-09-25
JP2605256B2 true JP2605256B2 (ja) 1997-04-30

Family

ID=13052474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60057327A Expired - Lifetime JP2605256B2 (ja) 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ

Country Status (1)

Country Link
JP (1) JP2605256B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2583074B2 (ja) * 1987-09-18 1997-02-19 日本電信電話株式会社 音声合成方法
JP2982637B2 (ja) * 1995-01-17 1999-11-29 日本電気株式会社 スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置
JPS59168498A (ja) * 1983-03-16 1984-09-22 株式会社日立製作所 音声認識装置
JPS59185400A (ja) * 1983-04-06 1984-10-20 株式会社リコー 単音節音声認識方式
JPS6032100A (ja) * 1983-08-03 1985-02-19 日本電気株式会社 Lsp型パタンマッチングボコ−ダ

Also Published As

Publication number Publication date
JPS61215599A (ja) 1986-09-25

Similar Documents

Publication Publication Date Title
US5305421A (en) Low bit rate speech coding system and compression
US7257535B2 (en) Parametric speech codec for representing synthetic speech in the presence of background noise
DE60126149T2 (de) Verfahren, einrichtung und programm zum codieren und decodieren eines akustischen parameters und verfahren, einrichtung und programm zum codieren und decodieren von klängen
EP0477960A2 (en) Linear prediction speech coding with high-frequency preemphasis
CA1219079A (en) Multi-pulse type vocoder
US4975955A (en) Pattern matching vocoder using LSP parameters
JP2779325B2 (ja) ボコーダーにおける前処理の相関関係式を用いたピッチ検索時間短縮方法
JP2605256B2 (ja) Lspパタンマツチングボコーダ
US4914702A (en) Formant pattern matching vocoder
JPS6032100A (ja) Lsp型パタンマッチングボコ−ダ
JPH0650440B2 (ja) Lsp型パタンマツチングボコ−ダ
Wong On understanding the quality problems of LPC speech
JP2539351B2 (ja) 音声合成方法
JP3398968B2 (ja) 音声分析合成方法
EP0780832A2 (en) Speech coding device for estimating an error of power envelopes of synthetic and input speech signals
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP3230380B2 (ja) 音声符号化装置
JP3199338B2 (ja) フォルマント抽出方法
JP2560860B2 (ja) マルチパルス型音声符号化及び復号化装置
JPH0235993B2 (ja)
JP2639118B2 (ja) マルチパルス型音声符号復号化装置
JPH0785200B2 (ja) スペクトル標準パタンの作成方法
JP2535809B2 (ja) 線形予測型音声分析合成装置
Helms LPC speech at 1200 bits per second using optimized frame repeat
JPH0511799A (ja) 音声符号化方式