JPS61215599A - Lspパタンマツチングボコ−ダ - Google Patents

Lspパタンマツチングボコ−ダ

Info

Publication number
JPS61215599A
JPS61215599A JP60057327A JP5732785A JPS61215599A JP S61215599 A JPS61215599 A JP S61215599A JP 60057327 A JP60057327 A JP 60057327A JP 5732785 A JP5732785 A JP 5732785A JP S61215599 A JPS61215599 A JP S61215599A
Authority
JP
Japan
Prior art keywords
standard
vector
pattern
lsp
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60057327A
Other languages
English (en)
Other versions
JP2605256B2 (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60057327A priority Critical patent/JP2605256B2/ja
Priority to CA000504517A priority patent/CA1245363A/en
Publication of JPS61215599A publication Critical patent/JPS61215599A/ja
Priority to US07/522,411 priority patent/US5027404A/en
Application granted granted Critical
Publication of JP2605256B2 publication Critical patent/JP2605256B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はLSPバタンマツチングボコーダに関する。
〔従来の技術〕
LSPパタンマッチングボコーダの分析側と合成側とに
備える標準ベクトルパタンは従来から等スペクトル距離
でクラスタリングしたものを使用し、この標準ベクトル
パタンと入力音声から抽出したL8F係数ベクトルパタ
ンとを照合(マツチング)する形式で入力音声信号の合
成を行なっている。
〔発明が解決しようとする問題点〕
しかしながら、従来の標準ベクトルパタンとマツチング
させるべきLSP係数ベクトルのベクトル空間における
発生密度は必らずしも一定でなく、従ってこの条件を無
視して等スペクトル距離でクラスタリングされた標準ベ
クトルパタン群と照合して選択された標準ベクトルパタ
ンと入力音声信号のL8P係数ベクトルとの差、すなわ
ちパタンiツチングにおける量子化歪の低減には限度が
あるという問題点がある。
本発明の目的は上述した欠点を除去し、スペクトル包絡
ベクトルの発生分布に対応したクラスタリングによって
分割した標準ベクトルパタンを記憶したメモリを備える
ことにより量子化歪を大幅忙低減しうるLAPバタンマ
ッチングボコータヲ提供することKある。
〔問題点を解決するための手段〕
本発明のボコーダは、音声資料のLSF係数の分布に関
する標準ベクトルパタンと入力音声信号を分析して得ら
れるLSP係数のベクトルパタンとを照合して入力音声
信号の合成を行なうL8Fバタンマツチングボコーダ忙
おいて、入力音声信号のスペクトル包絡ベクトルの発生
分布に対応したクラスタリングによって分割された標準
ベクトルパタンを記憶した第1の標準パタンメモリを備
えて構成される。
〔実施例〕
次に図面を癖照して本発明の詳細な説明する。
第1図は本発明によるLSPバタンマツチングボコーダ
の一実施例の構成を示すブロック図である。
第1図に示す実施例は第1の標準パタンメモリと第2の
標準パタンメモリとを備えた場合を例としているが、こ
れを第1の標準パタンメモリのみを有するものとして構
成しても勿論差支えない。
第1図に示す実施例のLSPパタンマッチングボコーダ
は分析側1および合成側2から成シ、さらに分析側IF
iL8F分析器11.音源情報分析器12.バタン照合
器i3.*準パタンメモリ(1)14、標準パタンメモ
リ(2)15およびマルチプレクサ16を備えて構成さ
れ、また合成側2はデマルチプレクサ21.バタン復号
器22.音源合成器23.L8F合成器24 、 D/
Aコンバータ25゜L P F (Low Pa5s 
Fi 1ter) 26のほか分析側と同様な標準バタ
ンメモIJ(1)14を備えて構成される0 分析側1は入力ライン1001を介して入力した入力音
声信号をLSF分析器11と音源情報分析器12とに供
給する。
LSF分析器11は入力音声信号をLPFを通して不要
な高域を除去したのち所定のビット数で量子化し、その
おとこの量子化音声信号に分析フレーム周期ごとに窓関
数の乗算を実施する。こうして得られた分析フレームご
との童子化データに対してL P C(Linear 
Prediction Coefficient。
線形予測係数)分析を行ない所定の次数、本実施例の場
合は10次のLPCを公知の手段で抽出したのちこのL
PGからLAP係数を誘導する。
LPGからLAP係数を誘導する公知の手段として知ら
れているものに、LPCをニュートン(Newton)
の反復法を利用した高次方程式を解く方方法と、零点探
索法とがあるが本実施例では前者の手法を利用している
こうして得られた基本フレームごとのL8P係数列は可
変長フレームデータに変換してバタン照合器13に供給
される。この可変長フレーム変換は次のようにして実施
される。
LSP分析器11は後述する音源情報分析器12から入
力音声信号に関する有声/無声/無音判別テータを入力
しつつ予め設定する数の分析フレームよ構成る区分ごと
に近似関数による近似処理を行ない、区分ごとの有音/
無声から成る有声区間と無音区間とで異るそれぞれ予め
設定する最大数以下の代表フレームを選定し、全フレー
ム情報を送出する代りにこれら代表フレームと、代表フ
レームによって表現されるフレーム数に関する情報のみ
を合成側に供給する。このような可変長フレーム変換の
際に各代表フレームによって示される分析フレーム数に
関する情報はレピートビットデータとしてマルチプレク
サ16に供給される。
バタン照合器13はスペクトル距離の計測を介して標準
パタンメモリ(1)14および標準バタンメモ1月2)
15に記憶されている各標準パタンベクトルとの予備選
択を前提とするバタンマツチングを行なう。
LSP係数もLPC係数と同様に空間ベクトルであ10
次のLAP係数は10次元のベクトル空間に分布される
。これらの空間ベクトルのひとつひとつを構成する標準
ベクトルパタンと、分析されたLAP係数ベクトルパタ
ンとのマツチングは次の(1)式で示すスペクトル距離
Dijが基本的尺度となる。
(1)式は演算量が膨大となるため通常この近似式とし
ての(2)式が利用されている。
(1)および(2)式において’tJはLAP分析にお
ける処理単位区間のフレームナンバー、8i(ω)。
Sj(ω)は周波数ωの関数としてのフレームi。
jにおけるN次のLSP係数、WxはN次のLAPスペ
クトル感度である。なお、LSP係数の次数はL8P係
数によって実現すべき声道フィルタを′!s成するため
の全極型ディジタルフィルタの次数とも対応する。また
、N次のLSFスペクトル感度WKはN次のLAP係数
の微少変化によって起るスペクトル変化の程度を示すも
のであシ、通常はLAP周波数に対応して決定されるL
SF周波数スペクトル感度が利用される。
さて、標準ベクトルパタンとのベクトルパタンマツチン
グは(2)式で示されるいわゆる簡易スペクトル距離計
測を介して行なわれ、その内容は分析された入力音声信
号の空間ベクトルとしてのN次のLsP係数PK(i)
と、[準</)、a=z<J7ii録されている空間ベ
クトルPK(j)との内積を各次数のL8F係数ごとに
求めたうえLSF係数の次数に対応するL8F周波数ご
とに予め設定する重みづけ係数としてのWxを乗じて、
可変長フレームのそれぞれのフレームごとに計測、算出
する。
さて、標準パタンメモリ+1)14および標準バタンメ
モIJ(2)15に記憶されている標準ベクトルパタン
は予め別のコンピュータを利用するか、もしくは本実施
例のホコーダを利用するかして作成し登録されている。
ます、等スペクトル距離でクラスタリングされる第2の
標準バタンメモIJ(2)15に記憶されている標準ベ
クトルパタンの作成について説明する。
この標準ベクトルパタンは基本的には次のようにして決
定される。
予め用意した音声資料を利用し、LPC分析等の手法に
よって無音区間の除去、不要な近接フレームの除去、有
声/無声/無音による分類等の前処理を行なったのち次
の■〜■のクラスタリングで呼ばれる手順に従って標準
バタンの決定、登録を行なう。
■ 10次元、一般的にはM次元のLSP係数ベクトル
空間UにN個のベクトルパタンか含まれているとする。
■ N個のベクトルパタンのおのおのKついて(2)式
で示すスペクトル距離Dijを算出し、この値が予め設
定する判定域値θdB”以下であるベクトルパタン数を
求めこのバタン数をMi(i=1.2・・・・・・N)
とする。
■ max (Mi )を有するベクトルパタンPLを
見出す。
■ PLにθdll”以内で含まれるすべてのベクトル
パタンをPLを含みベクトル空間Uから除去し、PLは
標準ベクトルパタンとして登録する。また、Pt、=m
ax(Mi)も登録しておく。
■ 残ったベクトルパタンについて上記■〜■を繰返し
つつUに含まれるベクトルパタンか零になるまで繰返す
以上■〜■の手法によって法人と標準バタンか決定され
、谷標準ベクトルパタンは10次元のベクトル空間を分
割するそれぞれのベクトル空間領域の代表として登録さ
れる。このようなりラスタリングは従来の分割手法によ
るものであり、ベクトルパタンの発生密度は無視したク
ラスタリングである。
そこで本実施例では上記クラスタリングにおける■のス
ペクトル距離θdB”の値を通常の等スペクトル距離ク
ラスタリングよりも予め設定するレベルタケ大きくし、
N個のベクトルパタンを通常のクラスタリングよりは十
分大きいベクトル空間領域で分割するものとする。この
ような大領域分割におけるθdB”の値の設定は数多く
の音声資料に関する先験的情報等にもとづいて11ぼ最
適値を推定することが容易にでき、またこの処理も上記
■〜■の手順に準じて容易に実施しうる。
こうして、通常の等スペクトル距離クラスタリングによ
る分割よりも十分多いベクトルパタンをそれぞれが含む
ような基準の小分割数で大領域分割されたそれぞれを代
表する標準ベクトルパタンか標準バタンメモ!j(2)
isに記憶される。
バタン照合器13に供給された入力音声信号の可変長フ
レームごとのLSP係数ベクトルパタンは、先ず標準バ
タンメモ1月2115に記憶された標準ベクトルパタン
と(2)式によるスペクトル距離の計測を介して最小の
スペクトル距離を示すものを決定し、これを予備選択と
して次に標準バタンメモ1月1)14との最終選択を次
のようにして実施する0 標準パタンメモリ+1114はベクトルパタンの発生密
度、すなわち本実施例の場合は10次元のベクトル空間
におけるスペクトル包絡ベクトルの分布密度と関連づけ
てクラスタリングされた標準ベクトルパタンを記憶する
。発生密度に対応したクラスタリングはスペクトル包絡
ベクトルパタンか前述したNFLとなる標準パタンPL
にθdB”以内で含まれるベクトル空間を等スペクトル
距離分割の■〜■の手順に従って再分割するものとし、
かつこの場合の再分割数の設定従ってθdB”の設定は
、たとえばNFLに比例させたものとするなど発生密度
の大小と対応するパラメータを利用するものとする。こ
のような再分割を行なった標準ベクトルパタンを用意す
ることによって発生密度の高いLSP係数ベクトルパタ
ンと標準ベクトルパタンとのマツチングがよシ高精度で
実施でき、従ってバタンマツチングにおける量子化歪も
よシ効果的に減少せしめることができる。
このようにして、等スペクトルによってクラスタリング
された標準ベクトルパタンを記憶する第2の標準パタン
メモリとしての標準パタンメモリ(2)15と、スペク
トル包絡ベクトルの発生密度に対応してクラスタリング
された標準ベクトルパタンを記憶する第1の標準パタン
メモリ(1)14とを備えた分析側1では、先ずLAP
分析器11から供給を受け7’(L8P係数ベクトルパ
タンと標準バタンメモ1月2)15に記憶されている標
準バタン群とのバタンマツチングをバタン照合器13で
実施して最終決定すべき標準バタンに対する予備選択を
行なったのち標準パタンメモリ+IH4に記憶されてい
る標準バタン群とのバタンマツチングを実施し最もスペ
クトル距離の小さい標準パタンを最終選択し、この標準
バタン指定番号データをマルチプレクサ16に供給する
。このような予備選択を前提とする標準パタンの選択に
よって選択処理の効率も大幅に改善さnている。
音源情報分析器12は入力音声信号の分析フレームごと
に公知の技術によってピッチ周期データ。
有声/無声/無音判別データ、および音源の強さく関す
るデータを抽出しこれら音源情報をマルチプレクサ16
に供給するとともに有声/無声/無音判別データはLS
P分析器11にも供給する。
マルチプレクサ16はレビートビットテータを含むこれ
ら入力を量子化したうえ所定の形成で多重化したあと伝
送路1002を介して合成側2に伝送する。
合成1112ではデマルチプレク°邦1が分析側1から
伝送された多重化信号の多重化分離と復号化を行い、標
準バタン番号指定データはバタン復号器22にルビート
ピットデータはLAP合成器24に、また音源情報デー
タは音源合成器23にそれぞれ供給する。
パタン復号器22は、入力標準バタン番号指定コードに
もとづいて標準パタンメモリ(1)14から番号指定さ
れた標準パタンの内容を胱出しこれをLAP合成器24
に供給する。
標準バタンメモ!j(1114は分析側に備えたものと
同じものであシ、可変長フレームごとのLAP係数列が
読出されLSP合成器24に供給されることとなる。L
8F合成器24はレビートビットデータとLSP係数列
とを利用し分析フレームごとのLSF係数を再生し、こ
れを全極型の10次のディジタルフィルタによって構成
する音声合成フィルタの係数として利用する。
音源合成器23は音源情報テークを利用し公知の技術に
よって分析フレームごとの音源を合成し、この音源電力
をLAP合成器24に供給してLSP合成器24内版の
前記音声合成フィルタを駆動しディジタル量の入力音声
信号を合成、出力せしめる0 LSF合成器24で合成されたディジタル量の入力音声
信号はD/Aコンバータでアナログ化されたのちLPF
26で不要な高域成分を除去し出力ライン2001に出
力される。
本発明はLSPバタンマツチングボコーダにおいて、ス
ペクトル包絡ベクトルの発生密度に対応したクラスタリ
ングによって分割された標準ベクトルパタンを備えてバ
タンマツチングを行なう点に基本的特徴を有するもので
あシ、第1図の実施例の変形も種種考えられる。
たとえ/l′!第1図の実施例では予備選択を行なうた
めに等スペクトル距離でクラスタリングさi″した標準
ベクトルパタンを記憶した第2の標準パタンメモリを備
えているが、予S選択を行なわないでバタンマツチング
を実施するときには、これは不要であシ、発生密度と関
連づけてクラスタリングした標準ベクトルパタンを記憶
する第1の標準パタンメモリのみ利用してマツチング処
理を行えばよい。
また、本冥施例では可変長フレーム方式でLSP係数列
を利用しているが、これは固定フレームとしても一向に
差支えなく、この場合はレビートビットデータの送受は
不要となる。
さらに本発明では音源情報はピッチ周期、有声/無声/
無音情報9音源の強さでモデル化して取扱っているが、
これをマルチパルス等の如く波形情報を利用する形成で
取扱ってもよく、以上はすべて本発明の主旨を損なうこ
となく容易に実施しうるものである。
〔発明の効果〕
以上説明した如く本発明によれば、LSPパタンマッチ
ングボコーダにおいて、スペクトル包絡ベクトルの発生
分布に対応したクラスタリングによって分割した標準ベ
クトルパタンを備えてバタンマツチングを実施すること
にょシ、バタンマツチングにおける量子化歪を大幅に低
減しつるバタンマツチングボコーダが実現できるという
効果がある。
【図面の簡単な説明】
第1図は本発明のLSPバタンマツチングボコーダの一
実施例の構成を示すブロック図である。 1・・・・・・分析側、2・・・・・・合成側、11・
・・・・・LAP分析器、12・・・・・・音源情報分
析器、13・旧・・バタン照合器、14・・・・・・標
準バタンメモl)、15・・・・・・標準パタンメモリ
(21,16・・・・・・マルチプレクサ、21・・・
・・・デマルチプレクサ、22・・・・・・バタン復号
器、23・・・・・・音源合成器、24・旧・・LSF
合成器、25・・・・・・D/Aコンバータ、26・・
・・・・LPF。

Claims (2)

    【特許請求の範囲】
  1. (1)音声資料のLSP(Line Spectrum
     Pairs、線スペクトル対)係数の分布に関する標
    準ベクトルパタンと入力音声信号を分析して得られるL
    SP係数のベクトルパタンとを照合しつつ入力音声信号
    の合成を行なうLSPパタンマッチングボコーダにおい
    て、入力音声信号のスペクトル包絡ベクトルの発生分布
    に対応したクラスタリング(clustering)に
    よって分割された標準ベクトルパタンを記憶した第1の
    標準パタンメモリを備えて取ることを特徴とするLSP
    パタンマッチングボコーダ。
  2. (2)前記第1の標準パタンメモリに加え等スペクトル
    距離によってクラスタリングされた標準ベクトルパタン
    を記憶した第2の標準パタンメモリを有しこの第2の標
    準パタンメモリに記憶した標準ベクトルパタンを介して
    予備選択しつつベクトルパタンの照合を実施することを
    特徴とする特許請求範囲第(1)項記載のLSPパタン
    マッチングボコーダ。
JP60057327A 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ Expired - Lifetime JP2605256B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60057327A JP2605256B2 (ja) 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ
CA000504517A CA1245363A (en) 1985-03-20 1986-03-19 Pattern matching vocoder
US07/522,411 US5027404A (en) 1985-03-20 1990-05-11 Pattern matching vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60057327A JP2605256B2 (ja) 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ

Publications (2)

Publication Number Publication Date
JPS61215599A true JPS61215599A (ja) 1986-09-25
JP2605256B2 JP2605256B2 (ja) 1997-04-30

Family

ID=13052474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60057327A Expired - Lifetime JP2605256B2 (ja) 1985-03-20 1985-03-20 Lspパタンマツチングボコーダ

Country Status (1)

Country Link
JP (1) JP2605256B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6478300A (en) * 1987-09-18 1989-03-23 Nippon Telegraph & Telephone Voice synthesization
JPH08195722A (ja) * 1995-01-17 1996-07-30 Nec Corp スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置
JPS59168498A (ja) * 1983-03-16 1984-09-22 株式会社日立製作所 音声認識装置
JPS59185400A (ja) * 1983-04-06 1984-10-20 株式会社リコー 単音節音声認識方式
JPS6032100A (ja) * 1983-08-03 1985-02-19 日本電気株式会社 Lsp型パタンマッチングボコ−ダ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置
JPS59168498A (ja) * 1983-03-16 1984-09-22 株式会社日立製作所 音声認識装置
JPS59185400A (ja) * 1983-04-06 1984-10-20 株式会社リコー 単音節音声認識方式
JPS6032100A (ja) * 1983-08-03 1985-02-19 日本電気株式会社 Lsp型パタンマッチングボコ−ダ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6478300A (en) * 1987-09-18 1989-03-23 Nippon Telegraph & Telephone Voice synthesization
JPH08195722A (ja) * 1995-01-17 1996-07-30 Nec Corp スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置

Also Published As

Publication number Publication date
JP2605256B2 (ja) 1997-04-30

Similar Documents

Publication Publication Date Title
US6553343B1 (en) Speech synthesis method
US5305421A (en) Low bit rate speech coding system and compression
US7035791B2 (en) Feature-domain concatenative speech synthesis
US20070118366A1 (en) Methods and apparatuses for variable dimension vector quantization
JPH0573100A (ja) 音声合成方法及びその装置
JPS5827200A (ja) 音声認識装置
EP2087485B1 (en) Multicodebook source -dependent coding and decoding
JP2002207499A (ja) 非常に低いビット・レートで作動する音声符号器のための韻律を符号化する方法
RU61924U1 (ru) Статистическая модель речи
JP3282693B2 (ja) 声質変換方法
JPS61215599A (ja) Lspパタンマツチングボコ−ダ
JPH0764599A (ja) 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置
JP3462958B2 (ja) 音声符号化装置および記録媒体
JPS6032100A (ja) Lsp型パタンマッチングボコ−ダ
JP2539351B2 (ja) 音声合成方法
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPH0650440B2 (ja) Lsp型パタンマツチングボコ−ダ
JPH05265486A (ja) 音声分析合成方法
JPH0750399B2 (ja) スペクトル標準パタン更新方法
JPH0785200B2 (ja) スペクトル標準パタンの作成方法
JPH0731520B2 (ja) 可変長フレ−ム型パタンマツチングボコ−ダ
Bardenhagen et al. Low bit rate speech compression using hidden Markov modeling
Lin et al. Speech applications created by a microcomputer: Discover the advantages of newly developed single-chip microcomputers for digital signal processing in speech applications
JPH0235993B2 (ja)
Lindén et al. A glottal vocoder employing vector quantization