JPS61236600A - パタンマツチングボコ−ダ - Google Patents

パタンマツチングボコ−ダ

Info

Publication number
JPS61236600A
JPS61236600A JP60077827A JP7782785A JPS61236600A JP S61236600 A JPS61236600 A JP S61236600A JP 60077827 A JP60077827 A JP 60077827A JP 7782785 A JP7782785 A JP 7782785A JP S61236600 A JPS61236600 A JP S61236600A
Authority
JP
Japan
Prior art keywords
band
pattern matching
pattern
linear prediction
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60077827A
Other languages
English (en)
Other versions
JPH0582600B2 (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60077827A priority Critical patent/JPS61236600A/ja
Priority to CA000504517A priority patent/CA1245363A/en
Publication of JPS61236600A publication Critical patent/JPS61236600A/ja
Priority to US07/522,411 priority patent/US5027404A/en
Publication of JPH0582600B2 publication Critical patent/JPH0582600B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はパタンマツチングボコーダに関し、特に帯域分
割型のパタンマツチングボコーダに[lする。
〔従来の技術〕
入力音声信号の周波数帯域を予め設定する複数の帯域に
分割して各帯域ごとにL P C(LinearPre
diction Coefficient、  線形予
測係数)分析を行なう帯域分割型ボコーダはよく知られ
ている。
これはLPG分析が有する2つの欠点、すなわちフォト
マント帯域幅の過小予測、およびエネルギーの少ない高
次フォルマントたとえば第37オルマントが第17オル
マントに比して近似性が悪いといった欠点を改善する手
段を提供するものである。前記2つの欠点は第17オル
マント等エネルギーの集中する周波数に極が過度に集中
するために発生すると推定され、帯域分割型ボコーダは
特定の周波数に極が集中するのを防ぐために入力音声の
周波数帯域を複数に分割しそれぞれの帯域に対してLP
C分析を行なうことによって極の分数を図シ上記欠点を
排除しようとするものである。
この場合1分割帯域数をあまシ多くしても分割帯域のそ
れぞれを白色化する結果となシ、入力音声信号の帯域圧
縮の意味が無くなっていくという問題が起るため通常2
〜4分割程度が利用されることが多く、また分割は等間
隔ではなく各帯域にスペクトル包絡の櫃としてのフォル
マントをそれぞれ含まぜるように分割し通常周波数間隔
は対数比で予め設定される。
〔発明が解決しようとする問題点〕
しかしながら、従来のこの種の帯域分割型ボコーダでは
本質的に合成側の帯域間スペクトルに不連続性が発生し
このため合成音質の劣化を招き易いという欠点がある。
本発明の目的は上述した欠点を除去し、合成側における
帯域間スペクトルの不連続性を大幅に改善した帯域分割
型のパタンマツチングボコーダを提供することにある。
〔問題点を解決するための手段〕
本発明のパタンマツチングボコーダは、入力音声信号の
音声帯域を複数の周波数帯域に分割し各分割周波数帯域
ごとに線形予測分析して求めた線形予測係数と前記各分
割周波数帯域間の電力比とをスペクトル包絡のベクトル
要素としてパタン照合を行なうパタン照合手段を分析側
に備えるとともに入力音声信号の全周波数帯域のベクト
ル要素を表現しうる標準パタンを記憶した標準パタンメ
モリを合成側に備えて構成される。
〔実施例〕
次に図面を参照して本発明の詳細な説明する。
第1図(5)および第1図(B)はそれぞれ本発明によ
るパタンマツチングボコーダの第1の実施例の分析側お
よび合成側の構成を示すブロック図である。
第1図(5)に示す分析側1はLPF(Low Pa5
spilter ) 101 、 A/D” :’メー
タ102.ウインドウ処理器103. DFT(Dis
crete PourieriaPransform 
) I Q 4 、電カスベクトル算出器105゜自己
相関関数算出器(1) 106−1〜自己相関係数算出
器(N)106−N、線形予測分析器(1) 107−
1〜線形予測分析器(N)107−N、  電力比算出
器(1)108−1〜を力g口器(N−1) 108−
(N−1) 、  パタン照合器1o9.u準パタンメ
モ1バ1)110.音源データ分析器111およびマル
チプレクサ112を備えて構成される。
また、第1図の)に示す合成側2は、デマルチプレクサ
2o1.m準パタンメモリ(2)202.音源信号発生
器203.f声合成フィルタ204゜D/Aコンバータ
205およびLPF206を備えて構成される。
第1図(5)においで、入力ライン1001を介して入
力した入力音声信号はLPFIOIに二って所定の高域
遮断を受ける。本実施例の場合高域遮断周波数は3,3
33I()1zに設定しである。次にLPPIOIの出
力は人/Dコンバータ102によって8KIlzのサン
プリング周波数でサンプリングされ所定のピット数で量
る化されたのちウィンドウ処理器103に供給される。
ウィンドウ処理器103は、入力信号の32m5EC分
ずつにハミング関数を換算するランドウ処理を行なった
のち256ボイン) (32mSECX8KHz )D
FTをDF’T 104にて実施する。
DFT回路104によるDFT出力は周波数領域の複素
スペクトル成分であり、これはさらに電カスベクトル算
出器105によって自乗演算等を介し周波数対電カスベ
クトルが算出される。
電カスベクトル算出器105の出力は自己相関係数算出
器(1)〜(へ)106−1〜106−Nに帯域分割し
て供給される。
これら自己相関係数算出器はそれぞれ予め設定した分割
数と分割周波数帯域とに対応する個数Nと帯域幅Bl、
 B2・・・・・・BN (B 1<B2・・・・・・
(BN )とを有し、たとえば本実施例は軍用周波数O
〜3,333KHzを対象として分割されたN個がそれ
ぞれ設定された帯域の周波数を対象として自己相関関数
を算出する。これらへ割数ならびに分割周波数帯域幅は
それぞれに7オルマント周波数が含まれるように、音声
資料等を勘案して設定される。
自己相関関数算出器+1)106−1〜(N)106−
Nはそれぞれ設定された分割周波数帯域の電力スペクト
ル算出器105の出力を受けてIDFT (Inver
seDFT)を施して必要な範囲内の各遅れ時間におけ
る自己相関係数を求め、これらを線形予測分析器(1)
107−1〜線形予測分析器(N)107−NK供給す
るとともに、算出した遅れ時間零における自己相関係数
すなわち各周波数帯域の短時間平均電力e1〜enをN
−1個の電力比算出器(1)108−1〜電力比算出器
(N−1) 108−(N−1)に供給し、各周波数帯
域間の短時間平均電力の比を算出する。本実施例におい
てはこの短時間平均電力の比で表現する電力比が短時間
平均電力e1を基準として算出するようKしておシ、従
って電力比算出器(1)108−1にハelとe2とが
、また電力比算出器(2)108−2にはelと83と
が供給され以下同様にして電力比算出器(N−1) 1
08−(N−1)にはelとenとが供給されるという
ようにしてN−1個の電力比算出器で各周波数帯域間の
電力比を求めているが、これはelとe2. e2とe
3.・・・・・・e(n−1)とenというような供給
の仕方としても勿論差支えない。
さて、線形予測分析器(1)107−1〜線形予測分析
分析器107−Nはそれぞれ、供給を受けた自己相関係
数を利用し公知の処理技術、たとえばAut。
−Correlation法等を利用し所定のLPC係
数。
本実施例では8次の(偏自己相関係数)パラメータを抽
出しパタン照合、器109に送出する。
また、電力比算出器(1)108−1〜電力算出器(N
−1’)108−(N−1)からはそれぞれ算出した電
力比がパタン照合器109に供給され、かくしてパタン
照合器109には分割各局波数帯域ごとのにパラメータ
と電力比とが供給される。
標準パタンメモ!J(1)110は前述したN個の帯域
分割に対応する如く分類し九にパラメータの標準パタン
ファイルを、本ボコーダを利用するかまたは他のコンビ
エータを利用してオフライン的に予め音声資料にもとづ
いて用意する。本実施例の場合は8次のにパラメータを
分割帯域に対応してパタンファイルとして用意し、さら
にこれらパタンファイルには前述した分割帯域間の電力
比も予め算出して用意し、こうしてパタン照合は各周波
数帯域ごとに線形予測分析して算出したにパラメ−タ間
数 包絡を表現するベクトル要素として行なわれる。
このパタン照合では2つのパタンのマツチングが両パタ
ンに含まれる全にパラメータ間で計測したスペクトル距
離を尺度として行なわれ、これが最小のものが標準パタ
ンとして各周波数帯域ごとに選択され、かつこの場合各
帯域間のにパラメータによって表現されるスペクトルの
連続性を各帯域間の電力比を介して確認しつつ行なう。
つまり、各帯域間の電力比というベクトル要素が上記ス
ペクトルの連続性を確認しうる唯一のパラメータである
ことを利用し、この電力比をパタン照合におけるベクト
ル要素に加えて帯域間の連続性を保証しつつパタン照合
を実施する。
このパタン照合によって選択された標準パタン(1)1
10の標準パタンは各周波数帯域ごとにその番号を指定
する標準パタン番号指定データがマルチプレクサ112
に供給される。
一方、音源データ分析器111は入力ライン1001か
ら入力音声信号を受けるとこれをLPF。
A/Dコンバータ等に通して所定の高域遮断、量る化を
行なう。この内容はほぼ前述したLPFIOI、人/D
コンバータ102によるものと同じで、とのちと公知の
処理技術で音源データとしてのピッチ周期データ、有声
/無声/無音判別データ、および音源の強さデータを抽
出しこれら音源データをマルチプレクサ112に供給す
る。
マルチプレクサ112はこうして入力した標準パタン番
号指定データと音源データとを符号化したうえ所定の形
式で多重化し、これを伝送路1002を介して合成側2
に送出する。
次に第1因回の合成側2について説明する。
デマルチプレクサ201は入力した多重化信号の多重化
分離を行なって復号化したうえ標準パタン      
1番号指定データは標準パタンメモ!J(2)202に
、また音源データは音源信号発生器203にそれぞれ供
給される。
標準パタンメモリ(2) 202は入力した標準パタン
番号指定データによって読出されるものが入力音声信号
のスペクトル包絡を全周波数帯域にわたって表現しうる
特徴パラメータであればどのようなLPG係数4しくけ
このLPC係数から誘導される係数等であっても工く、
ただ合成すべき全周波数帯域のスペクトル包絡を代表す
るベクトル要素が分割周波数帯域間で不連続性を帯びな
いものであることを配慮すれはよい。
本実軸的の場合18次分析した全周波数帯域一括のにパ
ラメータを登録したものを利用しこれKよって全周波数
帯域のベクトル要素を表現しているが、とのにパラメー
タは勿論αパラメータ等他のLPC係数を利用してもよ
く、さらにその次数も全周波数帯域にわたってのベクト
ル要素をほぼ満足に表現しうるものであれば差支えない
標準パタンメモリ(2)202は標準パタン番号指定デ
ータによって指定された標準パタンを読出しこれを音声
合成フィルタ204に供給する。こうして読出された標
準パタンは分析@1によりて選択された標準パタンを介
して全周波数にわたって分析側とは次数も含めて独立的
に登録したLPC係数を内容とするものであシ、これら
は音声合成フィルタ204のフィルタ係数として提供さ
れる。
全極型ディジタルフィルタによって構成される音声合成
フィルタ204は、標準パタンメモリ(2)202に登
録されている標準パタンのLPC係数と同次数のもので
あ夛そのフィルタ係数をこうして標準パタンメモリ(2
3202から受け、また音源信号発生器203から受け
た音源信号によって駆動されて入力音声信号をディジタ
ル量で合成する。
音源信号発生器203はデマルチプレクサ201から受
ける音源データを利用し次のようにモデル化された音源
を公知の手法によって生成する。
すなわち、音源信号発生器203は入力した有声/無声
/無音判別データを利用し、これが有声/無声の有音を
指定するときはピッチ周期データに対応する周期のパル
ス列を発生し、また無声を指定すると!!は雑音を発生
してこれらを可変利得増1m器を介して音源信号として
音声合成フィルタ204に供給する。上記可変利得増幅
器の利得は音源データのうちの音源の強さデータを利用
して制御する。
こうして合成されたディジタル音声はD/Aコンバータ
205によりてアナグロ化されたのちLPF206で不
要な高域成分を除去され出力ライン2001に送出され
る。
次に本発明の第2の実施例について説明する。
第2の実施例は第1図(A)、 CB)K示す第1の実
施例の分析側において分析する線形予測係数にL8F係
数を利用するものであシ、従って標準パタンとして7ア
イルしておく内容もL S P係数を利用する点のみが
異るので図示は省略する。
LSF係数は通常のLSF分析によって得られたαパラ
メータを利用し、ニエートンの高次方程式を解く方法や
零点探索法を公知の技術として利用して抽出されておシ
、音声に関するスペクトル包絡を周波数領域で表現する
ものであり、直感的に理解し易くまた合成における捕間
特性rcも優れているといった観点から近時多用されつ
つある。
本発明の第2の実施例ではこのLAP係数を線形予測係
数として各帯域ごとに抽出、またスペクトル距離計測を
介してこれと照合すべき標準パタンもLSP係数をベク
トル要素として利用し、さらに合成側で全周波数帯域に
わたるベクトル要素を表現しうるものとしてファイルさ
れるLPC係数も18次のLSF係数を利用したものと
している。その他の基本的動作は#1ば第1の実施例に
準する内容であるのでこれらに関する詳細な説明は省略
する。
本発明は分析側は帯域分割によるパタン照合でLPCパ
フメータベクトルの抽出合成側では全帯域のベクトル要
素を表現しうる標準パタンを備えた状態での音声合成を
行なうパタンマツチングボコーダとして、LPC分析な
らびに帯域分割ボコーダの欠点を基本的に排除した点に
基本的特徴を有するものであシ、前述した第1および第
2の実施例の変形も種々考えられる。
たとえば第1図(A)K示す分析側(1)でのLPFl
olの遮断周波数、A/Dコンバータ102のサンプリ
ング周波数あるいはウィンドウ処理器103において利
用するウィンドウ関数等はパタンマツチングボコーダの
運用条件等を勘案して任意に設定しうろことは明らかで
あプ、また、音源データ分析は本実施例のほかに音源波
形を伝送するマルチパルス、もしくは残差励振等の形式
による分析があシこれらはいずれも容易に実施しうるも
のである。
さらに、本第1.第2の実施例では分析フレームを一定
周期とした固定長フレームボコーダとしているが、これ
を可変長フレームボコーダとしてもよく、以上はすべて
本発明の主旨を損なうことなく容易に実施しうる。
〔発明の効果〕
以上説明した如く本発明によれば、パタンマツチングボ
コーダにおいて、分析側は帯域分割して抽出したLPG
係数と帯域間の電力比とをベクトル要素としてパタン照
合を行なうとともに合成側では全帯域のベクトル要素を
表現しうる標準パタンを用意するという手段を備えるこ
とによりLPC分析と帯域分割型ボコーダにおける本質
的欠点を根本的に排除したパタンマツチングボコーダが
実現できるという効果がある。
【図面の簡単な説明】
第1図(5)は本発明によるパタンマツチングボコーダ
の第1の実施例における分析側の構成を示すブロック図
、第1図@は本発明によるパタンマツチングボコーダの
第1の実施例における合成側の構成を示すブロック図で
ある。 1・・・・・・分析側、2・・・・・・合成側、101
・・・・・・LPF、102・・・・・・A/Dコンバ
ータ、103・・・・・・ウィンドウ処理器103、1
04・・・・・・DPT回路、105・・・・・・電カ
スベクトル算出器、106−1〜106−N・・・・・
・自己相関係数算出器(1)〜(N)、107−1〜1
07−N・・・・・・線形予測分析器(1)〜(へ)、
108−1〜108−(N−1)・・・・・・電力比算
出器(1)〜(N−1)、109・・・・・・パタン照
合器、110・・・・・・標準パタンメモリ(1)、1
11・・・・・・音源データ分析器、112・・・・・
・マルチプレクサ、201・・・・・・デマルチプレク
サ、202・・・・・・標準パタンメモ!J(2)、2
03・・・・・・音源信号発生器、2o4・・・・・・
音声合成フィルタ、2o5・・・・・・D/Aコンバー
タ、206・川・・LPF。

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声信号の音声帯域を複数の周波数帯域に分
    割し各分割周波数帯域ごとに線形予測分析して求めた線
    形予測係数と前記各分割周波数帯域間の電力比とをスペ
    クトル包絡のベクトル要素としてパタン照合を行なうパ
    タン照合手段を分析側に備えるとともに入力音声信号の
    全周波数帯域のベクトル要素を表現じうる標準パタンを
    記憶した標準パタンメモリを合成側に備えて成ることを
    特徴とするパタンマッチングボコーダ。
  2. (2)前記線形予測係数がLSP(Line Spec
    trumPairs、線スペクトル対)であることを特
    徴とする特許請求の範囲(1)項記載のパタンマッチン
    グボコーダ。
JP60077827A 1985-03-20 1985-04-12 パタンマツチングボコ−ダ Granted JPS61236600A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60077827A JPS61236600A (ja) 1985-04-12 1985-04-12 パタンマツチングボコ−ダ
CA000504517A CA1245363A (en) 1985-03-20 1986-03-19 Pattern matching vocoder
US07/522,411 US5027404A (en) 1985-03-20 1990-05-11 Pattern matching vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60077827A JPS61236600A (ja) 1985-04-12 1985-04-12 パタンマツチングボコ−ダ

Publications (2)

Publication Number Publication Date
JPS61236600A true JPS61236600A (ja) 1986-10-21
JPH0582600B2 JPH0582600B2 (ja) 1993-11-19

Family

ID=13644870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60077827A Granted JPS61236600A (ja) 1985-03-20 1985-04-12 パタンマツチングボコ−ダ

Country Status (1)

Country Link
JP (1) JPS61236600A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04264598A (ja) * 1990-11-05 1992-09-21 Internatl Business Mach Corp <Ibm> 人間の音声を認識するための方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04264598A (ja) * 1990-11-05 1992-09-21 Internatl Business Mach Corp <Ibm> 人間の音声を認識するための方法及び装置

Also Published As

Publication number Publication date
JPH0582600B2 (ja) 1993-11-19

Similar Documents

Publication Publication Date Title
US3681530A (en) Method and apparatus for signal bandwidth compression utilizing the fourier transform of the logarithm of the frequency spectrum magnitude
JPS61236600A (ja) パタンマツチングボコ−ダ
Fant Speech analysis and synthesis
JPH04116700A (ja) 音声分析・合成装置
Sundberg Synthesizing singing
JPH0235994B2 (ja)
JP2605256B2 (ja) Lspパタンマツチングボコーダ
JPS62278598A (ja) 帯域分割型ボコ−ダ
JP2535809B2 (ja) 線形予測型音声分析合成装置
JP3282595B2 (ja) 音声符号化・復号化装置及び通信装置
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JPH0229233B2 (ja)
JPS58211797A (ja) 帯域分割型ボコ−ダ
JPH0123800B2 (ja)
JPH052158B2 (ja)
JPS61219998A (ja) パタンマツチングボコ−ダ
JPS5850357B2 (ja) 音声分析合成装置
JPS593493A (ja) 帯域分割型ボコ−ダ
JPH08160993A (ja) 音声分析合成器
JPH0235993B2 (ja)
JPS58211795A (ja) 線形予測型音声分析合成装置
JPS6265100A (ja) Csm型音声合成器
JPH0235998B2 (ja)
Lam et al. Interpolating V/UV mixture functions of a harmonic model for concatenative speech synthesis
Bollepalli et al. Effect of MPEG audio compression on vocoders used in statistical parametric speech synthesis