JPS61236600A

JPS61236600A - パタンマツチングボコ−ダ

Info

Publication number: JPS61236600A
Application number: JP60077827A
Authority: JP
Inventors: 哲田口
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1985-04-12
Filing date: 1985-04-12
Publication date: 1986-10-21
Also published as: JPH0582600B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明はパタンマツチングボコーダに関し、特に帯域分
割型のパタンマツチングボコーダに［ｌする。

〔従来の技術〕

入力音声信号の周波数帯域を予め設定する複数の帯域に
分割して各帯域ごとにＬ　Ｐ　Ｃ（ＬｉｎｅａｒＰｒｅ
ｄｉｃｔｉｏｎ　Ｃｏｅｆｆｉｃｉｅｎｔ、　　線形予
測係数）分析を行なう帯域分割型ボコーダはよく知られ
ている。

これはＬＰＧ分析が有する２つの欠点、すなわちフォト
マント帯域幅の過小予測、およびエネルギーの少ない高
次フォルマントたとえば第３７オルマントが第１７オル
マントに比して近似性が悪いといった欠点を改善する手
段を提供するものである。前記２つの欠点は第１７オル
マント等エネルギーの集中する周波数に極が過度に集中
するために発生すると推定され、帯域分割型ボコーダは
特定の周波数に極が集中するのを防ぐために入力音声の
周波数帯域を複数に分割しそれぞれの帯域に対してＬＰ
Ｃ分析を行なうことによって極の分数を図シ上記欠点を
排除しようとするものである。

この場合１分割帯域数をあまシ多くしても分割帯域のそ
れぞれを白色化する結果となシ、入力音声信号の帯域圧
縮の意味が無くなっていくという問題が起るため通常２
〜４分割程度が利用されることが多く、また分割は等間
隔ではなく各帯域にスペクトル包絡の櫃としてのフォル
マントをそれぞれ含まぜるように分割し通常周波数間隔
は対数比で予め設定される。

〔発明が解決しようとする問題点〕

しかしながら、従来のこの種の帯域分割型ボコーダでは
本質的に合成側の帯域間スペクトルに不連続性が発生し
このため合成音質の劣化を招き易いという欠点がある。

本発明の目的は上述した欠点を除去し、合成側における
帯域間スペクトルの不連続性を大幅に改善した帯域分割
型のパタンマツチングボコーダを提供することにある。

〔問題点を解決するための手段〕

本発明のパタンマツチングボコーダは、入力音声信号の
音声帯域を複数の周波数帯域に分割し各分割周波数帯域
ごとに線形予測分析して求めた線形予測係数と前記各分
割周波数帯域間の電力比とをスペクトル包絡のベクトル
要素としてパタン照合を行なうパタン照合手段を分析側
に備えるとともに入力音声信号の全周波数帯域のベクト
ル要素を表現しうる標準パタンを記憶した標準パタンメ
モリを合成側に備えて構成される。

〔実施例〕

次に図面を参照して本発明の詳細な説明する。

第１図（５）および第１図（Ｂ）はそれぞれ本発明によ
るパタンマツチングボコーダの第１の実施例の分析側お
よび合成側の構成を示すブロック図である。

第１図（５）に示す分析側１はＬＰＦ（Ｌｏｗ　Ｐａ５
ｓｐｉｌｔｅｒ　）　１０１　、　Ａ／Ｄ”　：’メー
タ１０２．ウインドウ処理器１０３．　ＤＦＴ（Ｄｉｓ
ｃｒｅｔｅ　ＰｏｕｒｉｅｒｉａＰｒａｎｓｆｏｒｍ　
）　Ｉ　Ｑ　４　、電カスベクトル算出器１０５゜自己
相関関数算出器（１）　１０６−１〜自己相関係数算出
器（Ｎ）１０６−Ｎ、線形予測分析器（１）　１０７−
１〜線形予測分析器（Ｎ）１０７−Ｎ、　　電力比算出
器（１）１０８−１〜を力ｇ口器（Ｎ−１）　１０８−
（Ｎ−１）　、　　パタン照合器１ｏ９．ｕ準パタンメ
モ１バ１）１１０．音源データ分析器１１１およびマル
チプレクサ１１２を備えて構成される。

また、第１図の）に示す合成側２は、デマルチプレクサ
２ｏ１．ｍ準パタンメモリ（２）２０２．音源信号発生
器２０３．ｆ声合成フィルタ２０４゜Ｄ／Ａコンバータ
２０５およびＬＰＦ２０６を備えて構成される。

第１図（５）においで、入力ライン１００１を介して入
力した入力音声信号はＬＰＦＩＯＩに二って所定の高域
遮断を受ける。本実施例の場合高域遮断周波数は３，３
３３Ｉ（）１ｚに設定しである。次にＬＰＰＩＯＩの出
力は人／Ｄコンバータ１０２によって８ＫＩｌｚのサン
プリング周波数でサンプリングされ所定のピット数で量
る化されたのちウィンドウ処理器１０３に供給される。

ウィンドウ処理器１０３は、入力信号の３２ｍ５ＥＣ分
ずつにハミング関数を換算するランドウ処理を行なった
のち２５６ボイン）　（３２ｍＳＥＣＸ８ＫＨｚ　）Ｄ
ＦＴをＤＦ’Ｔ　１０４にて実施する。

ＤＦＴ回路１０４によるＤＦＴ出力は周波数領域の複素
スペクトル成分であり、これはさらに電カスベクトル算
出器１０５によって自乗演算等を介し周波数対電カスベ
クトルが算出される。

電カスベクトル算出器１０５の出力は自己相関係数算出
器（１）〜（へ）１０６−１〜１０６−Ｎに帯域分割し
て供給される。

これら自己相関係数算出器はそれぞれ予め設定した分割
数と分割周波数帯域とに対応する個数Ｎと帯域幅Ｂｌ、
　Ｂ２・・・・・・ＢＮ　（Ｂ　１＜Ｂ２・・・・・・
（ＢＮ　）とを有し、たとえば本実施例は軍用周波数Ｏ
〜３，３３３ＫＨｚを対象として分割されたＮ個がそれ
ぞれ設定された帯域の周波数を対象として自己相関関数
を算出する。これらへ割数ならびに分割周波数帯域幅は
それぞれに７オルマント周波数が含まれるように、音声
資料等を勘案して設定される。

自己相関関数算出器＋１）１０６−１〜（Ｎ）１０６−
Ｎはそれぞれ設定された分割周波数帯域の電力スペクト
ル算出器１０５の出力を受けてＩＤＦＴ　（Ｉｎｖｅｒ
ｓｅＤＦＴ）を施して必要な範囲内の各遅れ時間におけ
る自己相関係数を求め、これらを線形予測分析器（１）
１０７−１〜線形予測分析器（Ｎ）１０７−ＮＫ供給す
るとともに、算出した遅れ時間零における自己相関係数
すなわち各周波数帯域の短時間平均電力ｅ１〜ｅｎをＮ
−１個の電力比算出器（１）１０８−１〜電力比算出器
（Ｎ−１）　１０８−（Ｎ−１）に供給し、各周波数帯
域間の短時間平均電力の比を算出する。本実施例におい
てはこの短時間平均電力の比で表現する電力比が短時間
平均電力ｅ１を基準として算出するようＫしておシ、従
って電力比算出器（１）１０８−１にハｅｌとｅ２とが
、また電力比算出器（２）１０８−２にはｅｌと８３と
が供給され以下同様にして電力比算出器（Ｎ−１）　１
０８−（Ｎ−１）にはｅｌとｅｎとが供給されるという
ようにしてＮ−１個の電力比算出器で各周波数帯域間の
電力比を求めているが、これはｅｌとｅ２．　ｅ２とｅ
３．・・・・・・ｅ（ｎ−１）とｅｎというような供給
の仕方としても勿論差支えない。

さて、線形予測分析器（１）１０７−１〜線形予測分析
分析器１０７−Ｎはそれぞれ、供給を受けた自己相関係
数を利用し公知の処理技術、たとえばＡｕｔ。

−Ｃｏｒｒｅｌａｔｉｏｎ法等を利用し所定のＬＰＣ係
数。

本実施例では８次の（偏自己相関係数）パラメータを抽
出しパタン照合、器１０９に送出する。

また、電力比算出器（１）１０８−１〜電力算出器（Ｎ
−１’）１０８−（Ｎ−１）からはそれぞれ算出した電
力比がパタン照合器１０９に供給され、かくしてパタン
照合器１０９には分割各局波数帯域ごとのにパラメータ
と電力比とが供給される。

標準パタンメモ！Ｊ（１）１１０は前述したＮ個の帯域
分割に対応する如く分類し九にパラメータの標準パタン
ファイルを、本ボコーダを利用するかまたは他のコンビ
エータを利用してオフライン的に予め音声資料にもとづ
いて用意する。本実施例の場合は８次のにパラメータを
分割帯域に対応してパタンファイルとして用意し、さら
にこれらパタンファイルには前述した分割帯域間の電力
比も予め算出して用意し、こうしてパタン照合は各周波
数帯域ごとに線形予測分析して算出したにパラメ−タ間
数包絡を表現するベクトル要素として行なわれる。

このパタン照合では２つのパタンのマツチングが両パタ
ンに含まれる全にパラメータ間で計測したスペクトル距
離を尺度として行なわれ、これが最小のものが標準パタ
ンとして各周波数帯域ごとに選択され、かつこの場合各
帯域間のにパラメータによって表現されるスペクトルの
連続性を各帯域間の電力比を介して確認しつつ行なう。

つまり、各帯域間の電力比というベクトル要素が上記ス
ペクトルの連続性を確認しうる唯一のパラメータである
ことを利用し、この電力比をパタン照合におけるベクト
ル要素に加えて帯域間の連続性を保証しつつパタン照合
を実施する。

このパタン照合によって選択された標準パタン（１）１
１０の標準パタンは各周波数帯域ごとにその番号を指定
する標準パタン番号指定データがマルチプレクサ１１２
に供給される。

一方、音源データ分析器１１１は入力ライン１００１か
ら入力音声信号を受けるとこれをＬＰＦ。

Ａ／Ｄコンバータ等に通して所定の高域遮断、量る化を
行なう。この内容はほぼ前述したＬＰＦＩＯＩ、人／Ｄ
コンバータ１０２によるものと同じで、とのちと公知の
処理技術で音源データとしてのピッチ周期データ、有声
／無声／無音判別データ、および音源の強さデータを抽
出しこれら音源データをマルチプレクサ１１２に供給す
る。

マルチプレクサ１１２はこうして入力した標準パタン番
号指定データと音源データとを符号化したうえ所定の形
式で多重化し、これを伝送路１００２を介して合成側２
に送出する。

次に第１因回の合成側２について説明する。

デマルチプレクサ２０１は入力した多重化信号の多重化
分離を行なって復号化したうえ標準パタン　　　　　　
１番号指定データは標準パタンメモ！Ｊ（２）２０２に
、また音源データは音源信号発生器２０３にそれぞれ供
給される。

標準パタンメモリ（２）　２０２は入力した標準パタン
番号指定データによって読出されるものが入力音声信号
のスペクトル包絡を全周波数帯域にわたって表現しうる
特徴パラメータであればどのようなＬＰＧ係数４しくけ
このＬＰＣ係数から誘導される係数等であっても工く、
ただ合成すべき全周波数帯域のスペクトル包絡を代表す
るベクトル要素が分割周波数帯域間で不連続性を帯びな
いものであることを配慮すれはよい。

本実軸的の場合１８次分析した全周波数帯域一括のにパ
ラメータを登録したものを利用しこれＫよって全周波数
帯域のベクトル要素を表現しているが、とのにパラメー
タは勿論αパラメータ等他のＬＰＣ係数を利用してもよ
く、さらにその次数も全周波数帯域にわたってのベクト
ル要素をほぼ満足に表現しうるものであれば差支えない
。

標準パタンメモリ（２）２０２は標準パタン番号指定デ
ータによって指定された標準パタンを読出しこれを音声
合成フィルタ２０４に供給する。こうして読出された標
準パタンは分析＠１によりて選択された標準パタンを介
して全周波数にわたって分析側とは次数も含めて独立的
に登録したＬＰＣ係数を内容とするものであシ、これら
は音声合成フィルタ２０４のフィルタ係数として提供さ
れる。

全極型ディジタルフィルタによって構成される音声合成
フィルタ２０４は、標準パタンメモリ（２）２０２に登
録されている標準パタンのＬＰＣ係数と同次数のもので
あ夛そのフィルタ係数をこうして標準パタンメモリ（２
３２０２から受け、また音源信号発生器２０３から受け
た音源信号によって駆動されて入力音声信号をディジタ
ル量で合成する。

音源信号発生器２０３はデマルチプレクサ２０１から受
ける音源データを利用し次のようにモデル化された音源
を公知の手法によって生成する。

すなわち、音源信号発生器２０３は入力した有声／無声
／無音判別データを利用し、これが有声／無声の有音を
指定するときはピッチ周期データに対応する周期のパル
ス列を発生し、また無声を指定すると！！は雑音を発生
してこれらを可変利得増１ｍ器を介して音源信号として
音声合成フィルタ２０４に供給する。上記可変利得増幅
器の利得は音源データのうちの音源の強さデータを利用
して制御する。

こうして合成されたディジタル音声はＤ／Ａコンバータ
２０５によりてアナグロ化されたのちＬＰＦ２０６で不
要な高域成分を除去され出力ライン２００１に送出され
る。

次に本発明の第２の実施例について説明する。

第２の実施例は第１図（Ａ）、　ＣＢ）Ｋ示す第１の実
施例の分析側において分析する線形予測係数にＬ８Ｆ係
数を利用するものであシ、従って標準パタンとして７ア
イルしておく内容もＬ　Ｓ　Ｐ係数を利用する点のみが
異るので図示は省略する。

ＬＳＦ係数は通常のＬＳＦ分析によって得られたαパラ
メータを利用し、ニエートンの高次方程式を解く方法や
零点探索法を公知の技術として利用して抽出されておシ
、音声に関するスペクトル包絡を周波数領域で表現する
ものであり、直感的に理解し易くまた合成における捕間
特性ｒｃも優れているといった観点から近時多用されつ
つある。

本発明の第２の実施例ではこのＬＡＰ係数を線形予測係
数として各帯域ごとに抽出、またスペクトル距離計測を
介してこれと照合すべき標準パタンもＬＳＰ係数をベク
トル要素として利用し、さらに合成側で全周波数帯域に
わたるベクトル要素を表現しうるものとしてファイルさ
れるＬＰＣ係数も１８次のＬＳＦ係数を利用したものと
している。その他の基本的動作は＃１ば第１の実施例に
準する内容であるのでこれらに関する詳細な説明は省略
する。

本発明は分析側は帯域分割によるパタン照合でＬＰＣパ
フメータベクトルの抽出合成側では全帯域のベクトル要
素を表現しうる標準パタンを備えた状態での音声合成を
行なうパタンマツチングボコーダとして、ＬＰＣ分析な
らびに帯域分割ボコーダの欠点を基本的に排除した点に
基本的特徴を有するものであシ、前述した第１および第
２の実施例の変形も種々考えられる。

たとえば第１図（Ａ）Ｋ示す分析側（１）でのＬＰＦｌ
ｏｌの遮断周波数、Ａ／Ｄコンバータ１０２のサンプリ
ング周波数あるいはウィンドウ処理器１０３において利
用するウィンドウ関数等はパタンマツチングボコーダの
運用条件等を勘案して任意に設定しうろことは明らかで
あプ、また、音源データ分析は本実施例のほかに音源波
形を伝送するマルチパルス、もしくは残差励振等の形式
による分析があシこれらはいずれも容易に実施しうるも
のである。

さらに、本第１．第２の実施例では分析フレームを一定
周期とした固定長フレームボコーダとしているが、これ
を可変長フレームボコーダとしてもよく、以上はすべて
本発明の主旨を損なうことなく容易に実施しうる。

〔発明の効果〕

以上説明した如く本発明によれば、パタンマツチングボ
コーダにおいて、分析側は帯域分割して抽出したＬＰＧ
係数と帯域間の電力比とをベクトル要素としてパタン照
合を行なうとともに合成側では全帯域のベクトル要素を
表現しうる標準パタンを用意するという手段を備えるこ
とによりＬＰＣ分析と帯域分割型ボコーダにおける本質
的欠点を根本的に排除したパタンマツチングボコーダが
実現できるという効果がある。

【図面の簡単な説明】

第１図（５）は本発明によるパタンマツチングボコーダ
の第１の実施例における分析側の構成を示すブロック図
、第１図＠は本発明によるパタンマツチングボコーダの
第１の実施例における合成側の構成を示すブロック図で
ある。１・・・・・・分析側、２・・・・・・合成側、１０１
・・・・・・ＬＰＦ、１０２・・・・・・Ａ／Ｄコンバ
ータ、１０３・・・・・・ウィンドウ処理器１０３、１
０４・・・・・・ＤＰＴ回路、１０５・・・・・・電カ
スベクトル算出器、１０６−１〜１０６−Ｎ・・・・・
・自己相関係数算出器（１）〜（Ｎ）、１０７−１〜１
０７−Ｎ・・・・・・線形予測分析器（１）〜（へ）、
１０８−１〜１０８−（Ｎ−１）・・・・・・電力比算
出器（１）〜（Ｎ−１）、１０９・・・・・・パタン照
合器、１１０・・・・・・標準パタンメモリ（１）、１
１１・・・・・・音源データ分析器、１１２・・・・・
・マルチプレクサ、２０１・・・・・・デマルチプレク
サ、２０２・・・・・・標準パタンメモ！Ｊ（２）、２
０３・・・・・・音源信号発生器、２ｏ４・・・・・・
音声合成フィルタ、２ｏ５・・・・・・Ｄ／Ａコンバー
タ、２０６・川・・ＬＰＦ。

Claims

【特許請求の範囲】

（１）入力音声信号の音声帯域を複数の周波数帯域に分
割し各分割周波数帯域ごとに線形予測分析して求めた線
形予測係数と前記各分割周波数帯域間の電力比とをスペ
クトル包絡のベクトル要素としてパタン照合を行なうパ
タン照合手段を分析側に備えるとともに入力音声信号の
全周波数帯域のベクトル要素を表現じうる標準パタンを
記憶した標準パタンメモリを合成側に備えて成ることを
特徴とするパタンマッチングボコーダ。
（２）前記線形予測係数がＬＳＰ（Ｌｉｎｅ　Ｓｐｅｃ
ｔｒｕｍＰａｉｒｓ、線スペクトル対）であることを特
徴とする特許請求の範囲（１）項記載のパタンマッチン
グボコーダ。