JPS6238719B2

JPS6238719B2 -

Info

Publication number: JPS6238719B2
Application number: JP57050431A
Authority: JP
Inventors: Hiroya Fujisaki; Herumansukii Hineku; Yasuo Sato; Tadayasu Sugita
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-03-29
Filing date: 1982-03-29
Publication date: 1987-08-19
Also published as: JPS58168094A

Description

【発明の詳細な説明】 (A) 発明の技術分野本発明は、音声分析処理方式、特にパワー・ス
ペクトルを抽出して自己相関係数を算出して線形
予測係数を抽出する音声分析処理方式において、
上記パワー・スペクトルについてのパワー・スペ
クトル包絡情報を抽出してこれにもとづいて上記
線形予測係数に対応する改良線形予測係数を抽出
するようにし、ノイズによる影響やピツチ周波数
の変動による影響を受けることが少なく、かつホ
ルマント周波数を正確に抽出できるようにした音
声分析処理方式に関するものである。

(B) 技術の背景と問題点従来から、第１図を参照して後述する如き構成
によつて線形予測係数α（ｎ）／Ｋ（ｎ）を抽出
することが行われている。なお上記α（ｎ）／Ｋ
（ｎ）は係数α（ｎ）および／またはＫ（ｎ）を
意味している。

上記線形予測係数α（ｎ）／Ｋ（ｎ）は以降の
音声分析処理的に利用されてゆくものであるが、
ノイズによる影響やピツチ周波数の変動による影
響を受け易く、ホルマント周波数を正確に抽出す
る上で多少の問題が残されている。

(C) 発明の目的と構成本発明は、上記の点を解決することを目的とし
ており、パワー・スペクトルを用いて線形予測係
数を抽出するに当つて、パワー・スペクトルのい
わばピーク点を連らねた所のパワー・スペクトル
包絡情報にもとづいて改良線形予測係数を抽出す
るようにし、ピツチ周波数の変動やノイズによる
影響を受けにくく、かつホルマント周波数を正し
く抽出できるようにした改良線形予測係数を得る
ようにすることを目的としている。そしてそのた
めに、本発明の音声分析処理方式は、入力音声信
号をフーリエ変換部をそなえ、上記入力音声のパ
ワー・スペクトルを抽出し、該パワー・スペクト
ルをフーリエ逆変換部を介して自己相関係数を算
出して線形予測係数を抽出する音声分析処理方式
において、上記抽出されたパワー・スペクトルの
ピークに対応する形で当該パワー・スペクトルの
パワー・スペクトル包絡情報を抽出するパワー・
スペクトル包絡情報抽出部をもうけ、該抽出部に
よつて抽出された該パワー・スペクトル包絡情報
を上記フーリエ逆変換部に供給し、これによつて
得られた自己相関係数にもとづいて改良線形予測
係数を抽出するよう構成したことを特徴としてい
る。以下図面を参照しつつ説明する。

(D) 発明の実施例第１図は本発明の前提となる従来の構成の一
例、第２図は本発明の一実施例構成、第３図は本
発明にいうパワー・スペクトル包絡情報の一態様
を説明する説明図、第４図および第５図は夫々本
発明によつて得られた改良線形予測係数を用いる
ことによる効果を説明する説明図を示す。

第１図において、１はフーリエ変換部、２はフ
ーリエ逆変換部、３は線形予測係数算出部、Ｓ
（ｎ）は入力音声信号、Ｐ（ω）はパワー・スペ
クトル、Ｒ（ｎ）は自己相関係数、α（ｎ）／Ｋ
（ｎ）は線形予測係数を表わしている。

従来から線形予測係数α（ｎ）／Ｋ（ｎ）を得
るに当つて、第１図図示の如き構成が採用され、
入力音声信号Ｓ（ｎ）についてフーリエ変換部１
によつてフーリエ変換を行い例えば２乗するなど
してパワー・スペクトルＰ（ω）を抽出する。該
パワー・スペクトルは、第３図においてパワー・
スペクトルＰ（ω）の対数値をとつてlogP（ω）
として示す如く、ピツチ周波数に対応した凹凸を
もつものであると考えてよい。

従来、該パワー・スペクトルＰ（ω）にもとづ
いて、フーリエ逆変換部２によつて、自己相関係
数Ｒ（ｎ）を算出し、そして線形予測係数算出部
３によつて線形予測係数α（ｎ）／Ｋ（ｎ）を抽
出するようにしていた。なお、上記線形予測係数
算出部３は、例えば(i)コロナ社昭和58年発行、
鈴木久喜訳「音声のデイジタル信号処理（下）」
第165頁ないし第167頁や、(ii)IE³Proceeding
Vol63、No.４、1975“Linear Prediction：ａ
Tutorial Review”（J.Makhoul）P566、（37）式
または、（38a）式ないし（38c）式に示される如
く従来から知られているものである。

第２図は本発明の一実施例構成を示しており、
図中の符号１，２，３は第１図に対応し、４はピ
ツチ周波数抽出部、５はパワー・スペクトル包絡
情報抽出部を表わしている。またＰ＾（ω）はパワ
ー・スペクトル包絡情報、R′（ｎ）は本発明に
おいて得られる自己相関係数、α′（ｎ）／
K′（ｎ）は改良線形予測係数を表わす。

本発明の場合には、第２図において入力信号Ｓ
（ｎ）からピツチ周波数を抽出するなどして、フ
ーリエ変換部１を介して得られているパワー・ス
ペクトルＰ（ω）について、第３図図示＋印の如
き点に対応するパワー・スペクトル情報を抽出
し、該抽出されたパワー・スペクトル情報をフー
リエ逆変換部２へ入力するようにされる。上記＋
印の如き点に対応するパワー・スペクトル情報を
本明細書においてはパワー・スペクトル包絡情報
Ｐ＾（ω）と呼んでいる。そして上記＋印の点以外
のパワー・スペクトルの値を値“０”としてフー
リエ逆変換部２へ入力するようにする。勿論、＋
印の点のみの値をフーリエ逆変換部２へ入力して
もよい。

上記＋印の点は、フーリエ変換部１を介して得
られたパワー・スペクトルＰ（ω）におけるピー
ク点に対応しているものと考えてよく、第２図図
示の場合には、入力音声信号Ｓ（ｎ）から図示ピ
ツチ周波数抽出部４によつてピツチ周波数を抽出
し、該ピツチ周波数できまる周期の整数倍（１倍
を含む）の周期でサンプリングする点で与えられ
る。しかし本発明においては、上記パワー・スペ
クトル包絡情報Ｐ＾（ω）を得る手段については任
意である。

上記パワー・スペクトル包絡情報Ｐ＾（ω）が第
２図図示の如くフーリエ逆変換部２に入力されか
つ得られた出力R′（ｎ）が線形予測係数算出部
３に入力されることによつて、本発明にいう改良
線形予測係数α′（ｎ）／K′（ｎ）が抽出され
る。

第４図は本発明によつて得られた改良線形予測
係数を用いることによる効果を説明する説明図を
示している。曲線Ａは本発明による改良線形予測
係数を用いた場合に対応し、曲線Ｂは第１図にお
いて得られた線形予測係数を用いた場合に対応し
ている。なお横軸はＳ／Ｎ比（dB）を表わし、
縦軸はスペクトル間の距離について対数をとつた
値（dB）を表わしている。

該スペクトル間の距離とは次のようなものを表
わしていると考えてよい。即ち、モデル・スペク
トルＳを合成音によつて生成しておく。一方、こ
れに対して所望量のノイズを混入せしめて第１図
（または第２図）図示の構成によつて線形予測係
数を抽出する。該抽出された線形予測係数にもと
づいてスペクトルＴを生成する。そして上記スペ
クトルＳとＴとの差に相当する距離が得られ、該
距離を上記スペクトル間の距離としている。した
がつて、当該スペクトル間の距離が大きい程、得
られている線形予測係数が真のものからずれてい
る量が大きいことを表わしている。

第４図図示の場合、Ｓ／Ｎ比が小さくなる程、
即ちノイズの混入量が大になる程、上記距離が大
となつてゆくが、第１図に示す構成の場合に対応
するもの（曲線Ｂ）にくらべて、本発明に対応す
る改良線形予測係数を用いたもの（曲線Ａ）の側
がより小さい距離となつていることが判る。

また第５図は、母音｜ａ｜、｜ｉ｜、｜ｕ｜、
｜ｅ｜、｜ｏ｜に対応してインパルス励起を行な
つた場合について、原スペクトルと抽出された線
形予測係数にもとづいて得られた抽出スペクトル
との差（dB）を表わしている。

したがつて、第５図図示の値は、小さい程、好
ましい値であり、本発明の改良線形予測係数α′
（ｎ）／K′（ｎ）を用いた方がより好ましいもの
となつていることが判る。

また発明者らは、第１ホルマント周波数とし
F₁＝500（Hz）をもつ入力音声信号について、第
１図図示の構成による線形予測係数α（ｎ）／Ｋ
（ｎ）と第２図図示構成による改良線形予測係数
α′（ｎ）／K′（ｎ）とを抽出し、これから上述
のホルマント周波数を算出せしめて次の結果を得
た。即ち、ノイズ（dB）＝60.000の場合に、(i)前
者α（ｎ）／Ｋ（ｎ）を用いた場合には、算出さ
れたホルマント周波数はF₁＝467（Hz）となり、
(ii)後者α′（ｎ）／K′（ｎ）を用いた場合には、
算出されたホルマント周波数は、F₁＝475Hz、と
なつた。これは改良線形予測係数を用いた場合
に、真の値（500Hz）に対する誤差が25Hzであ
り、第１図図示の構成を用いた場合の誤差33Hzに
比較して、より好ましいものとなつていることを
明らかにしている。

(E) 発明の効果以上説明した如く、本発明によれば、従来の構
成によつて得られた線形予測係数にくらべて、よ
り好ましい係数を得ることが可能となる。そし
て、該改良線形予測係数α′（ｎ）／K′（ｎ）は
ピツチ周波数の変動による影響やノイズによる影
響を受けることが少なく、当該改良線形予測係数
を用いることによつてホルマント周波数をより高
い精度で抽出することが可能となる。

【図面の簡単な説明】

第１図は本発明の前提となる従来の構成の一
例、第２図は本発明の一実施例構成、第３図は本
発明にいうパワー・スペクトル包絡情報の一態様
を説明する説明図、第４図および第５図は夫々本
発明によつて得られた改良線形予測係数を用いる
ことによる効果を説明する説明図を示す。図中、１はフーリエ変換部、２はフーリエ逆変
換部、３は線形予測係数算出部、４はピツチ周波
数抽出部、５はパワー・スペクトル包絡情報抽出
部、Ｓ（ｎ）は入力音声信号、Ｐ（ω）はパワ
ー・スペクトル、Ｐ＾（ω）はパワー・スペクトル
包絡情報、Ｒ（ｎ）は自己相関係数、α（ｎ）／
Ｋ（ｎ）は線形予測係数、α′（ｎ）／K′（ｎ）
は改良線形予測係数を表わしている。

Claims

【特許請求の範囲】

１入力音声信号をフーリエ変換するフーリエ変
換部をそなえ、上記入力音声のパワー・スペクト
ルを抽出し、該パワー・スペクトルをフーリエ逆
変換部を介して自己相関係数を算出して線形予測
係数を抽出する音声分析処理方式において、上記
抽出されたパワー・スペクトルのピークに対応す
る形で当該パワー・スペクトルのパワー・スペク
トル包絡情報を抽出するパワー・スペクトル包絡
情報抽出部をもうけ、該抽出部によつて抽出され
た該パワー・スペクトル包絡情報を上記フーリエ
逆変換部に供給し、これによつて得られた自己相
関係数にもとづいて改良線形予測係数を抽出する
よう構成したことを特徴とする音声分析処理方
式。