JPS6238719B2 - - Google Patents

Info

Publication number
JPS6238719B2
JPS6238719B2 JP57050431A JP5043182A JPS6238719B2 JP S6238719 B2 JPS6238719 B2 JP S6238719B2 JP 57050431 A JP57050431 A JP 57050431A JP 5043182 A JP5043182 A JP 5043182A JP S6238719 B2 JPS6238719 B2 JP S6238719B2
Authority
JP
Japan
Prior art keywords
power spectrum
linear prediction
fourier transform
extracted
envelope information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57050431A
Other languages
English (en)
Other versions
JPS58168094A (ja
Inventor
Hiroya Fujisaki
Herumansukii Hineku
Yasuo Sato
Tadayasu Sugita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57050431A priority Critical patent/JPS58168094A/ja
Publication of JPS58168094A publication Critical patent/JPS58168094A/ja
Publication of JPS6238719B2 publication Critical patent/JPS6238719B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Eye Examination Apparatus (AREA)
  • Selective Calling Equipment (AREA)

Description

【発明の詳細な説明】 (A) 発明の技術分野 本発明は、音声分析処理方式、特にパワー・ス
ペクトルを抽出して自己相関係数を算出して線形
予測係数を抽出する音声分析処理方式において、
上記パワー・スペクトルについてのパワー・スペ
クトル包絡情報を抽出してこれにもとづいて上記
線形予測係数に対応する改良線形予測係数を抽出
するようにし、ノイズによる影響やピツチ周波数
の変動による影響を受けることが少なく、かつホ
ルマント周波数を正確に抽出できるようにした音
声分析処理方式に関するものである。
(B) 技術の背景と問題点 従来から、第1図を参照して後述する如き構成
によつて線形予測係数α(n)/K(n)を抽出
することが行われている。なお上記α(n)/K
(n)は係数α(n)および/またはK(n)を
意味している。
上記線形予測係数α(n)/K(n)は以降の
音声分析処理的に利用されてゆくものであるが、
ノイズによる影響やピツチ周波数の変動による影
響を受け易く、ホルマント周波数を正確に抽出す
る上で多少の問題が残されている。
(C) 発明の目的と構成 本発明は、上記の点を解決することを目的とし
ており、パワー・スペクトルを用いて線形予測係
数を抽出するに当つて、パワー・スペクトルのい
わばピーク点を連らねた所のパワー・スペクトル
包絡情報にもとづいて改良線形予測係数を抽出す
るようにし、ピツチ周波数の変動やノイズによる
影響を受けにくく、かつホルマント周波数を正し
く抽出できるようにした改良線形予測係数を得る
ようにすることを目的としている。そしてそのた
めに、本発明の音声分析処理方式は、入力音声信
号をフーリエ変換部をそなえ、上記入力音声のパ
ワー・スペクトルを抽出し、該パワー・スペクト
ルをフーリエ逆変換部を介して自己相関係数を算
出して線形予測係数を抽出する音声分析処理方式
において、上記抽出されたパワー・スペクトルの
ピークに対応する形で当該パワー・スペクトルの
パワー・スペクトル包絡情報を抽出するパワー・
スペクトル包絡情報抽出部をもうけ、該抽出部に
よつて抽出された該パワー・スペクトル包絡情報
を上記フーリエ逆変換部に供給し、これによつて
得られた自己相関係数にもとづいて改良線形予測
係数を抽出するよう構成したことを特徴としてい
る。以下図面を参照しつつ説明する。
(D) 発明の実施例 第1図は本発明の前提となる従来の構成の一
例、第2図は本発明の一実施例構成、第3図は本
発明にいうパワー・スペクトル包絡情報の一態様
を説明する説明図、第4図および第5図は夫々本
発明によつて得られた改良線形予測係数を用いる
ことによる効果を説明する説明図を示す。
第1図において、1はフーリエ変換部、2はフ
ーリエ逆変換部、3は線形予測係数算出部、S
(n)は入力音声信号、P(ω)はパワー・スペ
クトル、R(n)は自己相関係数、α(n)/K
(n)は線形予測係数を表わしている。
従来から線形予測係数α(n)/K(n)を得
るに当つて、第1図図示の如き構成が採用され、
入力音声信号S(n)についてフーリエ変換部1
によつてフーリエ変換を行い例えば2乗するなど
してパワー・スペクトルP(ω)を抽出する。該
パワー・スペクトルは、第3図においてパワー・
スペクトルP(ω)の対数値をとつてlogP(ω)
として示す如く、ピツチ周波数に対応した凹凸を
もつものであると考えてよい。
従来、該パワー・スペクトルP(ω)にもとづ
いて、フーリエ逆変換部2によつて、自己相関係
数R(n)を算出し、そして線形予測係数算出部
3によつて線形予測係数α(n)/K(n)を抽
出するようにしていた。なお、上記線形予測係数
算出部3は、例えば(i)コロナ社 昭和58年発行、
鈴木久喜訳「音声のデイジタル信号処理(下)」
第165頁ないし第167頁や、(ii)IE3Proceeding
Vol63、No.4、1975“Linear Prediction:a
Tutorial Review”(J.Makhoul)P566、(37)式
または、(38a)式ないし(38c)式に示される如
く従来から知られているものである。
第2図は本発明の一実施例構成を示しており、
図中の符号1,2,3は第1図に対応し、4はピ
ツチ周波数抽出部、5はパワー・スペクトル包絡
情報抽出部を表わしている。またP^(ω)はパワ
ー・スペクトル包絡情報、R′(n)は本発明に
おいて得られる自己相関係数、α′(n)/
K′(n)は改良線形予測係数を表わす。
本発明の場合には、第2図において入力信号S
(n)からピツチ周波数を抽出するなどして、フ
ーリエ変換部1を介して得られているパワー・ス
ペクトルP(ω)について、第3図図示+印の如
き点に対応するパワー・スペクトル情報を抽出
し、該抽出されたパワー・スペクトル情報をフー
リエ逆変換部2へ入力するようにされる。上記+
印の如き点に対応するパワー・スペクトル情報を
本明細書においてはパワー・スペクトル包絡情報
P^(ω)と呼んでいる。そして上記+印の点以外
のパワー・スペクトルの値を値“0”としてフー
リエ逆変換部2へ入力するようにする。勿論、+
印の点のみの値をフーリエ逆変換部2へ入力して
もよい。
上記+印の点は、フーリエ変換部1を介して得
られたパワー・スペクトルP(ω)におけるピー
ク点に対応しているものと考えてよく、第2図図
示の場合には、入力音声信号S(n)から図示ピ
ツチ周波数抽出部4によつてピツチ周波数を抽出
し、該ピツチ周波数できまる周期の整数倍(1倍
を含む)の周期でサンプリングする点で与えられ
る。しかし本発明においては、上記パワー・スペ
クトル包絡情報P^(ω)を得る手段については任
意である。
上記パワー・スペクトル包絡情報P^(ω)が第
2図図示の如くフーリエ逆変換部2に入力されか
つ得られた出力R′(n)が線形予測係数算出部
3に入力されることによつて、本発明にいう改良
線形予測係数α′(n)/K′(n)が抽出され
る。
第4図は本発明によつて得られた改良線形予測
係数を用いることによる効果を説明する説明図を
示している。曲線Aは本発明による改良線形予測
係数を用いた場合に対応し、曲線Bは第1図にお
いて得られた線形予測係数を用いた場合に対応し
ている。なお横軸はS/N比(dB)を表わし、
縦軸はスペクトル間の距離について対数をとつた
値(dB)を表わしている。
該スペクトル間の距離とは次のようなものを表
わしていると考えてよい。即ち、モデル・スペク
トルSを合成音によつて生成しておく。一方、こ
れに対して所望量のノイズを混入せしめて第1図
(または第2図)図示の構成によつて線形予測係
数を抽出する。該抽出された線形予測係数にもと
づいてスペクトルTを生成する。そして上記スペ
クトルSとTとの差に相当する距離が得られ、該
距離を上記スペクトル間の距離としている。した
がつて、当該スペクトル間の距離が大きい程、得
られている線形予測係数が真のものからずれてい
る量が大きいことを表わしている。
第4図図示の場合、S/N比が小さくなる程、
即ちノイズの混入量が大になる程、上記距離が大
となつてゆくが、第1図に示す構成の場合に対応
するもの(曲線B)にくらべて、本発明に対応す
る改良線形予測係数を用いたもの(曲線A)の側
がより小さい距離となつていることが判る。
また第5図は、母音|a|、|i|、|u|、
|e|、|o|に対応してインパルス励起を行な
つた場合について、原スペクトルと抽出された線
形予測係数にもとづいて得られた抽出スペクトル
との差(dB)を表わしている。
したがつて、第5図図示の値は、小さい程、好
ましい値であり、本発明の改良線形予測係数α′
(n)/K′(n)を用いた方がより好ましいもの
となつていることが判る。
また発明者らは、第1ホルマント周波数とし
F1=500(Hz)をもつ入力音声信号について、第
1図図示の構成による線形予測係数α(n)/K
(n)と第2図図示構成による改良線形予測係数
α′(n)/K′(n)とを抽出し、これから上述
のホルマント周波数を算出せしめて次の結果を得
た。即ち、ノイズ(dB)=60.000の場合に、(i)前
者α(n)/K(n)を用いた場合には、算出さ
れたホルマント周波数はF1=467(Hz)となり、
(ii)後者α′(n)/K′(n)を用いた場合には、
算出されたホルマント周波数は、F1=475Hz、と
なつた。これは改良線形予測係数を用いた場合
に、真の値(500Hz)に対する誤差が25Hzであ
り、第1図図示の構成を用いた場合の誤差33Hzに
比較して、より好ましいものとなつていることを
明らかにしている。
(E) 発明の効果 以上説明した如く、本発明によれば、従来の構
成によつて得られた線形予測係数にくらべて、よ
り好ましい係数を得ることが可能となる。そし
て、該改良線形予測係数α′(n)/K′(n)は
ピツチ周波数の変動による影響やノイズによる影
響を受けることが少なく、当該改良線形予測係数
を用いることによつてホルマント周波数をより高
い精度で抽出することが可能となる。
【図面の簡単な説明】
第1図は本発明の前提となる従来の構成の一
例、第2図は本発明の一実施例構成、第3図は本
発明にいうパワー・スペクトル包絡情報の一態様
を説明する説明図、第4図および第5図は夫々本
発明によつて得られた改良線形予測係数を用いる
ことによる効果を説明する説明図を示す。 図中、1はフーリエ変換部、2はフーリエ逆変
換部、3は線形予測係数算出部、4はピツチ周波
数抽出部、5はパワー・スペクトル包絡情報抽出
部、S(n)は入力音声信号、P(ω)はパワ
ー・スペクトル、P^(ω)はパワー・スペクトル
包絡情報、R(n)は自己相関係数、α(n)/
K(n)は線形予測係数、α′(n)/K′(n)
は改良線形予測係数を表わしている。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声信号をフーリエ変換するフーリエ変
    換部をそなえ、上記入力音声のパワー・スペクト
    ルを抽出し、該パワー・スペクトルをフーリエ逆
    変換部を介して自己相関係数を算出して線形予測
    係数を抽出する音声分析処理方式において、上記
    抽出されたパワー・スペクトルのピークに対応す
    る形で当該パワー・スペクトルのパワー・スペク
    トル包絡情報を抽出するパワー・スペクトル包絡
    情報抽出部をもうけ、該抽出部によつて抽出され
    た該パワー・スペクトル包絡情報を上記フーリエ
    逆変換部に供給し、これによつて得られた自己相
    関係数にもとづいて改良線形予測係数を抽出する
    よう構成したことを特徴とする音声分析処理方
    式。
JP57050431A 1982-03-29 1982-03-29 音声分析処理方式 Granted JPS58168094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57050431A JPS58168094A (ja) 1982-03-29 1982-03-29 音声分析処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57050431A JPS58168094A (ja) 1982-03-29 1982-03-29 音声分析処理方式

Publications (2)

Publication Number Publication Date
JPS58168094A JPS58168094A (ja) 1983-10-04
JPS6238719B2 true JPS6238719B2 (ja) 1987-08-19

Family

ID=12858674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57050431A Granted JPS58168094A (ja) 1982-03-29 1982-03-29 音声分析処理方式

Country Status (1)

Country Link
JP (1) JPS58168094A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106663437B (zh) * 2014-05-01 2021-02-02 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、记录介质
PL3139381T3 (pl) * 2014-05-01 2019-10-31 Nippon Telegraph & Telephone Urządzenie generujące sekwencję okresowej połączonej obwiedni, sposób generowania sekwencji okresowej połączonej obwiedni, program do generowania sekwencji okresowej połączonej obwiedni i nośnik rejestrujący

Also Published As

Publication number Publication date
JPS58168094A (ja) 1983-10-04

Similar Documents

Publication Publication Date Title
JP2763322B2 (ja) 音声処理方法
US6014617A (en) Method and apparatus for extracting a fundamental frequency based on a logarithmic stability index
US20090144058A1 (en) Restoration of high-order Mel Frequency Cepstral Coefficients
JPS61134000A (ja) 音声分析合成方式
JPS6238719B2 (ja)
JPH04288600A (ja) ピッチ周波数差分特徴量抽出法
JP3035939B2 (ja) 音声分析合成装置
Makhoul Methods for nonlinear spectral distortion of speech signals
JPS6239760B2 (ja)
Li et al. A Voice Disguise Communication System Based on Real-Time Voice Conversion
JPH0193796A (ja) 声質変換方法
JPH0636157B2 (ja) 帯域分割型ボコ−ダ
JP2569472B2 (ja) 音声分析装置
JPH0552959B2 (ja)
JPS5936279B2 (ja) 音声分析処理方式
Martony On the vowel source spectrum
JPS62235996A (ja) 合成音質変化方法
JPH06202695A (ja) 音声信号処理装置
JPS5912197B2 (ja) 音声スペクトル情報修正方式
Lacroix et al. Accurate pitch estimation using digital filters
JPS6239759B2 (ja)
JPS63195700A (ja) ホルマント抽出装置
JPH0365560B2 (ja)
JPS6132100A (ja) パワ−スペクトル抽出方式
Duncan AN OBJECT ORIENTED SIGNAL MODELING MODULE FOR SPEECH RECOGNITION FEATURE EXTRACTION