JPS599917B2 - 音声分析処理方式 - Google Patents

音声分析処理方式

Info

Publication number
JPS599917B2
JPS599917B2 JP56158355A JP15835581A JPS599917B2 JP S599917 B2 JPS599917 B2 JP S599917B2 JP 56158355 A JP56158355 A JP 56158355A JP 15835581 A JP15835581 A JP 15835581A JP S599917 B2 JPS599917 B2 JP S599917B2
Authority
JP
Japan
Prior art keywords
envelope information
spectral envelope
linear prediction
processing method
analysis processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56158355A
Other languages
English (en)
Other versions
JPS5859499A (ja
Inventor
博也 藤崎
ビネク・ヘルマンスキ−
泰雄 佐藤
忠靖 杉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56158355A priority Critical patent/JPS599917B2/ja
Publication of JPS5859499A publication Critical patent/JPS5859499A/ja
Publication of JPS599917B2 publication Critical patent/JPS599917B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 本発明は、音声分析処理方式、特に入力音声信号をフー
リエ変換してパワー ・スペクトルを抽出し、該パワー
・スペクトルを用いて自己相関係数を算出した上で線
形予測係数を抽出し、該線形予測係数を用いて入力音声
信号のスペクトル包絡情報を抽出する音声分析処理方式
において、上記フーリエ変換した後の周波数領域上にお
いて例えば圧縮ないし伸長などの変換を行なつた上で自
己相関係数を更に引続き線形予測係数を算出すると共に
、該線形予測係数を用いて得られた変形スペクトル包絡
情報に対して逆変換を行なうよう構成し、ピッチ周波数
に影響されない形で例えばスペクトル包絡情報を抽出し
たり、あるいは零周波数やホルマント周波数を高精度で
抽出できるようにした音声分析処理方式に関するもので
ある。
従来から、音声合成や音声認識などに用いるパラメータ
の抽出に当つて、線形予測係数を抽出することが行なわ
れている。
そして上記音声合成や音声認識に当つては、上記線形予
測係数から入力音声信号のスペクトル包絡情報を、例え
ば予測係数自体を時間関係とみなしてフーリエ変換を行
ないそのスペクトルの逆スペクトルを算出することによ
り、゛抽出したり、あるいは更に該スペクトル包絡情報
を用いてホルマント周波数などを求めたりするようにさ
れる。しかし、スペクトル包絡情報を抽出する上記従フ
来公知の方式の場合には、得られた上記スペクトル包
絡情報などが入力音声のピッチ周波数などに影響される
などの問題を含んでいる。
本発明は、上記の点を解決すると共に、音声合成や音声
分析に当つて将来の分析処理に自由度をク 与えるよう
にすることを目的としている。
そしてそのため、本発明の音声分析処理方式は、入力音
声信号をフーリエ変換して周波数領域に変換して当該入
力音声信号のパワー・スペクトルを抽出し、該パワー・
スペクトルを用いて自己相関係数を算出して線形予測係
数を抽出し、該線形予測係数を用いて上記入力音声信号
のスペクトル包絡情報を抽出する音声分析処理方式にお
いて、上記入力音声信号をフーリエ変換した後であつて
上記自己相関係数を算出する前の段階の周波数領域にお
いて入力信号に対して予め定めた変換をほどこす変換処
理部を挿置すると共に、上記線形予測係数を用いて得ら
れた変形スペクトル包絡情報に対して上記変換処理部に
おいて行なわれた変換の逆変換を行なう逆変換処理をほ
どこすよう構成したことを特徴としている。
以下図面を参照しつつ説明する。第1図は従来公知のス
ペクトル包絡情報抽出のための構成例、第2図は本発明
による方式を適用したスペクトル包絡情報抽出の一実施
例構成、第3図ないし第6図は夫々本発明による抽出結
果を説明する説明図を示す。第1図において、1はフー
リエ変換処理部であつて離散的な入力音声信号S(n)
をフーリエ変換す 二るもの、2は2乗値抽出部であつ
て入力音声のパワー・スペクトルP(至)を抽出するも
の、3はフーリエ逆変換処理部であつてパワー・スペク
トルP(―に対してフーリエ逆変換をほどこして自己相
関係数R(n)を算出するもの、4は線形予測係数算
2出部であつて自己相関係数R(n)にもとづいて線形
予測係数a(n)を算出するもの、5はフーリエ変換処
理部であつて線形予測係数a(n)を時間関数とみなし
てフーリエ変換を行なうもの、6は2乗値抽出部、7は
逆数処理部を表わしている。
なお、上 3記フーリエ変換処理部5と2乗値抽出部6
と逆数処理部7とは、上記線形予測係数a(n)から入
力音声信号のスペクトル包絡情報倉((社)を抽出する
ものと考えてよい。第1図図示の従来公知の構成を用い
た場合、次 3.の如き問題を包含している。
即ち、(4)今入力音声のピツチ周波数が、(1)62
.5ないし500Hzの周波数範囲内にある多数の音声
信号群A、(1)83.3ないし250Hzの周波数範
囲内にある多数の音声信号群BlOi;)62.5な
41いし125Hzの周波数範囲内にある多数の音声信
号群C1●V)250ないし500Hzの周波数範囲内
にある多数の音声信号群Dについて、対数スペクトル包
絡情報を抽出し、夫々群毎に入力音声の真の対数スペク
トル包絡情報からの偏差の2乗平均をとつてプロツトす
ると、第4図図示横軸r=1.0における値k1、K2
、K3として示されるように、各音声信号群A,B,C
,Dに応じて偏差が異なる値をもつている。
このことは、入力音声のピツチ周波数の存在によつて抽
出したスペクトル包絡情報に誤差が生じること、またピ
ツチ周波数の変動に応じて抽出スペクトル包絡情報が変
動することを示している。(B)また一定のホルマント
周波数F,(500Hz)に対応してF,/FO比が0
.80ないし8.00となる範囲のピツチ周波数F。
をもつ多数の音声信号毎に、抽出されたホルマント周波
数が真のホルマント周波数F1に対してどの程度の相対
誤差をもつかをプロツトすると、第5図図示の如く、相
対誤差がF1/FO比4.00以上のピッチ周波数F。
をもつ音声信号においても±2.50%程度の値をとる
ものとなつている。
上述の如く、第1図図示の従来公知の方式を用いた場合
、入力音声信号のピツチ周波数に応じて、得られるスペ
クトル包絡情報や得られるホルマント周波数に比較的大
きい相対誤差を含んだものとなつている。第2図は本発
明による方式を適用したスペクトル包絡情報抽出の一実
施例構成を示している。
図中の符号1ないし7およびS(n),P(祠,↑((
社)は第1図に対応し、8は本発明においてもうけられ
る変換処理部、9は逆変換処理部、11/(c!)は本
発明において得られる変形パワー・スペクトル、R′(
n)は本発明において得られる変形自己相関係数、a′
(n)は本発明において得られる変形予測係数、F(:
は本発明にお(・て得られる変形スペクトル包絡情報を
表わしている。第2図図示において2乗値抽出部2によ
つて入力音声のパワー・スペクトルP((!)が得られ
るが、該パワー・スペクトルP(@に対して例えばP′
(―=〔P(―〕1 ?(1)なる変換を与える変換処
理部8を挿置するようにする。
該変換処理部8における係数rの値に対応して、0〈r
く1の場合にはパワー・スペクトルP((社)を振幅軸
に関して圧縮し、1くrの場合には伸長し、−1くrく
0の場合には圧縮して逆数をとり、rく−1の場合には
伸長して逆数をとつているものと考えてよい。第2図図
示の場合、入力音声信号S(n)をプーリ工変換して絶
対値をとつたパワー・スペクトルP(ハ)に対して第(
1)式に示す如き変換を行なつた上で、変形自己相関係
数R″(n)、変形予測係数a′(n)、変形スペクト
ル包絡情報f/(0))を得てその上で、上記第(1)
式の変換の逆変換を逆変換処理部9において行なうよう
にする。
即ち、入力音声信号S(n)を 1フーリエ変換した後
であつてフーリエ逆変換処理部3によつて逆変換するま
での間の周波数領域において、第(1)式に示す如き変
換を行ない、スペクトル包絡情報P(匈を抽出するに当
つて、逆変換Fi(ω)=〔p(匈〕−rを行なうよう
にしている。なお、計算量は大となるが、第2図図示の
フーリエ変換処理部1の直後に変換処理部8を挿置して
もよい。第3図は、パワー・スペクトルP(ω)が図示
の如くスパイク状に存在しているものに対して、第2図
図示の構成にもとづいてスペクトル包絡情報↑(ω)を
抽出した状態を示している。
なお、第1図図示の従来公知の構成によつて得られてい
るスペクトル包絡情報↑(ω)は、第3図図示において
r一1に対応するスペクトル包絡情報に相当している。
また第3図図中の各スペクトル包絡情報角@の零レベル
は、図を明瞭にするために順次シフトして示していると
考えてよい。第4図は、上述の如く各音声信号群A,B
,C,D毎に、上記係数rを変化させて前述のスペクト
ル包絡情報の偏差をとつてプロツトした結果を示してい
る。
図示の場合においては、r=0.5近傍において、各群
A,B,C,D毎の偏差が略零近傍に集中しており、入
力音声のピツチ周波数の変動による影響が吸収されてい
ることが判る。第6図は、ピツチ周波数F。をもつ多数
の入力音声について、第2図図示の構成によつてr=フ
0.2として得られたスペクトル包絡情報?(―にもと
づいてホルマント周波数を抽出し、第5図図示の場合と
同様に真のホルマント周波数F。
に対する相対誤差をプロツトしたものである。第2図図
示の構成を用いた場合、例えば F1/FO比が4.00以上の場合、上記相対誤差はプ
ラス方向にずれる傾向をもつてはいるが略+1.25近
傍に集中し、入力音声のピツチ周波数が異なることによ
る影響が大きく抑えられる。
以上説明した如く、本発明によれば、入力音声信号のピ
ツチ周波数の違いによる影響をなくすることができ、特
にr−0.5の近傍においてその効果が大きい。また上
記rの値を選ぶことによつて場合においては入力音声信
号のピツチ周波数の違いによる特徴を拡大させて抽出す
ることもでき、分析処理上の自由度が向上する。更に本
発明において処理の過程で得られる変形スペクトル包絡
情報ないし変形スペクトル包絡情報から求められるホル
マント周波数自体も、ピツチ周波数の変動の影響を受け
ることが少ないため、音声合成や音声認識に用いること
が可能である。
【図面の簡単な説明】
第1図は従来公知のスペクトル包絡情報抽出のための構
成例、第2図は本発明による方式を適用したスペクトル
包絡情報抽出の一実施例構成、第3図ないし第6図は夫
々本発明による抽出結果を説明する説明図を示す。 図中、1はフーリエ変換処理部、2は2乗値抽出部、3
はフーリエ逆変換処理部、4は線形予測係数算出部、5
はフーリエ変換処理部、6は2乗値抽出部、7は逆数処
理部、8は変換処理部、9は逆変換処理部、S(研よ入
力音声信号、P(匈はパワー・スペクトル、f(―はス
ペクトル包絡情報、V((社)は変形パワー・スペクト
ル、k(n)は変形自己相関係数、a″(n)は変形予
測係数、p@は変形スペクトル包絡情報を表わす。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声信号をフーリエ変換して周波数領域に変換
    して当該入力音声信号のパワー・スペクトルを抽出し、
    該パワー・スペクトルを用いて自己相関係数を算出して
    線形予測係数を抽出し、該線形予測係数を用いて上記入
    力音声信号のスペクトル包絡情報を抽出する音声分析処
    理方式において、上記入力音声信号をフーリエ変換した
    後であつて上記自己相関係数を算出する前の段階の周波
    数領域において入力信号に対して予め定めた変換をほど
    こす変換処理部を挿置すると共に、上記線形予測係数を
    用いて得られた変形スペクトル包絡情報に対して上記変
    換処理部において行なわれた変換の逆変換を行なう逆変
    換処理をほどこすよう構成したことを特徴とする音声分
    析処理方式。
JP56158355A 1981-10-05 1981-10-05 音声分析処理方式 Expired JPS599917B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56158355A JPS599917B2 (ja) 1981-10-05 1981-10-05 音声分析処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56158355A JPS599917B2 (ja) 1981-10-05 1981-10-05 音声分析処理方式

Publications (2)

Publication Number Publication Date
JPS5859499A JPS5859499A (ja) 1983-04-08
JPS599917B2 true JPS599917B2 (ja) 1984-03-06

Family

ID=15669845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56158355A Expired JPS599917B2 (ja) 1981-10-05 1981-10-05 音声分析処理方式

Country Status (1)

Country Link
JP (1) JPS599917B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0417369Y2 (ja) * 1987-12-22 1992-04-17

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0417369Y2 (ja) * 1987-12-22 1992-04-17

Also Published As

Publication number Publication date
JPS5859499A (ja) 1983-04-08

Similar Documents

Publication Publication Date Title
EP0853309B1 (en) Method and apparatus for signal analysis
JP3321971B2 (ja) 音声信号処理方法
US8412526B2 (en) Restoration of high-order Mel frequency cepstral coefficients
EP2249333B1 (en) Method and apparatus for estimating a fundamental frequency of a speech signal
JP5992427B2 (ja) 信号におけるピッチおよび/または基本周波数に関するパターンを推定する方法および装置
CA1164569A (en) System for extraction of pole/zero parameter values
US20040199381A1 (en) Restoration of high-order Mel Frequency Cepstral Coefficients
JPS599917B2 (ja) 音声分析処理方式
JP2940835B2 (ja) ピッチ周波数差分特徴量抽出法
JPH0573093A (ja) 信号特徴点の抽出方法
JPS6239760B2 (ja)
Dasgupta et al. Detection of Glottal Excitation Epochs in Speech Signal Using Hilbert Envelope.
JP3312636B2 (ja) 音響信号分析合成装置
JP2898637B2 (ja) 音声信号分析方法
JPS6239759B2 (ja)
JPS6238719B2 (ja)
JPH0365560B2 (ja)
JPH06202695A (ja) 音声信号処理装置
JPS6132100A (ja) パワ−スペクトル抽出方式
JP6616962B2 (ja) 信号処理装置及びプログラム
JP2569472B2 (ja) 音声分析装置
JPH0588478B2 (ja)
JPS58111994A (ja) 音声パラメ−タの修正方式
JPS5912197B2 (ja) 音声スペクトル情報修正方式
JPS60118898A (ja) 音声分析方式