JPS5994796A - 音声分析処理方式 - Google Patents

音声分析処理方式

Info

Publication number
JPS5994796A
JPS5994796A JP20479982A JP20479982A JPS5994796A JP S5994796 A JPS5994796 A JP S5994796A JP 20479982 A JP20479982 A JP 20479982A JP 20479982 A JP20479982 A JP 20479982A JP S5994796 A JPS5994796 A JP S5994796A
Authority
JP
Japan
Prior art keywords
power spectrum
quadratic curve
analysis processing
envelope
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP20479982A
Other languages
English (en)
Other versions
JPS5936279B2 (ja
Inventor
ヒネク・ヘルマンスキー
佐藤泰雄
杉田忠靖
藤崎博也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP20479982A priority Critical patent/JPS5936279B2/ja
Publication of JPS5994796A publication Critical patent/JPS5994796A/ja
Publication of JPS5936279B2 publication Critical patent/JPS5936279B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Devices For Checking Fares Or Tickets At Control Points (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、線形予測にもとづく音声分析処理方式に関し
、特に音声のスペクトル包絡を、杼本化と補間により近
似することにより、精度が高くノイズにも強い分析結果
を得ることのできる音声分析処理方式に関する。っ 〔技術の背景〕 音声合成や音声認識に用いる音声波形の情報圧縮パラメ
ータとして、音声波形の標本値間の相関にもとすく線形
予測理論にしたがって抽出した線形予測係数ないし偏自
己相関係数を使用する音声分析方式は、従来から多くの
用途に広く利用されている。しかし、この方式は、ノイ
ズやピッチ周波数変動に影響され易く、誤差を生じ易い
欠点があった。
一般に線形予測係数α(りは、まず音声波形5(rL)
をフーリエ変換してF(ω)を求め、これからパワー・
スペクトルP(ω)=lF(0月2をを計算し、更にこ
れを逆フーリエ変換して自己相関係数RCn)を求め、
この自己相関係数RCn)から抽出されているが、本発
明者は、先に特願昭57−50431において、パワー
・スペクトルの包絡をパワー・スペクトルの各ピーク値
により標本化し、これらピーク値によるパワー・スペク
トル包絡情報をフーリエ逆変換するようにして、ノイズ
やピッチ周波数変動の影響を軽減した改良方式を提案し
ている。
〔発明の目的およびS成〕
本発明の目的は、ノイズやピッチ周波数変動の影響が少
く、かっフォルマント推定精度の高い線形予測にもとづ
く音声分析処理方式を提供することにあり、特に、前記
した先行出願の発明を更に改良して、より性能のよい線
形予測係数ないし偏自己相関係数などが得られる音声分
析処理方式を提供することにある。
本発明は、そのだめの手段としてパワー・スペクトル包
絡を標本化し、その各点間を直線あるいは2次曲L9に
より補間して連続スペクトル化し、従来方式よりも包絡
情報の桔度を高めるものであり、その構成として、入力
音声信号中の有声部に対して、該音声部のパワースペク
トルを算出し、該パワー・スペクトルの包絡をもつとも
よく表現する個々の高調波成分の振幅をまず検出し、つ
ぎに峙り合う高調波成分の振幅間を補間することによっ
て、より密なスペクトル包絡を求めたのち、該スペクト
ル包絡を逆フーリエ変換して自己相関係数を算出し、該
自己相関係数から線形予測係数ないし偏自己相関係数な
どを算出することを特徴とする、 〔発明の実施例〕 以下、本発明実施例を図面にしたがって詳述する0 第1図乃至第4図は本発明の前提技術を説明するだめの
図であり、第5乃至第10図が本発明実施例を説明する
だめの図である。
第1図は、従来の線形予測分析方式の惜成例を示す図で
ある。
第1図において、1はフーリエ変換部、2は7一リエ逆
変換部、3は線形予測演算部、5(rL)は入力音声信
号、l)(ω)はパワー・スペクトル、R(n)は自己
相関係数、αCn)/KCn)は線形予測係数ないし偏
自己相関係数などを表わしている。
従来から線形予測係数ないし偏自己相関係数α(n)/
KCn)を得るに当って、第1図図示の如きM!成が採
用され、入力音声信号5Cn)についてフーリエ変換部
1によってフーリエ変換を行い例えば2乗するなどして
パワー・スペクトルP(ωンを抽出する。該パワー・ス
ペクトルは、第3図においてパワー・スペクトルP(ω
)の対数値をとってzorP(ω)として示す如く、ピ
ッチ周波数に対応した凹凸をもつものであると考えてよ
い。
従来、該パワー・スペクトルP(ωンにもとづいて、フ
ーリエ逆変換部2によって、自己相関係数R(tt)を
算出し、そして線形予測演算部3によって線形予d+i
l係、戊ないし偏自己相1刀保数α(ル)/KCルノで
抽出するようVCしていた。
第2図は前記先行発明の一溝成例を示しており、図中の
符号1..2.13は2;51図に対応し、4はピッチ
周波数抽出部、5はパワー・スペクトル包絡情報抽出部
を表わしている。またP(ω)はパワー・スペク)・ル
包絡情報、R′(n)は本発明においで得られる目己相
凋係数、α’ (n ) /に′(n )は改良i形予
測係酋ないし改良’fij自己相+A係数を表わす。
本rOH’(成の、円台には、第2図において入力信号
5Cn)からピッチ周波?孜を抽出するなどして、フー
リエ変換部lを介して・10られているパワー・スペク
トルP(0りについて、第3図図示→印の如き点に対応
するパワー・スペクトル・Eft報を抽出し、該抽出き
れたパワー・スペクトル情報をフーリエ逆変換部2へ人
力するようにされる。上記十印の如き点に対応するパワ
ー・スペクトル情報を本構成においてはパワー・スペク
トル包絡情XiJ P (ω)と呼んている。そして上
記+印の点以外のパワー・スペクトルの値を値°゛0″
′としてフーリエ逆変俣部2ヘ入力するようにする。勿
論、半部の点のみの値をフーリエ逆変換部2へ入力して
もよい。
上記+印の点は、フーリエ変換部1を介して得られたパ
ワー・スペクトルP(ω)におけるピーク点に対応して
いるものと考えてよく、第2図図示の場合には、入力音
声信号5Cn)から図示ピッチ周波数抽出部4によって
ピッチ周波数を抽出し、該ピッチ周波数できまる周期の
蛯数倍(1倍を含む)の周期でサンプリングする点で与
えられる。しかし、上記パワー・スペクトル包絡情報P
(ω)を4.%る手段については任意である。
上記パワー・スペクトル包絡情報P(ωンが第2図図示
の如くフーリエ逆変換部2に入力されかつ得られた出力
R′(rL)が線形予測演算部3に入力されることによ
って、改良された線形予測係数ないし改良偏自己相関係
数(t’(rL)/ K’Cn)が抽出される。
第4図は、上述した2132図の先行発明の構成によっ
て得られた改良線形予測係数ないし改良偏自己相関係数
全周いることによる効果を説明する説明図を示している
。曲線Aは第2図のMり成による改良線形予測係数ない
し改良偏自己相関係数を用いた場合に対応している。な
お横軸はSlN比CdB)を表わし、縦・油はノイズ混
入により変動したスペクトルと基部のスペクトルとの間
の誤差距離について対数をとった値Cd B)を表わし
ている。
第4図の曲線Aは、S/Nを小さくしたとき、すなわち
ノイズ混入率を高くしたとき、曲aBよりはスペクトル
変動f+が小さいことを示しており、これより第2図の
方式は、第1図の方式とくらべて、ノイズに対して性能
的に改善されていることがわかる。
第5図は、本発明によるスペクトル包絡補間の1実施例
の説明図であり、単純な直線補間による方式を示す。同
図において、6はパワー・スペクトル、7は高調波ピー
ク、8は誇り合った2つのピークを結ぶ直線補間、腺、
9は線形予測LPによる近似線を示す。
第6図は、本発明によるスペクトル包絡補間方式の他の
実施例の説明図であり、第5図の直線補間方式よりも近
似特性のよい2次曲線を用いた補間方式を示す。同図に
おいて、PK−0,PK、PK+1゜PK+2は、相違
なる高調波ピーク点であり、それぞれ座標(”K−1,
yト1入(x、 ’/ x )% (″に+s、’/x
<十x入(、”K+2.3’に+2 )をもツー’(い
る。またLK、は、PK−1pK、 PK+ 1の3点
を通る2次曲線を表わし、LKは、次に続くPK+ P
K+1. PK+2C,3点を通る2次曲線を表わす。
2次曲線LK −1,Llcは、ピーク点PKおよびP
K+、を共有する。LK/は、2次曲線LK−1および
LKを、ピーク点PKおよびPK+1間で平均した平均
2次曲線であり、これを各ピーク点の相続く2点間で求
め、補間腺として使用する。
2点間を補間する半均2次曲線の公式は、(”IC。
3’に入(”K+1. !/に+1 )S (”K+2
. ’lx+z)の3点を通る2次曲線の係数をαに、
 hK、 ’にとするとき、(xK、 yK)オよび(
”K+1. yi+、)の間の区間において、y = 
2(α1C+αに+1 )Z 2+>(hx+ hK土
1)r+=(C’rc+(’1c4、)で表わされる。
第7図は、第5図あるいは第6図のスペクトル包絡補間
を適用したEILPCEnvelope 工nterp
olationLLrLeαγpredtct*vり音
声分析処理システムの1実施例のブロック図である。同
図において、1乃至5は第2日で説り1した先行発明の
4?f成要素に対応するものである。そし7て、lOは
本発明によるスペクトル包絡補間部である。
スペクトル包絡補間部10は、パワー・スペクトル包絡
情報抽出部5からの、高調波ピーク点からなるパワース
ペクトル包絡情報P(ω)にもとづいて、たとえば第6
図で説明したように平均2次曲線LTC”Ir:算出し
、補間パワー・スペクトル包絡情報p、(ω)を出力す
る。
逆フーリエ変換部2は、補間パワー・スペクトル包絡情
報P工(ωンにもとづいて自己相開係数R(す〃を生成
し、線形予測演算部3は、それにより線形予測係数α(
i戸/K(nγ′を算出する。
このようにして求められた線形予測係数αCn)”/K
(W)“は、第2図の先行発明の方式により得られる線
形予測係数αCn)’/KCn戸にくらべて、パワー・
スペクトル包絡をより良好に近似するものとなっている
瀉8図は、本発明の更に他の実施例のEITLP(En
velope Interpolotton and 
Transforrn Lineαrprerhctt
ve )システムのブロック図である。本実施例は、フ
ォルマントのピークがピッチ周波数と一致して、パワー
スペクトルがピッチ周波数の強い影響を受t〕、異音を
生じる場合があるのを改善するため、更にパワースペク
トルの振幅を圧MK換する手段をそなえているものであ
る。これにより、パワー・スペクトルの高レベルのピー
クが線形予測係数算出に及ぼす影響は弱められ、逆に、
低レベルのピークが課形予測係数算出に及ぼす影響は強
められる。
第8図にンい−C111は時間窓処理部、12はフーリ
エ変rA郡、j3は包路標本抽出部、14はスペクトル
包絡補間部、15はスペクトル変換部、16は逆フーリ
エ変換部、17は線形予測演算部、18は逆スペクトル
変換部、19は逆フーリエ変1(11μ、20は線形予
測演算部を示す。
まゾζ、S(n、)は分析される逃声波形化号、Sw(
rL)は短時間スペクトル分析のための窓処理を受けた
信号、P(ω)は信号の原スペク)/し、Foは信号の
基本周波数(ピッチ) % P3(”)は信号の包絡標
本化スペクトルPI(ω)は信号の補間スペクトル、P
T(0りは信号スペクトルの振幅変換されだ補間スペク
トル、R(rL)は振幅変換された補間スペクトルの自
己相関関数、PT(ωンは振幅変換された補間スペクト
ルに対するLPスペクトル近似、P(ω)は補間されフ
仁スでクトルに対するスペクトル近似、R′(rL)は
トルに対するLPスペクトル近似を表わしている。
スペクトル包絡補間部14は、本発明による、たとえば
第6図に示す平均2次曲線による補間処理を行う。
スペクトル変換部15は、パワー・スペクトルP、(ω
)に対して、振幅を圧縮あるいは伸長する適当な変換を
行う。たとえば、本実施例では、P工T(ωラー[:P
I(ω)〕7 なる変換を行う。γの値は予め定められ、O<γ〈1゜
1くγ、 −1<r<o、 r<−1のそれぞれの:1
71:4合にしだがって、PI(ω)について圧縮、伸
長、圧縮/通数、伸長/逆数の処理を行う。
線形予測演算部17は、RCn)から線形予測を求め更
にスペクトル包絡PT(ω)に変換する。
変換処理の逆変換処理 P(ωプ=〔PT(ωプ〕−7 を行う。逆フーリエ変換部19は、このP(ω)を自己
相関係数R’(rL)に変換し、線形予測演算部20は
最終的にスペクトル包絡PLP(ω)を生成する0第9
図および第10図は、本発明案施例の効果を説明するた
めの図であり、横軸はS/N(dB)、縦軸は第17オ
ルマントの相対誤差〔饅〕を表わす。
また△で示す曲線は従来の単純なLP方式、○で示す曲
線はスペクトル振幅変換を行った5TLP方式、八で示
す曲線は標本化および補間を行った第7図の実施例のE
ILP方式、○で示す曲線は、標本化、補間およびスペ
クトル振幅変換を行った第8図の実施例のEITLP方
式の、S/Nに対する相対誤差!1゛♀性を示す。
1に 第9図は基本周波AF、とフォルマント周波数F。
との比がF s /F o = 2.5のノ2”7)合
、そして第10図はF1/Fo= 1.75の劫j合を
示す。これらの図力1ら、EILPおよびE I TL
Pの各方式が、S/Nの/」・さい狽域でLP方式より
も良好な特性を示し、またそれがF□/Foの違いによ
って大きく変らないことカニわかる。
〔発明の効果〕
以上述べたように、本発明によれば、ノイズ混入率の大
きい信号波形に対しても良い精度で紛5杉予測ガ析を行
うことができ、丑だピッチ周波数の違いによりフォルマ
ント周波数が受ける影響を軽(6,4することができる
【図面の簡単な説明】
第1図および第2図は本発明の前提技術の従来方式の4
,1図、’!A”; 3図はスペクトル包絡情報の説明
図、’ii”z 4図は第2図に示す従来方式の効果を
示す図、第5図は本発明における補間方式の1例の説明
図、第6図は他の補間方式の説明図、第71図は本発明
の1実施例システムのオ、“1V成図、第8図はイ由の
実施例システムの<i’f成図、棺9図および第10図
は本発明の効果を示す図である。 図中、1はフーリエ変換部、2はフーリエ逆変換部、3
は線形子61(]演算部、4はピッチ周波数抽出部、5
はパワー・スペクトル包餡情報抽出部、10はスペクト
ル包絡補間部を示す。 特許出願人 藤 崎 博 也(外1名)代理人弁理士 
従容用 文 )!2(外1名)S/N (dB)→

Claims (3)

    【特許請求の範囲】
  1. (1)入力音声信号中の有声部に対して、該音声部のパ
    ワースペクトルを算出し、該パワースペクトルの包絡を
    もつともよく表現する個々の高調波成分の振幅をまず検
    出し、つぎに@シ合う高調波成分の振幅間を補間するこ
    とによって、より密なスペクトル包絡を求めたのち、該
    スペクトル包絡を逆フーリエ変換して自己相関係数を算
    出し、該自己相関係数から腺形予測係数ないし偏自己相
    関係数などを算出することを特徴とする音声分析処理方
    式。
  2. (2)  前記第1項において、音声部のパワースペク
    トルの降り合う高調波成分の振幅間を繍形補関すること
    を特徴とする音声分析処理方式。
  3. (3)前記第1項において、音声部のパワー・スペクト
    ルの相違なる3点の高調波成分の各点をj爪る2次曲線
    を求め、次に降り合う2点の高調波成分間の2種の2次
    曲線から平均2次曲線を求め、該平均2次曲線を用いて
    附り合52点の高周波成分間を補間することを特徴とす
    る音声分析処理方式0
JP20479982A 1982-11-22 1982-11-22 音声分析処理方式 Expired JPS5936279B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20479982A JPS5936279B2 (ja) 1982-11-22 1982-11-22 音声分析処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20479982A JPS5936279B2 (ja) 1982-11-22 1982-11-22 音声分析処理方式

Publications (2)

Publication Number Publication Date
JPS5994796A true JPS5994796A (ja) 1984-05-31
JPS5936279B2 JPS5936279B2 (ja) 1984-09-03

Family

ID=16496547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20479982A Expired JPS5936279B2 (ja) 1982-11-22 1982-11-22 音声分析処理方式

Country Status (1)

Country Link
JP (1) JPS5936279B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001030049A1 (fr) * 1999-10-19 2001-04-26 Fujitsu Limited Unite de traitement et de reproduction de son vocaux reçus
JP2017514174A (ja) * 2014-04-17 2017-06-01 ヴォイスエイジ・コーポレーション 異なるサンプリングレートを有するフレーム間の移行による音声信号の線形予測符号化および復号のための方法、符号器および復号器

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541571Y2 (ja) * 1986-03-28 1993-10-20

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001030049A1 (fr) * 1999-10-19 2001-04-26 Fujitsu Limited Unite de traitement et de reproduction de son vocaux reçus
US7130794B2 (en) 1999-10-19 2006-10-31 Fujitsu Limited Received speech signal processing apparatus and received speech signal reproducing apparatus
JP2017514174A (ja) * 2014-04-17 2017-06-01 ヴォイスエイジ・コーポレーション 異なるサンプリングレートを有するフレーム間の移行による音声信号の線形予測符号化および復号のための方法、符号器および復号器
US10431233B2 (en) 2014-04-17 2019-10-01 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US10468045B2 (en) 2014-04-17 2019-11-05 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US11282530B2 (en) 2014-04-17 2022-03-22 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US11721349B2 (en) 2014-04-17 2023-08-08 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates

Also Published As

Publication number Publication date
JPS5936279B2 (ja) 1984-09-03

Similar Documents

Publication Publication Date Title
CN110333389B (zh) 基于插值dft的正弦信号频率估计方法
Wise et al. Maximum likelihood pitch estimation
CA2209417C (en) Method and apparatus for signal analysis
Ananthapadmanabha et al. Epoch extraction from linear prediction residual for identification of closed glottis interval
TWI470623B (zh) 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器
CA1307345C (en) Digital speech vocoder
US8781819B2 (en) Periodic signal processing method, periodic signal conversion method, periodic signal processing device, and periodic signal analysis method
Hui et al. A pitch detection algorithm based on AMDF and ACF
US7272551B2 (en) Computational effectiveness enhancement of frequency domain pitch estimators
CA1061906A (en) Speech signal fundamental period extractor
JPS5994796A (ja) 音声分析処理方式
Erkelens et al. Bias propagation in the autocorrelation method of linear prediction
US6629049B2 (en) Method for non-harmonic analysis of waveforms for synthesis, interpolation and extrapolation
Grenier et al. Autoregressive models with time-dependent log area ratios
JPH0573093A (ja) 信号特徴点の抽出方法
Röbel Estimating partial frequency and frequency slope using reassignment operators
EP0534442A2 (en) Code-book driven vocoder device with voice source generator
CN111273345B (zh) 一种基于高精度时频瞬时相位的地震数据时频谱处理方法
JPS6238720B2 (ja)
Zhao et al. A robust algorithm for formant frequency extraction of noisy speech
Zhang et al. Performance and Optimization of the SEEVOC Algorithm
Sysel Wiener filtering with spectrum estimation by wavelet transformation
Yousefi et al. Linear prediction of discrete-time $1/f $ processes
JPH03245200A (ja) 音声情報圧縮方法
CN114563824A (zh) 一种二阶多重同步挤压多项式chirplet变换薄储层识别方法