JPS5936279B2 - 音声分析処理方式 - Google Patents

音声分析処理方式

Info

Publication number
JPS5936279B2
JPS5936279B2 JP20479982A JP20479982A JPS5936279B2 JP S5936279 B2 JPS5936279 B2 JP S5936279B2 JP 20479982 A JP20479982 A JP 20479982A JP 20479982 A JP20479982 A JP 20479982A JP S5936279 B2 JPS5936279 B2 JP S5936279B2
Authority
JP
Japan
Prior art keywords
power spectrum
linear prediction
analysis processing
processing method
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP20479982A
Other languages
English (en)
Other versions
JPS5994796A (ja
Inventor
ヒネク・ヘルマンスキー
泰雄 佐藤
忠靖 杉田
博也 藤崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP20479982A priority Critical patent/JPS5936279B2/ja
Publication of JPS5994796A publication Critical patent/JPS5994796A/ja
Publication of JPS5936279B2 publication Critical patent/JPS5936279B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Devices For Checking Fares Or Tickets At Control Points (AREA)
  • Complex Calculations (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、線形予測にもとづく音声分析処理方式に関し
、特に音声のスペクトル包絡を、標本化と補間により近
似することにより、精度が高くノイズにも強い分析結果
を得ることのできる音声分析処理方式に関する。
〔技術の背景〕
音声合成や音声認識に用いる音声波形の情報圧縮パラメ
ータとして、音声波形の標本値間の相関にもとずく線形
予測理論にしたがつて抽出した線形予測係数ないし偏自
己相関係数を使用する音声分析方式は、従来から多くの
用途に広く利用されている。
しかし、この方式は、ノイズやピッチ周波数変動に影響
され易く、誤差を生じ易い欠点があつた。一般に線形予
測係数α(n)は、まず音声波形S(n)をフーリエ変
換してF(iを求め、これからパワー ・スペクトルp
(ω)−IF(ω)12をを計算し、更にこれを逆フー
リエ変換して自己相関係数R(n)を求め、この自己相
関係数R(n)から抽出されているが、本発明者は、先
に特願昭57−50431において、パワー・スペクト
ルの包絡をパワー ・スペクトルの各ピーク値により標
本化し、これらピーク値によるパワー・スペクトル包絡
情報をフーリエ逆変換するようにして、ノイズやピッチ
周波数変動の影響を軽減した改良方式を提案している。
〔発明の目的および構成〕本発明の目的は、ノイズやピ
ツチ周波数変動の影響が少く、かつフオルマント推定精
度の高い線形予測にもとづく音声分析処理方式を提供す
ることにあり、特に、前記した先行出願の発明を更に改
良して、より性能のよい線形予測係数ないし偏自己相関
係数などか得られる音声分析処理方式を提供することに
ある。
本発明は、そのための手段としてパワー・スベクトル包
絡を標本化し、その各点間を直線あるいは2次曲線によ
り補間して連続スペクトル化し、従来方式よりも包絡情
報の精度を高めるものであり、その構成として、入力音
声信号中の有声部に対して 該音声部のパワースペクト
ルを算出し、該パワー ・スペクトルの包絡をもつとも
よく表現する個々の高調波成分の振幅をまず検出し、つ
ぎに隣り何う高調波成分の振幅間を補間することによつ
て、より密なスペクトル包絡を求めたのち、該スペクト
ル包絡を逆フーリエ変換して自己相関係数を算出し、該
自己相関係数から線形予測係数ないし偏自己相関係数な
どを算出することを特徴とする。
〔発明の実施例〕
以下、本発明実施例を図面にしたがつて詳述する。
第1図乃至第4図は本発明の前提技術を説明するための
図であり、第5乃至第10図が本発明実施例を説明する
ための図である。
第1図は、従来の線形予測分析方式の構成例を示す図で
ある。
第1図において、1はフーリエ変換部、2はフーリエ逆
変換部、3は線形予測演算部、S(n)は入力音声信号
、P(ωノはパワー ・スペクトル、R(n)は自己相
関係数、α(n)/ K(n)は線形予測係数ないし偏
自己相関係数などを表わしている。
従来から線形予測係数ないし偏自己相関係数α(n)/
K(n)を得るに当つて、第1図図示の如き構成が採用
され、入力音声信号S(n)についてフーリエ変換部1
によつてフーリエ変換を行い例えば2乗するなどしてパ
ワー ・スペクトルp(一を抽出する。
該パワー・スペクトルは、第3図においてパワー ・ス
ペクトルP(一の対数値をとつて10gP(一として示
す如く、ピツチ周波数に対応した凹凸をもつものである
と考えてよい。従来、該パワー・スペクトルP(ω)に
もとづいて、フーリエ逆変換部2によつて、自己相関係
数R(n)を算出し、そして線形予測演算部3によつて
線形予測係数ないし偏自己相関係数α(nl/ K(n
)を抽出するようにしていた。
第2図は前記先行発明の一構成例を示しており、図中の
符号1,2,3は第1図に対応し、4はピツチ周波数抽
出部、5はパワー・スペクトル包絡情報抽出部を表わし
ている。
またΦ(ω)はパワー ・スペクトル包絡情報、R’(
n)は本発明において得られる自己相関係数、α’(n
)/ K’(n)は改良線形予測係数ないし改良偏自己
相関係数を表わす。本構成の場合には、第2図において
入力信号S(n)からピツチ周波数を抽出するなどして
、フーリエ変換部1を介して得られているパワー ・ス
ペクトルp(ω)について、第3図図示+印の如き点に
対応するパワー ・スペクトル情報を抽出し、該抽出さ
れたパワー ・スペクトル情報やフーリエ逆変換部2へ
入力するようにされる。
上記+印の如き点に対応するパワー・スペクトル情報を
本構成においてはパワー ・スペクトル包絡情報全(ω
)と呼んでいる。そして上記+印の点以外のパワー ・
スペクトルの値を値゛o’’としてフーリエ逆変換部2
へ入力するようにする。勿論、十印の点のみの値をフー
リエ逆変換部2へ入力してもよい。上記+印の点は、フ
ーリエ変換部1を介して得られたパワー ・スペクトル
p(ω)におけるピーク点に対応しているものと考えて
よく、第2図図示の場合には、入力音声信号S(n)か
ら図示ピツチ周波数抽出部4によつてピッチ周波数を抽
出し、該ピツチ周波数できまる周期の整数倍(l倍を含
む)の周期でサンプリングする点で与えられる。
しかし、上記パワー ・スペクトル包絡情報ヤ(ω俺得
る手段については任意である。上記パワー ・スペクト
ル包絡情報Φ(ω坤S第2図図示の如くフーリエ逆変換
部2に入力されかつ得られた出力R’(n)が線形予測
演算部3に入力されることによつて、改良された線形予
測係数ないし改良偏自己相関係数d(n)/ K’(n
)が抽出される。
第4図は、上述した第2図の先行発明の構成によつて得
られた改良線形予測係数ないし改良偏自己相関係数を用
いることによる効果を説明する説明図を示している。曲
線Aは第2図の構成による改良線形予測係数ないし改良
偏自己相関係数を用いた場合に対応し、曲線Bは第1図
の構成において得られた線形予測係数ないし偏自己相関
係数を用いた場合に対応している。なお横軸はS/N比
(DB)を表わし、縦軸はノイズ混入により変動したス
ペクトルと基準のスペクトルとの間の誤差距離について
対数をとつた値(DB)を表わしている。第4図の曲線
Aは、S/Nを小さくしたとき、すなわちノイズ混入率
を高くしたとき、曲線Bよりはスペクトル変動量が小さ
いことを示しており、これより第2図の方式は、第1図
の方式とくらべて、ノイズに対して性能的に改善されて
いることがわかる。第5図は、本発明によるスペクトル
包絡補間の1実施例の説明図であり、単純な直線補間に
よる方式を示す。
同図において、6はパワー ・スペクトル、1は高調波
ピーク、8は隣り合つた2つのピークを結ぶ直線補間線
、9は線形予測LPによる近似線を示す。第6図は、本
発明によるスペクトル包絡補間方式の他の実施例の説明
図であり、第5図の直線補間方式よりも近似特性のよい
2次曲線を用いた補間方式を示す。
同図において、PK−1,PK,PKf.,PK.f,
2は、相連なる高調波ピーク点であり、それぞれ座標(
XK−、,YK−1)、(XK,yK)・(XK+1,
yK+1)、( XK+ 2,yK→2)をもつている
。またLK−,は、PK−1,PK,PK+,の3点を
通る2次曲線を表わし、LKは、次に続くPK,PK+
1,PK+2の3点を通る2次曲線を表わす。2次曲線
LK−1,LKは、ビーク点PKおよびPK+,を共有
する。
LI(’は、2次曲線LK−1およびLKを、ピーク点
PKおよびPK+l間で平均した平均2次曲線であり、
これを各ピーク点の相続く2点間で求め、補間線として
使用する。2点間を補間する平均2次曲線の公式は、(
XK,yk)、(XK+1,yK+1)、(XK+21
yK+2)の3点を通る2次曲線の係数をAK,bK,
cKとするとき、(XK,yK)および(XK+1,y
K+1)の間の区間において、で表わされる。
第T図は、第5図あるいは第6図のスペクトル包絡補間
を適用したEILP(EnvelOpeInterト0
1ati0nLinearPredictive)音声
分析処理システムのl実施例のプロツク図である。
同図において、1乃至5は第2図で説明した先行発明の
構成要素に対応するものである。そして、10は本発明
によるスペクトル包絡補間部である。スペクトル包絡補
間部10は、パワー ・スペクトル包絡情報抽出部5か
らの、高調波ピーク点からなるパワースペクトル包絡情
報貨ω)にもとづいて、たとえば第6図で説明したよう
に平均2次曲線L1!?を算出し、補間パワー ・スペ
クトル包絡情報介I(ω)を出力する。
逆フーリエ変換部2は、補間パワー ・スペクトル包絡
情報PI(ω)にもとづいて自己相関係数R(Ny’を
生成し、線形予測演算部3は、それにより線形予測係数
α(NY’/ K(NY’を算出する。
このようにして求められた線形予測係数α(n)″/
K(nΥ′は、第2図の先行発明の方式により得られる
線形予測係数α(n)’/ K(Nyにくらべて、パワ
ー ・スペクトル包絡をより良好に近似するものとなつ
ている。第8図は、本発明の更に他の実施例のEITL
P(EnvelOpeInterpOlOtiOnan
dTransfOrmLinearPredictiv
e)システムのプロツク図である。
本実施例は、フオルマントのピークがピツチ周波数と一
致して、パワースペクトルがピツチ周波数の強い影響を
受け、異音を生じる場合があるのを改善するため、更に
パワースペクトルの振幅を圧縮変換する手段をそなえて
いるものである。これにより、パワー ・スペクトルの
高レベルのピークが線形予測係数算出に及ほす影響は弱
められ、逆に、低レベルのピークが線形予測係数算出に
及ぼす影響は強められる。第8図において、11は時間
窓処理部、12はフーリエ変換部、13は包絡標本抽出
部、14はスペクトル包絡補間部、15はスペクトル変
換部、16は逆フーリエ変換部、1?は線形予測演算部
、18は逆スペクトル変換部、19は逆フーリエ変換部
、20は線形予測演算部を示す。
また、S(n)は分析される音声波形信号、Sw(n)
は短時間スペクトル分析のための窓処理を受けた信号、
P(ω)は信号の原スペクトル、FOは信号の基本周波
数(ピツチ)、Ps(ω)は信号の包絡標本化スペクト
ルPI(ω)は信号の補間スペクトル、PT(ω)は信
号スペクトルの振幅変換された補間スペクトル、R(n
)は振幅変換された補間スペクトルの自己相関関数、ヤ
T(ω)は振幅変換された補間スペクトルに対するLP
スペクトル近似、P(ω)は補間されたスペクトルに対
するスペクトル近似、R’(n)はp(ωp自己相関関
数、PLp(一は補間されたスペクトルに対するLPス
ペクトル近似を表わしている。
スペクトル包絡補間部14は、本発明による、たとえば
第6図に示す平均2次曲線による補間処理を行う。
スペクトル変換部15は、パワー ・スペクトルPI(
一に対して、振幅を圧縮あるいは伸長する適当な変換を
行う。
たとえば、本実施例では、なる変換を行う。γの値は予
め定められ、o<γ<1,1<γ,−1<γ<0,γ<
−lのそれぞれの場合にしたがつて、PI(ω”こつい
て圧縮、伸長、圧縮/逆数、伸長/逆数の処理を行う。
線形予測演算部ITは、R(n)から線形予測を求め更
にスペクトル包絡PT(一に変換する。
変換処理の逆変換処理Λ . を行う。
逆フーリエ変換部19は、このヤ(ω)を自己相関係数
R’(n)に変換し、線形予測演算部20は最終的にス
ペクトル包絡全Lp(ω)を生成する。第9図および第
10図は、本発明実施例の効果を説明するための図であ
り、横軸はS/N(DB)、縦軸は第1フオルマントの
相対誤差〔%〕を表わす。また△で示す曲線は従来の単
純なLP方式、○で示す曲線はスペクトル振幅変換を行
つたSTLP方式、▲で示す曲線は標本化および補間を
行つた第T図の実施例のEILP方式、●で示す曲線は
、標本化、補間およびスペクトル振幅変換を行つた第8
図の実施例のEITLP方式の、S/Nに対する相対誤
差特性を示す。第9図は基本周波数F,とフオルマント
周波数FOとの比がF,/FO二2.5の場合、そして
第10図はF,/FO二1.75の場合を示す。
これらの図から、EILPおよびEITLPの各方式が
、S/Nの小さい領域でLP方式よりも良好な特性を示
し、またそれがFl/FOの違いによつて大きく変らな
いことがわかる。〔発明の効果〕 以上述べたように、本発明によれば、ノイズ混入率の大
きい信号波形に対しても良い精度で線形予測分析を行う
ことができ、またヒーツチ周波数の違いによりフオルマ
ント周波数が受ける影響を軽減することができる。
【図面の簡単な説明】
第1図および第2図は本発明の前提技術の従来方式の構
図、第3図はスペクトル包絡情報の説明図、第4図は第
2図に示す従来方式の効果を示す図、第5図は本発明に
おける補間方式の1例の説明図、第6図は他の補間方式
の説明図、第T図は本発明のl実施例システムの構成図
、第8図は他の実施例システムの構成図、第9図および
第10図は本発明の効果を示す図である。 図中、1はフーリエ変換部、2はフーリエ逆変換部、3
は線形予測演算部、4はピツチ周波数抽出部、5はパワ
ー・スペクトル包絡情報抽出部、10はスペクトル包絡
補間部を示す。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号中の有声部に対して、該音声部のパワ
    ースペクトルを算出し、該パワースペクトルの包絡をも
    つともよく表現する個々の高調波成分の振幅をまず検出
    し、つぎに隣り合う高調波成分の振幅間を補間すること
    によつて、より密なスペクトル包絡を求めたのち、該ス
    ペクトル包絡を逆フーリエ変換して自己相関係数を算出
    し、該自己相関係数から線形予測係数ないし偏自己相関
    係数などを算出することを特徴とする音声分析処理方式
    。 2 前記第1項において、音声部のパワースペクトルの
    隣り合う高調波成分の振幅間の線形補間することを特徴
    とする音声分析処理方式。 3 前記第1項において、音声部のパワー・スペクトル
    の相連なる3点の高調波成分の各点を通る2次曲線を求
    め、次に隣り合う2点の高調波成分間の2種の2次曲線
    から平均2次曲線を求め、該平均2次曲線を用いて隣り
    合う2点の高周波成分間を補間することを特徴とする音
    声分析処理方式。
JP20479982A 1982-11-22 1982-11-22 音声分析処理方式 Expired JPS5936279B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20479982A JPS5936279B2 (ja) 1982-11-22 1982-11-22 音声分析処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20479982A JPS5936279B2 (ja) 1982-11-22 1982-11-22 音声分析処理方式

Publications (2)

Publication Number Publication Date
JPS5994796A JPS5994796A (ja) 1984-05-31
JPS5936279B2 true JPS5936279B2 (ja) 1984-09-03

Family

ID=16496547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20479982A Expired JPS5936279B2 (ja) 1982-11-22 1982-11-22 音声分析処理方式

Country Status (1)

Country Link
JP (1) JPS5936279B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541571Y2 (ja) * 1986-03-28 1993-10-20

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001030049A1 (fr) 1999-10-19 2001-04-26 Fujitsu Limited Unite de traitement et de reproduction de son vocaux reçus
CA2940657C (en) 2014-04-17 2021-12-21 Voiceage Corporation Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541571Y2 (ja) * 1986-03-28 1993-10-20

Also Published As

Publication number Publication date
JPS5994796A (ja) 1984-05-31

Similar Documents

Publication Publication Date Title
Yegnanarayana et al. Extraction of vocal-tract system characteristics from speech signals
McAulay et al. Pitch estimation and voicing detection based on a sinusoidal speech model
KR100770839B1 (ko) 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
TWI470623B (zh) 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器
US8412526B2 (en) Restoration of high-order Mel frequency cepstral coefficients
CA2209417C (en) Method and apparatus for signal analysis
JP2002516420A (ja) 音声コーダ
CA1061906A (en) Speech signal fundamental period extractor
US7305339B2 (en) Restoration of high-order Mel Frequency Cepstral Coefficients
EP1944754B1 (en) Speech fundamental frequency estimator and method for estimating a speech fundamental frequency
JPS5936279B2 (ja) 音声分析処理方式
US6662153B2 (en) Speech coding system and method using time-separated coding algorithm
JPS6238720B2 (ja)
KR100194953B1 (ko) 유성음 구간에서 프레임별 피치 검출 방법
JP3398968B2 (ja) 音声分析合成方法
JP3186020B2 (ja) 音響信号変換復号化方法
CN112233686B (zh) Nvocplus高速宽带声码器的语音数据处理方法
JP3223564B2 (ja) ピッチ抽出方法
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置
JP2898637B2 (ja) 音声信号分析方法
Turner et al. Linear prediction applied to time varying all pole signals
CN117219105A (zh) 一种融合端点检测技术与改进谱减法的语音降噪方法
Zhang et al. Performance and Optimization of the SEEVOC Algorithm
JPS629399A (ja) 音声ピツチ周波数抽出装置
Imagawa et al. A new spectrum estimation method of a speech waveform by eliminating high frequency pitch period