JPS60118898A - 音声分析方式 - Google Patents

音声分析方式

Info

Publication number
JPS60118898A
JPS60118898A JP58225671A JP22567183A JPS60118898A JP S60118898 A JPS60118898 A JP S60118898A JP 58225671 A JP58225671 A JP 58225671A JP 22567183 A JP22567183 A JP 22567183A JP S60118898 A JPS60118898 A JP S60118898A
Authority
JP
Japan
Prior art keywords
speech
fundamental frequency
autocorrelation function
filter
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58225671A
Other languages
English (en)
Inventor
健作 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58225671A priority Critical patent/JPS60118898A/ja
Publication of JPS60118898A publication Critical patent/JPS60118898A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Selective Calling Equipment (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 fal 発明の技術分野 本発明は音声認識並びに合成システムに係り、特に音声
の自己相関関数を用いて特徴を抽出する音声分析方式の
改良に関す。
fb) 技術の背景 近年電話交換機等のサービスの多様化の一環として、発
話者の音声を認識し合成する機会が増加している。音声
は、ピッチと呼ばれる声帯等の音源からエネルギーが供
給される周期を示す基本周波数と、音韻情報を与える高
調波と、前記各周波数成分とにより定まる。特に強いエ
ネルギーを持つ高調波成分をポルマントと称する。音声
を認識する為には該音声に含まれる音韻情報、特にホル
マント情報を抽出することが必要であり、基本周波数成
分は必要としない。また分析の結果i#られた特徴を用
いて元の音声を合成する為には、音韻情報に併せ基本周
波数成分を供給する。
tc+ 従来技術と問題点 音声の分析方式として線形予測分析法が公知である。該
線形予測分析法によれば、音声の波形を所定標本化周期
で標本化して得られる2個の標本値x(n−k)(但し
、にはl乃至p〕の線形結合から一つ先の標本値x (
n)を推定する場合、成る一定区間内における推定誤差
の自乗の和が最小となる様に、前記線形結合の係数(以
後線形予測係数akと称す)を決定する。今標本値x 
(n>を推定した場合の推定誤差e (n>は(1)式
により示される。
e (n) =x (n) −Σa k−x (n−k
) −(1)k=J また推定誤差e (n)の前記区間に就いての自乗和E
は(2)式で示される。
E−Σe (n) =3 (X (n)−Σa k−x (n−k) )”
 (2)kI=l 前記線形予測係数akは、前記自乗和Eの各線形予測係
数akによる偏微分係数から得られる(3)式を解くこ
とによりめられる。
Σx (n) x (n−1) ′p −ΣakΣx (n−k) −x (n−,1) =O
k=H′7′ Σx (n) x (n−2) ′?′P −ΣakΣx (n−k) −x (n−2) −=O
k−1へ Σx (n) x (n−p) ′ P −ΣakΣx (n−k) −x (n−p) =Ok
−t 外 ・・・・・・(3) ここで前記区間を一■<n<+■にとると、(3)式は
(4)式に示される自己相関関数R(i)により(5)
式の如く変形される。
R(p) −ΣakR(p k) −0に=t ・・・・・・(5) 従って線形予測係数akは、自己相関関数R(1)乃至
R(p)をめることにより計算される。
一方音声波形の基本角周波数をω0、標本化周期をTと
すると、音声波形x (nT)は(6)式で示される。
x(nT) −Σbk−cos (kω0nTk諭f +Δθk )・・・(6) 但しΔθには位相差を示す 従ってかかる音声波形の自己相関関数R(i)は(7)
式によりめられる。
R(0) =ΣX (n) −1 R(1) =Σbk″・cos(kωOT)it R(2) =Σbk ’ −cos (kω02T)−
1 R(p) =’Σbk’−cos (kω0pT)kl
=l ・・・・・・(7) 第1図は、以上の原理に基づ〈従来ある音声分析方式の
一例を示す図である。第1図において、自己相関関数演
算回路20ば入力端子10から入力される音声波形から
自己相関関数R(0)乃至R(p)をめ、線形予測係数
演算回路21は自己相関関数演算回路20によりめられ
た自己相関関数R(0)乃至R(p)に基づき線形予測
係数al乃Vapをめ、音声の分析結果として出力端子
11から出力する。
以上の説明から明らかな如く、従来ある音声分析方式に
おいては、人力される音声から直接自己相関関数R(0
)乃至R(p)をめていた。然しく7)式から明らかな
如く、自己相関関数R(1)乃至R(p)にはそれぞれ
基本周波数成分blcos(ωoaT)(但しiは1乃
至p〕が倉まれでいる。従ってかかる自己相関関数R(
1)乃至R(p)から計算した線形予測係数a kには
基本周波数成分が含まれていることとなる。然し前述の
如く、音声の認識を行う場合には基本周波数成分は必要
無く、寧ろ高エネルギーを有する基本周波数成分が含ま
れると他のホルマントをマスクする恐れもあり、的確な
特徴抽出が行われぬ欠点がある。また音声を合成する場
合には、音韻に関する情報として線形予測係数al乃至
a pと別にピッチに関する情報を伝達すると、ピッチ
に関する情報が二重に伝達されると言う無駄が生ずる。
(d) 発明の目的 本発明の目的は、前述の如き従来ある音声分析方式の欠
点を除去し、音声の認識の際に必要とするポルマント情
報を強調した情報を特徴として抽出する手段を実現する
ことに在る。
(el) 発明の構成 この目的は、音声の自己相関関数を用いて特徴を抽出す
る音声認識並びに合成システムにおいて、前記音声から
基本周波数を抽出するピッチ抽出手段と、該ピンチ抽出
手段から伝達される基本周波数に基づき前記音声から基
本周波数成分を除去するフィルタとを設け、該フィルタ
の出力波形の自己相関関数を用いて前記音声の特徴を抽
出することにより達成される。
即ち本発明においては、基本周波数成分を除去した音声
によりめられた自己相関関数を用いて音声の特徴が抽出
される。
ffl 発明の実施例 以下、本発明の一実施例を図面により説明する。
第2図は本発明の一実施例による音声分析方式を示す図
であり、第3図は第2図におけるフィルタの一例を示す
図である。なお、企図を通じて同一符号は同一対象物を
示す。第2図において、入力端子10から入力された音
声の標本値x (n)はピンチ抽出回路30および遅延
調整回路40に伝達される。ピッチ抽出回路30は標本
値x(n)から各種iに対する自己相関関数R(i)を
める自己相関関数演算部31と、自己相関関数演算部3
1から出力される自己相関関数R(i)の中から゛最大
値を示す自己相関関数R(i)に対するiをピッチ即ち
基本周波数と判定する最大値選択部32とから構成され
る。かくしてピッチ抽出回路30の抽出した基本周波数
はフィルタ41に伝達される。一方遅延調整回路40に
伝達された音声は、ピンチ抽出回路30が基本周波数を
抽出するに充分な時間の遅延を与えられた後、フィルタ
41に入力される;フィルタ41は第3図に示される如
く、−標本化遅延レジスフ412および413、乗算器
414および415、並びに加算器416および417
から構成され、(9)式に示される伝達関数F (z)
を有する。
F(z)−1+cl・z +c2−z ) −(91な
お係数c’lおよびc2はピッチ抽出回路30から伝達
されたピンチから00)式により定められる。
かかる伝達関数F (z)は基本角周波数ω0に零点を
有し、入力端子410から入力される音声の基本周波数
成分b1・(、os (ωOnT+Δθ1)を除去して
出力端子411から出力し、自己相関関数演算回路20
に伝達する。自己相関関数演算回路20はフィルタ41
から伝達された基本周波数成分bl−cos (ωOn
T+Δθ1)を除去された音声に基づき第1図と同様に
自己相関関数R(0)乃至R(1))をめて線形予測係
数演算回路21に伝達し、線形予測係数演算回路21も
自己相関関数演算回路20から伝達された自己相関関数
R(0)乃至R(Ill)に基づき第1図におけると同
様に線形予測係数akをめ、出力端子11に出力する。
以上の説明から明らかな如く、本実施例によれば、自己
相関関数演算回路20および線形予測係数演算回路21
はフィルタ41により基本周波数成分bl−cos (
ωOnT+Δθ1)を除去された音声に基づき自己相関
関数R(0)乃至択(p)および線形予測係数akを算
出する為、出力端子11から出力される特徴には基本周
波数成分が含まれず、音声の認識および合成に好適とな
る。
なお、第2図および第3図はあく迄本発明の一実施例に
過ぎず、例えはフィルタ41の構成は図示されるものに
限定されることは無く、他に幾多の変形が考慮されるが
、何れの場合にも本発明の効果は変らない。また本発明
の対象となる線形予測分析法は前述の如き係数決定法に
限定されることは無く、他に幾多の変形が考慮されるが
、自己相関関数を用いる何れの場合にも本発明の9JJ
果は変らない。
(gl 発明の効果 以上、本発明によれば、音声のピンチに関する情報が除
去され、ポルマント情報を強調した情報を特徴として抽
出することがpJ能となり、音声の認識に好適な分析結
果が得られる。 −
【図面の簡単な説明】
第1図は従来ある音声分析方式の一例を示す図、第2図
は本発明の一実施例による音声分析方式を示す図、第3
図は第2図におりる)、「ルタの一例を示す図である。 図において、10および410は入力端子、11および
411は出力端子、20は自己相関関数演算回路、21
は線形予測係数演算回路、3oはピッチ抽出回路、31
は自己相関関数演算部、32は最大値選択部、4oは遅
延調整回路、41はフィルタ、412および413は一
標本化遅延レジスタ、414および415は乗算器、4
16および417は加算器、clおよびc2は係数を示
す。

Claims (1)

    【特許請求の範囲】
  1. 音声の自己相関関数を用いて特徴を抽出する音声認識並
    びに合成システムにおいて、前記音声から基本周波数を
    抽出するピッチ抽出手段と、該ピンチ抽出手段から伝達
    される基本周波数に基づき前記音声から基本周波数成分
    を除去するフィルタとを設け、該フィルタの出力波形の
    自己相関関数を用いて前記音声の特徴を抽出することを
    特徴とする音声分析方式。
JP58225671A 1983-11-30 1983-11-30 音声分析方式 Pending JPS60118898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58225671A JPS60118898A (ja) 1983-11-30 1983-11-30 音声分析方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58225671A JPS60118898A (ja) 1983-11-30 1983-11-30 音声分析方式

Publications (1)

Publication Number Publication Date
JPS60118898A true JPS60118898A (ja) 1985-06-26

Family

ID=16832954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58225671A Pending JPS60118898A (ja) 1983-11-30 1983-11-30 音声分析方式

Country Status (1)

Country Link
JP (1) JPS60118898A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999038156A1 (fr) * 1998-01-26 1999-07-29 Matsushita Electric Industrial Co., Ltd. Methode et dispositif d'accentuation de registre

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999038156A1 (fr) * 1998-01-26 1999-07-29 Matsushita Electric Industrial Co., Ltd. Methode et dispositif d'accentuation de registre

Similar Documents

Publication Publication Date Title
US5450522A (en) Auditory model for parametrization of speech
US9026435B2 (en) Method for estimating a fundamental frequency of a speech signal
JP2005157363A (ja) フォルマント帯域を利用したダイアログエンハンシング方法及び装置
US20210201938A1 (en) Real-time pitch tracking by detection of glottal excitation epochs in speech signal using hilbert envelope
JP2940835B2 (ja) ピッチ周波数差分特徴量抽出法
JP3270866B2 (ja) 雑音除去方法および雑音除去装置
JPS60118898A (ja) 音声分析方式
Ganapathy et al. Robust spectro-temporal features based on autoregressive models of hilbert envelopes
Kameoka et al. Speech spectrum modeling for joint estimation of spectral envelope and fundamental frequency
CN112088404B (zh) 基音强调装置、其方法、以及记录介质
WO2019216192A1 (ja) ピッチ強調装置、その方法、およびプログラム
JP3271193B2 (ja) 音声符号化方法
JPH0318720B2 (ja)
JPS5876891A (ja) 音声ピツチ抽出方法
JP2898637B2 (ja) 音声信号分析方法
JPH06202695A (ja) 音声信号処理装置
JP3221050B2 (ja) 有声音判別方法
Fushikida A formant extraction method using autocorrelation domain inverse filtering and focusing method.
JPS61187000A (ja) 音声のピツチ周波数抽出装置
Tan et al. Speech feature extraction and reconstruction
JPS62278598A (ja) 帯域分割型ボコ−ダ
JPH0477798A (ja) 周波数包絡線成分の特徴量抽出方法
Yang et al. Estimation of voice source and vocal tract parameters using combined subspace-based and amplitude spectrum-based algorithm.
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
Rabiner et al. Use of a Computer Voice‐Response System for Wiring Communications Equipment