JPS63106699A - ホルマント抽出装置 - Google Patents

ホルマント抽出装置

Info

Publication number
JPS63106699A
JPS63106699A JP61252220A JP25222086A JPS63106699A JP S63106699 A JPS63106699 A JP S63106699A JP 61252220 A JP61252220 A JP 61252220A JP 25222086 A JP25222086 A JP 25222086A JP S63106699 A JPS63106699 A JP S63106699A
Authority
JP
Japan
Prior art keywords
vowel
formant
gender
regression
waveform data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61252220A
Other languages
English (en)
Inventor
修司 高田
道代 後藤
上川 豊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61252220A priority Critical patent/JPS63106699A/ja
Priority to US07/111,346 priority patent/US4882758A/en
Publication of JPS63106699A publication Critical patent/JPS63106699A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Medicines Containing Plant Substances (AREA)
  • Saccharide Compounds (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声の分析、認識に用いられるホルマント抽出
装置に関するものである。
従来の技術 ホルマントとは声道の伝達関数の極によって、音声波の
周波数スペクトル上に生ずる共振の山であり、音韻性を
形作る重要な因子である。周波数の低いほうから順に第
1、第2・・・ホルマントと呼ばれる。
従来、このホルマント抽出には、ツナグラムからの読み
取り、フィルタバンクを用いる方法、合成による分析法
等、様々な方法が用いられている。
線形予測分析による方法もこの中の一つで、この方法は
声道の伝達関数を全極型のモデルで近似するものである
以下、図面を参照しながら、上述した従来のホルマント
抽出装置の一例について説明する。第2図は従来のホル
マント抽出装置の要部ブロック図である。同図において
21は線形予測分析部、22は高次方程式木根部、23
はホルマント選択部である。
以上のように構成された従来のホルマント抽出装置につ
いて、その動作を以下に説明する。
第3図は線形予測分析部21における処理フロー図であ
る。ここで音声のサンプリング周波数を10KHz、1
フレームの時間長を20m5とする。1フレームの音声
波形データをy (i) 、i=1〜200で表わす。
プリエンファシスは次式で示される一次差分を用いる。
y’  (i)=y (i+1)  y (i)・旧・
・(1)フレーム切出しによる周波数ひずみの影響を軽
減するために次式で示されるハミング窓をかける。
y“ (+)=H(i)  ・y’(i)  ・・・・
・・(2)H(i ) =0.54−0.46・ cos(2πi /200)  ・・・・・・(3)次
に次式で示される短区間自己相関関数R4を算出する。
y“ (n−i)  ・・・・・・(4)αパラメータ
は次の連立−次方程式を解くことによって求められる。
・・・・・・(5) 実際には、Durbin法等の再帰的解法によって効果
的に解くことができ、kパラメータも同時に求めること
ができる。
声道の伝達関数は次式で表わされる。
H(Z) =G/ N + : cx、 z−’) −
−・・−(6)したがって、高次方程式木根部22にお
いて1+ン・ラプソン法等によって解くことにより、声
道伝達関数の極を求めることができる。さらにホルマン
ト選択部23において、周波数、帯域幅を考慮して複数
の根の中から求めるホルマントに対応する根を選び出す
発明が解決しようとする問題点 上記のような構成のホルマント抽出装置においては高次
の代数方程式を解かなければならないために、浮動小数
点演算が必要となり、処理時間がかかるという問題点が
ある。また求まった複数の根の中から、求めようとする
ホルマントに相当する根を選択する際に誤りを生ずる。
本発明はかかる点に鑑みてなされたもので、簡易にかつ
一意に求めるホルマント周波数を得ることのできるホル
マント抽出装置を提供することを目的としている。
問題点を解決するための手段 本発明は上記問題点を解決するため、第1の音声特徴量
と入力母音音声波形データの性別情報により、入力母音
音声波形データの母音判別を行なう母音判別部と、あら
かじめ複数話者の該当複数母音の第2の音声時fThf
fiデータとホルマント周波数データとを基に、男女別
名母音毎に第2の音声特徴量からホルマント周波数を推
定する重回帰分析を行なって得られる回帰係数を記憶し
て、上記母音判別結果および上記入力母音音声波形デー
タの性別情報により、該当する母音、性別の回帰係数を
出力するホルマント推定係数記憶部と、上記第2の音声
特徴量と上記該当する母音、性別の回帰係数とから回帰
直線値としてのホルマント周波数推定値を算出して出力
するホルマント推定部とを備えたものである。
作用 本発明は上記した構成により、母音判別結果および性別
情報によって、男女別、各母音毎に用意しである回帰係
数の中から該当するものを選び出し、音声特徴量とこの
回帰係数との積和演算によってホルマント周波数推定値
を求める。
重回帰分析法とは、ある変数yとそれに影響をおよぼす
と考えられる他の変数Xl+  X2+ ・・・x。
ao  +a、  x、  +”””ap  Xp  
     )’のように予測する1つの方法である。予
測の精度は変数XI +  x2 + ・・・x、と変
数yとの相関の度合(回帰直線への適合の度合)に依存
する。またN個のデータから算出した回帰直線へのデー
タの当てはあまりが良くない場合、変数XI+X2+・
・・x、の空間を分割し、より小さなデータ集合(デー
タ数n I *  n2・・・<<N)毎に予測を行う
ことにより、精度を上げることができる。本発明におい
ては、男女別、各母音毎に回帰係数を求めるでいる。
ここで回帰係数の算出法について説明しておく。
P次の音声特徴1txtn、i=l、−、pから第jホ
ルマント周波数fjnj=1+ ・・・を推定する回帰
モデルは次式で示される。
このとき推定誤差e1は次式で示される。
・・・・・・(8) 複数話者の複数母音にわたるN個のサンプルについてe
、、2を加え合わせたものをε2とする。
ε2を最小とする条件δε2/δaJt=o (0−≦
−4<p)により、次の連立−次方程式を解くことによ
って、回帰係数を求めることができる。・・・・・・・
QO) 実施例 以下本発明の第1の一実施例のホルマント抽出装置につ
いて図面を見ながら説明する。
第1図は本発明のホルマント抽出装置の第1の実施例を
示す要部ブロック図である。第1図において、1)は第
1の音響分析部、12は第2の音響分析部、13は母音
判別部、14はホルマント推定係数記憶部、15はホル
マント推定部である。
以上のように構成されたホルマント抽出装置について、
以下その動作を説明する。
まず第1の音響分析部1)において、入力母音音声波形
データを分析してスペクトル包絡を表わすP1次元の第
1の音声性微量xIi+  1 =1 + ・・・P。
を算出する。
同様に第2の音響分析部12において、入力母音音声波
形データを分析してスペクトル包絡表わすP2次元の第
2の音声性微量X 26.1 =1 + ・・・Pzを
算出する。
母音判別部13においては男女別に用意しである判別係
数のうち、入力母音音声波形データの性別情報に基づき
、適合する性別の係数を用いて、第1の音声性微量の値
から、入力母音音声波形データがどの母音に属するかを
判別する。母音の種類は日本語の場合、アイウェオの5
種類が一般的である。
求めるホルマント周波数を第1、第2の2つのホルマン
ト周波数とすると、ホルマント推定係数記憶部14にお
いては、あらかじめ複数男女話者の日本語5母音の上記
第2の音声特徴量データと第1、第2ホルマント周波数
データとを基に、男女別、各母音毎に第2の音声性微量
からそれぞれ第1、第2ホルマント周波数を推定する重
回帰分析を行なって得られる回帰係数を記憶しておく。
そして母音判別結果および性別情報により、該当する母
音、性別の回帰係数を出力する。これをa、8゜j=l
、2  i=o、・・・P2で表わすものとする。
ホルマント推定部15においては、上記第2の音声時@
N x2i+ i = 1 + ”’ P tと上記回
帰係数aji+j=1.2、i=0.・・・P2とから
次式によって第1、第2ホルマント周波数推定値f、、
j=l。
以上のように本実施例によれば、第1の音響分析部1)
と第2の音響分析部12と母音判別部13とホルマント
推定係数記憶部14とホルマント推定部15を設けるこ
とより、スペクトル包絡を表わす第2の音声時flから
、ホルマント周波数を推定することができる。
以下本発明の第2の実施例について図面を参照しながら
説明する。
第4図は本発明の第2の実施例を示すホルマント抽出装
置の要部ブロック図である。第1の音響分析部は入力母
音音声波形データからαパラメータを算出する線形予測
分析部41)と、αパラメータからLPCケプストラム
係数を算出するケプストラム算出部412とから構成さ
れている。第2の音響分析部は入力母音音声波形データ
からαパラメータを算出する線形予測分析部42で構成
されている。母音判別部43、ホルマント推定係数記憶
部44、ホルマント推定部45の構成は第1図と同様な
ものである。
線形予測分析部41).42における処理は第2図の従
来例での線形予測分析部21における処理はフロー図(
第3図)と同一のものである。
ケプストラム算出部412においては、次式によってL
PCケプストラム係数C41=l、 ・・・P21<n
<P2 ・・・・・・側 線形予測分析部41)とケプストラム算出部412とを
設けてLPCケプストラム係数を算出し、このLPCケ
プストラム係数を用いて母音判別部43において母音判
別を行なうことにより、高い判別率を得ることが出来る
発明の効果 以上のように本発明は第1の音響分析部と母音判別部と
ホルマント推定係数記憶部とホルマント推定部とを設け
ることより、スペクトル包絡を表わす第2の音声時@量
からホルマント周波数を推定することができ北。第1の
音声特徴量としてLPCケプストラム係数を用い、第2
の音声特徴量としてαパラメータを用いた場合、高い判
別率を得ることができ、ホルマント推定係数の選択誤り
を減少させることができるとともに、従来のホルマント
抽出装置において高次の代数方程式を解いていたのにく
らべて、大幅に演算量を減らすことができる。
【図面の簡単な説明】
第1図は本発明の第1の一実施例におけるホルマント抽
出装置の要部ブロック図、第2図は従来のホルマント抽
出装置の要部ブロック図、第3図は第2図の線形予測分
析部における処理フロー図、第4図は本発明の第2の一
実施例におけるホルマント抽出装置の要部ブロック図で
ある。 1)・・・・・・第1の音響分析部、12・・・・・・
第2の音響分析部、13・・・・・・母音判別部、14
・・・・・・ホルマント推定係数記憶部、15・・・・
・・ホルマント推定部、21・・・・・・線形予測分析
部、22・・・・・・高次方程式木根部、23・・・・
・・ホルマント選択部、41)・・・・・・線形予測分
析部、412・・・・・・ケプストラム算出部、42・
・・・・・線形予測分析部、43・・・・・・母音判別
部、44・・・・・・ホルマント推定係数記憶部、45
・・・・・・ホルマント推定部。 代理人の氏名 弁理士 中尾敏男 はか1名第3図 −1(1只1−

Claims (2)

    【特許請求の範囲】
  1. (1)入力母音音声波形データを音響分析してスペクト
    ル包絡を表わす第1の音声特徴量を算出する第1の音響
    分析部と、上記入力母音音声波形データを音響分析して
    スペクトル包絡を表わす第2の音声特徴量を算出する第
    2の音響分析部と、上記第1の音声特徴量と上記入力母
    音音声波形データの性別情報により、上記入力母音音声
    波形データの母音判別を行なう母音判別部と、あらかじ
    め複数話者の該当複数母音の上記第2の音声特徴量デー
    タとホルマント周波数データとを基に、男女別、各母音
    毎に第2の音声特徴量からホルマント周波数を推定する
    重回帰分析を行なって得られる回帰係数を記憶して、上
    記母音判別結果および上記入力母音音声波形データの性
    別情報により、該当する母音、性別の回帰係数を出力す
    るホルマント推定係数記憶部と、上記第2の音声特徴量
    と上記該当する母音、性別の回帰係数とから回帰直線値
    としてのホルマント周波数推定値を算出して出力するホ
    ルマント推定部とを具備してなることを特徴とするホル
    マント抽出装置。
  2. (2)第1の音声特徴量としてLPCケプストラム係数
    を用い、第2の音声特徴量としてαパラメータを用いた
    ことを特徴とする特許請求の範囲第(1)項記載のホル
    マント抽出装置。
JP61252220A 1986-10-23 1986-10-23 ホルマント抽出装置 Pending JPS63106699A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61252220A JPS63106699A (ja) 1986-10-23 1986-10-23 ホルマント抽出装置
US07/111,346 US4882758A (en) 1986-10-23 1987-10-22 Method for extracting formant frequencies

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61252220A JPS63106699A (ja) 1986-10-23 1986-10-23 ホルマント抽出装置

Publications (1)

Publication Number Publication Date
JPS63106699A true JPS63106699A (ja) 1988-05-11

Family

ID=17234180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61252220A Pending JPS63106699A (ja) 1986-10-23 1986-10-23 ホルマント抽出装置

Country Status (1)

Country Link
JP (1) JPS63106699A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279743A (ja) * 2006-04-06 2007-10-25 Toshiba Corp 話者認証登録及び確認方法並びに装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279743A (ja) * 2006-04-06 2007-10-25 Toshiba Corp 話者認証登録及び確認方法並びに装置

Similar Documents

Publication Publication Date Title
Airaksinen et al. Quasi closed phase glottal inverse filtering analysis with weighted linear prediction
Markel et al. Linear prediction of speech
US6195632B1 (en) Extracting formant-based source-filter data for coding and synthesis employing cost function and inverse filtering
US20070055504A1 (en) Optimized windows and interpolation factors, and methods for optimizing windows, interpolation factors and linear prediction analysis in the ITU-T G.729 speech coding standard
Milner et al. Speech reconstruction from mel-frequency cepstral coefficients using a source-filter model
EP1693826B1 (en) Vocal tract resonance tracking using a nonlinear predictor
Deng et al. Tracking vocal tract resonances using a quantized nonlinear function embedded in a temporal constraint
US20140200889A1 (en) System and Method for Speech Recognition Using Pitch-Synchronous Spectral Parameters
Christensen et al. A comparison of three methods of extracting resonance information from predictor-coefficient coded speech
McAulay Maximum likelihood spectral estimation and its application to narrow-band speech coding
JPS63106699A (ja) ホルマント抽出装置
US7231344B2 (en) Method and apparatus for gradient-descent based window optimization for linear prediction analysis
Slaney et al. Pitch-gesture modeling using subband autocorrelation change detection.
US7389226B2 (en) Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
Arroabarren et al. Glottal spectrum based inverse filtering.
US7512534B2 (en) Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
Kammoun et al. Cepstrum vs. LPC: A comparative study for speech formant frequencies estimation
JPS6327899A (ja) ホルマント抽出装置
Addou et al. A noise-robust front-end for distributed speech recognition in mobile communications
JPS6325699A (ja) ホルマント抽出装置
JP2019070775A (ja) 信号解析装置、方法、及びプログラム
JPS63195700A (ja) ホルマント抽出装置
JP3199338B2 (ja) フォルマント抽出方法
Tan et al. Speech feature extraction and reconstruction
JP3112462B2 (ja) 音声符号化装置