JPS60168198A - ホルマント抽出装置 - Google Patents

ホルマント抽出装置

Info

Publication number
JPS60168198A
JPS60168198A JP59024820A JP2482084A JPS60168198A JP S60168198 A JPS60168198 A JP S60168198A JP 59024820 A JP59024820 A JP 59024820A JP 2482084 A JP2482084 A JP 2482084A JP S60168198 A JPS60168198 A JP S60168198A
Authority
JP
Japan
Prior art keywords
peak
analysis
frequency
formant
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59024820A
Other languages
English (en)
Inventor
一宏 津賀
修司 高田
入路 友明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59024820A priority Critical patent/JPS60168198A/ja
Publication of JPS60168198A publication Critical patent/JPS60168198A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Medicines Containing Plant Substances (AREA)
  • Saccharide Compounds (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声信号を評価、認識9合成する装置等に使用
して有効なホルマント抽出装置に関するものである。
従来例の構成とその問題点 近年、計算機の発達によりデジタル音声イ計号処理の分
野が脚光をあびている。その中でも古典的であり々から
、非常に難しい問題とされてきたのが音声信号からホル
マント周波数を決定する問題である。ここで、ホルマン
ト周波数を第1図を用いて説明する。第1図は、ある日
本人男性が発声した日本語母音ア″に対する音声信号の
フーリエ変換によるパワースペクトルであり、縦軸は振
幅強度を、横軸は周波数を表わしている。このスペクト
ルは、有声音特有の基本周波数の高周波構造が約260
H2間隔に現われているが、よく見れば図中のF1〜F
4の矢印の位置にエネルギーの集中部がある。この各集
中部の中心周波数をホルマント周波数と称し、ピークを
ポルマントと称す。
ホルマント周波数の抽出が重要であるゆえんは、有声音
、特に母音において音声生成のメカニズムを声帯の概周
期的振動である音源系と、のと9口腔等での共鳴系に分
離した場合、ホルマント周波数が共鳴系の共振周波数に
対応する為である。そして、“アイウェオ′”等の音韻
間の差か生ずる原因は、この共鳴系の差による所が多い
からである。
次にホルマント周波数の抽出方法について述べる。現在
、ホルマント周波数抽出方法は大別すると次の2つの方
法に別れる。第1の方法は、音声信号をフーリエ変換に
より第1図1に示される様なパワースペクトルに変換し
、何らかのスムー/ング手法により基本周波数の高調波
による″ギサギザ″”を取り除き、スペクトルの概包絡
パターンだけを取り出し、その後、ピークを検出するも
のである。この手法では、例えば日本語母音“オ“′の
ように第1ノオルマント周波数と第2ノオルマント周波
数が非常に近い場合には、両刀のフォルマント周波数を
抽出できないという問題がある。
第2の方法は、全極型の線形予測分析肴−行ない、音声
信号の生成における共[19系部分を線形モデルにより
近似的な推定を右な(・)、推定された線形システム・
のシステム関数の振幅極大値周波数をホルマント周波数
とする方法である。この方法は、第1の方法のような隣
接したフォルマントは、分離し易いものの、線形モデル
の次数をどの様に決定するかが難しい問題となる。これ
を第2図を参照して説明する。第2図は、々A1図に示
されるスペクトル構造を持つ音声信号を10KHzのヅ
ンゾリング周波数で14子化し、6次と14次の次数で
線形予測分析して得られたモデルのスペクトルを小した
ものである。図中において、実線は6次の場合であり、
破線は14次の場合を示す。図を見て解ることは、6次
では第1フイルマントと第2フオルマントが分離されて
いないし、14次では第1フォルマノ+−とa2フォル
マントif & < 近似すれているか、2KHz〜3
KHzに更に2ケのピーりが存在し、これらをフォルマ
ントと誤まる可能性があることを示す。つまり、このよ
うに、帯域幅が適切な値であり、かつ存在領域が適切な
範囲にあるピークの内からどれが真のフォルマントであ
るかを見つけることは非常に困難な問題である。
しかしながら適切な分析次数というものは、対象となる
音韻差2個人差により変化するものである為にトす]定
住することはフォルマント抽出という観点からは好まし
くない。それにもかかわらず、フォルマント抽出に最適
な次数は非常に決定が難しい為に、従来では分析次数を
固定化するものが多かった。
発明の目的 本発明の1」的は、適切なフォルマント周波数が抽出し
易い様な分析次数決定機構を盛り込んだフォルマント抽
出装置を提供することにある。
発明の構成 本発明のフォルマント抽出装置は、入力音声信号の線形
予測分析を行ない、線形予測係数を出力する線形予測分
析部と、線形予測係数に基ついた音声信号パワースペク
トルのピーク周波数と帯域幅を検出するピーク検出部と
、ピーク周波数と帯域幅から上記ピーク周波数が上記音
声信号パワースペクトルのホルマント周波数であるか否
かを判定するピーク判定部と、ホルマント周波数か所望
の個数たけ検出できるまで上記線形予測分析部の分析次
数を制御する分析次数制御とフォルマント周波数・帯域
幅を出力する分析次数制御部を具備し、上記線形予測分
析部は上言己入力音声仁−号と上記分析次数制御部の出
力の一部である分析次数fft制御信号を入力とし、上
記ピーク検出部は上記線形予測分析部の出力を入力とし
、−F証ピーク判定部は上記ピーク検出部の出力を入力
とし、」1記分析次数制御部は上記ピーク判定部の出力
を入力とするように構成したものであり、これにより正
確なフォルマント周波数の抽出が行なえるものである。
実施例の説明 以下、本発明の実施例について、図m]を参照しながら
説明する。第3図におじで、1 fd大入力!1−だ音
声信号、2は音声信号1と分析次数制伺晶1≦5の出力
の一部である分析次1(i制御信号を入力として、線形
予411j保数を出力する線形予測分析部、3は線形予
測分析部2の出力である線形予測係数を入力として、相
定された線形システムに基ついた音声信号の概包絡パワ
ースペクトルのピーク周一波数と帯域幅を検出するピー
ク検出部、4はピーク検出部3の出力であるピーク周波
数と帯域幅を入力として各ピークが真にフォルマントに
ふされしいかどうかを判定し結果を出力するピーク判定
部、s(dピーク判定部4の出力である判定結果を入力
とし、あらかじめ定められた所望の数の7オルマントが
抽出されたか否かを調べ、抽出されている場合にはフォ
ルマント周波数・帯域幅として出力し、未抽出の場合に
は、線形予」11分析都1に送る分析次数制御4月号を
分析次数か高次になるべく更新する分1J1次数制?l
ll1部、6r↓抽出されたフォルマント周波数及び帯
域幅である。
以上のように構成された本実施例のフォルマント抽出装
置K1′について以下その動作を説明する。−まず、音
声信号1として第4図に示されるある日本人男伯ミによ
る音声イ″が入力さ〕またとする。、本音声信月は10
240H2のサンプリング周波数で月−子化されている
。この信号は線形予7111巖NR部2により分析され
線形予測係数α1に変換マ巽りる。
ここで1は次数を表わす。この際、分析次数については
分析次数制御部5からの1h]j旬]lイハ号により決
定される。分析次数制作1部5では、あらかじめ分析次
数に対して最低次幻と最高次数に対するft】lJ (
Wがあり、本実施例で(d最低次数ば[−81となって
いる。そこで、分析次数制御部は初期状態におりでは、
最低次数である8次分析を線形予測外kJj部2に対し
て指令する。このようにして8次で分析され、抽出され
た線形予測係数α1にっbて、音声信号逆フィルターの
伝達関数との関係を式で表わすと次のようになる。
α、は音声信号を次式で表わされる線形フィルターに通
した場合に、その残差悟乞か最小2乗の意味で最小化さ
れるように決定される。
上式でA (Z)は、音声信号逆フィルターの伝達関数 nは分析次数 ZはZ変換パラメータ この場合に音声イ計号の推定伝達関数は、1/ A (
z)となる。
次に請求められた8個の線形予測係数α1からα8けピ
ーク検出部3に入力される。このピーク検出)3μsの
内部構成を第6図に示す。第6図において、パワースペ
クトル計算部11では、甘ず(α、)の前に1と後ろに
複数のOを伺加した次のような256サンプルのデータ
列を作成する。
1、α4.α2.・ ・α8.o、o、o、o、・・、
OこのデータタIjを入力として離散的フーリエ変換を
施した後、次式によりパワースペクトルを計算する。
P(f)=−1(X!Og+o(X(カ+Y(f)J 
−−(2)ここで、P(f)は周波数fのパワースペク
トルX(f)はスペクトルの実数成分 Y(f)はスペクトルの虚数成分 上記P(f″lを図示したものが第6図の実線で承さ才
するものである。このように計算ざ−h、 /こパワー
スペクトルP(f)ば、第6図のピーク周波数検出部1
2と帯域幅計算部13に入力される。ピーク周波数検出
部12では、入力さ肛たP(f)に対して次のようにし
て仮ピーク周波数を決定する。fを120Hzから32
00Hziで順次単位周波数(40Hz)っつ変化させ
、次の判断基準を1岡だした周波数を仮ピーク周波数と
して出力する。
P(fj−P (f−40))OかツP(fl−P(f
−1−40)>0(ただし、fは仮ピーク17.J波数
)この」場合、240H2と2760H2に、f反ピー
ク周波数が出力される。これらの仮ピーク1^」波数と
P(fjは帯域幅計算部13へ人力される。この帯域幅
計算部13では、人力された各々の仮ピーク周波数に対
1〜で相隣接する2点を加えた3点で2次曲線近似を行
ない請求めらIした2次Oh線から頁のピーり周波数で
ある中心周波数とピークレベルから3dB ダウンする
周波数の差(帯域幅)をめる。このようにしてめられた
ピーク周波数と帯域幅は各々次のようになる。第1ピー
ク中心周波数230H2、第1ピーク帯域幅60H2、
第2ピーク中心簡波数276o Hz 、第2ピーク帯
域幅950 H2である。
次に、これらのピーク周波数と帯域幅は第3図のピーク
判定部4に入力される。ピーク判定部4では、入力され
たピーク周波数と計域幅に基つき、ピークがフォルマン
トであるか否かを判定する。
具体的には、ピーク周波数に応じ−C帯域幅がそれぞれ
定められた閾値以下である場合にのみフォルマントとす
る。ピーク周波数と帯域幅閾値の関係は、ピーク周波数
が700H2未満の時は250Hzであり、ピーク周波
数が700Hz以上の場合は320Hzである。この規
則に基つき入力されたピーク周波数の内、第1ピーク周
波数のみがフォルマント周波数として出力され、分析次
数割付1部5に入力される。分析次数制御部5では、入
力されたフォルマントの数により更に分析次数を上げて
分析を続けるか、分析を中止し−Cフォルマント周波数
と帯域幅を出力するかを決定する。本実施例では第1お
よび第27オルマントのみを抽出するものであるので、
2つのフォルマントが抽出された時点で分析次数の更新
は中止される。現時点、つまり8次の分析では第17オ
ルマントのみが抽出されただけであるので分析次数の更
新が行なわれ、10次の分析が線形予測分析部2に指令
される。線形予測分析部2で再分析が行なわれα1〜α
toの10ケの線形予測係数が抽出さI■1、ピーク検
出部3では、第5図の破線で示さするパワースペクトル
か抽出される。これよシ第1ピークとしてピーク周波数
220H,z、帯域幅40Hz。
第2ピークとしてピーク周波数2400H2,帯域幅5
ooHz、第3ピークとしでピーク周波数3000H2
,帯域幅260Hz が出力される。
ピーク判定部4においては、これらの3つのピークはフ
ォルマントと判定され、各々のフォルマント周波数・帯
域幅は分析次数割切1部6に入力される。分析次数制御
部5では1ヅ「望のフォルマント数2ケを越えてンオル
マントがめられメこので分析次数の更新を止め、所望の
数に対応するように第1.@2フォル、ントに対応する
フォルマント周波数・帯域幅を出力する。
以上のように本実施例では、従来分析次数の不適切さゆ
えに難しい問題であったフォルマントの抽出を、順次分
析次数を上げなからピークかフォルマントであり得るか
どうかを判定することで困難さを克服I−でいる。なお
、上記実施例ではピーク判力!部4において単に帯域幅
の大小により各ピークがフォルマントか否かを判定して
いるか、各フォルマント周波数間の関係をあらかじめ規
則にしておき、規則を逸脱したピークかめられた場合に
は除去するというものでも良い。
発明の効果 以上の説明から明らかなように、本発明は従来のフメル
マント抽出装置にピーク判定を利用した分析次数制御部
を設け、ノオルマント尚波数の誤抽出を避けるようにし
たものである。原理的には、線形予測分析法では分析次
数の決定がノオ/Lマント抽出に関して非常に重要な問
題であることを見い出し、適切なピークをめるという観
点から分析次数制御機構を盛り込んだものであり、特に
音声信号を評価、認識9合成等する場合にきわめて1効
なものである。
【図面の簡単な説明】
第1図は日本語母音“ア′”のツー リエ変換によるパ
ワースペクトラム、第2図は第1図に示した音声から6
次と14次の線形〕″−!1++j分4hにより抽出す
したパワースペクトラム、第3図は本発明の一実施例に
係るノオルマント抽出装置の要部ブロック構成図、第4
図は1」本語り音“イ“の督ノ七波形図、第5図は第4
図にノJ【される音7Jハ郊の8次と10次の分析次数
におけるパワースペクトシム、第6図は第3図のピーク
検出部のブロックl’f4成図である。 1・・・・・音声信号、2・ ・線形予測分析部、3−
・−ピーク検出部、4・・・ピーク判定部、5・・分析
次数制御機構都、6・・・・フォルマント胤波数・;7
;i:域幅、11・・・パワースペクトル計算部、12
・・・・・・ピーク周波数検出部、13 ・・・帯域幅
計算部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名@1
図 月貧 這 を矢 (u) 第2図 冴も次数(8!:) ゝ −鴎 ω IIL @口 鞍 第 4 vA 55 図 圓破数(B幻 )6に群 係沃 1 L 、−J

Claims (1)

    【特許請求の範囲】
  1. 入力音声信号の線形予測分析を行ない、線形予測係数を
    出力する線形予測分析部と、線形予測係数に基づいた音
    声信号パワースペクトルのピーク周波数と帯域幅を検出
    するピーク検出部と、ピーク周波数と帯域幅から上記ピ
    ーク周波数が上記音声信号パワースペクトルのホルマン
    ト周波数であるか否かを判定するピーク判定部と、ホル
    マント周波数が所望の個数だけ検出できるまで上記線形
    予測分析部の分析次数を制御する分析次数制御信号とフ
    ォルマント周波数・帯域幅を出力する分析次数制御部を
    具備し、上記線形予測分析部は上記入力音声信号と上記
    分析次数制御部の出力の一部である分析次数制御信号を
    入力とL、上記ピーク検出部は上記線形予測分析部の出
    力を入力とし、」二記ビーク判定部は上記ピーク検出部
    の出力を入力とし、上記分析次数制御部は上記ピーク判
    定部の出力を入力とすることを特徴とL7だホルマント
    抽出装置。
JP59024820A 1984-02-13 1984-02-13 ホルマント抽出装置 Pending JPS60168198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59024820A JPS60168198A (ja) 1984-02-13 1984-02-13 ホルマント抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59024820A JPS60168198A (ja) 1984-02-13 1984-02-13 ホルマント抽出装置

Publications (1)

Publication Number Publication Date
JPS60168198A true JPS60168198A (ja) 1985-08-31

Family

ID=12148816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59024820A Pending JPS60168198A (ja) 1984-02-13 1984-02-13 ホルマント抽出装置

Country Status (1)

Country Link
JP (1) JPS60168198A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62154000A (ja) * 1985-12-27 1987-07-08 日本電気株式会社 ホルマント抽出器
JPS62296200A (ja) * 1986-06-17 1987-12-23 松下電器産業株式会社 ホルマント抽出装置
JPS63106700A (ja) * 1986-10-23 1988-05-11 松下電器産業株式会社 ホルマント抽出装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS551600A (en) * 1978-06-15 1980-01-08 Svenska Traeforskningsinst Method and device for measuring distribution of size of grains in flowing medium
JPS57202600A (en) * 1981-06-08 1982-12-11 Nippon Electric Co Voice analyzer/synthesizer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS551600A (en) * 1978-06-15 1980-01-08 Svenska Traeforskningsinst Method and device for measuring distribution of size of grains in flowing medium
JPS57202600A (en) * 1981-06-08 1982-12-11 Nippon Electric Co Voice analyzer/synthesizer

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62154000A (ja) * 1985-12-27 1987-07-08 日本電気株式会社 ホルマント抽出器
JPS62296200A (ja) * 1986-06-17 1987-12-23 松下電器産業株式会社 ホルマント抽出装置
JPH0754437B2 (ja) * 1986-06-17 1995-06-07 松下電器産業株式会社 ホルマント抽出装置
JPS63106700A (ja) * 1986-10-23 1988-05-11 松下電器産業株式会社 ホルマント抽出装置
JPH0758436B2 (ja) * 1986-10-23 1995-06-21 松下電器産業株式会社 ホルマント抽出装置

Similar Documents

Publication Publication Date Title
Drugman et al. A comparative study of glottal source estimation techniques
EP0219109B1 (en) Method of analyzing input speech and speech analysis apparatus therefor
JP2005043666A (ja) 音声認識装置
EP0838805B1 (en) Speech recognition apparatus using pitch intensity information
CN104123934A (zh) 一种构音识别方法及其系统
JP4516157B2 (ja) 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム
CN106898362A (zh) 基于核主成分分析改进Mel滤波器的语音特征提取方法
Alku et al. The linear predictive modeling of speech from higher-lag autocorrelation coefficients applied to noise-robust speaker recognition
Mousa Voice conversion using pitch shifting algorithm by time stretching with PSOLA and re-sampling
US20080162134A1 (en) Apparatus and methods for vocal tract analysis of speech signals
JP6087731B2 (ja) 音声明瞭化装置、方法及びプログラム
JPS60168198A (ja) ホルマント抽出装置
Irino et al. An auditory model of speaker size perception for voiced speech sounds
Liu et al. Pitch-synchronous linear prediction analysis of high-pitched speech using weighted short-time energy function
Rahali et al. Robust Features for Speech Recognition using Temporal Filtering Technique in the Presence of Impulsive Noise
Kopeček Speech recognition and syllable segments
Aadit et al. Pitch and formant estimation of bangla speech signal using autocorrelation, cepstrum and LPC algorithm
Morikawa Adaptive estimation of time-varying model order in the ARMA speech analysis
Gulzar et al. An improved endpoint detection algorithm using bit wise approach for isolated, spoken paired and Hindi hybrid paired words
Zhuang et al. An Efficient Method to Study Speech Intelligibility with Non-Harmonic Spectrum Structure
Haque et al. Generating Vowel Nasality for a Rule-Based Bangla Speech Synthesizer
Potisuk A system for extracting F 0 contours of lexical tones using adaptive IIR notch filter with harmonic suppression
Zbancioc et al. Integrated system for prosodic features detection from speech
JP3008404B2 (ja) 音声認識装置
JP2744622B2 (ja) 破裂子音識別方式