JPS62194297A

JPS62194297A - 音素判別方法

Info

Publication number: JPS62194297A
Application number: JP3514786A
Authority: JP
Inventors: 天野　明雄
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1986-02-21
Filing date: 1986-02-21
Publication date: 1987-08-26

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声人力装置の音響処理部に係り、特に人力音
声中の類似したＦｆ素を識別するための音素判別方法に
関する。

〔従来の技術〕

従来からＩｊｋｆ＋／　ｍ　／　、　／　ｎ　／のよう
な類似した音素の識別について１両者の調音点の違いに
基づいてスペクトルバタン−ヒに現われるホルマントの
遷移の仕方の差を利用できることは知られていた。

これを利用した識別法として、たとえば日本音響学会講
演論文２−４−１．　Ｏ（１９８５年９〜１０月）に記
載のように周波数スペクトルのピークを抽出し、その遷
移をとらえてこれをもとにして識別する方法があった。

しかし、この方法では処理量。

抽出の安定性についての配慮がなされていなかった。

〔発明が解決しようとする問題点〕

上記従来技術においては音声を認識するために音声信号
の周波数構造を重視してホルマント周波数を陽に求める
ような手段をとっていた。周波数スペクトルからホルマ
ント周波数を抽出するのは処理量が多くなるばかりでな
く、誤まったピークを検出してしまう誤検出も少なくな
い。このように従来技術では処理量が多い、抽出の安定
性に欠けるという１ｍ題があった６本発明の目的は上記問題を解決し、調音点の違いによっ
て生ずる音響的な特徴の差を少ない処理量でかつ安定に
抽出する手法を提供することにある。

〔問題点を解決するための手段〕

本発明は、入力音声を複数の周波数帯域に分割し各帯域
の振幅包絡波形から時間変化の特徴的な点を検出しその
出現時点の時間関係の情報を用いて入力音声中の音素の
識別を行うものである。

時間的な特徴点の検出は振幅包絡波形に対する微分処理
などの簡単な演算と閾値判定によりなされるので少ない
処理量で実現できる。また、帯域分割された複数の周波
数帯域の中から特徴が最も顕著にあられれた帯域を選択
するという処理のため、抽出結果が安定したものとなる
。

このように本発明により、上記二つの目的、すなわち処
理量の削減と抽出の安定化が達成される。

〔作用〕

音声パタンを周波数帯域別の振幅包絡波形という観点か
らとらえると、音声パタン上に現われるホルマントの遷
移はホルマントが通過する周波数帯域において振幅包絡
波形に上昇−停留−下降のパタンか現われることとして
とらえることができる。本発明はこの振幅包絡波形上に
現われるパタンをとらえることにより、調音点の違いに
基づいて生じる音響的な特徴の差を識別しようとするも
のである。

入力された音声信号は周波数帯域分割され、各帯域毎に
振幅包絡波形が求められる。各帯域毎の振幅包絡波形に
ついて上記上昇−停留−下降のパタンを検出し最もその
特徴が顕著にあられれる帯域が決定される。この帯域の
振幅包絡波形について上昇・下降など時間変化の特徴点
をいくつか求め、その出現の時間関係を調べることによ
り音素の識別がなされる。

特徴を求める帯域を複数の帯域から選択するのでホルマ
ント周波数の変動の影響を受けにくく安定した結果が得
られる。また時間方向の変化を検出するようにしたこと
により１周波数方向にはわずかの移動であるようなホル
マント遷移でも少ない処理量で安定にとらえられるよう
になる６〔実施例〕以下、本発明の一実施例を第１図を用いて説明する。

入力音声１は帯域分割フィルタ２により複数の周波数帯
域毎の信号として分割された時、振幅包絡算出部３によ
り振幅包絡波形が求められる。

このようにして求まった各周波数帯域毎の振幅包絡波形
に対し、２階微分演算部４において２階微分が施され２
階微分された波形が出力される。

最小値検出部５では各帯域の２階微分波形から２階微分
値が最も小さい値をとる帯域２時間位置ｔｌおよび最小
値の値自体を記憶する。２階微分波形の最小値を求める
のは、もとの振幅包絡波形上で上に最も凸な点、いいか
えると振幅減少方向の加速度が最大となる点を求めてい
ることに相当する− 一方、２階微分値が最も小さくなる帯域について、もと
の振幅包絡波形のピークを最大値検出部６において検出
しその時間位置ｔ２を求める。

時間間隔算出部７では、２階微分波形の最小値位置ｔｌ
ともとの振幅包絡波形のピーク位置ｔｚの時間間隔ｔｚ
　　ｔｌ　を求め閾値判定部８に送る。

閾値判定部８°では送られてきた時間間隔とあらかじめ
設定してあった閾値とを比較し、その大小関係にもとづ
いて入力音声中の音素の識別を行う。

時間間隔ｔｚ−ｔｔは特定帯域の振幅包絡波形において
上に最も凸な点から包絡波形のピークまでの間隔であり
、調音点の移動によってホルマントの遷移のあるような
音素ではこの間隔が小さくなり、ホルマントの遷移の少
ない音素ではこの間隔が大きくなる傾向がある。閾値判
定部８における判定はこの基準に基づいて音素を識別す
るものである。

次に第２図を用いて本実施例の動作を説明する。

図中実線は２階微分波形において最小値の生じた帯域の
振幅包絡波形１１、破線は実線の振幅包絡波形に対して
２階微分を施した波形１２である６最小値検出部５では
２階微分波形１２について最小値を検出し、その時点ｔ
１が求められる。一方最大値検出部６では振幅包絡波形
１１に対して最大値を検出しその時点ｔｚを求める。時
間間隔算出部ではこの２つの時点ｔ１．ｔ２から時間間
隔ｔ２　ｔ＋　を求め、これを閾値判定部８に送る。

本図に示したのは入力音声が／　ｍ　ｉ　／の場合であ
りｔ、　１とｔ２の間隔が小さくなっており、このこと
により閾値判定部８において／　ｍ　ｉ　／であると判
定される。一方入力音声が／　ｎ　ｉ　／であると時間
間隔ｔｚ　　ｔｘが大きくなり閾値判定部８において／
　ｍ　ｉ　／であると判定される。

〔発明の効果〕

本発明によれば、調音点の違いに基づいて現われる音響
的特徴の差を少ない処理量で安定に抽出できるので、調
音点のみが異なるという類似子音の識別精度を処理量を
増加することなく向上することができる。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロック図、第２図は
第１図の実施例の動作を示す図である。１・・・入力音声、２・・・帯域分割フィルタ、３・・
・振幅包絡算出部、４・・・２階微分演算部５５・・・
最小値検出部、６・・・最大値検出部、７・・・時間間
隔算出部、８・・・閾値判定部、１１・・・振幅包絡波
形、１２・・・２階微分波形。

Claims

【特許請求の範囲】

１、入力音声を複数の周波数帯域に分割する手段と、各
周波数帯域毎に振幅包絡を求める手段と、前記各周波数
帯域毎の振幅包絡から複数種類の特徴を検出する手段と
を有し、前記複数種類の特徴の出現する時点の時間関係
に基づいて入力音声中の音素を判別するようにしたこと
を特徴とする音素判別方法。