JPS62194297A - 音素判別方法 - Google Patents
音素判別方法Info
- Publication number
- JPS62194297A JPS62194297A JP3514786A JP3514786A JPS62194297A JP S62194297 A JPS62194297 A JP S62194297A JP 3514786 A JP3514786 A JP 3514786A JP 3514786 A JP3514786 A JP 3514786A JP S62194297 A JPS62194297 A JP S62194297A
- Authority
- JP
- Japan
- Prior art keywords
- amplitude envelope
- band
- envelope waveform
- waveform
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000012850 discrimination method Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 238000000034 method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声人力装置の音響処理部に係り、特に人力音
声中の類似したFf素を識別するための音素判別方法に
関する。
声中の類似したFf素を識別するための音素判別方法に
関する。
従来からIjkf+/ m / 、 / n /のよう
な類似した音素の識別について1両者の調音点の違いに
基づいてスペクトルバタン−ヒに現われるホルマントの
遷移の仕方の差を利用できることは知られていた。
な類似した音素の識別について1両者の調音点の違いに
基づいてスペクトルバタン−ヒに現われるホルマントの
遷移の仕方の差を利用できることは知られていた。
これを利用した識別法として、たとえば日本音響学会講
演論文2−4−1. O(1985年9〜10月)に記
載のように周波数スペクトルのピークを抽出し、その遷
移をとらえてこれをもとにして識別する方法があった。
演論文2−4−1. O(1985年9〜10月)に記
載のように周波数スペクトルのピークを抽出し、その遷
移をとらえてこれをもとにして識別する方法があった。
しかし、この方法では処理量。
抽出の安定性についての配慮がなされていなかった。
上記従来技術においては音声を認識するために音声信号
の周波数構造を重視してホルマント周波数を陽に求める
ような手段をとっていた。周波数スペクトルからホルマ
ント周波数を抽出するのは処理量が多くなるばかりでな
く、誤まったピークを検出してしまう誤検出も少なくな
い。このように従来技術では処理量が多い、抽出の安定
性に欠けるという1m題があった6 本発明の目的は上記問題を解決し、調音点の違いによっ
て生ずる音響的な特徴の差を少ない処理量でかつ安定に
抽出する手法を提供することにある。
の周波数構造を重視してホルマント周波数を陽に求める
ような手段をとっていた。周波数スペクトルからホルマ
ント周波数を抽出するのは処理量が多くなるばかりでな
く、誤まったピークを検出してしまう誤検出も少なくな
い。このように従来技術では処理量が多い、抽出の安定
性に欠けるという1m題があった6 本発明の目的は上記問題を解決し、調音点の違いによっ
て生ずる音響的な特徴の差を少ない処理量でかつ安定に
抽出する手法を提供することにある。
本発明は、入力音声を複数の周波数帯域に分割し各帯域
の振幅包絡波形から時間変化の特徴的な点を検出しその
出現時点の時間関係の情報を用いて入力音声中の音素の
識別を行うものである。
の振幅包絡波形から時間変化の特徴的な点を検出しその
出現時点の時間関係の情報を用いて入力音声中の音素の
識別を行うものである。
時間的な特徴点の検出は振幅包絡波形に対する微分処理
などの簡単な演算と閾値判定によりなされるので少ない
処理量で実現できる。また、帯域分割された複数の周波
数帯域の中から特徴が最も顕著にあられれた帯域を選択
するという処理のため、抽出結果が安定したものとなる
。
などの簡単な演算と閾値判定によりなされるので少ない
処理量で実現できる。また、帯域分割された複数の周波
数帯域の中から特徴が最も顕著にあられれた帯域を選択
するという処理のため、抽出結果が安定したものとなる
。
このように本発明により、上記二つの目的、すなわち処
理量の削減と抽出の安定化が達成される。
理量の削減と抽出の安定化が達成される。
音声パタンを周波数帯域別の振幅包絡波形という観点か
らとらえると、音声パタン上に現われるホルマントの遷
移はホルマントが通過する周波数帯域において振幅包絡
波形に上昇−停留−下降のパタンか現われることとして
とらえることができる。本発明はこの振幅包絡波形上に
現われるパタンをとらえることにより、調音点の違いに
基づいて生じる音響的な特徴の差を識別しようとするも
のである。
らとらえると、音声パタン上に現われるホルマントの遷
移はホルマントが通過する周波数帯域において振幅包絡
波形に上昇−停留−下降のパタンか現われることとして
とらえることができる。本発明はこの振幅包絡波形上に
現われるパタンをとらえることにより、調音点の違いに
基づいて生じる音響的な特徴の差を識別しようとするも
のである。
入力された音声信号は周波数帯域分割され、各帯域毎に
振幅包絡波形が求められる。各帯域毎の振幅包絡波形に
ついて上記上昇−停留−下降のパタンを検出し最もその
特徴が顕著にあられれる帯域が決定される。この帯域の
振幅包絡波形について上昇・下降など時間変化の特徴点
をいくつか求め、その出現の時間関係を調べることによ
り音素の識別がなされる。
振幅包絡波形が求められる。各帯域毎の振幅包絡波形に
ついて上記上昇−停留−下降のパタンを検出し最もその
特徴が顕著にあられれる帯域が決定される。この帯域の
振幅包絡波形について上昇・下降など時間変化の特徴点
をいくつか求め、その出現の時間関係を調べることによ
り音素の識別がなされる。
特徴を求める帯域を複数の帯域から選択するのでホルマ
ント周波数の変動の影響を受けにくく安定した結果が得
られる。また時間方向の変化を検出するようにしたこと
により1周波数方向にはわずかの移動であるようなホル
マント遷移でも少ない処理量で安定にとらえられるよう
になる6〔実施例〕 以下、本発明の一実施例を第1図を用いて説明する。
ント周波数の変動の影響を受けにくく安定した結果が得
られる。また時間方向の変化を検出するようにしたこと
により1周波数方向にはわずかの移動であるようなホル
マント遷移でも少ない処理量で安定にとらえられるよう
になる6〔実施例〕 以下、本発明の一実施例を第1図を用いて説明する。
入力音声1は帯域分割フィルタ2により複数の周波数帯
域毎の信号として分割された時、振幅包絡算出部3によ
り振幅包絡波形が求められる。
域毎の信号として分割された時、振幅包絡算出部3によ
り振幅包絡波形が求められる。
このようにして求まった各周波数帯域毎の振幅包絡波形
に対し、2階微分演算部4において2階微分が施され2
階微分された波形が出力される。
に対し、2階微分演算部4において2階微分が施され2
階微分された波形が出力される。
最小値検出部5では各帯域の2階微分波形から2階微分
値が最も小さい値をとる帯域2時間位置tlおよび最小
値の値自体を記憶する。2階微分波形の最小値を求める
のは、もとの振幅包絡波形上で上に最も凸な点、いいか
えると振幅減少方向の加速度が最大となる点を求めてい
ることに相当する− 一方、2階微分値が最も小さくなる帯域について、もと
の振幅包絡波形のピークを最大値検出部6において検出
しその時間位置t2を求める。
値が最も小さい値をとる帯域2時間位置tlおよび最小
値の値自体を記憶する。2階微分波形の最小値を求める
のは、もとの振幅包絡波形上で上に最も凸な点、いいか
えると振幅減少方向の加速度が最大となる点を求めてい
ることに相当する− 一方、2階微分値が最も小さくなる帯域について、もと
の振幅包絡波形のピークを最大値検出部6において検出
しその時間位置t2を求める。
時間間隔算出部7では、2階微分波形の最小値位置tl
ともとの振幅包絡波形のピーク位置tzの時間間隔tz
tl を求め閾値判定部8に送る。
ともとの振幅包絡波形のピーク位置tzの時間間隔tz
tl を求め閾値判定部8に送る。
閾値判定部8°では送られてきた時間間隔とあらかじめ
設定してあった閾値とを比較し、その大小関係にもとづ
いて入力音声中の音素の識別を行う。
設定してあった閾値とを比較し、その大小関係にもとづ
いて入力音声中の音素の識別を行う。
時間間隔tz−ttは特定帯域の振幅包絡波形において
上に最も凸な点から包絡波形のピークまでの間隔であり
、調音点の移動によってホルマントの遷移のあるような
音素ではこの間隔が小さくなり、ホルマントの遷移の少
ない音素ではこの間隔が大きくなる傾向がある。閾値判
定部8における判定はこの基準に基づいて音素を識別す
るものである。
上に最も凸な点から包絡波形のピークまでの間隔であり
、調音点の移動によってホルマントの遷移のあるような
音素ではこの間隔が小さくなり、ホルマントの遷移の少
ない音素ではこの間隔が大きくなる傾向がある。閾値判
定部8における判定はこの基準に基づいて音素を識別す
るものである。
次に第2図を用いて本実施例の動作を説明する。
図中実線は2階微分波形において最小値の生じた帯域の
振幅包絡波形11、破線は実線の振幅包絡波形に対して
2階微分を施した波形12である6最小値検出部5では
2階微分波形12について最小値を検出し、その時点t
1が求められる。一方最大値検出部6では振幅包絡波形
11に対して最大値を検出しその時点tzを求める。時
間間隔算出部ではこの2つの時点t1.t2から時間間
隔t2 t+ を求め、これを閾値判定部8に送る。
振幅包絡波形11、破線は実線の振幅包絡波形に対して
2階微分を施した波形12である6最小値検出部5では
2階微分波形12について最小値を検出し、その時点t
1が求められる。一方最大値検出部6では振幅包絡波形
11に対して最大値を検出しその時点tzを求める。時
間間隔算出部ではこの2つの時点t1.t2から時間間
隔t2 t+ を求め、これを閾値判定部8に送る。
本図に示したのは入力音声が/ m i /の場合であ
りt、 1とt2の間隔が小さくなっており、このこと
により閾値判定部8において/ m i /であると判
定される。一方入力音声が/ n i /であると時間
間隔tz txが大きくなり閾値判定部8において/
m i /であると判定される。
りt、 1とt2の間隔が小さくなっており、このこと
により閾値判定部8において/ m i /であると判
定される。一方入力音声が/ n i /であると時間
間隔tz txが大きくなり閾値判定部8において/
m i /であると判定される。
本発明によれば、調音点の違いに基づいて現われる音響
的特徴の差を少ない処理量で安定に抽出できるので、調
音点のみが異なるという類似子音の識別精度を処理量を
増加することなく向上することができる。
的特徴の差を少ない処理量で安定に抽出できるので、調
音点のみが異なるという類似子音の識別精度を処理量を
増加することなく向上することができる。
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例の動作を示す図である。 1・・・入力音声、2・・・帯域分割フィルタ、3・・
・振幅包絡算出部、4・・・2階微分演算部55・・・
最小値検出部、6・・・最大値検出部、7・・・時間間
隔算出部、8・・・閾値判定部、11・・・振幅包絡波
形、12・・・2階微分波形。
第1図の実施例の動作を示す図である。 1・・・入力音声、2・・・帯域分割フィルタ、3・・
・振幅包絡算出部、4・・・2階微分演算部55・・・
最小値検出部、6・・・最大値検出部、7・・・時間間
隔算出部、8・・・閾値判定部、11・・・振幅包絡波
形、12・・・2階微分波形。
Claims (1)
- 1、入力音声を複数の周波数帯域に分割する手段と、各
周波数帯域毎に振幅包絡を求める手段と、前記各周波数
帯域毎の振幅包絡から複数種類の特徴を検出する手段と
を有し、前記複数種類の特徴の出現する時点の時間関係
に基づいて入力音声中の音素を判別するようにしたこと
を特徴とする音素判別方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3514786A JPS62194297A (ja) | 1986-02-21 | 1986-02-21 | 音素判別方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3514786A JPS62194297A (ja) | 1986-02-21 | 1986-02-21 | 音素判別方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62194297A true JPS62194297A (ja) | 1987-08-26 |
Family
ID=12433788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3514786A Pending JPS62194297A (ja) | 1986-02-21 | 1986-02-21 | 音素判別方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62194297A (ja) |
-
1986
- 1986-02-21 JP JP3514786A patent/JPS62194297A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4401849A (en) | Speech detecting method | |
EP0054365B1 (en) | Speech recognition systems | |
US5148484A (en) | Signal processing apparatus for separating voice and non-voice audio signals contained in a same mixed audio signal | |
US4885791A (en) | Apparatus for speech recognition | |
US3377428A (en) | Voiced sound detector circuits and systems | |
JPS62194297A (ja) | 音素判別方法 | |
JPH0520760B2 (ja) | ||
JPS59121099A (ja) | 音声区間検出装置 | |
JPS62141595A (ja) | 音声検出方式 | |
JPS63163495A (ja) | 音声区間検出装置 | |
JPS61277998A (ja) | 音声認識回路 | |
JP3450972B2 (ja) | パターン認識装置 | |
JP2547541B2 (ja) | 単音節音声認識装置 | |
JPS59228300A (ja) | 音声区間検出方式 | |
JPS61140999A (ja) | 音声区間検出方式 | |
JPS622300A (ja) | 音声ピツチ抽出装置 | |
JPS63226691A (ja) | 標準パターン作成方式 | |
CA1127764A (en) | Speech recognition system | |
JPH04251299A (ja) | 音声区間検出方法 | |
KR970067093A (ko) | 음성신호의 유성음 구간에서 이포크(epoch) 검출 방법 | |
JPH01158499A (ja) | 定常雑音除去方式 | |
JPH0412478B2 (ja) | ||
JPS58202500A (ja) | 音声の特徴抽出方式 | |
JPS6031196A (ja) | 音声パタ−ン作成装置 | |
JPS6068397A (ja) | 音声特徴抽出方式 |