JPS63213900A - 破裂子音識別方式 - Google Patents
破裂子音識別方式Info
- Publication number
- JPS63213900A JPS63213900A JP4728487A JP4728487A JPS63213900A JP S63213900 A JPS63213900 A JP S63213900A JP 4728487 A JP4728487 A JP 4728487A JP 4728487 A JP4728487 A JP 4728487A JP S63213900 A JPS63213900 A JP S63213900A
- Authority
- JP
- Japan
- Prior art keywords
- point
- consonant
- vowel
- plosive
- rupture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 7
- 230000000630 rising effect Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 241000600169 Maro Species 0.000 description 1
- 230000009172 bursting Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[概 要]
音声d識装置における破裂子音識別方式において、入力
音声の破裂時点と母音立ち上がり点を検出し、それらか
ら子音長を求め、この子音長を識別パラメタに加えて識
別するように構成したものであり、これにより破裂子音
の識別精度を向上させた。
音声の破裂時点と母音立ち上がり点を検出し、それらか
ら子音長を求め、この子音長を識別パラメタに加えて識
別するように構成したものであり、これにより破裂子音
の識別精度を向上させた。
[産業上の利用分野]
本発明は音声認識装置に係わり、特に破裂子音の識別を
行う方式に関する。
行う方式に関する。
音声認識の中でも、破裂子音の識別は特に困難であると
いわれている。そのため、それらの分析はより詳細に行
い、識別に最も適したパラメタを求める必要がある。
いわれている。そのため、それらの分析はより詳細に行
い、識別に最も適したパラメタを求める必要がある。
[従来の技術]
破裂子音識別方式の従来例としては、破裂時点と後続す
る母音の立ち上がり点を基準として分析位置を設定し、
分析を行い、識別パラメタとする方式がある。(例えば
、特願昭6O−250542)。この従来技術による破
裂子音識別方式の構成を第4図に示す。
る母音の立ち上がり点を基準として分析位置を設定し、
分析を行い、識別パラメタとする方式がある。(例えば
、特願昭6O−250542)。この従来技術による破
裂子音識別方式の構成を第4図に示す。
図において、1は入力音声のディジタル時系列信号から
破裂時点を検出する破裂時点検出部である。
破裂時点を検出する破裂時点検出部である。
2は上記ディジタル時系列から後続する母音の立ち上が
り点を検出する母音立ち上がり点検出部である。
り点を検出する母音立ち上がり点検出部である。
3は上記の破裂時点と母音立ち上がり点を基準として、
複数の分析位置を設定する分析位置設定部である。
複数の分析位置を設定する分析位置設定部である。
4は分析位置設定部3で設定した分析位置で分析を行い
、パラメタ系列を求める分析部である。
、パラメタ系列を求める分析部である。
5は分析部4の求めたパラメタ系列を用いて最も類似し
たカテゴリを判定する判定部である。
たカテゴリを判定する判定部である。
[発明が解決しようとする問題点]
上記の従来技術では、子音長(破裂時点から母音の立ち
上がり点までの時間長)で時間の正規化を行ってから識
別パラメタを求めるので、音素毎の子音長の違いが識別
パラメタに反映されないという問題点がある。
上がり点までの時間長)で時間の正規化を行ってから識
別パラメタを求めるので、音素毎の子音長の違いが識別
パラメタに反映されないという問題点がある。
本発明は、この従来技術の問題点を解消した新規な破裂
子音識別方式を提供しようとするものである。
子音識別方式を提供しようとするものである。
[問題点を解決するための手段]
第1図は本発明の破裂子音識別方式の原理ブロック図を
示す。
示す。
図において、lは破裂時点検出部であり、入力音声のデ
ィジタル時系列信号から破裂時点を検出する。
ィジタル時系列信号から破裂時点を検出する。
2は母音立ち上がり点検出部であり、上記ディジタル時
系列信号から母音立ち上がり点を検出する。
系列信号から母音立ち上がり点を検出する。
3は分析位置設定部であり、上記破裂時点と母音立ち上
がり点を基準として複数の分析位置を設定する。
がり点を基準として複数の分析位置を設定する。
4は分析部であり、分析位置設定部3で設定した分析位
置で分析を行い、パラメタ系列を求める。
置で分析を行い、パラメタ系列を求める。
6は子音製算出部であり、上記破裂時点と母音立ち上が
り点から子音長を求める。
り点から子音長を求める。
5は判定部であり、分析部4で求めたパラメタ系列と子
音製算出部6で求めた子音長を用いて、最も類似したカ
テゴリを判定する。
音製算出部6で求めた子音長を用いて、最も類似したカ
テゴリを判定する。
[作用]
上記の構成をとることによって、判定部5における判定
のための識別パラメタとして、分析部4で求めたパラメ
タ系列に、子音製算出部6で求めた子音長が加えられる
。
のための識別パラメタとして、分析部4で求めたパラメ
タ系列に、子音製算出部6で求めた子音長が加えられる
。
破裂子音の子音長は、一般に音素毎に違いがあり、例え
ばp、tでは約15m5 Skでは約40園Sとなって
いる。
ばp、tでは約15m5 Skでは約40園Sとなって
いる。
従って、この子音長データを識別パラメタに加えて判定
することにより、より正確な識別が可能となる。
することにより、より正確な識別が可能となる。
[実施例]
以下第2図および第3図に示す実施例により、本発明を
さらに具体的に説明する。
さらに具体的に説明する。
第2図は、本発明の一実施例の構成を示すブロック図で
ある。この実施例は無声破裂子音(p。
ある。この実施例は無声破裂子音(p。
t、k)を識別するものである。
図において、01は音声データメモリであり、入力音声
(無声破裂子音と母音からなる単音節)のディジタル時
系列信号を記憶しておく。
(無声破裂子音と母音からなる単音節)のディジタル時
系列信号を記憶しておく。
11は破裂時点検出部であり、入力音声の時系列信号か
ら子音区間の始まり、即ち調音点が開放される時点であ
る破裂時点を検出する。例えば、入力音声を高域強調し
た後のパワーがしきい値を越える点を破裂時点とする。
ら子音区間の始まり、即ち調音点が開放される時点であ
る破裂時点を検出する。例えば、入力音声を高域強調し
た後のパワーがしきい値を越える点を破裂時点とする。
第3図(a)に入力音声の波形を、(b)にその対数パ
ワー系列を示す、第3図の音声の場合、A点が破裂時点
である。
ワー系列を示す、第3図の音声の場合、A点が破裂時点
である。
21は母音立ち上がり点検出部であり、上記入力音声の
時系列信号から、後続する母音の周期的な波形の始まる
点を検出する。
時系列信号から、後続する母音の周期的な波形の始まる
点を検出する。
例えば、人力音声を高域除去した後のパワーがしきい値
を越える点を母音立ち上がり点とする。
を越える点を母音立ち上がり点とする。
第3図の音声の場合、B点が母音立ち上がり点である。
61は子音長算出部であり、破裂時点Aと母音の立ち上
がり点Bから、次式により子音長rを求める。
がり点Bから、次式により子音長rを求める。
r=B−A
31は分析位置設定部であり、破裂時点と母音立ち上が
り点を基準として分析位置を設定する0例えば3フレー
ムの分析を行う場合、その分析フレームの中心位置を、
A、 (A+B)/2.8とする。
り点を基準として分析位置を設定する0例えば3フレー
ムの分析を行う場合、その分析フレームの中心位置を、
A、 (A+B)/2.8とする。
41は周波数分析部であり、分析位置設定部31の設定
した分析位置において周波数分析を行い、各フレームあ
たり、例えば16帯域のパワースペクトルを求める。
した分析位置において周波数分析を行い、各フレームあ
たり、例えば16帯域のパワースペクトルを求める。
フレーム数を3とすると、48次元の識別パラメタとな
る。これを、X(要素はXi、1=48)とする。
る。これを、X(要素はXi、1=48)とする。
42は標準パターン辞書であり、予め多数のデータから
求めておいた主成分係数ベクトルMと、主成分展開後の
8次元のデータに子音長を加えた9次元のデータの、p
、t、にの各群の平均ベクトルEp、Et、Ekおよび
各群の平均共分散行列の逆行列Vを格納しておく。
求めておいた主成分係数ベクトルMと、主成分展開後の
8次元のデータに子音長を加えた9次元のデータの、p
、t、にの各群の平均ベクトルEp、Et、Ekおよび
各群の平均共分散行列の逆行列Vを格納しておく。
主成分とは多数の変数(本例では48)間の関係から抽
出した識別に有効な少ない数(本例では8)の変数のこ
とであり、主成分係数ベクトルは主成分を求めるための
係数のベクトルであり、主成分係数ベクトルを用いて主
成分を求めることを展開という。
出した識別に有効な少ない数(本例では8)の変数のこ
とであり、主成分係数ベクトルは主成分を求めるための
係数のベクトルであり、主成分係数ベクトルを用いて主
成分を求めることを展開という。
平均共分散行列は各群の主成分データおよび子音長デー
タの散らばり状況を示す行列式であり、判定部51にお
ける距離の計算に加味される。
タの散らばり状況を示す行列式であり、判定部51にお
ける距離の計算に加味される。
主成分数を8とすると、Mは48×8次元の行列(要素
はmi、j 、 i −1〜4 B、 j = 1
〜8)であり、Eは9次元のベクトル(要素はeJ+J
=1〜9)、■は9×9次元の行列(要素はVi。
はmi、j 、 i −1〜4 B、 j = 1
〜8)であり、Eは9次元のベクトル(要素はeJ+J
=1〜9)、■は9×9次元の行列(要素はVi。
j+ t=t〜9.3=1〜9)である。
43は主成分展開部であり、入力音声の識別パラメタX
から、標準パターン辞書42の主成分係数ベクトルM(
要素はmi、j + i = 1〜41L j =
1〜8)を用いて、その主成分Z(要素はZj、j=
1〜8)を次式により求める。
から、標準パターン辞書42の主成分係数ベクトルM(
要素はmi、j + i = 1〜41L j =
1〜8)を用いて、その主成分Z(要素はZj、j=
1〜8)を次式により求める。
51は判定部であり、主成分展開部43で求めたZに子
音長算出部61で求めた子音長rを加えた9次元のベク
トル2(ただし、Z9=r)と標準パターン辞書42か
ら、次式により各カテゴリとの距離を求め、最も距離の
小さいカテゴリを識別結果とする0式中、(2−Eq)
″は(2−Eq)の縦横の転置したものを示す。
音長算出部61で求めた子音長rを加えた9次元のベク
トル2(ただし、Z9=r)と標準パターン辞書42か
ら、次式により各カテゴリとの距離を求め、最も距離の
小さいカテゴリを識別結果とする0式中、(2−Eq)
″は(2−Eq)の縦横の転置したものを示す。
QQ =(2−Eq ) ’ V ・(2−Eq )
(q−p、t、k) [発明の効果] 以上説明のように本発明によれば、子音長を識別パラメ
タに加えることにより、従来考慮されていなかった音素
毎の子音長の違いが考慮されるようになるので、より正
確な識別行うことができ、その実珀上の効果は極めて大
で ある。
(q−p、t、k) [発明の効果] 以上説明のように本発明によれば、子音長を識別パラメ
タに加えることにより、従来考慮されていなかった音素
毎の子音長の違いが考慮されるようになるので、より正
確な識別行うことができ、その実珀上の効果は極めて大
で ある。
第1図は本発明の原理ブロック図、
第2図は本発明の一実施例の構成を示すブロック図、
第3図は入力音声波形と対数パワーを例示する図、
第4図は従来の破裂子音識別方式の構成を示すブロック
図である。 図面において、 i、tiは破裂時点検出部、 2.21は母音立ち上がり点検出部、 3.31は分析位置設定部、 4は分析部、 5,51は判定部、6.61
は子音長算出部、 01は音声データメモリ、41は周
波数分析部、 42は標準パターン辞書、43は主
成分展開部、 をそれぞれ示す。 ホ企旦月の源チヒフ゛Dツ20 峯 1 口 拵 2 麿 )3バtH皮形強ぐワーυl示tろ日 子 3 口
図である。 図面において、 i、tiは破裂時点検出部、 2.21は母音立ち上がり点検出部、 3.31は分析位置設定部、 4は分析部、 5,51は判定部、6.61
は子音長算出部、 01は音声データメモリ、41は周
波数分析部、 42は標準パターン辞書、43は主
成分展開部、 をそれぞれ示す。 ホ企旦月の源チヒフ゛Dツ20 峯 1 口 拵 2 麿 )3バtH皮形強ぐワーυl示tろ日 子 3 口
Claims (1)
- 【特許請求の範囲】 破裂子音と母音からなる単音節音声のディジタル時系列
信号から破裂時点を検出する破裂時点検出部(1)と、 前記ディジタル時系列信号から後続する母音の立ち上が
り点を検出する母音立ち上がり点検出部(2)と、 前記破裂時点と母音立ち上がり点を基準として識別パラ
メタを求める分析部(4)と、 前記破裂時点と母音立ち上がり点から子音長を算出する
子音長算出部(6)と、 子音長算出部(6)の算出した子音長を、分析部(4)
の求めた識別パラメタに加えて、最も近いカテゴリを判
定する判定部(5)を備え、 破裂子音を識別するよう構成したことを特徴とする破裂
子音識別方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4728487A JPS63213900A (ja) | 1987-03-02 | 1987-03-02 | 破裂子音識別方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4728487A JPS63213900A (ja) | 1987-03-02 | 1987-03-02 | 破裂子音識別方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63213900A true JPS63213900A (ja) | 1988-09-06 |
Family
ID=12770990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4728487A Pending JPS63213900A (ja) | 1987-03-02 | 1987-03-02 | 破裂子音識別方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63213900A (ja) |
-
1987
- 1987-03-02 JP JP4728487A patent/JPS63213900A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5972496A (ja) | 単音識別装置 | |
JPS63213900A (ja) | 破裂子音識別方式 | |
JPS6136798A (ja) | 音声セグメンテ−シヨン法 | |
JP2744622B2 (ja) | 破裂子音識別方式 | |
WO1987003127A1 (en) | System and method for sound recognition with feature selection synchronized to voice pitch | |
JPS63161499A (ja) | 音声認識装置 | |
JPS63217399A (ja) | 音声区間検出装置 | |
JPS6069695A (ja) | 語頭子音のセグメンテ−ション法 | |
JPS6293000A (ja) | 音声認識方法 | |
JPS62191900A (ja) | 無声破裂子音識別方式 | |
Zahorian et al. | Dynamic spectral shape features for speaker-independent automatic recognition of stop consonants | |
JPS63155098A (ja) | 有声破裂音破裂時点検出装置 | |
JPS63316098A (ja) | 破裂子音識別方式 | |
JPH0887292A (ja) | 単語音声認識装置 | |
JPS62115498A (ja) | 無声破裂子音識別方式 | |
JPH01303499A (ja) | 破裂子音識別方式 | |
JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
JPH01260499A (ja) | 子音認識法 | |
JPS61118800A (ja) | 音声分析装置 | |
JPS62141597A (ja) | 有声破裂子音識別方式 | |
JPS6236699A (ja) | 音声識別装置 | |
JPS61149998A (ja) | 音素判別方法 | |
JPS5885495A (ja) | 音声認識装置 | |
JPS62115497A (ja) | 破裂子音識別方式 | |
JPS63191199A (ja) | 有声破裂子音識別装置 |