JPS63213900A - 破裂子音識別方式 - Google Patents

破裂子音識別方式

Info

Publication number
JPS63213900A
JPS63213900A JP4728487A JP4728487A JPS63213900A JP S63213900 A JPS63213900 A JP S63213900A JP 4728487 A JP4728487 A JP 4728487A JP 4728487 A JP4728487 A JP 4728487A JP S63213900 A JPS63213900 A JP S63213900A
Authority
JP
Japan
Prior art keywords
point
consonant
vowel
plosive
rupture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4728487A
Other languages
English (en)
Inventor
均 岩見田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4728487A priority Critical patent/JPS63213900A/ja
Publication of JPS63213900A publication Critical patent/JPS63213900A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概 要] 音声d識装置における破裂子音識別方式において、入力
音声の破裂時点と母音立ち上がり点を検出し、それらか
ら子音長を求め、この子音長を識別パラメタに加えて識
別するように構成したものであり、これにより破裂子音
の識別精度を向上させた。
[産業上の利用分野] 本発明は音声認識装置に係わり、特に破裂子音の識別を
行う方式に関する。
音声認識の中でも、破裂子音の識別は特に困難であると
いわれている。そのため、それらの分析はより詳細に行
い、識別に最も適したパラメタを求める必要がある。
[従来の技術] 破裂子音識別方式の従来例としては、破裂時点と後続す
る母音の立ち上がり点を基準として分析位置を設定し、
分析を行い、識別パラメタとする方式がある。(例えば
、特願昭6O−250542)。この従来技術による破
裂子音識別方式の構成を第4図に示す。
図において、1は入力音声のディジタル時系列信号から
破裂時点を検出する破裂時点検出部である。
2は上記ディジタル時系列から後続する母音の立ち上が
り点を検出する母音立ち上がり点検出部である。
3は上記の破裂時点と母音立ち上がり点を基準として、
複数の分析位置を設定する分析位置設定部である。
4は分析位置設定部3で設定した分析位置で分析を行い
、パラメタ系列を求める分析部である。
5は分析部4の求めたパラメタ系列を用いて最も類似し
たカテゴリを判定する判定部である。
[発明が解決しようとする問題点] 上記の従来技術では、子音長(破裂時点から母音の立ち
上がり点までの時間長)で時間の正規化を行ってから識
別パラメタを求めるので、音素毎の子音長の違いが識別
パラメタに反映されないという問題点がある。
本発明は、この従来技術の問題点を解消した新規な破裂
子音識別方式を提供しようとするものである。
[問題点を解決するための手段] 第1図は本発明の破裂子音識別方式の原理ブロック図を
示す。
図において、lは破裂時点検出部であり、入力音声のデ
ィジタル時系列信号から破裂時点を検出する。
2は母音立ち上がり点検出部であり、上記ディジタル時
系列信号から母音立ち上がり点を検出する。
3は分析位置設定部であり、上記破裂時点と母音立ち上
がり点を基準として複数の分析位置を設定する。
4は分析部であり、分析位置設定部3で設定した分析位
置で分析を行い、パラメタ系列を求める。
6は子音製算出部であり、上記破裂時点と母音立ち上が
り点から子音長を求める。
5は判定部であり、分析部4で求めたパラメタ系列と子
音製算出部6で求めた子音長を用いて、最も類似したカ
テゴリを判定する。
[作用] 上記の構成をとることによって、判定部5における判定
のための識別パラメタとして、分析部4で求めたパラメ
タ系列に、子音製算出部6で求めた子音長が加えられる
破裂子音の子音長は、一般に音素毎に違いがあり、例え
ばp、tでは約15m5 Skでは約40園Sとなって
いる。
従って、この子音長データを識別パラメタに加えて判定
することにより、より正確な識別が可能となる。
[実施例] 以下第2図および第3図に示す実施例により、本発明を
さらに具体的に説明する。
第2図は、本発明の一実施例の構成を示すブロック図で
ある。この実施例は無声破裂子音(p。
t、k)を識別するものである。
図において、01は音声データメモリであり、入力音声
(無声破裂子音と母音からなる単音節)のディジタル時
系列信号を記憶しておく。
11は破裂時点検出部であり、入力音声の時系列信号か
ら子音区間の始まり、即ち調音点が開放される時点であ
る破裂時点を検出する。例えば、入力音声を高域強調し
た後のパワーがしきい値を越える点を破裂時点とする。
第3図(a)に入力音声の波形を、(b)にその対数パ
ワー系列を示す、第3図の音声の場合、A点が破裂時点
である。
21は母音立ち上がり点検出部であり、上記入力音声の
時系列信号から、後続する母音の周期的な波形の始まる
点を検出する。
例えば、人力音声を高域除去した後のパワーがしきい値
を越える点を母音立ち上がり点とする。
第3図の音声の場合、B点が母音立ち上がり点である。
61は子音長算出部であり、破裂時点Aと母音の立ち上
がり点Bから、次式により子音長rを求める。
r=B−A 31は分析位置設定部であり、破裂時点と母音立ち上が
り点を基準として分析位置を設定する0例えば3フレー
ムの分析を行う場合、その分析フレームの中心位置を、
A、  (A+B)/2.8とする。
41は周波数分析部であり、分析位置設定部31の設定
した分析位置において周波数分析を行い、各フレームあ
たり、例えば16帯域のパワースペクトルを求める。
フレーム数を3とすると、48次元の識別パラメタとな
る。これを、X(要素はXi、1=48)とする。
42は標準パターン辞書であり、予め多数のデータから
求めておいた主成分係数ベクトルMと、主成分展開後の
8次元のデータに子音長を加えた9次元のデータの、p
、t、にの各群の平均ベクトルEp、Et、Ekおよび
各群の平均共分散行列の逆行列Vを格納しておく。
主成分とは多数の変数(本例では48)間の関係から抽
出した識別に有効な少ない数(本例では8)の変数のこ
とであり、主成分係数ベクトルは主成分を求めるための
係数のベクトルであり、主成分係数ベクトルを用いて主
成分を求めることを展開という。
平均共分散行列は各群の主成分データおよび子音長デー
タの散らばり状況を示す行列式であり、判定部51にお
ける距離の計算に加味される。
主成分数を8とすると、Mは48×8次元の行列(要素
はmi、j 、  i −1〜4 B、  j = 1
〜8)であり、Eは9次元のベクトル(要素はeJ+J
=1〜9)、■は9×9次元の行列(要素はVi。
j+  t=t〜9.3=1〜9)である。
43は主成分展開部であり、入力音声の識別パラメタX
から、標準パターン辞書42の主成分係数ベクトルM(
要素はmi、j +  i = 1〜41L  j =
 1〜8)を用いて、その主成分Z(要素はZj、j=
1〜8)を次式により求める。
51は判定部であり、主成分展開部43で求めたZに子
音長算出部61で求めた子音長rを加えた9次元のベク
トル2(ただし、Z9=r)と標準パターン辞書42か
ら、次式により各カテゴリとの距離を求め、最も距離の
小さいカテゴリを識別結果とする0式中、(2−Eq)
″は(2−Eq)の縦横の転置したものを示す。
QQ =(2−Eq ) ’  V ・(2−Eq )
(q−p、t、k) [発明の効果] 以上説明のように本発明によれば、子音長を識別パラメ
タに加えることにより、従来考慮されていなかった音素
毎の子音長の違いが考慮されるようになるので、より正
確な識別行うことができ、その実珀上の効果は極めて大
で ある。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例の構成を示すブロック図、 第3図は入力音声波形と対数パワーを例示する図、 第4図は従来の破裂子音識別方式の構成を示すブロック
図である。 図面において、 i、tiは破裂時点検出部、 2.21は母音立ち上がり点検出部、 3.31は分析位置設定部、 4は分析部、      5,51は判定部、6.61
は子音長算出部、 01は音声データメモリ、41は周
波数分析部、   42は標準パターン辞書、43は主
成分展開部、 をそれぞれ示す。 ホ企旦月の源チヒフ゛Dツ20 峯  1   口 拵 2 麿 )3バtH皮形強ぐワーυl示tろ日 子 3 口

Claims (1)

  1. 【特許請求の範囲】 破裂子音と母音からなる単音節音声のディジタル時系列
    信号から破裂時点を検出する破裂時点検出部(1)と、 前記ディジタル時系列信号から後続する母音の立ち上が
    り点を検出する母音立ち上がり点検出部(2)と、 前記破裂時点と母音立ち上がり点を基準として識別パラ
    メタを求める分析部(4)と、 前記破裂時点と母音立ち上がり点から子音長を算出する
    子音長算出部(6)と、 子音長算出部(6)の算出した子音長を、分析部(4)
    の求めた識別パラメタに加えて、最も近いカテゴリを判
    定する判定部(5)を備え、 破裂子音を識別するよう構成したことを特徴とする破裂
    子音識別方式。
JP4728487A 1987-03-02 1987-03-02 破裂子音識別方式 Pending JPS63213900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4728487A JPS63213900A (ja) 1987-03-02 1987-03-02 破裂子音識別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4728487A JPS63213900A (ja) 1987-03-02 1987-03-02 破裂子音識別方式

Publications (1)

Publication Number Publication Date
JPS63213900A true JPS63213900A (ja) 1988-09-06

Family

ID=12770990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4728487A Pending JPS63213900A (ja) 1987-03-02 1987-03-02 破裂子音識別方式

Country Status (1)

Country Link
JP (1) JPS63213900A (ja)

Similar Documents

Publication Publication Date Title
JPS5972496A (ja) 単音識別装置
JPS63213900A (ja) 破裂子音識別方式
JPS6136798A (ja) 音声セグメンテ−シヨン法
JP2744622B2 (ja) 破裂子音識別方式
WO1987003127A1 (en) System and method for sound recognition with feature selection synchronized to voice pitch
JPS63161499A (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JPS6069695A (ja) 語頭子音のセグメンテ−ション法
JPS6293000A (ja) 音声認識方法
JPS62191900A (ja) 無声破裂子音識別方式
Zahorian et al. Dynamic spectral shape features for speaker-independent automatic recognition of stop consonants
JPS63155098A (ja) 有声破裂音破裂時点検出装置
JPS63316098A (ja) 破裂子音識別方式
JPH0887292A (ja) 単語音声認識装置
JPS62115498A (ja) 無声破裂子音識別方式
JPH01303499A (ja) 破裂子音識別方式
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPH01260499A (ja) 子音認識法
JPS61118800A (ja) 音声分析装置
JPS62141597A (ja) 有声破裂子音識別方式
JPS6236699A (ja) 音声識別装置
JPS61149998A (ja) 音素判別方法
JPS5885495A (ja) 音声認識装置
JPS62115497A (ja) 破裂子音識別方式
JPS63191199A (ja) 有声破裂子音識別装置