JPS63155098A - 有声破裂音破裂時点検出装置 - Google Patents

有声破裂音破裂時点検出装置

Info

Publication number
JPS63155098A
JPS63155098A JP30470186A JP30470186A JPS63155098A JP S63155098 A JPS63155098 A JP S63155098A JP 30470186 A JP30470186 A JP 30470186A JP 30470186 A JP30470186 A JP 30470186A JP S63155098 A JPS63155098 A JP S63155098A
Authority
JP
Japan
Prior art keywords
analysis
cepstrum
distance
point
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30470186A
Other languages
English (en)
Inventor
小林 敦仁
均 岩見田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP30470186A priority Critical patent/JPS63155098A/ja
Publication of JPS63155098A publication Critical patent/JPS63155098A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 本発明は、有声破裂子音相互を識別する装置内の破裂時
点検出装置において、特に同一分析開始点で分析フレー
ム長の異なる2つの分析フレーム間のケプストラム距1
lilIヲ用いて破裂時点を検出する際問題となる破裂
現象が弱い場合の誤検出を。
後続母音側のケプストラムに、よりケグストラム距離を
正規化することにより、検出誤りft減少させるように
したものである。
〔産業上の利用分野〕
本発明は音声認識装置、特に、有声破裂子音間の相互を
識別する装置に関連するものである。
音声認識装置特に単音節認識装置は基本的に68個のt
p音節で全ての日本1語いを構成できることから、キー
ボード入力のかわりとして文章入力に用いることができ
、音声ワールドプロセッサとして現在実用化がはかられ
ている しかし、単音節音声認識においては9語頭の子
音部の特徴の違いが大きな比重を占めており、従来から
単語音声認識装置等で用いられている方式ではその特i
11に捉えきれない。特に発声機(薄が非常に類似して
いる子音群内の相互識別は難しく、その高精度な識別方
法が必要とされている。特に有声破裂子音はその代表的
なものである。一般に有声破裂子音の特徴は破裂時点検
出および破裂時点から後続母音にいたる渡り領域VC6
ると考えられており、破裂時点検出は非常に重壁な課題
であり、現在研究が進められている。
〔従来の技術〕
従来の有声破裂音破裂時点検出方式には種々の方法が提
案されている。バンドパスフィルタの帯域パワーの一次
差分を用いる方法1時間領域でのパラメータ(エネルギ
ー、零交差回数など)を組み合わせて検出する方法など
があげられるが、現在数も有効な方法と考えられるのは
、−同一分析開始点で分析フレーム長の異なった2つの
分析フレーム間のケプストラム距離に基づいて極めて短
時間のスペクトル変化を抽出することにより破裂時点を
検出するものである。
ここでは、従来の有声破裂音破裂時点検出方式として、
同一分析開始点で分析フレーム長の異なった2つの分析
フレーム間のケプストラム距離による方法を第4図に記
す。
図中、11はマイクロホン、12はA/D変換器、13
ttハイパスフィルタ回路、14はA/Dデータメモリ
、15は分析位置設定回路116はケプストラム分析回
路、17はケプストラム距離演算回路、18はケプスト
ラム距離時系列メモリ。
19は破裂時点決定回路である。
マイクロホン11から入力された有声破裂音は。
A/D変換器12によりアナログ−ディジタル変換サレ
、ハイパスフィルタ13によりバズ信号を除去し、A/
Dデータメモリ4に格納される。A/Dデータメモリ1
4に格納された音声信号に対して3分析位置設定回路1
51Cて同一分析開始点で分析フレーム長の異なる2つ
の分析フレーム金。
ある一定の分析フレーム同門で設定し、ケプストラム分
析回路16にて、2つのフレーム毎にケプストラムを求
める。ケプストラム距離演算回路17でハ分析フレーム
長の異なる2つの分析フL/−A間のケプストラム距離
を演算する。その結果はケプストラム距離時系列メモリ
18に順次格納され。
破裂時点決定回路19ではケプストラム距離時系列にお
いて最大値を有する時点を破裂時点として出力する。
〔発明が解決しようとする問題点〕
従来、有声1i1X裂音に工・ける破裂時点検出方式と
しては、同一分析開始点で分析フレーム長の異なる2つ
の分析フレーム間のケプストラム距離に基づいて極めて
短時間のスペクトル変化を抽出することにより破裂時点
を検出する方法が最も有効であると考えられている。一
般的【は、破裂時点付近が最もスペクトル変化が急激で
あるが、唇音・歯茎音に多い例であるが=破裂が弱い″
場合にはスペクトル変化が急激に変化しないこともある
また、過渡部付近くもスペクトル変化が大きくなる時点
が存在する。このために、破裂時点でのケプストラム距
離が過渡部付近でのケプストラム距離よりも相対的に小
さくなり、誤検出する場合が多い。
〔問題点を解決するための手段〕
第1図は本発明の原理ブロック図である。
図中、lはハイパスフィルタ部、2は音声パワー演算部
、3は後続母音部検出部、4は分析位置設定部、5はケ
プストラム分析部、6はバッファメモリ部、7はケプス
トラム距離演nH5,8はケプストラム距離正規化部、
9はケプストラム距離時系列メモリ部、10は破裂時点
決定部である。
本発明では、マイクロホンから入力、A/D変換された
音声信号に関して、まず、音声パワー系列を計算し、そ
の音声パワー系列より後続母音の定常部開始点(i−検
出し、その時点でのケプストラムヲ求める。このケプス
トラムをもとに同一分析開始点で分析フレーム長の異な
る2つの分析フレーム間の正規化ケプストラム距離系列
を求め5その距離系列をもとに破裂時点を検出する。
〔作用〕
本発明においては、音声パワー演算部2及び後続母音部
検出部3にて得られた後続母音部間始点でのケプストラ
ムを用い、ケプストラム距離正規化部81/Cて、同一
分析開始点で分析フレーム長の異する2つの分析フレー
ム間のケプストラム距離を正規化する。このため破裂現
象が弱い場合にも後C母音への渡り領域でのケプストラ
ム距推より相対的て距離値が大きくなり、破裂時点の誤
噴出が、減少する。
〔実施%11 @2図は1本発明り一実施例による有声汲裂音破裂時a
検出装置である。
図中、マイクロホン2から入力された有声破裂音(離散
単音節)は、A/D変換器22によりアナログ−ディジ
タル変換され、ハイパスフィルタ23(力、トオフ周波
数5QOHz)によりバズ信号を除去し、データメモリ
24に格納される。次VC1音声パワー演算回路25に
て音声パワー時系列を計算する。いま、音声信号をy 
(t)とすれば、音声パワーPは に対応するサンプルH?イ/ト数) 上記定義に従って、フレーム周期M(M :  例えば
10m5)で音声パワー時系列を求める。その音声パワ
ー時系列は音声パワー時系列メモIJ 27 K格納さ
れる。次ぎに、その音声パワー時系列をもとに後続する
母音の定常部開始点を後続母音部検出回路26で検出す
る。ここでの処理は音声パワー時系列において、そのパ
ワーが犬キく、かつその変動があるいき値以下になる時
点を検出し、母音の定常部開始時点とする。次に、モー
ド切り換え回路28により、まず、上記定常部開始時点
におけるケプストラムCm(j)(j−1,n ) 7
に求める。ここでは分析フレーム長を10m5としく第
5図に示すフレームbと同じ長さ)FF’T演算回路3
0にて高速フーリエ変換を行い、対数パワースペクトル
演算回路31で対数パワースペクトル化し、さらにそ・
れを逆FFT演算回路32にて高速フーリエ逆変換を行
いケプストラムを求める。求められたケプストラムCs
 (j)はバッファメモリ33Vc格納される。次にモ
ード切り換え回路28により。
第5図に図示するような同一分析開始点で異なる2つの
分析フレームておけるケプストラムを求める。
ここでは、フレームaの分析悪投f 8.5ms 、フ
レームbのそれを10+nsとし、前述と同様な処理ト
てよりケプストラムを求める。
フレームaにおけるケプストラムr、(c a(j) 
、  フレームbrこおけるケプストラムをc b U
)とする(j=1.n)。次に、ケブヌトラム距離演算
回路34にてフレームaとフレームbとのケプストラム
距離dt次式で計算する。
次ぎに、ケプストラム距離正規化回路35により下式で
得られたケプストラム距離の正規化を行う。バッファメ
モIJ 33 Vこ格納されている後続母f部開始点で
のケプストラムCm(j)k用い1次式で正規化ケプス
トラム距離を求める。
ここで、Wは濾み係数であり。
w = 1− (フレームaの分析窓長)/(フレーム
bの分析窓長) で定義する。
上記処理を分析位置設定回路29の制御のもとに分析フ
レーム周期3m5(検出精度を考慮〉で順次行い、その
結果である正規化ケプストラム距離時系列tケプストラ
ム距離時系列メモリ36に格納する。ここで、正規化ケ
プストラム距離時系列を次式で表す。
da(1)= da(1)、 da(2)、 ・−=d
shl−この正規化ケプストラム距離時系列において最
大値を有する時点を最大値検出回路37にて検出する。
このima:c時点を破裂時点として検出する。
上記処理の説明図および破裂時点検出結果の例を第3図
に示す。
〔発明の効果〕
本発明によ′れば、破裂現像が弱い場合(唇音A/。
/d/に多い)にも、破裂時点付近でのケプストラム距
離が過渡部付近でのケプストラム距離よりも相対的に小
さくなり、破裂時点の検出率及び検出精度が高くなる。
【図面の簡単な説明】
第1図は本発明の原理プロ、り図。 図。 第4図は従来技術の構成図。 第5図は分析フレームの一例を示す図である。 第1図において、1はハイパスフィルタ部、2は音声パ
ワー演算部、3は後続母音部検出部、4は分析位置設定
部、5はケプストラム分析部、6はバッファメモ9部、
7はケプストラム距離演算部、8はケプストラム距離正
規化部、9はケプストラム距離時系列メモリ部、10は
破裂時薇決定部である。 #==邑 一一一一一一一 一一一一日二キ (σ−) (&ン ’S ’hfi’! [f) gE+小’)71’)’
j! t tb l t ;7モ1’7第 3 図 イタ2項ヒ秒示折丁のホー 八 四η 第 4 又 扮1斤フレームの 1 第 5 :フレームa(θ5 ms) !フレームしくto酌) 介・111図 図

Claims (1)

  1. 【特許請求の範囲】 バズ信号を除去するハイパスフィルタ手段(1)と、音
    声パワー時系列を演算する音声パワー演算手段(2)と
    、 音声パワー時系列より後続母音の定常部開始点を検出す
    る後続母音検出手段(3)と、 同一分析開始点で分析フレーム長の異なる2つの分析フ
    レームをある一定の分析フレーム周期で設定する分析位
    置設定手段(4)と、 各分析フレームにおいてケプストラムを演算するケプス
    トラム分析手段(5)と、 上記ケプストラム分析手段(5)により得られた後続母
    音の定常部開始点におけるケプストラムを保持するバッ
    ファメモリ手段(6)と、 同一分析開始点で分析フレーム長の異なる2つの分析フ
    レーム間のケプストラム距離を演算するケプストラム距
    離演算手段(7)と、 上記ケプストラム距離演算手段(7)により得られた2
    つの分析フレーム間のケプストラム距離を、上記バッフ
    ァメモリ手段(6)に格納されている後続母音の定常開
    始点におけるケプストラムで正規化処理を行なうケプス
    トラム距離正規化手段(8)と、上記ケプストラム距離
    正規化手段(8)により得られたケプストラム距離の時
    系列を保持するケプストラム距離時系列メモリ手段(9
    )と、 プストラム距離時系列よりその最大値を検出し、破裂時
    点を決定する破裂時点検定手段(10)とをそなえたこ
    とを特徴とする有声破裂音破裂時点検出装置。
JP30470186A 1986-12-18 1986-12-18 有声破裂音破裂時点検出装置 Pending JPS63155098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30470186A JPS63155098A (ja) 1986-12-18 1986-12-18 有声破裂音破裂時点検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30470186A JPS63155098A (ja) 1986-12-18 1986-12-18 有声破裂音破裂時点検出装置

Publications (1)

Publication Number Publication Date
JPS63155098A true JPS63155098A (ja) 1988-06-28

Family

ID=17936176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30470186A Pending JPS63155098A (ja) 1986-12-18 1986-12-18 有声破裂音破裂時点検出装置

Country Status (1)

Country Link
JP (1) JPS63155098A (ja)

Similar Documents

Publication Publication Date Title
JPS5972496A (ja) 単音識別装置
JPS60200300A (ja) 音声の始端・終端検出装置
JPS63155098A (ja) 有声破裂音破裂時点検出装置
JPS58108590A (ja) 音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPH045198B2 (ja)
JPS63213899A (ja) 話者照合方式
JPH0398098A (ja) 音声認識装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPS63161499A (ja) 音声認識装置
JPS61260299A (ja) 音声認識装置
Undhad et al. Exploiting speech source information for vowel landmark detection for low resource language
JPS60115996A (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JPS61124998A (ja) 音声分析装置
JPH02232698A (ja) 音声認識装置
JPH03145167A (ja) 音声認識方式
JPS6011898A (ja) 音声認識装置
JPS63173100A (ja) キ−ワ−ド抽出装置
JPS63191199A (ja) 有声破裂子音識別装置
JPS63213900A (ja) 破裂子音識別方式
JPS62191900A (ja) 無声破裂子音識別方式
JPS61190398A (ja) 破裂子音認識方式
JPS62280800A (ja) 破裂子音識別方式
JPS61118800A (ja) 音声分析装置