JPS61185799A - 有声破裂音認識装置 - Google Patents

有声破裂音認識装置

Info

Publication number
JPS61185799A
JPS61185799A JP60027012A JP2701285A JPS61185799A JP S61185799 A JPS61185799 A JP S61185799A JP 60027012 A JP60027012 A JP 60027012A JP 2701285 A JP2701285 A JP 2701285A JP S61185799 A JPS61185799 A JP S61185799A
Authority
JP
Japan
Prior art keywords
audio signal
time series
difference
voiced
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60027012A
Other languages
English (en)
Inventor
小林 敦仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60027012A priority Critical patent/JPS61185799A/ja
Publication of JPS61185799A publication Critical patent/JPS61185799A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は単音節音声認識装置に係り、特に有声破裂音の
認識に供せられる有声破裂音認識装置に関する。
例えば日本語における音節は母音と子音とに大別され、
これらのうち子音は、調音様式によって破裂子音をはじ
めとする6種類に分類される。また破裂子音は有声破裂
音(バ行・ダ行・ガ行の子音)と無声破裂音(パ行・夕
行・力行の子音)とに分類される。
第2図は有声破裂音“バ″の音声信号であり。
領域■はバズバー(buzz bar)と称される領域
であり、有声破裂音の破裂に先立って比較的ひくい周波
数の周期的信号が継続する。
領域■は破裂部と称され、破裂時点Bから数肥の短い間
に破裂的信号が存在する。
領域■は破裂部直後から母音への渡りの領域であり、こ
こで子音“b”から母音“a”への移り変わりがおこな
われるのであるが、この領域は領域■とともに有声破裂
音を最も特徴付ける領域である。
また領域■は母音“a”を特徴付ける領域であり、比較
的長時間にわたって周期的信号が継続する。
従って、有声破裂音の認識においては破裂時点Bおよび
破裂時点直後から母音への渡り領域の特徴を正確に抽出
することが重要である。
〔従来の技術〕
第3図は有声破裂音認識装置の従来例の構成を示すブロ
ック図であり。
1は話者が発声した有声破裂音を電気信号に変換するマ
イクロホン。
2はマイクロホン1によって電気信号に変換された音声
信号を1例えば10 k Hz毎にサンプリングしてA
D変換するAD変換器(八/D)。
3はAD変換2によってAD変換された音声信号の時系
列を一時記憶するバッファ。
4はバッファ3に記憶する音声信号を所定時間長の分析
窓によって一定周期毎に分析して、所定時間長のフレー
ム毎の例えばパワースペクトル等の特徴を抽出し特徴時
系列を作る特徴抽出部。
5は有声破裂音の種類毎に予め準備した標準の特徴時系
列を登録する特徴辞書。
6は特徴抽出部4によって抽出した入力音声の特徴時系
列と特徴辞IF5に登録する複数の標準特徴時系列との
類似度を求める照合部。
7は照合部6によって得られた類似度によって。
入力された有声破裂音の種別を判定する判定部である。
〔発明が解決しようとする問題点〕
上記構成の有声破裂音認識装置においては、特徴抽出部
4では第2図に示すように1例えば長さg=20msの
分析窓を■−■−■−・・・のように。
例えば周期T=10ms毎に移動させながら、音声信号
の各フレーム毎に特徴を抽出して5例えば40フレ一ム
分の特徴時系列を作るのであるが1分析窓をかける位置
に対しては何等の規制がなされていない。
このため破裂時点から母音への渡りの領域(領域■・■
)にかかる分析窓の位置が不定であり。
有声破裂音を最も特徴付ける領域の特徴を常に安定すな
わち正確に抽出することが出来ず、従って認識精度が低
下するという問題点がある。
〔問題点を解決するための手段〕
本発明になる有声破裂音認識装置は、入力された音声信
号の一次差分の時系列と二次差分の時系列とを生成する
第一の演算回路と、前記生成された二次差分の時系列か
ら前記入力された音声信号の有声破裂音の破裂時点の候
補を検出する第一の検出回路と、前記検出された破裂時
点の候補の前後における前記音声信号のエネルギーの差
分を演算する第二の演算回路と、前記演算されたエネル
ギーの差分の最大値が得られる時点を検出する第二の検
出回路とを備えることによって前記問題点の解消を図っ
たものである。
〔作用〕
第2図に見られるように、破裂時点Bでは音声信号の急
激な立上がりが現れ、また微視的には音声信号のエネル
ギーが急激に増大していることがわかる。
このような特徴に注目して2本発明では、入力音声信号
の二次差分によって音声信号の急激な立上がり部を破裂
時点の候補として幾つか検出したのち、これらの中で前
後におけるエネルギーの差分の最大値が得られる時点を
破裂時点として決定し、このようにして得られた破裂時
点によって。
特徴抽出における分析窓をかける位置を規制することに
り、入力音声信号中の有声破裂音を最も特徴付ける領域
の特徴を常に安定に抽出できるようにしたものである。
〔実施例〕
以下に本発明の要旨を実施例によって具体的に説明する
第1図は本発明一実施例の構成を示すブロック図であり
、第3図従来例のブロック図と共通する符号は同一対象
を指すほか。
8a・8b・8c・8dは入力された音声信号の一次差
分の時系列と二次差分の時系列とを生成する第一の演算
回路8の構成要素であり、 8aはバッファ3に記憶さ
れる音声信号の時系列の一次差分を演算しその時系列を
生成する第一の差分回路、 8bは第一の差分回路8a
の出力を絶対値に変換する変換回路、 8cは変換回路
8bを介して得られる入力音声信号の一次差分の絶対値
の時系列を格納するバッファ、また8dはバッファ8c
に格納される時系列の−次差分として、入力音声信号の
二次差分を演算しその時系列を生成する第二の差分回路
である。
9は第二の差分回路8dによって生成された入力音声信
号の二次差分の時系列から、所定の闇値を越える時点を
抽出することにより、入力音声信号中の有声破裂音の破
裂時点の候補を検出する第一の検出回路。
10は第一の検出回路9によって検出された破裂時点の
候補を格納するバッファ。
11は、バッファ8cに格納される入力音声信号の一次
差分の絶対値の時系列から、バッファ10に格納される
各破裂時点の候補の前後における入力音声信号のエネル
ギーの差分を演算する第二の演算回路。
12は第二の演算回路11によって演算されたエネルギ
ーの差分の最大値が得られる時点を有声破裂音の破裂時
点として検出する第二の検出回路。
4′は、バッファ3に記憶する音声信号の時系列を、第
二の検出回路12によって検出された破裂時点によって
規制された所定時間長の分析窓によって一定周期毎に分
析して、所定時間長のフレーム毎の例えばパワースペク
トル等の特徴を抽出し特徴時系列を作る特徴抽出部であ
る。
以上のような構成により、第一の演算回路8において入
力音声信号の一次差分の絶対値の時系列XI(仁)= 
l x(t) −x(t−1)  l     (11
および二次差分の時系列 x 2(t) = x Ht) −x 1(t−1) 
      (2)が得られ、バッファ8cには出力音
声信号の一次差分の絶対値の時系列(第3図(a)参照
)が、またバッファ10には入力音声信号の二次差分の
時系列のうち所定の閾値を越えるものく第3図中)参照
)が生ずる時点tH,すなわち有声破裂音の破裂時点の
候補が格納される。
第二の演算回路11は、各破裂時点の候補ti毎に9次
式で定義される信号エネルギーの差分Eti=Σsq、
 x 1 (t)−Σsq、 x Ht)   (3)
を求める(たただし右辺の第1項は破裂時点の候補時刻
tiまでのM時間ぶんの一次差分の信号エネルギー、第
2項はそのあとM時間ぶんの一次差分の信号のエネルギ
ーであり、ここでMは例えば5〜6maの範囲である)
また検出回路12は、第二の演算回路11によって演算
された信号エネルギーの差分の最大値が得られる時点を
検出し、これを有声破裂音の破裂時点として決定する。
特徴抽出部4′は、このようにして決定された破裂時点
によって規制された所定時間長の分析窓を用い、バッフ
ァ3に記憶する音声信号の時系列を一定周期毎に分析し
て、所定時間長のフレーム毎の例えばパワースペクトル
等の特徴を抽出し特徴時系列を作る。
以下従来例と同様にして、特徴抽出部4′によって抽出
た入力音声の特徴時系列と特徴辞書5に登録する複数の
標準特徴時系列との類似度から。
入力された有声破裂音の種別を判定する。
上記実施例では、破裂時点を求めるために、まず入力音
声信号の二次差分から破裂時点の候補を求めたうえ、こ
れらを−次差分の絶対値の時系列信号のエネルギーの差
分によって検証しており。
従って入力音声信号中に多少の雑音があっても正確に破
裂時点を検出することができる。
〔発明の効果〕
以上説明したように2本発明によれば、特徴抽出におけ
る分析窓をかける位置を破裂時点によって規制すること
により、入力音声信号中の有声破裂音を最も特徴付ける
領域の特徴を常に安定に抽出できるので、有声破裂音の
認識精度を向上することが出来る。
【図面の簡単な説明】
第1図は本発明一実施例のブロック図。 第2図は有声破裂音の音声信号の説明図。 第3図は従来例のブロック図。 第4図(a) (blは本発明一実施例の説明図である
。 図中。 8は第一の演算回路、8aは第一の差分回路。 8dは第二の差分回路、  9は第一の検出回路。 11は第二の演算回路、12は第二の検出回路を示す。

Claims (1)

    【特許請求の範囲】
  1. 入力された音声信号の一次差分の時系列と二次差分の時
    系列とを生成する第一の演算回路と、前記生成された二
    次差分の時系列から前記入力された音声信号の有声破裂
    音の破裂時点の候補を検出する第一の検出回路と、前記
    検出された破裂時点の候補の前後における前記音声信号
    のエネルギーの差分を演算する第二の演算回路と、前記
    演算されたエネルギーの差分の最大値が得られる時点を
    検出する第二の検出回路とを備えることを特徴とする有
    声破裂音認識装置。
JP60027012A 1985-02-14 1985-02-14 有声破裂音認識装置 Pending JPS61185799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60027012A JPS61185799A (ja) 1985-02-14 1985-02-14 有声破裂音認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60027012A JPS61185799A (ja) 1985-02-14 1985-02-14 有声破裂音認識装置

Publications (1)

Publication Number Publication Date
JPS61185799A true JPS61185799A (ja) 1986-08-19

Family

ID=12209186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60027012A Pending JPS61185799A (ja) 1985-02-14 1985-02-14 有声破裂音認識装置

Country Status (1)

Country Link
JP (1) JPS61185799A (ja)

Similar Documents

Publication Publication Date Title
JPS5972496A (ja) 単音識別装置
JPS61185799A (ja) 有声破裂音認識装置
JPS5972500A (ja) 音声認識方式
JPS61124998A (ja) 音声分析装置
JPS62191900A (ja) 無声破裂子音識別方式
JP2005070377A (ja) 音声認識装置、音声認識方法及び音声認識処理プログラム
Musfir et al. Analysis of fricatives, stop consonants and nasals in the automatic segmentation of speech using the group delay algorithm
JPS62280800A (ja) 破裂子音識別方式
JPS61118800A (ja) 音声分析装置
JPS63161499A (ja) 音声認識装置
JPS62191899A (ja) 有声破裂子音識別方式
JPS6120879B2 (ja)
JPS62118400A (ja) 有声破裂子音識別方式
JPH0887292A (ja) 単語音声認識装置
JPS59180598A (ja) 音声入力方式
JPS63217399A (ja) 音声区間検出装置
JPS62115498A (ja) 無声破裂子音識別方式
JPH0449716B2 (ja)
JPS6027000A (ja) パタンマツチング方法
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPH0246957B2 (ja)
JPS6033599A (ja) 音声認識装置
JPS63155098A (ja) 有声破裂音破裂時点検出装置
JPS6240496A (ja) 音声パタ−ン分類方式
JPH03145167A (ja) 音声認識方式