JPS62280800A - 破裂子音識別方式 - Google Patents

破裂子音識別方式

Info

Publication number
JPS62280800A
JPS62280800A JP61124827A JP12482786A JPS62280800A JP S62280800 A JPS62280800 A JP S62280800A JP 61124827 A JP61124827 A JP 61124827A JP 12482786 A JP12482786 A JP 12482786A JP S62280800 A JPS62280800 A JP S62280800A
Authority
JP
Japan
Prior art keywords
plosive
point
spectrum
analysis
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61124827A
Other languages
English (en)
Inventor
小林 敦仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61124827A priority Critical patent/JPS62280800A/ja
Publication of JPS62280800A publication Critical patent/JPS62280800A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 〔概要〕 本発明は、臂声破裂子音相互及び無声破裂子音間相互を
識別する方式において、安定かつ確実に各々の子音の特
徴を捉えるため、音声分析により得られるとなりあう分
析フレーム間のケプストラム距離を演算し、スペクトル
変化の大きい時点即ち最もその子音の特徴が包含されて
いると考えられる時点を検出し、その時点における特徴
パラメータを抽出することにより、破裂子音の%aをに
定に捉えることが可能となり、高い識別率でM声働無声
破裂子音間相互ヲ識別でさるようにしたものである。
〔産業上の利用分野〕
本発明は、音声認識装置特に有声/無声破裂子音間相互
を識別する方式に関する。音声認識装置特に単音節認識
袋*は基本的に68個の単音節で丁ぺての日本語語量t
l−構底できることから、キーボード入力のかわりとし
て文章入力に用いることができ、音声ワードプロセッサ
として現在実用化がはかられている。しかし、単音節認
識においては、語頭の子音部の特徴の違いが大きな比重
をしめており、従来から単語認識で用いられている音声
分析方法ではその特徴を捉えきれず、認識藁が低いとい
う問題があり、実用化にはさらに多くの技術的!!題の
克服が要求されている。この中でも特に発声機構が非零
に似ている子音肝門相互の識別は雌しく、その高精度な
識別方式の確立が必要とされている。
〔従来の技術〕
従来の破裂子音識別方式としては、破裂時点直後の破裂
部スペクトルを特徴量として用いる方式や、破裂時点か
ら後続母音方向におけるスペクトル時系列を用いる方式
がある。
■ 破裂時点直後の破裂部スペクトルを用いる場合の構
成を第4図に示す。
図中、21はマイクロホン、22はA/D変換器、23
#″IA/Dデータメモリ、24は破裂時点検出部、2
5は周波数分析部、26は照合部、27は辞書メモリで
ある。
この方式は、破裂時点直後の破裂部スペクトルに識別に
有効な情報が存在するという考え万に基ライており、破
裂部近傍の1フレームのスペクトルを識別パラメータと
して破裂子音間相互の識別を行っている。
■ 破裂時点から後続母音方向におけるスペクトル時系
列を用いる方式の構成に基本的には第4図と同じである
が、25の周波数分析部では複数のスペクトル即ち時系
列情報が求まり、辞書メモ:J27には各子音のカテゴ
リ毎にスペクト/I/時系列が格納されることになる。
この方式では破裂時点から後続母音側への過渡領域(時
間変化)にも破裂子音間相互を識別する特徴が存在する
という考え方に基づいている。
〔発明が解決しようとする問題点〕
従来の有声/無声被装子音識別方式では、その識別パラ
メータとして、■破裂部近傍の17レームの破裂部スペ
クトルを用いるものや、■破裂時点から後続する母音へ
の過渡部特徴をスペクトル時系列で捉えて用いるものが
多い。
■では、破裂時点直後の破裂部のスペクトル形状に無声
破裂子音の特徴が存在するという立場から用いられてい
る識別パラメータであるが、静的な特徴であるとともに
、母音と異なり、基本的には雑音に近い破裂音を安定に
抽出することは困難であり、従って識別率も低い。
■では、破裂時点のスペクトルの他に後続母音への過渡
領域のスペクトルを付は加えたスペクトル時系列の形の
識別パラメータを用いる。しかし、一般的には破裂時点
、から母音側にある一定の分析周期で音声分析がなされ
るだけであり、各発声毎に変動すると考えられる破裂時
点から母音の立上りまでの時間(分析対象区間内に後続
する母音がどの程度含まれるか〕等の変動の影響を強く
受け、安定した分析結果が得られないという問題がある
〇〔問題点を解決するための手段〕 第1図は本発明の破裂子音識別方式の原理ブロック図で
ある。図中、1はマイクロホン、2はA/D変換器、3
はA/Dデータメモリ、4は音声分析部、5け特徴佃出
部、6はケグストラム距離演算回路、7はスペクトル変
化点検出回路、8はスペクトル分析回路、9は照合回路
、10は辞書メモリである。本発明ではマイクロホン1
から入力、変換され九破裂音音声信号に関して、ケプス
トラム分析を行い、となりあう分析フレーム間のケプス
トラム距離を演算し、その値に基づいてスペクトル変化
点を検出し、その各時点においてスペクトル分析回路8
 VCおいてスペクトル形状め、そAを識別パラメータ
としてg誠を行う。
〔作用〕
本発明の音声分析部4は、入力された音声信号をフレー
ム単位でケプストラム分析する。またスペクトル変化点
抽出回路7は前記フレーム間のケプストラム距離を演算
し、スペクトル変化の急峻な時点即ち、最も子音の特徴
を包含している時点を検出する。この検出された時点で
のスペクトルを識別パラメータとして抽出する。この結
果、安定して確実な特徴を捉えることが可能となる。
〔実施例〕
第2図は本発明の一実施例による破裂子音識別装置の構
成図である。
図中、1はマイクロホン、2flA/111器、3はA
/Dデータメモリ、4は音声分析部、5は特徴抽出部、
6はケプストラム距離演算回路、7はスペクトル変化点
検出回路、8はスペクトル分析回路、9は照合回路、1
0は辞書メモリ、11は窓処理回路、12はケグストラ
ム分析回路、13はF’F’T演算回路、14は対数パ
ワースペクトル演算回路、15は逆FFT演算回路、1
6はケプストラム時系列メモリである。
図中、マイクロホン1から入力された離散単音節(破裂
音)は2のA/D変換器によりアナログ/ディジタル変
換され、3のA/Dデータメモリに格納される。
3のメモリ内に格納された音声信号系列の先頭から一定
の分析周期でケグストラム分析回路う。
この処理はケグストラム分析回路12で行なわれる。
音声信号系列の先頭からある一定の分析周期で分析窓全
シフトさせ、11の窓処理回路において窓処理を行い、
次に13のFFTfi、u回路にてFFTによる周波数
分析全行う。そして14の対数パワースペクトル演算回
路にて13で寿られたスペクトルを対数パワースペクト
ル化し、さらにその対数パワースペクトルを15の逆F
FT演冥回路にて逆FFT処理してFFTケブストラム
ヲ得る。得られたFFTケプストラム時系列は16のケ
プストラム時系列メモリに一時格納される。
次に、このケプストラム時系列を対象に、となりあう分
析フレーム間のケプストラム距離を演算する。これは6
のケプストラム距離演算回路にて行なわれる。
ここでケプストラム距離は次式で定義する。
・ CtHtフレーム目、i次元目のケグストラム係数
である。
・ ケプストラム係数は低ケフレンシ側n個(CI−C
n )を用いるものとする0(1)式の定義に基づいて
、となりあうフレーム間のケプストラム距離を各々計算
する。その結果得られた系列をDとすると、次式が求め
られるOD ” dt r ds r ds + −−
dm第3図にケプストラム距離系列の一例を示す0次に
、このケプストラム距離を基にスペクトル変化の大きい
時点を検出する。
一般に、ケプストラム距離が大きい時点は被装時点付近
及び母音立上り付近であり、第3図のA。
B点の様に顕著なピークを持つ0この時点は知覚上重要
なポイントであるという笑我結果が得られている。
スペクトル変化点検出回路7では、ケプストラム距離が
最大となるピーク点及び次に大きいピーク点を検出する
次に、スペクトル分析回路8では、7で得られたスペク
トル変化の大きい2つの時点において周波数分析を行い
、スペクトルを得る。ここで、得られたスペクトル’I
: ’+ * h  とする。
9の照合回路では、予め標準パターンとして辞書メモリ
VC格納されている各子音のデータとのパターン間距離
を演算し、距離最小のカテゴリを識別結果とする。
〔発明の効果〕
本発明によれば、知覚上最も重要である2つの時点即ち
破裂時点及び母音の立上夛時点における特徴パラメータ
を安定かつ確実に抽出することができ、この結果有声/
無声破裂子音内相互の識別を高率で行うことが可能とな
る。
【図面の簡単な説明】
第1図は本発明の原理図、 第2因は不発明の一実施例の構成図、 第3図はケグヌトラム距離系列の一例を示す図、第4図
は従来技術を説明するブロック図である。 図中、1はマイクロホン、2はA/D変換器、3はA/
Dデータメモリ、4は音声分析部、5は特徴抽出部、6
はケグストラム距離演算回路、7はスペクトル変化点検
出回路、8はスペクトル分析回路、9は照合回路、1o
は辞書メモリである。 不繁朗の斥理国 簿1(!3 音チ値形 註 ケアストラム距難系列の一イダ1 21    22     23    24    
25     ム2′7

Claims (1)

  1. 【特許請求の範囲】 音声分析部(4)と特徴抽出部(5)を含み、有声破裂
    子音間相互および無声破裂子音間相互を識別する破裂子
    音識別装置において、 上記音声分析部(4)に、隣り合う分析フレーム間のケ
    プストラム距離を演算するケプストラム距離演算回路(
    6)を設け、 上記特徴抽出部(5)に、上記ケプストラム距離演算回
    路(6)にて得られたケプストラム距離を基にスペクト
    ル変化が大きい時点を検出するスペクトル変化点検出回
    路(7)を設け、 該スペクトル変化点検出回路(7)で検出された時点で
    の特徴パラメータを抽出し、該抽出された特徴パラメー
    タを基に識別処理を行なうように構成したことを特徴と
    する破裂子音識別方式。
JP61124827A 1986-05-30 1986-05-30 破裂子音識別方式 Pending JPS62280800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61124827A JPS62280800A (ja) 1986-05-30 1986-05-30 破裂子音識別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61124827A JPS62280800A (ja) 1986-05-30 1986-05-30 破裂子音識別方式

Publications (1)

Publication Number Publication Date
JPS62280800A true JPS62280800A (ja) 1987-12-05

Family

ID=14895083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61124827A Pending JPS62280800A (ja) 1986-05-30 1986-05-30 破裂子音識別方式

Country Status (1)

Country Link
JP (1) JPS62280800A (ja)

Similar Documents

Publication Publication Date Title
US6553342B1 (en) Tone based speech recognition
Rahman et al. Continuous bangla speech segmentation using short-term speech features extraction approaches
van Santen et al. High-accuracy automatic segmentation.
Sakran et al. A review: Automatic speech segmentation
Zolnay et al. Extraction methods of voicing feature for robust speech recognition.
JPS6138479B2 (ja)
Hasija et al. Recognition of children Punjabi speech using tonal non-tonal classifier
JPS5972500A (ja) 音声認識方式
JPS62280800A (ja) 破裂子音識別方式
Sharma Implementation of ZCR and STE techniques for the detection of the voiced and unvoiced signals in Continuous Punjabi Speech
JPS63161499A (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JP3049711B2 (ja) 音声処理装置
JPS63131196A (ja) 鼻子音識別装置
JPS59149400A (ja) 音声入力装置
JPH0254560B2 (ja)
JPS63191199A (ja) 有声破裂子音識別装置
JPS6225796A (ja) 音声認識装置
KI et al. Automatic Spotting of Plosives and Fricatives from Speech signals
JPS62191900A (ja) 無声破裂子音識別方式
JPS61180300A (ja) 音声認識装置
CN115019775A (zh) 一种基于音素的语种区分性特征的语种识别方法
JPS6011898A (ja) 音声認識装置
JPS6033599A (ja) 音声認識装置
JPH045699A (ja) 鼻音区間検出方式