JPS62280800A

JPS62280800A - 破裂子音識別方式

Info

Publication number: JPS62280800A
Application number: JP61124827A
Authority: JP
Inventors: 小林　敦仁
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1986-05-30
Filing date: 1986-05-30
Publication date: 1987-12-05

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】３、発明の詳細な説明〔概要〕本発明は、臂声破裂子音相互及び無声破裂子音間相互を
識別する方式において、安定かつ確実に各々の子音の特
徴を捉えるため、音声分析により得られるとなりあう分
析フレーム間のケプストラム距離を演算し、スペクトル
変化の大きい時点即ち最もその子音の特徴が包含されて
いると考えられる時点を検出し、その時点における特徴
パラメータを抽出することにより、破裂子音の％ａをに
定に捉えることが可能となり、高い識別率でＭ声働無声
破裂子音間相互ヲ識別でさるようにしたものである。

〔産業上の利用分野〕

本発明は、音声認識装置特に有声／無声破裂子音間相互
を識別する方式に関する。音声認識装置特に単音節認識
袋＊は基本的に６８個の単音節で丁ぺての日本語語量ｔ
ｌ−構底できることから、キーボード入力のかわりとし
て文章入力に用いることができ、音声ワードプロセッサ
として現在実用化がはかられている。しかし、単音節認
識においては、語頭の子音部の特徴の違いが大きな比重
をしめており、従来から単語認識で用いられている音声
分析方法ではその特徴を捉えきれず、認識藁が低いとい
う問題があり、実用化にはさらに多くの技術的！！題の
克服が要求されている。この中でも特に発声機構が非零
に似ている子音肝門相互の識別は雌しく、その高精度な
識別方式の確立が必要とされている。

〔従来の技術〕

従来の破裂子音識別方式としては、破裂時点直後の破裂
部スペクトルを特徴量として用いる方式や、破裂時点か
ら後続母音方向におけるスペクトル時系列を用いる方式
がある。

■　破裂時点直後の破裂部スペクトルを用いる場合の構
成を第４図に示す。

図中、２１はマイクロホン、２２はＡ／Ｄ変換器、２３
＃″ＩＡ／Ｄデータメモリ、２４は破裂時点検出部、２
５は周波数分析部、２６は照合部、２７は辞書メモリで
ある。

この方式は、破裂時点直後の破裂部スペクトルに識別に
有効な情報が存在するという考え万に基ライており、破
裂部近傍の１フレームのスペクトルを識別パラメータと
して破裂子音間相互の識別を行っている。

■　破裂時点から後続母音方向におけるスペクトル時系
列を用いる方式の構成に基本的には第４図と同じである
が、２５の周波数分析部では複数のスペクトル即ち時系
列情報が求まり、辞書メモ：Ｊ２７には各子音のカテゴ
リ毎にスペクト／Ｉ／時系列が格納されることになる。

この方式では破裂時点から後続母音側への過渡領域（時
間変化）にも破裂子音間相互を識別する特徴が存在する
という考え方に基づいている。

〔発明が解決しようとする問題点〕

従来の有声／無声被装子音識別方式では、その識別パラ
メータとして、■破裂部近傍の１７レームの破裂部スペ
クトルを用いるものや、■破裂時点から後続する母音へ
の過渡部特徴をスペクトル時系列で捉えて用いるものが
多い。

■では、破裂時点直後の破裂部のスペクトル形状に無声
破裂子音の特徴が存在するという立場から用いられてい
る識別パラメータであるが、静的な特徴であるとともに
、母音と異なり、基本的には雑音に近い破裂音を安定に
抽出することは困難であり、従って識別率も低い。

■では、破裂時点のスペクトルの他に後続母音への過渡
領域のスペクトルを付は加えたスペクトル時系列の形の
識別パラメータを用いる。しかし、一般的には破裂時点
、から母音側にある一定の分析周期で音声分析がなされ
るだけであり、各発声毎に変動すると考えられる破裂時
点から母音の立上りまでの時間（分析対象区間内に後続
する母音がどの程度含まれるか〕等の変動の影響を強く
受け、安定した分析結果が得られないという問題がある
〇〔問題点を解決するための手段〕第１図は本発明の破裂子音識別方式の原理ブロック図で
ある。図中、１はマイクロホン、２はＡ／Ｄ変換器、３
はＡ／Ｄデータメモリ、４は音声分析部、５け特徴佃出
部、６はケグストラム距離演算回路、７はスペクトル変
化点検出回路、８はスペクトル分析回路、９は照合回路
、１０は辞書メモリである。本発明ではマイクロホン１
から入力、変換され九破裂音音声信号に関して、ケプス
トラム分析を行い、となりあう分析フレーム間のケプス
トラム距離を演算し、その値に基づいてスペクトル変化
点を検出し、その各時点においてスペクトル分析回路８
　ＶＣおいてスペクトル形状め、そＡを識別パラメータ
としてｇ誠を行う。

〔作用〕

本発明の音声分析部４は、入力された音声信号をフレー
ム単位でケプストラム分析する。またスペクトル変化点
抽出回路７は前記フレーム間のケプストラム距離を演算
し、スペクトル変化の急峻な時点即ち、最も子音の特徴
を包含している時点を検出する。この検出された時点で
のスペクトルを識別パラメータとして抽出する。この結
果、安定して確実な特徴を捉えることが可能となる。

〔実施例〕

第２図は本発明の一実施例による破裂子音識別装置の構
成図である。

図中、１はマイクロホン、２ｆｌＡ／１１１器、３はＡ
／Ｄデータメモリ、４は音声分析部、５は特徴抽出部、
６はケプストラム距離演算回路、７はスペクトル変化点
検出回路、８はスペクトル分析回路、９は照合回路、１
０は辞書メモリ、１１は窓処理回路、１２はケグストラ
ム分析回路、１３はＦ’Ｆ’Ｔ演算回路、１４は対数パ
ワースペクトル演算回路、１５は逆ＦＦＴ演算回路、１
６はケプストラム時系列メモリである。

図中、マイクロホン１から入力された離散単音節（破裂
音）は２のＡ／Ｄ変換器によりアナログ／ディジタル変
換され、３のＡ／Ｄデータメモリに格納される。

３のメモリ内に格納された音声信号系列の先頭から一定
の分析周期でケグストラム分析回路う。

この処理はケグストラム分析回路１２で行なわれる。

音声信号系列の先頭からある一定の分析周期で分析窓全
シフトさせ、１１の窓処理回路において窓処理を行い、
次に１３のＦＦＴｆｉ、ｕ回路にてＦＦＴによる周波数
分析全行う。そして１４の対数パワースペクトル演算回
路にて１３で寿られたスペクトルを対数パワースペクト
ル化し、さらにその対数パワースペクトルを１５の逆Ｆ
ＦＴ演冥回路にて逆ＦＦＴ処理してＦＦＴケブストラム
ヲ得る。得られたＦＦＴケプストラム時系列は１６のケ
プストラム時系列メモリに一時格納される。

次に、このケプストラム時系列を対象に、となりあう分
析フレーム間のケプストラム距離を演算する。これは６
のケプストラム距離演算回路にて行なわれる。

ここでケプストラム距離は次式で定義する。

・　ＣｔＨｔフレーム目、ｉ次元目のケグストラム係数
である。

・　ケプストラム係数は低ケフレンシ側ｎ個（ＣＩ−Ｃ
ｎ　）を用いるものとする０（１）式の定義に基づいて
、となりあうフレーム間のケプストラム距離を各々計算
する。その結果得られた系列をＤとすると、次式が求め
られるＯＤ　”　ｄｔ　ｒ　ｄｓ　ｒ　ｄｓ　＋　−−
ｄｍ第３図にケプストラム距離系列の一例を示す０次に
、このケプストラム距離を基にスペクトル変化の大きい
時点を検出する。

一般に、ケプストラム距離が大きい時点は被装時点付近
及び母音立上り付近であり、第３図のＡ。

Ｂ点の様に顕著なピークを持つ０この時点は知覚上重要
なポイントであるという笑我結果が得られている。

スペクトル変化点検出回路７では、ケプストラム距離が
最大となるピーク点及び次に大きいピーク点を検出する
。

次に、スペクトル分析回路８では、７で得られたスペク
トル変化の大きい２つの時点において周波数分析を行い
、スペクトルを得る。ここで、得られたスペクトル’Ｉ
：　’＋　＊　ｈ　　とする。

９の照合回路では、予め標準パターンとして辞書メモリ
ＶＣ格納されている各子音のデータとのパターン間距離
を演算し、距離最小のカテゴリを識別結果とする。

〔発明の効果〕

本発明によれば、知覚上最も重要である２つの時点即ち
破裂時点及び母音の立上夛時点における特徴パラメータ
を安定かつ確実に抽出することができ、この結果有声／
無声破裂子音内相互の識別を高率で行うことが可能とな
る。

【図面の簡単な説明】

第１図は本発明の原理図、第２因は不発明の一実施例の構成図、第３図はケグヌトラム距離系列の一例を示す図、第４図
は従来技術を説明するブロック図である。図中、１はマイクロホン、２はＡ／Ｄ変換器、３はＡ／
Ｄデータメモリ、４は音声分析部、５は特徴抽出部、６
はケグストラム距離演算回路、７はスペクトル変化点検
出回路、８はスペクトル分析回路、９は照合回路、１ｏ
は辞書メモリである。不繁朗の斥理国簿１（！３音チ値形註ケアストラム距難系列の一イダ１２１　　　　２２　　　　　２３　　　　２４　　　　
２５　　　　　ム２′７

Claims

【特許請求の範囲】音声分析部（４）と特徴抽出部（５）を含み、有声破裂
子音間相互および無声破裂子音間相互を識別する破裂子
音識別装置において、上記音声分析部（４）に、隣り合う分析フレーム間のケ
プストラム距離を演算するケプストラム距離演算回路（
６）を設け、上記特徴抽出部（５）に、上記ケプストラム距離演算回
路（６）にて得られたケプストラム距離を基にスペクト
ル変化が大きい時点を検出するスペクトル変化点検出回
路（７）を設け、該スペクトル変化点検出回路（７）で検出された時点で
の特徴パラメータを抽出し、該抽出された特徴パラメー
タを基に識別処理を行なうように構成したことを特徴と
する破裂子音識別方式。