JPS5923398A - 単音節音声認識装置 - Google Patents

単音節音声認識装置

Info

Publication number
JPS5923398A
JPS5923398A JP57133431A JP13343182A JPS5923398A JP S5923398 A JPS5923398 A JP S5923398A JP 57133431 A JP57133431 A JP 57133431A JP 13343182 A JP13343182 A JP 13343182A JP S5923398 A JPS5923398 A JP S5923398A
Authority
JP
Japan
Prior art keywords
speech
feature pattern
distance
monosyllabic
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57133431A
Other languages
English (en)
Other versions
JPH0412478B2 (ja
Inventor
樺澤 哲
英一 坪香
三船 義照
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57133431A priority Critical patent/JPS5923398A/ja
Publication of JPS5923398A publication Critical patent/JPS5923398A/ja
Publication of JPH0412478B2 publication Critical patent/JPH0412478B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声の認識を行なう単音節音声認識装置に関す
るものである。
従来より考案されている単音節音声認識装置は、入力音
声を子音部分と母音部分に区分し、各部分の時間的な中
央部の平均的特徴ノζターンを用いて入力音声を認識す
るように構成されている。しかし、子音部分のパターン
は時間的に非定常な場合が多いことは一般的によく知ら
れており、子音部分の識別に前述した平均的特徴・;タ
ーンを用いると、子音の非定常−な特徴が不明瞭になる
。そこで、特に子音部分の識別には、子音区間内の複数
フレームの特徴パターンを用いることが望ましい。なお
、フレームとは特徴ノくターンを発生するため1F−1
入力音声データを一定時間毎にサンプリンク′する際の
各サンプリング時点のことをいう。
一方、音声区間内の全フレームのもつ特徴パターンを用
いて入力音声の認識を行う装置も、従来から単音節音声
認識装置として考案されている。
このような装置は、前記の装置の欠点を補うことはでき
るが、母音部分に関しては比較的長時間(例えば、百数
十m5ec程度)に渡って特徴パターンが安定しており
、前記音声区間の全フレームの特徴パターンを用いて入
力音声の認識を行うことは、必要以上の時間を費す結果
となり、認識に要する時間を短縮するためにも、前述の
θ目く平均的特徴パターンを用いて認識を行うことが望
まし −い。
本発明は上記欠点に鑑み、単音節音声に対して先ず母音
部分と確信できる部分、即ち音声区間の語尾の数フレー
ム手前の数フレームに関して特徴パターンを平均して平
均的特徴パターンを求め、次に語頭から順次特徴パター
ンを求めて前記平均的特徴パターンとの距離を計算し、
前記距離が予め定めだ閾値よりも小さくなった時点、或
いは前記距離が前記閾値よりも小さくなるフレームが数
フレーム続いた時点、或いは前記距離が前記閾値よりも
小さくなるフレームが連続して数フレーム続いた時点で
、特徴パターンを求める分析を終了し、既に求められた
特徴パターンを用いて入力音声の認識を行うことにより
、認識に要する時間を短縮し、・・−ドウエアに要求さ
れる処理の高速化を軽減することのできる単音節音声認
識装置を提供するものである。
一以下、本発明の一実施例について図面を参照しながら
説明する。
第1図は本発明の一実施例における単音節音声認識装置
のブCff7り図である。
第1図において、1は音声区間検出部で、単音節音声入
力aの語頭と語尾に対応した時点を検出して、語頭及び
語尾検出信号を出力する。2は音声保持部奏で、音声区
間検出部1から送出された語頭検出信号を得だ時点から
語尾検出信号を得る時点までの間の単音節音声人力aの
データを保持する。3は平均的特徴パターン発生部で、
音声保持部2で保持されている音声データのうち、語尾
の検出時点よりも数フレーム(数サンプリング時点)手
前、例えば10フレーム手前の時点より、数フレーム分
(数サンプリング時点分)例えば5フレ一ム分の音声デ
ータに対して、一定時間毎にサンプリングして特徴パタ
ーンを求め、それらを平均して平均的特徴パターンを発
生して出力する、4は特徴パターン発生部で、音声保持
部2で保持されている音声データを、語頭から順次一定
時間毎にサンプリングして特徴パターンを発生して出力
する。5は特徴パターン保持部で、特徴パターン発生部
4の出力である特徴パターンを保持する、6は特徴パタ
ーン間距離計算部で、平均的特徴パターン発生部4から
送出された平均的特徴パターンと、特徴パターン発生部
4から送出された特徴パターンとの距離を計算し、求め
られた距離を出力する。7は閾値判定部で、特徴パター
ン間距離計算部6の出力である距離と予め定めた閾値と
を比較して大小判定を行い、距離が閾値よりも小さい時
、計数増加信号を出力する。8は計数部で、閾値判定部
の出力である計数増加信号を得る毎に計数値を1増加さ
せ、計数値が予め定めた値になった時点で、特徴パター
ン発生部3に特徴パターンの発生を終了させる特徴パタ
ーン発生終了信号を出力すると同時に、特徴パターン保
持部6に保持している特徴パターンを出力させる特徴パ
ターン出力命令信号を出力する。9は音声識別部で、特
徴パターン採持部5の出力を用いて入力音声の識別を行
い、単音節音声認識結果すを出力するっ以下、上記のよ
うに構成された装置の動作を具体的に説明する。
捷ず遮断周波数5KHzで低域a波された入力音声を標
本化周波数10KHzでA/D変換し、離散的信号につ
いて音声区間検出部1により、例えばエネルギーレベル
を用いて語頭を検出し、音声保持部2で誤頭に対応した
時点から離散信号の保持を開始し、音声区間検出部1に
より語尾を検出した時点で離散的信号の保持を終了する
。次に平均的特徴パターン発生部3では、例えば時間幅
12.8msθCのハミング窓を6.4m560ずつず
らしながら(この時、フレーム周期は6.4 m5el
c となる)音声保持部2で保持されでいる離散的信号
に付加するとともに、語尾から70.4m5130  
(語尾フレームから10フレーム)手前の時点から、語
尾から32111560手前の時点までの、5フレ一ム
分の離散的信号に関して14次のPARC:OR係数を
求めて、それらを平均して平均的特徴パターンを発生し
、特徴パターン間距離計算部6に出力する。
一方特徴パターン発生部4では、平均的特徴パターン発
生部3と同様に、例えば時間幅12゜5m5ecの前記
ハミング窓を6゜4 m5ecずつずらしながら、音声
保持部2で保持されている離散的信号に付加して、語頭
から順次前記PARCOR係数をフレーム周期6.4 
m5eoで発生し、特徴パターン保持部5と特徴パター
ン間距離計算部6に出力する。そして特徴パターン保持
部6では、 6.4 m5ec毎に特徴パターン発生部
4で発生される特徴パターンを保持する。一方特徴パタ
ーン間距離計算部らでは、平均的特徴パターンとしての
PARCOR係数とe、4m5ec毎に得られる特徴パ
ターンとしてのPARCOR係数との、例えばユークリ
ッド距離を閾値よシもユークリッド距離値が小さくなっ
た時、計数部Bの計数を1増加させる計数増加信号を出
力する。計数増加信号が印加されると計数部8では、例
えば計数値が5になった時、特徴パターン発生部4に特
徴パターン発生を終了させる特徴パターン発生終了信号
を出力すると同時に、特徴パターン保持部5で保持して
いる特徴パターンを音声識別部9に出力させる特徴パタ
ーン出力命令信号を特徴パターン保持部5に出力する。
音声識別部9では、この様にして得られた前記特徴パタ
ーンを用いて単音節音声入力色の識別を行い、単音節音
声認識結果すを出力することができる、第2図、第3図
及び第4図は、それぞれ「ア」、「す」、「夕」なる単
音節音声に関して、音声区間の前半部分と前記平均的特
徴パターンとのユークリッド距離を求めた計算結果であ
り、”FRAME:”は各音節に関するフレーム番号を
示し、 ”DIST”は前記ユークリッド距離値を示す
。まだこれらの図において、閾値を0.2とし、計数値
が5となった場合のフレームに下線を引いである。語頭
より下線を施しだフレームまて、即ち「ア」 (第2図
)の場合は語頭より5フレ一ム分、「す」 (第3図)
の場合は語頭より20フレ一ム分、「夕」(第4図)の
場合は語頭より15フレ一ム分を特徴パターンとするの
で、語頭から語尾寸での全フレームの特徴パターンとす
る場合に比べて、特徴パターンの計も少なく、シだがっ
て、装置に要求される記諺容量が少なくなるばかりでな
く、入力音声の識別に関する処理量が少なくなるので、
より短時間で認識結果を得ることができる。
第5図、第6図及び第7図は、それぞれ[ア」、「す」
、「夕」なる単音節音声に関して、閾値を0.2.計数
値を5とした場合の線形予測によるスペクトル包絡の時
間変化を表しだものであり、各音節の子音部分のスペク
トル的特徴及び母音部分のスペクトル的特徴が簡潔に杷
握できる。
以上のように本実施例によれば、単音節音声aの語頭か
ら特徴パターン発生部4により特徴・ぐターンを求める
とともに、単音節音声aの語尾から平均的特徴パターン
発生部3により平均的特徴・ζターンを求め、その後に
特徴・ζターンと平均的特徴パターンとの距離を特徴・
々ター/間距離計算部6により求め、閾値判定部子によ
り距離があらかじめ定められた閾値0.2よりも小さく
なるフレームが6回連続して続いた時点で特徴)ζター
ンを求める分析動作を終了し、特徴ノζターン保持部5
の特徴パターンから音声識別部9により音声の認識を行
なうことにより、短時間で音声認識を行なうことができ
る。
なお、本実施例では、計数値を5としたが、計数値を1
とする場合には第1図における計数部8は不要となり、
閾値判定部γからの出力信号で特徴パターン発生部4の
特徴・(ターン発生を終了させると共に、特徴・ζター
ン保持部5に保持している特徴パターンを出力させれば
良く、第8図の様なブロック構成としてもよい。
また本実施例では、特徴・ζターンとしてPARCOR
係数を用い、特徴パターン間距離の尺度として1−クリ
ノド距離を用いだが、特徴パターンとしては例えばフィ
ルタバンクの出力を用いるなど、入力音声の特徴を表現
しうるものであれば良く、また距離尺度も例えば市街距
離やco ah尺度など種々の距離尺度を用いた場合で
も有効である。
更に、閾値判定部7で特徴パターン間距離が閾値よりも
小さくない場合には、計数部8の計数値をクリアする計
数値クリア信号を、また閾値判定部7から計数部8に出
力して閾値判定部7で特徴パターン間距離が閾値よりも
小さい場合には計数部8の計数値を1増加させる計数値
増加信号を、閾値判定部7から計数部8に出力すること
とすれば、前記閾値よりも小さい前記パターン間距離の
フレームが前記計数値に対応したフレーム数だけ連続し
た時点までの特徴パターンを用いることにより、単音節
音声入力の識別を行うようにしてもよい。
以上のように本発明は子音部分の様に時間的に非定常な
特徴パターンを持つ部分では非定常部分の特徴パターン
をすべて得るとともに、母音部分の様に子音部分に比べ
て定常でしかも継続時間の長い部分については特徴パタ
ーンのすべてを求めないように構成することにより、特
徴パターンを発生させる分析時間を短縮できるだけでな
く、音声識別の認識時間も短縮でき、更に音声識別にお
いて識別に必髪な標準パターンの量も減少させることが
でき、装置に要求される処理の高速性を緩和させると同
時に記i音各量も少なくすることができ、その工業的価
値は犬なるものがある。
【図面の簡単な説明】
第1図は本発明の一実施例における単音節音声認識装置
のブロック図、第2図、第3図及び第4図は特徴パター
ンと平均的特徴パターンとのユークリッド距離の計算結
果を示した図、第5図、第6図及び第7図は線形予測に
よるスペクトル包絡の波形図、第8図は本発明の他の実
施例における単音節音声認識装置のブロック図である。 1・・・・・・音声保持部、2・・・・・・音声区間検
出部、3・・・・・平均的特徴パターン発生部、4・・
・・・・特徴パターン発生部、5・・・・・特徴パター
ン保持部、6・・・・・特徴パターン間距離計算部、7
・・・・・閾値判定部、8・・・・・泪数部、9・・・
・・・音声識別部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 3 第2図 九 丁    。 入力日f、/υl 第3図 入、t+i7’   ・ Isαl 第4図 入力111rlbcLl 第5図 BF:5utr = A 第7図 gEs(JLT = 、Tハ

Claims (1)

    【特許請求の範囲】
  1. 単音節音声区間を検出する音声区間検出手段と、検出さ
    れた単音節音声を保持する音声保持手段と、前記音声保
    持手段が保持している単音節音声から音声特徴パターン
    を発生する特徴パターン発生手段と、前記音声保持手段
    が保持している単音節音声から数フレーム分の特徴パタ
    ーンを平均して平均的特徴パターンを発生する平均的特
    徴パターン発生手段と、特徴パターン間の距離を計算す
    る計算手段と、前記距離を予め定めだ閾値と比較して大
    小判定する閾値判定手段と、前記距離が前記閾値よりも
    小さい際そのフレームの数を少なくとも1つ以上計数す
    る計数手段とを具備し、前記音声区間検出手段で検出さ
    れた単音節音声区間の語頭から、順次各フレームの特徴
    パターンと前記音声区間の語尾から数フレーム手前であ
    る定常部の数フレーム分の平均的特徴パターンとの距離
    を前記計算手段で計算し、前記閾値判定手段で前記互角
    1トが予め定めた閾値よりも小さくなるフレームを前記
    計数手段で計数し、計数値が予め定めた値に達する時点
    である定常部の始端部分までの%徴ノくターン系列を求
    める単音節音声認識装置。
JP57133431A 1982-07-29 1982-07-29 単音節音声認識装置 Granted JPS5923398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57133431A JPS5923398A (ja) 1982-07-29 1982-07-29 単音節音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57133431A JPS5923398A (ja) 1982-07-29 1982-07-29 単音節音声認識装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP3017534A Division JPH04211299A (ja) 1991-02-08 1991-02-08 単音節音声認識装置

Publications (2)

Publication Number Publication Date
JPS5923398A true JPS5923398A (ja) 1984-02-06
JPH0412478B2 JPH0412478B2 (ja) 1992-03-04

Family

ID=15104609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57133431A Granted JPS5923398A (ja) 1982-07-29 1982-07-29 単音節音声認識装置

Country Status (1)

Country Link
JP (1) JPS5923398A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04211299A (ja) * 1991-02-08 1992-08-03 Matsushita Electric Ind Co Ltd 単音節音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04211299A (ja) * 1991-02-08 1992-08-03 Matsushita Electric Ind Co Ltd 単音節音声認識装置

Also Published As

Publication number Publication date
JPH0412478B2 (ja) 1992-03-04

Similar Documents

Publication Publication Date Title
JPS5923398A (ja) 単音節音声認識装置
JPH04211299A (ja) 単音節音声認識装置
JP2666296B2 (ja) 音声認識装置
JPS59121099A (ja) 音声区間検出装置
JPS6060076B2 (ja) 音声認識装置
JP3031081B2 (ja) 音声認識装置
JPS597399A (ja) 単音節音声認識装置
JP2901976B2 (ja) パターン照合予備選択方式
JPS63259596A (ja) 音声区間検出方式
JPH0567039B2 (ja)
JPH03290700A (ja) 有音検出装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
Ruinskiy et al. An algorithm for accurate breath detection in speech and song signals
JPS5926797A (ja) 音声認識装置
JPS63257797A (ja) 音声始端検出装置
JPS6336679B2 (ja)
JPS63131196A (ja) 鼻子音識別装置
JPS6126099A (ja) 音声基本周波数抽出方法
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS60238898A (ja) 単音節認識方法
JPS5926796A (ja) 音声認識装置
JPS6363919B2 (ja)
JPS6039698A (ja) 音声認識方法
JPS61131000A (ja) 単音節音声認識方法
JPS62280800A (ja) 破裂子音識別方式