JPS59178500A - 音声パラメータ抽出方法 - Google Patents

音声パラメータ抽出方法

Info

Publication number
JPS59178500A
JPS59178500A JP58054386A JP5438683A JPS59178500A JP S59178500 A JPS59178500 A JP S59178500A JP 58054386 A JP58054386 A JP 58054386A JP 5438683 A JP5438683 A JP 5438683A JP S59178500 A JPS59178500 A JP S59178500A
Authority
JP
Japan
Prior art keywords
power
parameter extraction
information
value
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58054386A
Other languages
English (en)
Other versions
JPH0146078B2 (ja
Inventor
佐藤 泰雄
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58054386A priority Critical patent/JPS59178500A/ja
Publication of JPS59178500A publication Critical patent/JPS59178500A/ja
Publication of JPH0146078B2 publication Critical patent/JPH0146078B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、音声認識用の特徴パラメータ(音声パラメー
タ)の抽出方法に関する。
従来技術と問題点 一般に音声を認識するには入力音声を多数の周波数帯に
区分する多数のバンドパスフィルタ(、BPF)に通し
、各フィルタの出力を整流、積分し、更にその対数をと
って特徴パラメータ群を作り、同様な手法で予め得てお
いた各種音声の特徴パラメータ群と比較し、最も近い特
徴バラメーク群を選択してそれに対応する言葉を認識結
果として出力するという方法をとる。即ち周波数分析し
てそのスペクトル情報を音声の特徴パラメータとする音
声認識方式では、予め各音声の特徴パラメータを作成、
保存しておき、認識時には入力音声の特徴パラメータを
同様に抽出し、保存されているものと比較し、同一もし
くは最も頬僚している特徴パラメータが見い出されたら
、その音声の言葉が入力されたと判断する。
この場合、入力音声のパワーは大きな又は小さな声で話
した、マイクから離して又は接近して話゛した等により
その都度変動することが予測されるので、通常はこのパ
ワー変動が認識結果に影響を与えないように音声(特徴
)パラメータを正規化する。例えば認識対象とする入力
音声をNチャネルのバンドパスフィルタを通して分析す
る場合番こは、各特徴パラメータから、入力音声の全帯
域電力を1/Nした平均値を差引いて正規化する。
ところが、このように各特徴パラメータから入力音声の
全帯域電力(パワー)の平均値を引し)でしまうと全く
パワー情報が残らなくなるので、ノ寸ワーの大小で区別
すると都合のよむ1母音()ぐワー大)と子音(パワー
小)の認識率が低下するなどの問題が生じる。
発明の目的 本発明は、発声パワーに左右されないように音声パラメ
ータを正規化する際に、パワー情報の一部を残すことに
よって母音と子音の認識率を向上などを図ろうとするも
のである。
本発明は、音声周波数分析し、そのスペクトル情報を音
声の特徴パラメータとする音声パラメータ抽出方式に於
て、該スペクトル情報の全帯域電力またはその平均値以
外の値に変換した値を用いて該スペクトル情報を正規化
することによって、得られる音声パラメータにパワー情
報を付加することを特徴とするが、以下図示の実施例を
参照しながらこれを詳細に説明する。
発明の実施例 図面は本発明の一実施例を示すブロック図で、11〜I
Nは入力音声を周波数分析するNチャネルのバンドパス
フィルタ(BPF) 、21〜2Nはそれらの出力を整
流して積分するN11Iの整流積分回路である。これら
の出力(スペクトル情報)P′1〜P′Nはそのままで
も音声パラメータの形態をとるが、本例では対数変換回
路31〜3Nでこれを対数P l 〜PN  (=  
IogP’t 〜logP’N)に変換する。そして、
減算器41〜4Nによって出力PI〜pNから平均値A
 V ” NΣP1を差し引いた値X I=XN (=
P +  AV〜P)g、AV)を最終的な音声パラメ
ータとして認識部5に与えるが、本発明ではこの平均値
AVを次の様にして変更する。
先ず加算回路6で全ての音声パラメータP1〜pNを加
算する点は従来と同様であるが、図示の例ではこれを平
均化する際に1/Nではない定数Cを用いる。7は該定
数Cを与える定数部、8は加算値ΣPiに定数Cを乗じ
て平均値AVを求める乗算部である。
従来は定数Cの代りに1/Nが用いられたので、Xl(
n) = 1ogP’i[n) −A V in)  
      −・= fl)但しi=1.2.・・・・
・・N であったが、本例によると Xl(rl = IogP 1(nl −A V (n
)        ・・・−+31AV’(1) ” 
 C、Z  P 1(x)             
      −・ (4)1=1 (但しC\1/N) となる。−例を挙げるとN−16のとき、C=−1/2
0に設定する。このようにすれば不充分な平均値の差引
きとなって個々のパラメータX1〜Xnにパワー情報の
一部が付加される(残る)。
尚、対数変換回路31〜3Nを省略する、従って積分回
路21〜2Nの出力P’+〜P′Nを直接除(減算器を
4除算器にする)及び加 算回路6へ入力する場合は、全帯域電力pwのベキ乗p
 Waを平均値AVの代りに用いる。つまり、とする。
従来方式ではa=1であるが本発明では例えばa = 
0.5とする。こ、のようにするとやはり不充分な平均
パワーの除去となり、パワーの一部が残って母音、子音
の識別など、に自効である。
発明の効果 以上述べたように本発明によれば、音声パラメータにパ
ワー情報が一部付加されてい−るので、音声パワーの変
動に対してt@識率を低下させず、しかも母音と子音と
の誤認識を防止できる利点がある。
また平均値差引きでベース分を除去したりするのでパラ
メータ量の節減、にもつながる。
【図面の簡単な説明】
図面は本発明の一実施例を示すブロック図である。 図中、II〜INは周波数分析用のフィルタ、21〜2
Nはスペクトル情報を抽出する整流積分回路、31〜3
Nは対数変換回路、41〜4Nは正規化用の減算器、6
は全帯域電力の加算回路、6゛は定数部、7は平均値を
求める乗算部である。 出願人 富士通株式会社

Claims (1)

  1. 【特許請求の範囲】 (11音声周波数分析し、そのスペクトル情報を音声の
    特徴パラメータとする音声パラメータ抽出方式に於て、
    該スペクトル情報の全帯域電力またはその平均値以外の
    値に変換した値を用いて該スペクトル情報を正規化する
    ことによって、得られる音声パラメータにパワー情報を
    付加することを特徴とする音声パラメータ抽出方式。 (2)スペクトル情報を対数変換した後、その平均値に
    一定係数を乗じた値を各スペクトル情報の対数値から除
    することによって正規化することを特徴とする特許請求
    の範囲第1項記載の音声パラメータ抽出方式。 (3)スペクトル情報を正規化する際にその全帯域電力
    の1以外のヘキ乗を用いることを特徴とする特許請求の
    範囲第1項記載の音声パラメータ抽出方式。
JP58054386A 1983-03-30 1983-03-30 音声パラメータ抽出方法 Granted JPS59178500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58054386A JPS59178500A (ja) 1983-03-30 1983-03-30 音声パラメータ抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58054386A JPS59178500A (ja) 1983-03-30 1983-03-30 音声パラメータ抽出方法

Publications (2)

Publication Number Publication Date
JPS59178500A true JPS59178500A (ja) 1984-10-09
JPH0146078B2 JPH0146078B2 (ja) 1989-10-05

Family

ID=12969241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58054386A Granted JPS59178500A (ja) 1983-03-30 1983-03-30 音声パラメータ抽出方法

Country Status (1)

Country Link
JP (1) JPS59178500A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS565597A (en) * 1979-06-26 1981-01-21 Sanyo Electric Co Voice identifier
JPS57158699A (en) * 1981-03-25 1982-09-30 Oki Electric Ind Co Ltd Recognition starting point specification for voice typewriter

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS565597A (en) * 1979-06-26 1981-01-21 Sanyo Electric Co Voice identifier
JPS57158699A (en) * 1981-03-25 1982-09-30 Oki Electric Ind Co Ltd Recognition starting point specification for voice typewriter

Also Published As

Publication number Publication date
JPH0146078B2 (ja) 1989-10-05

Similar Documents

Publication Publication Date Title
EP0077558B1 (en) Method and apparatus for speech recognition and reproduction
EP0182989B1 (en) Normalization of speech signals
JPS6152479B2 (ja)
JPS59178500A (ja) 音声パラメータ抽出方法
JP2992324B2 (ja) 音声区間検出方法
Sharma et al. Emotion Recognition based on audio signal using GFCC Extraction and BPNN Classification
JP3298658B2 (ja) 音声認識方式
JPS59123897A (ja) 音声認識装置
JPS61228500A (ja) 音声認識方法
JPS6229798B2 (ja)
JPH0461359B2 (ja)
JPS61230199A (ja) 音声認識方法
TW504666B (en) Speech recognition method
JPS6057397A (ja) 正規化方法
JPS63223696A (ja) 音声パタ−ン作成方式
JP3002200B2 (ja) 音声認識
JPH0146079B2 (ja)
JPS58176698A (ja) パターンマッチング装置
JPS59172695A (ja) 音声パラメ−タ抽出方式
JPS6350897A (ja) 音声認識装置
JP2000250599A (ja) 音響特徴抽出方法及び装置
JPS6057398A (ja) 正規化方法
JPS62172400A (ja) 音声認識装置
JPS63262695A (ja) 音声認識方式
JPS59231599A (ja) 音声認識方法