JPH0146078B2 - - Google Patents
Info
- Publication number
- JPH0146078B2 JPH0146078B2 JP58054386A JP5438683A JPH0146078B2 JP H0146078 B2 JPH0146078 B2 JP H0146078B2 JP 58054386 A JP58054386 A JP 58054386A JP 5438683 A JP5438683 A JP 5438683A JP H0146078 B2 JPH0146078 B2 JP H0146078B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- power
- parameters
- extraction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001228 spectrum Methods 0.000 claims description 8
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
Description
【発明の詳細な説明】
発明の技術分野
本発明は、音声認識用の特徴パラメータ(音声
パラメータ)の抽出方法に関する。
パラメータ)の抽出方法に関する。
従来技術と問題点
一般に音声を認識するには入力音声を多数の周
波数帯に区分する多数のバンドパスフイルタ
(BPF)に通し、各フイルタの出力を整流、積分
し、更にその対数をとつて特徴パラメータ群を作
り、同様な手法で予め得ておいた各種音声の特徴
パラメータ群と比較し、最も近い特徴パラメータ
群を選択してそれに対応する言葉を認識結果とし
て出力するという方法をとる。即ち周波数分析し
てそのスペクトル情報を音声の特徴パラメータと
する音声認識方式では、予め各音声の特徴パラメ
ータを作成、保存しておき、認識時には入力音声
の特徴パラメータを同様に抽出し、保存されてい
るものと比較し、同一もしくは最も類似している
特徴パラメータが見い出されたら、その音声の言
葉が入力されたと判断する。
波数帯に区分する多数のバンドパスフイルタ
(BPF)に通し、各フイルタの出力を整流、積分
し、更にその対数をとつて特徴パラメータ群を作
り、同様な手法で予め得ておいた各種音声の特徴
パラメータ群と比較し、最も近い特徴パラメータ
群を選択してそれに対応する言葉を認識結果とし
て出力するという方法をとる。即ち周波数分析し
てそのスペクトル情報を音声の特徴パラメータと
する音声認識方式では、予め各音声の特徴パラメ
ータを作成、保存しておき、認識時には入力音声
の特徴パラメータを同様に抽出し、保存されてい
るものと比較し、同一もしくは最も類似している
特徴パラメータが見い出されたら、その音声の言
葉が入力されたと判断する。
この場合、入力音声のパワーは大きな又は小さ
な声で話した、マイクから離して又は接近して話
した等によりその都度変動することが予測される
ので、通常はこのパワー変動が認識結果に影響を
与えないように音声(特徴)パラメータを正規化
する。例えば認識対象とする入力音声をNチヤネ
ルのバンドパスフイルタを通して分析する場合に
は、各特徴パラメータから、入力音声の全帯域電
力を1/Nした平均値を差引いて正規化する。
な声で話した、マイクから離して又は接近して話
した等によりその都度変動することが予測される
ので、通常はこのパワー変動が認識結果に影響を
与えないように音声(特徴)パラメータを正規化
する。例えば認識対象とする入力音声をNチヤネ
ルのバンドパスフイルタを通して分析する場合に
は、各特徴パラメータから、入力音声の全帯域電
力を1/Nした平均値を差引いて正規化する。
ところが、このように各特徴パラメータから入
力音声の全帯域電力(パワー)の平均値を引いて
しまうと全くパワー情報が残らなくなるので、パ
ワーの大小で区別すると都合のよい母音(パワー
大)と子音(パワー小)の認識率が低下するなど
の問題が生じる。
力音声の全帯域電力(パワー)の平均値を引いて
しまうと全くパワー情報が残らなくなるので、パ
ワーの大小で区別すると都合のよい母音(パワー
大)と子音(パワー小)の認識率が低下するなど
の問題が生じる。
発明の目的
本発明は、発声パワーに左右されないように音
声パラメータを正規化する際に、パワー情報の一
部を残すことによつて母音と子音の認識率を向上
などを図ろうとするものである。
声パラメータを正規化する際に、パワー情報の一
部を残すことによつて母音と子音の認識率を向上
などを図ろうとするものである。
発明の構成
音声周波数分析し、そのスペクトル情報を音声
の特徴パラメータとする音声パラメータ抽出方法
に於て、該スペクトル情報の全帯域電力の0より
大きい1未満のベキ乗を用いて該スペクトル情報
を正規化することによつて、得られる音声パラメ
ータにパワー情報を付加することを特徴とする
が、以下図示の実施例を参照しながらこれを詳細
に説明する。
の特徴パラメータとする音声パラメータ抽出方法
に於て、該スペクトル情報の全帯域電力の0より
大きい1未満のベキ乗を用いて該スペクトル情報
を正規化することによつて、得られる音声パラメ
ータにパワー情報を付加することを特徴とする
が、以下図示の実施例を参照しながらこれを詳細
に説明する。
発明の実施例
図面は本発明の一実施例を示すブロツク図で、
11〜1Nは入力音声を周波数分析するNチヤネ
ルのバンドパスフイルタ(BPF)、21〜2Nは
それらの出力を整流して積分するN個の整流積分
回路である。これらの出力(スペクトル情報)
P′1〜P′Nはそのままでも音声パラメータの形態を
とるが、本例では対数変換回路31〜3Nでこれ
を対数P1〜PN(=logP′1〜logP′N)に変換する。
そして、減算器41〜4Nによつて出力P1〜PN
から平均値AV=1/NΣPiを差し引いた値X1〜XN (=P1−AV〜PN−AV)を最終的な音声パラメー
タとして認識部5に与えるが、本発明ではこの平
均値AVを次の様にして変更する。
11〜1Nは入力音声を周波数分析するNチヤネ
ルのバンドパスフイルタ(BPF)、21〜2Nは
それらの出力を整流して積分するN個の整流積分
回路である。これらの出力(スペクトル情報)
P′1〜P′Nはそのままでも音声パラメータの形態を
とるが、本例では対数変換回路31〜3Nでこれ
を対数P1〜PN(=logP′1〜logP′N)に変換する。
そして、減算器41〜4Nによつて出力P1〜PN
から平均値AV=1/NΣPiを差し引いた値X1〜XN (=P1−AV〜PN−AV)を最終的な音声パラメー
タとして認識部5に与えるが、本発明ではこの平
均値AVを次の様にして変更する。
先ず加算回路6で全ての音声パラメータP1〜
PNを加算する点は従来と同様であるが、図示の
例ではこれを平均化する際に1/Nではない定数
Cを用いる。7は該定数Cを与える定数部、8は
加算値ΣPiに定数Cを乗じて平均値AVを求める
乗算部である。
PNを加算する点は従来と同様であるが、図示の
例ではこれを平均化する際に1/Nではない定数
Cを用いる。7は該定数Cを与える定数部、8は
加算値ΣPiに定数Cを乗じて平均値AVを求める
乗算部である。
従来は定数Cの代りに1/Nが用いられたの
で、 Xi=(n)logP′i(n)−AV(n) …(1) AV(n)=1/NN 〓i=1 Pi(n) …(2) 但しi=1,2,……N であつたが、本例によると Xi(n)=logP′i(n)−AV′(n) …(3) AV′(n)=CN 〓i=1 Pi(x) …(4) (但しC≠1/N) となる。一例を挙げるとN=16のとき、C=1/
20に設定する。このようにすれば不充分な平均値
の差引きとなつて個々のパラメータX1〜Xnにパ
ワー情報の一部が付加される(残る)。
で、 Xi=(n)logP′i(n)−AV(n) …(1) AV(n)=1/NN 〓i=1 Pi(n) …(2) 但しi=1,2,……N であつたが、本例によると Xi(n)=logP′i(n)−AV′(n) …(3) AV′(n)=CN 〓i=1 Pi(x) …(4) (但しC≠1/N) となる。一例を挙げるとN=16のとき、C=1/
20に設定する。このようにすれば不充分な平均値
の差引きとなつて個々のパラメータX1〜Xnにパ
ワー情報の一部が付加される(残る)。
尚、対数変換回路31〜3Nを省略する、従つ
て積分回路21〜2Nの出力P′1〜P′Nを直接除算
器41〜4N(減算器を除算器にする)及び加算
回路6へ入力する場合は、全帯域電力Pwのベキ
乗Pwaを平均値AVの代りに用いる。つまり、 Pw(n)=N 〓i=1 P′i(n) …(5) Xi(n)=P′i(n)/Pwa(n) …(6) とする。従来方式ではa=1であるが本発明では
例えばa=0.5とする。このようにするとやはり
不充分な平均パワーの除去となり、パワーの一部
が残つて母音、子音の識別などに有効である。定
数C,aは1より小さく、0より大きくし、これ
で不充分な平均パワーの除去を行なう。
て積分回路21〜2Nの出力P′1〜P′Nを直接除算
器41〜4N(減算器を除算器にする)及び加算
回路6へ入力する場合は、全帯域電力Pwのベキ
乗Pwaを平均値AVの代りに用いる。つまり、 Pw(n)=N 〓i=1 P′i(n) …(5) Xi(n)=P′i(n)/Pwa(n) …(6) とする。従来方式ではa=1であるが本発明では
例えばa=0.5とする。このようにするとやはり
不充分な平均パワーの除去となり、パワーの一部
が残つて母音、子音の識別などに有効である。定
数C,aは1より小さく、0より大きくし、これ
で不充分な平均パワーの除去を行なう。
発明の効果
以上述べたように本発明によれば、音声パラメ
ータにパワー情報が一部付加されているので、音
声パワーの変動に対して認識率を低下させず、し
かも母音と子音との誤認識を防止できる利点があ
る。また平均値差引きでベース分を除去したりす
るのでパラメータ量の節減にもつながる。
ータにパワー情報が一部付加されているので、音
声パワーの変動に対して認識率を低下させず、し
かも母音と子音との誤認識を防止できる利点があ
る。また平均値差引きでベース分を除去したりす
るのでパラメータ量の節減にもつながる。
図面は本発明の一実施例を示すブロツク図であ
る。 図中、11〜1Nは周波数分析用のフイルタ、
21〜2Nはスペクトル情報を抽出する整流積分
回路、31〜3Nは対数変換回路、41〜4Nは
正規化用の減算器、6は全帯域電力の加算回路、
6は定数部、7は平均値を求める乗算部である。
る。 図中、11〜1Nは周波数分析用のフイルタ、
21〜2Nはスペクトル情報を抽出する整流積分
回路、31〜3Nは対数変換回路、41〜4Nは
正規化用の減算器、6は全帯域電力の加算回路、
6は定数部、7は平均値を求める乗算部である。
Claims (1)
- 【特許請求の範囲】 1 音声周波数分析し、そのスペクトル情報を音
声の特徴パラメータとする音声パラメータ抽出方
法に於て、該スペクトル情報の全帯域電力の0よ
り大きい1未満のベキ乗を用いて該スペクトル情
報を正規化することによつて、得られる音声パラ
メータにパワー情報を付加することを特徴とする
音声パラメータ抽出方法。 2 音声周波数分析し、そのスペクトル情報を音
声の特徴パラメータとする音声パラメータ抽出方
法に於て、該スペクトル情報を対数変換した後、
該スペクトル情報の平均値に0より大きく1より
小さい一定係数を乗じた値を各スペクトル情報の
対数値から減じて該スペクトル情報を正規化する
ことによつて、得られる音声パラメータにパワー
情報を付加することを特徴とする音声パラメータ
抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58054386A JPS59178500A (ja) | 1983-03-30 | 1983-03-30 | 音声パラメータ抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58054386A JPS59178500A (ja) | 1983-03-30 | 1983-03-30 | 音声パラメータ抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59178500A JPS59178500A (ja) | 1984-10-09 |
JPH0146078B2 true JPH0146078B2 (ja) | 1989-10-05 |
Family
ID=12969241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58054386A Granted JPS59178500A (ja) | 1983-03-30 | 1983-03-30 | 音声パラメータ抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59178500A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS565597A (en) * | 1979-06-26 | 1981-01-21 | Sanyo Electric Co | Voice identifier |
JPS57158699A (en) * | 1981-03-25 | 1982-09-30 | Oki Electric Ind Co Ltd | Recognition starting point specification for voice typewriter |
-
1983
- 1983-03-30 JP JP58054386A patent/JPS59178500A/ja active Granted
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS565597A (en) * | 1979-06-26 | 1981-01-21 | Sanyo Electric Co | Voice identifier |
JPS57158699A (en) * | 1981-03-25 | 1982-09-30 | Oki Electric Ind Co Ltd | Recognition starting point specification for voice typewriter |
Also Published As
Publication number | Publication date |
---|---|
JPS59178500A (ja) | 1984-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0077558B1 (en) | Method and apparatus for speech recognition and reproduction | |
US7711123B2 (en) | Segmenting audio signals into auditory events | |
JPH0146078B2 (ja) | ||
US5692103A (en) | Method of speech recognition with learning | |
JP2992324B2 (ja) | 音声区間検出方法 | |
JP2642694B2 (ja) | 雑音除去方法 | |
JPH0461359B2 (ja) | ||
JPS59123897A (ja) | 音声認識装置 | |
JPH0146079B2 (ja) | ||
JP3298658B2 (ja) | 音声認識方式 | |
JPS6229798B2 (ja) | ||
JPS61206000A (ja) | 音声認識装置 | |
JPS61228500A (ja) | 音声認識方法 | |
Golibersuch | Automatic prediction of linear frequency warp for speech recognition | |
JPS62113197A (ja) | 音声認識装置 | |
JPS59172695A (ja) | 音声パラメ−タ抽出方式 | |
JPS625298A (ja) | 音声認識装置 | |
JPS61230199A (ja) | 音声認識方法 | |
JPS63223696A (ja) | 音声パタ−ン作成方式 | |
JPS6334477B2 (ja) | ||
JPS625299A (ja) | 音声認識装置 | |
JP3002200B2 (ja) | 音声認識 | |
JPH0558560B2 (ja) | ||
Ueda et al. | Critical-band filter analysis of speech sentences | |
JPS6057397A (ja) | 正規化方法 |