JPS6048100A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6048100A
JPS6048100A JP15659883A JP15659883A JPS6048100A JP S6048100 A JPS6048100 A JP S6048100A JP 15659883 A JP15659883 A JP 15659883A JP 15659883 A JP15659883 A JP 15659883A JP S6048100 A JPS6048100 A JP S6048100A
Authority
JP
Japan
Prior art keywords
standard
segment
envelope
input
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP15659883A
Other languages
English (en)
Inventor
相良 良二
文雄 前原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP15659883A priority Critical patent/JPS6048100A/ja
Publication of JPS6048100A publication Critical patent/JPS6048100A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、予め登録しである音声の標準パターンを用い
て入力音声を認識する音声認識装置に関する。
従来例の構成とその問題点 近年、人間−機械系の入力手段として音声が注目を集め
ており、各種の音声認識装置が商品化されている。この
様な音声認識装置には単語単位の認識を行なうものと、
単音節単位の認識を行なうものとがあり、いずれの場合
でも語頭や七グメント境界の検出手段の精度が認識率に
大きく影響を及ぼし、音声入力装置の使い易さを決める
大きな要因となる。そこで単肝節認識では母音と子音の
セグメント境界を正確に検出する方法が多数提案されて
いる。才だ単語認識においても、語頭の音節のセグメン
ト境界は語頭の位置合わぜに有用である。
以下第1図を参照しながら、従来の音声認識装置につい
て説明する。
同図において、1は音声を電気信号に変換するマイクロ
フォン等からなる入力手段、2は入力手段1からの電気
信号をディジタル化するA/D変換手段、3はA/D変
換手段2に」こってディジタル化された音声信号から母
音と子音のセグメント境界を検出するセグメント境界検
出手段、4はセグメント境界検出手段3によって検出さ
れたセグメント境界を基準にしてA/D変換手段2の出
力から音声の特徴を抽出する特徴抽出手段、5は特徴抽
出手段4によって抽出きれた音声の特徴を入カバターン
として一時的に記憶しておく入カバターン記憶手段、6
は認識対象となる複数個の音声の特徴を標準パターンと
して予め記憶せしめておく標準パターン記憶手段、7は
標準パターン記憶千成61りるいは入カバターン記憶手
段5と特徴抽11)D段4とを接続するモード切換スイ
ッチであp、標I<t5パターン記憶手段6に音声の特
徴を予め記憶ぜしめる登録モートと入カバターン記憶手
段5に1゛仲1jの特徴を記憶せしめる認識モードとを
選択する11段である。8は入カバターン記憶手段5に
記憶された入カバターンと標準パターン記憶手段6に記
憶された複数個の標準パターンとを比較し、人力音声を
特定の単語あるいは単音節と認識する認識処理手段、9
は認識処理手段8によって認識さiシた単語あるいは単
音節忙対応する信号全出力する出力手段である。
上記のように構成された音声認識装置、について、以下
具体的に動作を説明する。
丑ず登録モード時には、モード切換スイッチ7をA側に
接続し、出力手段9より出力される各種の出力信号に対
応した単語または単音節を発声して入力手段1に入力す
る事によって、音声の登録が為される。即ち、入力され
た音声を入力手段1によって電気信号に変換し、この電
気信号をA/D変換手段2によシディジタル化し、この
ディジクル化された音声信号よシセグメント境界検出手
段3によって母音と子音のセグメント境界を検出し、こ
のセグメント境界を基準にして特徴抽出手段4により音
声の特徴を抽出して、標準パターン記憶手段6にこの音
声の特徴を登録する。
次に認識モード時には、モード切換スイッチ7をB側に
接続し、登録モート時に登録された複数個の単語または
単音節の内から所望のものを入力手段1に入力すれば、
認識処理手段8によって入カバターンに最も類似してい
ると判定された標準パターンに対応した信号が出力手段
9から出力される。即ち、入力手段1に入力されてA/
D変換f段2によってディジクル化された音声は、セグ
メント境界検出手段3によ−)で検出されたセグメント
境界を基準にして特徴抽出手段4により特徴パターンに
変換され、−具入カパターン記憶手段らに記憶された後
、標準パターン記憶手段6に記憶されている複数個のも
1°こ準パターンと比較されて、J’lも類似している
単語−1たは単音節に対応した信号が出力手段9がら出
力される。
イー記のように構成された鴇声認識装置では、母1′S
°と子音のセグメント境界の検出精度が認識率に大きな
影響を及ぼす。そこで種々のセグメント境71!険出法
が提案されているが、一方法としご母音パワーと標準エ
ンベロープとの類似度を用いる方法の有効性が報告され
ている。以下、第2図を参照しなから、従来のセグメン
ト境界検出手段3について説明する。
第2図は従来のセグメント境界検出手段3のプ1」ツク
図である。同図において、3aは母音のポルマントの帯
域にあわせたフィルタ、3Jjフイルタ3aの出力のパ
ワーを言1算するパワー計算手段、3Cは予め定めてお
いた標準エンベロープを記憶しておく標準エンベロープ
記憶手段、3dはパワー計算手段3bの出力と標準エン
ベローフ゛との距離を割算する距離計算手段 3eは距
it+、=−を算手段3dによって計算された距離カニ
最/J%となる7へをめ、その点をセグメン゛1・−境
界として113ツノ1−る境界検出手段である。
」−記のように構成されたセグメント境界検([手段に
ついて、以下具体的に動イ/は説明11−る。
第1図に示すA/D変換手段2によってテイジタル化さ
れた音声信号は、フィルり3aによってろ波されて母音
の部分で大きな出力カニ得られる信号に変換され、・く
ワー言−(算手段3bによって整流。
平滑化されて音声のホルマントの存在する壱ヲ域のバン
ド・パワーく第3図の10)が出力される。
このバント・パワーは、距離計算手段3dによって標準
エンベロープ記憶手段3Cに記憶されていル標準エンベ
ロープ(第3図の11)を1点1′つシフトしたものと
比較され、両者の距離(第3図の12)が計算される。
即ち、標準エンベローフ。
f(n)(n=−nl、−n1+1.−=、、−1,0
,1、・。
n2; ただしn、 、>o 、 n2>O)をm点だ
けシフトしだも・のとバンド・ノくワーの波形p (n
) (n−〇。
1.2.・・、N、ただしN)O)との各点での差の絶
力J値和、 n = m −n ま ただし、n1=n、 、 n1+1 、− 、 N−n
2あるいtよ二乗和 n:: m −n 1 か各mについて泪r11される。次にdl(m)あるい
はd2(m)か最小となるmか境界検出手段3eによっ
て検出され、セグメント境界として出力される。
しかし、上記のように構成された音声認識装置では、発
声のし方や、発声された音節の母音の違いによるバンド
・パワーの変動に追従できず、セグメント境界の検出誤
りひいては認識誤りが生じ易いという欠点を有していた
。発声した音節によ17\では、バンド・パワーは第4
図の10に示すようになり、これに対して標準エンベロ
ープ11との比較による距離の最小値はm8の位置とな
り、実際の子音と母音の境界点m。とは相描違った位置
として検出、されてし丑っていた。
発明の目的 本発明は上記問題点に鑑み、発声のし方や発声された音
節の母音の違いによるバンド・パワーの変動に追従でき
、より正確なセグメント境界の検出が可能で、したがっ
て認識率の向上を図ることのできる音声認識装置を提供
することを目的とする。
発明の構成 本発明は、予め定められた複数個の標準エンベロープを
記憶しておく標準エンベローブ記憶手段と、パワー計算
手段から出力されるバンド・パワーの波形に応じて標準
エンベロープの選択を行なう標準エンベロープ選択手段
とを、セグメント境界検出手段内に備えた音声認識装置
であり、バンド・パワーの波形・大きさに応じて複数個
の標準エンベロープの中の1つを選択してセグメント境
界の検出に用いることにより、音声のパワーの変動に左
右されない安定なセグメント境界が検出でき、高い認識
率を得ることのできるものである。
実施例の説明 以下、本発明の構成について図面とともに説明す7.。
第5図は本発明の一実施例における単音節認識装置のセ
グメント境界検出手段のブロック図であイ[)。
同図において、3aはフィルタ、3bはパワー言13す
手段、3dは距離割算手段、3eは境界検出手段で、以
上は第2図の構成と同じものである。
第2図の構成と異なる点は、パワー計算手段3bに、に
って算出された母音パワーの最大値を検出する最大値検
出手段3fど、予め定められた複数個の標僧エンベロー
プを記憶しておき最大値検出手段3fJ:p出力される
バンド・パワーの最大値に応じた標準エンベロープをエ
ンベロープ選択スイッチ3hにより選択して出力する標
準エンベロープ1:1シ憶手段3qとを設けた点である
以上のように構成したセグメント境界検出手段について
、以下具体的に動作を説明する。
窮1図に示す入力手段1およびA/D変換手段2によっ
てディジタル信号に変換された単音節音声は、フィルタ
3aによってろ波されて母音部で大きな出力が得られる
信号に変換され1.<ワー計算手段3bによって整流、
平滑化されて・くンド・パワーp(n)(n=0.1、
−、N) (第3図の10)が出力される。バンド・パ
ワーの最大値が最大値検出手段3fによって検出され、
音声のノくンド・パワー波形に応じた標準エンベロープ
が選択される。即ち、バンド・パワーの最大値に応じた
大きさの標準エンベロープが得られる位置にエンベロー
プ選択スイッチ3hが接続され、予め標準エンベロープ
記憶手段3qに記憶しである複数個の標準エンベロープ
f、(n)、 、f2(nL f3(ロ)、f4(n)
(第6図の13〜16)のうちの1つが選択されて出力
される。距離計算手段3dでは、標準エンベロープ記憶
手段3qから出力された標準エンベロープを順次一点ず
つシフトしたものとパワー計算手段3bによって算出さ
れた母音パワーとの距離が各点毎に創算される。即ち、
エンベロープ選択スイッチ3hがS、(β=1.2,3
.4)に接続され、標準エンベロープ記憶手段3qから
標準エンベロープfI1.(n)(n−−n1l−n1
+1.・・・、−1,○l’ I”’l”2)が出力さ
れたとすると1.f、(n)をm点だけシフトし/こf
ρ(n−m)とfiJ音パワーの時間波形pOとの各点
での差の絶対値和 n、、、=m −n ま ただし、(m=n1. n1+1、−7−、N−n2)
あるいけ二乗和 n =m −nl が各mについて計算され−る。この後、d 1(rrh
 )あるいはd2(m)が最小となるmが境界検出手段
3eによって検出され、セグメント境界として出力され
る。
以上のように本実施例によれば、最大値検出手段3fと
標準エンベロープ記憶手段3qとを設けることにより、
単音節の母音の違いによる音声パワーの変動や発声の大
きさによる音声パワーの変動に応じて適切な形、大きさ
の標準エンベロープが選択でき、より正確なセグメント
境界の検出を行なうことができる。単音節認識ではセグ
メント境界を基準にして特徴抽出を行なうため、セグメ
ント境界の検出が正確であるほど認識装置の認識率が向
上し、使い易さの面で効果は大きい。
なお本実施例では認識対象を単音節に限定したが、本セ
グメント境界検出手段は単語の語頭の単音節にも適用可
能で、単語の語頭の時間合わせがより正確に行なえるよ
うに在り認識率の向上につながる。壕だエンベロープの
切り換えはパワーの最大値に応じて行なう必要はなく、
音声の大きさを表わす他のパラメータを用いても良い。
また、標準エンベロープの数も4つに限定する必要はな
い。
発明の効果 以上のように本発明は、予め定め、られた複数個の標準
エンベロープを記憶しておく標準エンベロープ記憶手段
と、音声のパワーに応じて標準エンベロープを切り換え
る標準エンベロープ切換手段を設ける乙とにより、音声
゛のパワーの変動によらない正確なセグメンF 境界の
検出を行なうことができ、その結果高い認jiilt−
率が得られるようになり、その効果は大なるものがある
【図面の簡単な説明】
第1図は音声認識装置のブロック図、第2図は従来のセ
グメント境界検出部のブロック図、第31凶に[同セグ
メント境界検出部の説明のための原理図、第4図はセグ
メント検出誤りの例を示す原理図、第5図は本発明の一
実施例における音声認識装置のセグメント境界検出手段
のブロック図、第6121はそれぞれ標準エンベロープ
の例を示す特性図でhる。 1・・・・・・入力手段、2・・・・・・A/D変換手
段、3・・・・・・セグメント境界検出手段、3a・・
・・・・フィルタ、3b・・・・・・パワー計算手段、
3c・・・・・・標準エンベロープ記憶手段、3d・・
・・・・距離計算手段、3e・・・・・・境界検出手段
、3f・・・・・・最大値検出手段、3q・・・・・・
標準エンベロープ記憶手段、3h・・・・・・エンベロ
ープ選択スイッチ、4・・・・・・特徴抽出手段、5・
・・・・・入カバターン記憶手段、6・・・・・・標準
パターン記憶手段、7・・・・・・モード選択スイッチ
、8・・・・・・認識処理手段、9・・・・・・出力手
段、10・・・・バンド・パワー波形、11・・・・・
・標準エンベロープ、12・・・・−・バンド・パワー
波形と標準エンベロープの距NB、13・°−°−標S
エンベローフf1(n)、14・・・・・標準エンベロ
ープf2(n) + 15・・・・・・標準エンベロー
プJ’3(n)、16・・・・・・標準エンベロー、;
’ f4(n)。

Claims (1)

    【特許請求の範囲】
  1. 入力された音声を電気信号に変換する入力手段と、上記
    電気信号をディジタル化するA/D変換手段と、上記デ
    ィジタル化された電気信号から音声の母音部と子音部の
    セグメント境界を検出するセグメント境界検出手段と、
    上記セグメント境界検出手段によって検出されたセグメ
    ント境界を基準にして上記母音部と上記子音部の特徴を
    抽出する特徴抽出手段と、上記特徴抽出手段にノよって
    抽出された音声の特徴を入カバターンとして一時的に記
    憶する入カバターン記憶手段と、予め入力しておく音声
    から上記特徴抽出手段によって抽出された特徴を標準パ
    ターンとして複数個記憶しておく標準パターン記憶手段
    と、上記標準パターン記憶手段に記憶されている上記各
    標準パターンと上記入カバターンとを比較し上記入カバ
    ターンを特定の上記標準パターンと認識する認識処理手
    段と、上記認識処理手段によって認識された標準ノ(タ
    ーンに対応した信号を出力する出力手段とを備え、上記
    セグメント境界検出子・段は、上記ディジタル化された
    音声信号から音声のパワー波形を検出するパワー検出手
    段と、予め定められた複数個の標準エンベロニブを記憶
    しておく標準エンベロープ記憶手段と、上記標準エンベ
    ロープ記憶手段の中から上記パワー検出手段で検出した
    )(ワー波形に応じた標準エンベロープを選択する選択
    手段と、上記選択した標準エンベロープと上記パワー波
    形との距離が溌小となる点を上記母音部と上記子音部の
    セグメント境界として出力する手段とで構成されること
    を特徴とする音声認識装置。
JP15659883A 1983-08-26 1983-08-26 音声認識装置 Pending JPS6048100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15659883A JPS6048100A (ja) 1983-08-26 1983-08-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15659883A JPS6048100A (ja) 1983-08-26 1983-08-26 音声認識装置

Publications (1)

Publication Number Publication Date
JPS6048100A true JPS6048100A (ja) 1985-03-15

Family

ID=15631251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15659883A Pending JPS6048100A (ja) 1983-08-26 1983-08-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6048100A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132177A (ja) * 1998-10-20 2000-05-12 Canon Inc 音声処理装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132177A (ja) * 1998-10-20 2000-05-12 Canon Inc 音声処理装置及び方法

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS6316766B2 (ja)
JPS6048100A (ja) 音声認識装置
JPS60125899A (ja) 音声認識装置
JP3039453B2 (ja) 音声認識装置
JP2547541B2 (ja) 単音節音声認識装置
JPS60121499A (ja) 音声照合装置
JPS6126678B2 (ja)
JPS6070497A (ja) 音声認識装置
JPS62134698A (ja) 多数単語の音声入力方式
JP2844592B2 (ja) 離散単語音声認識装置
JP3020999B2 (ja) パターン登録方法
JPH0343639B2 (ja)
JPS59224900A (ja) 音声認識方法
JPS61183699A (ja) 音声認識装置
JPS6148897A (ja) 音声認識装置
JPH01158499A (ja) 定常雑音除去方式
JPS59168496A (ja) 音声認識方法
JPH0336440B2 (ja)
JPS62295100A (ja) 音声認識装置
JPH0449719B2 (ja)
JPS595294A (ja) 音声認識装置
JPS60125898A (ja) 音声認識装置
JPS61177000A (ja) 音声パタ−ン登録方式
JPS62217298A (ja) 音声認識装置