JPS62172400A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS62172400A
JPS62172400A JP1345286A JP1345286A JPS62172400A JP S62172400 A JPS62172400 A JP S62172400A JP 1345286 A JP1345286 A JP 1345286A JP 1345286 A JP1345286 A JP 1345286A JP S62172400 A JPS62172400 A JP S62172400A
Authority
JP
Japan
Prior art keywords
pattern
input
speech
low frequency
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1345286A
Other languages
English (en)
Inventor
水上 敏彦
高岡 利安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
NEC Corp
Original Assignee
NEC Corp
NEC Shizuoca Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Shizuoca Ltd filed Critical NEC Corp
Priority to JP1345286A priority Critical patent/JPS62172400A/ja
Publication of JPS62172400A publication Critical patent/JPS62172400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、単語毎に区切って発声される音声を認識する
離散単語型の音声認識装置に関する。
〔概 要〕
本発明は、特徴パラメータとして入力音声信号の周波数
スペクトルを抽出して、その標準パタンと比較する手段
を含む音声認識装置において、標準パタンとの比較を始
めに低域成分について行う手段を設け、比較を低減成分
と全帯域成分の2段階に行うことにより、 認識性能の向上と所要時間の短縮化を図ったものである
〔従来の技術〕
第2図は従来の音声認識装置の一般的な構成を示すブロ
ック構成図である。マイクロフォン1から入力された音
声信号を音声分析部2により分析し、特徴パラメータを
抽出する。従来この特徴パラメータとしては、音声に含
まれるスペクトルをバンドパスフィルターバンクにより
抽出したものが広く用いられており、特徴パラメータは
パタン比較部3に供給され、標準パタンメモリ5に記憶
されている各単語の標準パタンと全帯域を一度にパタン
比較される。
ところで、標準パタンメモリ5は、特定話者認識装置の
場合、話者に対応した各単語の特徴パラメータを、また
不特定話者認識装置の場合、あらかしめ多数の人の音声
から抽出した各単語の特徴パラメータを記憶するもので
ある。パタン比較部3は入力されたパタンと最も近い標
準パタンに対応する単語を認識結果6として出力する。
〔発明が解決しようとする問題点〕
上述した従来の音声認識装置は、特徴パラメータとして
、周波数ごとの強度分布のスペクトルを用い、入力パタ
ンと標準パタンを一度に比較することが広く用いられて
おり、パタン比較は所定の各時間における各スペクトル
間の差の絶対値の総和により類似度を判定している。し
かし、上記のパタン比較においては、スペクトルの低域
成分と高域成分が所定の各時間において対称的となるよ
うな異なった単語のパタン比較においても類似度が等し
くなり、結果として誤認識を起ごしてしまう欠点があっ
た。
本発明の目的は、これらの欠点を除去し、良好な認識性
能を有する音声認識装置を提供することにある。
〔問題点を解決するための手段〕
本発明は、入力音声信号を所定の周期ごとに分析し周波
数スペクトルから得られる特徴パラメータを抽出する音
声分析部と、上記特徴パラメータを各単語ごとに標準パ
タンとして記憶する標準パタンメモリと、抽出された上
記入力音声信号の特徴パラメータのパタンと上記標準パ
タンとの比較を行うパタン比較部とを含む音声認識装置
において、上記パタン比較部の前段に、入力が上記音声
分析部に接続され、抽出された上記入力音声信号の特徴
パラメータの低域成分と上記標準パラメータの低域成分
とを比較する低域パタン比較部が挿入されたことを特徴
とする。
〔作 用] 本発明は、始めに、抽出された入力音声信号の特徴パラ
メータの低域成分によりパタン比較し、次に全帯域成分
によりパタン比較を行う。したがって、低域成分と高域
成分とが対称的に分布するような単語を識別することが
でき、より高い認識率を得ることが可能となる。さらに
時間のかかる全帯域成分比較は低域成分の比較で絞られ
たより少ない数の候補について行えばよくなり、認識に
要する時間は全体として短縮することも可能となる。
[実施例] 以下、本発明の実施例について図面を参照して説明する
第1図は本発明の一実施例を示すブロック構成図である
。本実施例は、マイクロフォン11と、このマイクロフ
ォン11から入力音声信号を所定の周期ごとに分析し周
波数スペクトルからなる特徴パラメータを抽出する音声
分析部12と、この音声分析部12に接続され入力音声
信号の特徴パラメータの低域成分と標準パラメータの低
域成分とを比較する低域パタン比較部13と、この低域
パタン比較部13に接続され入力音声信号の特徴パラメ
ータの全帯域成分と標準パタンの全帯域成分との比較を
行い認識結果16を出力する全帯域パタン比較部14と
、特徴パラメータの標準パタンを発生する標準パタンメ
モリ15とを含んでいる。
本発明の特徴は、第1図において低域パタン比較部13
を設けたことである。
次に、本実施例の動作について説明する。マイクロフォ
ン11から入力された音声信号は、音声分析部12によ
り、周波数スペクトルの時間変化が所定周期(一般には
4〜20m5ec)ごとに分析され、特徴パラメータと
して出力される。第1段目の低域パタン比較部13は、
あらかじめ標準パタンメモリ15に記憶されている各単
語のスペクトルの内の低域成分の時間変化パタンと入力
音声信号の特徴パラメータの低域成分のパタンを比較し
、全体の単語の中から類似している標準パタンに対応し
た単語を取り出す。次に入力音声の特徴パラメータは第
2段目の全帯域パタン比較部6により、標準パタンメモ
リ15に記憶されたスペクトルパタンのうち、第1段目
パタン比較で類似した単語に対応しているものと全帯域
にねたりパタン比較され、最も近いパタンを認識結果1
6として出力する。
〔発明の効果〕
以上説明したように、本発明は、入力音声の周波数スペ
クトルの低域成分の分布と高域成分の分布が対称的な異
なった単語のパタンでも、低域成分を取り出してパタン
比較することにより、従来誤認識しがちであったこれら
の単語間のパタンの差を識別することができ、高い認識
率を得る効果がある。さらに、低域成分のみを用いてパ
タン比較を行い、認識候補を絞り、次に絞られた単語に
のみ従来と同じパタン比較を行うため、従来の全部のパ
タンに対して全帯域成分を用いてパタン比較する方式に
比べ、認識処理に要する時間が短縮される効果もある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック構成図。 第2図は従来例を示すブロック構成図。 1.11・・・マイクロフォン、2.12・・・音声分
析部、3・・・パタン比較部、5.15・・・標準パタ
ンメモリ、6.16・・・認識結果、13・・・低域パ
タン比較部、14・・・全帯域パタン比較部。

Claims (1)

    【特許請求の範囲】
  1. (1)入力音声信号を所定の周期ごとに分析し周波数ス
    ペクトルから得られる特徴パラメータを抽出する音声分
    析部と、 上記特徴パラメータを各単語ごとに標準パタンとして記
    憶する標準パタンメモリと、 抽出された上記入力音声信号の特徴パラメータのパタン
    と上記標準パタンとの比較を行うパタン比較部と を含む音声認識装置において、 上記パタン比較部の前段に、入力が上記音声分析部に接
    続され、抽出された上記入力音声信号の特徴パラメータ
    の低域成分と上記標準パラメータの低域成分とを比較す
    る低域パタン比較部が挿入された ことを特徴とする音声認識装置。
JP1345286A 1986-01-24 1986-01-24 音声認識装置 Pending JPS62172400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1345286A JPS62172400A (ja) 1986-01-24 1986-01-24 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1345286A JPS62172400A (ja) 1986-01-24 1986-01-24 音声認識装置

Publications (1)

Publication Number Publication Date
JPS62172400A true JPS62172400A (ja) 1987-07-29

Family

ID=11833532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1345286A Pending JPS62172400A (ja) 1986-01-24 1986-01-24 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62172400A (ja)

Similar Documents

Publication Publication Date Title
US4852181A (en) Speech recognition for recognizing the catagory of an input speech pattern
US7974420B2 (en) Mixed audio separation apparatus
JPS5972496A (ja) 単音識別装置
US4817158A (en) Normalization of speech signals
JPS5844500A (ja) 音声認識方式
US5144672A (en) Speech recognition apparatus including speaker-independent dictionary and speaker-dependent
US4833714A (en) Speech recognition apparatus
JPS62172400A (ja) 音声認識装置
JPS62172398A (ja) 音声認識装置
Elghonemy et al. Speaker independent isolated Arabic word recognition system
JPH02118698A (ja) 音声認識装置
JPS60208800A (ja) 単語音声認識装置
JPS6070496A (ja) 音声認識処理方式
JPS59211100A (ja) 登録型音声認識方法
JPS6293000A (ja) 音声認識方法
JPS6229798B2 (ja)
JPS6031196A (ja) 音声パタ−ン作成装置
JPS6227798A (ja) 音声認識装置
JPS6059394A (ja) 音声認識装置
JPS59124390A (ja) 候補削減音声認識方式
JPS5995597A (ja) 音声特徴パラメ−タ作成方式
JPS6350898A (ja) 音声認識装置
JPH0558560B2 (ja)
JPH11249681A (ja) 音響特徴抽出方法及び同方法を適用した音声認識装置
JPS59124388A (ja) 単語音声認識処理方式