JPS61138298A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61138298A
JPS61138298A JP59261104A JP26110484A JPS61138298A JP S61138298 A JPS61138298 A JP S61138298A JP 59261104 A JP59261104 A JP 59261104A JP 26110484 A JP26110484 A JP 26110484A JP S61138298 A JPS61138298 A JP S61138298A
Authority
JP
Japan
Prior art keywords
pattern
speech
silent
matching
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59261104A
Other languages
English (en)
Inventor
武志 則松
正宏 浜田
明寿 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59261104A priority Critical patent/JPS61138298A/ja
Publication of JPS61138298A publication Critical patent/JPS61138298A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、標準パタンと入力音声パタンとのパタンマツ
チングにより認識結果を導き出す音声認識装置に関する
ものである。
従来の技術 一般に、音声認識装置では、入力音声パタンと辞書に蓄
えられた標準パタンとの類似度を評価す・  るのに、
動的計画法(ダイナミック・プログラミング法)を用い
たパタンマツチング(以下DPマツチングと記す)を行
ない、距離の最小となる標準パタンを認識結果とする方
法が行なわれている。
特に、単語音声認識装置では、すべての標準パタンと単
語音声パタン全体に渡ってDPマツチングを行ない、高
い認識率を得ている。
例えば、文献「ダイナミック プログラミングオブティ
ミゼイション フォ スポークン ワード レコグニン
g 7 J (H、5akoe and S、Chib
a。
”Dynamic Prograrrtning op
timization forspok@n word
 recognition”IEEE Tran1+。
Acoust、、 5peech、 Signal P
rocessing。
マo1. ASSP−27PP、336−349.19
79.)発明が解決しようとする問題点 しかしながら上記の音声認識装置では、例えばOKAY
AMA(岡山)、!:WAKAYAMA(和歌山)のよ
うな類似した単語同志のパタンマツチングを行なうと、
岡山の00部分と和歌山のWAの部分の違いが、単語全
体に渡ってDPマツチングを行なうことにより吸収され
てしまい、単語間の距離が小さくなり誤認識を生じやす
いという問題点を有していた。
また、異単語のDPマツチングでも、極端なマツチング
が生じることがあり誤認識を生じる原因となっていた。
本発明は上記問題点に鑑み、類似単語間での誤認識およ
び極端なりPマツチングによる誤認識を極力抑えること
のできる音声認識装置を提供するものである。
問題点を解決するための手段 上記問題点を解決するために本発明の音声認識装置は、
入力音声からエネルギー系列を含めた特徴ベクトルの時
系列を出力する音声分析手段と、前記音声分析手段から
出力されるエネルギー系列からエネルギーレベルがある
閾値を一定区間下回る区間を検出し、その区間の個数と
フレーム位置を記憶する無音区間検出手段と、前記無音
区間検出手段により得られる無音区間の個数が同数であ
る入力音声パタンと標準パタンの間でのみ、無音区間の
フレーム位置の交点をマッチングバスが必ず通過するよ
うに制限したパタンマツチングを行ない、入力音声パタ
ンと標準パタン間の距離を求めるパタンマツチング手段
を備えたものである。
作  用 本発明は上記に述べた構成によって、入力音声パタンと
標準パタンの無音区間のフレーム位置を合わせて必ずそ
の交点をマツチングバスが通るように制限することによ
り、類似単語同志のマツチングの場合、音韻の異なった
部分の距離が従来の音声g歳装置に比べて全体の距離に
より大きく反映し、誤認識を極力防止することができる
。また、無音区間に基づいた予備選択手段を用いること
により、標準パタン全てとのパタンマツチングを行なう
必要がなくなるため、マツチング計算の短縮にもなり、
極端なマツチングによる誤認識も防ぐことができる。
実施例 以下本発明の一実施例の音声認識装置について、図面を
参照しながら説明する。
第1図は本発明の一実施例における音声認識装置のブロ
ック図である。第1図において、1は音−入力部で、話
者の音声がマイクロホン等を通して入力される。2は音
声分析手段で、入力された音声信号からエネルギー系列
を含む特徴ベクトルの時系列を抽出する。3は雑音分析
手段で、無音区間検出のため音声入力する以前の一定区
間の雑音部分のエネルギー値から一定の閾値を決定する
4は無音区間検出手段で、音声の特徴ベクトルの時系列
から無音区間部分を判別し、各標準パタンについて無音
区間の個数およびそのフレーム位置を検出し記憶するり
5は音声分析手段2から出力される特徴ベクトルの時系
列を音声の標準パタンとして記憶するパタン記憶手段、
6は予備選択手段で、入力音声パタンと無音区間の個数
の一致する標準パタンを選択する。7はパタンマツチン
グ手段で、パタン記憶手段6に蓄えられた標準パタンと
入力音声パタンとの間で、無音区間検出手段4と予備選
択手段6の結果をもとにパタンマツチングを行なう。8
は認識手段で、パタンマツチング手段7の結果から認識
候補音声を導き出す。9は音声出力部で、認識結果をL
ED等に表示する。
第2図は本実施例の構成を示す回路ブロック図で、上記
雑音分析手段3.無音区間検出手段4.予備選択手段e
パタンマツチング手段7.認識手段8をマイクロコンピ
ュータ16で実現したものである。
第2図において、10は音声の入力を行なうマイクロホ
ン、11はマイクロホン10から入力された音声信号を
アナログ−ディジタル変換するアナログ−ディディジタ
ル変換器(以下A/D変換器という)である。12は変
換された音声信号にもとすき特徴ベクトルの時系列を抽
出する音声分析部、13は入力音声の特徴ベクトルの時
系列を記憶する入力パタンメモリ、14は標準パタ/の
特徴ベクトルの時系列を記憶する標準パタンメモリ、1
5は演算制御部16aと記憶部15bより成るマイクロ
コンピュータ、16は認識候補音声を表示する認識結果
表示器である。
第3図は本実施例のマイクロコンピュータの動作を説明
するための要部70−チャートである。
以上の榊成による本実施例の動作を、入力音声パタンの
無音区間が1個存在する場合について第3図のフローチ
ャートに沿って詳細に説明する。
まず、音声信号を入力する以前の雑音信号をマイクロホ
ン10より入力し、雑音分析を行なう。
この分析は、一定時間内の雑音信号を取り込み、一定時
間内の雑音エネルギー値系列の平均値を求め、これを無
音区間検出のだめの閾値(NS)として設定する(ステ
ップ21)。ステップ22では、マイクロホーン1oよ
り音声を入力し、A/D変換器11で音声信号がアナロ
グ−ディジタル変換器、音声分析部12で、音声の特徴
ベクトル(例えば、10次元の線形予測系数)の時系列
とエネルギー値系列を求め、入力パタンメモリ13に記
憶する。
この後、ステップ23で無音区間を検出する。これは、
ステップ22で求めた入力音声のエネルギー系列からエ
ネルギー値が閾値NSを下回る区間が一定時間七〇を超
える区間を無音区間として検出し、無音区間の数INと
無音区間の最終フレーム位置!Fを記憶部1tsbに記
憶する。無音区間検出後、標準パタンメモリ14内の先
頭の標準パタンの無音区間の数駅と入力パタンの無音区
間の個数INが同数であるかをステップ24で判断する
。ステップ240条件が満たされると以下に示す処理に
より入力パタンと標準パタンとのパタンマツチングを行
なう。
標準パタン中の無音区間の最終7レ一ム位置をRFとす
ると、1ず、ステップ26で入力パタンの第1フレーム
から第1F7レームまでと標準パタンの第1フレームか
ら第RF 7レームまでとの間でDPマツチングを行な
い、累積距離D1を算出し、記憶部1sbに記憶する。
次にステップ26で、入力パタンの第1Fフレームから
最終フv−ムIEまでと、標準パタンの第1F7レーム
から最終フレームRE−jでとの間でDPマツチングを
行ない累積距離D2 を算出する。この後ステップ26
で入力パタンと標準パタン間の距離りを次式で算出する
ただし、dIF、RF は、入力パタンのIF7レーム
の特電ベクトルと標準パタンのRF7レームの特徴ベク
トルとのベクトル間距離である。
また、ここではDPマツチングの漸化式を次式のように
設定した。
Dl、1=d1,1 ここでDl、1 は入力パタンの第1フレーム、標準バ
タ/のJtiフレームでのDPマツチングの累積距離で
ある。ステップ27で算出された距離値りは記憶部15
bに記憶される。この距離値りは、入力パタンのIF7
レームと標準パタ/のRFフレームの交点をマッチング
バスが必ず通るように制限したDPマツチングにより得
られる結果である。
パタンマツチング処理終了後、ステップ28に進み標準
パタンメモリ14に蓄えられたすべての標準パタ/につ
いて上記の処理をし終わったかを判断し、この条件を満
たさなければ、ステップ24に戻り次の標準パタンにつ
いて以下同様の処理を続ける。ステップ2日の条件が満
たされるとステップ29で記憶部15bに記憶された距
離値のうち、最小値を与える標準パタンを認識候補音声
と判定し、認識結果表示器16に認識候補音声を表示す
る。
なお、本実施例では、入力パタンの無音区間の個数が1
個の場合について説明したが、無音区間が2個以上存在
する時も同様の処理を行なうことができる。
以上のように本実施例によれば、音声パタンの無音区間
を検出する無音区間検出手段と、入力パタンと標準パタ
ンの無音区間で各パタンを分割し、分割されたそれぞれ
のパタン間のDPマツチングを行なった後、全パタン間
の距離値を求めるパタンマツチング手段を設けることに
より、特に音韻的に類似した単語間のマツチング距離に
パタン間の相違が全体の距離により大きく反映し、誤認
識を減らすことができる。また、無音区間の個数により
DPマツチングを行なう標準パタンをあらかじめ選択す
る予備選択手段を設けることにより、マツチング計算時
間を大幅に短縮することができる。
発明の効果 以上のように本発明は、音声パタン中の無音区間を検出
し、その個数とフレーム位置を記憶する無音区間手段と
、無音区間の個数が入力パタンと一致する標準パタンを
選択する予備選択手段と、入力パタンと標準パタンの無
音区間のフレーム位置を合わせ、その交点をマッチング
バスが必ず通るように制限したDPマツチングを行なう
パタンマツチング手段を設けたことにより、音韻の類似
したパタン間の誤認識、および極端なマツチングによる
誤認識を極力抑えることのできる音声認識装置を提供す
ることができる。
また上記予備選択手段を設けたことによりマツチングに
かかる計算時間を大幅に短縮することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置の構成
を示すブロック図、第2図は同装置の構成を示す回路ブ
ロック図、第3図は同装置の動作説明のための要部フロ
ーチャートである。

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声からエネルギー系列を含む特徴ベクトル
    の時系列を出力する音声分析手段と、前記音声分析手段
    から出力される特徴ベクトルの時系列を音声の標準パタ
    ンとして記憶するパタン記憶手段と、前記音声分析手段
    の結果から、音声パタン中の音声部分と無音声部分を判
    別し無音区間の個数およびそのフレーム位置を検出し記
    憶する無音区間検出手段と、前記無音区間検出手段より
    検出された無音区間の個数が入力音声パタンと一致する
    標準パタンを選択する予備選択手段と、前記予備選択手
    段で選択された標準パタンと入力パタン間でのみ前記無
    音区間検出手段で検出された無音区間のフレーム位置の
    交点をマッチングバスが必ず通過するように制限したパ
    タンマッチングを行ない両者間の距離を算出するパタン
    マッチング手段と、前記パタンマッチング手段により得
    られた入力音声パタンと各標準パタンとの距離のうち最
    小値を与える標準パタンを認識結果とする認識手段を備
    えたことを特徴とする音声認識装置。
  2. (2)無音区間検出手段は、音声入力する以前の一定区
    間の雑音部分のエネルギー値から一定の閾値を定める雑
    音分析手段を有し、音声区間のエネルギー値系列が前記
    閾値を一定時間下回る区間を無音区間として検出するこ
    とを特徴とする特許請求の範囲第1項記載の音声認識装
    置。
JP59261104A 1984-12-11 1984-12-11 音声認識装置 Pending JPS61138298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59261104A JPS61138298A (ja) 1984-12-11 1984-12-11 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59261104A JPS61138298A (ja) 1984-12-11 1984-12-11 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61138298A true JPS61138298A (ja) 1986-06-25

Family

ID=17357137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59261104A Pending JPS61138298A (ja) 1984-12-11 1984-12-11 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61138298A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5962899A (ja) * 1982-10-04 1984-04-10 株式会社日立製作所 音声認識方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5962899A (ja) * 1982-10-04 1984-04-10 株式会社日立製作所 音声認識方式

Similar Documents

Publication Publication Date Title
US6195634B1 (en) Selection of decoys for non-vocabulary utterances rejection
Christiansen et al. Detecting and locating key words in continuous speech using linear predictive coding
JP3066920B2 (ja) 音声認識方法及び装置
EP0118484B1 (en) Lpc word recognizer utilizing energy features
US5033089A (en) Methods for forming reference voice patterns, and methods for comparing voice patterns
US4513436A (en) Speech recognition system
US5159637A (en) Speech word recognizing apparatus using information indicative of the relative significance of speech features
US5751898A (en) Speech recognition method and apparatus for use therein
JPH05119792A (ja) 音声認識装置
JPS61138298A (ja) 音声認識装置
JP3112037B2 (ja) 音声認識装置
JP3477751B2 (ja) 連続単語音声認識装置
JP3100180B2 (ja) 音声認識方法
JPS6247100A (ja) 音声認識装置
JPS6147999A (ja) 音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JPS62111295A (ja) 音声認識装置
JPH06100920B2 (ja) 音声認識装置
JP2577891B2 (ja) 単語音声予備選択装置
JPS61277999A (ja) 音声認識装置
JPH0247758B2 (ja)
JPS6383800A (ja) 音声認識装置
JPH01185599A (ja) 音声認識装置
JPH0567037B2 (ja)
JPS60203993A (ja) 音声認識方法