JPS63259689A - 音声認識応答装置 - Google Patents

音声認識応答装置

Info

Publication number
JPS63259689A
JPS63259689A JP62095617A JP9561787A JPS63259689A JP S63259689 A JPS63259689 A JP S63259689A JP 62095617 A JP62095617 A JP 62095617A JP 9561787 A JP9561787 A JP 9561787A JP S63259689 A JPS63259689 A JP S63259689A
Authority
JP
Japan
Prior art keywords
voice
recognition
section
speech
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62095617A
Other languages
English (en)
Other versions
JPH0769712B2 (ja
Inventor
平岡 省二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62095617A priority Critical patent/JPH0769712B2/ja
Publication of JPS63259689A publication Critical patent/JPS63259689A/ja
Publication of JPH0769712B2 publication Critical patent/JPH0769712B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、人間の声を機械に認識させ、機械が応答する
音声認識応答装置に関するものである。
従来の技術 近年、電話等を利用した音声認識応答装置の開発が活発
に行なわれている。このような不特定話者を対象とした
音声認識においては、ノイズを含んだ音声信号や語頭、
語尾における発声が不明瞭な音声信号についても認識す
る必要があるが、本出願人は先にこれら不明瞭な音声信
号に対して高い認識率を得ることができるようにした音
声認識方法について、特願昭60−2513600号と
して提案した。以下この方法を用いて音声により機械と
対話を行なう音声認識応答装置について図面を参照しな
がら説明する。
第4図は従来の音声認識応答装置の構成を示す機能ブロ
ック図である。同図に示すようにAD変換部1は入力音
声をディジタル信号に変換する。
音響分析部2は、音声を分析区間(フレーム)毎に分析
し、スペクトル情報(線形予測係数)を求める。特徴パ
ラメータ抽出部3は線形予測係数を用いてLPCケプス
トラム係数正規化対数残差パワー〇、および帯域通過フ
ィルタ値などを求める。
フレーム同期信号発生部4はフレーム毎に同期信号を発
生する。標準パターン選択部9はパターンマツチングを
行なう際、認識対象語句の標準パターンを順次選択する
。区間候補設定部6は選択された標準パターン毎に複数
の候補の音声区間長を設定する。時間軸正規化部5は設
定された複数の候補の音声区間に対する特徴パラメータ
の時系列パターンを一定フレーム長に伸縮する。類似度
計算部7は標準パターン選択部9で選ばれた標準パター
ン格納部8中の各標準パターンとの類似度を計算する。
類似度比較部11はフレーム毎に1次記憶10に蓄積さ
れている最大類似度値と比較し、最大の類似度の認識対
象語句を選択する。1次記憶10は得られた最大類似度
の語句を更新する。1次記憶10に残った語句は認識結
果として類似度比較部11よりタスク制御部15に出力
される。タスク制御部15は上記認識結果に対する応答
文音声を選択し、音声合成部16に指令を与える。音声
合成部16は音声データ格納部17から指定された文の
音声データを取り出し、音声を合成する。この合成され
たディジタルの音声をDA変換部18でアナログに変換
して出力する。
タスク制御部15は類似度比較部1工に認識指令を出力
し、認識を開始させて認識結果を得ることと、音声合成
部16に対する合成指令で応答文の音声を再生すること
とを繰返して行ない、目的のタスク全体の流れを制御す
る。
発明が解決しようとする問題点 しかし、上記のような従来側の構成では、第5図(a)
〜(d)に示すように認識開始以前から発声され始めた
音声、いわゆる語頭切れの音声に対してもパターンマツ
チングを行ない、候補の中から尤度の高いものを選ぶ誤
認識を行なったり、あるいは尤度が低いため゛認識でき
ず” (リジェクト)という結果となったシする。この
ため、人間が認識させようとする語句または文を最後ま
で発声した後で誤認識またはりジェクトが分かり、再度
語句または文の初めから発声し直さなければならないと
いう不都合を生じ、利用者に不快感を与えていた。
本発明の目的は、認識開始時点でリジェクトか認識可能
かを判定し、リジェクトの場合には頭切れであったとい
うリジェクト理由を発声者に伝達することができ、的確
で自然な対話を行なうことができるようにした音声認識
応答装置を提供するものである。
問題点を解決するだめの手段 本発明は上記目的を達成するもので、入力音声の有無を
検出する手段と、音声の認識開始時点で上記検出手段の
検出によシ以降に入力される音声について認識するか否
かの判定を行なう認識処理手段とを有し、認識しないと
判定した場合にはその結果を発声者に伝達するように構
成したものである。
作用 本発明は上記構成により、認識開始時点において、すぐ
に音声が発声されているか否かを判定し、発声している
場合には認識処理を行なわずにリジェクトし、即座にそ
のリジェクト理由を発声者に伝えるので、発声者は途中
で発声を中止し、再度発声し直すことができ、同じ語句
や文の全部を2度繰り返すという煩わしさをなくすこと
ができる。
実施例 以下、本発明の実施例について図面を参照しながら詳細
に説明する。
まず、本発明の第1実施例について説明する。
第1図は本発明の第1実施例における音声認識応答装置
の構成を示す機能ブロック図である。
同図において、符号1〜11および15〜18で示す各
部は第4図で説明した従来例の構成と同様であるので、
その説明を省略し、異なる構成についてのみ説明する。
パワー比較部12は特徴パラメータ抽出部3で得られた
帯域通過フィルタのパワー値と、ある一定閾値との比較
を行ない、閾値を越えたフレームを検出する。認識結果
生成部14はタスク制御部15からの認識指令を受けて
認識を開始した時点で上記フィルタパワー値が閾値を越
えた場合、認識処理を中止し、認識結果をリジェクトと
判定してタスク制御部15に出力する。タスク制御部1
5は音声合成部16にリジェクトの理由を示す応答文の
合成を指令した後、再び認識指令を発する。音声合成部
16は音声データ格納部17から応答文の音声データを
取り出し、音声を合成し、DA変換部18でアナログに
変換して出力し、発声者に伝達する。
第2図(3)〜(d)は以上の処理の様子を示した図で
ある。同図に示すように認識開始以前に発声された入力
音声に対し、リジェクトにより応答音声が開始され、発
声者は該当する語句の発声を停止している。
次に本発明の第2実施例について説明する。第3図は本
発明の第2実施例の構成を示す機能ブロック図である。
上記第1実施例では、認識開始時点で語頭切れの音声か
否かを判定するため、音声以外の瞬時のノイズに対して
誤ってリジェクトしてしまう危険性があるので本実施例
では瞬時のノイズに対し、誤ってリジェクトしないよう
に考慮したものである。同図において、符号1〜12お
よび14〜18で示す各部は第1図に示した第1実施例
の構成と同様であるので、その説明を省略し、異なる構
成についてのみ説明する。13はパワー比較部12から
出力される帯域通過フィルタパワー値がある閾値を越え
たフレームの個数を計算するフレーム計数部であり、認
識開始時点よ多連続して一定フレーム以上閾値を越えた
フレームが連続した場合を検出する。以降の処理は上記
第1J施例と同様である。
なお、上記各実施例では、帯域通過フィルタパワーによ
シ音声の有無を検出しているが、全域パワーを用いても
同様の検出は可能である。まだ発声者に伝達するには、
上記実施例のように音声合成部16による合成音声に限
らず、その他の合図音でもよい。
発明の効果 以上述べたように本発明によれば、音声の認識開始時点
において検出手段による入力音声の有無の検出によシ認
識処理手段で以降に入力される音声について認識するか
否かを判定し、認識しない場合にはその結果を発声者に
伝達するようにしている。すなわち認識開始時点で音声
の有無を判定し、音声が未だ入力されていない場合には
認識処理を行ない、音声が以前に発声開始されている場
合にはりジェツトにより語頭切れであった事を発声者に
知らせることができる。したがって発声者は語句全体を
発声し終った後にリジェクトを知らされ、再発声しなけ
ればならない事を知るという不快感を与えられることが
なく、スムーズで自然な対話を実現できる。
【図面の簡単な説明】
第1図は本発明の第1実施例における音声認識応答装置
の構成を示す機能ブロック図、第2図は本発明の実施例
における対話の様子を示すタイミング図、第3図は本発
明の第2実施例の構成を示す機能ブロック図、第4図は
従来の音声認識応答装置の構成を示す機能ブロック図、
第5図は従来例における対話の様子を示すタイミング図
である。 1・・・AD変換部、2・・・音響分析部、3・・・特
徴パラメータ抽出部、4・・・フレーム同期信号発生部
、5・・・時間軸正規化部、6・・・区間候補設定部、
7・・・類似度計算部、8・・・標準パターン格納部、
9・・・標準パターン選択部、1o・・・1次記憶、1
1・・・類似度比較部、12・・・パワー比較部、13
・・・フレーム計数部、14・・・認識結果生成部、1
5・・・タスク制御部、16川音声合成部、17・・・
音声データ格納部、18・・・DA変換部。

Claims (3)

    【特許請求の範囲】
  1. (1)入力音声の有無を検出する手段と、音声の認識開
    始時点で上記検出手段の検出により以降に入力される音
    声について認識するか否かの判定を行なう認識処理手段
    とを有し、認識しないと判定した場合にはその結果を発
    声者に伝達するように構成したことを特徴とする音声認
    識応答装置。
  2. (2)検出手段が音声信号のパワー値と、ある一定閾値
    との比較を行なうパワー比較部で構成されている特許請
    求の範囲第1項記載の音声認識応答装置。
  3. (3)検出手段が音声信号のパワー値と、ある一定閾値
    との比較を行なうパワー比較部と、このパワー比較部か
    ら出力され、閾値を越えたフレームの個数を計算するフ
    レーム計数部とより構成されている特許請求の範囲第1
    項記載の音声認識応答装置。
JP62095617A 1987-04-17 1987-04-17 音声認識応答装置 Expired - Lifetime JPH0769712B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62095617A JPH0769712B2 (ja) 1987-04-17 1987-04-17 音声認識応答装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62095617A JPH0769712B2 (ja) 1987-04-17 1987-04-17 音声認識応答装置

Publications (2)

Publication Number Publication Date
JPS63259689A true JPS63259689A (ja) 1988-10-26
JPH0769712B2 JPH0769712B2 (ja) 1995-07-31

Family

ID=14142507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62095617A Expired - Lifetime JPH0769712B2 (ja) 1987-04-17 1987-04-17 音声認識応答装置

Country Status (1)

Country Link
JP (1) JPH0769712B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916800A (ja) * 1995-07-04 1997-01-17 Fuji Electric Co Ltd 顔画像付き音声対話システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916800A (ja) * 1995-07-04 1997-01-17 Fuji Electric Co Ltd 顔画像付き音声対話システム

Also Published As

Publication number Publication date
JPH0769712B2 (ja) 1995-07-31

Similar Documents

Publication Publication Date Title
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
EP0077194B1 (en) Speech recognition system
US7272561B2 (en) Speech recognition device and speech recognition method
CA2366892C (en) Method and apparatus for speaker recognition using a speaker dependent transform
EP0757342A2 (en) User selectable multiple threshold criteria for voice recognition
EP1635327A1 (en) Information transmission device
EP0411290A2 (en) Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
JPH09500223A (ja) 多言語音声認識システム
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
JPH01296299A (ja) 音声認識装置
JPH0792988A (ja) 音声検出装置と映像切り替え装置
JP3069531B2 (ja) 音声認識方法
WO2002091358A1 (en) Method and apparatus for rejection of speech recognition results in accordance with confidence level
JP5201053B2 (ja) 合成音声判別装置、方法及びプログラム
JPH11231895A (ja) 音声認識方法及びその装置
JPS63259689A (ja) 音声認識応答装置
JP2000122678A (ja) 音声認識機器制御装置
JP4449380B2 (ja) 話者正規化方法及びそれを用いた音声認識装置
JPH04324499A (ja) 音声認識装置
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
JPS63259690A (ja) 音声認識応答装置
JPH0769713B2 (ja) 音声認識応答装置
JP2656234B2 (ja) 会話音声理解方法
JP2705061B2 (ja) 音声認識方法
JP2000099099A (ja) データ再生装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070731

Year of fee payment: 12