JPS61107399A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61107399A
JPS61107399A JP59229238A JP22923884A JPS61107399A JP S61107399 A JPS61107399 A JP S61107399A JP 59229238 A JP59229238 A JP 59229238A JP 22923884 A JP22923884 A JP 22923884A JP S61107399 A JPS61107399 A JP S61107399A
Authority
JP
Japan
Prior art keywords
voice
solicitation
sound
signal
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59229238A
Other languages
English (en)
Inventor
杉 伸夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59229238A priority Critical patent/JPS61107399A/ja
Publication of JPS61107399A publication Critical patent/JPS61107399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 E発明の技術分野] 本発明は、電話回線を利用した音声認識応答システムに
使用される音声認識装置に関する。
[発明の技術的背景とその問題点〕 近年、電話回線を通じてユーザから入力された音声を認
識し、この認識結果に応じて所定の内容の音声応答を行
なうシステムが開発されている。
このような音声認識応答システムでは、最初に発声者に
対して発声を促すための勧誘音を発生し、この後に発声
者から入力された音声を認識するように構成されている
ところで、システム側からの勧誘音が鳴り終わる以前に
、音声を発声する発声者が多数見られる。
このため、勧誘音と発声者の音声の両方が、同時にシス
テムに入力されることになる。この場合、発声された音
声が勧誘音より短時間であると、システムには音声入力
がされない状態と同様になり、リジェクト処理が行われ
る。また、発声された音声が勧誘音より長時間であると
、勧誘音が鳴り終わった後の音声部分だけが認識処理さ
れて、結果的に発声者の音声が誤認識されることになる
。即ち、従来のシステムでは、発声者が勧誘音の発生後
に発声されない場合、音響分析処理が不完全となること
があり、このためシステムの処理効率が著しく低下する
問題があった。
[発明の目的] 本発明の目的は、音声認識応答システムにおいて、発声
者が肋誘音の鳴り終わる以前に発声した場合でも、発声
者の音声を確実に認識することができ、システム全体の
処理効率を大幅に向上できる音声認識装置を提供するこ
とにある。
[発明の概要] 本発明は、発声者の発声した音声及び勧誘音の両方を同
時に取込み、勧誘音を除去した音声のみを認識する音声
!ill!識手段を偏手段いる。この音声認識手段は、
予め勧誘音のスペクトル情報を記憶・しており、入力し
た音声及び勧誘音からなる音声信号のスペクトルから上
記勧誘音のスペクトルを除去する手段を備えている。音
声認識手段は勧誘音が除去された音声信号に対する認識
処理を行なう。
このような音声認識手段により、勧誘音が鳴り終わる以
前に発声された音声を確実に認識することができる。こ
のため、音声認識応答システムの音声認識応答処理の効
率を高めることが可能となる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる音声認識応答システムの構成を示
すブロック図である。第1図において、回線制御装置1
0は、電話回線系と音声認識応答システム間の入出力制
御を行なう。電話回線系は、電話機11.電話回線12
及び電話交換R13からなる。システム側の音声認識装
[14は、音響分析装置15.スペクトル情報減算装置
(以下単に減算装置1)16.音声区間装置17及び識
別装置18を備えている。音響分析装置15は、回線制
御装置10から出力される音声をデジタル信号に変換し
、音響分析処理(音声パラメータ系列に変換するなどの
処理)を行なう。減算装置16は、音響分析袋[15か
ら出力される音声信号のスペクトル情報から勧誘音のス
ペクトル情報を減算する減算処理を行なう。勧誘音のス
ペクトル情報は、予めレジスタ19′に格納されている
。音声区間装置f17は、減算装置1Gから出力される
音声信号の始端及び終端を検出する。識別装置18は、
音声区間装置17で検出された区間の音声信号に対して
、辞書メモリ20に予め記憶されている標準パターンと
のマツチング処理を実行して認識処理を行なう。
システム制御装置21は、通常ではホストコンピュータ
からなり、識別装置18から認識結果Aを受信すると、
予め決定された応答処理を実行して応答データBを音声
応答装置122に出力する。またシステム制御装置21
は、システム全体の動作を制御し、発声者から音声を受
信する際に発声を促すための制御信号Cを勧誘音発生装
置23に出力する。
音声応答装@22は、システム制御装置21から出力さ
れた応答データBに応じた音声応答信号Rを回線制御装
置10に出力する。勧誘音発生装置23は、システム制
御装置21の制御信号Cに応じて、勧誘音信号Iを回線
料m装置10に出力する。
このような構成の音声認識応答システムにおいて、同実
施例の動作を説明する。先ず、ユーザが電話機11を操
作して、電話回線系とシステムとが回線制御装置10を
通じて接続されたとする。システム制御表[21は、発
声者に対して発声を促すためのメツセージを発生するよ
うに音声応答装置22の動作を制御する。音声応答装置
22は、例えば「サービスコードをどうぞ」のような音
声信号を回線制御袋[10に出力する。これにより、回
線制御袋@10を通じて、上記のような最初のメツセー
ジが電話回線12を介してユーザに伝達される。この後
、システム制御装置21の制御により、回線制御袋ji
i10は音声認識装置14と電話回線系を接続させる。
そして、システム制御l装置21が制御信号Cを出力す
ることにより、勧誘音発生装置23から勧誘音信号Iが
回線制御11装置10へ出力される。
ここで、ユーザである発声者が、勧誘音信号Iが鳴り終
わる以前に音声を発声したとする。この結果、音声認識
装置14の音響分析装置15には、回線料m装置10を
通じて発声者からの音声及び勧誘音信号Iが混在した状
態で入力される。音響分析装置15は、入力された音声
に対して音響分析処理を実行し、デジタル信号である音
声信号を出力する。この音声信号は、第2図(a)に示
すように、勧誘音信号■と発声者の音声の各スペクトル
が混在した信号である。このような音声信号は、減算装
ji116に出力される。減算装置16では、予めレジ
スタ19に記憶された勧誘音信号Iのスペクトル情報(
第2図(b)を参照)を使用して、音響分析装置15か
ら出力される音声信号のスペクトル情報から勧誘音信号
Iの°スペクトル情報が減算される。
これにより、同図(C)に示すように、勧誘音信号Iの
スペクトルを除去したスペクトルの音声信号Sが、減算
装置16から出力される。音声区間装置17は、減算装
置16から出力される音声信号Sの始端及び終端を検出
する。識別装置18は、音声区間装置17で検出された
区間(始端から終端)の音声信号Sに対する認識処理を
行なう。この認識処理では、辞書メモリ20に予め記憶
された標準パターンとのマツチング処理がなされて、最
大類似度i    を示す認識結果Aがシステム制御装
置21に出力される。
システム制御装置27では、認識結果Aに応じた応答処
理を実行して、所定の応答データBを音声応答装置22
に出力する。音声応答装置22は、応答データ8に応じ
て、例えば銀行の預金残高照会のメツセージである音声
応答信号Rを回線制御lIl装置10に出力する。
このようにして、勧誘音信号が発生する以前に音声!8
1!識装置の音声入力動作を開始し、発声者から発声さ
れた音声及び勧誘音信号の両方を同時に入力させる。音
声W&識装置では、勧誘音信号を除去した発声者からの
音声に対してのみ、音声認識処理が実行される。このた
め、発声者が勧誘音信号の鳴り終わる以前に発声した場
合でも、発声された音声を確実に認識処理することがで
き、音声の認識率を大幅に高めることができる。
[発明の効果] 以上詳述したように本発明によれば、音声認識応答シス
テムにおいて、発声者が勧誘音の鳴り終わる以前に発声
した場合でも、発声者の音声を確実に認識することがで
きる。したがつ゛て、発声者の発声動作の影響により、
音声!Ili動作におけるリジェクトまたは誤認識を大
幅に減少することができる。このため、結果的にシステ
ム全体の処理効率を大幅に向上できるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる音声!!!識応答シ
ステムの構成を示すブロック図、第2図(a)〜(C)
はそれぞれ同実施例の動作を説明するための波形図であ
る。 10・・・回線制御装置、15・・・音響分析装置、1
6・・・減算装置、17・・・音声区間装置、18・・
・識別装置、19・・・レジスタ、20・・・辞書メモ
リ、21・・・システム制御装置、22・・・音声応答
装置、23・・・勧誘音発生装置。

Claims (1)

    【特許請求の範囲】
  1. 電話回線を通じて音声入力を行なう発声者に対して勧誘
    音を出力する勧誘音発生手段と、この勧誘音発生手段か
    ら出力された勧誘音及び上記発声者が発声した音声を同
    時に取込み音響分析処理を行なう音響分析手段と、予め
    記憶した上記勧誘音に対応するスペクトル情報を使用し
    て上記音響分析手段から出力される音声信号から上記勧
    誘音信号を除去するスペクトル情報減算手段と、このス
    ペクトル情報減算手段から出力される音声信号に対して
    音声認識処理を行なう音声認識手段とを具備してなるこ
    とを特徴とする音声認識装置。
JP59229238A 1984-10-31 1984-10-31 音声認識装置 Pending JPS61107399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59229238A JPS61107399A (ja) 1984-10-31 1984-10-31 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59229238A JPS61107399A (ja) 1984-10-31 1984-10-31 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61107399A true JPS61107399A (ja) 1986-05-26

Family

ID=16888989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59229238A Pending JPS61107399A (ja) 1984-10-31 1984-10-31 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61107399A (ja)

Similar Documents

Publication Publication Date Title
JP4085924B2 (ja) 音声処理装置
JP2007233412A (ja) ユーザが定義したフレーズの話者に依存しない認識方法及びシステム
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
JP4486235B2 (ja) 音声認識装置
JPS61107399A (ja) 音声認識装置
JP2002101203A (ja) 音声処理システム、音声処理方法およびその方法を記憶した記憶媒体
JPH04324499A (ja) 音声認識装置
JP2656234B2 (ja) 会話音声理解方法
JP2002252705A (ja) 話者id検出方法及び装置
JPS6338995A (ja) 音声認識ダイアル電話装置
JPS61256397A (ja) 音声認識装置
JPS5946695A (ja) 音声認識方式
JPS61107397A (ja) 音声認識応答装置
JPS59195300A (ja) 音声認識装置
JPS5934596A (ja) 音声認識処理方式
JPH03188500A (ja) 音声認識装置
JPH0316038B2 (ja)
JPS6041863A (ja) プッシュホン音声入力装置
JPS6338994A (ja) 音声認識装置
JPS63125998A (ja) 音声入出力装置
JPS59176791A (ja) 音声登録方式
JPH0548763A (ja) 音声認識応答装置
JPS6338999A (ja) 音声認識装置
JPH0562358B2 (ja)
JPH07210188A (ja) 音声認識装置