JPS5946695A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS5946695A
JPS5946695A JP57155982A JP15598282A JPS5946695A JP S5946695 A JPS5946695 A JP S5946695A JP 57155982 A JP57155982 A JP 57155982A JP 15598282 A JP15598282 A JP 15598282A JP S5946695 A JPS5946695 A JP S5946695A
Authority
JP
Japan
Prior art keywords
voice
standard
speech
recognition
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57155982A
Other languages
English (en)
Inventor
徳子 松井
俊宏 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57155982A priority Critical patent/JPS5946695A/ja
Publication of JPS5946695A publication Critical patent/JPS5946695A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、認識対象の各単語に対応して複数組の標準音
声パタンを記憶しておき、人力音声に対する類似度が最
上位となる組の標準音声パタンを認識結果として出力・
表示する音声8.召識装置において、その認識率を向上
させるだめの音声認識方式に関するものである。
この種の音声認識装置における従来の音声認識方式は、
例えば、一連のザービスが完了する寸で、内蔵されてい
る複数組の全標準音声バタンを使用して音声認識処理を
行わせるようにしていたので、ある特定の発声者による
特定の短語が、ある特定組の標準音声パタンに関し−C
誤JaN止 l) /、:[り1・を起こし易いことが
あり、そのような場合には、一連の音声認識処理におい
て誤認識、リジェクトが当該単語について集中・多発を
するというおそれがあった。
〔発明の目的〕
本発明の目的は、上記した従来技術の欠点をなりシ、髄
に、発声者別に生ずる、尚°定単語の標準音声バタンの
特定組に対する誤認識を防止し、認識率を総合的に向上
することができる音声認識方式を提供することにある。
〔発明の概要〕
本発明に係る音声認識方式の構成は、認識対象の各単語
に対応して複数組の標準音jYIバタンデータを記憶し
ておき、人力音声の特徴抽出を行い、その特徴データと
上記各標準音声パタンデータとの類似度泪幻処理を行い
、その類似度が最上位となる標準音声パタンを認識結果
として判定・出力する機能を有する音声認識装置におい
て、あらかじめ登録されている上記入力音声に係る各発
声者の登録番号と、それらに対応する標準音声パタンの
各組番号との対応を記憶せしめておくことにより、音声
認識処理に先立って最初に入力される−にM己登録番号
の音声の認識結果に基づいて」−記憶i%(4音声パタ
ンの該当する組を選択し、これに基づいて以後の一連の
音声認識処理を行わしめるように制餌1・処理するもの
である。
なお4、登録対象の発声者に関する登録CI5、その登
録番号と認識対象の各単語とについての入力音声の特徴
抽出を行い、その登録番号を認識するとともに、その各
単語の特徴データを分析して当該音声対応すべき標準音
声パタンの組番号を求め、これらの対応を記憶せしめて
おくようにするものである。
〔発明の実施例〕
以下、本発明の実施例を図に基づいて説明する。
第1図は、本発明に係る音/″41R識方式の一実M+
j例の方式構成図、第2図は、その処理フrJ−チャ〜
1・である。
ここで、1は、制闘部であって、音声認識装置ンの各部
に対する制御をして所要の認識処理を行い、その認識結
果をホスト装置I−I S Tに伝え、これに所望のザ
ービス処理を行わしめるもの、2は、認識対象の各単語
に対応して各複数組の標準音声パタンデータが用意され
ている標準音声バタンメモリ、3は、標準音声バタン選
択部、4ば、音声認識部、5は、そのメタ/マツチング
の結果に応じて入力音声に対する標準音声パタンの組を
判定する判定部、6は、入力音声から特徴データを抽出
する分析部、7は、音声入出力回線(例えば、電話回線
L)に係る入出力部、8は、認識結果表示。
音声入力指示に係る音声合成部、9は、登録用の入力音
声の特徴抽出の結果(データ)に従って当該標準音声バ
タンを作成し、これを標準音声バタンメモリ2に格納(
記憶)せしめる標準音声バタン作成部、10は、認識対
象の各発声者の登録番号、当該標弗音声バタン組番号の
対応を記憶している対応メモ1ハ 11は、入力音声が
どの標準音声バタンの組に適合するかを分類する分類部
である。
まず、通常の音声認識処理について説明する。
制御部1は、音声入力に対する準備を音声昭識部4に指
示し、丑だ、すべての標準音声パタンを標準音声バタン
メモリ2がら選択するように標準音声バタン選択部3へ
指示する(第2図の処理21)。
まだ、この音声入力が最初のものであるか否かを判断し
、そうであればバタン選択コード(登録番号)の入力催
告の音声出力を音声合成部8.入出力部7を通して電話
回線へ送出せしめ(゛同処理22)、そうでなければ所
望の音声入力を引続いて行うように上記と同様に行う(
同処理23)。
これより、登録対象の発声者の音声が電話回線りから入
出力部7へ入力されると(同処理2+)、分析部6は、
入力された音声を分析し、その!1も徴データを抽出す
る(同処理25)。
次いで、音声認識部4は、単語登録でなければ標準音声
バタン選択部3が示す標僧音声バタンと、上記入力音声
バタンとの間でパタノマノチングを行い、その計算結果
の類似度を判定部5へ伝える(同処理26)。
判定部5は、送られてきた全類似度の中で最も類似した
標準音声バタンを認識結果として制御部1へ送る(同処
理27)。
入力音声に対して最も確からしい類似度の値が低く、認
識結果として決定するのは疑わしいとすべきりジェツト
の場合には、制御部1ば、標準音声バタン選択部3に対
して今址でと同一の標準音声パタンを選択するように指
示しく同処理31)、更に音声合成部8に対して再音声
入力を促すメツセージを入出力部7から電話回線りへ送
出するように指示しく開始J!J232)、以下、処理
24以下の処理を繰返すようにする。
寸だ、リジエツトでない場合には、その認識結果が正し
いものであるか否かを発声者に確認させるだめの表示と
して、確認要求メツセージを音声合成部8から入出力部
7を介して電話回線りへ送出させる(同処理28)。
対象発声者は、これを聴取して人力音声が正しく認識さ
れたのか、誤認識されたのかを知り、その旨を音声で人
出力部7へ入力する。これによって肖該情報は、分析部
6.音声認識部4を介して制御部1へ入力される(同処
理29)。
制御部1は、上記確認情報により、上述の認識候補が正
しいもの(正認識)であるときは、音声認識部4へ入力
音声に対する準備を指示するとともに、標準音声バタン
選択部3に対し、認識結果に基づく登録番号に対応する
標準音声バタン絹番号に従って対応メモリ10を参照し
ながら、該当する標準音声パタンの組を標準音声バタン
メモリ2から選択するように指示するので、以後の認識
処理は、その標準音声パタンか使用されるようになる(
同処理30)。
一方、誤認識であった場合、制御部1iIi、1−述の
りジェツトの場合と同機に処理31.32を行う。
以上の動作を一連のザービスが完了する1で繰  1り
返す。
次に、音声認識のザービスに先立ち、あらかじめ、登録
対象の発声者の発声が、用意されたど゛の標準音声パタ
ンに適合しているかを確認するリービス(処理)につい
て説明する。
まず、制御部1は、音声入力に対する準備を音声認識部
4に指示し、すべての標7V″踊声パタンを標準音声バ
タンメモリ2から選択するよう標準音声バタン選択部3
に指示する(同処理21)。
準備が完了すると、発声者に対して音声入力(登録番号
および認識対象の所定の単語の発声)を促すべき人力催
告メツセージが音声合成部8から入出力部7を通して電
話回線りへ送出される(同処理22)。
発声者が電話回線りかも入出力部7へ音声(登録番号)
を入力すると(同処理24)、分析部6は、人力された
音声を分析して特徴データを抽出する(同処理25)。
次いで、音声認識部4は、標準バタン選択部3が示す標
準音声パタンと、上記入力音声バタンとの間でバタンマ
ツチングを行い、その計算結果の類似度を判定部5へ伝
える(同処理26)。
判定部5は、送られてきた全類似度の中で最も類似した
標準音声パタンを認識結果として、制御部1へ送る(同
処理27)。
制(財)部1は、その認識結果が正しいものであるか否
かを発声者に確認されるだめの表示として、確認要求メ
ツセージを音声合成部7から出力させ、それを入出力部
7経由で電話口、!!Lへ送出さぜる(同処理28)。
発声者は、これを聴取して入力音声が正しく認識された
か、誤認識されたのかを知り、その旨を電話回線りから
人出部79分析部6.音声認識部4を介して制御部1へ
入力する(同処理29)。
制御部1は、」二記確認情報により、上述の認識候補が
正しいものであるときは、次に認識対象となるべき単語
に対する入力要求メツセージを音声合成部8.入出力部
7から電話回線■、へ送出させる。
なお、誤認識の場合には、制御部1は、標準バタン選択
部3に対し、今丑で選択していたものと同一バタンを選
択するように指示しく同処理31)、音声合成部8.入
出力部7経出で11丁発声人力を促すメツセージを電話
回線■、へ送出せしめる(同処理11)。
一方、前述の処理25の後で単語登録であることが判断
されると、制御部1は、標準音声バタン作成部9に対し
て当該バタンの作成をせしめ、それを標準音声バタンメ
モリ2に格納せしめるように制闘する(処理33)。
次いで、分類部11は、分析部で処理された入力バタン
か、登録されている標準音声パタンのどの絹に最も適合
しているかを分類しく同処理34)、その結果により、
当該標準音声バタン組番号、登録番号の対応を対応メモ
リ10に記憶せしめることができる(同処理35)。
上記実施例において、音声認識処理をすべき音声人力は
、電話回線りから行われるように説明したが、本発明は
、これに限定されるものでなく、マイクロフォン等から
直接に入力するようにすることを妨げるものでないこと
は明らかである。
〔発明の効果〕
以上、詳細に説明したように、本発明によれば、各発声
者ごとに適合した標準音声バタンによって音声認識処理
をすることができるので、特定者による発声が標準音声
パタンの特定組に誤認識されることが減少し、音声認識
装置における認識率向上、ザービス性向上に顕著な効果
が得られる。
【図面の簡単な説明】 第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フローチー\・−1・であ
る。 1・・・制御部、2・・・標準音声バタンメモリ、3・
・・標準音声バタン選択部、4・・・音声認識部、5・
・・判定部、6・・・分析部、7・・・入出力部、8・
・・音声合成部、9・・・標準音声バタン作成部、10
・・・対応メモリ、11・・・分類部。 代理人 弁理士 福田幸作− (ほか1名) 躬20

Claims (1)

  1. 【特許請求の範囲】 1、 認識対象の各単語に対応して複数組の標準音声バ
    タンデータを記憶しておき、入力音声の特徴抽出を行い
    、その特徴データと」二記各標準音声パタンデータとの
    類似度計算処理を行い、その類似度が最」三位となる標
    準音声バタンを認識結果として判定・出力する機能を有
    する音声認識装置において、あらかじめ登録されている
    上記入力音声に係る各発声者の登録番号と、それらに対
    応する標準音声パタンの各組番号との対応を記憶せしめ
    ておくようにし、音声ii、i!識処;FD、に先立っ
    て最初に入力される上記登録番号音声の認識結果に基づ
    いて」−記標準音声パタンの該当する組を選択し、これ
    に基づいて以後の一連の音声認識処理を行わしめるよう
    に制仰・処理することを特徴とする音声認識方式。 2、特許請求の範囲第1項記載のものにおいて、登録対
    象の発声者に関する登録は、その登録番号と認識対象の
    各単語とについての人力tf j”の!llj徴抽出全
    抽出、その登録番号を認識するとともに、その各単語の
    特徴データを分析して当該−8声に対応すべき標準音声
    パタンの組番号を求め、これらの対応を記憶ぜしめてお
    くようにしたものである音声認識方式。
JP57155982A 1982-09-09 1982-09-09 音声認識方式 Pending JPS5946695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57155982A JPS5946695A (ja) 1982-09-09 1982-09-09 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57155982A JPS5946695A (ja) 1982-09-09 1982-09-09 音声認識方式

Publications (1)

Publication Number Publication Date
JPS5946695A true JPS5946695A (ja) 1984-03-16

Family

ID=15617764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57155982A Pending JPS5946695A (ja) 1982-09-09 1982-09-09 音声認識方式

Country Status (1)

Country Link
JP (1) JPS5946695A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006086037A1 (en) * 2004-11-30 2006-08-17 The Regents Of The University Of California Braze system with matched coefficients of thermal expansion

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006086037A1 (en) * 2004-11-30 2006-08-17 The Regents Of The University Of California Braze system with matched coefficients of thermal expansion

Similar Documents

Publication Publication Date Title
US5719921A (en) Methods and apparatus for activating telephone services in response to speech
JPS5944639B2 (ja) 音声による異同認識方式における標準パタ−ン更新方法
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
JPS5946695A (ja) 音声認識方式
JP2000099090A (ja) 記号列を用いた話者認識方法
JP2000122678A (ja) 音声認識機器制御装置
KR100931790B1 (ko) 음성인식 시스템에서 발음명칭목록을 이용한 인식사전 생성 방법 및 그를 이용한 유사발음명칭 처리 방법
JPS59147397A (ja) 音声認識制御方式
JPS5915990A (ja) 音声認識方式
JPS5917598A (ja) 音声認識方式
JPS5915992A (ja) 音声認識方式
JPS59212900A (ja) 音声認識装置
JPS59111696A (ja) 音声認識方式
JPS5917597A (ja) 音声認識方式
JPS59195300A (ja) 音声認識装置
JPS5962900A (ja) 音声認識方式
JPS5934595A (ja) 音声認識処理方式
JPS59147396A (ja) 音声認識制御方式
JPH11184492A (ja) 話者認識装置及びその方法
JPS59111698A (ja) 音声認識方式
JPS5946697A (ja) 音声認識方式
JPS5946696A (ja) 音声認識方式
JPS5917596A (ja) 音声認識方式
JP2000250594A (ja) 話者認識装置
JPS6170594A (ja) 不特定話者音声認識方法