JPS5918998A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS5918998A
JPS5918998A JP57127724A JP12772482A JPS5918998A JP S5918998 A JPS5918998 A JP S5918998A JP 57127724 A JP57127724 A JP 57127724A JP 12772482 A JP12772482 A JP 12772482A JP S5918998 A JPS5918998 A JP S5918998A
Authority
JP
Japan
Prior art keywords
voice
standard
recognition
speech
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57127724A
Other languages
English (en)
Inventor
徳子 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57127724A priority Critical patent/JPS5918998A/ja
Publication of JPS5918998A publication Critical patent/JPS5918998A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、認識対象の各単語に対応して複数組効率向上
を行うための音声認識方式に関するものである。
この種の音声認識装置における従来の音声認識方式は、
例えば、一連のサービスが完了する址で、内蔵されてい
る複数組の全標準音声バタンを使用して音声認識処理を
行わせるようにしていたので、発声者の発声特性によっ
ては、男性による音声(一般にホルマント周波数が比較
的に低いもので、以下、単に男声という。)の入力が、
むしろ女性    ゛による音声(一般にホルマント周
波数が比較的に高いもので、以下、単に女声という。)
川の特定組の標準音声パタンに類似している場合や、そ
の逆の場合もあって誤認識が起こり易いこともあつ7ζ
まだ、誤認識が発生したときには、同一内容の時 ものを再発声させ、かつ、当該誤認識におけるもへ のと全く同一内容の音声認識処理を行うようにしていた
しかしながら、誤認識をしたということは、その発声内
容が、各標準音声バタンのうちで真に上記発声内容に近
いものとして認識・判定されるべき標準i′1声バタン
よりも、誤認識の結果となった標準音声パタンに近かっ
たということである。まだ、発声者側からみても、なぜ
誤認識となったかを推定する方法も全くなかった。
しだがって、上述のように同一内容のば声認識処理を繰
り返しても、反復して同様な誤認識となる確率が商く、
正しい認識結果が得られるまでにし11、相当に多くの
発声の繰返しをしなければならないので、認識に要する
時間が長くなるとともに、発声者に対する負担も大きく
なるという問題があった。
本発明の目的は、」二言己した従来技術の欠点をなくシ
、誤認識が発生したとき、特に、発声者によって標準音
声パタンの特定の種類に対する誤認識が発生したとき、
次の繰返し音声認識の認識率を向上せしめて当該豹正処
理の効率向上を可能とする音声認識方式を提供すること
にある。
本発明に係る音声認識方式の構成は、認識対象の各単語
に対応して複数組の標準音声バタンデータを記憶してお
き、入力音声の特徴抽出を行い、その特徴データと上記
全標準音声パタンデータとの類似変信1算処理を行い、
その類似度が当該入力音声に対して最上位となる標準音
声パタンを認識結果として判定・出力する機能を翁する
音声認識装置において、標準音声パタンに関してポルマ
ント周波数の高群・低群別に標準音声バタンデータを記
憶しておくようにし、一連の音声認識処理について、類
似度が最上位となった標準1イ声パタンが上記ホルマン
ト周波数の高群・低群いずれに属するかに応じて尚該同
一群寸たは他の群いずれか所定のものに対応するホルマ
ント周波数構成の確認要求ツノセージの合成音声を送出
し、これに対して返送される認識結果の正否、標準音声
バタン種類指定その他所要の情報からなる確認情報に基
つき、その後の繰返し音声認識処理を上記標準音声バタ
ン種類指定に従って行わしめるよう制御・処理するもの
である。
これを要するに、特に誤認識であったときに、確認要求
の合成音声がホルマント周波数構成の高。
低いずれのもの(男声1女声)であるかに応じ、発声者
が、当該音声認識結果がホルマント周波数の高群、低群
(女声、男声)いずれの標準音声パタンによっているか
を知ることができるので、それに対応して以後の音声認
識処理を自己の音声が適合し易い標準音声バタン種類(
ホルマント周波数の高群、低群、すなわち女声、男声の
もの)に」:つて行うように指定しうるようにし、繰返
し音声認識の認識率の向」二を図ろうとするものである
以下、本発明の実施例を図に基づいて説明する。
第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フローチャー1・である。
ここで、1は、認識対象の各単語について複数組の標準
音声バタンデータをホルマント周波数の高群・低群(例
えば、女声・男声)別に格納(記憶)している標準音声
バタンメモリ、2は、その選択制御をする標準音声バタ
ン選択部、3は、音声入力に係るマイクロフォン、4は
、その入力音声の特徴抽出をする分析部、5は、その特
徴データと標準音声バタンデータとの類似度計算処理(
バタンマツチング処理)を行う音声認識部、6は、その
処理結果に基づき入力音声に対する類似度が高い標準音
声パタンの組を判定する判定部、7は、認識結果の表示
に係る音声合成部であって、後述する制御部10の指示
によって上記標準音声パタンのホルマント周波数の高群
・低群に対応するホルマント周波数構成の合成音声(例
えば、女声、男声)を送出するもの、8は、同スピーカ
、9は、認識結果の確認および繰返し音声人力の指示に
係るコンソール部、10は、上記各部に対する制御その
他所要の処理を行う制御部、11は、認識結果に基づい
て所望の処理をするポスト装置である。
まず、マイクロフォン3からの入力音声の認識に先立ち
、制御部10は、音声入力に対する準備を分析部4.音
声認識部5に指示し、丑だ、その時の認識対象となるべ
き単語の標準音声バタンの全組のデータを標準音声バタ
ンノモリ1から選択づ゛るように標準音声バタン選択部
2に指示する(第2図の処理21)。
これらの7箇備が完了すると、発声者に対して音声入力
を促すべき入力催告メンセージを出力する」、う音声合
成部7に指示し、スピーカ8から同メツセージを放声せ
しめる(処理22)。
これにより、発声者がマイクロフォン3から音声入力を
すると(処理23)、分析部4は、その入力音声の音声
分析をして特徴抽出を行う(処理24)。
音声認識部5は、上述のように制御部10からの制御に
より標準バタン選択部2が選択・指示する標準音声バタ
ン全組のデータと」二記入力音声の特徴データとの間で
類似度計算処理(バタンマツチング処理〕を行い、上記
各組の中から入力音声との類似度が最上位のものを認識
結果の候補とするとともに、すべての認識結果、類似度
を判定部6に伝える(処理25)。
判定部6は、類似度が最上位の標準音声パタンの糾を判
定し、そのデータ(組の識別データ、女声・男声別等)
を制御部10へ報告する(処理26)。
これにより、まず、制御部10は、以後(特に認識結果
の確認時)出力すべき合成音声の種類(例えば女声、男
声)を決定しておく。すなわち、判定部6からの上記デ
ータにより、当該認識結果が女声、男声に応じて同一ま
だは他のもの(例えば、認識結果が女声に係るものであ
るときは、女声または男声であって、逆のときは、男声
寸たは女声)の合成音声を送出しうるようにしておく(
処理27)。
制御部10は、認識結果の類似度が前もって定められた
定数(リジェクト定数)よりも低く、認識結果として出
力するには疑わしいものとみなすべき認識結果(リジェ
クト)に該尚するかどうかを判断しく判断28)、リジ
ェクトの場合には、標準音声パクン選択部2に対して再
び同一の標準音声パタンを選択するように指示しく処理
33)、史にi7声合成部に対して再び同一内容の入力
催告ノンセージを出力するよう指示し、同メツセージを
スピーカ8から放声せしめる(処理34)。これにより
、上述と同様な再認識処理が行われる。
一方、リジェクトでない場合には、その認識結果が正し
いものであるか否かを発声者に確認させるだめの表示と
して、前述の処理27で決定した種類の合成音声(女声
寸たは男声)により、確認要求メンセージを音声合成部
7経由でスピーカ8から放声ぜしめる(処理29)。
発声者は、これを聴取し、て人力音声が正しい認識(正
認識)をされたのか、誤った認識(誤認識)をされたの
かを知り、その旨を確認情報の一つとしてコンソール部
9から制御部10へ入力する(処理30)。
この認識結果の正否の確認入力は、必ずしもコンソール
部9における操作による必要はなく、マイクロフォン3
からの確認用音声入力によってもよいが、その内容は、
音声認識が確実に行われるように簡単で誤認識をしにく
いものであるものが望ましい。
制御部10は、」二記確認情報により正認識(上記認識
候補が正しいものであること)であったか否かの判断を
しく判断31)、正認識であった場合には、必要に応じ
て上記認識結果をホスト装置11へ送出せしめた後、一
連のザービス動作が終了したか否かを判断しく判断32
)、終了していないときは、−I′+]び前述の処理2
1へ戻って次の人力音声の認識処理を行い、終了してい
るときは、全認識結果をホスト装置11へ送出し、1つ
の人力音声に対する認識処理を終了し、次の入力に倫え
る。
一方、誤認識であった場合には、Xli制御部10は、
確認情報の一つとして以後に使1月すべき標準音声パタ
ンの種類(例えば、女声捷たは男声のもの)を選択する
ように要求する音声(例えば、処理29と同一種類)を
音声合成部7経由でスピーカ8から発声者に対して放声
せしめるようにする(処理35)。
これは、前述の確認要求メツセージの音声の種類(例え
ば、女声まだは男声)により、誤認識結果の対象となっ
た標糸音声バタンの種類(女声まだは男声)が知られて
いるので、例えば、次の繰返し認識処理においては、そ
の発声者の発声特徴に応じた経験的(まだは実験的)既
知情報により、同一または他の種類の標準音声バタンを
使用するように指定せしめるだめである。
したがって、発声者は、標準音声パタンの種類(例えば
、女声捷たは男声)の指定をコンソール部9から制御部
10へ入力せしめる(処理36)。
制御部10は、この指定に基づいて以後の繰返し音声認
識処理において使用すべき標準音声パタンの種類(例え
ば、女声まだは男声)を選択するように標準音声バタン
選択部2に指示する(処理37)。
寸だ、出力すべき合成音声の種類(上記処理36におけ
る指定に対応するもの)を決定しく処理38)、音声合
成部7経由でスピーカ8がら繰返し音声認識処理のだめ
の入力催告の放声をせしめ(処理39)、以後、前述と
同様に処理23以下が繰り返される。
なお、この場合の合成音声の種類(例えば、女声捷たけ
男声)は、必ずしも上述のようにして決定する必要がな
く、例えば、処理27で決定されたものをそのまま用い
るようにしてもよいが、上述のようにすると、発声者が
自己の指定を装置側に確実に伝達しえたことを確認し、
その信頼感を増加せしめることができる。
このようにして、誤認識となったときには、発声者自身
の確認に従って次に使用すべき適切な標準音声パタンの
種類を決定しうるので、繰返し音声認識処理における認
識率を大幅に向上させることが可能となり、ひいては総
合的な認識率向上にもなる。
以上、詳細に説明したように、本発明によれば、誤認識
となったときの訂正処理の効率を向上し、C・いては総
合的な認識率の向上をすることができるので、この種の
音声認識システムにおける信頼性、ザービス性、効率の
向上に顕著な効果が得られる。
【図面の簡単な説明】
第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フローチャー1・である。 1・・・標準音声バタンメモリ、2・・・標準音声バタ
ン選択部、3・・・マイクロフォン、4・・・分析部、
5・・・音声認識部、6・・・判定部、7・・・音声合
成部、8・・・スピーカ、9・・・コンソール部、1o
・・・制御部、】1・・・ホスト装置。 代理人 弁理士 福田幸作 (ほか1名) 茅 1 目

Claims (1)

    【特許請求の範囲】
  1. ■、認識対象の各単語に対応して複数組の標準音声バタ
    ンデータを記憶しておき、入力音声の特徴抽出を行い、
    その特徴データと上記全標準音声バタンデータとの類似
    度計算処理を行い、その類似度が当該入力音声に対して
    最上位となる標準音声バタンを認識結果として判定・出
    力する機能を有する音声認識装置において、標準音声パ
    タンに関してポルマント周波数の高群・低群別に標準バ
    タンデータを記憶しておくようにし、一連の音声認識処
    理について、類似度が最上位となった標準音声パタンか
    上記ホルマント周波数の高群・低群いずれに属するかに
    応じて当該同一群捷たけ他の群いずれか所定のものに対
    応するホルマント周波数構成の確認要求メツセージの合
    成音声を送出し、これに対して返送される認識結果の正
    否、標準音声バタン種類指定その他所要の情報からなる
    確認情報に基づき、その後の繰返し音声認識処理を上記
    標準音声バタン種類指定に従って行わしめるように制御
    ・処理することを特徴とするーiイ声認識方式。
JP57127724A 1982-07-23 1982-07-23 音声認識方式 Pending JPS5918998A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57127724A JPS5918998A (ja) 1982-07-23 1982-07-23 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57127724A JPS5918998A (ja) 1982-07-23 1982-07-23 音声認識方式

Publications (1)

Publication Number Publication Date
JPS5918998A true JPS5918998A (ja) 1984-01-31

Family

ID=14967133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57127724A Pending JPS5918998A (ja) 1982-07-23 1982-07-23 音声認識方式

Country Status (1)

Country Link
JP (1) JPS5918998A (ja)

Similar Documents

Publication Publication Date Title
CN105765650B (zh) 带有多向解码的语音辨识器
US9583102B2 (en) Method of controlling interactive system, method of controlling server, server, and interactive device
US6975986B2 (en) Voice spelling in an audio-only interface
DE112021001064T5 (de) Vorrichtungsgerichtete Äußerungserkennung
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
JPS603699A (ja) 適応性自動離散音声認識方法
CA1325479C (en) Speech recognition
CN111412587B (zh) 空调器的语音处理方法、装置、空调器和存储介质
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JPS5918998A (ja) 音声認識方式
JPS59212900A (ja) 音声認識装置
JPS59147397A (ja) 音声認識制御方式
JPS5917597A (ja) 音声認識方式
JPS5915990A (ja) 音声認識方式
JPS5917598A (ja) 音声認識方式
JPS5915991A (ja) 音声認識方式
JPS5917595A (ja) 音声認識方式
JP2001175279A (ja) 音声認識方法
JPS5915992A (ja) 音声認識方式
JPS5988798A (ja) 音声認識処理方式
JPS5946696A (ja) 音声認識方式
JPS5962900A (ja) 音声認識方式
JPS5917596A (ja) 音声認識方式
JPS59147396A (ja) 音声認識制御方式
JPS6126678B2 (ja)