JPS5915992A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS5915992A
JPS5915992A JP57124485A JP12448582A JPS5915992A JP S5915992 A JPS5915992 A JP S5915992A JP 57124485 A JP57124485 A JP 57124485A JP 12448582 A JP12448582 A JP 12448582A JP S5915992 A JPS5915992 A JP S5915992A
Authority
JP
Japan
Prior art keywords
voice
recognition
standard
speech
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57124485A
Other languages
English (en)
Inventor
徳子 松井
俊宏 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57124485A priority Critical patent/JPS5915992A/ja
Publication of JPS5915992A publication Critical patent/JPS5915992A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、認識対象の各単語に対応して複数組の標準音
声パタンを内蔵(格納、記憶)している音声認識装置に
おいて、その認識率の向上および誤認識時(認識結果が
当該発声者等の確認によって誤りであるものとされた時
)の訂正処理の効率向上を図るだめの音声認識方式に関
するものである。
この種の音声認識装置における従来の音声認識方式は、
例えば、一連のサービスが完了するまで、内蔵されてい
る複数組の全標準音声・;タンを使用して音声認識処理
を行わせるようにしていたので、発声者の発声特性によ
っては、男性による音声(一般にホルマント周波数が比
較的に低いもので、以下、単に男声という。)の人力が
、むしろ女性による音声(一般にホルマント周波数が比
較的に高いもので、以下、単に女声という。)用の特定
組の標準音声バタンに類似している場合や、その逆の場
合もあって誤認識が起こり易いこともあった。
また誤認識が発生したときには、同一内容のものを再発
声させ、かつ、誤認識の場合におけるものと全く同一内
容の音声認識処理を行うようにしていた。
しかしながら、誤認識をしたということは、その発声音
声バタンか、各標準音声パタンのうちで真に上記発声音
声バタンに近いものとして認識・判定されるべき標準音
声パタンよりも、誤認識の結果となった標準音声パタン
に近かったということである。
したがって、上述のように同一内容の音声認識処理を繰
り返しても、反復して同様な誤認識となる確率が高く、
正しい認識結果が得られるまでには、相当に多くの発声
の繰返しをしなければならないので、認識に要する時間
が長くなるとともに、発声者に対する負担も大きくなる
という問題があった。
本発明の目的は、上記した従来技術の欠点をなくシ、特
に発声者によって標準音声パタンの特定組に対する誤認
識を防止して認識率の向上を可能とするとともに、人力
音声の認識処理の結果により誤認識となったときは、次
の繰返し認識の認識率を向上せしめて当該訂正処理の効
率向上を可能とする音声認識方式を提供することにある
本発明に係る音声認識方式の構成は、認識対象の各単語
に対応して複数組の標準音声バタンデータを記憶してお
き、人力音声の特徴抽出を行い、その特徴データと上記
全標準音声バタンデータとの類似度計算処理を行い、そ
の類似度が当該人力音声に対して最上位となる標準音声
パタンを認識紡毛として判定・出力する機能を有する音
声認識装置l/l−いて、標準音声パタンに関してポル
マント周波数の高群・低群別に各所定数の組の標準音声
バタンデータを記憶しておくようにし、一連の音声認識
処理について、最初に正認識結果が得られた場合の対象
標準音声バタンか属する上記ポルマント周波数の高群・
低群いずれかの群の標準音声バタンデータの全組を用い
、その後の入力音声の認識処理を行うとともに、第2回
目以後の人力音声の認識結果が誤認識となったときは、
それまで用いられてきた標準音声パタンか属する上記ホ
ルマント周波数の高群・低群を入れ替えた標準音声バタ
ンデータの各組を用いて繰返し音声認識処理を行わしめ
るように制御・処理するものである。
これを要するに、女声、男声の音響的性質の相違を利用
することにより、発声者に応じて適切な標準音声パタン
を用い、全体の認識率の向上、または誤認識の場合の訂
正処理の効率向上を図ろうとするものである。
以下、本発明の実施例を図に基づいて説明する。
第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フローチャートである。
ここで、1は、認識対象の各単語についてホルマント周
波数の高群・低群の音声(例えば、女声・男声)に対す
る各同一内容の複数組(例えば、各8組)の標準音声パ
タン・データを格納(記憶)している標準音声バタンメ
モ1ハ2は、そノ選択制御をする標準音声バタン選択部
、3は、音声人力に係るマイクロフォン、4は、その人
力音声の特徴抽出をする分析部、5は、その特徴データ
と標準音声パタンデータとの類似度計算処理(バタンマ
ツチング処理)を行う音声認識部、6は、その処理結果
に基づき入力音声に対する類似度が高い標準音声パタン
の組(すなわち、入力音声が女声、男声いずれの組に多
く類似していたか)を判定する判定部、7ば、認識結果
の表示に係る音声合成部、8は、同スピーカ、9は、認
識結果の確認および繰返し音声入力の指示に係るコンノ
ール部、10は、上記各部に対する制御その他所安の処
理を行う制御部、11は、認識結果に基づいて所望の処
理をするホスト装置である。
まず、マイクロフォン3からの人力音声の認識に先立ち
、制御部10は、音声人力に対する準備を分析部4.音
声認識部5に指示し、才だ、その時の認識対象となるべ
き単語の標準音声パタンの全組のデータを標準音声バタ
ンメモリ1から選択するように標準音声バタン選択部2
に指示する(第2図の処理21)。
これらの準備が完了すると、発声者に対して音声人力を
促すべき入力催告メツセージを出力するよう音声合成部
7に指示し、スピーカ8から同メツセージを放声せしめ
る(処理22)。
これにより、発声者がマイクロフォン3から音声人力を
すると(処理23)、分析部4は、その入力音声の音声
分析として特徴抽出を行う(処理24)。
音声認識部5は、上述のように制砥部10からの開側]
により標準バタン選択部2が選択・指示する標準音声バ
タン全組(例えば、16組)のデータと上記人力音声の
特徴データとの間で類似度計算処理(バタンマツチング
処理)を行い、上記各組の中から入力音声との類似度が
最上位のものを認識結果の候補とするとともに、すべて
の認識結果、類似度を判定部6.制御部10に伝える(
処理25)。
制御部10は、認識結果の類似度が前もって定めら−れ
た定数(リジェクト定数)よりも低く、認識結果として
出力するには疑わしいものとみなすべき認識結果(リジ
ェクト)に該当するかかどうかを判断しく判断27)、
リジェクトの場合には、標準音声バタン選択部2に対し
て全組の標準音声バタンを選択するように指示しく処1
fi35)、更に音声合成部に対して再び同一内容の人
力催告メツセージを出力するよう指示し、同メツセージ
をスピーカ8から放声せしめる(処理36)。これによ
り、上述と同様な再認識処理が行われる。
一方、リジェクトでない場合には、その認識結果が正し
いものであるか否かを発声者に確認させるだめの表示と
して、確認要求メツセージを音声合成部7経由でスピー
カ8から放声せしめる(処理28)。
発声者は、これを聴取して人力音声が正しい認識(正認
識)をされたのか、誤った認識(誤認識)をされたのか
を知り、その旨をコンソール部9から制御部10へ入力
する(処理29)。
この認識結果の正否の確認人力は、必ずしもコンソール
部9における操作による必要はなく、マイクロフォン3
からの確認用音声人力によってもよいが、その内容は、
音声認識が確実に行われるように簡単で誤認識をしにく
いものであるものが望ましい。
次に、制(財)部10は、正認識であったか否かを判断
しく判断30)、そうでない場合には、更にこの認識処
理が第1回目の人力音声に対するものであるか否かを判
断しく判断37)、そうでアカときは、リジェクト時と
同様に前述の処理35゜36を行い、第1回目で6り)
ときは、標準音声・くタン選択部2に対して標準音声、
Sり/の群(女声用または男声用)を誤認識の対象とな
ったものから他群へ変更するように指示しく処理38)
、更に再人力の催告メツセージを音声合成部7経由でス
ピーカ8から放声せしめる(処理39)。
正認識であった場合には、必要に応じて上記認識結果の
確認情報によって当該標準音声、Sタン情報をホスト装
置11へ送出するとともに、この音声認識処理が一連の
処理の第1回目であるか否かを判断しく判断31)、第
1回目であ′るときは、正認識をした標準音声パタンの
絹の中で女声用。
男声用いずれかが多かったかの集計情報を判定部6から
受は取り、標準音声バタン選択部2に対して次の認識の
標準音声パタンの選択内容を上記情報に応じて女声用ま
たは男声用いずれかの群に限るように指示しておく(処
理32)。
また、第2回目以降の認識であったときは(判断31O
Noのときは)、前回と同一群の標準音声パタンを選1
?するように指示しておく(処理33)。
次いで、それまでの開側1.処理で一連のザービス動作
が終了したか否かを判断しく判断34)、終了していな
ければ、再び前述の処理22へ戻って同様な処理を繰り
返し、終了していれば、全処理を終了せしめる。
このようにして、最初の正認識がされた後には、発声者
に対して適合した女声または男声の標準音声パタンだけ
が認識処理に用いられることになるので、発声者により
特定の組の標準音声・々タンに対する誤認識が多く発生
することを防止し、認識率の向上とともに認識時間の減
少も得られ、る。
また、誤認識となったときに、対象となった標準音声バ
タンの群を切り替えて次の繰返し認識を行うので、以後
、認識率を高くすることができるとともに、その訂正処
理の効率向上も可能となる。
以上、詳、細に説明したように、本発明によれば、認識
率を向上し、また、誤認識となったときの訂正処理の効
率を向上することができるので、この種の音声認識/ス
テムにおける信頼性、サービス性、効率の向上に顕著な
効果が得られる。
【図面の簡単な説明】
第1図は、本発明に係る音声認識方式の一実施例の方式
構成図、第2図は、その処理フローチャートである。 1・・・標準音声バタンメモリ、2・・・標準音声バタ
ン選択部、3・・・マイクロフォン、4・・・分析部、
5・・・音声認R部、6・・・判定部、7・・・音声合
成部、訃・・スピーカ、9・・・コンソール部、10・
・・制御部、11・・・ホスト装置。 、# 1 目 第2目

Claims (1)

  1. 【特許請求の範囲】 1、 認識対象の各単語に対応して複数組の標準音声バ
    タンデータを記憶しておき、入力音声の特徴抽出を行い
    、その特徴データと上記全標準音声パ友 タンデータとの類似値計算処理を行い、その類似度が当
    該入力音声に対して最上位となる標準音声バタンを認識
    結果として判定・出力する機能を有する音声認識装置に
    おいて、標準音声パタンに関してホルマント周波数の高
    群・低群別に各所定数の組の標準音声バタンデータを記
    憶しておくようにし、一連の音声認識処理について、最
    初に正認識結果が得られた場合の対象標準音声バタンか
    属する上記ホルマント周波数の高群・低群いずれかの群
    の標準音声バタンデータの全組を用い、その後の入力音
    声の認識処理を行うとともに、第2回目以後の人力音声
    の認識結果が誤認識となったとは、それまで用いられて
    きた標準音声パタンか属する上記ホルマント周波数の高
    群・低群を入れ替えた標準音声バタンデータの各組を用
    いて繰返し音声認識処理を行わしめるように制御・処理
    することを特徴とする音声認識方式。
JP57124485A 1982-07-19 1982-07-19 音声認識方式 Pending JPS5915992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57124485A JPS5915992A (ja) 1982-07-19 1982-07-19 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57124485A JPS5915992A (ja) 1982-07-19 1982-07-19 音声認識方式

Publications (1)

Publication Number Publication Date
JPS5915992A true JPS5915992A (ja) 1984-01-27

Family

ID=14886675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57124485A Pending JPS5915992A (ja) 1982-07-19 1982-07-19 音声認識方式

Country Status (1)

Country Link
JP (1) JPS5915992A (ja)

Similar Documents

Publication Publication Date Title
CN105765650B (zh) 带有多向解码的语音辨识器
CN111063341A (zh) 复杂环境中多人语音的分割聚类方法及系统
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
JP2008309856A (ja) 音声認識装置及び会議システム
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
CN113744742B (zh) 对话场景下的角色识别方法、装置和系统
JPS5915992A (ja) 音声認識方式
CN106971734B (zh) 一种可根据模型的提取频率训练识别模型的方法及系统
JPS5915990A (ja) 音声認識方式
JPS5917597A (ja) 音声認識方式
JPS5917598A (ja) 音声認識方式
JPS5946695A (ja) 音声認識方式
KR100931790B1 (ko) 음성인식 시스템에서 발음명칭목록을 이용한 인식사전 생성 방법 및 그를 이용한 유사발음명칭 처리 방법
JPH04324499A (ja) 音声認識装置
JPS59147397A (ja) 音声認識制御方式
JPS59212900A (ja) 音声認識装置
JPS5915991A (ja) 音声認識方式
JP2004126198A (ja) 信号抽出システム、信号抽出方法および信号抽出プログラム
JPS5962900A (ja) 音声認識方式
JPS5917595A (ja) 音声認識方式
JPS5918998A (ja) 音声認識方式
JPS5917596A (ja) 音声認識方式
JPS5945499A (ja) 音声認識方式
JPS5934595A (ja) 音声認識処理方式
JPH0534679B2 (ja)