JPS59111696A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS59111696A
JPS59111696A JP22031982A JP22031982A JPS59111696A JP S59111696 A JPS59111696 A JP S59111696A JP 22031982 A JP22031982 A JP 22031982A JP 22031982 A JP22031982 A JP 22031982A JP S59111696 A JPS59111696 A JP S59111696A
Authority
JP
Japan
Prior art keywords
voice
speech
input
standard
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP22031982A
Other languages
English (en)
Inventor
徳子 松井
俊宏 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP22031982A priority Critical patent/JPS59111696A/ja
Publication of JPS59111696A publication Critical patent/JPS59111696A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、音声の認識率を向上せしめるための方式に関
し、特に認識対象としての入力音声がホルマント周波数
の高群に属する入力音声、低群に2自“ 属する入力音声かを事前に入力音声によって確認してお
くことによって以降の入力音声が正しく認識されるよう
にした音声認識方式に関するものである。
〔従来技術〕
これまでの音声認識装置においてはホルマント周波数の
高群、低群別にそれぞれ数種類の標準音声パターンが用
意されてお多、入力音声の認識はこれら標準音声パター
ンを全て用いて行なわれるように々つている。ホルマン
ト周波数の高群、低群別に数種類の標準音声パターンが
用意されているのは性別によって、また、年令などによ
っても発声される音声は個人差を有していること全考慮
しているからに他ならない。しかしながら、従来にあっ
ては発音者による音声がホルマント周波数の高群に属す
るものであるか低群に属するものであるかを事前に何等
区別することなく、シたがって用意されている全ての標
準音声パターンを用い入力音声の認識全行なっていたこ
とから、往々にしてホルマント周波数の低群に属す入力
音声がホ3(1 ルマント周波数の高群に属す入力音声用の標準音声パタ
ーンに対して、捷た、これとは逆にホルマント周波数の
高群に属す入力音声がホルマント周波数の低群に属す入
力音声用の標準音声パターンに対して誤って認識され易
いという不具合がある。
〔発明の目的〕
よって本発明の目的は、入力音声がホルマント周波数の
低群、高群の何れに属する場合であってもその入力音声
金工しく認識し得る音声認識方式%式% 〔発明の概要〕 この目的のため本発明は、入力音声がホルマント周波数
の低群に属するか高群に属するかが事前に知れている場
合には音声の認識がよシ正しく行ない得ることに着目し
、サービス初期において入力される音声より以降入力さ
れる音声がホルマント周波数の低群に属するか高群に属
するかを事前に確認し、この認識結果にもとづいてホル
マント周波数の高群、低群の倒れか一方の標準音声パタ
ーンを用い入力音声の認識を行なうようにしたものであ
る。
〔発明の実施例〕
以下、本発明全第1図、第2図により説明する。
先ず本発明に係る音声認識装置について説明する。第1
図はその概要構成を示したものである。
これによると音声はスピーカ2より放声される指示内容
に従って入力されるようになってbる。制御部8は音声
合成部7を介しスピーカ2よシ必要な指示事項全放声す
る一方、この指示に促されて発声者はその指示内容に応
じた音声を発生するようになっているものである。発声
された音声はマイクロフォン1を介し音声入力・分析部
11で先ずA/D変換されたうえその音声の特徴が抽出
されるが、この抽出された特徴パターンが音声認識部6
で標準音声パターンとパターンマツチングされることに
よってその類似度が認識結果として得られるようになっ
ているわけである。パターンマツチングされる標準音声
パターンは予め制御部8の制御下にある標準音声パタ〜
ン選択部5によって標準音声パターンメモリ4よシ全部
捷たは特定のも5  −、f のが選択されるが、このようにして選択された標準音声
パターンとの間でパターンマツチングが行なわれるもの
である。この場合標準音声パターンメモリ4にはホルマ
ント周波数の低群に属す入力音声(一般に男性の音声)
用とホルマント周波数の高群に属す入力音声(一般に女
性の音声)用の標準音声パターンがそれぞれ数種類(例
えば8種類づつ)格納されているが、従来にあってはそ
れら全ての標準音声パターンとの間でパターンマツチン
グが行なわれるようになっていたわけでおる。
しかし、本発明による場合は事前に入力音声が男性によ
るものか女性によるものかが確認されるから、最初の音
声が入力された後は何れか一方の標準音声パターンだけ
が選択されるようになっている。入力音声が男性による
ものである場合には男性用の標準音声パターンを用いパ
ターンマツチングすれば、よシ正しく入力音声の認識が
行ない得るわけである。
ところで標準音声パターン内には各種の単語対応の音声
パターンが含まれているが、したがって61「 パターンマツチングはそれら単語対応の音声パターンと
の間で行なわれることになる。これらマツチング結果よ
り類似度が最も大きい単語は認識結果の候補として選択
されるが、このような事情は他の標準音声パターンとの
間でのパターンマツチングでも同様となっている。した
がって、制御部8にパターンマツチングの終了が報告さ
れる時点では選択された標準音声パターン対応に認識結
果の候補が全て出揃うことになるが、判定部10はそれ
ら候補から更に類似度が大のものを最終的な認識結果と
して制御部8に送るようになっているものである。これ
を制御部8がどのように処理するかは後述するところで
ある。
さて、第1図に示す音声認識装置は例えば銀行などにお
けるキャシュディスペンサの一部トして用いられるよう
になっているが、第2図はそのような用途に使用される
際での音声認識の処理フローを示したものである。
これによると制御部8は音声認識処理に先立って先ず音
声入力に対する準備を音声入力・分析部7r( 11および音声認識処理に指示するとともに、認識対象
となるべき標準音声パターン全標準音声パターン選択部
5を介し標準音声パターンメモリ4より読み出すべく制
御するようになっている。この場合選択的に読み出され
る標準音声)くターンは男性用、女性用の全てである。
これは、音声全入力する者がまだ男性であるか女性であ
るかが不明であるからである。これらの準備が完了する
と次に制御部8は発声者に対しこれから入力される音声
が最初のものであることを確認したうえ、何れか一方の
標準音声パターンを選択させるべく入力催告メツセージ
を音声合成部7を介しスピーカ2より放声するところと
なるものである。このメツセージによシ発声者はマイク
ロフォン1よυ音声を入力するが、この場合に入力され
る音声は例えば発声者が男性であれば゛イチ(1)”、
女性ならば”ゼロ(0)”とされる。入力音声がこのよ
うに簡単であれば何れの標準音声パターンによってもそ
の入力音声は容易に認識され得るからである。マイクロ
フォン1からの入力音声はこの後音声入力・分析部11
でディジタル変換されたうえその入力音声の特徴が抽出
されるが、抽出された入力音声の特徴パターンは次に音
声認識部6で予め選択されている全ての標準音声パター
ンとの間でパターンマツチングされるように々つている
。これによりその標準音声パターン内に含オれる個々の
単語対応(7)f声パターンとの間でパターンマツチン
グが行なわれ単語対応にマツチング結果が得られるもの
である。これらマツチング結果から類似度が最も大きい
単語は認識結果の候補として選択されるが、パターンマ
ツチングは予め選択されている他の標準音声パターンと
の間でも順次行なわれるようになっている。したがって
、制御部8にパターンマツチングの終了が報告される時
点では選択された標準音声パターン対応に認識結果の候
補が全て出揃うことになるが、判定部10はそれら候補
から更に類似度が大のものを最終的な認識結果として制
御部8に送るようになっているものである。
制御部8では判定部10からの最終的な認識結果の類似
度と一定値(リジェクト定数)と全比較す   cf ることによってその認識結果が妥当か否かが判定される
ようになっている。一定値以下である場合は妥当でない
として標準音声パターン選択部5に対してこれまでと同
一の標準音声パターン、即ち、全ての標準音声パターン
を選択するよう指示した後、同一の音声を入力するよう
催告するものである。一方、妥当でおると判定された場
合には、制御部8はその認識結果が正しいか否かを発声
者に確認させるべくその認識結果対応の音声と確認要求
メツセージを音声としてスピーカ2より放声するように
なっている。これに応じ発声者は確認結果をマイクロフ
ォン1より音声入力するが、確認結果の入力は必ずしも
音声によらない。コンソール部5が設けられている場合
にはコンソール部6より入力してもよいからである。こ
れによυ制御部8は認識結果が正しいか否かを知れるが
、誤認識であった場合には最終的な認識結果が妥当でな
いと判定された場合と同様に処理されるようになってい
る。これに対し認識結果が正しかった場合にはその認識
結果に応じた標準音声ノくターンを選10.1 択するよう指示するものである。認識結果が゛イチパで
あれば男性用のものを、また、6ゼロ°”であれば女性
用のものを選択するわけであシ、以降入力される音声の
認識処理はその選択された標準音声パターンを用い行な
われるわけである。この認識結果はホスト装置9に送出
されることによって最初の入力音声に対する音声認識処
理は終了するが、全てのサービスが終了しない限りにお
いては次の音声入力全催告しつつ入力音声の認識を行な
うようになっているものである。
〔発明の効果〕
以上説明したように本発明による場合は、最初の入力音
声よシ以降入力される音声がホルマント周波数の低群に
属すか高群に属すかが事前に知れ、以降入力される音声
は男性用か女性用の何れか一方の標準音声パターンによ
って認識され得るから、より確実に入力音声を識別し得
るという効果がある。
【図面の簡単な説明】
第1図は、本発明に係る音声認識装置の一例で11  
 Cτ の概略構成を示す図、第2図は、その装置での音声認識
処理の一例でのフローを示す図である。 1・・・マイクロフォン、4・・・標準音声パターンメ
モリ、5・・・標準音声パターン選択部、6・・・音声
認識部、8・・・制御部、10・・・判定部、11・・
・音声入力・分析部。 代理人 弁理士  秋 本 正 実

Claims (1)

    【特許請求の範囲】
  1. 入力音声を分析することによって該音声よシ特徴パター
    ンを抽出したうえ標準音声パターンとの間でパターンマ
    ツチング全行ない、該マツチングの結果より上記入力音
    声を認識する音声認識方式にして、音声認識のサービス
    初期において入力さ全事前に確認し、該確認結果に応じ
    ホルマント周波数の高群、低群の何れか一方の標準音声
    パターン全選択したうえ以降入力される音声の認Rをサ
    ービス終了に至るまで行なうことを特徴とする音声認識
    方式。
JP22031982A 1982-12-17 1982-12-17 音声認識方式 Pending JPS59111696A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22031982A JPS59111696A (ja) 1982-12-17 1982-12-17 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22031982A JPS59111696A (ja) 1982-12-17 1982-12-17 音声認識方式

Publications (1)

Publication Number Publication Date
JPS59111696A true JPS59111696A (ja) 1984-06-27

Family

ID=16749274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22031982A Pending JPS59111696A (ja) 1982-12-17 1982-12-17 音声認識方式

Country Status (1)

Country Link
JP (1) JPS59111696A (ja)

Similar Documents

Publication Publication Date Title
US6671672B1 (en) Voice authentication system having cognitive recall mechanism for password verification
US5719921A (en) Methods and apparatus for activating telephone services in response to speech
US4403114A (en) Speaker recognizer in which a significant part of a preselected one of input and reference patterns is pattern matched to a time normalized part of the other
JP2002032213A (ja) ボイス・メール・メッセージを転記する方法およびシステム
US20010056345A1 (en) Method and system for speech recognition of the alphabet
EP1187441B1 (en) Audio recognition method and device for sequence of numbers
JPS59111696A (ja) 音声認識方式
JPH09230889A (ja) 音声認識応答装置
JP2009086207A (ja) 議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム
JP2656234B2 (ja) 会話音声理解方法
JPS6338996A (ja) 音声認識制御方式
JPS59111698A (ja) 音声認識方式
JPS59147397A (ja) 音声認識制御方式
JPS5946695A (ja) 音声認識方式
JPS59111697A (ja) 音声認識方式
JPS5915990A (ja) 音声認識方式
JPS59212900A (ja) 音声認識装置
JPS5917598A (ja) 音声認識方式
JPS604999A (ja) 音声認識方法
JPS5917597A (ja) 音声認識方式
JPS5988799A (ja) 音声パタン登録方式
JPS6170594A (ja) 不特定話者音声認識方法
JPS5962900A (ja) 音声認識方式
JPS59176791A (ja) 音声登録方式
JPH0465391B2 (ja)