JPS59111697A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS59111697A
JPS59111697A JP57220320A JP22032082A JPS59111697A JP S59111697 A JPS59111697 A JP S59111697A JP 57220320 A JP57220320 A JP 57220320A JP 22032082 A JP22032082 A JP 22032082A JP S59111697 A JPS59111697 A JP S59111697A
Authority
JP
Japan
Prior art keywords
voice
speech
input
section
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57220320A
Other languages
English (en)
Inventor
徳子 松井
俊宏 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57220320A priority Critical patent/JPS59111697A/ja
Publication of JPS59111697A publication Critical patent/JPS59111697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、音声の認識率を向上させるための方式に関し
、特に発声者の音声パワーに応じて音声を区間検出のた
めのノ4ラメータ’kW史することによって音声が正し
く認識されるようにした音声認識方式に関するものであ
る。
〔従来技術〕
2  α これまでの音声認識方式においては、発声者による音声
は電気信号に変換されたうえA/D変換されるようにな
っており、更にこのA/D変換された音声は予め設定さ
れた一定・母うメータ(しきい値)と比較されることに
よって音声区間が検出されるようになっているのが実情
である。音声区間が正しく検出されて初めて音声の認識
も正しく行なわれるようになっているわけであるが、従
来にあっては音声区間検出用の/fラメータが常時一定
トされていたことから、発声あるいは音声入力の態様如
何によっては音声区間が正しく検出されず、したがって
音声が正しく認識され得ないものとなっている。例えば
発声音の声が小さくその音声パワーが小さかったり、入
力音声が電話機からのものであっていわゆる電話が遠い
などの理由によって入力音?レベルが基準パラメータよ
f)も小さい場合には、入力音声単語の語頭あるいは語
尾もが音声区間外として検出されたり、音声入力中であ
るにも拘わらずその途中での入力音声レベルが小さい場
合には途中に非音声区間が含まれると石像さ3自 されていたものである。音声の認識は一部パラメータ以
上のレベルをもった入力音声部分の特徴を抽出すること
によって行なわれていることケ考案すれば、音声区間が
正しく検出されない程に入力音声の認識もまた困難であ
るというものである。
〔発明の目的〕
よって本発明の目的は、入力音声レベルが小さい場合で
あっても正しく音声区間を検出することによって音声が
正しく認識され得る音声認識方式7式% 〔発明の概要〕 この目的のため本発明は、入力音声ノ々ワーのビーク乞
検出したうえこれに対する音声区間検出用のパラメータ
が適当でない場合は、そのピークに適合するよう音声区
間検出用のパラメータを変更しつつ入力音声の認識を行
なうようにしたものである。
〔発明の実施例〕
以下、本発明ケ第1図、第2図により説明する。
先ず本発明に係る音声認識装置について説明する。第1
図はその概略構成を示したものである。
これによると発声者はスピーカ2より放声される指示内
容に従って必要事項を発声するようになっている。制御
部8は音声合成部7に介しスピーカ2より必要な指示事
項を放声する一方、これに促されて発声者はその指示内
容に応じた音声を発声するようになっているものである
。発声者によって発声された音声はマイクロフォン1を
介し音声入力部12でA/D f換された後分析部11
によってはその入力音声より特徴が抽出されるようにな
っているわけであるが、特徴の抽出が行なわれる区間は
音声区間検出部】3によって制御されるものとなってい
る。音声入力部12からのA/D f換された入力音声
は音声区間検出部13で音声区間検出用のパラメータと
比較されるが、そのパラメータル上の音声レベルをもっ
た入力音声部分についてのみ特徴が抽出されるようにな
っているものである。従来にあっては入力音声より特徴
Z抽出するに際し  ′そのノRラメータは常時一定と
されていたが、本発明においては変更可として設定され
るようになつ1 でいる。A/D変換された人力音声のピークは制御部8
において知れるようになっているが、制御部8は現に設
定されている/4’ラメータがそのピークに対して適当
でないと判断した場合にはパラメータを変更するように
なっているわけである。し女がって、変更可として設定
されるパラメータによって状態良好にして音声区間が検
出され、このようにして検出された音声区間について結
果的に特徴が抽出されるようになっているものである。
抽出されfc特徴パターンは次に音声認識部6で標準音
声パターンとパターンマツチングされその類似度が認識
結果として得られるようになっている。
パターンマツチングされる標準音pi4ターンハ予め制
御部8の制御下にある標準音声ノ9ターン選択部5によ
って標準音声パターンメモリ4より所定の数種類の標準
音声パターンが選択的に読み出されるようになっており
、これら標準音声ノ4ターンとの間でパターンマツチン
グが行なわれるものである。した、かって、標準音声・
やターン対応に認識結果が得られることになるが、判定
部10では類似・1                
                6  f〔度が最も
大きいものについて制御部8に対して報告を行ない、制
御部8i−Iその報告だもとづいて必要な処理を行なう
ようになっているものである。
なお、コンソール部3やホスト装置9については後述す
るところである。
ところで第1図に示す音声認識装置は例えば銀行などに
おけるキャシュデイヌペンサの一部とじて用いられるよ
うになっているが、第2図はそのような用途に使用され
る際での音声認識の処理フローを示したものである。
これによると制御部8は音声認識処理に先立って先ず音
声入力に対する準備を音声入力部12、分析部11およ
び音声認識部6に指示するとともに、そのときの認識対
象となるべき標準音声・母ターンを標準音声Aターン選
択部5に介し標準音声・Pターンメモリ4より読み出す
べく制御するようになっている。これらの傳備が完了す
ると次に制御部8によって発声者に対し最初の音声入力
な促すべく入力倍音メツセージが音声合成部7乞介レス
ビーカ2エリ放声される。このメツセージにより発7自 声者はマイクロフォン1より音声を入力するところとな
るものである。マイクロフォン1からの入力音声は音声
入力部12でディジタル変換された抜分析部]】でその
特徴が抽出されるが、一方では入力音声パワーのピーク
レベルが制御部8に音声入力部12から取り込まれたう
え現に設定されている音声区間検出用のパラメータが適
当か否かが判定されるようになっている。現に設定され
ているパラメータが適当でない場合は最適なパラメータ
が新たな音声区間検出用のパラメータとして音声区間検
出部13に設定されるものである。このように変更可と
されたパラメータと音声入力部12からのディ・ソタル
変換された入力音声とにもとづき、音声区間検出部13
は制御部8からの指示によってその入力音声に対する音
声区間を状態良好にして検出するわけである。この検出
された音声区間に対する入力音声の特徴パターンは次に
分析部1】エフ音声認識部6に送られ予め選択されてい
る標準音声パターンとの間でパターンマツチングが行な
われるようになっている。これによりその標準音声ツク
ターン内に含ずれる個々の単語対応の音声パターンとの
間でパターンマツチングが行なわれ単語対応にマツチン
グ結果が得られるものである。これらマツチング結果か
ら類似度が最も大きい単語は認識結果の候補として選択
されるが、パターンマツチングは予め選択されている他
の標準音声パターンとの間でも順次行なわれるようにな
っている。したがって、制御部8にパターンマツチング
の終了が報告される時点では選択された標準音声パター
ン対応に認識結果の候補が全て出揃うことになるが、判
定部10はそれら候補から更に類似度が大のものを最終
的な認識結果として制御部8に送るようになっているも
のである。
制御部8では判定部】0からの最終的な認識結果の類似
度と一定値(リジェクト定数)とを比較することによっ
てその認識結果が妥当か否かが判定されるようになって
いる。一定値以下である場合は妥当でないとして標準音
声パターン選択部5に対してこれまでの同一の標準音声
パターンを選択するように指示した後、同一の音声を入
力するより  (〔 う催告するものである。一方、妥当であると判定された
場合には、制御部8fdその認識結果が正しいか否かを
発声者に確認させるべくその認識結果対応の音声と確認
要求メツセージを音声としてスピーカ2より放声するよ
うになっている。これに応じ発声者は確認結果をコンソ
ール部3 、r、、II)入力するが、確認結果の入力
は必ずしもコンソール部3によらない。容器に認識可能
であれば簡単な音声で以て入力してもよいからである。
これにより制御部8は認識結果が正しいか否かを知れる
が、誤認識であった場合には最終的な認識結果が妥当で
ないと判定された場合と同様に処理されるようになって
いる。これに対し認識結果が正しかった場合にはそれを
認識結果としてホスト装置9に送出したうえ最初の入力
音声に対する音声認識処理を終了するものである。全て
のサービスが終了しない限りにおいては次の音声入力乞
催告しつつ入力音声の認識を行なうようになっているわ
けである。
〔発明の効果〕
10   頁 以上説明したように本発明による場合は、入力音声パワ
ーのピークにもとづいてその入力音声に対する音声区間
検出用の・々ラメータが設定されることから、女とえ入
力音声レベルが小さい場合であってもJ:9確実に入力
音声を認識し得るという効果がある。
【図面の簡単な説明】
第1図は、本発明に係る音声認識装置の一例での概略構
成を示す図、第2図は、その装置での音声認識処理の一
例でのフロー乞示す図である。 1・・・マイクロフォン、4・・・標準音声ノぐターン
メモリ、5・・・標準音声・母ターン選択部、6・・・
音声認識部、8・・・制御部、11・・・分析部、12
・・・音声入力部、1;3・・・音声区間検出部。 代理人弁理士  秋 本  正  実

Claims (1)

    【特許請求の範囲】
  1. 入力音声より検出された音声区間にもとづき該音声より
    特徴パターンを抽出したうえ標飴音声パターンとパター
    ンマツチを行ない、該マツチングの結果より上記入力音
    声を認識する音声認識方式にして、入力音声のパワーの
    ピークに応じて音声区間検出用のパラメータを変更し、
    該変更に係るパラメータによって上記入力音声に対する
    音声区間を検出したうえ該音声を認識することを特徴と
    する音声認識方式。
JP57220320A 1982-12-17 1982-12-17 音声認識方式 Pending JPS59111697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57220320A JPS59111697A (ja) 1982-12-17 1982-12-17 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57220320A JPS59111697A (ja) 1982-12-17 1982-12-17 音声認識方式

Publications (1)

Publication Number Publication Date
JPS59111697A true JPS59111697A (ja) 1984-06-27

Family

ID=16749289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57220320A Pending JPS59111697A (ja) 1982-12-17 1982-12-17 音声認識方式

Country Status (1)

Country Link
JP (1) JPS59111697A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6377095A (ja) * 1986-09-19 1988-04-07 松下電器産業株式会社 音声区間の始端検出装置
JPH09325790A (ja) * 1986-06-02 1997-12-16 British Telecommun Plc <Bt> 音声処理方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09325790A (ja) * 1986-06-02 1997-12-16 British Telecommun Plc <Bt> 音声処理方法および装置
JPS6377095A (ja) * 1986-09-19 1988-04-07 松下電器産業株式会社 音声区間の始端検出装置

Similar Documents

Publication Publication Date Title
US4403114A (en) Speaker recognizer in which a significant part of a preselected one of input and reference patterns is pattern matched to a time normalized part of the other
JPS58130393A (ja) 音声認識装置
JP2996019B2 (ja) 音声認識装置
JPS59111697A (ja) 音声認識方式
JPH0558553B2 (ja)
JPS59111698A (ja) 音声認識方式
JPS61180297A (ja) 話者照合装置
JPS6126678B2 (ja)
JPS5962900A (ja) 音声認識方式
JP2609874B2 (ja) 音声認識システム
JP2547611B2 (ja) 文章作成システム
JP2844592B2 (ja) 離散単語音声認識装置
JPS63157199A (ja) 話者照合装置
JPS59111696A (ja) 音声認識方式
JPS5859498A (ja) 音声認識装置
JPS61278896A (ja) 話者照合装置
JPS6287993A (ja) 音声認識装置
JPS60233700A (ja) 音声パタ−ン照合方法
JPS59147397A (ja) 音声認識制御方式
JPS59204897A (ja) 音声認識辞書登録方式
JPS6147994A (ja) 音声認識方式
JPS595294A (ja) 音声認識装置
JPH0256680B2 (ja)
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS6315295A (ja) 音声認識装置