JPH03122696A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03122696A
JPH03122696A JP1259958A JP25995889A JPH03122696A JP H03122696 A JPH03122696 A JP H03122696A JP 1259958 A JP1259958 A JP 1259958A JP 25995889 A JP25995889 A JP 25995889A JP H03122696 A JPH03122696 A JP H03122696A
Authority
JP
Japan
Prior art keywords
speech
voice
pattern
standard
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1259958A
Other languages
English (en)
Inventor
Yuichiro Fujihashi
藤橋 勇一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1259958A priority Critical patent/JPH03122696A/ja
Publication of JPH03122696A publication Critical patent/JPH03122696A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声認識装置に係り、特に音声の標準パターン
の登録状態を確認することのできる音声認識装置に関す
る。
〔従来の技術〕
音声認識装置では、認識する複数の音声を音声分析部で
予め分析し、その特徴パターンを標準パターンとしてメ
モリに登録しておく。標準パターンは、各音声の標準パ
ターンごとに所定の登録番号を対応付けて登録される。
音声の認識を行う場合、音声認識装置は音声分析部に入
力された音声の特徴パターンを切り出し、これとメモリ
に予め登録された各標準パターン・メモリとのパターン
マツチングを行う。音声認識装置は、パターンマツチン
グの結果パターン間距離が最小となる標準パターンを入
力された音声と認識し、その登録番号を出力する。
出力された登録番号は一般に制御装置に供給される。制
御装置では、音声の登録時に例えばその音声を示す文字
や、その音声によって行われるべき動作が音声の登録番
号と共に記憶されている。
従って、例えば音声を認識してこれを記録するための装
置の場合、「ヤマモト」という音声が入力されると、音
声認識装置はこれを認識して対応する登録番号を出力す
る。この登録番号が制御装置に供給され、「山水」と記
録される。また、工場の天井や支柱に設置され、ワイヤ
がけされた荷物を垂直および水平方向に移動させるクレ
ーンの移動制御に音声認識装置が使用されることがある
この場合、例えば「ヒガシ」という音声が音声認識装置
に入力されると、音声認識装置はこれを認識して対応す
る登録番号を出力する。この登録番号に対応する所定の
プログラムに従って制御装置はクレーンを「東」方向に
移動するように制御する。
〔発明が解決しようとする課題〕
このような音声認識装置で、標準パターンの登録時にそ
の登録が正しく行われたか否かを確認する場合、実際に
音声の認識を行い、その認識結果から判断している。す
なわち、音声認識装置に音声を実際に認識させ、対応す
る登録番号を出力させる。そして、その登録番号に基づ
いて制御装置で記録される文字や、制御される動作によ
って標準パターンの登録が正しいか否かを判断していた
従って、標準パターンの登録が正しく行われていること
を確認する作業に時間がかかるばかりでなく、非常に面
倒であった。
また、音声認識装置で音声を認識して例えばクレーンを
制御する場合、音声の誤認識による事故を防止するため
に、認識した音声を確認する「アンサーバック」が行わ
れ、操作者からの返事を受けた後に初めて動作を行うも
のがある。しかし、アンサーバックでクレーンが操作者
にV&認する音声は、音声認識装置とは別に用意された
音声ROMのような音声合成装置で合成した音声であり
、間接的な音声による確認しか行われていない。すなわ
ち、アンサーバックにより出力される音声は、音声認識
装置がパターンマツチングにより認識した標準パターン
・メモリの内容そのものではない。
従って、制御装置等の故障により音声認識結果と異なる
アンサーバックが音声合成装置から出力される可能性が
あるという欠点がある。
更に、音声合成装置のメモリに標準パターンとして登録
されている音声を確認したい場合がある。
特に登録音声数が増えてくると、その全てについて記憶
しておくのは大変なので、このように音声を確認する必
要が生じてくる。このような場合、従来では、例えば登
録された全ての標準パターンの登録番号と対応する文字
を記録して、登録済みの音声を確認している。すなわち
、音声認識結果を出力するための記録装置を配置しなけ
ればならない。また、例えばクレーンの作業中に操作を
指示する音声が何であったか忘れてしまった場合、いち
いち記録装置で出力して確認するのでは操作が遅れてし
まう。特に、鉄鋼等の重量物をワイヤで吊り上げている
ような場合には危険である。
そこで本発明の第1の目的は、標準パターンの登録が正
しく行われた否かを容易に確認することができる音声認
識装置を提供することにある。
また本発明の第2の目的は、標準パターン・メそりに格
納された標準パターンそのものによりアンサーバックを
行うことのできる音声認識装置を提供することにある。
更に本発明の第3の目的は、音声合成装置のメモリに標
準パターンとして登録されている音声を、素早く確認す
ることのできる音声認識装置を提供することにある。
〔課題を解決するための手段〕
請求項1記載の発明は、(i)入力音声の特徴パターン
を分析する音声分析手段と、(ii )入力音声の音声
区間の検出を行う音声検出手段と、(iii )認識す
る音声の標準パターンを複数格納する標準パターン・メ
モリと、(iv)音声検出手段で検出した音声区間に存
在する音声分析手段で分析される特徴パターンと標準パ
ターン・メモリに格納された各標準パターンとの間のパ
ターン間距離を算出するパターンマツチング手段と、(
V)このパターンマツチング手段で算出したパターン間
距離から入力される音声の認識結果を判定する認識結果
判定手段と、(vi)!準パターン・メモリに格納され
た標準パターンの音声を合成する音声合成手段とを具備
している。
すなわち請求項1記載の音声認識装置は、音声合成手段
で標準パターン・メモリに格納されている標準パターン
を読み出し、その音声を再生することにより、第1の目
的を特徴する 請求項2記載の音声認識装置は、(i)入力音声の特徴
パターンを分析する音声分析手段と、(ii )人力音
声の音声区間の検出を行う音声検出手段と、(iii 
>認識する音声の標準パターンを複数格納する標準パタ
ーン・メモリと、(1v)音声検出手段で検出した音声
区間に存在する音声分析手段で分析される特徴パターン
と標準パターン・メモリに格納された各標準パターンと
の間のパターン間距離を算出するパターンマツチング手
段と、(V)このパターンマツチング手段で算出したパ
ターン間距離から入力される音声の認識結果を判定する
認識結果判定手段と、(vi)この認識結果判定手段で
判定した音声に対応する標準パターン・メモリに格納さ
れた標準パターンから音声を合成し、これをアンサーバ
ックする音声合成手段とを具備している。
すなわち請求項2記載の音声認識装置は、入力音声であ
ると認識した標準パターンを音声合成部で合成してアン
サーバックすることとし、これにより第2の目的を特徴
する 請求項3記載の音声認識装置は、(i)入力音声の特徴
パターンを分析する音声分析手段と、(ii )入力音
声の音声区間の検出を行う音声検出手段と、(iii)
認識する音声の標準パターンを複数格納する標準パター
ン・メモリと、(iv)音声検出手段で検出した音声区
間に存在する音声分析手段で分析される特徴パターンと
標準パターン・メモリに格納された各標準パターンとの
間のパターン間距離を算出するパターンマツチング手段
と、(■)このパターンマツチング手段で算出したパタ
ーン間距離から入力される音声の認識結果を判定する認
識結果判定手段と、(vl)この認識結果判定手段で判
定した音声が所定のキーワードである場合に標準パター
ン・メモリに格納された標準パターンの音声を合成する
音声合成手段とを具備している。
すなわち請求項3記載の音声認識装置は、入力された音
声が所定のキーワードである場合に、標準パターン・メ
モリに格納された標準パターンから登録されている音声
を合成することとし、第3の目的を達成する。
〔実施例〕
以下、実施例につき本発明の詳細な説明する。
第1図は、本発明の一実施例における音声認識装置の概
要を示したものである。
この実施例の音声認識装置は、音声入力端子11を備え
ており、標準パターンを登録する場合、およびこの標準
パターンに基づいて音声を認識する場合に音声が入力さ
れる。音声入力端子11から入力された音声12は、音
声分析部13に供給される。
音声分析部13は、人力音声12の特徴パターンを分析
する部分であり、その分析結果としての特徴パターン1
4を切替スイッチ16に送出する。
また、音声分析部13から出力されるパワー17は、音
声検出部18に送出され、ここで入力音声12の音声区
間が検出される。音声検出部18で得られた音声区間情
報19は、標準パターン・メモリ21とパターンマツチ
ング部22の双方に供給される。切替スイッチ16は、
その切り替えにより音声分析部13から送出された特徴
パターン14を標準パターン・メモリ21あるいはパタ
ーンマツチング部22のいずれかに送出するようになっ
ている。
標準パターン・メモリ21は、特徴パターン14を受け
ると、これを音声区間情報19に同期させて標準パター
ンとして登録する。標準パターンは、所定の登録番号と
共に登録される。一方、パターンマツチング部22は、
特徴パターン14を受けると、これと標準パターン・メ
モリ21から読み出された各標準パターン23との間で
バクーンマッチングを行う。パターンマツチング部22
は、パターン間距離24を計算し、これと標準パターン
23の登録番号を認識結果判定部26に供給するように
なっている。
認識結果判定部26は、供給されたパターン間距離24
が最小である標準パターン23を認識結果とし、その登
録番号27を出力端子28と音声合成部29に供給する
。音声合成部29は、標準パターン・メモリ21から登
録番号27に対応する標準パターン31を読み出し、こ
れから音声を合成する。音声合成部29は、合成した音
声32を音声出力端子33にアンサーバックするように
なっている。音声合成部29は、供給されたキーワード
の登録番号27が供給された場合、標準パターン・メモ
リ21に登録された全ての標準パターン31の音声合成
を行い、音声出力端子33に送出するようになっている
次に、以上のように構成された音声認識装置がクレーン
に使用された場合の動作について、その登録時と認識時
に分けて具体的に説明する。
(登録時) 標準パターンの登録を行うときには、切替スイッチ16
を標準パターン・メモリ21側に接続しておく。
この状態で、音声入力端子11から人力された入力音声
12は、音声分析部13に入力される。
音声分析部13は、入力された入力音声12を分析し、
その結果としての特徴パターン14を標準パターン・メ
モリ21に供給する。音声分析部13は、入力音声12
のパワー17を音声検出部18に入力する。音声検出部
18は、パワー17から音声区間を検出し、音声区間情
報19を標準ノ(ターン・メモリ21に供給する。標準
ノイターン・メモリ21では、音声区間情報19に従っ
て切り出された入力音声の特徴パターン14を、音声入
力端子11から入力された入力音声12の標準)くター
ンとして登録する。標準パターン・メモリ21に格納さ
れる入力音声12の標準パターンは、図示しない制御装
置の同じく図示しない操作盤から入力される所定の登録
番号と共に登録される。
例えば、「ヒガシ」という音声信号12の標準パターン
に対応して所定の登録番号“09”が標準パターン・メ
モリ21に格納される。
標準パターン・メモリ21に格納された標準パターン3
1は音声合成部29に供給される。各標準パターンは、
標準パターン・メモリ21に格納されるごとに音声合成
部で合成され、確認される。
例えば、音声「ヒガシ」の標準パターン31が供給され
た音声合成部29は、その特徴パターンから音声を合成
し、音声出力端子33に出力する。
これによって音声の登録者は、正確に音声「ヒガシ」の
特徴パターンが標準パターンとして登録されたか否かを
確認する。
図示しない操作盤の操作により一括確認モードに設定さ
れると、音声合成部29は登録の終了を示す信号が供給
された後に、標準パターンをその登録順に一括して合成
し、出力する。また、操作盤から特定の登録番号が指定
されると、音声合成部29は指定された登録番号に対応
する標準パターンを標準パターン・メモリ21から読み
出し、その特徴パターンから音声を合成し、音声出力端
子33に出力する。
音声の認識を2うときには、切替スイッチ16をパター
ンマツチング部22側に接続しておく。
操作者は、図示しないマイクロホンからクレーンを制御
するための指令語を例えば「ヒガシ」と音声人力する。
マイクロホンに入力された音声は無線により音声入力端
子11に供給される。音声入力端子11から供給された
入力音声12は、音声分析部13に入力される。音声分
析部13は、入力音声12を分析し、その結果としての
特徴パターン14をパターンマツチング部2゛2に供給
する。また、音声分析部13は人力音声12のパワー1
7を音声検出部18に人力する。音声検出部18は、パ
ワー17から音声区間を検出し、音声区間情報19をパ
ターンマツチング部22に供給する。パターンマツチン
グ部22では、標準パターン・メモリ21から標準パタ
ーン23を読み出し、音声区間情報19に従って切り出
された入力音声12の特徴パターン14とパターンマツ
チングを行う。そして、これを基にじてパターン間距離
24が算出される。認識結果判定部26では、このパタ
ーン間距離24から結果を判定し、判定した標準パター
ン23の登録番号27“09”を出力端子28から図示
しない制御装置に供給する。
認識結果判定部26は、登録番号27“09”を音声合
成部29に供給する。音声合成部29は、標準パターン
・メモリ21から登録番号27“09”に対応するの標
準パターン31を読み出し、これを合成する。音声合成
部29は、標準パターン31から合成した音声「ヒガシ
」と、これに音声「ですか」を付加して音声32「ヒガ
シですか」を音声出力端子33に出力する。音声出力端
子33から出力された音声32は、アンサーバックとし
て操作者が装備した図示しないイヤホンに無線で送出さ
れる。
操作者は、自分の入力した音声とアンサーバックの内容
が一致する場合には、マイクロホンから「スタート」と
音声入力する。音声認識装置は、同様にしてこの音声「
スタート」を認識し、対応する登録番号27、例えば“
99”を出力端子から図示しない制御装置に供給する。
制御装置は、登録番号“99#が供給されると、既に供
給されている「ヒガシ」の登録番号“09″に対応する
予め用意されたプログラムに従って、クレーンを東側に
移動するように制御する。
操作者は、クレーンを制御するための指令語を忘れた場
合のように、作業中に標準パターン・メモリ21に登録
された音声の確認をしたい場合がある。このような場合
、操作者は所定のキーワード「トウロクゴサイセイ」を
マイクロホンから入力する。音声認識装置は、同様にし
て人力された音声「トウロクゴサイセイ」を認識し、対
応する登録番号27、例えば“98”を音声合成り29
に供給する。音声合成部29は、登録番号“98”が供
給されると、標準パターン・メモリ21に登録された標
準パターン31を順次読み出して音声の合成、再生をし
、これを音声出力端子33に出力する。操作者は無線で
イヤホンから出力される音声を聴いて必要な指令語の確
認を行い、操作を続行する。
以上説明した実施例では、キーワードが入力されると全
ての標準パターンにぢいて音声合成されたが、所定の分
類ごとにキーワードを複数設け、必要な分類の標準パタ
ーンのみを合成する構成としてもよい。
また以上説明した実施例では、音声認識装置が用いられ
たクレーンについて説明したが、音声を認識して自動的
にダイヤルする電話機に用いることも可能である。この
場合、音声合成部はアンサーバックによる音声を出力し
たことを示す信号を音声分析部に供給する。これによっ
て音声分析部は、アンサーバックによる音声が受話器を
通じて供給されても、その分析を行わない。
更に、以上説明”した実施例では音声区間を検出してパ
ターンマツチングを行うこととしたが、これ;・に限ら
ず、例えばワード・スポツティング等の他の方式を用い
てもよい。すなわち、どのような方式で音声を認識す・
るかは本発明の範囲と直接関係はない。
〔発明の効果〕
このように請求項1記載の音声認識装置によれば、音声
合成手段で標準パターン・メモリに格納されている標準
パターンを読み出してその音声を再生する構成としたの
で、標準パターンの登録が正しく行われた否かを容易に
確認することができる。
請求項2記載の音声認識装置によれば、入力音声である
と認識した標準パターンを音声合成部で合成してアンサ
ーバックする構成としたので、標準パターン・メモリに
格納した標準パターンの内容によりアンサーバックを行
うことができる。また、HEmした音声を確認するため
の音声データをメモリに格納しておく必要がないので、
メモリ量を低減することができる。
請求項3記載の音声認識装置によれば、入力された音声
が所定のキーワードである場合に、標準パターン・メモ
リに格納された標準パターンから登録されている音声を
合成する構成としたので、標準パターンとして登録され
ている音声を素早く確認することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置の回路
構成を示すブロック図である。 11・・・・・・音声入力端子、13・・・・・・音声
分析部、16・・・・・・切替スイッチ、18・・・・
・・音声検出部、21・・・・・・標準パターン・メモ
リ、22・・・・・・パターンマツチング部、26・・
・・・・認識結果判定部、28・・・・・・出力端子、
29・・・・・・音声合成部、33・・・・・・音声出
力端子。

Claims (1)

  1. 【特許請求の範囲】 1、入力音声の特徴パターンを分析する音声分析手段と
    、 入力音声の音声区間の検出を行う音声検出手段と、 認識する音声の標準パターンを複数格納する標準パター
    ン・メモリと、 前記音声検出手段で検出した音声区間に存在する前記音
    声分析手段で分析される特徴パターンと前記標準パター
    ン・メモリに格納された各標準パターンとの間のパター
    ン間距離を算出するパターンマッチング手段と、 このパターンマッチング手段で算出したパターン間距離
    から入力される音声の認識結果を判定する認識結果判定
    手段と、 前記標準パターン・メモリに格納された標準パターンの
    音声を合成する音声合成手段 とを具備することを特徴とする音声認識装置。 2、入力音声の特徴パターンを分析する音声分析手段と
    、 入力音声の音声区間の検出を行う音声検出手段と、 認識する音声の標準パターンを複数格納する標準パター
    ン・メモリと、 前記音声検出手段で検出した音声区間に存在する前記音
    声分析手段で分析される特徴パターンと前記標準パター
    ン・メモリに格納された各標準パターンとの間のパター
    ン間距離を算出するパターンマッチング手段と、 このパターンマッチング手段で算出したパターン間距離
    から入力される音声の認識結果を判定する認識結果判定
    手段と、 この認識結果判定手段で判定した音声に対応する前記標
    準パターン・メモリに格納された標準パターンから音声
    を合成し、これをアンサーバックする音声合成手段 とを具備することを特徴とする音声認識装置。 3、入力音声の特徴パターンを分析する音声分析手段と
    、 入力音声の音声区間の検出を行う音声検出手段と、 認識する音声の標準パターンを複数格納する標準パター
    ン・メモリと、 前記音声検出手段で検出した音声区間に存在する前記音
    声分析手段で分析される特徴パターンと前記標準パター
    ン・メモリに格納された各標準パターンとの間のパター
    ン間距離を算出するパターンマッチング手段と、 このパターンマッチング手段で算出したパターン間距離
    から入力される音声の認識結果を判定する認識結果判定
    手段と、 この認識結果判定手段で判定した音声が所定のキーワー
    ドである場合に前記標準パターン・メモリに格納された
    標準パターンの音声を合成する音声合成手段 とを具備することを特徴とする音声認識装置。
JP1259958A 1989-10-06 1989-10-06 音声認識装置 Pending JPH03122696A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1259958A JPH03122696A (ja) 1989-10-06 1989-10-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1259958A JPH03122696A (ja) 1989-10-06 1989-10-06 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03122696A true JPH03122696A (ja) 1991-05-24

Family

ID=17341286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1259958A Pending JPH03122696A (ja) 1989-10-06 1989-10-06 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03122696A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9010298B2 (en) 2010-04-16 2015-04-21 Fuji Jukogyo Kabushiki Kaisha Rollover detection device for general-purpose engine

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9010298B2 (en) 2010-04-16 2015-04-21 Fuji Jukogyo Kabushiki Kaisha Rollover detection device for general-purpose engine

Similar Documents

Publication Publication Date Title
EP0757342B1 (en) User selectable multiple threshold criteria for voice recognition
US5842161A (en) Telecommunications instrument employing variable criteria speech recognition
JPH05134694A (ja) 音声認識装置
CN110602334A (zh) 一种基于人机协同的智能外呼方法及系统
EP1185976B1 (en) Speech recognition device with reference transformation means
JPH03122696A (ja) 音声認識装置
JPH02135499A (ja) 音声認識リジェクト閾値設定方式
JPH09265298A (ja) 作業機の音声指令装置
JPS59195739A (ja) 音声応答装置
JP2712703B2 (ja) 信号処理装置
JPS6356698A (ja) 多数話者音声認識装置
JPS61292199A (ja) 音声認識装置
CN1288224A (zh) 语音识别装置和方法
JPH04181998A (ja) 音声認識装置および方法
JPH039400A (ja) 音声認識装置
JPH0287757A (ja) 電話自動応答認識装置
JPH06266388A (ja) 音声認識装置
JPS63305396A (ja) 音声認識装置
JPS6143862A (ja) 音声認識装置
JPH11327587A (ja) 作業支援装置及び作業支援システム
JPS63281196A (ja) 音声認識装置
JPH04178699A (ja) 音声認識方法及び装置
JPS63260345A (ja) 自動音声収録装置
JPH02162399A (ja) 音声認識装置
JPS6173998A (ja) 音声認識装置