JPH07295586A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH07295586A
JPH07295586A JP6110230A JP11023094A JPH07295586A JP H07295586 A JPH07295586 A JP H07295586A JP 6110230 A JP6110230 A JP 6110230A JP 11023094 A JP11023094 A JP 11023094A JP H07295586 A JPH07295586 A JP H07295586A
Authority
JP
Japan
Prior art keywords
voice information
voice
registered
memory
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6110230A
Other languages
English (en)
Inventor
Noriyuki Tsunashima
則幸 綱嶋
Yasuhiro Tai
康裕 田井
Mitsumasa Abe
光正 阿部
Hiroshi Tanaka
博史 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Priority to JP6110230A priority Critical patent/JPH07295586A/ja
Publication of JPH07295586A publication Critical patent/JPH07295586A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 誤認識を実質的に減少させた音声認識装置を
提供する。 【構成】 第1メモリ52に格納された入力被認識音声
に基づく音声情報と第3メモリ54に格納されている複
数の各登録音声情報との差を演算部57にて演算し、演
算された差中の最小の差をとなる登録音声情報を検索
し、更新制御部58の制御のもとに前記最小の差を第2
メモリ53に格納し、第2メモリ53に格納されている
差が閾値以下か否かを判別部59にて判別し、閾値を超
えていると判別されたときに、前記検索された登録音声
情報に基づく表示を表示器7に行い、実行指示スイッチ
8による実行指示があったときに前記検索された登録音
声情報に基づく動作の実行を行うようにした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は認識すべき音声に基づく
音声情報を複数登録しておき登録された音声情報を参照
して、入力された音声を認識する音声認識装置に関す
る。
【0002】
【従来の技術】音声認識装置は認識すべき音声に基づく
音声情報を登録音声情報として複数登録しておき登録音
声情報を参照して、入力された音声を認識するように構
成されている。かかる音声認識装置を用いて音声によっ
て被制御装置を制御することが行われる。
【0003】上記した従来の音声認識装置において、入
力した音声の認識および認識結果に基づく被制御装置へ
の制御信号の送出は図3に示すフローチャートに基づく
手順によって行われている。すなわち、音声入力を検出
すると第1メモリに入力された音声すなわち被認識音声
に基づく音声情報が格納される(ステップS1〜S
3)。入力音声が終了すると登録音声情報の数nを1に
設定し、かつ第2メモリに最大値を格納する初期設定が
なされる(ステップS4、S5)。
【0004】一方、第3メモリには予めn個の登録音声
情報が格納されており、ステップS5に続いて第1メモ
リに格納された音声情報と第3メモリに格納されている
登録音声情報との差が各登録音声情報に対して演算され
て、演算された差中の最小の差が第2メモリに格納さ
れ、差が最小である登録音声情報が実質的に第4メモリ
に格納される(ステップS6〜S10)。第4メモリに
格納されるのは例えば登録音声情報に割り当てた番号で
ある。ステップS10に続いて第2メモリに格納されて
いる内容、すなわち差が閾値以下か否かがチェックされ
(ステップS11)、閾値を超えていると判別されたと
きはステップS1から繰返して実行し、閾値以下である
と判別されたときは、第4メモリに格納されている登録
音声情報に対応する制御動作が実行される(ステップS
15)。
【0005】
【発明が解決しようとする課題】しかし、上記したよう
な従来の音声認識装置においては、被認識音声に基づく
音声情報と登録音声情報との差が最小の登録音声情報を
検索し、音声情報との差が予め定められた閾値以下と判
別されたとき、検索された登録音声情報に対応する動作
が行われる。この場合に閾値を小さい値に設定すると、
すなわち類似性の大きい登録音声情報に対応する動作を
行わせるようにすると誤認識は減少するが動作を行わな
い場合が増加し、逆に閾値を大きい値とすると動作を行
わないことが減少するが誤認識は増加して誤動作が多く
なるという問題点があった。
【0006】本発明は、誤認識を実質的に減少させた音
声認識装置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の音声認識装置
は、認識すべき音声に基づく音声情報を登録音声情報と
して複数登録しておき登録音声情報を参照して、入力さ
れた音声を認識する音声認識装置において、入力された
被認識音声に基づく音声情報と登録音声情報との差が最
小の登録音声情報を検索する検索手段と、前記被認識音
声に基づく音声情報と検索手段によって検索された登録
音声情報との差が予め定めた閾値を超えているか否かを
判別する判別手段と、判別手段によって閾値を超えてい
ると判別されたときに検索された登録音声情報に基づく
表示を行う表示手段と、検索された登録音声情報に基づ
く動作の実行を指示する実行指示手段とを備え、実行指
示手段からの実行指示があったときに検索された登録音
声情報に基づく動作の実行を行うことを特徴とする。
【0008】本発明の音声認識装置は、認識すべき音声
に基づく音声情報を登録音声情報として複数登録してお
き登録音声情報を参照して、入力された音声を認識する
音声認識装置において、入力された被認識音声に基づく
音声情報と登録音声情報との差が最小の登録音声情報を
検索する検索手段と、前記被認識音声に基づく音声情報
と検索手段によって検索された登録音声情報との差が予
め定めた第1の閾値を超えているか否かを判別する第1
判別手段と、第1判別手段によって第1の閾値を超えて
いると判別されたとき第1の閾値より大きい第2の閾値
を超えているかを判別する第2判別手段と、第1の閾値
を超えかつ第2の閾値以下と判別されたときに検索され
た登録音声情報に基づく表示を行う表示手段と、登録音
声情報に基づく動作の実行を指示する実行指示手段とを
備え、第1の閾値を超えかつ第2の閾値以下と判別され
たときに実行指示手段からの実行指示に基づいて登録音
声情報に基づく動作の実行を行うことを特徴とする。
【0009】
【作用】本発明の音声認識装置は、入力された被認識音
声に基づく音声情報と登録音声情報との差が最小の登録
音声情報が検索手段によって検索される。被認識音声に
基づく音声情報と検索手段によって検索された登録音声
情報との差が予め定めた閾値を超えているか否かが判別
手段によって判別され、閾値を超えていると判別された
ときに検索された登録音声情報に基づく表示が表示手段
に表示される。この表示によって被認識音声に対応して
認識された登録音声が判り、使用者が被認識音声として
入力したものと一致しているか否かが判る。この結果、
実行指示をするか否かが使用者によって決定され、実行
指示をするときには、実行指示手段から実行指示がなさ
れて該登録音声情報に基づく動作の実行がなされる。
【0010】また、第1および第2判別手段を設けたと
きは、被認識音声に基づく音声情報と検索手段によって
検索された登録音声情報との差が予め定めた第1の閾値
を超えているか否かが第1判別手段によって判別され、
第1判別手段によって第1の閾値を超えていると判別さ
れたとき第2の閾値を超えているかが第2の判別手段に
よって判別され、第1の閾値を超えかつ第2の閾値以下
と判別されたときに検索された登録音声情報に基づく表
示が表示手段に表示される。この表示によって被認識音
声に対応して認識された登録音声が判り、使用者が被認
識音声として入力したものと一致しているか否かが判
る。この結果、実行指示をするか否かが使用者によって
決定され、実行指示をするときには、実行指示手段から
実行指示がなされて該登録音声情報に基づく動作の実行
がなされる。
【0011】
【実施例】以下、本発明を実施例により説明する。図1
は本発明にかかる音声認識装置の一実施例の構成を示す
ブロック図である。
【0012】本実施例の音声認識装置は、マイクロフォ
ン1、マイクロフォン1からの音声信号を増幅する増幅
器2、増幅器2の出力音声信号をデジタル信号に変換す
るA/D変換器3、増幅器2の出力音声信号を受けて音
声信号が入力されている期間出力を発生する音声検出ス
イッチ回路4、マイクロコンピュータからなる音声認識
のための制御回路5、表示ドライバ6によって駆動され
て登録音声情報に基づく表示を行う表示器7と、実行指
示を行う実行指示スイッチ8を備えている。
【0013】マイクロフォン1からの出力される音声信
号は増幅器2によって増幅し、増幅された音声信号はA
/D変換器3に供給してデジタル信号に変換する。増幅
器2において増幅された音声信号は音声検出スイッチ回
路4に供給して音声信号が入力されていることを検出す
る。A/D変換器3から出力されるデジタル信号、音声
検出スイッチ回路4から出力される検出出力、実行指示
スイッチ8から出力される実行指示信号は制御回路5に
供給してあり、制御回路5からの信号は表示ドライバ6
に供給し、表示ドライバ6を介して表示器7において登
録音声情報に基づく表示をさせる。
【0014】制御回路5は、入力された被認識音声情報
が格納される第1メモリ52、被認識音声情報と登録音
声情報との差情報が格納される第2メモリ53、登録音
声情報が格納された第3メモリ54、登録音声情報を特
定するための情報が格納される第4メモリ55、第3メ
モリ54に格納された登録音声情報に対応させたコマン
ドである制御情報が格納された第5メモリ56を備えて
いる。
【0015】制御回路5にはさらに、機能的に、デジタ
ル信号に変換された入力被認識音声信号の特徴を抽出し
て音声情報として第1メモリ52に格納させる特徴抽出
部51、第1メモリに格納された音声情報と第3メモリ
に格納されている登録音声情報とから差を求める差演算
部57、差演算部57において演算された差情報と第2
メモリ54に格納されている差情報と比較して前者が小
さいとき第2メモリ53に格納されている差情報を演算
された差情報に更新すると共に、更新毎に第4メモリの
内容を更新していく更新制御部58、第2メモリ53に
格納されている差情報を予め定められた閾値と比較して
閾値以下か否かを判別する判別部59、判別部59にお
いて第2メモリ53に格納されている差情報が閾値以下
と判別されたときは第4メモリ55に格納された情報に
対応する制御情報を第5メモリから読み出して被制御装
置に送出し、かつ閾値以下ではないと判別されたときは
第4メモリ55に格納された情報に対応する第3メモリ
内の登録情報を読み出して表示ドライバを介して登録情
報に基づく表示を表示器7にさせると共に、実行指示ス
イッチ8からの実行指示によって第5メモリから読み出
された制御情報を被制御装置に送出する出力制御部60
とを備えている。
【0016】ここで、第2メモリ53、第4メモリ5
5、差演算部57および更新制御部58は、入力された
被認識音声に基づく音声情報と登録音声情報との差が最
小の登録音声情報を検索する検索手段を構成している。
【0017】次に、上記のように構成された本発明にか
かる音声認識装置の一実施例の作用を第2図に示したフ
ローチャートにしたがって説明する。
【0018】入力音声が供給されるとマイクロフォン1
によって電気信号に変換され、増幅器2によって増幅さ
れ、A/D変換器3によってデジタル信号に変換され
る。一方、増幅器2からの出力を受けて音声検出スイッ
チ回路4によって音声が入力されたことが検出され、A
/D変換器3によってデジタル信号に変換された音声信
号が被認識音声信号として制御回路5に読み込まれて、
特徴抽出部51において特徴が抽出され被認識音声信号
に基づく音声情報として第1メモリ52に格納される
(ステップS1〜S3)。入力音声が終了すると登録音
声情報の数nが1に設定され、かつ第2メモリに最大値
を格納する初期設定がなされる(ステップS4、S
5)。ここでnは登録音声情報の数でもあるが、第3メ
モリ54のアドレスにも対応している。
【0019】一方、第3メモリ54には予めn個の登録
音声情報か格納されており、第5メモリ56には第3メ
モリ54に格納された登録音声情報に対応させたコマン
ドである制御情報が予め格納されている。ステップS5
に続いて第1メモリ52に格納された音声情報と第3メ
モリ54の〃n〃に対応するアドレスに格納されている
登録音声情報とが減算され減算結果の絶対値が、差情報
として第2メモリに格納されされている差情報より小さ
いか否かがチェックされる(ステップS6)。ステップ
S6において小さいと判別されたときは第2メモリ53
の格納内容がステップS6における減算結果の差情報に
更新される(ステップS7)。
【0020】ステップS7に続いて、第3メモリ54の
アドレスに対応する〃n〃が第4メモリ55に格納され
(ステップS8)、次いでnがインクリメントされる、
すなわちnに(+1)される(ステップS9)。ステッ
プS9に次いで、nが登録音声情報の数に達したか否か
がチェックされ(ステップS10)、登録音声情報の数
に達するまでステップS6から繰り返して実行される。
ステップS6において小さいと判別されないときは、ス
テップS7およびステップS8がスキップされて、ステ
ップS6に次いでステップS9が実行される。したがっ
てステップS6〜S10の実行の終了によって第2メモ
リ53には最小の差情報が格納された状態となり、第4
メモリ55には被認識音声に基づく音声情報と最も類似
している登録音声情報が格納されている第3メモリ54
のアドレスに基づく情報(n)が格納された状態となっ
ている。
【0021】ステップS10の実行の終了に続いて、第
2メモリ53に格納されている差情報、すなわち差が閾
値以下か否かがチェックされ(ステップS11)、閾値
以下であると判別されたときは、第4メモリの格納内容
nに対応する第3メモリ54のアドレスに格納されてい
る登録音声情報に対応する制御情報が第5メモリ56か
ら読み出されて、被制御装置に送出され、被認識音声信
号に最も類似する登録音声情報に対応する制御動作が実
行される(ステップS15)。この作用は従来の場合と
同様である。
【0022】ステップS11において閾値を超えている
と判別されたときは、第4メモリ55の格納内容(n)
に対応する第3メモリ54のアドレスに格納されている
登録音声情報に基づく表示が表示器7になされる(ステ
ップS12)。表示器7になされる表示は、例えば登録
音声情報に基づくコマンドであってもよい。この表示を
みて使用者は音声認識装置が誤認識をしたか否かが判る
ことになり、使用者が入力した音声に基づく表示がなさ
れているときは正しく認識されたときであり、使用者が
入力した音声に基づく表示がなされていないときは誤認
識されたときである。
【0023】ステップS12に続いて、実行指示スイッ
チ8から実行指示がなされているか否かがチェックされ
る(ステップS13)。ステップS13において実行指
示がなされたと判別されたときは、ステップS13に続
いてステップS15が実行される。すなわち、第4メモ
リの格納内容nに対応する第3メモリ54のアドレスに
格納されている登録音声情報に対応する制御情報が第5
メモリ56から読み出されて、被制御装置に送出され、
被認識音声信号に最も類似する登録音声情報に対応する
制御動作が実行される。この場合において、使用者が入
力した音声に基づく状態に被制御装置が制御される。
【0024】ステップS13において実行指示がなされ
ていないと判別されたときは、ステップS13に続いて
音声入力されるの待って、音声が入力されるとステップ
S2から実行される。この場合は音声認識装置が誤認識
している場合であって、再度音声による指示がなされる
のを待って、再度認識動作を行うのである。
【0025】次に、上記した一実施例において表示器7
を用いて、ステップS12において認識結果を表示する
ようにした場合を例示したが、音声合成によって認識結
果の確認を求めるようにしてもよい。また、ステップS
13において実行指示スイッチ8による実行指示に代わ
って音声によって指示するようにしてもよい。
【0026】次に、上記した一実施例において閾値が一
つの場合を例示したが、閾値を2つ設けた応用例につい
て説明する。この応用例では、第1の閾値および第1の
閾値より大きい第2の閾値を設けて、ステップS11に
おいてまず第1の閾値と比較し、第2メモリ53に格納
されている差情報、すなわち差が第1の閾値以下か否か
をチェックし、第1の閾値以下であると判別されたとき
は、第4メモリの格納内容nに対応する第3メモリ54
のアドレスに格納されている登録音声情報に対応する制
御情報を第5メモリ56から読み出して、被制御装置に
送出し、被認識音声信号に最も類似する登録音声情報、
すなわち検索された登録音声情報に対応する制御動作を
実行させる。
【0027】第2メモリ53に格納されている差情報と
の比較の結果、第1の閾値を超えていると判別されたと
きは、第2メモリ53に格納されている差情報が第2の
閾値以下か否かをチェックし、第2の閾値以下であると
判別されたときは、ステップS12を実行し、次いでス
テップS13、S14を実行するようにし、第2の閾値
を超えていると判別されたときはステップS2から実行
するようにしてもよい。
【0028】すなわち、上記した応用例によれば、第2
メモリ53に格納されている差情報が第1の閾値以下の
ときは、被認識音声信号に最も類似する登録音声情報、
すなわち検索された登録音声情報に対応する制御動作が
実行され、第2メモリ53に格納されている差情報が第
1の閾値を越え第2の閾値以下のときは、検索された登
録音声情報に基づく表示がなされ、実行指示スイッチ8
からの実行指示に基づいて検索された登録音声情報に対
応する制御動作が実行され、第2の閾値を越えていると
きは再び音声の入力を待って音声認識が行われることに
なる。
【0029】
【発明の効果】以上説明した如く本発明の音声認識装置
によれば、被認識音声に基づく音声情報と登録音声情報
との差が最小の登録音声情報を検索し、被認識音声に基
づく音声情報と検索された登録音声情報との類似性を判
別するための閾値を小さい値に設定した場合に、閾値を
越えて類似性が低いと判別された検索登録音声情報に基
づく表示がなされ、実行指示手段にからの実行指示に基
づいて、検索された登録音声情報に基づく動作の実行が
なされるため、誤認識が実質的に減少し、かつ誤認識に
基づく誤制御が起こることが避けられるという効果があ
る。
【0030】また、類似性を判別するための閾値を2段
階に設けた場合においても同様の効果が得られる。
【図面の簡単な説明】
【図1】本発明にかかる音声認識装置の一実施例の構成
を示すブロック図である。
【図2】本発明にかかる音声認識装置の一実施例の作用
の説明に供するフローチャートである。
【図3】従来の音声認識装置における音声認識作用の説
明に供するフローチャートである。
【符号の説明】
1 マイクロフォン 2 増幅器 3 A/D変換器 4 音声検出スイッチ回路 5 制御回路 7 表示器 8 実行指示スイッチ 51 特徴抽出部 52、53、54、55および56 第1、第2、第
3、第4および第5メモリ 57 差演算部 58 更新制御部 59 判定部 60 出力制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 田中 博史 東京都目黒区青葉台3丁目6番17号 株式 会社ケンウッドエンジニアリング内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】認識すべき音声に基づく音声情報を登録音
    声情報として複数登録しておき登録音声情報を参照し
    て、入力された音声を認識する音声認識装置において、
    入力された被認識音声に基づく音声情報と登録音声情報
    との差が最小の登録音声情報を検索する検索手段と、前
    記被認識音声に基づく音声情報と検索手段によって検索
    された登録音声情報との差が予め定めた閾値を超えてい
    るか否かを判別する判別手段と、判別手段によって閾値
    を超えていると判別されたときに検索された登録音声情
    報に基づく表示を行う表示手段と、検索された登録音声
    情報に基づく動作の実行を指示する実行指示手段とを備
    え、実行指示手段からの実行指示があったときに検索さ
    れた登録音声情報に基づく動作の実行を行うことを特徴
    とする音声認識装置。
  2. 【請求項2】認識すべき音声に基づく音声情報を登録音
    声情報として複数登録しておき登録音声情報を参照し
    て、入力された音声を認識する音声認識装置において、
    入力された被認識音声に基づく音声情報と登録音声情報
    との差が最小の登録音声情報を検索する検索手段と、前
    記被認識音声に基づく音声情報と検索手段によって検索
    された登録音声情報との差が予め定めた第1の閾値を超
    えているか否かを判別する第1判別手段と、第1判別手
    段によって第1の閾値を超えていると判別されたとき第
    1の閾値より大きい第2の閾値を超えているかを判別す
    る第2判別手段と、第1の閾値を超えかつ第2の閾値以
    下と判別されたときに検索された登録音声情報に基づく
    表示を行う表示手段と、登録音声情報に基づく動作の実
    行を指示する実行指示手段とを備え、第1の閾値を超え
    かつ第2の閾値以下と判別されたときに実行指示手段か
    らの実行指示に基づいて登録音声情報に基づく動作の実
    行を行うことを特徴とする音声認識装置。
JP6110230A 1994-04-27 1994-04-27 音声認識装置 Pending JPH07295586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6110230A JPH07295586A (ja) 1994-04-27 1994-04-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6110230A JPH07295586A (ja) 1994-04-27 1994-04-27 音声認識装置

Publications (1)

Publication Number Publication Date
JPH07295586A true JPH07295586A (ja) 1995-11-10

Family

ID=14530401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6110230A Pending JPH07295586A (ja) 1994-04-27 1994-04-27 音声認識装置

Country Status (1)

Country Link
JP (1) JPH07295586A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392194B2 (en) 2002-07-05 2008-06-24 Denso Corporation Voice-controlled navigation device requiring voice or manual user affirmation of recognized destination setting before execution

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392194B2 (en) 2002-07-05 2008-06-24 Denso Corporation Voice-controlled navigation device requiring voice or manual user affirmation of recognized destination setting before execution

Similar Documents

Publication Publication Date Title
US4829576A (en) Voice recognition system
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
JP2004054080A (ja) データ入力方法およびデータ入力装置
US8041576B2 (en) Information processing apparatus and information processing method
JP2002258892A (ja) 音声認識機器操作装置
JPH0746517A (ja) 動画像検索方法及び装置
CN114155839A (zh) 一种语音端点检测方法、装置、设备及存储介质
EP1316944B1 (en) Sound signal recognition system and method, and dialog control system and method using it
JPH07295586A (ja) 音声認識装置
KR100395713B1 (ko) 음성인식방법및음성인식장치
KR101944303B1 (ko) 음성인식을 이용한 자동 음원 선곡이 가능한 자동차 오디오 시스템 제어방법
JP3888584B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP4675514B2 (ja) 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録したコンピュータにより読取り可能な記録媒体
JPH0520367A (ja) インデツクス作成方式
EP0392537B1 (en) Pattern recognition apparatus
JPS63186298A (ja) 単語音声認識装置
CN112992139A (zh) 设备控制方法、装置和设备
JP3291347B2 (ja) 音声認識装置
JP2004037803A (ja) 応答制御装置、方法及び応答制御プログラム、記録媒体
JP3360978B2 (ja) 音声認識装置
JP3005330B2 (ja) 音声認識装置
JP2625682B2 (ja) 音声区間の始端検出装置
JP4352800B2 (ja) 音声認識装置
JP3515143B2 (ja) パターン追加登録装置
JPH0651792A (ja) 音声認識装置