JPH03231297A - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JPH03231297A
JPH03231297A JP2026532A JP2653290A JPH03231297A JP H03231297 A JPH03231297 A JP H03231297A JP 2026532 A JP2026532 A JP 2026532A JP 2653290 A JP2653290 A JP 2653290A JP H03231297 A JPH03231297 A JP H03231297A
Authority
JP
Japan
Prior art keywords
reject
value
standard pattern
state
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2026532A
Other languages
English (en)
Inventor
Hiromi Shibuya
渋谷 浩洋
Yasutomo Onishi
大西 康友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Refrigeration Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Refrigeration Co filed Critical Matsushita Refrigeration Co
Priority to JP2026532A priority Critical patent/JPH03231297A/ja
Publication of JPH03231297A publication Critical patent/JPH03231297A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、特定話者及び不特定話者が入力した単語音声
を認識し、その認識結果により数々の処理を行なうため
の音声認識システムに関し、特に、不特定話者に対応し
た自動販売機用等の音声認識システムである。
従来の技術 照しながら説明する。
第3図において、1は従来の音声認識システムであり、
音声分析手段2、第1標準パターン記憶手段3、第2標
準パターン記憶手段4、選択手段5、標準パターン選出
手段6、リジェクト判定手段7から構成されている。以
下に各構成要素の詳細について述べる。まず、利用者が
マイクロホン8により入力した音声を音声分析手段2に
より分析して音声パターンを抽出する。分析には帯域通
過フィルター群を使ったBPF(Band  Path
  Filter)分析結果を時間軸と周波数軸で標本
化し、強度をデジタル処理する手法を用いる。第1、第
2標準パターン記憶手段3.4には、同様の方法により
抽出した多数の不特定話者が発声した複数の離散単語の
音声パターンを標準パターンとして記憶しである。自販
機等では対話形式で音声認識を進めていくが、各段階(
ステート)で必要な登録単語が異なる。このため、認識
率の向上を目的として各ステートごとに標準パターン記
憶手段を切り替えて使用している。すなわち、前記第1
標準パターン記憶手段3にはステート1で使用するフレ
ーバー(コーヒー ジュース等飲料の品名)の呼称が記
憶されており、前記第2標準パターン記憶手段4にはス
テート2を使用する返答単語(はい、いいえ)が記憶さ
れている。5は選択手段であり、後述の自販機制御手段
10からのステート信号により、ステート1ならば前記
第1標準パターン記憶手段3を選択し、ステート2なら
ば前記第2標準パターン記憶手段4を選択するものであ
る。6は標準パターン選出手段であり、前記入力音声パ
ターンと前記選択された標準パターン記憶手段が記憶し
ている標準パターン群との距離をDP(Dynamic
  Program l n g )マツチング法によ
り算出して距離値の最も小さい標準パターンを認識結果
として選出する。DPマツチング法とは動的計画法と訳
され、1957年に米国のBe 11manが提案した
数理計画法の一手法で、多段決定過程の最適化に適用さ
れる。その手法は、各段である決定(制御)を行なって
状態を変換させながら、目的に達するまでの過程での良
さ/悪さを評価する関数を最大/最小とするというもの
である。7はリジェクト判定手段であり、前記選出され
た標準パターンと前記入力音声パターンとの距離値(L
)とあらかじめ記憶しているリジェクト値(Lr)とを
比較してリジェクト判定を行なうものである0表1゜に
示すように距離値がリジェクト値以下であれば前記認識
結果を出力し、距離値がリジェクト値より大きければり
ジエクト信号t−後述する自販機制御手段10に出力す
るものである。なお、リジェクト値は最も類似度が大き
い登録単語間(例えば、コーヒーとコーラ)で誤認識が
起こらないような値に設定する。
表1 Lr:リジェクト値 発声誘導手段9は、音声合成手段により構成され、後述
する自販機制御手段10に応じて、利用者の発声を促す
ために音声による発声を促す。ただし、フレーバー塩は
、カップ自販機前面のパネル板等に明記してあり、利用
者はその中から好みのフレーバー塩を1つ選んで発声す
るものである。
自販機制御手段10は、処理に応じて発声誘導手段9に
誘導音声の発声を指示し、リジェクト判定手段7の出力
が認識結果であれば利用者が発声した単語を認識すると
共に、認識結果により以後の自販機の動作を制御するも
のである。また、11はコインの受取りと釣銭の払い戻
しを行なうコイン受取り手段、12は選択されたフレー
バーをカップに注ぎ搬出する飲料搬出手段である。
発明が解決しようとする課題 しかしながら、上記のような方法では、リジェクト値を
全ステートの登録単語中で類似度が最も大きい登録単語
間で誤認識が起こらないような値に設定するため、どう
してもリジェクト率が大きくなってしまい、登録単語間
の類似度が小さいステート(例えば、はい、いいえ)で
あっても、認識率があるレベル以上によくならないとい
う課題を有していた。
本発明は上記従来の課題を解決するもので、すジエクト
値を各ステート毎に最適な値に切り替えてやることによ
り、認識率の高い音声認識システムを提供することを目
的とする。
課題を解決するための手段 この目的を達成するために本発明の音声認識システムは
、複数の離散単語音声の標準パターン群を記憶した複数
の標準パターン記憶手段と、前記複数の標準パターン記
憶手段のいずれか1つを選択する選択手段と、発声者の
音声を分析し音声パターンを抽、出する音声分析手段と
、前記音声パターンと前記選択された標準パターン記憶
手段の記憶する複数の標準パターンとの距離を類似度計
算により算出して距離値の最も小さい標準パターンを選
出する標準パターン選出手段と、前記選択された標準パ
ターン記憶手段に記憶された複数の標準パターン間の類
似度に応じてリジェクト値を決定するリジエクト値決定
手段と、前記距離値と前記リジェクト値とを比較して距
離値がリジェクト値より大きい場合は前記標準パターン
選8手段による選出結果を無効とするリジエクト判定手
段とからなる構成を有している。
作用 この構成によって、リジェクト値決定手段が各ステート
に応じたりジエクト値 をリジェクト判定手段に与えてやることにより、リジェ
クト判定手段が、登録単語間の類似度が大きいステート
では厳しいリジェクト値で判定を行ない、登録単語間の
類似度が小さいステートではゆるいリジェクト値を判定
を行なうため、誤認識率及びリジェクト率を低く抑える
ことができ、認識率の高い音声認識システムを実現でき
る。
実施例 以下本発明の一実施例について、図面を参照しながら説
明する。
本実施例は、不特定話者に対する音声認識システムを自
販機に適応したものである。ただし、構成要件中、従来
例と同構成のものは、同番号を付し、説明を割愛する。
第1図は、本発明の一実施例における音声認識システム
のブロック図である。
13は、本発明の一実施例の音声認識システムであり、
音声分析手段2、第2標準パターン記憶手段3、第2標
準パターン記憶手段4、選択手段5、標準パターン選出
手段6、リジェクト値決定手段14、リジェクト判定手
段15から構成されている。以下に各構成要素の詳細に
ついて述べる。リジェクト値決定手段14は、各ステー
トに応じたりジエクト値をあらかじめ記憶しており、前
記選択手段5からのステート信号により、各ステートに
応じたりジエクト値をリジェクト判定手段15に出力す
るものである。すなわち、表2に示すように、ステート
1ならばLl、ステート2ならばL2のリジェクト値を
出力するものである。
ただし、ステート1には、コーヒーとコーラのように類
似度の大きな登録単語があるのに対して、ステート2は
、はいといいえの類似度の小さな登録単語であるため、
リジェクト値はLl<L2になる。
(3,’、)T−全白) 表2 リジェクト判定手段15は、前記リジェクト値決定手段
14より各ステートに応じたリジエクト値を入力し、前
記標準パターン選出手段6より認識結果及び入力音声パ
ターンと認識結果との距離値を入力して、リジェクト判
定を行なうものである。
以上のように構成された音声認識システムについて、第
2図のフローチャートを用いてその動作を説明する。第
2図において、まず、ステップ101で、前記コイン受
は取り手段11にコインが投入されたか否かを判定し、
コインが投入されればステップ102に進む、ステップ
102では、前記発声誘導手段9により、′いらっしゃ
いませ、何になさいますか”と誘導し、次に、ステップ
103で前記選択手段5により”ステート1”信号を出
力する。”ステート1”信号を受けて、ステップ104
で、前記リジェクト値決定手段14がリジェクト値Lr
=Lrlと決定する。ステップ105では、前記標準パ
ターン選出手段6が、入力音声パターンと標準パターン
群との距離を算出して距離値の最も小さい標準パターン
を選出して、フレーバー名を認識する。ステップ106
では前記リジェクト判定手段15が、前記リジェクト値
決定手段14より入力したりジエクト値Lrlと、前記
標準パターン選出手段6より人力した距離値L1とを比
較して、Ll>Lrlならばリジェクトと判定して、ス
テップ107へ進み、前記発声誘導手段9により、′も
う一度お答え下さい”と誘導して103へ戻る。一方、
L1≦Lrlならばステップ108へ進み1、前記発声
誘導手段9により、”コーヒーですね”と確認する。そ
して、ステップ109で前記選択手段5により”ステー
ト2”信号を出力する。”ステート2”信号を受けて、
ステップ110で、前記リジェクト値決定手段14がリ
ジェクト値Lr==Lr2と決定する。ステップ111
では、ステップ105と同様にして、人力音声パターン
と標準パターン群との距離を算出して距離値の最も小さ
い標準パターンを選出して、はいかいいえの返答を認識
する。ステップ112では前記リジェクト判定手段15
が、前記リジェクト値決定手段14より入力したリジエ
クト値Lr2と、前記標準パターン選出手段6より入力
した距離値L2とを比較して、L2>Lr2ならばりジ
ェツトと判定して、ステップ108へ戻り、L2≦Lr
2ならばステップ113へ進む、ステップ113では、
ステップ111で認識した返答がはいの場合はステップ
114へ進み、いいえの場合はステップ107へ戻る。
ステップ114では、前記自販機制御手段10が、コー
ヒーを前記飲料搬出手段12を使ってカップに注ぎ搬出
する。そして、ステップ115で、釣り銭がある場合は
、コイン受取手段11により釣り銭を払い戻し、最後に
、ステップ116で前記発声誘導手段9により、”あり
がどうございました”と発声して一連の動作を終了する
以上のように本実施例によれば、前記リジェクト値決定
手段14が各ステートに応じたりジエクト値を前記リジ
ェクト判定手段15に与えてやることにより、前記リジ
ェクト判定手段15が、登録単語間の類似度が大きいス
テート1では厳しいリジェクト値Lrlで判定を行ない
、登録単語間の類似度が小さいステート2ではゆるいリ
ジェクト値Lr2で判定を行なうため、誤認識率及びリ
ジェクト率を低く抑えることができ、認識率の高い音声
認識システムを実現できることとなり、その効果は大で
ある。
また、本実施例では、各ステートの登録単語間の類似度
の大きさによってリジェクト値を切り替えることとした
が、各ステートの登録単語が増える程、各登録単語間で
の誤認識も増える傾向にあるため、各ステートの登録単
語数によってリジェクト値を切り替えることとしてもよ
い。
発明の効果 以上のように本発明の音声認識システムは、複数の離散
単語音声の標準パターン群を記憶した複数の標準パター
ン記憶手段と、前記複数の標準パターン記憶手段のいず
れか1つを選択する選択手段と、発声者の音声を分析し
音声パターンを抽出する音声分析手段と、前記音声パタ
ーンと前記選択された標準パターン記憶手段の記憶する
複数の標準パターンとの距離を類似度計算により算出し
て距離値の最も小さい標準パターンを選出する標準パタ
ーン選出手段と、前記選択された標準パターン記憶手段
に記憶された複数の標準パターン間の類似度に応じてリ
ジェクト値を決定するりジエクト値決定手段と、前記距
離値と前記リジェクト値とを比較して距離値がリジェク
ト値より大きい場合は前記標準パターン選8手段による
選出結果を無効とするりジェツト判定手段とを設けるこ
とにより、リジェクト値決定手段が各ステートに応じた
りジエクト値をリジェクト判定手段に与えてやることに
より、リジェクト判定手段が、登録単語間の類似度が大
きいステートでは厳しいリジェクト値で判定を行ない、
登録単語間の類似度が小さいステートではゆるいリジェ
クト値で判定を行なうため、誤認識率及びリジェクト率
を低く抑えることができ、認識率の高い音声認識システ
ムを実現できることとなる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識システムの
機能ブロック図、第2図は本発明の実施例における音声
認識システムの動作例を示すフローチャート、第3図は
従来の音声認識システムの機能ブロック図である。 2・・・音声分析手段、3・・・第1標準パターン記憶
手段、4・・・第2標準パターン記憶手段、5・・・選
択手段、6・・・標準パターン選出手段、14・・・リ
ジェクト値決定手段、15・リジェクト判定手段。

Claims (1)

    【特許請求の範囲】
  1. 複数の離散単語音声の標準パターン群を記憶した複数の
    標準パターン記憶手段と、前記複数の標準パターン記憶
    手段のいずれか1つを選択する選択手段と、発声者の音
    声を分析し音声パターンを抽出する音声分析手段と、前
    記音声パターンと前記選択された標準パターン記憶手段
    の記憶する複数の標準パターンとの距離を類似度計算に
    より算出して距離値の最も小さい標準パターンを選出す
    る標準パターン選出手段と、前記選択された標準パター
    ン記憶手段に記憶された複数の標準パターン間の類似度
    に応じてリジエクト値を決定するリジエクト値決定手段
    と、前記距離値と前記リジエクト値とを比較して距離値
    がリジエクト値より大きい場合は前記標準パターン選出
    手段による選出結果を無効とするリジェクト判定手段と
    からなる音声認識システム。
JP2026532A 1990-02-06 1990-02-06 音声認識システム Pending JPH03231297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2026532A JPH03231297A (ja) 1990-02-06 1990-02-06 音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2026532A JPH03231297A (ja) 1990-02-06 1990-02-06 音声認識システム

Publications (1)

Publication Number Publication Date
JPH03231297A true JPH03231297A (ja) 1991-10-15

Family

ID=12196099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2026532A Pending JPH03231297A (ja) 1990-02-06 1990-02-06 音声認識システム

Country Status (1)

Country Link
JP (1) JPH03231297A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011033597A1 (ja) * 2009-09-19 2011-03-24 株式会社 東芝 信号分類装置
CN104008752A (zh) * 2013-02-25 2014-08-27 精工爱普生株式会社 语音识别装置及方法、以及半导体集成电路装置
JP2014170163A (ja) * 2013-03-05 2014-09-18 Seiko Epson Corp 音声認識装置及び方法、並びに、半導体集積回路装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011033597A1 (ja) * 2009-09-19 2011-03-24 株式会社 東芝 信号分類装置
JP5356527B2 (ja) * 2009-09-19 2013-12-04 株式会社東芝 信号分類装置
US8804973B2 (en) 2009-09-19 2014-08-12 Kabushiki Kaisha Toshiba Signal clustering apparatus
CN104008752A (zh) * 2013-02-25 2014-08-27 精工爱普生株式会社 语音识别装置及方法、以及半导体集成电路装置
US9886947B2 (en) 2013-02-25 2018-02-06 Seiko Epson Corporation Speech recognition device and method, and semiconductor integrated circuit device
JP2014170163A (ja) * 2013-03-05 2014-09-18 Seiko Epson Corp 音声認識装置及び方法、並びに、半導体集積回路装置

Similar Documents

Publication Publication Date Title
US4394538A (en) Speech recognition system and method
EP1159737B1 (en) Speaker recognition
JP2002536691A (ja) 音声認識除去方式
JPH03231297A (ja) 音声認識システム
EP1316944B1 (en) Sound signal recognition system and method, and dialog control system and method using it
JPH0375799A (ja) 音声認識システム
JP3437492B2 (ja) 音声認識方法及び装置
CN112530452A (zh) 一种后置滤波补偿方法、装置和系统
JPH02106800A (ja) 音声認識システム
JPH02250095A (ja) 音声認識システム
JPH02250096A (ja) 音声認識システム
JPH03127099A (ja) 音声認識システム
JP2001265387A (ja) 話者照合装置及び方法
JPH02250097A (ja) 音声認識システム
JPH0330083A (ja) 自動販売機
EP1079370A2 (en) Method for training a speech recognition system with detection of confusable words
KR100304665B1 (ko) 피치 웨이브 특성을 이용한 음성 인식 장치 및 그 방법
JPH03274598A (ja) 音声認識装置
JPH02300800A (ja) 音声認識装置
JPH03276196A (ja) 音声認識システム
JPS5915990A (ja) 音声認識方式
JPH02204797A (ja) 音声認識システム
JPH03231296A (ja) 音声認識装置
KR100395222B1 (ko) 음성사서함서비스(브이엠에스)를 위한 음성인식시스템
JPH02151900A (ja) 音声認識システム