JPS6194093A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6194093A JPS6194093A JP59216870A JP21687084A JPS6194093A JP S6194093 A JPS6194093 A JP S6194093A JP 59216870 A JP59216870 A JP 59216870A JP 21687084 A JP21687084 A JP 21687084A JP S6194093 A JPS6194093 A JP S6194093A
- Authority
- JP
- Japan
- Prior art keywords
- recognition device
- rejection
- input
- similarity
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技−重分−野
本発明は、音声認識装置に関する。
従−求核術−
音声認識装置において、入力音声の識別は一般に辞書に
格納された標準パターンと入力パターンとの類似度を示
す距離を計測し、その類似度の一番大きなものを識別す
る方式を用いる。このとき、1位の類似度と2位の頬イ
以度の差又は比を求めて閾値に対して小さいときは識別
不能として結果をリジエクトする方法がとられている。
格納された標準パターンと入力パターンとの類似度を示
す距離を計測し、その類似度の一番大きなものを識別す
る方式を用いる。このとき、1位の類似度と2位の頬イ
以度の差又は比を求めて閾値に対して小さいときは識別
不能として結果をリジエクトする方法がとられている。
第3図は、リジェクト比(1位の類似度/2位の類似度
)を用いた場合の誤認識領域■と、リジェクト領域■と
、正解領域■との関係を示す図で、図中、aは(10o
−誤認識率)、bは正解率を示す。例えば、リジェクト
比1.0の場合つまりリジェクトを設けないときの認識
率は正解率と等し<98.5%とする。リジェクト比を
上げてゆくと誤認識と正解率が低下し、リジェクトされ
る割合が増す。認識装置を使用する場合、用途に応じて
、リジェクトは少なく正解率が高い方が良い場合と、リ
ジェクトは多少あっても誤認識がない方が良い場合があ
る。前者は認識装置の近くに使用者がいて訂正手段があ
るときであり、後者は遠隔操作の場合のように訂正手段
がないときである。従来の認識装置においてはこれらの
用途に応じたリジェクトの指示法がなかった。
)を用いた場合の誤認識領域■と、リジェクト領域■と
、正解領域■との関係を示す図で、図中、aは(10o
−誤認識率)、bは正解率を示す。例えば、リジェクト
比1.0の場合つまりリジェクトを設けないときの認識
率は正解率と等し<98.5%とする。リジェクト比を
上げてゆくと誤認識と正解率が低下し、リジェクトされ
る割合が増す。認識装置を使用する場合、用途に応じて
、リジェクトは少なく正解率が高い方が良い場合と、リ
ジェクトは多少あっても誤認識がない方が良い場合があ
る。前者は認識装置の近くに使用者がいて訂正手段があ
るときであり、後者は遠隔操作の場合のように訂正手段
がないときである。従来の認識装置においてはこれらの
用途に応じたリジェクトの指示法がなかった。
月J!句
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置の用途に応じ使用者が正解率を重ん
するか誤認識率を少なくすることを重んするかで、リジ
ェクト指示を容易に与える手段を有する音声認識装置を
提供することを目的としてなされたものである。
特に、音声認識装置の用途に応じ使用者が正解率を重ん
するか誤認識率を少なくすることを重んするかで、リジ
ェクト指示を容易に与える手段を有する音声認識装置を
提供することを目的としてなされたものである。
1戒
本発明は、上記目的を達成するため、入力音声の入力パ
ターンを辞書に格納した標準パターンと照合してその類
似度を算出し、その第1位及び第21)ンの類似度音声
を識別し、第1位と第2位の類似度との差又は比からリ
ジェクト係数を求め、前記差又は比が閾値以下の場合、
結果をリジェクトするような音声認識装置において、特
定のリジェクト係数を使用者が入力できるようにしたこ
とを特徴としたものである。以下、本発明の実施例に基
づいて説明する。
ターンを辞書に格納した標準パターンと照合してその類
似度を算出し、その第1位及び第21)ンの類似度音声
を識別し、第1位と第2位の類似度との差又は比からリ
ジェクト係数を求め、前記差又は比が閾値以下の場合、
結果をリジェクトするような音声認識装置において、特
定のリジェクト係数を使用者が入力できるようにしたこ
とを特徴としたものである。以下、本発明の実施例に基
づいて説明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で、図中、1はマイクロホン。
ロック線図で、図中、1はマイクロホン。
2ば前処理回路、3は特徴抽出部で、特徴抽出部3で分
析された特徴パターンは認識処理部4で辞占に格納され
ている標準パターンと照合されて夫々類似度を算出する
。5ば音声区間検出部で入力信号から音声区間を検出す
る。6ば類似度結果からリシ丁−クトずべきかどうか判
定して結果を出力する結果判定部、7はリジェクト係数
の指示部で、この指示部からの指令に基づいて判定部で
認識結緊を吟味する。
析された特徴パターンは認識処理部4で辞占に格納され
ている標準パターンと照合されて夫々類似度を算出する
。5ば音声区間検出部で入力信号から音声区間を検出す
る。6ば類似度結果からリシ丁−クトずべきかどうか判
定して結果を出力する結果判定部、7はリジェクト係数
の指示部で、この指示部からの指令に基づいて判定部で
認識結緊を吟味する。
先づ、リジェクト係数の指示法であるがキーボードから
キーインする方法がある。この場合はソフトウェア的な
手段によりリジェクト係数を入力する。これをハードウ
ェア的に実現するためにはディップスイッチのようなコ
ード信号で指示できるスイッチによる方法と、複数の設
定状態を切り換えるスイッチによる方法がある。
キーインする方法がある。この場合はソフトウェア的な
手段によりリジェクト係数を入力する。これをハードウ
ェア的に実現するためにはディップスイッチのようなコ
ード信号で指示できるスイッチによる方法と、複数の設
定状態を切り換えるスイッチによる方法がある。
従来例で述べたように、リジェクト係数は正解率の高い
方を選ぶか誤認識率が少ない方を選ぶかで中間の領域を
選ぶごとはそれ程ないと思われる。
方を選ぶか誤認識率が少ない方を選ぶかで中間の領域を
選ぶごとはそれ程ないと思われる。
よって、第3図で言えばリジェクト比が1.0のポイン
トと1.55L2J、l−のどららかと言うことになる
。
トと1.55L2J、l−のどららかと言うことになる
。
従って、リジェクト0とするか又は誤認識の発生を0と
するかを指示することになる。この場合、装置のパネル
にリジェクト指示のスイッチがあり、リジェクト0と誤
認識0とが切り換えられるようになっておれば都合が良
(、マン−マシン−コミュニケーション機器としての音
声入力装置である認識装置としては使い勝手が良いもの
となる。
するかを指示することになる。この場合、装置のパネル
にリジェクト指示のスイッチがあり、リジェクト0と誤
認識0とが切り換えられるようになっておれば都合が良
(、マン−マシン−コミュニケーション機器としての音
声入力装置である認識装置としては使い勝手が良いもの
となる。
第2図は、上述のごとき切換え式にした場合のリジェク
ト係数指示部7の具体的構成図で、スイッチ0により正
解率重視の端子9aと誤認識数重視の端Y9bを切り換
え、係数指示器10の係数を例えば9aならば1.0を
、9bならば1.55以上の係数を発生し−(判定器6
に出力する。
ト係数指示部7の具体的構成図で、スイッチ0により正
解率重視の端子9aと誤認識数重視の端Y9bを切り換
え、係数指示器10の係数を例えば9aならば1.0を
、9bならば1.55以上の係数を発生し−(判定器6
に出力する。
すJ米
以にの説明から明らかなように、本発明によると、使用
者の用途に応じてIF解率と誤認識率のいづれを大切に
するかで簡単に認識装置を制御して使用することのでき
る音声認識装置を提供することができる。
者の用途に応じてIF解率と誤認識率のいづれを大切に
するかで簡単に認識装置を制御して使用することのでき
る音声認識装置を提供することができる。
第1図は、本発明による音声認識装置の一実施例を説明
するだめの電気的フロック線図、第2図は、第1図に示
したリジェクI・係数指示部7の詳細図、第3図C:1
、リジェクト比と誤認識領域、リジLりI〜領領域IF
解率の関係を示す図である。 1・・・71゛り「1ホン、2・・・前処理回路、3・
・・特徴抽出部、4・・・認識処理部、5・・・音声区
間検出部、6・・・結果判定部、7・・・リジェクト係
数指示部、9・・・スイッチ、10・・・係数指示器。
するだめの電気的フロック線図、第2図は、第1図に示
したリジェクI・係数指示部7の詳細図、第3図C:1
、リジェクト比と誤認識領域、リジLりI〜領領域IF
解率の関係を示す図である。 1・・・71゛り「1ホン、2・・・前処理回路、3・
・・特徴抽出部、4・・・認識処理部、5・・・音声区
間検出部、6・・・結果判定部、7・・・リジェクト係
数指示部、9・・・スイッチ、10・・・係数指示器。
Claims (4)
- (1)、入力音声の入力パターンを辞書に格納した標準
パターンとを照合してその類似度を算出し、その第1位
及び第2位の類似度音声を識別し、第1位と第2位の類
似度との差又は比からリジェクト係数を求め、前記差又
は比が閾値以下の場合、結果をリジェクトするような音
声認識装置において、特定のリジェクト係数を使用者が
入力できるようにしたことを特徴とする音声認識装置。 - (2)、前記リジェクト係数をキーボードから入力でき
るようにしたことを特徴とする特許請求の範囲第(1)
項に記載の音声認識装置。 - (3)、前記リジェクト係数が外部スイッチにより切換
えられることを特徴とする特許請求の範囲第(1)項に
記載の音声認識装置。 - (4)、正解率が1番高いポイントと誤認識率が0とな
るポイントの2点のリジェクト係数を指定できることを
特徴とする特許請求の範囲第(1)項又は第(2)項又
は第(3)項に記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59216870A JPS6194093A (ja) | 1984-10-16 | 1984-10-16 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59216870A JPS6194093A (ja) | 1984-10-16 | 1984-10-16 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6194093A true JPS6194093A (ja) | 1986-05-12 |
Family
ID=16695200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59216870A Pending JPS6194093A (ja) | 1984-10-16 | 1984-10-16 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6194093A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008233305A (ja) * | 2007-03-19 | 2008-10-02 | Toyota Central R&D Labs Inc | 音声対話装置、音声対話方法及びプログラム |
-
1984
- 1984-10-16 JP JP59216870A patent/JPS6194093A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008233305A (ja) * | 2007-03-19 | 2008-10-02 | Toyota Central R&D Labs Inc | 音声対話装置、音声対話方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4401849A (en) | Speech detecting method | |
US4581755A (en) | Voice recognition system | |
US20230321488A1 (en) | A Controller and a Method to Determine a Swim Stroke | |
JPS6194093A (ja) | 音声認識装置 | |
JPS62141595A (ja) | 音声検出方式 | |
JPH01159697A (ja) | 音声認識装置 | |
JPH04199198A (ja) | 音声認識装置 | |
JPH01244497A (ja) | 音声区間検出回路 | |
JPH04198997A (ja) | 音声認識方法 | |
JPH0651792A (ja) | 音声認識装置 | |
JPH08254991A (ja) | パターン認識装置 | |
JPS61238099A (ja) | 単語音声認識装置 | |
JPS63155196A (ja) | 無声音検出方法 | |
JPH1049190A (ja) | 音声認識装置および音声認識方法 | |
JP2547541B2 (ja) | 単音節音声認識装置 | |
JPS6283799A (ja) | 音声認識装置 | |
JPS62209500A (ja) | 話者認識装置 | |
JPS61259296A (ja) | 音声区間検出方式 | |
JPS61185800A (ja) | 音声ピツチ抽出装置 | |
JPS63155200A (ja) | ピツチ検出法 | |
JPS6285393A (ja) | リジエクト機能付きパタ−ン認識装置 | |
JPS6238718B2 (ja) | ||
JPS6256998A (ja) | 子音区間検出装置 | |
JPH02238493A (ja) | 音声区間検出装置 | |
JPS63155197A (ja) | 無声音検出方法 |