JPH0481898A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH0481898A JPH0481898A JP2197173A JP19717390A JPH0481898A JP H0481898 A JPH0481898 A JP H0481898A JP 2197173 A JP2197173 A JP 2197173A JP 19717390 A JP19717390 A JP 19717390A JP H0481898 A JPH0481898 A JP H0481898A
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- voice
- place
- matching
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 abstract description 2
- 238000012790 confirmation Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000004744 fabric Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声認識装置に関し、特に誤認識し易い発音が
類似している音声の認識に好適な音声認識装置に関する
。
類似している音声の認識に好適な音声認識装置に関する
。
従来の音声認識装置では、発音の類似している音声を誤
認識することが多い、例えば、富山(TOYAMA)と
音声入力した時、周囲雑音あるいは音声の検出誤り等で
語頭が失われて小山(OYAMA)と認識されることが
ある。このため認識結果の認識機能と訂正機能が不可欠
である。
認識することが多い、例えば、富山(TOYAMA)と
音声入力した時、周囲雑音あるいは音声の検出誤り等で
語頭が失われて小山(OYAMA)と認識されることが
ある。このため認識結果の認識機能と訂正機能が不可欠
である。
従来、この種の誤認識に対して下記の対策を施している
。
。
(1〉入力単位ごと、あるいは区切りの良い単位ごとの
入力終了後、表示装置や音声出力装置で認識を行ない誤
った部分を音声で再度入力するか、あるいはキーボード
から入力して訂正する。
入力終了後、表示装置や音声出力装置で認識を行ない誤
った部分を音声で再度入力するか、あるいはキーボード
から入力して訂正する。
(2)発音の類似しており誤認識されそうな音声につい
ては区別できるように言い方を変える。
ては区別できるように言い方を変える。
(例)富山(TOYAMA)→富山系(TOYAMAK
EN) 小山(OYAMA)→小山布(OYAMAS I )〔
発明が解決しようとする課題〕 上述した従来の音声認識装置における誤認識の対策では
、次のような欠点がある。
EN) 小山(OYAMA)→小山布(OYAMAS I )〔
発明が解決しようとする課題〕 上述した従来の音声認識装置における誤認識の対策では
、次のような欠点がある。
(1)入力単位ごとに確認すると、余分な時間が掛かる
。
。
(2)キーボードを使用すると、操作が複雑になり音声
入力の利点が無くなる。
入力の利点が無くなる。
(3)認識語を変更すると、使用者に違和感を与える。
本発明の音声認識装置は、登録した音声識別用の標準パ
ターン間の類似度が予め設定した値よりも大きいものの
組合せを保持する類似語テーブルと、入力音声と前記標
準パターンとのマツチング結果に応じて前記類似語テー
ブルに保持されているかを検索する判定手段と、前記マ
ツチング結果が前記類似後テーブルに存在したときには
音声で類似語選択の適否問合せを出力する音声出力手段
とを有する。
ターン間の類似度が予め設定した値よりも大きいものの
組合せを保持する類似語テーブルと、入力音声と前記標
準パターンとのマツチング結果に応じて前記類似語テー
ブルに保持されているかを検索する判定手段と、前記マ
ツチング結果が前記類似後テーブルに存在したときには
音声で類似語選択の適否問合せを出力する音声出力手段
とを有する。
次に、本発明について図面を参照して説明する。
第1図は本発明の第1の実施例を示すブロック図である
。音声分析部3は、マイクロホン1から入ってくる音声
信号を分析してその音声パターンの特徴を現わす認識パ
ラメータの抽出と、音声の始端、終端を決定する音声検
出を行う。パターンマツチング部4は、標準パターン5
を登録した時に各標準パターン間の類似度を計算して、
類似度が予め設定された第1の閾値を越えている標準パ
ターンの番号を類似語テーブル7に登録する。また認、
識モード時には、パターンマツチング4での音声分析結
果と標準パターン5との間でパターンマツチングを行い
、類似度を計算する。判定部6は、認識モード時、パタ
ーンマツチング部4で計算した確標準パターンと類似度
から第−位、第三位、第三位・・・・・・のマツチング
結果を得る。それから第−位のマツチング結果と同じパ
ターン番号が類似度テーブル7に登録されているか否か
を検索する。類似度テーブル7に登録されている場合、
第−位のマツチング結果と第三位のマツチング結果の類
似度の差が予め設定された第2の閾値以上の時は第−位
のマツチング結果と第三位のマツチング結果との類似度
の差が第2の閾値以上の時は第−位のマツチング結果を
認識結果として出力する。
。音声分析部3は、マイクロホン1から入ってくる音声
信号を分析してその音声パターンの特徴を現わす認識パ
ラメータの抽出と、音声の始端、終端を決定する音声検
出を行う。パターンマツチング部4は、標準パターン5
を登録した時に各標準パターン間の類似度を計算して、
類似度が予め設定された第1の閾値を越えている標準パ
ターンの番号を類似語テーブル7に登録する。また認、
識モード時には、パターンマツチング4での音声分析結
果と標準パターン5との間でパターンマツチングを行い
、類似度を計算する。判定部6は、認識モード時、パタ
ーンマツチング部4で計算した確標準パターンと類似度
から第−位、第三位、第三位・・・・・・のマツチング
結果を得る。それから第−位のマツチング結果と同じパ
ターン番号が類似度テーブル7に登録されているか否か
を検索する。類似度テーブル7に登録されている場合、
第−位のマツチング結果と第三位のマツチング結果の類
似度の差が予め設定された第2の閾値以上の時は第−位
のマツチング結果と第三位のマツチング結果との類似度
の差が第2の閾値以上の時は第−位のマツチング結果を
認識結果として出力する。
次に具体例で説明する。標準パターンに次のパターンを
登録した場合に、 標準パターン番号 標準パターン登録語1
東京(TO−KYO−)2
大阪(0O8AKA)3 名古屋(N
AGOYA)21 富山(TOYAMA
)103 小山(OYAMA)標準パタ
ーンと富山と小山の類似度が大きかったとする。このと
き標準パターン番号21と103とを類似度テーブル7
に登録する。
登録した場合に、 標準パターン番号 標準パターン登録語1
東京(TO−KYO−)2
大阪(0O8AKA)3 名古屋(N
AGOYA)21 富山(TOYAMA
)103 小山(OYAMA)標準パタ
ーンと富山と小山の類似度が大きかったとする。このと
き標準パターン番号21と103とを類似度テーブル7
に登録する。
認識モード時にマイクロホンから富山を入力した時、音
声検出の誤り等で第−位のマツチング結果が小山、第三
位の結果が富山になったとする。
声検出の誤り等で第−位のマツチング結果が小山、第三
位の結果が富山になったとする。
このとき類似度テーブル小山(103)が登録されてい
るので、第三位の類似度の差を求める。類似度の差が第
2の閾値以下の場合は、音声出力部8を駆動する。これ
に応じて音声出力部8は、マツチング結果の確認のため
のメツセージを出力する(例、“小山ですか? ”)、
確認メツセージを聞いた使用者は、否定の入力があった
場合さらに次のメツセージを出力し確認を求める(例、
富山ですか?゛′)。肯定(例、“はい″)の入力で認
識結果が決まる。第−位の結果が富山であった場合は、
確認メツセージに対して肯定の入力を行い認識結果を決
定する。
るので、第三位の類似度の差を求める。類似度の差が第
2の閾値以下の場合は、音声出力部8を駆動する。これ
に応じて音声出力部8は、マツチング結果の確認のため
のメツセージを出力する(例、“小山ですか? ”)、
確認メツセージを聞いた使用者は、否定の入力があった
場合さらに次のメツセージを出力し確認を求める(例、
富山ですか?゛′)。肯定(例、“はい″)の入力で認
識結果が決まる。第−位の結果が富山であった場合は、
確認メツセージに対して肯定の入力を行い認識結果を決
定する。
第2図は本発明の第2の実施例を示すブロック図である
。本実施例は、第1の実施例に、標準パターン5のデー
タ音素記号を入力するためのキーボード−9を付加した
ものである。類似語テーブル作成部10は、入力された
音素記号から類似しているパターンを検出し類似語テー
ブル7に登録する。
。本実施例は、第1の実施例に、標準パターン5のデー
タ音素記号を入力するためのキーボード−9を付加した
ものである。類似語テーブル作成部10は、入力された
音素記号から類似しているパターンを検出し類似語テー
ブル7に登録する。
類似語テーブル7は、例えば、富山(TOYAMA)と
小山(OYAMA) 、和歌山(WAKAYAMA)と
岡山(OKAYAMA)、津市(TUSI)と逗子(Z
USI)等のように語頭だけが違っており、人間が聞い
ても間違いそうな単語を検出して作成すれば良い。
小山(OYAMA) 、和歌山(WAKAYAMA)と
岡山(OKAYAMA)、津市(TUSI)と逗子(Z
USI)等のように語頭だけが違っており、人間が聞い
ても間違いそうな単語を検出して作成すれば良い。
以上説明したように本発明は類似度が大きい標準パター
ンの組合せを保持する類似度テーブルを設け、入力音声
と標準パターンとのマツチング結果を類似度テーブルで
検索して音声出力で認識結果の確認を行なうことにより
、次のような効果がある。
ンの組合せを保持する類似度テーブルを設け、入力音声
と標準パターンとのマツチング結果を類似度テーブルで
検索して音声出力で認識結果の確認を行なうことにより
、次のような効果がある。
(1)類似度の大きい言葉が認識された時だけ確認を求
めるので、入力速度が早い。
めるので、入力速度が早い。
(2)誤認識した時の訂正にキーボードを使用する必要
がなくなり、操作が簡単になる。
がなくなり、操作が簡単になる。
(3)類似した言葉の誤認識を避けるために認識語を変
更する必要がなくなり、人と人の会話と同じになり違和
感がない。
更する必要がなくなり、人と人の会話と同じになり違和
感がない。
第1図および第2図は、本発明の実施例のブロック図を
示す。 1・・・マイクロホン、2・・・スピーカ、3・・・音
声分析部、4・・・パターンマツチング部、5・・・標
準パターン、6・・・判定部、7・・・類似語テーブル
、8・・・音声出力部、9・・・キーボード、10・・
・類似語テーブル作成部。
示す。 1・・・マイクロホン、2・・・スピーカ、3・・・音
声分析部、4・・・パターンマツチング部、5・・・標
準パターン、6・・・判定部、7・・・類似語テーブル
、8・・・音声出力部、9・・・キーボード、10・・
・類似語テーブル作成部。
Claims (1)
- 【特許請求の範囲】 1、登録した音声識別用の標準パターン間の類似度が予
め設定した値よりも大きいものの組合せを保持する類似
語テーブルと、入力音声と前記標準パターンとのマッチ
ング結果に応じて前記類似語テーブルに保持されている
かを検索する判定手段と、前記マッチング結果が前記類
似後テーブルに存在したときには音声で類似語選択の適
否問合せを出力する音声出力手段とを有することを特徴
とる音声認識装置。 2、前記判定手段は、第1位および第2位の前記マッチ
ング結果の類似度の差が予め設定した値以下のときにの
み、前記音声出力手段に前記問合せ出力させるよう制御
する請求項1記載の音声認識装置。 3、前記類似語テーブルに、登録した前記標準パターン
の音素記号を入力するためのキーボードと、入力された
該音素記号の系列が互いに類似している前記標準パター
ンの組合せを検出して該類似テーブルに登録する類似語
テーブル作成手段とを接続してある請求項1記載の音声
認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2197173A JPH0481898A (ja) | 1990-07-25 | 1990-07-25 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2197173A JPH0481898A (ja) | 1990-07-25 | 1990-07-25 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0481898A true JPH0481898A (ja) | 1992-03-16 |
Family
ID=16370012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2197173A Pending JPH0481898A (ja) | 1990-07-25 | 1990-07-25 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0481898A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000214879A (ja) * | 1999-01-20 | 2000-08-04 | Sony Internatl Europ Gmbh | 音声認識装置の適応化方法 |
JP2003271192A (ja) * | 2002-03-13 | 2003-09-25 | Nissan Motor Co Ltd | 音声認識装置 |
JP2009116075A (ja) * | 2007-11-07 | 2009-05-28 | Xanavi Informatics Corp | 音声認識装置 |
CN111128140A (zh) * | 2019-12-30 | 2020-05-08 | 云知声智能科技股份有限公司 | 语音播报的中断方法及装置 |
WO2021130892A1 (ja) * | 2019-12-25 | 2021-07-01 | 日本電気株式会社 | 変換テーブル生成装置、音声対話システム、変換テーブル生成方法、音声対話方法および記録媒体 |
-
1990
- 1990-07-25 JP JP2197173A patent/JPH0481898A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000214879A (ja) * | 1999-01-20 | 2000-08-04 | Sony Internatl Europ Gmbh | 音声認識装置の適応化方法 |
JP4638970B2 (ja) * | 1999-01-20 | 2011-02-23 | ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング | 音声認識装置の適応化方法 |
JP2003271192A (ja) * | 2002-03-13 | 2003-09-25 | Nissan Motor Co Ltd | 音声認識装置 |
JP2009116075A (ja) * | 2007-11-07 | 2009-05-28 | Xanavi Informatics Corp | 音声認識装置 |
WO2021130892A1 (ja) * | 2019-12-25 | 2021-07-01 | 日本電気株式会社 | 変換テーブル生成装置、音声対話システム、変換テーブル生成方法、音声対話方法および記録媒体 |
JPWO2021130892A1 (ja) * | 2019-12-25 | 2021-07-01 | ||
CN111128140A (zh) * | 2019-12-30 | 2020-05-08 | 云知声智能科技股份有限公司 | 语音播报的中断方法及装置 |
CN111128140B (zh) * | 2019-12-30 | 2022-08-26 | 云知声智能科技股份有限公司 | 语音播报的中断方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3674990B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP4246703B2 (ja) | 自動音声認識の方法 | |
WO2021213490A1 (zh) | 一种身份验证方法、装置和电子设备 | |
JPH0481898A (ja) | 音声認識装置 | |
KR20210000802A (ko) | 인공지능 음성 인식 처리 방법 및 시스템 | |
US7177806B2 (en) | Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system | |
JP2003177779A (ja) | 音声認識のための話者学習法 | |
JP2020148805A (ja) | 音声認識システム、及び、音声認識方法 | |
JP2004251998A (ja) | 対話理解装置 | |
JP3008593B2 (ja) | 音声認識装置 | |
JPH09274497A (ja) | 音声認識装置 | |
JP6571587B2 (ja) | 音声入力装置、その方法、及びプログラム | |
JPS61175696A (ja) | 情報処理方法 | |
KR100677224B1 (ko) | 안티워드 모델을 이용한 음성인식 방법 | |
JPH02103599A (ja) | 音声認識装置 | |
JPH0484197A (ja) | 連続音声認識装置 | |
JPH0651792A (ja) | 音声認識装置 | |
JPS6239899A (ja) | 会話音声理解方法 | |
JPH02178699A (ja) | 音声認識装置 | |
JP2864511B2 (ja) | 話者識別方式と装置 | |
JPH07210186A (ja) | 音声登録装置 | |
JPH0236960B2 (ja) | ||
JP2002196789A (ja) | 音声対話装置 | |
JPH03155599A (ja) | 音声認識装置 | |
JPH0416899A (ja) | 音声認識装置 |