JPH02198499A - 音声認識装置の辞書の自動更新システム - Google Patents
音声認識装置の辞書の自動更新システムInfo
- Publication number
- JPH02198499A JPH02198499A JP1018523A JP1852389A JPH02198499A JP H02198499 A JPH02198499 A JP H02198499A JP 1018523 A JP1018523 A JP 1018523A JP 1852389 A JP1852389 A JP 1852389A JP H02198499 A JPH02198499 A JP H02198499A
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- dictionary
- updated
- standard pattern
- update
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
仮豊圀互
本発明は、音声認識装置の辞書の自動更新システムに関
する。
する。
嶽米扱権
従来の音声認識システムの更新法は、更新のために入力
された入力パターンでユーザーの指定した標準パターン
を更新するか、又は、認識結果に基いて、その第一位の
結果がユーザーが正しいと判断したものについてのみそ
の未知入力パターンでその標準パターンを更新していた
。
された入力パターンでユーザーの指定した標準パターン
を更新するか、又は、認識結果に基いて、その第一位の
結果がユーザーが正しいと判断したものについてのみそ
の未知入力パターンでその標準パターンを更新していた
。
従って、自動的に更新を行うために、ユーザの決定を仰
がなければならず面倒であった。
がなければならず面倒であった。
又、更新を、次の発声入力があった場合に更新可とみな
して、その入力後に前回の入力パターンを用いて、前回
の第一位の標準パターンを更新していた。しかしながら
、発声後に周囲ノイズが入った場合などに、誤りである
にもかかわらず更新してしまう様なことがあり、ユーザ
は絶えず注意を払う必要があり面倒であった。
して、その入力後に前回の入力パターンを用いて、前回
の第一位の標準パターンを更新していた。しかしながら
、発声後に周囲ノイズが入った場合などに、誤りである
にもかかわらず更新してしまう様なことがあり、ユーザ
は絶えず注意を払う必要があり面倒であった。
この様に、従来技術においては誤認識により標準パター
ンを悪化させることがあり、また、それを防ぐためにユ
ーザを介する必要があり辞書のメンテナンスに労力を要
していた。
ンを悪化させることがあり、また、それを防ぐためにユ
ーザを介する必要があり辞書のメンテナンスに労力を要
していた。
目 的
本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識装置の標準テンプレート群の自動更新を行うこ
とにより、より効率的にその標準テンプレート群を、現
在の音質に近づけ、認識率の降下をおさえることのでき
る音声認識装置の辞書の自動更新システムを提供するこ
とを目的としてなされたものである。
音声認識装置の標準テンプレート群の自動更新を行うこ
とにより、より効率的にその標準テンプレート群を、現
在の音質に近づけ、認識率の降下をおさえることのでき
る音声認識装置の辞書の自動更新システムを提供するこ
とを目的としてなされたものである。
構 成
本発明は、上記目的を達成するために、入力された音声
を増幅し、補正を行う前段部と、その音声信号から特徴
量を抽出する特徴抽出部と、その特徴データを用いて音
声の始端、終端を決定する音声区間検出部と、その様に
して得られた特徴データから標準パターンを生成する標
準パターン生成部と、未知入力に対して照合演算を行う
認識演算部と、その認識結果に基く#A$パターンと入
力パターンとを用いて更新する更新演算部とを有する音
声認識装置の辞書の自動更新システムにおいて、認識結
果の第一位と第二位の類似度の比が第一の閾値以上で、
第一位の類似度が第二の閾値以上の時に限って標準パタ
ーンを更新すること、更に、更新した場合の認識結果に
対する過去の類似度の平均値を求め、その平均値以上の
認識結果の場合のみ更新すること、更に、条件を満たす
場合に更新した場合の類似度を求め、その類似度が認識
結果で得られた類似度のある定数倍より低い場合は更新
しないこと、更に、更新しようとする標準パターンと未
知入力パターンの無音区間数の差がQ個以上ある場合に
更新しないこと、更には、更新しようとする標準パター
ンと未知入力パターンのフレーム長がある閾値以上差が
ある場合に更新しないことを特徴としたものである。以
下、本発明の実施例に基づいて説明する。
を増幅し、補正を行う前段部と、その音声信号から特徴
量を抽出する特徴抽出部と、その特徴データを用いて音
声の始端、終端を決定する音声区間検出部と、その様に
して得られた特徴データから標準パターンを生成する標
準パターン生成部と、未知入力に対して照合演算を行う
認識演算部と、その認識結果に基く#A$パターンと入
力パターンとを用いて更新する更新演算部とを有する音
声認識装置の辞書の自動更新システムにおいて、認識結
果の第一位と第二位の類似度の比が第一の閾値以上で、
第一位の類似度が第二の閾値以上の時に限って標準パタ
ーンを更新すること、更に、更新した場合の認識結果に
対する過去の類似度の平均値を求め、その平均値以上の
認識結果の場合のみ更新すること、更に、条件を満たす
場合に更新した場合の類似度を求め、その類似度が認識
結果で得られた類似度のある定数倍より低い場合は更新
しないこと、更に、更新しようとする標準パターンと未
知入力パターンの無音区間数の差がQ個以上ある場合に
更新しないこと、更には、更新しようとする標準パター
ンと未知入力パターンのフレーム長がある閾値以上差が
ある場合に更新しないことを特徴としたものである。以
下、本発明の実施例に基づいて説明する。
本来、更新演算を行う機会は、その認識のために発声さ
れたデータを用いて、その認識結果を何らかの手段で、
正しいかどうかを判断して、その結果の標準パターンに
対して、更新演算を行う。
れたデータを用いて、その認識結果を何らかの手段で、
正しいかどうかを判断して、その結果の標準パターンに
対して、更新演算を行う。
第2図は、」−記の更新演算の概念を説明するための図
で、図中、1は認識部、2は更新判定部、3は更新演算
部、4は入力バッファ、5は標準パターン生成部である
。この場合、もっとも問題となるのは更新判定で、認識
装置からの結果の正確さをどのように知るかである。
で、図中、1は認識部、2は更新判定部、3は更新演算
部、4は入力バッファ、5は標準パターン生成部である
。この場合、もっとも問題となるのは更新判定で、認識
装置からの結果の正確さをどのように知るかである。
第1図は、本発明による自動更新システムのブロック図
で、図中、6は前処理部、7は特徴抽出部、8は登録部
を示し、その他第2図の場合と同様の作用をする部分1
〜4には第2図の場合と同一の参照番号を付しである。
で、図中、6は前処理部、7は特徴抽出部、8は登録部
を示し、その他第2図の場合と同様の作用をする部分1
〜4には第2図の場合と同一の参照番号を付しである。
入力された音声は前処理部6で増幅、補正され、特徴抽
出部7において、例えばケプストラムやパワースペク1
〜ルなどの認識に必要な特徴量を得、入力パターンとし
て認識部1へ送られる。
出部7において、例えばケプストラムやパワースペク1
〜ルなどの認識に必要な特徴量を得、入力パターンとし
て認識部1へ送られる。
認識部1は未知入力パターンと標準パターンとで照合演
算を行い、最も高い類似性を示すものを結果として出力
し、その結果について、更新判定部2で更新を行うか否
かを判断し、更新を行う場合は、入力バッファ4のデー
タで該当する標準パターンを更新する。更新を行わない
場合は何もせ6一 す結果を出力する。
算を行い、最も高い類似性を示すものを結果として出力
し、その結果について、更新判定部2で更新を行うか否
かを判断し、更新を行う場合は、入力バッファ4のデー
タで該当する標準パターンを更新する。更新を行わない
場合は何もせ6一 す結果を出力する。
次に、本発明の主旨である更新判定法について説明する
。まず、出力された結果の第一位と第三位の比が閾値T
1以下の場合、つまり第一位と第三位の類似度が接近し
ている場合か、第一位の類似度が閾値T2より低い場合
、この結果の信頼性は低いと判断されるため更新は行わ
ない。
。まず、出力された結果の第一位と第三位の比が閾値T
1以下の場合、つまり第一位と第三位の類似度が接近し
ている場合か、第一位の類似度が閾値T2より低い場合
、この結果の信頼性は低いと判断されるため更新は行わ
ない。
又、この類似度を各標準パターンに対して過去の類似度
を平均して行き、得られた類似度がその平均値に対して
、所定%以下の値の場合更新は行わない。
を平均して行き、得られた類似度がその平均値に対して
、所定%以下の値の場合更新は行わない。
又、実際にパターンを更新して再びその入力と類似度を
求めると、その類似度は当然大きくなるはずであるが、
線型伸縮による照合や、数回の発声による加算で辞書を
作成するシステムにおいては、時として、かえって類似
度が小さくなる場合がある。従って、このような場合は
更新しない。
求めると、その類似度は当然大きくなるはずであるが、
線型伸縮による照合や、数回の発声による加算で辞書を
作成するシステムにおいては、時として、かえって類似
度が小さくなる場合がある。従って、このような場合は
更新しない。
欣に、更新しようとする標準パターンの有する無音区間
数と入力パターンの無音区間数が所定(Q)個以上の差
がある場合は更新しない。
数と入力パターンの無音区間数が所定(Q)個以上の差
がある場合は更新しない。
更に同様に、両者のフレーム長がある閾値以上ある場合
も更新しない。この様に信頼性の高い場合のみ未知入力
パターンで標準パターンを更新することにより、誤認識
による更新の悪影響を極力小さくすることが可能である
。
も更新しない。この様に信頼性の高い場合のみ未知入力
パターンで標準パターンを更新することにより、誤認識
による更新の悪影響を極力小さくすることが可能である
。
効 果
以上の説明から明らかなように、本発明によると、認識
結果を考慮して更新を行うようにしたので、より効率的
に正確に自動更新が可能となり、音声辞書のメンテナン
スが可能になった。
結果を考慮して更新を行うようにしたので、より効率的
に正確に自動更新が可能となり、音声辞書のメンテナン
スが可能になった。
第1図は、本発明による自動辞書更新システムのブロッ
ク図、第2図は、更新演算の概念図である。 1・・・認識部、2・・更新判定部、3・・・更新演算
部、4・・・入力バッファ、5・・・標準パターン生成
部、6・・・前処理部、7・・特徴抽出部、8・・・登
録部。 特許出願人 株式会社 リコー
ク図、第2図は、更新演算の概念図である。 1・・・認識部、2・・更新判定部、3・・・更新演算
部、4・・・入力バッファ、5・・・標準パターン生成
部、6・・・前処理部、7・・特徴抽出部、8・・・登
録部。 特許出願人 株式会社 リコー
Claims (1)
- 【特許請求の範囲】 1、入力された音声を増幅し、補正を行う前段部と、そ
の音声信号から特徴量を抽出する特徴抽出部と、その特
徴データを用いて音声の始端、終端を決定する音声区間
検出部と、その様にして得られた特徴データから標準パ
ターンを生成する標準パターン生成部と、未知入力に対
して照合演算を行う認識演算部と、その認識結果に基く
標準パターンと入力パターンとを用いて更新する更新演
算部とを有する音声認識装置の辞書の自動更新システム
において、認識結果の第一位と第二位の類似度の比が第
一の閾値以上で、第一位の類似度が第二の閾値以上の時
に限って標準パターンを更新することを特徴とする音声
認識装置の辞書の自動更新システム。 2、更新した場合の認識結果に対する過去の類似度の平
均値を求め、その平均値以上の認識結果の場合のみ更新
することを特徴とする請求項1記載の音声認識装置の辞
書の自動更新システム。 3、条件を満たす場合に更新した場合の類似度を求め、
その類似度が認識結果で得られた類似度のある定数倍よ
り低い場合は更新しないことを特徴とする請求項1又は
請求項2記載の音声認識装置の辞書の自動更新システム
。 4、更新しようとする標準パターンと未知入力パターン
の無音区間数の差がl個以上ある場合に、更新しないこ
とを特徴とする請求項第1項乃至第3項のいずれか1項
に記載の音声認識装置の辞書の自動更新システム。 5、更新しようとする標準パターンと未知入力パターン
のフレーム長がある閾値以上差がある場合に更新しない
ことを特徴とする請求項第1項乃至第3項のいずれか1
項に記載の音声認識装置の辞書の自動更新システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1018523A JPH02198499A (ja) | 1989-01-27 | 1989-01-27 | 音声認識装置の辞書の自動更新システム |
US07/468,173 US5040213A (en) | 1989-01-27 | 1990-01-22 | Method of renewing reference pattern stored in dictionary |
DE4002336A DE4002336A1 (de) | 1989-01-27 | 1990-01-26 | Bezugsmuster-erneuerungsverfahren |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1018523A JPH02198499A (ja) | 1989-01-27 | 1989-01-27 | 音声認識装置の辞書の自動更新システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02198499A true JPH02198499A (ja) | 1990-08-06 |
Family
ID=11973990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1018523A Pending JPH02198499A (ja) | 1989-01-27 | 1989-01-27 | 音声認識装置の辞書の自動更新システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02198499A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002502992A (ja) * | 1998-02-03 | 2002-01-29 | デテモビール ドイチェ テレコム モビールネット ゲーエムベーハー | 音声認識システムにおける認識率向上方法及び装置 |
-
1989
- 1989-01-27 JP JP1018523A patent/JPH02198499A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002502992A (ja) * | 1998-02-03 | 2002-01-29 | デテモビール ドイチェ テレコム モビールネット ゲーエムベーハー | 音声認識システムにおける認識率向上方法及び装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1355295A2 (en) | Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded | |
JPS62217295A (ja) | 音声認識方式 | |
US5040213A (en) | Method of renewing reference pattern stored in dictionary | |
US20020082833A1 (en) | Method for recognizing speech | |
KR101122590B1 (ko) | 음성 데이터 분할에 의한 음성 인식 장치 및 방법 | |
JP3069531B2 (ja) | 音声認識方法 | |
JP2002215187A (ja) | 音声認識方法及びその装置 | |
JP3535292B2 (ja) | 音声認識システム | |
KR101122591B1 (ko) | 핵심어 인식에 의한 음성 인식 장치 및 방법 | |
JP2996019B2 (ja) | 音声認識装置 | |
JPH02198499A (ja) | 音声認識装置の辞書の自動更新システム | |
JP2006039382A (ja) | 音声認識装置 | |
EP0177854B1 (en) | Keyword recognition system using template-concatenation model | |
US6438521B1 (en) | Speech recognition method and apparatus and computer-readable memory | |
JP2002215184A (ja) | 音声認識装置、及びプログラム | |
JP2002041083A (ja) | 遠隔制御システムおよび遠隔制御方法、並びに記録媒体 | |
JPH11249688A (ja) | 音声認識装置およびその方法 | |
JPH06324699A (ja) | 連続音声認識装置 | |
JP3007357B2 (ja) | 音声認識装置の辞書更新方式 | |
JPH08314490A (ja) | ワードスポッティング型音声認識方法と装置 | |
KR960001950B1 (ko) | 음성인식방법 및 그 장치 | |
JP3031081B2 (ja) | 音声認識装置 | |
JPH0997095A (ja) | 音声認識装置 | |
JPH071438B2 (ja) | 音声中の複数話者の発話区間自動検出同定装置 | |
KR20010026402A (ko) | 신경망을 이용한 음성인식장치 및 그 방법 |