JPH02201400A - 音声認識辞書管理装置 - Google Patents
音声認識辞書管理装置Info
- Publication number
- JPH02201400A JPH02201400A JP1020490A JP2049089A JPH02201400A JP H02201400 A JPH02201400 A JP H02201400A JP 1020490 A JP1020490 A JP 1020490A JP 2049089 A JP2049089 A JP 2049089A JP H02201400 A JPH02201400 A JP H02201400A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- pattern
- evaluation value
- dictionaries
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 16
- 238000007726 management method Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000002950 deficient Effects 0.000 abstract description 3
- 230000002411 adverse Effects 0.000 abstract description 2
- 238000012217 deletion Methods 0.000 abstract 1
- 230000037430 deletion Effects 0.000 abstract 1
- 238000001228 spectrum Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
挟亙分見
本発明は、音声認識装置の辞書管理方式に関する。
胱」θ1欧
音声認識において、例えば登録の際に音声と同時に周囲
ノイズなどが入った場合、その辞書は本来の辞書とは異
なる辞書となり、当然、認識させようとしても誤認識す
るか、認識してもその確度は低い、又、数回発声し平均
化するような辞書においては、−度の発声が異なるよう
な場合も同様の結果となる。
ノイズなどが入った場合、その辞書は本来の辞書とは異
なる辞書となり、当然、認識させようとしても誤認識す
るか、認識してもその確度は低い、又、数回発声し平均
化するような辞書においては、−度の発声が異なるよう
な場合も同様の結果となる。
更に、そのような辞書は、比較的特徴のない辞書になっ
ているため、逆に認識時他の単語を発声した時、その辞
書単語が、第何位かの下位に入ってくる可能性が高くな
り、結果を阻害する場合が生ずる。
ているため、逆に認識時他の単語を発声した時、その辞
書単語が、第何位かの下位に入ってくる可能性が高くな
り、結果を阻害する場合が生ずる。
且−一旗
本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識装置の登録された辞書の不良を発見し、それを
その辞書内から削除し、他に与える影響を無くすととも
に、いち早くユーザにそれを促し、再登録して辞書の品
質を保持するように構成した音声認識辞書管理方式を提
供することを目的としてなされたものである。
音声認識装置の登録された辞書の不良を発見し、それを
その辞書内から削除し、他に与える影響を無くすととも
に、いち早くユーザにそれを促し、再登録して辞書の品
質を保持するように構成した音声認識辞書管理方式を提
供することを目的としてなされたものである。
構成
本発明は、上記目的を達成するために、マイクから入力
された音声を補正して分析する補正・分析手段と、この
分析結果から特徴量を抽出する抽出手段と、その特徴量
を音声テンプレートとしてメモリして登録する登録手段
と、更に未知入力の特徴パターンと前記テンプレートを
比較して類似度を算出する算出手段とを有する音声認識
装置において、構成されている複数のテンプレートの各
々のテンプレートの評価演算を行い、その評価値がある
レベル以下の場合にその単語辞書を抹消する事、更に、
上記評価値演算に特徴量を有する部分と有しない部分の
差又は比により評価値を決定する事、更に、上記評価値
に基いて、その辞書の品質をユーザに知らせる事を特徴
としたものである。
された音声を補正して分析する補正・分析手段と、この
分析結果から特徴量を抽出する抽出手段と、その特徴量
を音声テンプレートとしてメモリして登録する登録手段
と、更に未知入力の特徴パターンと前記テンプレートを
比較して類似度を算出する算出手段とを有する音声認識
装置において、構成されている複数のテンプレートの各
々のテンプレートの評価演算を行い、その評価値がある
レベル以下の場合にその単語辞書を抹消する事、更に、
上記評価値演算に特徴量を有する部分と有しない部分の
差又は比により評価値を決定する事、更に、上記評価値
に基いて、その辞書の品質をユーザに知らせる事を特徴
としたものである。
一般に音声認識装置においては、多数の辞書が装置内に
おり、未知入力に対して、辞書と照合演算を行い、最も
類似性の大きい辞書を候補として抽出する。
おり、未知入力に対して、辞書と照合演算を行い、最も
類似性の大きい辞書を候補として抽出する。
本発明では、装置内に有する辞書をある評価値を用いて
評価し、その良否を判定し、悪いもの又は悪影響を与え
るものを消去するようにしたものである。以下、本発明
の実施例に基づいて説明する。
評価し、その良否を判定し、悪いもの又は悪影響を与え
るものを消去するようにしたものである。以下、本発明
の実施例に基づいて説明する。
第1図は、本発明による音声認識辞書管理方式の一例を
説明するための構成図で、図中、1はマイク、2は特徴
抽出部、3は登録部、4は認識部、5は結果出力部、6
は評価部、71〜7nは辞書である。マイク1から入力
された音声は、特徴抽出部2において、その特徴量が抽
出され、登録部3において辞書パターンが生成され辞書
メモリに登録される。この辞書メモリ内の辞書は登録時
以外、つまり認識時に更新されたり、頁登録されたりす
る。辞書評価部6はある任意のタイミングで7゜〜7n
の各辞書1〜nを検査し不良のものは消去する。
説明するための構成図で、図中、1はマイク、2は特徴
抽出部、3は登録部、4は認識部、5は結果出力部、6
は評価部、71〜7nは辞書である。マイク1から入力
された音声は、特徴抽出部2において、その特徴量が抽
出され、登録部3において辞書パターンが生成され辞書
メモリに登録される。この辞書メモリ内の辞書は登録時
以外、つまり認識時に更新されたり、頁登録されたりす
る。辞書評価部6はある任意のタイミングで7゜〜7n
の各辞書1〜nを検査し不良のものは消去する。
この評価部6を例えばBTSP方式(BinaryTi
me Spectrum Pattern)を用いて説
明する。BTSP方式においては、J Ol と′1′
の2値パターンでその音声の特徴量を表現しており、そ
の2値パターンを例えば特定話者認識の場合、3回の発
声パターンを荷重平均化して用いる。
me Spectrum Pattern)を用いて説
明する。BTSP方式においては、J Ol と′1′
の2値パターンでその音声の特徴量を表現しており、そ
の2値パターンを例えば特定話者認識の場合、3回の発
声パターンを荷重平均化して用いる。
第2図は、BTSP方式による辞書の例を示す図で、(
a)図は入カバターン例(分解能2)、(b)図は特定
話者方式の標準パターン例(分解能4)を示し、図示の
ように、3回とも存在する場所は13′に、−度も11
′が存在しないものは′0′になっている。又、例えば
、既に存在している辞書に更新する場合、誤った更新を
した場合や、登録した時と極端に違った発声を行った場
合、この辞書が悪化し、よりブロードになり0と1.2
.3のバランスが変化し、例えば、第3図に示すように
(a)と(b)の2回の発声を合わせた場合、(C)の
ように変化する。従って、このt Otの総数と′1″
121%3+の部分の総数を比較することによりその
目安とすることができる。下記の式(1)において、t
Olの部分の総数ΣKOとそれ以外の部分の総数Σ(
KIUK2UK3)との比が閾値THを下まわる時、辞
書が悪化したものとして辞書を自動的に消去する。
a)図は入カバターン例(分解能2)、(b)図は特定
話者方式の標準パターン例(分解能4)を示し、図示の
ように、3回とも存在する場所は13′に、−度も11
′が存在しないものは′0′になっている。又、例えば
、既に存在している辞書に更新する場合、誤った更新を
した場合や、登録した時と極端に違った発声を行った場
合、この辞書が悪化し、よりブロードになり0と1.2
.3のバランスが変化し、例えば、第3図に示すように
(a)と(b)の2回の発声を合わせた場合、(C)の
ように変化する。従って、このt Otの総数と′1″
121%3+の部分の総数を比較することによりその
目安とすることができる。下記の式(1)において、t
Olの部分の総数ΣKOとそれ以外の部分の総数Σ(
KIUK2UK3)との比が閾値THを下まわる時、辞
書が悪化したものとして辞書を自動的に消去する。
又、消去する荊にユーザにその情報を示し指示を受ける
方法も考えられる。
方法も考えられる。
以上の説明から明らかなように、本発明によると、辞書
内に存在する不良辞書、特に、誤った更新などによりユ
ーザの知らない内に悪化した辞書を自動的に発見し、消
去もしくはそれに準じた動作を行うことにより、誤認識
を防ぐことを可能となった。
内に存在する不良辞書、特に、誤った更新などによりユ
ーザの知らない内に悪化した辞書を自動的に発見し、消
去もしくはそれに準じた動作を行うことにより、誤認識
を防ぐことを可能となった。
第1図は、本発明による音声認識辞書管理方式を説明す
るための構成図、第2図は、音声の特徴量を表わす図で
、(a)図は入カバターンの例。 (b)図は特定話者方式の標準パターンの例を示す図、
第3図は、発声パターンと合成パターンの例を示す図で
ある。 1・・・マイク、2・・・特徴抽出部、3・・・登録部
、4・・・認識部、5・・・結果出力部、6・・・評価
部、7□〜7n・・・辞書。 特許出願人 株式会社 リコー
るための構成図、第2図は、音声の特徴量を表わす図で
、(a)図は入カバターンの例。 (b)図は特定話者方式の標準パターンの例を示す図、
第3図は、発声パターンと合成パターンの例を示す図で
ある。 1・・・マイク、2・・・特徴抽出部、3・・・登録部
、4・・・認識部、5・・・結果出力部、6・・・評価
部、7□〜7n・・・辞書。 特許出願人 株式会社 リコー
Claims (1)
- 【特許請求の範囲】 1、マイクから入力された音声を補正して分析する補正
・分析手段と、この分析結果から特徴量を抽出する抽出
手段と、その特徴量を音声テンプレートとしてメモリし
て登録する登録手段と、更に未知入力の特徴パターンと
前記テンプレートを比較して類似度を算出する算出手段
とを有する音声認識装置において、構成されている複数
のテンプレートの各々のテンプレートの評価演算を行い
、その評価値があるレベル以下の場合にその単語辞書を
抹消する事を特徴とする音声認識辞書管理方式。 2、上記評価値演算に特徴量を有する部分と有しない部
分の差又は比により評価値を決定する事を特徴とする請
求項1記載の音声認識辞書管理方式。 3、上記評価値に基いて、その辞書の品質をユーザに知
らせる事を特徴とする請求項1記載の音声認識辞書管理
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1020490A JP3056745B2 (ja) | 1989-01-30 | 1989-01-30 | 音声認識辞書管理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1020490A JP3056745B2 (ja) | 1989-01-30 | 1989-01-30 | 音声認識辞書管理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02201400A true JPH02201400A (ja) | 1990-08-09 |
JP3056745B2 JP3056745B2 (ja) | 2000-06-26 |
Family
ID=12028591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1020490A Expired - Fee Related JP3056745B2 (ja) | 1989-01-30 | 1989-01-30 | 音声認識辞書管理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3056745B2 (ja) |
-
1989
- 1989-01-30 JP JP1020490A patent/JP3056745B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3056745B2 (ja) | 2000-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6912499B1 (en) | Method and apparatus for training a multilingual speech model set | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
US20030220791A1 (en) | Apparatus and method for speech recognition | |
US6134527A (en) | Method of testing a vocabulary word being enrolled in a speech recognition system | |
JP2001503154A (ja) | 音声認識システムにおける隠れマルコフ音声モデルの適合方法 | |
KR19980086697A (ko) | 음성 인식 시스템에서의 화자 인식 방법 및 장치 | |
US6961702B2 (en) | Method and device for generating an adapted reference for automatic speech recognition | |
Hébert et al. | Phonetic class-based speaker verification. | |
JP4199927B2 (ja) | 発声言語における少なくとも1つのキーワードを計算器により認識する方法および認識装置 | |
JPH02201400A (ja) | 音声認識辞書管理装置 | |
KR20090055320A (ko) | 혼동 행렬 기반 발화 검증 방법 및 장치 | |
JP2002215184A (ja) | 音声認識装置、及びプログラム | |
US6438521B1 (en) | Speech recognition method and apparatus and computer-readable memory | |
Wang et al. | Improved Mandarin speech recognition by lattice rescoring with enhanced tone models | |
JP3868798B2 (ja) | 音声認識装置 | |
CN111276121B (zh) | 语音对齐方法、装置、电子设备及存储介质 | |
JPH11249688A (ja) | 音声認識装置およびその方法 | |
JP2005173008A (ja) | 音声解析処理およびそれを用いた音声処理装置および媒体 | |
WO1994015330A1 (en) | Method and apparatus for automatic evaluation of pronunciation | |
Mayora-Ibarra et al. | Time-domain segmentation and labelling of speech with fuzzy-logic post-correction rules | |
JPH0619491A (ja) | 音声認識装置 | |
Scagliola et al. | Continuous speech recognition via diphone spotting a preliminary implementation | |
JPS59107397A (ja) | 音声認識装置 | |
KR960001950B1 (ko) | 음성인식방법 및 그 장치 | |
JP2001034291A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |