JPH02201400A - 音声認識辞書管理装置 - Google Patents

音声認識辞書管理装置

Info

Publication number
JPH02201400A
JPH02201400A JP1020490A JP2049089A JPH02201400A JP H02201400 A JPH02201400 A JP H02201400A JP 1020490 A JP1020490 A JP 1020490A JP 2049089 A JP2049089 A JP 2049089A JP H02201400 A JPH02201400 A JP H02201400A
Authority
JP
Japan
Prior art keywords
dictionary
pattern
evaluation value
dictionaries
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1020490A
Other languages
English (en)
Other versions
JP3056745B2 (ja
Inventor
Harutake Yasuda
安田 晴剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1020490A priority Critical patent/JP3056745B2/ja
Publication of JPH02201400A publication Critical patent/JPH02201400A/ja
Application granted granted Critical
Publication of JP3056745B2 publication Critical patent/JP3056745B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 挟亙分見 本発明は、音声認識装置の辞書管理方式に関する。
胱」θ1欧 音声認識において、例えば登録の際に音声と同時に周囲
ノイズなどが入った場合、その辞書は本来の辞書とは異
なる辞書となり、当然、認識させようとしても誤認識す
るか、認識してもその確度は低い、又、数回発声し平均
化するような辞書においては、−度の発声が異なるよう
な場合も同様の結果となる。
更に、そのような辞書は、比較的特徴のない辞書になっ
ているため、逆に認識時他の単語を発声した時、その辞
書単語が、第何位かの下位に入ってくる可能性が高くな
り、結果を阻害する場合が生ずる。
且−一旗 本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識装置の登録された辞書の不良を発見し、それを
その辞書内から削除し、他に与える影響を無くすととも
に、いち早くユーザにそれを促し、再登録して辞書の品
質を保持するように構成した音声認識辞書管理方式を提
供することを目的としてなされたものである。
構成 本発明は、上記目的を達成するために、マイクから入力
された音声を補正して分析する補正・分析手段と、この
分析結果から特徴量を抽出する抽出手段と、その特徴量
を音声テンプレートとしてメモリして登録する登録手段
と、更に未知入力の特徴パターンと前記テンプレートを
比較して類似度を算出する算出手段とを有する音声認識
装置において、構成されている複数のテンプレートの各
々のテンプレートの評価演算を行い、その評価値がある
レベル以下の場合にその単語辞書を抹消する事、更に、
上記評価値演算に特徴量を有する部分と有しない部分の
差又は比により評価値を決定する事、更に、上記評価値
に基いて、その辞書の品質をユーザに知らせる事を特徴
としたものである。
一般に音声認識装置においては、多数の辞書が装置内に
おり、未知入力に対して、辞書と照合演算を行い、最も
類似性の大きい辞書を候補として抽出する。
本発明では、装置内に有する辞書をある評価値を用いて
評価し、その良否を判定し、悪いもの又は悪影響を与え
るものを消去するようにしたものである。以下、本発明
の実施例に基づいて説明する。
第1図は、本発明による音声認識辞書管理方式の一例を
説明するための構成図で、図中、1はマイク、2は特徴
抽出部、3は登録部、4は認識部、5は結果出力部、6
は評価部、71〜7nは辞書である。マイク1から入力
された音声は、特徴抽出部2において、その特徴量が抽
出され、登録部3において辞書パターンが生成され辞書
メモリに登録される。この辞書メモリ内の辞書は登録時
以外、つまり認識時に更新されたり、頁登録されたりす
る。辞書評価部6はある任意のタイミングで7゜〜7n
の各辞書1〜nを検査し不良のものは消去する。
この評価部6を例えばBTSP方式(BinaryTi
me Spectrum Pattern)を用いて説
明する。BTSP方式においては、J Ol と′1′
の2値パターンでその音声の特徴量を表現しており、そ
の2値パターンを例えば特定話者認識の場合、3回の発
声パターンを荷重平均化して用いる。
第2図は、BTSP方式による辞書の例を示す図で、(
a)図は入カバターン例(分解能2)、(b)図は特定
話者方式の標準パターン例(分解能4)を示し、図示の
ように、3回とも存在する場所は13′に、−度も11
′が存在しないものは′0′になっている。又、例えば
、既に存在している辞書に更新する場合、誤った更新を
した場合や、登録した時と極端に違った発声を行った場
合、この辞書が悪化し、よりブロードになり0と1.2
.3のバランスが変化し、例えば、第3図に示すように
(a)と(b)の2回の発声を合わせた場合、(C)の
ように変化する。従って、このt Otの総数と′1″
 121%3+の部分の総数を比較することによりその
目安とすることができる。下記の式(1)において、t
 Olの部分の総数ΣKOとそれ以外の部分の総数Σ(
KIUK2UK3)との比が閾値THを下まわる時、辞
書が悪化したものとして辞書を自動的に消去する。
又、消去する荊にユーザにその情報を示し指示を受ける
方法も考えられる。
以上の説明から明らかなように、本発明によると、辞書
内に存在する不良辞書、特に、誤った更新などによりユ
ーザの知らない内に悪化した辞書を自動的に発見し、消
去もしくはそれに準じた動作を行うことにより、誤認識
を防ぐことを可能となった。
【図面の簡単な説明】
第1図は、本発明による音声認識辞書管理方式を説明す
るための構成図、第2図は、音声の特徴量を表わす図で
、(a)図は入カバターンの例。 (b)図は特定話者方式の標準パターンの例を示す図、
第3図は、発声パターンと合成パターンの例を示す図で
ある。 1・・・マイク、2・・・特徴抽出部、3・・・登録部
、4・・・認識部、5・・・結果出力部、6・・・評価
部、7□〜7n・・・辞書。 特許出願人  株式会社 リコー

Claims (1)

  1. 【特許請求の範囲】 1、マイクから入力された音声を補正して分析する補正
    ・分析手段と、この分析結果から特徴量を抽出する抽出
    手段と、その特徴量を音声テンプレートとしてメモリし
    て登録する登録手段と、更に未知入力の特徴パターンと
    前記テンプレートを比較して類似度を算出する算出手段
    とを有する音声認識装置において、構成されている複数
    のテンプレートの各々のテンプレートの評価演算を行い
    、その評価値があるレベル以下の場合にその単語辞書を
    抹消する事を特徴とする音声認識辞書管理方式。 2、上記評価値演算に特徴量を有する部分と有しない部
    分の差又は比により評価値を決定する事を特徴とする請
    求項1記載の音声認識辞書管理方式。 3、上記評価値に基いて、その辞書の品質をユーザに知
    らせる事を特徴とする請求項1記載の音声認識辞書管理
    方式。
JP1020490A 1989-01-30 1989-01-30 音声認識辞書管理装置 Expired - Fee Related JP3056745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1020490A JP3056745B2 (ja) 1989-01-30 1989-01-30 音声認識辞書管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1020490A JP3056745B2 (ja) 1989-01-30 1989-01-30 音声認識辞書管理装置

Publications (2)

Publication Number Publication Date
JPH02201400A true JPH02201400A (ja) 1990-08-09
JP3056745B2 JP3056745B2 (ja) 2000-06-26

Family

ID=12028591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1020490A Expired - Fee Related JP3056745B2 (ja) 1989-01-30 1989-01-30 音声認識辞書管理装置

Country Status (1)

Country Link
JP (1) JP3056745B2 (ja)

Also Published As

Publication number Publication date
JP3056745B2 (ja) 2000-06-26

Similar Documents

Publication Publication Date Title
US6912499B1 (en) Method and apparatus for training a multilingual speech model set
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
US20030220791A1 (en) Apparatus and method for speech recognition
US6134527A (en) Method of testing a vocabulary word being enrolled in a speech recognition system
JP2001503154A (ja) 音声認識システムにおける隠れマルコフ音声モデルの適合方法
KR19980086697A (ko) 음성 인식 시스템에서의 화자 인식 방법 및 장치
US6961702B2 (en) Method and device for generating an adapted reference for automatic speech recognition
Hébert et al. Phonetic class-based speaker verification.
JP4199927B2 (ja) 発声言語における少なくとも1つのキーワードを計算器により認識する方法および認識装置
JPH02201400A (ja) 音声認識辞書管理装置
KR20090055320A (ko) 혼동 행렬 기반 발화 검증 방법 및 장치
JP2002215184A (ja) 音声認識装置、及びプログラム
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
Wang et al. Improved Mandarin speech recognition by lattice rescoring with enhanced tone models
JP3868798B2 (ja) 音声認識装置
CN111276121B (zh) 语音对齐方法、装置、电子设备及存储介质
JPH11249688A (ja) 音声認識装置およびその方法
JP2005173008A (ja) 音声解析処理およびそれを用いた音声処理装置および媒体
WO1994015330A1 (en) Method and apparatus for automatic evaluation of pronunciation
Mayora-Ibarra et al. Time-domain segmentation and labelling of speech with fuzzy-logic post-correction rules
JPH0619491A (ja) 音声認識装置
Scagliola et al. Continuous speech recognition via diphone spotting a preliminary implementation
JPS59107397A (ja) 音声認識装置
KR960001950B1 (ko) 음성인식방법 및 그 장치
JP2001034291A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees