JPS6132679B2 - - Google Patents

Info

Publication number
JPS6132679B2
JPS6132679B2 JP55143116A JP14311680A JPS6132679B2 JP S6132679 B2 JPS6132679 B2 JP S6132679B2 JP 55143116 A JP55143116 A JP 55143116A JP 14311680 A JP14311680 A JP 14311680A JP S6132679 B2 JPS6132679 B2 JP S6132679B2
Authority
JP
Japan
Prior art keywords
word
pattern
input
registered
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55143116A
Other languages
English (en)
Other versions
JPS5766498A (en
Inventor
Takayuki Ooyama
Hidekazu Shiratori
Yasuo Sato
Junichi Ichikawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP55143116A priority Critical patent/JPS5766498A/ja
Publication of JPS5766498A publication Critical patent/JPS5766498A/ja
Publication of JPS6132679B2 publication Critical patent/JPS6132679B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、標準音声登録パターンの自動削除方
式に関し、特に、入力された音声を分折してその
特徴を抽出し、辞書部からの認識するための情報
と比較し、該比較結果にもとづいて確率の高い優
先順に、上記入力された音声である可能性の高い
単語候補を複数表示し、その中から正答候補を選
択することによつて音声認識処理を行なう方式に
おいて、誤つた発声等で作成された不要な標準パ
ターンを自動的に削除できるようにした方式に関
する。
現在、データ入力装置としてはタイプライタ、
キーボード、穿孔装置、タツチ入力装置等がある
が、それらの装置を十分に使いこなすためには、
操作者に対してかなりの訓練が必要であり、また
訓練後の操作者が実際の装置の操作を行なう場合
にも長時間連続して操作すると疲労度も増大す
る。
このように入力すべきデータを上記の如き入力
装置を用いて、データ処理装置が理解できるよう
な書かれたデータ形式、あるいは穿孔形式等に変
換するのにはかなりの負担のかかるのが普通であ
る。したがつて、望ましくは上記のような人手に
よる変換を行なわず入力データを音声の形式で直
接入力できれば誠に都合がよい。
このような音声入力装置についての研究は、か
なりの成果を収めており、入力対象を区切つて発
声された単語とし、使用者の発声単語の登録を前
提とする装置は、すでにいくつか実現されてい
る。
しかし、従来のこの種の装置においては、入力
すべき単語の音声の特徴が互に類似している場合
には、それらを認識、識別することは困難であ
り、その認識率が低下してしまつて実用的である
とは言えなかつた。
特に、入力対象がカナ文字の場合は殆んどすべ
ての音素の識別が必要とされ、現在の技術段階で
は、実用的レベルの認識を実現するのは極めて困
難な状況にある。このような音声認識の困難さの
理由としては、既に述べた (1) 互いにその特徴の類似した音素が存在するこ
と。
の他、さらに (2) 音素を特徴づけるパラメータが種々の要因で
変動すること。
(3) 一部の音素は特徴そのものが充分解明されて
いないこと。
などあげられる。
したがつて、これらの問題を含んだ音声入力を
実用的な意味で実現するには、これらの問題を直
接解決することを避け、入力された音声に対応す
る可能性のある文字候補をいくつか表示して、そ
のうちから正しい文字のみを選択するようにすれ
ばよい。
このような、複数の文字候補を表示し、その中
から正しい候補を選択する1つの方式について
は、本願の出願人は、先に出願した特開昭53−
77402号公報において開示している。
上記出願の発明においては、入力された音声に
相当する確率の高い文字候補順に複数の文字を表
示するが、正しい候補を如何にして、確実に、も
れなく表示するかは、残された問題である。通
常、音声パターンの分布は複雑であり、入力パタ
ーンとのマツチング距離を使用する場合、1つだ
けの登録パターンでは誤認識もしくは認識もれが
生ずる可能性が大である。そのため一般には、各
単語に対して必要に応じて複数の登録パターンを
設定するようにしており、例えば、認識の難しい
「ガ行」、「ザ行」、「ダ行」、「バ行」等の単語には
複数の登録パターンが与えられている。一方、比
較的認識の容易な「ア」、「カ」、「ユ」、「ヨ」等の
単語には単一の登録パターンを設定し、登録パタ
ーンの増加による認識処理速度の低下を防ぐよう
にしている。
第1図は音声パターンの分布と登録パターンの
関係を示すものであり、A,B,C,Dの実線で
囲まれた部分は実際の音声パターンの分布を示
し、A1とA2は単語Aに対する登録パターン、B1
〜B3は単語Bに対する登録パターン、C1は単語
Cに対する登録パターンである。図示Cの如く、
1つの登録パターンでカバーできれば、認識しそ
こなうことはないが、図示A,Bのような場合に
は、既存の登録パターンのみではカバーしきれな
い部分が存在し、認識率向上のさまたげとなる。
そのため、適当な手段を使用して登録パターン
を追加してゆく必要があるが、そのとき誤つた発
声等により、第1図図示のA3の如きパターンを
単語Aの登録パターンとしてしまつたとき、該
A3パターンは単語Aの正常な発声時においては
使用されることがなくなり記憶領域の無駄を招く
ことになる。さらに該A3パターンが他の単語D
の音声パターン領域に入りこんでしまつている場
合には、単語Dを正常に発声したとき、単語Aが
正答候補として表示されてしまうケースも生じ誤
認識を生ずるもととなる。
本発明は上記の点を解決し、誤つた発声等で作
成された不要な標準パターンを削除することによ
り、記憶領域を効率よく使用できるようにすると
ともに、他のパターンとの混同を減少させ認識率
の向上を計ることを目的とし、そしてそのため本
発明は入力された音声を分析してその特徴を抽出
し、辞書部からの認識するための情報と比較し、
該比較結果にもとづいて確率の高い優先順に、上
記入力された音声である可能性の単い単語候補を
複数表示し、その中から正答候補を選択すること
によつて音声認識処理を行なう方式において、選
択された単語に対応する複数の標準登録パターン
のうち入力音声とのマツチング距離が最小でかつ
一定値以下の標準登録パターンについては、該パ
ターンが使用されたものと見なし、各標準登録パ
ターンごとに使用回数を記憶しておくとともに、
ある単語の入力回数が一定回数以上となつた時点
で当該単語に対応する複数の標準登録パターンの
うち、使用回数が一定条件を満足しないものがあ
れば当該標準登録パターンを削除するようにした
ことを特徴とする。
以下、本発明を図面により説明する。第2図は
本発明による実施例の音声認識処理装置のブロツ
ク図であり、図中、1はスペクトル分析部、2は
パターン抽出部、3は照合判定部、4は結果表示
部、5は選択キー、6は辞書管理部、7は辞書部
である。
マイクロホン(MIC)より入力された音声信号
はスペクトル分析部1においてスペクトル分析さ
れる。スペクトル分析部1は、帯域フイルタ群、
パラメータ抽出回路などを含み、入力音声即ち単
音節音声の特徴量(パラメータ)例えば第1ホル
マント周波数に相当するモーメントM1や第2ホ
ルマント周波数に相当するモーメントM2や更に
は低域電力や高域電力などを抽出し、さらにこれ
らの特徴量に関するサンプル点を決定し特徴量の
時系列情報を得る機能を有している。スペクトル
分析部1においてスペクトル分析され、得られた
パラメータ時系列情報は、パターン抽出部2に入
力される。次に、パターン抽出部2は、入力音声
の特徴を表わす入力パターンを抽出し、照合判定
部3に送出する。照合判定部3は、辞書部7の内
容を順次読出し、辞書部7に登録されているパタ
ーンと上記抽出された入力パターンとの照合を行
なう。辞書部7においては、単語毎に1つまたは
複数の登録パターンが用意されている。図示の例
では単語A1に対して(A11;A12)、単語A2
に対して(A21;A12、;A23)、単語A3
対して(A31)、………、単語Anに対して(A
o1;Ao2;Ao3)がそれぞれ用意されてい
る。さらに各登録パターンに対しては使用回数を
保持する領域が付加されており、また各単語に対
しては対応する1個または複数個の登録パターン
の使用回数の和である総使用回数を保持する領域
が付加されている。そして、照合判定部3では、
上記入力パターンと登録パターンとの間の照合距
離が所定値以下のものを判定し、該所定値以下の
照合距離を有する登録パターンに対応する単語
(1つまたは複数)を正答単語候補として結果表
示部4へ送出する。結果表示部4では、照合距離
の小さい順、即ち確度の大きい順に複数の正答単
語候補を表示する。
使用者は、表示結果を見て、自分の入力したい
語があつた場合は、選択キー5を操作して当該単
語を選択し、図示しない記憶部へ記憶させる。
一方、選択キー5からの信号によつて入力音声
に対応する単語が同定されたとき、辞書管理部6
は、選択キー5からの信号によつて入力された単
語を識別し、辞書部7から当該単語に対応する登
録パターンを読出す。そして、当該登録パターン
が複数個存在する場合には、その中で入力パター
ンとの照合距離が最小のものを選択し、かつ選択
したものの照合距離が一定値以下のときは、当該
選択した登録パターンに対応する使用回数と当該
単語に対応する総使用回数を辞書部7より読出
す。辞書管理部7は、読出した使用回数と総使用
回数とをそれぞれ+1するとともに、総使用回数
があらかじめ定められた一定値以上に達したか否
かを判定する。もし、該一定値に達していなけれ
ば、上記それぞれ+1された使用回数と総使用回
数とを辞書部7に格納することにより、辞書部7
の内容の更新を行なう。
一方、総使用回数が上記一定値に達していると
きは、当該単語に対応する複数の登録パターン中
に、総使用回数に対する使用回数の割合が一定値
以下のものが存在するか否かを判定する。一定値
以下のものがなければ、上記+1された使用回数
と総使用回数とを辞書部7に格納する。もし、総
使用回数に対する使用回数の割合が一定値以下の
ものが存在すれば、当該使用回数に対応する登録
パターンを辞書部7から削除する。そして、削除
特作が行なわれた単語については、残された登録
パターンの使用回数および総使用回数をゼロにク
リアして、新規にカウント動作を行なわせるよう
にする。
以上説明したように本発明によれば、辞書部に
登録された標準パターンの使用頻度を監視し、使
用頻度が一定レベル以下のものは自動的に辞書部
から削除するようにしたので、不要かつ誤認識の
もととなる標準パターンをなくすことができ、記
憶領域の効果的な使用および認識率の向上をもた
らすことができる。
【図面の簡単な説明】
第1図は音声パターンの分布と登録パターンの
関係を示すもの、第2図は本発明による実施例の
音声認識処理装置のブロツク図である。 第2図において、1はスペクトル分析部、2は
パターン抽出部、3は照合判定部、4は結果表示
部、5は選択キー、6は辞書管理部、7は辞書部
である。

Claims (1)

    【特許請求の範囲】
  1. 1 入力された音声を分折してその特徴を抽出
    し、辞書部からの認識するための情報を比較し、
    該比較結果にもとづいて確率の高い優先順に、上
    記入力された音声である可能性の高い単語候補を
    複数表示し、その中から正答候補を選択すること
    によつて音声認識処理を行なう方式において、選
    択された単語に対応する複数の標準登録パターン
    のうち入力音声とのマツチング距離が最小でかつ
    一定値以下の標準登録パターンについては、該パ
    ターンが使用されたものと見なし、各標準登録パ
    ターンごとに使用回数を記憶しておくとともに、
    ある単語の入力回数が一定回数以上となつた時点
    で当該単語に対応する複数の標準登録パターンの
    うち、使用回数が一定条件を満足しないものがあ
    れば当該標準登録パターンを削除するようにした
    ことを特徴とする標準音声登録パターンの自動削
    除方式。
JP55143116A 1980-10-14 1980-10-14 Reference voice registration pattern automatic deleting system Granted JPS5766498A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55143116A JPS5766498A (en) 1980-10-14 1980-10-14 Reference voice registration pattern automatic deleting system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55143116A JPS5766498A (en) 1980-10-14 1980-10-14 Reference voice registration pattern automatic deleting system

Publications (2)

Publication Number Publication Date
JPS5766498A JPS5766498A (en) 1982-04-22
JPS6132679B2 true JPS6132679B2 (ja) 1986-07-28

Family

ID=15331282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55143116A Granted JPS5766498A (en) 1980-10-14 1980-10-14 Reference voice registration pattern automatic deleting system

Country Status (1)

Country Link
JP (1) JPS5766498A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59107397A (ja) * 1982-12-10 1984-06-21 電子計算機基本技術研究組合 音声認識装置
JPS59124398A (ja) * 1982-12-29 1984-07-18 富士通株式会社 音声登録方法
JPS60113298A (ja) * 1983-11-24 1985-06-19 富士通株式会社 特定話者音声認識装置
JPS60118894A (ja) * 1983-11-30 1985-06-26 松下電器産業株式会社 音声認識装置
JPS6199197A (ja) * 1984-10-02 1986-05-17 富士通株式会社 音声標準パタン作成処理方法
JP4767754B2 (ja) 2006-05-18 2011-09-07 富士通株式会社 音声認識装置および音声認識プログラム

Also Published As

Publication number Publication date
JPS5766498A (en) 1982-04-22

Similar Documents

Publication Publication Date Title
JPS6147440B2 (ja)
JPH02163819A (ja) テキスト処理装置
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
EP0108609B1 (en) Method and apparatus for the phonetic recognition of words
US5781887A (en) Speech recognition method with error reset commands
JPS6132679B2 (ja)
JPS6151799B2 (ja)
JPS6151798B2 (ja)
JPS6211731B2 (ja)
EP0177854B1 (en) Keyword recognition system using template-concatenation model
JPS6211732B2 (ja)
KR100513038B1 (ko) 다채널 확장된 음성인식 시스템에서의 음성데이터 저장 방법
JPS6131880B2 (ja)
JPS562040A (en) Audio input discrimination system
JPH049320B2 (ja)
JPH05173589A (ja) 音声認識応答装置
Raman et al. Performance of isolated word recognition system for confusable vocabulary
JPS6148897A (ja) 音声認識装置
JPH01290000A (ja) 音声認識方式
JPH0446398A (ja) 音声認識装置
JPS59157699A (ja) 音声登録方法
JPS615300A (ja) 学習機能付音声入力装置
JPS636355B2 (ja)
JPH05197390A (ja) 音声認識装置
JPS5879298A (ja) 印刷用音声入力装置