JPS63247799A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63247799A
JPS63247799A JP62081463A JP8146387A JPS63247799A JP S63247799 A JPS63247799 A JP S63247799A JP 62081463 A JP62081463 A JP 62081463A JP 8146387 A JP8146387 A JP 8146387A JP S63247799 A JPS63247799 A JP S63247799A
Authority
JP
Japan
Prior art keywords
pattern
matching
candidate
word
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62081463A
Other languages
English (en)
Inventor
別所 由実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62081463A priority Critical patent/JPS63247799A/ja
Publication of JPS63247799A publication Critical patent/JPS63247799A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき、単数また
は複数個の標準パターンテンプレートを持つ音声認識装
置に関するものである。
従来の技術 不特定話者に対応させるために、各単語もしくは音節、
音韻につき、複数個の標準パターンを用いる方法は有効
な方法であり、標準パターンを作成する際に、より多数
の音声パターンを母集団として橋準パターンを選択した
方が、より多くの話者に対応できる。しかしながら、母
集団となる音声データが多数に′、五!しばなるほど、
より膨大なデータ収集時間、標準パターン作成時間が必
要となることから、不特定話者に充分対応する標準パタ
ーンを作成することは事実上困難である。
従来の音声認識装置では、上記問題点を解決するため、
必要最小限数の母集団音声より標準パターンを作成して
おき、認識装置使用中に対応しない話者が存在した場合
に、その話者に対応するパターンを標準パターンとして
追加する方法がとられた。以上の方法により、使用状況
に合わせて多くの話者に対応する認識装置を実現するこ
とが可能となる。(例えば、飯塚、森戸、山田(沖電気
(株)基盤研究所)「不特定話者単語音声認識」、音響
学会音蜘研究会資料583−54(12・22・198
3) )。
以下、図面を参照しながら、上述したような従来の音声
認識装置について説明を行う。第3図は、従来の音声認
識装置のブロック図である。1は音声入力端子、2は特
徴抽出部、9はパターン照合部、6は認識結果出力端子
、11は追加パターン決定部、13は保管パターンテン
プレート、12は標準パターンテンプレート、1oはス
イッチである。以上のように構成された音声認識装置に
ついて、その動作を説明する。
まず、話者が標準パターンを更新する学習の際には、音
声入力端子1より入力された学習用音声信号を特徴抽出
部2で分析し、特徴パラメータを抽出する。学習用音声
信号としては、標準パターンテンプレート12に含まれ
ている単語音声信号を用いる。また、分析方法には、た
とえばLPCケプストラム法を用いれば、単位時間ごと
に所定の個数のケプストラム係数が算出される。
標準パターンテンプレート12には、音声区間分のケプ
ストラム係数を1単語分とする標準パターンが各単語に
つき複数個含まれており、パターン照合部9で標準パタ
ーンを入力し、特徴抽出部2で分析された学習音声パタ
ーンと標準パターンとの距離を算出し、最短距離の標準
パターンを認識結果とする。結果が誤認識した場合には
誤認識単語の1回分のパターンを保管パターンテンプレ
ート13に保管し、以上の処理を、単数もしくはまれる
パターンが一定個数以上になった際に、追加パターン決
定部11で、保管パターンテンプレート13より読み込
んだ保管パターンを対象に追加パターンを決定する。決
定方法は、最も誤認識の多かった単語の保管パターンを
対象に、類似度の高いパターンを同クラスと見なしたク
ラス分けを行い、クラス内のパターンが一定数以上であ
るクラスのセントロイドパターンを標準パターンに追加
する方法である。
次に認識時には、音声信号を音声信号入力端子1より入
力し、信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。信号の種類、分析条件は、学習時と同様であ
る。
次にパターン照合部9で、学習時に更新した標準パター
ンテンプレート12の標準パターンと入力パターンとの
距離を算出し、出力端子6より認識結果を出力する。
なお、スイッチ10は、学習時には追加パターン決定部
11に、認識時には結果出力端子5に認識結果を出力す
るように動作する。
発明が解決しようとする間雇点 しかしながら、上記のような構成では、まず、標準パタ
ーンの保管容量を越えて学習ができないこと、次にJご
く少数の話者に対応するためにパターンが追加され、追
加パターン数が増加する割には認識率の改善度が低くな
る場合があり、このような場合は、パターン保管容量の
使用効率が悪くなるという間雇点を有していた。また上
記の場合は、学習回数が増加する程、多くなる傾向があ
ると思われる。
°本発明は、上記問題点に鑑み、照合結果の下位N候補
の単語もしくは音節、音韻名を第1候補の単語もしくは
音節、音韻別にグループ化して非照合パターン管理テー
ブルに記録し、照合結果の上位候補パターンと現在まで
に非照合パターン管理テーブルに記録されたパターンと
を上記単語もしくは音節、音韻別グループごとに比較し
、最も一致するパターンが少ないグループの単語もしく
は音節、音韻を認識結果として出力することで標準パタ
ーン保管容量に無関係に学習ができ、また、標準パター
ンを有効に使用して認識率を向上させることできる音声
認識装置を提供するものである。
問題点を解決するだめの・手段 この目的を達成するために本発明の音声認識装置は、各
単語もしくは音節、音韻についての単数または複数個の
標準パターンを有する標準パターンテンプレートと、上
記標準パターンと入力パターンの照合を行い、下位候補
標準パターン名をテーブルに記録するパターン照合部と
、上記下位候補標準パターン名を保管しておく非照合パ
ターン管理テーブルと、上記下位候補の情報より認識結
果を決定する認識結果決定部とから構成されている。
作  用 この構成によって、パターン照合部で、照合結果の下位
候補の単語もしくは音節、音韻基を第1候補の単語もし
くは音節、音韻別にグループ化して非照合パターン管理
テーブルに記録し、認識決定部で、照合結果の上位候補
パターンと現在までに非照合パターン管理テーブルに記
録されたパターンとを上記単語もしくは音節、音韻別グ
ループごとに比較し、最も一致するパターンが少ないグ
ループの単語もしくは音節、音韻を認識結果として出力
する。
実施例 以下、本発明の単語音声認識における実施例について第
1図を参照しながら説明する。第1図において、1は音
声入力端子、2は特徴抽出部、3はパターン照合部、4
はスイッチ、6は認識結果出力端子、6は認識結果決定
部、7は標準パターンテンプレート、7は非照合パター
ン管理テーブルであシ、従来例と同じものは同一の番号
を付与している。
以上のように構成された音声認識装置について以下その
動作について第1図、第2図を用いて説明する。
まず、話者が学習する際には、音声入力端子1より入力
(処理21)された学習用音声信号を特徴抽出部2で分
析しく処理22)、特徴パラメータを抽出する。学習用
音声信号としては、標準パターンテンプレート7に含ま
れている単語音声信号を用いる。また、分析方法には、
たとえばLPCケプストラム法を用いれば、単位時間ご
とに所定の個数のケプストラム係数が算出される。標準
パターンテンプレート7には、音声区間分のケプストラ
ム係数を1単語分とする標準パターンが各単語につき単
数または複数個含まれており、パターン照合部3で標準
パターンを入力し、学習音声パターンと標準パターンと
の距離を算出しく処理23)。
距離の遠い下位N候補の単語番号を、第1候補の単語番
号別に非照合パターン管理テーブル8に記録する(処理
24)。(以下、上記処理によりグループ化された各々
の単語の集まりを単語グループと呼ぶ。) 学習用音声信号を入力してから後の以上の課程を、標準
パターンテンプレート7に含まれる全単語について複数
大分で複数回繰り返す。
次に認識時には、認識すべき音声信号を音声入力端子1
より入力しく処理21)、信号を特徴抽出部2で分析し
、特徴パラメータを抽出しく処理22)、パターン照合
部3で、標準パターンと入力パターンの距離を算出する
(処理23)。認識結果決定部6で、照合した結果の第
1候補単語距、離と第2候補単語距離を比較しく処理2
5)、距離差が一定値以上であれば、従来通り第1候補
単語を認識結果として認識結果出力端子6より出力する
(処理26)(処理37)。距離差が一定値以下であれ
ば、第1候補と第2候補が同単語がどうかを調べ、同単
語であれば、従来通り第1候補単語を認識結果として結
果出力端子6より出力する(処理26)(処理37)。
しかしながら、異単語であれば、まず単語グループごと
に非照合パターンとして多く記録された単語を複数個選
出し、選出された単語と第1候補単語とを比較しく処理
3o)、一致した単語があれば、その単語グループの非
照合カウンターに1を追加する(処理31)。以上の比
較処理を第N候補単語と比較するまで繰シ返す。
上記結果、最も非照合カウンター値の小さい単語を認識
結果として出力端子6より出力する。また、最小値を持
つカウンターが複数個存在した場合には、より上位候補
の単語を認識結果として出力する(処理36)(処理3
7)。
なお、スイッチ4は、学習時及び認識時に非照合パター
ン管理テーブル8を使用しない際には結果を出力端子6
へ、認識時た非照合パターン管理テーブル8を使用する
場合には結果を認識結果決定部6へ出力するように動作
する。
以上のように、本実施例によれば、話者が最初に使用す
る際に、パターン照合部3で、照合結果の下位N候補の
単語を第1候補の単語別にグループ化して非照合パター
ン管理テーブル8に記録し、認識時に認識決定部6で、
照合結果の上位候補パターンと現在までに非照合パター
ン管理テーブル8に記録されたパターンとを上記単語ご
とに比較し、最も一致するパターンが少ないグループの
単語もしくは音節、音韻を認識結果として出力すること
により、標準パターン保管容量に無関係に学習ができ、
また、標準パターンを有効に使用して認識率を向上させ
ることできる。
発明の効果 本発明は、話者が最初に使用する際に、パターン照合部
で、照合結果の下位N候補の単語もしくは音節、音韻基
を第1候補の単語もしくは音節、音韻別にグループ化し
て非照合パターン管理テーブルに記録し、認識決定部で
、照合結果の上位候補パターンと現在までに非照合パタ
ーン管理テーブルに記録されたパターンとを上記単語も
しくは音節、音韻別グループごとに比較し、最も一致す
るパターンが少ないグループの単語もしくは音節、音韻
を認識結果として出力するにより、標準パターン保管容
量に無関係に学習ができ、また、標準パターンを有効に
使用して認識率を向上させることが可能となる優れた音
声認識装置を実現するものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は本発明の一実施例における音声認識処
理のフローチャート、第3図は従来例における音声認識
装置のブロック図である。 1・・・・・・音声入力端子、2・・・・・・特徴抽出
部、3・・・・・・パターン照合部、4・・・・・・ス
インt、6・・・・・・認識結果出力端子、6・・・・
・・認識結果決定部、7・・・・・・標準パターンテン
プレート、8・・・・・・非照合パターン管理テーブル
。 代理人の氏名 弁理士 中 尾 敏 男 ほかう名第1
図 第2図 第3図

Claims (2)

    【特許請求の範囲】
  1. (1)各単語もしくは音節、音韻についての単数または
    複数個の標準パターンを有する標準パターンテンプレー
    トと、上記標準パターンと入力パターンの照合を行い、
    照合した結果、距離の遠かった下位N個の下位候補標準
    パターン名をテーブルに記録するパターン照合部と、上
    記下位候補標準パターン名を保管しておく非照合パター
    ン管理テーブルと、上記下位候補の情報より認識結果を
    決定する認識結果決定部とを具備し、上記パターン照合
    部で、照合結果の下位候補の単語もしくは音節、音韻名
    を第1候補の単語もしくは音節、音韻別にグループ化し
    て上記非照合パターン管理テーブルに記録し、上記認識
    決定部で、照合結果の上位候補パターンと現在までに上
    記非照合パターン管理テーブルに記録されたパターンと
    を単語もしくは音節、音韻別グループごとに比較し、最
    も一致するパターンが少ないグループの単語もしくは音
    節、音韻を認識結果として出力することを特徴とする音
    声認識装置。
  2. (2)認識決定部で、パターン照合の結果、第1候補の
    信頼性が高い場合には第1候補を認識結果として出力し
    、第1候補の信頼性が低い場合のみ上位候補とテーブル
    内の単語もしくは音節、音韻との比較結果を認識結果と
    して出力することを特徴とする特許請求の範囲第1項記
    載の音声認識装置。
JP62081463A 1987-04-02 1987-04-02 音声認識装置 Pending JPS63247799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62081463A JPS63247799A (ja) 1987-04-02 1987-04-02 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62081463A JPS63247799A (ja) 1987-04-02 1987-04-02 音声認識装置

Publications (1)

Publication Number Publication Date
JPS63247799A true JPS63247799A (ja) 1988-10-14

Family

ID=13747090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62081463A Pending JPS63247799A (ja) 1987-04-02 1987-04-02 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63247799A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6482050B1 (ja) * 2017-07-14 2019-03-13 花王株式会社 硬質物品の洗浄方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6482050B1 (ja) * 2017-07-14 2019-03-13 花王株式会社 硬質物品の洗浄方法

Similar Documents

Publication Publication Date Title
US6195634B1 (en) Selection of decoys for non-vocabulary utterances rejection
JPH0470640B2 (ja)
Rabiner et al. Some performance benchmarks for isolated work speech recognition systems
Kamble et al. Emotion recognition for instantaneous Marathi spoken words
JPS63247799A (ja) 音声認識装置
JP2001312293A (ja) 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体
EP0177854B1 (en) Keyword recognition system using template-concatenation model
WO2014155652A1 (ja) 話者検索システム、プログラム
JPS63155195A (ja) 音声認識装置
JPH03116100A (ja) 大語彙音声認識装置
JPS6131880B2 (ja)
JPS62111292A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JPS63118198A (ja) 音声認識装置
JPS6167897A (ja) 音声認識装置
JPS63303398A (ja) 音声認識装置
JP2004309654A (ja) 音声認識装置
JPS62100799A (ja) 音声認識方法
JP3033132B2 (ja) 言語処理装置
JPS6148897A (ja) 音声認識装置
JPS60147797A (ja) 音声認識装置
JPS61138296A (ja) 音声認識装置
JPS62204299A (ja) 音声認識装置
JPS6315295A (ja) 音声認識装置
JPS5977500A (ja) 単語音声認識方式