JPS61138296A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61138296A
JPS61138296A JP59261103A JP26110384A JPS61138296A JP S61138296 A JPS61138296 A JP S61138296A JP 59261103 A JP59261103 A JP 59261103A JP 26110384 A JP26110384 A JP 26110384A JP S61138296 A JPS61138296 A JP S61138296A
Authority
JP
Japan
Prior art keywords
pattern
standard
patterns
standard pattern
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59261103A
Other languages
English (en)
Inventor
別所 由実
正宏 浜田
明寿 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59261103A priority Critical patent/JPS61138296A/ja
Publication of JPS61138296A publication Critical patent/JPS61138296A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明、各単語もしくは音節、音韻につき複数、個の標
準パターンを有する標準パターンテンプレートを持つ音
声認識装置に関するものである。
従来の技術 不特定話者に対応させるために、各単語もしくは音節、
音韻につき複数個の標準パターンを用いる方法は有効な
方法である。上記方法では、より多くの話者に対応した
り、同話者であっても話者の発声状態が時間の経過とと
もに変化した場合に対応するためには、話者の数、発声
状態の変化に応じて、標準パターンテンプレートに最適
なパターンを追加する必要がある。また追加にともない
、テープレートが増大し照合時間が長くなることや、テ
ンプレートの個数の多さのために異なるパターン間の重
複が多くなり誤認識の原因になることを防ぐために、不
必要な標準パターンを削除することが不可欠になる。し
かしながら、誤認識の原因妃なる一部の単語もしくは音
節、音韻の標準パターンのみを削除したために、誤認識
していた単語もしくは音節、音韻の標準パターンの認識
率が向上しても、削除したパターンと同単語または音節
音韻の認識率が逆に低下するという不都合がある。
従来の音声認識装置では、上記問題点を解決するために
、削除するパターンを予測し、削除前の標準パターンを
使用した場合の認識率と、削除後の認識率を比較し後者
の方が高認識率であった場合のみ、削除後の標準パター
ンテンプレートを採用し、後者の方が低認識率であった
場合は標準パターンテンプレートを削除する前の状態に
戻すという方法がとられた。以上の方法で、パターンを
削除することで、必ず認識率が低下することなく、より
話者に適応したテンプレートを使用することが可能とな
る(たとえば、飯塚、森戸、山田著沖電気(株)基礎技
術研究所「不特定話者単語音声認識」、音響学会音声研
究会資料S83.−54(12,22,1983))。
以下、図面を参照しながら、上述したような従来の音声
認識装置について説明を行う。第2図は従来の音声認識
装置のブロック図である。1は音声入力端子、2は特徴
抽出部、9はパターン照合部、4はスイッチ、6は認識
結果を出力する出力端子、10は更新パターン照合部、
11は標準ノ々ターンテンプレートである。以上のよう
に構成された音声認識装置について、以下その動作を説
明する。
まず標準パターンを削除するだめの学習を行う際には音
声入力端子1より入力された音声信号を特徴抽出部2で
分析し、特徴パラメータを抽出する。学習用音声信号と
しては、標準パターンテンプレート11に含まれている
単語と同単語の音声信号を用い単語の入力順序も決めて
おく。また分析方法には、たとえばLPCケプストラム
法を用いれば、単位時間ごとに所定の個数のケプストラ
ム係数が算出される。
標準パターンテンプレート11には、音声区間外のケプ
ストラム係数を1単語とする標準パターンが、各単語に
つき複数個含まれており、各パターンに、パターンの使
用回数を加算するカウンタが付加されている。パターン
照合部9で、標準パターンを入力し、特徴抽出部2で分
析された学習音声パターンと標準パターンの市街地距離
を算出し、最短距離の標準パターンを選択する。市街地
距離の算出式は、第(1)式となる。
但し C:標準音声のケプストラム係数工 ゛  C:入力音声のケプストラム係数N:分析次数 M:全フレーム数 D 二市街地距離 学習用音声信号を入力してから後の以上の過程を標準パ
ターンテンプレート11VC含まれている全単語につい
て複数回繰り返し、パターン照合部9で認識の可否を判
断する。また、標準パターンの使用回数を、正認識した
場合と誤認識した場合とを区別し、各パターンのカウン
タに加算する。
また、パターン更新判定部10でカウンタを参照し、正
認識の場合使用頻度の極端に少ないパターン、誤認識の
場合使用頻度の極端に多いパターンが存在すれば、以上
のパターンを削除候補パターンとする。
次に、以上の認識結果より、削除候補パターンが存在す
る場合には再度学習用音声信号を音声信号入力端子1よ
り入力し、音声信号を特徴抽出部2で分析し、特徴パラ
メータを抽出する。学習用音声信号の種類2分析条件は
、最初の学習時と同様である。
次にパターン照合部9で、標準パターンテンプレートよ
り、標準パターンを入力し、以上全バタ−ンより削除候
補バター/を除外した残りのパターンを標準パターンと
みなし、学習用入力音声パターンと標準パターンの市街
地距離を算出するっ市街地距離の算出式は前述の第(1
)式となる。
学習用音声信号を入力してから後の以上の過程ヲ[準パ
ターンテンプレート11に含まれている全単語について
複数回繰り返し、更新パターン決定部1Qで、最初の学
習時の認識率と、再学習時の認識率を比較する。その結
果、最初の学習時の認識率の方が高い場合には、削除候
補パターンも含めて再び標準パターンとして使用する。
再学習時の認識率の方が高い場合には、削除候補パター
ytm準パターンテンプレート11から削除する。
次に認識時には、音声信号を音声信号入力端子1より入
力し、音声信号を特徴抽出部2で分析し、特徴パラメー
タを抽出する。音声信号の種類、分析条件は、学習時と
同様である。− 次にパターン照合部9で、学習時に更新した標準パター
ンテンプレート11より標準パターンと入カバターンの
市街地距離を算出し、出力端子6より認識結果を出力す
る。
なお、スイッチ4は、学習時忙は更新パターン決定部1
oへ、認識時には、出力端子6に認識結果を出力するよ
うに動作する。
発明が解決しようとする問題点 しかしながら、上記のような構成では、標準パターンテ
ンプレートを削除するまでに、各単語に付き複数回の音
声入力を必要とする学習を1回分として同種の学習を2
回行わ、なければならず、話者の負担が大きくなり、学
習に要する時間も長くなる。また、認識率を比較した結
果、削除する前のテンプレートを採用すると判断された
場合は。
学習が無駄になるという問題点を有していた。
本発明は、上記問題点に鑑み、学習の際に、認識した結
果の第2候補までの標準パターン番号を参照し更新すべ
き標準パターンを決定することで、従来の学習1回分で
、削除すべき標準パターンが決定でき、学習時の話者の
負担、学習時間が減少い音声認識装置を提供するもので
ある。
問題点を解決するための手段 この目的を達成するために、本発明の音声認識装置は、
各単語もしくは音節、音韻につき複数個の標準パターン
を持つ標準パターンテンプレートと、使用した標準パタ
ーンの番号を保管する標準パターン番号テーブルと、入
力音声パターンと標準パターンを照合するパターン照合
部と、更新するパターンを決定する更新パターン決定部
とから構成されている。
作  用 この構成によって、学習の際に、照合部で認識した結果
の第2候補までの標準パターン番号を、標準パターン番
号テーブルに記録し、パターン更新判定部で、標準パタ
ーン番号を各単語もしくは音節、音韻ごとに参照し、同
単語もしくは音節。
音韻の入力音声に使用されず、他の入力音声に使用され
ているパターンか、もしくは第1候補と第2候補が同単
語もしくは同音節、同音韻のパターンであり、どちらか
一方を削除しても認識率が低下しないことが明らかであ
るパターンを、標準パターンから削除する。認識時には
、削除したパターンを除外した残りのパターンを標準パ
ターンとみなし認識する。
実施例 以下、本発明の単語音声認識における実施例について第
1図を参照しながら説明する。第1図において、1は音
声入力端子、2は特徴抽出部、3は入力音声パターンと
標準パターンを照合するパターン照合部、4aはスイッ
チ、6は認識結果を出力する出力端子、6は更新する標
準パターンを決定する更新パターン決定部、7は各単語
もしくは音節、音韻につき複数個の標準パターンを有す
る標準パターンテンプレート、8は使用した標準パター
ンの番号を保管する標準パターン番号テーブルであり、
従来例と同じものは同一の番号を付与している。
以上のように構成された音声認識装置について以下その
動作について説明する。
まず、標準パターンを削除するための学習を行。
う際には、音声入力端子1より入力された音声信号を特
徴抽出部2で分析し、特徴パラメータを抽出する。学習
用音声信号の種類2分析条件は、従来例と同じである〇 次にパターン照合部3で標準パターンテンプレート7よ
り標準パターンを入力し、学習用入力音声パターンと標
準パターンの市街地距離を算出する0 学習用音声信号を入力してから以上の過程を標準パター
ンテンプレートに含まれる全単語について複数回繰り返
し、パターン照合部3で、各単語ごとに第2候補までの
標準パターン番号を、標準パターン番号テーブル8に記
録する。
以上の過程を、装置を使用する全話者について行い次に
、更新パターン決定部6で、標準パターン番号テーブル
8より、単語ごとに使用した標準パターン番号を参照し
ながら、次の2つの規則に従って削除するパターンを決
定する。
(規則1) 同単語には使用されず、他単語の第1候補
もしくは第2候補に使用 された標準パターンは、標準パタ ーンテンプレート7から削除する0 (規則2) 第1候補または第2候補に使用された際に
、それぞれ、他の第2候 補または第1候補が常に同単語パ ターンであるような標準パターン は、標準パターンテンプレートカ ら削除する。
次に認識時には、音声信号を音声入力端子1より入力し
、音声信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。音声信号の種類2分析条件は学習時と同様で
ある。
次にパターン照合部3で、学習時に更新した標準パター
ンテンプレート7より、標準パターンと入カバターンの
市街地距離を算出し、出力端子5より認識結果を出力す
る。
なおスイッチ4aは、学習時には更新パターン決定部6
へ、認識時には、出力端子5に認識結果を出力するよう
に動作する。
以上のように本実施例によれば、削除する標準パターン
を決定する際に、単語ごとに標準パターン番号を参照し
、同単語パターンに使用されず他の単語に使用されてい
るか、もしくは、第1候補と第2候補が同単語パターン
でどちらか一方を削除しても認識率に影響がないパター
ンを削除することにより、従来より、学習時の話者の負
担、学習時間が減少し、かつ学習を無駄にすることがな
い。また以上より、標準パターンを削除することで認識
率が低下する不都合もない。
なお、本実施例では、更新パターン決定部6は、削除す
る標準パターンを決定するように動作したが、学習の際
に誤認識単語が存在した場合には、話者の全単語パター
ン1回分を標準パターンを追加し、追加したパターンの
みを対象に、実施例の規則1.規則2を実行することに
より削除するパターンを決定してもよい。また、本実施
例では、他の話者が装置を使用する際に、以前に使用し
た話者と異なる標準パターンと適応する場合に、既にパ
ターンが削除されている場合があり、使用する全話者が
学習しないと削除パターンを決定できないという不都合
があるが、この場合は、削除する対象となるパターンが
話者の追加パターンでありパターンを削除することが、
削除後に使用する他の話者に対する認識率を低下させる
という不都合がないため、話者ごとに学習することが可
能となる。
発明の効果 本発明は、認識した結果の第2候補までの標準パターン
を各単iもしくは音節、音韻ごとに参照し、削除するべ
き標準パターンを決定することで、削除するための学習
時の話者の負担、学習時間が減少し、かつ、学習を無駄
にすることがない。また、標準パターンを削除すること
で認識率が低下する不都合のない優れた音声認識装置を
実現するものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は従来例における音声認識装置のブロッ
ク図である。 1・・・・・・音声入力端子、2・・・・・・特徴抽出
部、3・・・・・・パターン照合部、4&・・・・・・
スイッチ、6・・・・・・出力端子、6・・・・・・更
新パターン決定部、7・・・・・・標準パターンテンプ
レート、8・・・・・・標準パターン番号テーブル。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1

Claims (3)

    【特許請求の範囲】
  1. (1)各単語もしくは音節、音韻につき複数個の標準パ
    ターンを有する標準パターンテンプレートと、使用した
    標準パターンの番号を保管する標準パターン番号テーブ
    ルと、入力音声パターンと標準パターンを照合するパタ
    ーン照合部と、更新する標準パターンを決定する更新パ
    ターン決定部とを具備し、前記標準パターンテンプレー
    トの各パターンにパターン番号を付けておき、前記パタ
    ーン照合部で認識した結果の第2候補までの標準パター
    ン番号を前記標準パターン番号テーブルに記入し、前記
    更新パターン決定部で記入された第2候補までの標準パ
    ターン番号を参照することで、更新するべき標準パター
    ンを決定することを特徴とする音声認識装置。
  2. (2)更新パターン決定部は、使用しない標準パターン
    、または、逆に認識率を低下する原因となるパターンを
    削除することを特徴とする特許請求の範囲第1項記載の
    音声認識装置。
  3. (3)更新パターン決定部は、認識結果より、話者に適
    応するパターンが標準パターンテンプレートに存在しな
    いと判断された場合には、話者に適応するパターンを前
    記標準パターンテンプレートに追加し、追加した全パタ
    ーンを対象に削除することを特徴とする特許請求の範囲
    第2項記載の音声認識装置。
JP59261103A 1984-12-11 1984-12-11 音声認識装置 Pending JPS61138296A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59261103A JPS61138296A (ja) 1984-12-11 1984-12-11 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59261103A JPS61138296A (ja) 1984-12-11 1984-12-11 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61138296A true JPS61138296A (ja) 1986-06-25

Family

ID=17357121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59261103A Pending JPS61138296A (ja) 1984-12-11 1984-12-11 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61138296A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6338995A (ja) * 1986-08-04 1988-02-19 松下電器産業株式会社 音声認識ダイアル電話装置
US5610025A (en) * 1992-01-31 1997-03-11 Actimed Laboratories, Inc. Inhibition of interfering endogenous enzyme activity in assays of biological fluids
JP2019121258A (ja) * 2018-01-10 2019-07-22 国立研究開発法人情報通信研究機構 情報処理装置およびセンシングシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6338995A (ja) * 1986-08-04 1988-02-19 松下電器産業株式会社 音声認識ダイアル電話装置
US5610025A (en) * 1992-01-31 1997-03-11 Actimed Laboratories, Inc. Inhibition of interfering endogenous enzyme activity in assays of biological fluids
JP2019121258A (ja) * 2018-01-10 2019-07-22 国立研究開発法人情報通信研究機構 情報処理装置およびセンシングシステム

Similar Documents

Publication Publication Date Title
JPS62239231A (ja) 口唇画像入力による音声認識方法
JPH0556517B2 (ja)
JPS61138296A (ja) 音声認識装置
JPS6242198A (ja) 音声認識装置
JPS61123889A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JPS63218999A (ja) 音声認識装置
JPS61279896A (ja) 音声認識装置
JPS6315295A (ja) 音声認識装置
JPS63303398A (ja) 音声認識装置
JPS61292699A (ja) 音声通過フイルタ
JPS6167897A (ja) 音声認識装置
JPS62204299A (ja) 音声認識装置
JPH01260495A (ja) 音声認識法
JPS62111292A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JPS6344699A (ja) 音声認識装置
JPH09319395A (ja) 離散単語音声認識システムにおける音声データ学習装置
JPH0119596B2 (ja)
JPS63213897A (ja) 話者認識装置における辞書更新方式
JPS63247799A (ja) 音声認識装置
JPH01319099A (ja) 音声認識装置
JPS63155195A (ja) 音声認識装置
JPS61121093A (ja) 音声認識装置
Ukita et al. A speaker independent recognition algorithm for connected word using word boundary hypothesizer