JPS63118198A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63118198A
JPS63118198A JP61264578A JP26457886A JPS63118198A JP S63118198 A JPS63118198 A JP S63118198A JP 61264578 A JP61264578 A JP 61264578A JP 26457886 A JP26457886 A JP 26457886A JP S63118198 A JPS63118198 A JP S63118198A
Authority
JP
Japan
Prior art keywords
pattern
patterns
recognition
standard
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61264578A
Other languages
English (en)
Inventor
別所 由実
正宏 浜田
武志 則松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61264578A priority Critical patent/JPS63118198A/ja
Publication of JPS63118198A publication Critical patent/JPS63118198A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき、複数個の
標準パターンテンプレートを持つ音声認識装置に関する
ものである。
従来の技術 不特定話者に対応させるために、各単語もしくは音節、
音韻につき、複数個の標準パターンを用いる方法は有効
な方法である。前記方法では、より多くの話者に対応し
たり、同話者であっても話者の発声状態が時間の経過と
共に変化した場合に対応するためには、話者の数2発声
状態の変化に応じて、標準パターンテンプレートに最J
なパターンを追加する必要があシ、追加パターンは、装
置使用時の入力パターンから選択すると効率が良い。
しかしながら、認識時の入力パターンの認識結果単語名
もしくは音節、音韻名がわかっても、正しい単語名もし
くは音節、音韻名がわからないために、常に正しい単語
もしくは音節、音韻名で標準パターンテンプレートに追
加されるとは限らない。従来の音声認識装置では、前記
問題点を解決するため、認識時に全入力パターンを保管
し、パターンが一定数以上保管されると、保管パターン
を対象に類似度の高いパターンを同クラスとみなすクラ
ス分け(以後クラスタリングと呼ぶ。)を行うことによ
り、複数の入力パターンを単語もしくは音節、音韻別に
分類し、クラスタごとに黛パターンの認識結果単語名も
しくは音節、音韻名を調べ、最も数の多い単語名もしく
は音節、音韻名を各クラスタの代表名とみなし、各クラ
スタのセントロイドパターンを前記代表名のパターンと
して標準テンプレートに追加する。以上の方法により、
入力パターンの代表パターンを標準テンプレートに追加
することで、より話者に適したテンプレートを使用する
ことが可能となる(たとえば、北野 百出 連日 内房
 (成人産業科学研究所)「教師なし学習によるセット
化音韻テンプレートの自動作成」情報処理学会第29回
全天資料559)。
以下、図面を参照しながら、上述したような従来の音声
認識装置について説明を行う。第2図は、従来の音声認
識装置のブロック図である。第2図において、1は音声
入力端子、2は特徴抽出部、8はセントロイド決定部、
9は追加パターン決定部、1oは標準パターンテンプレ
ート、13はパターン照合部、14はスイッチ、15は
認識結果出力端子、16は保管パターンテンプレートで
ある。以上のように構成された音声認識装置について、
その動作を説明する。
まず認識時には、音声信号を音声信号入力端子1よシ入
力し、信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。入力信号の種類は標準パターンテンプレート
10に含まれている単語音声信号を用いる。また、分析
方法には、たとえばLPCケプ・ストラム法を用いれば
、単位時間ごとに所定の個数のケプヌトラム係数が算出
される。
標準パターンテンプレート1oには、音声区間分のケプ
ヌトラム係数を1単語分とする標準パターンが各単語に
つき複数個含まれており、パターン照合部3で標準パタ
ーンを入力し、特徴抽出部2で分析された入力音声パタ
ーンを選び、出力端子15より認識結果を出力する。ま
た、入力音声パターンを保管パターンテンプレート16
に出力する。
次に、標準パターンを更新する学習の際には、特別に話
者に対して学習時を設けず、認識時に保管した保管パタ
ーンテンブレー )18内のパターンが一定個数以上に
なった場合、以下の動作により標準パターンテンプレー
ト10を更新する。初めに、セントロイド決定部8で、
保管パターンを対象にクラスタリングを行い、各クラス
の中心パターンを決定する。クラスタリングの方法は、
たとえば、各パターンにつき距離の近い上位に個のパタ
ーンを各パターンの近傍点とし同クラスとする。そして
、互いに近傍点となるパターンが存在すれば、相当する
パターンのクラスを合わせたものを新しいクラスとする
。(以上の処理を以後KNN法と呼ぶ。)これを式で示
すと、 x=(xOxl・・・・・・xk) Y:(YOYl・・・・・・Yk) XoEY  かつ Y。EX−+X=lX  Yl但し
くx、yは各パターン) 次に、セントロイドの決定法は、たとえば、同クラス内
の全てのパターンとの距離の和が最も小さいパターンを
中心パターンとする。(以後ボテンシャル法と呼ぶ。) 次に、クラスタごとに全単語パターンの認識結果単語名
を調べ、最も多い単語名をクラスタの代表単語名とみな
し、前記セントロイドパターンを前記単語パターンとし
て、標準パターンテンプレート1oに追加する。
なお、スイッチ14は、学習時にはセントロイド決定部
8へ、認識時には結果出力端子16に認識結果を出力す
るように動作する。
発明が解決しようとする問題点 しかしながら、上記のような構成では、保管パターンに
誤認識パターンが多い場合には、各クラスタの代表単語
名を誤って決定する場合があり、正しい単語名でパター
ンを追加することが不可能になる。また、保管パターン
に正認識パターンが多い場合には、決定された追加パタ
ーンも正認識パターンである場合が多く、学習後の認識
率が向上せず、学習が無駄になるという問題点を有して
いた。
本発明は、上記問題点に鑑み、認識時に認識結果を話者
に知らせ認識の正誤を確認し、誤った場合には、正しい
と確認されるまで同じ音声入力。
照合、確認を繰シ返すことで、誤認識パターンだけを正
解単語もしくは音韻、音節名と共に保管テンプレートに
保管し、標準パターンを更新するだめの学習時に、保管
された誤認識パターンを対象に単語もしくは音節、音韻
別にクラス分けを行い、セントロイドを決定し、前記セ
ントロイドパターンを相当する単語もしくは音節、音韻
として標準テンプレートに追加することにより、話者に
必要以上の負担をかけず、さらに常に正しい単語もしく
は音節、音韻として追加することが可能となり、かつ、
追加パターンは誤認識パターンよシ選択しているので不
都合な学習の無駄をも軽減し、効率良く認識率を向上さ
せることのできる音声認識装置を提供するものである。
問題点を解決するための手段 この目的を達成するために本発明の音声認識装置は、各
単語もしくは音節、音韻についての複数個の標準パター
ンを有する標準パターンテンプレートと、標準パターン
の更新に必要なパターンを保管する保管パターンテンプ
レートと、標準パターンと認識されるべき入力パターン
とを照合するパターン照合部と、話者が処理を終了する
まで一時的に入力音声を保管しておく保管バッファと、
話者に対し認識結果の正誤を確認する正誤確認部と、前
記保管バッファ内のデータを保管テンプレートに転送す
るパターン転送部と、入力パターンの中より標準パター
ンテンプレートに追加スルべきパターンを決定する追加
パターン決定部と、複数個の保管パターンに対し類似度
の高いパターンを同クラスとみなしたクラス分けを行い
、各クラスのセントロイドを決定するセントロイド決定
部とから構成されている。
作  用 この構成によって、認識時に、パターン照合部で認識結
果を出力し、正誤確認部で認識結果を話者に知らせ認識
の正誤を確認し、誤った場合には、正しいと確認される
まで同じ音声入力及び照合を繰り返した後、正しいと確
認された際に、先の誤認識パターンを正解単語名もしく
は音韻、音節名と共に保管テンプレートに保管し、標準
パターンを更新するための学習時に、前記セントロイド
決定部で、保管された誤認識パターンを対象に単語もし
くは音節、音韻別にクラス分けを行い、セントロイドを
決定し、前記追加パターン決定部で、上記セントロイド
パターンを標準パターンに追加するように動作する。次
の認識時には、更新された標準パターンテンプレートを
用いて認識する。
実施例 以下、本発明の単語音声認識における一実施例について
第1図を参照しながら説明する。第1図において、1は
音声入力端子、2は特徴抽出部、3はパターン照合部、
4は音声合成部、5はスイッチ、eは認識結果出力端子
、7はパターン転送部、8はセントロイド決定部、9は
追加パターン決定部、1oは標準パターンテンプレート
、11は保管バッファ、12は保管パターンテンプレー
トであり、前記従来例と同じものは、同一の番号を付与
している。
以上のように構成された音声認識装置について以下その
動作について説明する。
まず認識時には、音声信号を音声信号入力端子1より入
力し、信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。入力信号の種類2分析条件は従来例と同様で
あり、たとえば都市名「東京」と入力したとする。
次に、パターン照合部3で標準パターンテンプレート1
0よシ標準パターンを入力し、特徴抽出部2で分析され
た入力音声パターンと標準パターンとの距離を算出し、
最短距離の標準・(ターンに相当する単語名を認識結果
として音声合成部4に出力する。また、入力音声パター
ンを保管バッファ11に出力する。
次に、音声合成部4で上記認識結果を話者に確認するた
めの確認用合成音声を作成し、出力端子6より出力する
。この際の合成音声は、たとえば「東京ですね。」でも
よく、合成方式は、たとえばADPCM方式でもよい。
次に、話者の確認音声信号を音声入力端子1より入力し
、信号を特徴抽出部2で分析し、特徴パラメータを抽出
する。分析条件は従来例と同様であり、信号の内容は、
正誤確認音声、たとえば「はい」または「いいえ」でも
よい。
次に、パターン照合部3で標準パターンテンプレート1
oより確認音声用標準パターンを入力し、特徴抽出部2
で分析された入力音声パターンと標準パターンとの距離
を算出し、最短距離の標準パターンに相当する確認単語
名を認識結果として出力する。この際に認識結果が正し
い場合、たとえば「はい」を出力する場合は、保管バッ
ファ11を消去し、認識処理を終了する。認識結果が誤
った場合、たとえば「いいえ」の場合は、音声合成部4
に認識結果を出力する。
次に、音声合成部4で、話者に対し再度同じ入力音声を
催促するための催促用合成音声を作成し、音声出力端子
6よシ出力する。合成方体は確認用合成音声と同様であ
り、音声の内容は、たとえば「もう−度、都市名をどう
ぞ。」でもよい。
次に、再度、同都市名音声信号をマイクロホン等を介し
音声信号入力端子1より入力し、上記の処理を、正しい
都市名と確認されるまで繰り返す。
この際に、繰り返し回数を数え、予め決められた最大限
度回数以上になった時は認識処理を終了してもよい。
次に、1回以上上記処理を繰シ返した後、正しい都市名
が確認された場合は、パターン転送部7で保管バッファ
11内の誤認識した入力パターンを正しい単語名ととも
に保管パターンテンプレート12に転送し、保管パター
ンテンプレート12では単語名ごとにパターンが保管さ
れる。
また、標準パターンを更新する学習の際には、特別に話
者に対して学習時を設けず、認識時に保管した保管パタ
ーンテンブレー)10の内のパターンが一定個数以上に
なった場合、以下の動作により標準パターンテンプレー
ト1Qを更新する0初めに、セントロイド決定部8で、
保管パターンを対象にクラスタリングを行い、各クラス
の中心パターンを決定する。クラスタリングの方法は、
たとえば、K−NN法、セントロイドの決定法は、たと
えば、ポテンシャル法でもよい。
次に、追加パターン決定部9で上記セントロイトパター
ンを標準パターンテンプレート1oに追加する。
なお、スイッチ6は、学習時にはセントロイド決定部8
へ、パターン転送時にはパターン転送部7へ、認識時に
は結果出力端子6に認識結果を出力するように動作する
以上のように、本実施例によれば、認識時に、パターン
照合部3で認識結果を出力し、音声合成部4で確認用合
成音声により認識結果を話者に知らせ認識の正誤を確認
し、誤った場合には、正しいと確認されるまで同じ音声
入力及び照合を繰り返した後、正しいと確認された際に
、先の誤認識パターンを正解単語名と共に保管テンプレ
ートに保管し、標準パターンを更新するだめの学習時に
、セントロイド決定部8で、保管された誤認識パターン
を対象に単語別にクラスタリングを行い、セントロイド
を決定し、追加パターン決定部9で、上記セントロイト
パターンを標準テンプレートに追加することにより、常
に正しい単語として追加することが可能となシ、かつ、
追加パターンは誤認識パターンより選択しているので、
不都合な学習の無駄をも軽減し、効率良く認識率を向上
させることが可能となる。また、正誤確認方法に音声を
使用することにより、確認用として他の装置を付加する
必要もなく、話者に必要以上の負担がかからないという
利点を有するものである。
発明の効果 本発明は、認識時に、パターン照合部で認識結果を出力
し、正誤確認部で認識結果を話者に知らせ認識の正誤を
確認し、誤った場合には、正しいと確認されるまで同じ
音声入力及び照合を繰り返した後、正しいと確認された
際に、先の誤認識パターンを正解単語名もしくは音韻、
音節名と共に保管テンプレートに保管し、標準パターン
を更新するだめの学習時に、前記セントロイド決定部で
、保管された誤認識パターンを対象に単語もしくは音節
、音韻別にクラス分けを行い、セントロイドを決定し、
前記追加パターン決定部で、前記セントロイドパターン
を標準パターンに追加することにより、常に正しい単語
もしぐは音節、音韻として追加することが可能となり、
かつ、追加パターンは誤認識パターンより選択している
ので、不都合な学習の無1駄をも軽減し、効率良く認識
率を向上させることが可能となる。また、正誤確認部を
音声合成にて行うことにより、確認用として他の装置を
付加する必要もなく、話者に必要以上の負担がかからな
い優れた音声認識装置を実現するものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は従来例における音声認識装置のブロッ
ク図である。 1・・・・・・音声入力端子、2・・・・・・特徴抽出
部、3・・・・・・パターン照合部、4・・・・・・音
声合成部、5・・・・・・スイッチ、6・・・・・認識
結果出力端子、7・・・・・パターン転送部、8・・・
・・・セントロイド決定部、9・・・・・追加パターン
決定部、1o・・・・・・標準パターンテンプレート、
11・・・・・・保管バッファ、12・・・・・・保管
ハターンテンプレート。

Claims (2)

    【特許請求の範囲】
  1. (1)各単語もしくは音節、音韻についての複数個の標
    準パターンを有する標準パターンテンプレートと、標準
    パターンの更新に必要なパターンを保管する保管パター
    ンテンプレートと、標準パターンと認識されるべき入力
    パターンとを照合するパターン照合部と、話者が処理を
    終了するまで一時的に入力音声を保管しておく保管バッ
    ファと、話者に対し認識結果の正誤を確認する正誤確認
    部と、前記保管バッファ内のデータを保管テンプレート
    に転送するパターン転送部と、保管パターンの中より標
    準パターンテンプレートに追加するべきパターンを決定
    する追加パターン決定部と、複数個の保管パターンに対
    し類似度の高いパターンを同クラスとみなしたクラス分
    けを行い、各クラスのセントロイドを決定するセントロ
    イド決定部を具備し、前記パターン照合部で認識結果を
    出力し、認識時に、前記正誤確認部で認識結果を話者に
    知らせ認識の正誤を確認し、誤った場合には、正しいと
    確認されるまで同じ音声入力及び照合を繰り返した後、
    正しいと確認された際に、先の誤認識パターンを正解単
    語名もしくは音韻、音節名と共に前記保管テンプレート
    に保管し、標準パターンを更新するための学習時に、前
    記セントロイド決定部で、保管された誤認識パターンを
    対象に単語もしくは音節、音韻別にクラス分けを行い、
    セントロイドを決定し、前記追加パターン決定部で、前
    記セントロイドパターンを標準パターンに追加すること
    を特徴とする音声認識装置。
  2. (2)正誤確認部は合成音声により話者に正誤を確認す
    る音声合成部であることを特徴とする特許請求の範囲第
    1項記載の音声認識装置。
JP61264578A 1986-11-06 1986-11-06 音声認識装置 Pending JPS63118198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61264578A JPS63118198A (ja) 1986-11-06 1986-11-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61264578A JPS63118198A (ja) 1986-11-06 1986-11-06 音声認識装置

Publications (1)

Publication Number Publication Date
JPS63118198A true JPS63118198A (ja) 1988-05-23

Family

ID=17405233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61264578A Pending JPS63118198A (ja) 1986-11-06 1986-11-06 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63118198A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619491A (ja) * 1992-06-30 1994-01-28 Sanyo Electric Co Ltd 音声認識装置
JP2003280688A (ja) * 2002-03-25 2003-10-02 Nissan Diesel Motor Co Ltd 情報交換システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619491A (ja) * 1992-06-30 1994-01-28 Sanyo Electric Co Ltd 音声認識装置
JP2003280688A (ja) * 2002-03-25 2003-10-02 Nissan Diesel Motor Co Ltd 情報交換システム

Similar Documents

Publication Publication Date Title
JP3444108B2 (ja) 音声認識装置
JPS63118198A (ja) 音声認識装置
JP3039453B2 (ja) 音声認識装置
JPS62111292A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JPH0566597B2 (ja)
JP3291073B2 (ja) 音声認識方式
JPS62159200A (ja) 特定話者用単語音声認識装置
JPS63303398A (ja) 音声認識装置
JPS62204299A (ja) 音声認識装置
JPH0554116B2 (ja)
JPS6148897A (ja) 音声認識装置
JPS5934595A (ja) 音声認識処理方式
JPS63247799A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JPS63218999A (ja) 音声認識装置
Wielgat Improving speech recognition accuracy using HMM and DTW methods
JPS6315295A (ja) 音声認識装置
JPS61121093A (ja) 音声認識装置
JPS63155195A (ja) 音声認識装置
JPH0760317B2 (ja) 音声情報入力装置
JPS61165797A (ja) 音声認識装置
JPS5968794A (ja) 単語音声認識方法
JPS5961893A (ja) 標準パタ−ン更新機能付音声入力装置
JPS6312000A (ja) 音声認識装置