JPS61121093A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61121093A
JPS61121093A JP59243781A JP24378184A JPS61121093A JP S61121093 A JPS61121093 A JP S61121093A JP 59243781 A JP59243781 A JP 59243781A JP 24378184 A JP24378184 A JP 24378184A JP S61121093 A JPS61121093 A JP S61121093A
Authority
JP
Japan
Prior art keywords
standard pattern
standard
speaker
pattern
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59243781A
Other languages
English (en)
Inventor
別所 由美
明寿 山田
正宏 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59243781A priority Critical patent/JPS61121093A/ja
Publication of JPS61121093A publication Critical patent/JPS61121093A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき、複数個の
標準パターンを有する標準パターンテンプレートを持つ
音声認識装置に関するものである。
従来の技術 不特定話者に対応させるために、各単語もしくは、音節
、音韻につき、複数個の標準パターンを用いる方法は有
効な方法である。上記方法では、より多くの話者に対応
するために、標準パターンの個数を増加することが考え
られるが、逆に個数の多さのために異なる単語間の標準
パターンの重複が多くなり誤認識の原因となることと、
入カバターンとのマツチングに必要な処理時間が長くな
るという不都合とがある。従来の音声認識装置では、上
記問題点を解決するだめ、認識する前に話者ごとに複数
回音声を入力することにより、用いるべき標準パターン
を選出し、認識時には選出したパターンのみを用いる方
法がとられた。また、選出されたパターンをセット化し
、同話者が再度標準パターンを選出する際には初回より
も少ない音声入力で、セット化された標準パターンを選
択する。以上の方法により、話者への適応を目的とした
学習の際に、少ない学習音声で、信頼度の高いセット化
された標準パターンを選択でき、選択されたパターンを
使用することで、前記話者に対する認識率を向上させる
ことが可能となる。
(たとえば、特願昭58−67321号)以下図面を参
照しながら、従来の音声認識装置について説明する。第
2図は、従来の音声認識装置のブロック図である。1は
音声入力端子、2は特徴抽出部、3はパターン照合部、
4はスイッチ、6は認識結果出力端子、8はセット作成
部、9は標準パターンテンプレート、1oはセット化情
報テーブル、11はセット選択部である。以上のように
構成された音声認識装置について、その動作を説明する
まず、話者が最初に使用する(以後初期学習と呼ぶ)際
には、音声入力端子1より入力された学習用音声信号を
特徴抽出部で分析し、特徴パラメータを抽出する。学習
用音声信号としは、標準ノくターンテンプレート9に含
まれている単語音声信号を用いる。また分析方法には、
たとえばLPCケプストラム法を用いれば、単位時間ご
とに所定の個数のケプストラム係数が算出される。
標準パターンテンプレート9には、音声区間分のケプス
トラム係数を1単語分とする標準パターンが、各単語に
つき複数個含まれており、パターン照合部3で、標準パ
ターンを入力し、特徴抽出部2で分析された学習音声パ
ターンと、標準パターンの市街地距離を算出し、最短距
離の標準パターンを選び、使用回数を記憶する。市街地
距離りの算出式は、以下の第(1)式となる。
但し CR、標準音声のケプヌトラム係数qt、入力音
声 N :分析次数 M :全フレーム故 D :市街地距離 学習用音声信号を入力してから後の以上の過程を、標準
パターンテンプレートに含まれている全単語について複
数回繰シ返し、セット作成部8でれる標準パターン番号
をセット情報テーブル1゜に記憶する。
認識時には、音声入力端子1よシ入力された音声信号を
特徴抽出部2で分析し特徴パラメータを抽出する。パタ
ーン照合部3で、標準パターンテンプレートからパター
ンを入力し、入カバターンと標準パターンの市街地距離
を求め、出力端子6より認識結果を出力する。
また話者に適応するセットを選択するための学習(以後
、再学習と呼ぶ)時には、音声入力端子1より入力され
た学習用音声信号を特徴抽出部2で分析し、特徴パラメ
ータを抽出する。学習用音声信号及び抽出方法は初期学
習時と同様である。
次に、パターン照合部3で、標準パターンテンプレート
9から標準パターンを入力し、特徴抽出部2で分析され
た学習音声パターンと標準パターンとの市街地距離を算
出し、最短距離の標準パターン番号と、セット情報テー
ブル10に記録されている標準パターン番号を照合し最
短距離標準パターン番号を含むセットの使用回数を記憶
する。
学習用音声信号を入力してから後の過程を、全単語につ
き複数回繰り返し、セット選択部11で、最も使用頻度
の多いセットを選択する。この際、初期学習時と同数の
単語を入力する必要はなく、極端な場合、各単語につき
1回ずつ入力し、使用頻度の多いセットを選択する。
また、入力単語の増加に伴なって、選択するセットを制
限する。なお、スイッチ4は、初期学習時には、セット
作成部8、再学習時にはセット選択部11、認識時には
、結果出力端子Sに照合結果を出力するように動作する
発明が解決しようとする問題点 しかしながら、上記のような構成では、一度セノド化す
ると、セット内に含まれている標準パターンの種類に変
更がないだめ、各話者の発声状態が時間の経過と共に変
化し、一部の単語に対しては、他のセットに含まれる標
準パターンにより良くマツチングする場合も、多くの単
語に変化がない限りは、初期学習時のセノ)に含まれる
標準パターンを選択してしまう。故に、一部の単語に対
しては、セット化することで、逆に認識が低下するとい
う問題点を有していた。
本発明は、上記問題点に鑑み、再学習時に各セットの標
準パターンの種類を更新することで、話者の発声状態が
時間の経過とともに変化しても、常に、最適な標準パタ
ーンを含むセットを選択することができる音声認識装置
を提供するものである。
問題点を解決するための手段 この目的を達成するために、本発明の音声認識装置は、
各単語もしくは音節、音韻についての複数個の繁準パタ
ーンを有する標準パターンテンプレートと、話者の組ご
と、使用すべきテンプレートのセット情報を保管しであ
るセット情報テーブルと、話者に適応するセットを選択
するセット選択部と、選択するセットにセット外の標準
パターンを追加するセント追加部とから構成されている
作  用 この構成によって、再学習時にはセント選択部で、話者
に適応するセットを選択するとともに、話者に適応する
パターンが選択したセットに含まれない場合、上記標準
パターン番号を記憶し、セント追加部で、上記標準パタ
ーン番号をセットに追加し、セット情報テーブルに再登
録し、認識時には、追加したセット情報による標準パタ
ーンを用いて認識する。
実施例 以下、本発明の単語音声認識における一実施例について
、図面を参照しながら説明する。第1図は、本発明の一
実施例における音声認識装置のブロック図である。1は
音声入力端子、2は特徴抽出部、3はパターン照合部、
4はスイッチ、6は毛織結果を出力する出力端子、6は
話者に適応するセットを選択するセット選択部、7は選
択したセットにセット外の標準パターンをセット情報テ
ーブルに追加するセット追加部、8はセント作成部、9
は各単語もしくは音節、音韻についての複数個標準パタ
ーンを有する標準パターンテンプレート、1oは話者も
しくは複数人の話者ごとに使用すべきテンプレートのセ
ット情報を保管しであるセット情報テーブルである。
以上のように構成された音声認識装置について、以下そ
の動作について説明する。
まず、初期学習時には、音声入力端子1より入力された
学習用音声信号を特徴抽出部2で分析し、特徴パラメー
タを抽出する。学習用音声信号としては、標準パターン
テンプレート9に含まれている単語音声信号を用いる。
また分析方法には、たとえばLPCケプストラム法を用
いれば、単位時間ごとに所定の個数のケプヌトラム係数
が算出される。
標準パターンテンプレート9には、音声区間分のケプヌ
トラム係数を1単語分とする標準パターンが、各単語に
つき複数個含まれており、パターン照合部で、標準パタ
ーンを入力し、特徴抽出部2で分析された学習音声パタ
ーンと、標準パターンの市街地距離を算出し、最短距離
の標準パターンを選び、使用回数を記憶する。市街地距
離りの算出式は以下第(1)式となる。
学習用音声信号を入力してから後の以上の過程を、標準
パターンテンプレート9に含まれている全単語について
複数回繰り返し、セット作成部8で単語ごとに最も使用
頻度の多い標準パターンを選出し、選出したパターンを
1セツトとして、セットに含まれる標準パターン番号を
セット情報テーブル10に記憶する。
次に認識時には、音声入力端子1より入力された音声信
号を特徴抽出部2で分析し特徴パラメータを抽出する。
パターン照合部3で、標準パターンテ゛ンプレート9か
らパターンを入力し、入カバターンと標準パターンの市
街地距離を求め、出力端子6より認識結果を出力する。
また再学習時には、音声入力端子1より入力された学習
用音声信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。学習用音声信号及び抽出方法は初期学習時と
同様である。この際、学習音声信号は既知とする。
次ニ、パターン照合部3で、標準パターンテンプレート
9から標準パターンを入力し、特徴抽出部2で分析され
た学習音声パターンと標準パターンとの市街地距離を算
出し、最短距離の標準パターン番号と、セット情報テー
ブル10に記録されている標準パターン番号を照合し、
最短距離標準パターン番号を含むセットの使用回数を記
憶する。
学習用音声信号を入力してから後の過程を、全単語につ
き複数回繰り返し、セット選択部6で、最も使用頻度の
多いセットを選択する。この際、初期学習時と同数の単
語を入力する必要はなく、極端な場合、各単語につき1
回ずつ入力し、使用項度の多いセットを選択する。
また、入力単語の増加に伴なって、選択するセットを制
限する。この際、選択したセットに含まれていない標準
パターンと最適にマツチングした単語が存在した場合、
正認識であることを認識した上、正認識の場合のみ上記
標準パターン番号を記憶しておく。
次に、セット追加部7で、上記で選択されたセットに記
憶した標準パターン番号を追加し、セット情報テーブル
10に更新する。
なお、スイッチ4は、初期学習時にはセット作成部8、
再学習時にはセント選択部6、認識時には認識結果出力
端子6に、照合結果を出力するように動作する。
以上のように、本実施例によれば、話者に適応する標準
パターンが、セット選択部6で選択したセットに含まれ
ない場合、標準パターンが正認識であることを確認し、
正認識であった場合のみ、上記標準パターン番号を記憶
し、セット追加部7で、選択したセットに、上記標準パ
ターン番号を追加し、セット情報テーブル1oに再登録
することで、従来のセット化した標準パターンを使用す
る利点を保ちながら、なおかつ、話者の発声状態が時間
の経過とともに変化しても、認識時には、常に話者に最
適な標準パターンを用いることで、認識率を向上させる
ことが9鵬となる。
発明の効果 本発明は、話者に適応する標準ノくターンが選択したセ
ットに含まれない場合、選択されたセットに上記標準パ
ターン番号を追加し、認識時には追加したセット情報に
より選択された標準ノ(ターンを用いることで、話者の
発声状態が時間の経過と共に変化しても、認識時には、
常に話者に最適な標準パターンを用いることで、認識率
を向上させることが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は従来例における音声認識装置のブロッ
ク図でおる。 1・・・・・・音声入力端子、2・・・・・・特徴抽出
部、3・・・・・・パターン照合部、4・・・・・・ス
イッチ、6・・・・・・認識結果出力端子、6・・・・
・・セット選択部、7・・・・・・セット追加部、8・
・・・・・セット作成部、9・・・・・・標準・くター
ンテンプレート、10・・・・・・セット情報テーブル
。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1

Claims (1)

    【特許請求の範囲】
  1. 各単語もしくは音節、音韻についての複数個の標準パタ
    ーンを有する標準パターンテンプレートと、話者もしく
    は複数人の話者ごとに、使用すべきテンプレートのセッ
    ト情報を保管してあるセット情報テーブルと、話者に適
    応するセットを選択するセット選択部と、選択したセッ
    トに、セット外の標準パターンを上記セット情報テーブ
    ルに追加するセット追加部とを具備し、話者に適応する
    セットを選択するための学習の際に、話者に適応する標
    準パターンが上記セット選択部で選択されたセットに含
    まれない場合、上記セット追加部で選択されたセットに
    標準パターン番号を記憶し、上記セット情報テーブルに
    再登録し、追加された上記セット情報により選択された
    標準パターンを用いて認識することを特徴とする音声認
    識装置。
JP59243781A 1984-11-19 1984-11-19 音声認識装置 Pending JPS61121093A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59243781A JPS61121093A (ja) 1984-11-19 1984-11-19 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59243781A JPS61121093A (ja) 1984-11-19 1984-11-19 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61121093A true JPS61121093A (ja) 1986-06-09

Family

ID=17108874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59243781A Pending JPS61121093A (ja) 1984-11-19 1984-11-19 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61121093A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015018080A (ja) * 2013-07-10 2015-01-29 日本電信電話株式会社 音声合成用モデル学習装置と音声合成装置と、それらの方法とプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015018080A (ja) * 2013-07-10 2015-01-29 日本電信電話株式会社 音声合成用モデル学習装置と音声合成装置と、それらの方法とプログラム

Similar Documents

Publication Publication Date Title
DE60124408T2 (de) System und Verfahren für automatische Spracherkennung unter Verwendung von Mapping bzw. Abbildung
JPS5944639B2 (ja) 音声による異同認識方式における標準パタ−ン更新方法
JPS6466698A (en) Voice recognition equipment
JPH0354600A (ja) 不明人物の同一性検証方法
Reddy et al. The Hearsay-I speech understanding system: An example of the recognition process
JPH0225517B2 (ja)
JPS61121093A (ja) 音声認識装置
JPS61180297A (ja) 話者照合装置
JPS6287993A (ja) 音声認識装置
Higgins et al. A multi-spectral data-fusion approach to speaker recognition
JPS5934595A (ja) 音声認識処理方式
JPS63218999A (ja) 音声認識装置
Lubensky Continuous digit recognition using coarse phonetic segmentation
JPS63118198A (ja) 音声認識装置
JPS60107192A (ja) パタ−ン認識装置
JPS62111292A (ja) 音声認識装置
JPS61138296A (ja) 音声認識装置
Higgins et al. An HMM-based subband processing approach to speaker identification
JPS63155195A (ja) 音声認識装置
JPS6167897A (ja) 音声認識装置
JPS60241097A (ja) 音声認識応用装置
JPH0119596B2 (ja)
JPS59195299A (ja) 特定話者音声認識装置
JPS61123889A (ja) 音声認識装置
JPS63259597A (ja) 音声認識装置