JPS6287993A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6287993A
JPS6287993A JP60228045A JP22804585A JPS6287993A JP S6287993 A JPS6287993 A JP S6287993A JP 60228045 A JP60228045 A JP 60228045A JP 22804585 A JP22804585 A JP 22804585A JP S6287993 A JPS6287993 A JP S6287993A
Authority
JP
Japan
Prior art keywords
learning
standard
speaker
standard pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60228045A
Other languages
English (en)
Inventor
別所 由実
正宏 浜田
明寿 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60228045A priority Critical patent/JPS6287993A/ja
Publication of JPS6287993A publication Critical patent/JPS6287993A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき、複数個の
標準パターンテンプレートを持つ音声認識装置に関する
ものである。
従来の技術 不特定話者に対応させるために、各単語もしくは音節、
音韻につき、複数個の標準パターンを用いる方法は有効
な方法である。上記方法では、より多くの話者に対応す
るために、標準パターンの個数を増加することが考えら
れるが、逆に個数の多さのために異なる単語間の標準パ
ターンの重複が多くなり誤認識の原因となることと、入
カバターンとのマツチングに必要な処理時間が長くなる
という不都合とがある。従来の音声認識装置では、上記
問題点を解決するため、学習の際に、話者ごとに複数回
音声を入力することにより用いるべき標準パターンを選
択し選択されたパターンをセット化しておき、認識の際
には、学習の際よりも少ない音声入力でセット化された
標準パターンを選択し、選択された標準パターンを対象
に認識を行うという方法がとられた。以上の方法により
、話者に適応法標準パターンのみを使用することで、マ
ツチングに必要な処理時間が短くなり、前記話者に対す
る認識率を向上させることが可能となる。
(たとえば特開昭59−192299号公報)以下、図
面を参照しながら、上述したような従来の音声認識装置
だついて説明を行う。
第2図は、従来の音声認識装置のブロック図である。第
2図において、1は音声入力端子、2は特徴抽出部、4
はパターン照合部、5は認識結果出力端子、6はセント
選択部、8は標準パターンテンプレート、9はセット情
報テーブル、13はセット作成部、14はスイッチであ
る。
以上のように構成された音声認識装置について、その動
作を説明する。
まず、話者が最初に使用する際には、音声入力端子1よ
り入力された学習用音声信号を特徴抽出部2で分析し、
特徴パラメータを抽出する。学習用音声信号としては、
標準パターンテンプレート9に含まれている単語音声信
号を用いる。また、分析方法には、たとえばLPCケプ
ヌトラム法を用いれば、単位時間ごとに所定の個数のケ
プストラム係数が算出される。
標準パターンテンプレート9には、音声区間分のケプス
トラム係数を1単語分とする標準パターンが各単語につ
き複数個含まれており、パターン照合部4で標準パター
ンを入力し、特徴抽出部2で分析された学習音声パター
ンと標準パターンとの距離を算出し、最短距離の標準パ
ターンを選ぶ。
学習用音声信号を入力してから後の以上の過程を標準パ
ターンテンブレー)K含まれる全単語について複数回繰
り返し、セット作成部13で、単語ごとに、最も選択さ
れた回数の多い標準パターンを1セツトとして、セット
内の標準パターン番号をセット情報テーブル10に記録
する。この場合、選択されたセット内の標準パターン番
号が、以前に作成されたセット内のパターン番号と半数
以上同じであれば、新たにセットを作成せずに、以前の
セットに残りの異なるパターン番号だけを追加記録する
次に認識時には、最初に、話者に適応するセットを選択
するためだ、選択用音声信号を音声入力端子1より入力
し、信号を特徴抽出部2で分析し、特徴パラメータを抽
出する。選択用音声信号の種類9分析条件は初期学習時
と同様である。
次に、パターン照合部4で、標準パターンテンプレート
9より、標準パターンを入力し、選択用音声パターンの
市街値距離を算出し、最短距離の標準パターン番号とセ
ット情報テーブル1oに記録されている標準パターン番
号を照合し、最短距離の標準パターン番号を含むセット
の使用回数を記録する。選択用音声信号を入力してから
後の過程を全単語につき複数回繰り返し、セット選択部
6で最も使用回数の多いセットを選択する。この際、学
習時と同数の単語を入力する必要はなく、極端な場合、
各単語につき1回ずつ入力し、セットを選択しても良い
。また、入力単語の増加に伴って、選択するセット数を
制限しても良い。
次に、認識すべき音声信号を音声入力端子1より入カレ
、信号を特徴抽出部2で分析し、特徴パラメータを抽出
する。パターン照合部4で、上記の処理にて選択された
セント内の標準パターンと入カバターンの市街値距離を
算出し、出力端子5より認識結果を出力する。
なお、スイッチ14は、セットを作成する場合にはセッ
ト作成部13へ、セットを選択する場合にはセット選択
部6へ、認識する場合には、出力端子6へ照合結果を出
力するように動作する。
発明が解決しようとする問題点 しかしながら、上記のような構成では、セット化すると
セットに含まれる標準パターンの数が少なくなり、極端
な場合、1つのセットに対しセット作成のだめの学習を
2回以上行わない限りは、1セツト内に各単語につき1
個ずつのパターンしか含まなくなるため、各話者の発声
状態が時間の経過と共に変化し、一部の単語に対しては
他のセントに含まれる標準パターンにマツチングする場
合も、多くの単語に変化がない限りは、最初に作成した
セットに含まれる標準パターンを選択してしまう。この
ため場合によっては、セット化することで、逆に認識率
が低下するという問題点を有していた。
本発明は、上記問題点に鑑み、セット作成の際には、セ
ットを作成するための学習の完成度を学習度数テーブル
にセットごとに記録し、認識の際には、選択されたセッ
トの学習の完成度が一定以上の時にセット内の標準パタ
ーンのみを使用し、以下の時には全標準パターンを使用
することにより、セントの信頼性を調べ、信頼性の高い
セットのみを使用することができる音声認識装置を提供
するものである。
問題点を解決するための手段 この目的を達成するために本発明の音声認識装置は、各
単語もしくは音節、音韻についての複数個の標準パター
ンを有する標準パターンテンプレートと、話者もしくは
複数の話者ごとに使用すべきテンプレートのセット情報
を保管するセット情報テーブルと、話者もしくは複数の
話者ごとのセットを作成するセット作成部と、セットを
作成するための学習の完成度を記録する学習度数テーブ
ルと、セット情報を使用するかどうか判定するセット使
用判定部と、話者に適応するセットを選択するセット選
択部とから構成されている。
作  用 この構成によって、話者に適応するセットを作成するた
めの学習の際に、セット作成部でセントを作成すると同
時に、学習の完成度をセットごとに学習度数テーブルに
記録し、認識の際には、セット使用判定部で学習の完成
度が一定以上になっているかを判定し、一定以上の場合
のみ、セット選択部で話者に適応する標準パターンを選
択し、選択された標準パターンを使用し、一定以下の場
合にはセット情報を使用せず、全標準パターンを使用し
て認識を行う。
実施例 以下、本発明の単語音声認識における実施例について第
1図を参照しながら説明する。第1図において1は音声
入力端子、2は特徴抽出部、3はセント使用判定部、4
はパターン照合部、6は認識結果出力端子、6はセット
選択部、7はセット作成部、8は学習度数テーブル、9
は標準パターンテンプレート、10はセット情報テーブ
ルであり、従来例と同じものは、同一の番号を付与して
いる。
以上のように構成された音声認識装置について以下その
動作について説明する。
まず、話者が最初に使用する際には、音声入力端子1よ
り入力された学習用音声信号を特徴抽出部2で分析し、
特徴パラメータを抽出する。学習用音声信号としては、
標準パターンテンプレート9に含まれている単語音声信
号を用いる。また、分析方法には、たとえばLPCケプ
ストラム法を用いれば、単位時間ごとに所定の個数のケ
プストラム係数が算出される。
標準パターンテンプレート9には、音声区間分のケプス
トラム係数を1単語分とする標準パターンが各単語につ
き複数個含まれており、パターン照合部4で標準パター
ンを入力し、特徴抽出部2で分析された学習音声パター
ンと標準パターンとの距離を算出し、最短距離の標準パ
ターンを選ぶ。
学習用音声信号を入力してから後の以上の過程を標準バ
ター7テンプレートに含まれる全単語について複数回繰
シ返し、セット作成部7で、単語ごとの使用回数を記録
する。選択用音声信号を入力してから後の過程を全単語
につき複数回繰り返し、セット選択部6で最も使用回数
の多いセラ)1選択する。この際、学習時と同数の単語
を入力する必要はなく、極端な場合、各単語につき1回
ずつ入力し、セットを選択しても良い。また、入力単語
の増加に伴って、選択するセット数を制限しても良い。
次に、認識すべき音声信号を音声入力端子1よシ入力し
、信号を特徴抽出部2で分析し、特徴パラメータを抽出
する。セット使用判定部3で、上記処理にて選択された
セットの学習回数を学習度数テーブル8より読み込み、
学習回数が一定値以上かどうか調べ、一定値以上の場合
は、パターン照合部4で、選択されたセット内の標準パ
ターンと入カバターンの市街値距離を算出し、出力端子
5より認幽結果を出力する。一定値以下の場合には、パ
ターン照合部4で、全標準パター7との市街値距離を算
出し、出力端子6より認識結果を出力する。
なお、スイッチ12は、セットを作成する場合にはセッ
ト作成部7へ、セットを選択する場合にはセット選択部
6へ、認識する場合には、出力端子6へ照合結果を出力
するように動作する。スイッチ11は、セットを作成す
る場合とセットを選択する場合にはパターン照合部4へ
、認識する場合には、セット使用判定部3へ結果を出力
するように動作する。
以上のように、本実施例によれば、話者に適応するセッ
トを作成するための学習の際に、セフ)作成部7でセッ
トを作成すると同時に、学習回数をセットごとに学習度
数テーブル8に記録し、認識の際には、セット使用判定
部3で学習回数が一定値以上になっているかを判定し、
一定値以上の場合のみ、セット選択部6で話者に適応す
る標準パターンを選択し、選択された標準パターンを使
用し、一定値以下の場合にはセット情報を使用せず、全
標準パターンを使用することにより、従来のセット化し
た標準パターンを使用する利点を保ちながら、なおかつ
、話者の発声状態が時間と共に変化しても、認識時には
、常に話者に最適な標準パターンを用いることで認識率
を向上させることが可能となる。
なお、本実施例では、学習の完成度を調べるために、セ
ットを作成するための学習の回数をセットごとに学習度
数テーブルに記録したが、他の方法で完成度を調べても
よい。
さらに、学習の完成度を調べる他の方法として、セット
ごとにセットに含まれる標準パターンの数を学習度数テ
ーブルiに記録し、パターン数が一定値以上の場合はセ
ットに含まれる標準パターンのみを使用し、一定値以下
の場合はセットを使用せずに、全標準パターンを使用し
ても、本実施例と同様の効果が得られる。
発明の効果 本発明は、セット作成の際には、セットを作成するため
の学習の完成度を学習度数テーブルにセットごとに記録
し、認識の際には、選択されたセットの学習の完成度が
一定以上の時にセット内の標準パターンのみを使用し、
以下の時には全標準パターンを使用することにより、常
に話者に最適な標準パターンを用いることで、認識率を
向上させることが可能となる優れた音声認識装置を実現
するものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のプロ
、7り図、第2図は従来例における音声認識装置のブロ
ック図である。 1・・・・・・音声入力端子、2・・・・・・特徴抽出
部、3・・・・・・セット使用判定部、4・・・・・・
パターン照合部、5・・・・・・認識結果出力端子、6
・・・・・・セット選択部、7・・・・・・セット作成
部、8・・・・・・学習度数テーブル、9・・・・・・
標準ハターンテンプレート、1o・・・・・・セット情
報テーブル、11.12・・・・・・スイッチ。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図

Claims (3)

    【特許請求の範囲】
  1. (1)各単語もしくは音節、音韻についての複数個の標
    準パターンを有する標準パターンテンプレートと、話者
    もしくは複数の話者ごとに使用すべきテンプレートのセ
    ット情報を保管するセット情報テーブルと、話者もしく
    は複数の話者ごとのセットを作成するセット作成部と、
    セットを作成するための学習の完成度を記録する学習度
    数テーブルと、セット情報を使用するかどうか判定する
    セット使用判定部と、話者に適応するセットを選択する
    セット選択部とを具備し、話者に適応するセットを作成
    するための学習の際に、前記セット作成部でセットを作
    成すると同時に、学習の完成度をセットごとに前記学習
    度数テーブルに記録し、認識の際には、前記セット使用
    判定部で学習の完成度が一定以上になっているかを判定
    し、一定以上の場合のみ、前記セット選択部で話者に適
    応する標準パターンを選択し、選択された標準パターン
    を使用し、一定以下の場合にはセット情報を使用せず、
    全標準パターンを使用して認識を行うことを特徴とする
    音声認識装置。
  2. (2)学習度数テーブルには、セットごとの学習回数を
    記録することを特徴とする特許請求の範囲第1項記載の
    音声認識装置。
  3. (3)学習度数テーブルには、セットごとに、セットに
    含まれるパターン数を記録することを特徴とする特許請
    求の範囲第1項記載の音声認識装置。
JP60228045A 1985-10-14 1985-10-14 音声認識装置 Pending JPS6287993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60228045A JPS6287993A (ja) 1985-10-14 1985-10-14 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60228045A JPS6287993A (ja) 1985-10-14 1985-10-14 音声認識装置

Publications (1)

Publication Number Publication Date
JPS6287993A true JPS6287993A (ja) 1987-04-22

Family

ID=16870334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60228045A Pending JPS6287993A (ja) 1985-10-14 1985-10-14 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6287993A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4659311B2 (ja) * 1999-07-08 2011-03-30 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 転送手段を有するスピーチ認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4659311B2 (ja) * 1999-07-08 2011-03-30 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 転送手段を有するスピーチ認識装置

Similar Documents

Publication Publication Date Title
JPS6287993A (ja) 音声認識装置
JPS6242198A (ja) 音声認識装置
JPS63218999A (ja) 音声認識装置
JPS63155195A (ja) 音声認識装置
JP3919314B2 (ja) 話者認識装置及びその方法
JPS61138296A (ja) 音声認識装置
JPS6167897A (ja) 音声認識装置
JPS61180297A (ja) 話者照合装置
JPS61121093A (ja) 音声認識装置
JPS63157199A (ja) 話者照合装置
JPS5934595A (ja) 音声認識処理方式
KR20240060961A (ko) 음성 데이터 생성 방법, 음성 데이터 생성 장치 및 컴퓨터로 판독 가능한 기록 매체
JPS59212900A (ja) 音声認識装置
JPS63247799A (ja) 音声認識装置
JPS61123889A (ja) 音声認識装置
JPS63118198A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JP2707552B2 (ja) 単語音声認識装置
JPS62111292A (ja) 音声認識装置
JPH01260495A (ja) 音声認識法
JPS60241097A (ja) 音声認識応用装置
JPS63259597A (ja) 音声認識装置
JPS595294A (ja) 音声認識装置
JPH0119596B2 (ja)
JPS59111697A (ja) 音声認識方式