JPS63218999A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63218999A
JPS63218999A JP5251787A JP5251787A JPS63218999A JP S63218999 A JPS63218999 A JP S63218999A JP 5251787 A JP5251787 A JP 5251787A JP 5251787 A JP5251787 A JP 5251787A JP S63218999 A JPS63218999 A JP S63218999A
Authority
JP
Japan
Prior art keywords
distance
pattern
standard
matching
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5251787A
Other languages
English (en)
Inventor
別所 由実
博之 直野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5251787A priority Critical patent/JPS63218999A/ja
Publication of JPS63218999A publication Critical patent/JPS63218999A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき、単数また
は複数個の標準パターンテンプレートを持つ音声認識装
置に関するものである。
従来の技術 不特定話者に対応させるために、各単語もしくは音節、
音韻につき、複数個の標準パターンを用いる方法は有効
な方法である。上記方法では、より多くの話者に対応し
たり、同話者であっても話者の発声状態が時間の経過と
共に変化した場合に対応するために、初期標準パターン
に、より最適なパターンを追加することが考えられる。
しかしながら、追加した結果、パターン数が増加し、逆
に異なる単語もしくは音節、音韻間の標準パターンの重
複が多くなり誤認識の原因となることと、入力とのマツ
チングに必要な処理時間が長くなるという不都合とがあ
る。従来の音声認識装置では、上記問題点を解決するた
め、学習の際に、話者ごとに複数回音声を入力すること
により用いるべき標準パターンを選択し選択されたパタ
ーンをセット化しておき、認識の際には、学習の際より
も少ない音声入力でセット化された標準パターンを選択
し、選択された標準パターンを対象に認識を行うという
方法がとられた。以上の方法により、話者に適応した標
準パターンのみを使用することで、マツチングに必要な
処理時間が短くなシ、標準パターンを増加させずに前記
話者に対する認識率を向上させることが可能となる(た
とえば、特願昭58−67321)。
以下、図面を参照しながら、上述したような従来の音声
認識装置について説明を行う。第3図は、従来の音声認
識装置のブロック図である。第3図において、1は音声
入力端子、2は特徴抽出部、11はパターン照合部、1
6は認識結果出力端子、13はセット選択部、14はセ
ット作成部、9は標準パターンテンプレート、16はセ
ット情報テーブル、12はスイッチである。以上のよう
に構成された音声認識装置について、その動作を説明す
る。
まず、話者が最初に使用する際には、音声入力端子1よ
シ入力された学習用音声信号を特徴抽出部2で分析し、
特徴パラメータを抽出する。学習用音声信号としては、
標準パターンテンプレート9に含まれている単語音声信
号を用いる。また、分析方法には、たとえばLPCケプ
ストラム法を用いれば、単位時間ごとに所定の個数のケ
プストラム係数が算出される。
標準パターンテンプレート9には、音声区間分のケプス
トラム係数を1単語分とする標準ノくターンが各単語に
つき複数個含まれており、ノ(ターン照合部11で標準
パターンを入力し、特徴抽出部2で分析された学習音声
パターンと標準)(ターンとの距離を算出し、最短距離
の標準、Sターンを選ぶ。学習用音声信号を入力してか
ら後の以上の過程を標準パターンテンプレート9に含ま
れる全単語について複数回繰り返し、セット作成部14
で、単語ごとに、最も選ばれた回数の多い標準)くター
ンを1セツトとして、セット内の標準ノくターン番号を
セット情報テーブル16に記録する。この場合、セット
内の標準パターン番号が、以前に作成されたセット内の
パターン番号と半数以上同じであれば、新たにセットを
作成せずに、以前のセットに残りの異なるパターン番号
だけを追加記録する。
次に認識時には、最初に、話者に適応するセットを選択
するために、選択用音声信号を音声入力端子1より入力
し、信号を特徴抽出部2で分析し、特徴パラメータを抽
出する。選択用音声信号の種類2分析条件は初期学習時
と同様である。
次に、パターン照合部11で、標準パターンテンプレー
ト9より、標準パターンを入力し、選択用音声パターン
の市街値距離を算出し、最短距離の標準パターン番号と
セット情報テーブル16に記録されている標準パターン
番号を照合し、最短距離の標準パターン番号を含むセッ
トの使用回数を記録する。選択用音声信号を入力してか
ら後の過程を全単語につき複数回繰り返し、セット選択
部13で最も使用回数の多いセットを選択する。
この際、学習時と同数の単語を入力する必要はなく、極
端な場合、各単語につき1回ずつ入力し、セットを選択
しても良い。また、入力単語の増加に伴って、選択する
セット数を制限しても良い。
次に、認識すべき音声信号を音声入力端子1より入力し
、信号を特徴抽出部2で分析し、特徴ノくラメータを抽
出する。パターン照合部11で、上記の処理にて選択さ
れたセット内の標準ノくターンと入力パターンの市街値
距離を算出し、出力端子16より認識結果を出力する。
なお、スイッチ12は、セットを作成する場合にはセッ
ト作成部14へ、セットを選択する場合にはセット選択
部13へ、認識する場合には、出力端子15へ照合結果
を出力するように動作する。
発明が解決しようとする問題点 しかしながら、上記のような構成では、学習回数が多く
なると共にセットに含まれる標準ノくターン数が増加す
る可能性が多く、マツチングに時間がかかり、セット化
する利点がなくなってしまう。
また認識する前に、セットを選択するための選択用音声
を必ず入力しなければならないために、使用時に話者に
負担がかかるという問題点を有していた。
本発明は、上記問題点に鑑み、照合結果の全標準パター
ンとの距離値をテーブルに保管し、パターン照合結果の
距離値と現在までにテーブルに保管された距離値との照
合を行い、距離値照合結果より認識結果を決定すること
により、学習回数の増加に伴って処理時間が増大する、
使用時に話者に負担をかけるという従来装置の問題点を
解決し、しかも、パターンを増加させることなく少数の
標準パターンで効率良く話者の認識率を向上させること
ができる音声認識装置を提供するものである。
問題点を解決するだめの手段 この目的を達成するために、本発明の音声認識装置は、
各単語もしくは音節、音韻についての単数または複数個
の標準パターンを有する標準パターンテンプレートと、
上記標準パターンと入力パターンの照合を行い、照合結
果の距離値をテーブルに記録するパターン照合部と、上
記距離値を記録しておく距離テーブルと、上記距離テー
ブル内の距離値と上記パターン照合結果の距離値の照合
を行う距離値照合部と、距離値照合結果より認識結果を
決定する認識結果決定部とから構成されている。
作  用 この構成によって、パターン照合部で、照合した後入力
パターンと全標準パターンとの距離値を、照合した結果
量も距離の近かった単語もしくは音節、音韻(以下第1
候補と呼ぶ。)別に距離テーブルに記録し、距離値照合
部で、パターン照合結果の距離値の一部もしくは全部と
現在までに上記方法にて記録された距離テーブル内の距
離値の一部もしくは全部との照合を行い、認識決定部で
、距離値間の距離が最も小さい単語もしくは音節。
音韻を認識結果を決定し出力する。
実施例 以下、本発明の単語音声認識における実施例について第
1図を参照しながら説明する。第1図において、1は音
声入力端子、2は特徴抽出部、3はパターン照合部、4
はテーブル信頼度判定部、5はスイッチ、6は距離値照
合部、7は認識結果決定部、8は認識結果出力端子、9
は標準パターンテンプレート、10は距離テーブルであ
り、従来例と同じものは同一の番号を付与している。
以上のように構成された音声認識装置について以下その
動作について説明する。
認識時に、まず、音声入力端子1より入力(処理21)
された音声信号を特徴抽出部2で分析しく処理22)、
特徴パラメータを抽出する。音声信号としては、標準パ
ターンテンプレート9に含まれている単語音声信号を用
いる。また、分析方法には、たとえばLPCケプストラ
ム法を用いれば、単位時間ごとに所定の個数のケプヌト
ラム係数が算出される。標準パターンテンプレート9に
は、音声区間分のケプヌトラム係数を1単語分とする標
準パターンが各単語につき単数または複数個含まれてお
り、パターン照合部3で標準パターンを入力し、特徴抽
出部2で分析された音声パターンと標準パターンとの距
離を算出する(処理23)。
入力された音声が、初めて入力された単語である場合は
、算出された全距離値を第1候補の単語番号別に距離テ
ーブル1oに記録しく処理26)、2回目以上の場合に
は、算出された全距離値と過去に上記処理にてテーブル
に記録された距離値との平均距離値を算出しく処理26
)、距離テーブル10内の距離値を上記平均距離値に書
き換える(処理26)。この際に、現在までに距離テー
ブルに記録した回数を単語別に数え、記録回数も距離テ
ーブル10に記録しておく。
次にテーブル信頼度判定部4で、距離テーブル1oへの
記録回数が、全単語において一定値以上であるかどうか
を調べ(処理27)、一定値以下の単語が存在する場合
は、距離値データネ足とみなし、゛距離値間の照合を行
わずに、パターン照合結果の第1候補を認識結果として
出力する。
全単語において一定値以上の場合には、距離値照合部6
で、パターン照合部3にて算出された全距離値と距離テ
ーブル10内の距離値との照合を単語別に行う(処理2
8)。照合はたとえば距離値開の市街地距離を算出する
場合には次の方法で行う。
距離値テーブル10内の距離値データを次式で表し、 X1=(xli、x2i  −−・ zni)(但し、
iwl、2  ・・・ m) xi:単語iの各標準パターンとの距離値xiL :単
語1と標準パターンjとの距離値m:全単語数 n:全標準パターン数 一方、照合結果の、入力パターンと標準パターンの距離
値Yを次式で表すと、 Y−(yl 、y2.・・・ yn )単語iとの距離
値間の市街地距離Diは次式で表され、 全単語分m個の市街地距離が算出される。
次に、認識結果決定部7で、全単語分の距離値間の市街
地距離の中で最短距離の単語を認識結果と決定する(処
理29)。つまシ、 Di=min(Do、DI、D2. ・−Dm)i:認
識単語 となシ、結果を出力端子8よシ出力する(処理30)。
またスイッチ5は、距離値照合を行わない場合には結果
を出力端子8に、距離値照合を行う場合には距離値照合
部6に結果を出力するように動作する。
以上のように、本実施例によれば、パターン照合部で照
合した後、入力パターンと全標準パターンとの距離値を
、第1候補単語別に距離テーブルに記録し、距離テーブ
ルに一定回数以上のデータが記録されると、距離値照合
部で、パターン照合結果の距離値の一部もしくは全部と
現在までに上記方法にて保管された距離テーブル内の距
離値の一部もしくは全部との照合を単語ごとに行い、認
識決定部で、距離値間の距離が最も小さい単語を認識結
果を決定し出力することによシ、学習回数の増加に伴っ
て処理時間が増大する、使用時に話者に負担をかけると
いう従来装置の問題点を解決し、しかも、パターンを増
加させることなく少数の標準パターンで効率良く話者の
認識率を向上させることができる。
発明の効果 本発明は、パターン照合部で、照合した後入力パターン
と全標準パターンとの距離値を、第1候補の単語もしく
は音節、音韻別に距離テーブルに保管し、距離値照合部
で、パターン照合結果の距離値の一部もしくは全部と現
在までに上記方法にて保管された距離テーブル内の距離
値の一部もしくは全部との照合を行い、認識決定部で、
距離値間の距離が最も小さb単語もしくは音節、音韻を
認識結果を決定し出力することによシ、学習回数の増加
に伴って処理時間が増大する、使用時に話者に負担をか
けるという従来装置の問題点を解決し、しかも、パター
ンを増加させることなく少数の標準パターンで効率良く
話者の認識率を向上させることが可能となる優れた音声
認識装置を実現するものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は本発明の一実施例における音声認識処
理のフローチャート、第3図は従来例における音声認識
装置のブロック図である。 1・・・・・・音声入力端子、2・・・・・・特徴抽出
部、3・・・・・・パターン照合部、4・・・・・・テ
ーブル信頼度判定部、6・・・・・・スイッチ、6・・
・・・・距離値照合部、7・・・・・・認識結果決定部
、8・・・・・・認識結果出力端子、9・・・・・・標
準パターンテンプレート、10・・・・・・距離テーブ
ル0 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図

Claims (1)

    【特許請求の範囲】
  1. 各単語もしくは音節、音韻についての単数または複数個
    の標準パターンを有する標準パターンテンプレートと、
    上記標準パターンと入力パターンの照合を行い、照合結
    果の距離値をテーブルに記録するパターン照合部と、上
    記距離値を記録しておく距離テーブルと、上記距離テー
    ブル内の距離値と上記パターン照合結果の距離値の照合
    を行う距離値照合部と、距離値照合結果より認識結果を
    決定する認識結果決定部とを具備し、上記パターン照合
    部で照合した後、入力パターンと全標準パターンとの距
    離値を距離テーブルに記録し、距離値照合部で、パター
    ン照合結果の距離値の一部もしくは全部と現在までに上
    記方法にて記録された距離テーブル内の距離値の一部も
    しくは全部との照合を行い、認識決定部で、距離値照合
    結果より認識結果を決定することを特徴とする音声認識
    装置。
JP5251787A 1987-03-06 1987-03-06 音声認識装置 Pending JPS63218999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5251787A JPS63218999A (ja) 1987-03-06 1987-03-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5251787A JPS63218999A (ja) 1987-03-06 1987-03-06 音声認識装置

Publications (1)

Publication Number Publication Date
JPS63218999A true JPS63218999A (ja) 1988-09-12

Family

ID=12916931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5251787A Pending JPS63218999A (ja) 1987-03-06 1987-03-06 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63218999A (ja)

Similar Documents

Publication Publication Date Title
JP2955297B2 (ja) 音声認識システム
JPS63218999A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JP3919314B2 (ja) 話者認識装置及びその方法
JPS61138296A (ja) 音声認識装置
JPS61123889A (ja) 音声認識装置
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPS61148497A (ja) 標準パタン作成装置
JPS61180297A (ja) 話者照合装置
JPS63155195A (ja) 音声認識装置
KR20240060961A (ko) 음성 데이터 생성 방법, 음성 데이터 생성 장치 및 컴퓨터로 판독 가능한 기록 매체
JPS62111292A (ja) 音声認識装置
JPS6167897A (ja) 音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPS6073592A (ja) 特定話者用音声認識装置
JPS63118198A (ja) 音声認識装置
JP2000122693A (ja) 話者認識方法および話者認識装置
JPS63303398A (ja) 音声認識装置
JPS5934595A (ja) 音声認識処理方式
JPS60241097A (ja) 音声認識応用装置
JPS62255999A (ja) 単語音声認識装置
JPH01260495A (ja) 音声認識法
JPH0119596B2 (ja)
JPS63247799A (ja) 音声認識装置
JPS62204299A (ja) 音声認識装置