JPS6167897A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6167897A
JPS6167897A JP59189908A JP18990884A JPS6167897A JP S6167897 A JPS6167897 A JP S6167897A JP 59189908 A JP59189908 A JP 59189908A JP 18990884 A JP18990884 A JP 18990884A JP S6167897 A JPS6167897 A JP S6167897A
Authority
JP
Japan
Prior art keywords
standard pattern
standard
keyword
recognition device
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59189908A
Other languages
English (en)
Inventor
別所 由実
明寿 山田
正宏 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59189908A priority Critical patent/JPS6167897A/ja
Publication of JPS6167897A publication Critical patent/JPS6167897A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき複数個の標
準パターンテンプレートを持つ音声認識装置に関するも
のである。
従来例の構成とその問題点 元来よシ音声認識装置において不特定話者に対応させる
ために、各単語、もしくは音節、音韻につき複数個の標
準パターンを用いる方法は有効な方法である。上記方法
では、より多くの話者に対応するために、標準パターン
の個数を増加することが考えられるが、逆に個数の多さ
のために異なる単語間の標準パターンの重複が多くなり
誤認識の原因となることと、入カバターンとのマツチン
グに必要な処理時間が長くなるという不都合とがある。
従来の音声認識装置では、上記問題点を解決するため認
識する前に、各個人ごとに複数個音声を入力することに
より用いるべき標準パターンを選出し、認識時には選出
された標準パターンのみを用いる方法が行なわれた。
しかしながら上記方法では、全ての標準パターンの話者
への適応を脣うためには、認識装置を使用するごとに全
ての単語もしくは音節、音韻に対して一定量の学習用音
声信号が必要となり、話者への適応速度が遅いという問
題点を有している。。
以下、図面を参照しながら従来の音声認識装置について
説明する。第1図は従来の音声認識装置のブロック図で
ある。第1図において、1は音声入力端子、2は特徴抽
出部、3は標準パターン照合部、4は標準パターン選出
部、5は標準パターンテンプレート、6は判定部、7は
認識結果出力端子、8はスイッチである。
以上のように構成された音声認識装置についてその動作
を単語パターンテンプレートを使用する場合を例にあげ
て説明する。
まず、学習時に音声入力端子1よシ入力された学習用音
声信号を特徴抽出部2で分析し特徴パラメー!を抽出す
る。学習用音声信号としては、標準パターンテンプレー
ト5に含まれている単語音声信号を用いる。また分析方
法には、たとえばLPCケプストラム法を用いれば、単
位時間ごとに、所定の個数のケプヌトラム係数が算出さ
れる。
標準パターンテンプレート6には、音声区間分のケプヌ
トラム係数を1単語分とする標準パターンが各単語につ
き複数個含まれており、標準パターン照合部3で特徴抽
出部2で分析された学習音声パターンと各標準パターン
との市街地距離りを計算し、最短距離の標準パターンを
選び、使用回数を記憶する。
市街地距離りの算出式は(1)式となる。
工 C: 入力音声のケプヌトラム係数 N : 分析次数 M : 全フレーム数 D 二 市街地距離 学習用音声信号を入力してから後の以上の過程を標準パ
ターンテンプレート5に含まれている全単語について複
数回繰シ返し、標準パターン選出部4で、単語ととに最
も使用頻度の多い標準パターンを選出する。
次に、認識時に音声入力端子1よシ入力された音声信号
を特徴抽出部2で分析し特徴パラメータを抽出する。判
定部6で先はど選出された標準パターンと入カバターン
との市街地距離りを求め、最短距離単語を認識結果出力
端子7から出力する。
なお、スイッチ8は特徴抽出部2の出力結果を学習用音
声信号を処理する場合は標準パターン照合部3へ、音声
信号を処理する場合は判定部6へ入力するように動作す
る。
しかしながら、上記の従来の構成では、認識装置を使用
するごとに、全ての単語に対して複数個の学習用音声信
号を入力しなければならず、話者への適応速度が遅いと
いう問題点を有していた。
発明の目的 本発明は、上記の従来の問題点を解消するもので、最初
に認識装置を使用する際に、学習用音声信号を入力し各
個人に最適な標準パターンを選出しておけば、二度目以
後に認識装置を使用する際は、学習を必要とすることは
なく、しかも、認識時には各個人に最も適切な標準パタ
ーンのみを使用することで、従来どおり誤認識を防ぎ、
さらに短時間処理が可能である音声認識装置を提供する
ものである。
発明の構成 本発明は、特徴抽出部と、標準パターン照合部と、標準
パターン選出部と、標準パターンテンプレートと判定部
とに加え、選出されたパターンを1セットとするセット
作成部と、作成されたセット情報を保管するセット情報
テンプレートと、1セットの中で、他のセットに含まれ
ている回数の最も少ないパターンをセットのキーワード
とするキーワード選出部と、2度目以後、認識装置使用
の際に入力されたキーワードから最適標準パターンを選
出する最適標準パターン選出部とを備えることにより、
最初に認識装置を使用する際に学習用音声信号を入力し
、最適標準パターンセットを作成し、キーワードを出力
する処理を行えば2度目以後に認識装置を使用する際に
はキーワード音声を入力するだけで、最適標準パターン
セットを読み出すことができるために、短時間での話者
適応が可能となるものである。
実施例の説明 本発明の実施例について第2図にもとづいて説明する。
第2図は、本発明の一実施例における音声認識装置のブ
ロック図である。1は音声入力端子、2は特徴抽出部、
3は標準パターン照合部、4は標準パターン選出部、6
は標準パターンテンプレート、6は判定部、7は認識結
果出力端子、9はセット作成部、1oはキーワード選出
部、11はキーワード出力端子、12は最適標準パター
ン選出部、13はセット情報テンプレート、14はスイ
ッチである。
以上のように構成された本実施例の音声認識装置につい
て、単語パターンテンプレートを使用する場合を例にあ
げて、以下その動作を説明する。
尚、第1図と同一部材には同一番号を付し詳しい説明は
省略する。
まず、初期学習時に音声入力端子1から入力された学習
用音声信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。動作は従来例の特徴抽出部の動作と同じであ
る。次に標準パターン照合部3で学習音声パターンと標
準パターンとの市街地距離を計算し、最短距離を与える
標準パターンを選び使用回数を記憶する。動作及び内容
は従来例の標準パターン照合部及び標準パターンテンプ
レートと同じである。以上の過程を標準パターンに含ま
れている全単語について複数回繰り返し、従来例と同方
法を用いて標準パターン選出部4で単語ごとに標準パタ
ーンを選出する。
次に、セット作成部9で、選出された標準パターンを1
セットとし、選出された標準パターン番号を1セットと
してセット情報テンプレート13に書き出す。
次にキーワード選出部1oでは、1セットに含まれるパ
ターンの中で、他のセットに含まれる回数の最も少ない
パターンをセクトのキーワードとし、キーワード単語を
出力する。認識装置使用者は、使用者ごとにキーワード
単語を記憶しておく。
2度目以後に使用する際は、上記の結果をふまえ、話者
の識別さえできれば、各話者に最適なセットの読み出し
が可能である。このような観点から以下に示す音声認識
が行なわれる。
話者識別時には、まず音声入力端子1より使用者自身の
キーワード単語音声を入力し、特徴抽出部2で分析する
。次に最適標準パターン選出部12でキーワード単語を
認識し、認識された単語をキーワードとするセットをセ
ット情報テンプレート13から読み出し、このセットに
含まれる標準パターンを、標準パターンテンプレートS
かう読み出す。
次に認識時には音声信号を音声入力端子1より入力し、
特徴抽出部2で分析し、特徴パラメータを判定部6に入
力する。後の動作は、従来例の判定部と同じである。次
に認識結果を認識結果出力端子7より出力する。なお、
スイッチ14は特徴抽出部2の出力を学習用音声信号を
処理する場合は標準パターン照合部3へ、キーワード単
語音声信号を処理する場合は、最適標準パターン選出部
12へ、音声信号を処理する場合は、判定部6へ入力す
るように動作する。
以上のように本実施例によれば、最初に認識装置を使用
する際に、初期学習として学習用音声信号を入力し、標
準パターンを選出し、選出されたパターンを1セットと
して、セットごとにキーワード単語を決めることで、2
度目以後認識装置を使用する際には最初にキーワード単
語音声を入力するだけで、各個人ごとに最適な標準パタ
ーンを選出することが可能である。このため、誤認識が
少なく、さらに短時間での話者適応化が可能である。
発明の効果 本発明は、最初に認識装置を使用する際に、単語もしく
は音節、音韻ごとに標準パターンを選出し、選出された
パターンを1セクトとしてセットごとにキーワードを決
めることで、2度目以後認識装置を使用する際の学習を
必要とすることなく話者識別の目的で、単一のキーワー
ド音声を入力するだけで、認識時における各個人に最も
適切な標準パターンの使用が可能となり、このため、誤
認識を防ぎ、さらに短時間処理が可能である優れた音声
認識装置を実現するものである。
【図面の簡単な説明】
第1図は従来の音声認識装置のブロック図、第2図は本
発明の一実施例における音声認識装置のブロック図であ
る。 1・・・・・・音声信号入力端子、2・・・・・・特徴
抽出部、3・・・・・・標準パターン照合部、4・・・
・・・標準パターン選出部、5・・・・・・標準パター
ンテンプレート、6・・・・・・判定部、7・・・・・
・認識結果出力端子、8・・・・・・スイッチ、9・・
・・・・セット作成部、10・・・・・・キーワード選
出部、11・・・・・・キーワード出力端子、12・・
・・・・最適標準パターン選出部、13・・・・・・セ
ット情報テンプレート、14・・・・・・スイッチ。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名−喝 Cす

Claims (2)

    【特許請求の範囲】
  1. (1)各単語もしくは音節、音韻につき複数個の標準パ
    ターンを持つテンプレートを使用する際に、各個人ごと
    に使用するべき標準パターンを選出する標準パターン選
    出部と、選出されたパターンを1セットとする標準パタ
    ーンセット作成部と、上記標準パターンセット作成部で
    選出されたパターンの中で、他のセットに含まれる頻度
    の最も少ないパターンを、セットのキーワードとするキ
    ーワード選出部を具備し、認識装置使用の際には最初に
    上記キーワード音声を入力することで、複数個の標準パ
    ターンから、各個人の上記標準パターンセットを読み出
    し、読み出した標準パターンのみを使用することを特徴
    とする音声認識装置。
  2. (2)標準パターン選出部は、各単語音声もしくは音節
    、音韻を複数回入力し、使用頻度の高い標準パターンを
    選出することを特徴とする特許請求の範囲第1項記載の
    音声認識装置。
JP59189908A 1984-09-11 1984-09-11 音声認識装置 Pending JPS6167897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59189908A JPS6167897A (ja) 1984-09-11 1984-09-11 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59189908A JPS6167897A (ja) 1984-09-11 1984-09-11 音声認識装置

Publications (1)

Publication Number Publication Date
JPS6167897A true JPS6167897A (ja) 1986-04-08

Family

ID=16249212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59189908A Pending JPS6167897A (ja) 1984-09-11 1984-09-11 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6167897A (ja)

Similar Documents

Publication Publication Date Title
JPS6167897A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPS5887599A (ja) 音声単語認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
JPS63157199A (ja) 話者照合装置
JPS61138296A (ja) 音声認識装置
JPS61180297A (ja) 話者照合装置
JPS63303398A (ja) 音声認識装置
JPS63247799A (ja) 音声認識装置
JPS63155195A (ja) 音声認識装置
JPS63218999A (ja) 音声認識装置
JPS60164800A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JPS61121093A (ja) 音声認識装置
JPS5934595A (ja) 音声認識処理方式
JPS63118198A (ja) 音声認識装置
JPS62159200A (ja) 特定話者用単語音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPS61123889A (ja) 音声認識装置
JPS60170885A (ja) 単音節音声学習方式
JPS58156998A (ja) 情報入力装置
JPS59111697A (ja) 音声認識方式
JPS608898A (ja) 音声認識装置