JPS6225797A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6225797A
JPS6225797A JP60165119A JP16511985A JPS6225797A JP S6225797 A JPS6225797 A JP S6225797A JP 60165119 A JP60165119 A JP 60165119A JP 16511985 A JP16511985 A JP 16511985A JP S6225797 A JPS6225797 A JP S6225797A
Authority
JP
Japan
Prior art keywords
vowel
recognition
reliability
stationary point
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60165119A
Other languages
English (en)
Inventor
紀代 原
喜一 長谷川
入路 友明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60165119A priority Critical patent/JPS6225797A/ja
Publication of JPS6225797A publication Critical patent/JPS6225797A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置の改良に関し、特に認識率の向上
に関する。
従来の技術 音声認識技術はワードプロセッサや計算機への入力等マ
ン・マシンインターフェイスとして実用化が期待されて
いる分野である。
音声認識装置には、人力音声を認識する単位として単音
節(CV% cは子音、■は母音を表わす)を用いるも
の、cvおよびvcvを用いるもの、音素(CおよびV
)を用いるもの等が考えられる。また、使用者があらか
じめ+M’E、!−なる音声を発声、登録してから認識
処理をはじめる登録型と、たくさんの発声データをもと
に統計処理を施し普遍的なパターンを準備しておき使用
者の登録を必要としない不特定型がある。また特徴抽出
の方法としては線形予測分析やフィルタバンクを用いた
ものが主流となっている。ここでは従来例、実施例とと
もに認識単位としてcvおよびvcv、特徴抽出法とし
て線形予測分析を用いた不特定型音声認識装置について
説明する。以下図面を用いて、従来の音声認識装置の一
例を説明する。
第3図は不特定型音声認識装置の構成を示すブロック図
である。音声入力端21から入力された音声は特徴抽出
部22に於て、窓長20m5ec、フレームシフト5 
m5ec15次の自己相関法を用いた線形予測分析がな
されて、15個のケプストラム係数および残差パワーの
計16個のパラメータの組たして出力される。(線形予
測分析については、マーケル・グレイ著鈴木久喜訳:音
声の線形予測1980年コロナ社参照)。次に無音検出
部23に於て、残差パワーを利用して語頭・語尾および
語中の無音部が決定される。母音認識部24においては
、あらかじめたくさんの発声データを統計処理して得ら
れた母音識別関数(安田三部著社会統計学、2章7節参
照、1969年丸善)の係数を格納した識別関数記憶部
25より係数を読み込み、無音検出部23において検出
された無音部以外の部分について、各フレーム毎母音認
識を行なう。26は定常点検出部で母音認識部24で得
られた各フレーム毎の母音認識結果より支点なものを取
りだして母音定常点列として出力する。27は音韻認識
部であらかじめ作成された標準パターン記憶部28から
標準パターンを読みだし入カバターンとDPマツチング
を行ない、その結果距離が最小となる標準パターンを認
識音曲列として出力する。29は単語認識部で9で得ら
れた音韻認識結果と記号列表記されて記憶されている単
語辞130との内容を比較し最終的な単語としてのLを
、識結果を認識結果出力端12に得る。
(例えば、三船他:電子通信学会、PRL83−40、
この論文は、特徴抽出手段として線形予測分析ではなく
フィルタバンクを、母音定常点検出手段として各フレー
ムの母音認識結果を用いるかわりに各フレーム間の分散
を用いたものであるが、従来例の一例としてあげる事が
できる。) 発明が解決しようとする問題点 この様な従来の音声認識装置では定常点における母音認
識結果が最終的な認識率に影響を与えてしまうという問
題点がある。言いかえれば、母音の誤認識は復旧される
事がない、そこで母音認識率を向上さ=Cる為に母音認
識結果の第1候補、第2候補をともに用いる事が考えら
れるが、これでは処理量が倍増してしまうという問題点
がある。
問題点を解決するための手段 本発明は上記問題点を解消するためなされたもので、定
常点の母音第1候補に対し信頼度を定義し、(8頼度の
低いときのみ母音第1候補、第2候補をあわせて用いる
事により、処理量を大幅に増加させる事なく認識率の向
上を計ることを目的としたものである。
作用 本手段の作用は次のようになる。すなわち母音定常点に
おける母音認識結果の第1候補に対し何らかの形で信頼
度を定義し、信頼度の低いときのみ第2候補以下をあわ
せて用いる事により、すべての定常点に対して母音第1
候補および第2候補を用いた場合に比べて少ない処理量
で同程度の効果をあげる事が可能となる。
実施例 以下、本発明の一実施例について説明する。第1図は本
発明の一実施例について示したブロック図である。音声
入力端1から入力された音声は特徴抽出部2に於て、窓
長20m5ec、フレームシフト5 m5ec、15次
の自己相関法を用いて線形予測分析され、15次のケプ
ストラム係数および残差パワーの計16個のパラメータ
の組として出力される。次に無音検出部3において、残
差パワーを利用して語頭・語尾および語中の無音部が決
定される。母音認識部4においては、あらかじめたくさ
んの発声データを統計処理して得られた識別関数の係数
を格納した識別関数記憶部5より係数を読み込み、無音
検出部3において検出された無音部以外の部分について
、各フレーム毎母音認識を行なう。6は定常点検出部で
母音認識部4で得られた各フレーム毎の母音認識結果列
より安定なものを取り出して定常点列として出力する。
7は母音信頼度検討部で、定常点検出部で得られた各定
常点の母音認識結果の信頼度を定義し、信頼度が低いと
きのみその定常点に対して母音第1候補と第2候補の2
つの結果を採用する事とする。母音信頼度検討部7にお
ける詳細なアルゴリズムと母音信頼度検討部7aと平均
母音重心記憶部7bについては後に説明する。8は音韻
認識部であらかじめ作成された標(1!パタ一ン記憶部
8から標準パターンを読みだし入カバターンとDPマ、
チングを行ないその結果距離が最小となる標準パターン
の音韻を認識結果音韻列として出力する。10は単語認
識部で7で得られた音韻認識結果と記号列表記されて記
憶されている単語辞書11との内容を比較して最終曲な
単語としての認識結果を認識結果出力端12に得る。
次に母音信頼度検討部7におけるアルゴリズムについて
詳細に説明する。まず信頼度を計算するためのリファレ
ンスとして、母音識別関数を作成したときに用いたあら
かじめ準備されたたくさんの母音発声データから、各母
音毎の平均値−平均母音重心を求める。数式で表現すれ
ば、仮にaの発声データの集団をU、、その元をuni
とするし、Ulの元の個数をn、とすると、aの平均母
音重心8つは、 ただし、ga 、us ともに15次のケプストラム係
数からなるベクトルである。平均母音重心記憶部7bは
上記の式で求められた各母音毎の平均母音重心ga、g
8、gu、g、、go、g8を格納しである。今、ある
定常点Sにおける母音認識結果の第1候補がVl、第2
候補がV2と仮定すると、母音信頼度検討部において、
平均母音重心との距離d v +、dv2、を次の式で
求める。
dv+= l S  gv+ l−Σ (S、  g 
Vl+ +) ”dvz−l S  gvz l−Σ 
(S、  gvz、;)z即ちこれは定常点Sにおける
特徴パラメータ列と平均母音重心とのユークリッド距離
である。信頼度rをdVl、dv□を用いて r =d vz/ d v+ と定義し、r〉2のときは、定常点Sにおける母音認識
結果第1候補の信頼度が高いと判断して、第1候補v1
だけを採用し、r−≦−2のときは信頼度が低いと判断
してV、 、V、ともに採用する。
以上の様に、母音認識結果に対して何らかの形で信頼度
を定義し、信頼度の低いときのみ母音第1候補、第2候
補の2つの候補を利用する事により、処理量を大幅に増
加させる事なく認識率の向上を計る事ができる。
実施例では、リファレンスとして平均母音重心を、距離
としてニークリット距離を、信頼度として距離の比をま
た信頼度の閾値として2を用いているが、これは本発明
を何ら制限するものではない。
発明の効果 以上のように本発明によると、母音認識結果の信頼度を
定義して、信頼度の低いときのみ母音第1、第2の両候
補を用いる事により、信頼度を用いずにすべての定常点
について母音第1、第2候補を採用した場合に比べより
少ない処理量で同様の効果(認識率の向上)を計る事が
できる。
【図面の簡単な説明】
第1図は本発明の一実施例の音声認識装置のブロック図
、第2図は従来例の音声認識装置のブロック図である。 1・・・・・・特徴抽出部、3・・・・・・無音部検出
部、4・・・・・・母音認識部、5・・・・・・識別関
数記憶部、6・・・・・・定常点検出部、7・・・・・
・母音信頼度検討部、8・・・・・・音韻認識部、9・
・・・・・標準パターン記憶部、10・・・・・・単語
認識部、11・・・・・・単語辞書記憶部。

Claims (1)

    【特許請求の範囲】
  1. 音声入力手段、前記音声入力手段から入力された音声に
    対し一定時間毎に特徴抽出を行ない特徴パラメータ列を
    抽出する特徴抽出手段、前記特徴パラメータ列に対し母
    音認識を行なう母音認識手段、前記母音認識結果から安
    定部を検出して母音定常点列として出力する定常点検出
    手段、認識すべき各音韻に対してあらかじめ準備されて
    いる標準パターンを格納しておく標準パターン格納手段
    、前記特徴パラメータ列と前記標準パターンの各々を比
    較して前記特徴パラメータ列を音韻系列に変換する音韻
    認識手段を有し、前記定常点検出手段に於て検出された
    母音定常点の母音第1候補に対し信頼度を定義し、信頼
    度が低いときには母音第2候補もともに利用することを
    特徴とした音声認識装置。
JP60165119A 1985-07-26 1985-07-26 音声認識装置 Pending JPS6225797A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60165119A JPS6225797A (ja) 1985-07-26 1985-07-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60165119A JPS6225797A (ja) 1985-07-26 1985-07-26 音声認識装置

Publications (1)

Publication Number Publication Date
JPS6225797A true JPS6225797A (ja) 1987-02-03

Family

ID=15806274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60165119A Pending JPS6225797A (ja) 1985-07-26 1985-07-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6225797A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010286702A (ja) * 2009-06-12 2010-12-24 Nec Corp 話者照合装置、話者照合方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010286702A (ja) * 2009-06-12 2010-12-24 Nec Corp 話者照合装置、話者照合方法およびプログラム

Similar Documents

Publication Publication Date Title
Gaikwad et al. A review on speech recognition technique
CN111429921B (zh) 声纹识别方法、系统、移动终端及存储介质
JP3444108B2 (ja) 音声認識装置
JPS6138479B2 (ja)
CN114999447A (zh) 一种基于对抗生成网络的语音合成模型及训练方法
JPS6225797A (ja) 音声認識装置
JPS58108590A (ja) 音声認識装置
JP2813209B2 (ja) 大語彙音声認識装置
JPS6225796A (ja) 音声認識装置
JPS63161499A (ja) 音声認識装置
JPS60164800A (ja) 音声認識装置
JP3115016B2 (ja) 音声認識方法および装置
JPS6355599A (ja) 音声認識装置
CN114203159A (zh) 语音情感识别方法、终端设备及计算机可读存储介质
JPH0731508B2 (ja) 音声認識応答装置
JPS61249099A (ja) 音声認識装置
Bronson Syntactic pattern recognition of discrete utterances
JPS6355600A (ja) 音声認識装置
JPS63254497A (ja) パタ−ン認識装置
Rachman et al. Improving Phoneme to Viseme Mapping for Indonesian Language
JPS60147797A (ja) 音声認識装置
JPS6120998A (ja) 音声認識装置
JPS58195895A (ja) 単語音声認識装置
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
Ariki et al. Continuous speech understanding by keyword extraction in a voice mail system.