JPH0635494A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0635494A
JPH0635494A JP4189049A JP18904992A JPH0635494A JP H0635494 A JPH0635494 A JP H0635494A JP 4189049 A JP4189049 A JP 4189049A JP 18904992 A JP18904992 A JP 18904992A JP H0635494 A JPH0635494 A JP H0635494A
Authority
JP
Japan
Prior art keywords
feature vector
pattern
vector sequence
vowel
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4189049A
Other languages
English (en)
Inventor
Hirohiko Okamura
裕彦 岡村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4189049A priority Critical patent/JPH0635494A/ja
Publication of JPH0635494A publication Critical patent/JPH0635494A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】テンプレートマッチング法を用いた音声認識装
置において、同一母音系列をもつ単語の認識性能を向上
させる。 【構成】音声分析部11とピッチ検出部12と母音パタ
ーン圧縮部13と標準パターンメモリ14とパターン比
較部15とを備え、入力された音声の母音部を検出し、
母音部のパターンを予め設定されたピッチ数分のみを残
し残りは削除して圧縮特徴ベクトル系列を得て、パター
ン比較に用いることにより、パターン間距離の母音部の
貢献度を下げ子音部の貢献度を上げて、同一母音系列を
もつ単語の認識性能を向上できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声を認識してその結果
を文字列として出力する音声認識装置に関する。
【0002】
【従来の技術】従来の音声認識装置は、図4に示すよう
に、入力された音声を分析して特徴ベクトル系列を出力
する音声分析部31と、認識すべき各単語について予め
音声分析部31が出力する特徴ベクトル系列を標準パタ
ーンとして記憶させてある標準パターンメモリ32と、
音声分析部31が出力する特徴ベクトル系列を入力パタ
ーンとし標準パターンメモリ32に記憶されている各単
語の標準パターンと比較し、類似度が最高値を示した単
語を認識結果として外部に出力するパターン比較部33
とを有している。
【0003】単語は2個以上の単音節で構成され、各単
音節は一般に(子音部+母音部)で構成されている。母
音部は、信号レベルが高い上に継続時間が長く、しかも
信号源が声帯であるための周期性を持ち、冗長度の多い
信号である。これに対して子音部は、その生成が唇によ
る摩擦音や破裂音であるため、信号レベルが低い上に継
続時間が短く、しかもノイジーな信号であるため冗長度
は極めて少ない。また、日本語の母音は約5種と、子音
の約15種類に比べ少ない。
【0004】従来の音声認識装置のパターン比較部33
では、入力パターンと標準パターンとを単純に比較して
おり、パターン間の距離値(類似度の逆数)は、継続時
間の長い母音部で決定され、継続時間が短い子音部のパ
ターン間の距離値への貢献度は極めて小さい。
【0005】
【発明が解決しようとする課題】この従来の音声認識装
置では、パターン間の距離値が継続時間の長い母音部で
決定され、継続時間が短い子音部の貢献度が極めて小さ
いため、母音系列が同じ単語同士間での認識性能が低い
という問題点がある。
【0006】
【課題を解決するための手段】本発明の第1の発明の音
声認識装置は、入力された音声を分析して特徴ベクトル
系列を出力する音声分析部と、入力された音声の母音区
間及びピッチ周期を検出し両者を表わすデータを出力す
るピッチ検出部と、前記特徴ベクトル系列のうち、前記
母音区間及びピッチ周期のデータに応じて各母音区間の
先頭から予め設定されたピッチ周期分のみを残し、残り
の区間を除去して圧縮特徴ベクトル系列を出力する母音
部パターン圧縮部と、予め前記音声分析部と前記ピッチ
検出部と母音部パターン圧縮部とを使用し認識すべき各
単語について作成した前記圧縮特徴ベクトル系列を標準
パターンとして記憶しておく標準パターンメモリと、前
記圧縮特徴ベクトル系列を入力パターンとして前記標準
パターンとのパターン比較を行い、類似度が最大値を示
した単語を表わすデータを外部に認識結果として出力す
るパターン比較部とを備えている。
【0007】第2の発明の音声認識装置は、入力された
音声を分析し特徴ベクトル系列を出力する音声分析部
と、前記特徴ベクトル系列の各要素毎の差分値を求め、
その差分値の絶対値が予め設定されたしきい値を越えた
か否かを表わす差分特徴ベクトル系列を出力する特徴ベ
クトル差分演算部と、認識すべき各々の単語について予
め前記音声分析部が出力した特徴ベクトル系列を標準パ
ターンとして記憶する標準パターンメモリと、認識すべ
き各単語について予め前記特徴ベクトル差分演算部にて
求めた差分特徴ベクトル系列を差分標準パターンとして
記憶する差分標準パターンメモリと、前記特徴ベクトル
系列を第1の入力パターンとし、前記差分特徴ベクトル
系列を第2の入力パターンとして、前記標準パターン及
び前記差分標準パターンとのパターン比較を行い、最小
距離値を与えた単語を表わすデータを認識結果として外
部に出力するパターン比較部とを備えている。
【0008】
【実施例】次に本発明について図面を参照して説明す
る。
【0009】図1は本発明の第1の発明の一実施例のブ
ロック図である。同図において、参照符号11は音声分
析部、12はピッチ検出部、13は母音部パターン圧縮
部、14は標準パターンメモリ、15はパターン比較部
をそれぞれ示す。
【0010】音声分析部11は、入力された音声区間の
音声信号を分析し、特徴ベクトル系列X=(x1
2 ,…xJ )を出力する。ピッチ検出部12は、入力
された音声区間の母音区間の時刻データ(t1s,t1e
2s,t2e,………tvs,tve)と各母音区間のピッチ
周期(p1 ,p2 ,…pv )とを出力する。例えば、時
刻(t1s,t1e)は入力された音声の先頭の母音区間を
示し、ピッチ周期p1 は、時刻(t1s,t1e)の区間の
母音部のピッチ周期を示し、また時刻(t1s,t1e)間
の時間はp1 の整数倍である。以下、時刻データ
(t2s,t2e…)及びピッチ周期(p2 ,…)について
も上記のような関係が成立つ。vは入力された音声の母
音区間数を示す。
【0011】母音部パターン圧縮部13は、音声分析部
11が出力する特徴ベクトル系列Xのうち、ピッチ検出
部12が出力する時刻データ(t1s,t1e,t2s
2e,………tvs,tve)とピッチ周期(p1 ,p2
…pv )とに応じて、母音区間の特徴ベクトルを予め外
部から設定されたピッチ周期分のみを残し、残りの区間
を除去して圧縮特徴ベクトル系列Y=(y1 ,y2
…,yJ )を出力する。Jは圧縮特徴ベクトル系列のフ
レーム数を示す。
【0012】図2は本実施例での特徴ベクトル系列を例
示するタイムチャートであり、母音区間数(v=3)
で、母音区間の時刻データは(t1s,t1e,t2s
2e,t3s,t3e)、ピッチ周期は(p1 ,p2
3 )である。また予め外部から設定されたピッチ周期
数をNとすると、時刻(t1s,t1e)区間の母音部の特
徴ベクトル系列(xt1s ,…xt1e )の先頭からNピッ
チ周期分の特徴ベクトル系列(xt1s ,…xt1)(図2
のV11に相当する部分)のみを残し、残りの区間(V12
に相当する部分)を除去する。時刻t1 はt1sに(N×
1 )を加えた時刻である。以下同じように、特徴ベク
トル系列(xt2s ,…xt2)及び(xt3s ,…xt3)を
取り出し、これに子音部の特徴ベクトル系列(図2のC
1 ,C2 ,C3 に相当する部分)を加え、圧縮特徴ベク
トル系列Y(図2のC1 ,V11,C2 ,V21,C3 ,V
32の部分を接続したパターン)を生成する。
【0013】パターン比較部15は母音部パターン圧縮
部13が出力する圧縮特徴ベクトルYを入力パターンと
して、標準パターンメモリ14に記憶されている各単語
の標準パターンBm とパターン比較を行い、類似度Sm
を単語毎に算出し、類似度Sm が最大値をとる単語番号
mを求め、類似度Sm が最大値を与えた単語番号mを認
識結果として外部に出力する。
【0014】図3は本発明の第2の発明の一実施例のブ
ロック図である。同図において、参照符号21は音声分
析部、22は特徴ベクトル系列に対する差分演算部、2
3は標準パターンメモリ、24は差分標準パターンメモ
リ、25はパターン比較部をそれぞれ示す。
【0015】音声分析部21は、入力された音声区間の
音声信号を分析し、特徴ベクトル系列X=(x1
2 ,…xJ )を出力する。差分演算部22は、音声分
析部21が出力する特徴ベクトル系列Xを入力しベクト
ル間の各要素毎の差分値を算出し、その差分値の絶対値
が予め外部から設定されたしきい値Thを越えたときに
1を、またしきい値Th以下のときは0を、差分特徴ベ
クトル系列ΔX=(Δx1,Δx2 ,…,ΔxJ )とし
て出力する。すなわち、 xi =(xi1,xi2,…,xiN)、Δxi =(Δxi1,Δxi2,…,ΔxiN) として、 |xip−xi-1,p |≦Thのとき、Δxip=0 |xip−xi-1,p |〉Thのとき、Δxip=1 ここで、Nは特徴ベクトルの要素数を示し、pは要素番
号を、またiはフレーム番号を示す。
【0016】差分特徴ベクトル系列Δxi は、冗長度が
多い母音部では0の値が連続し、冗長度が少い子音部で
は1の値が連続する。
【0017】標準パターンメモリ23は、認識すべき各
単語について予め音声分析部21で音声分析して与えら
れた特徴ベクトル系列を、標準パターンとして記憶して
おくためのメモリである。
【0018】差分標準パターンメモリ24は、認識すべ
き各単語について予め音声分析部21で音声分析して与
えられた特徴ベクトル系列を特徴ベクトル差分演算部2
2に入力して差分特徴ベクトル系列を求め、差分標準パ
ターンとして記憶しておくためのメモリである。
【0019】パターン比較部25は、音声分析部21が
出力する特徴ベクトル系列Xを第1の入力パターンと
し、差分演算部22が出力する差分特徴ベクトル系列Δ
Xを第2の入力パターンとして、標準パターンメモリ1
3に記憶されている標準パターンBm =(b1 m,b2 m
…bJ m)、差分標準パターンメモリ14に記憶されてい
る差分標準パターンΔBm =(Δb1 m,Δb2 m,…,Δ
J m)との間で、単語毎にパターン比較を行い最小距離
値を与えた単語番号mを外部に認識結果として出力す
る。
【0020】パターン比較は、一般に広く知られている
DPマッチング法(動的計画法)を用いて行う。すなわ
ち、第1及び第2の入力パターンのベクトルxi 及びΔ
iと、標準パターンのベクトルbj m及び差分標準パタ
ーンのベクトルΔbj mとのベクトル間距離値d(i,j) m
次式により算出する。
【0021】
【0022】第1及び第2の入力パターンの先頭からi
番目のフレームまでの部分パターン(x1 ,x2 ,…x
i )及び(Δx1 ,Δx2 ,…,Δxi )と、標準パタ
ーン及び差分標準パターンの先頭からj番目のフレーム
までの部分パターン(b1 m,b2 m,…bJ m)及び(Δb
1 m,Δb2 m,…,ΔbJ m)との距離値g(i,j) mを次式で
算出する。
【0023】
【0024】なお、初期条件は以下の通りとする。gm
(1,1)=2d(1,1) (i=j=1) 次に各単語毎の距離値は次式で算出する。Dm (A,B
m )=gm (I,J)/(I+Jm )ここで、Iは第1
及び第2の入力パターンのフレーム数、Jm は標準パタ
ーンと及び差分標準パターンのフレーム数である。
【0025】パターン比較部25は、認識すべき全ての
単語について距離値Dm (A,Bm)を算出し、D
m (A,Bm )の最小値を与えるmを求め、mを認識結
果とし外部に出力する。
【0026】
【発明の効果】以上説明したように本発明によれば、継
続時間が長く冗長な母音部によるパターン間の距離値
(類似度の逆数)への貢献度を下げ、継続時間が短く冗
長性が低い子音部の貢献度を相対的に上げることによ
り、母音系列が同じ単語同士間での認識性能を向上でき
る。
【図面の簡単な説明】
【図1】本発明の第1の発明の実施例のブロック図。
【図2】図1における圧縮特徴ベクトル系列を例示する
タイミング図。
【図3】本発明の第2の発明の実施例のブロック図。
【図4】従来装置のブロック図。
【符号の説明】
11,21,31 音声分析部 12 ピッチ検出部 13 母音部パターン圧縮部 14,23,32 標準パターンメモリ 15,25,33 パターン比較部 22 差分演算部 24 差分標準パターンメモリ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声を分析して特徴ベクトル
    系列を出力する音声分析部と、 入力された音声の母音区間及びピッチ周期を検出し両者
    を表わすデータを出力するピッチ検出部と、 前記特徴ベクトル系列のうち、前記母音区間及びピッチ
    周期のデータに応じて各母音区間の先頭から予め設定さ
    れたピッチ周期分のみを残し、残りの区間を除去して圧
    縮特徴ベクトル系列を出力する母音部パターン圧縮部
    と、 予め前記音声分析部と前記ピッチ検出部と母音部パター
    ン圧縮部とを使用し認識すべき各単語について作成した
    前記圧縮特徴ベクトル系列を標準パターンとして記憶し
    ておく標準パターンメモリと、 前記圧縮特徴ベクトル系列を入力パターンとして前記標
    準パターンとのパターン比較を行い、類似度が最大値を
    示した単語を表わすデータを外部に認識結果として出力
    するパターン比較部とを備えていることを特徴とする音
    声認識装置。
  2. 【請求項2】 入力された音声を分析し特徴ベクトル系
    列を出力する音声分析部と、 前記特徴ベクトル系列の各要素毎の差分値を求め、その
    差分値の絶対値が予め設定されたしきい値を越えたか否
    かを表わす差分特徴ベクトル系列を出力する特徴ベクト
    ル差分演算部と、 認識すべき各々の単語について予め前記音声分析部が出
    力した特徴ベクトル系列を標準パターンとして記憶する
    標準パターンメモリと、 認識すべき各単語について予め前記特徴ベクトル差分演
    算部にて求めた差分特徴ベクトル系列を差分標準パター
    ンとして記憶する差分標準パターンメモリと、 前記特徴ベクトル系列を第1の入力パターンとし、前記
    差分特徴ベクトル系列を第2の入力パターンとして、前
    記標準パターン及び前記差分標準パターンとのパターン
    比較を行い、最小距離値を与えた単語を表わすデータを
    認識結果として外部に出力するパターン比較部とを備え
    ていることを特徴とする音声認識装置。
JP4189049A 1992-07-16 1992-07-16 音声認識装置 Withdrawn JPH0635494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4189049A JPH0635494A (ja) 1992-07-16 1992-07-16 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4189049A JPH0635494A (ja) 1992-07-16 1992-07-16 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0635494A true JPH0635494A (ja) 1994-02-10

Family

ID=16234438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4189049A Withdrawn JPH0635494A (ja) 1992-07-16 1992-07-16 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0635494A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102482A (ja) * 2006-10-20 2008-05-01 Toshiba Tec Corp パターンマッチング装置及び方法
KR20180120340A (ko) * 2017-04-27 2018-11-06 정재효 아기 울음소리 분석시스템, 방법 및 프로그램

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102482A (ja) * 2006-10-20 2008-05-01 Toshiba Tec Corp パターンマッチング装置及び方法
JP2011022621A (ja) * 2006-10-20 2011-02-03 Toshiba Tec Corp パターンマッチング装置及び方法
KR20180120340A (ko) * 2017-04-27 2018-11-06 정재효 아기 울음소리 분석시스템, 방법 및 프로그램

Similar Documents

Publication Publication Date Title
JP2005043666A (ja) 音声認識装置
JP2006171750A (ja) 音声認識のための特徴ベクトル抽出方法
CN113112575B (zh) 一种口型生成方法、装置、计算机设备及存储介质
JP3311460B2 (ja) 音声認識装置
US6230126B1 (en) Word-spotting speech recognition device and system
JPH09325798A (ja) 音声認識装置
JPH0635494A (ja) 音声認識装置
JP2003044078A (ja) 発声速度正規化分析を用いた音声認識装置
JP3437064B2 (ja) 音声合成装置
JP2001005483A (ja) 単語音声認識方法及び単語音声認識装置
JP3299170B2 (ja) 音声登録認識装置
JP3503862B2 (ja) 音声認識方法及び音声認識プログラムを格納した記録媒体
JP2737122B2 (ja) 音声辞書作成装置
JPH1097270A (ja) 音声認識装置
JP2578771B2 (ja) 音声認識装置
JP2615649B2 (ja) 単語音声認識装置
JPH05303391A (ja) 音声認識装置
JP2766393B2 (ja) 音声認識方式
JPH01126694A (ja) 音声認識装置における音韻記号の付加方式
JPS6237797B2 (ja)
JPH05197397A (ja) 音声認識方法及びその装置
JPS60182499A (ja) 音声認識装置
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPH0552516B2 (ja)
JPH0719159B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991005