JPH0195373A - パタン尤度計算方式 - Google Patents

パタン尤度計算方式

Info

Publication number
JPH0195373A
JPH0195373A JP62254116A JP25411687A JPH0195373A JP H0195373 A JPH0195373 A JP H0195373A JP 62254116 A JP62254116 A JP 62254116A JP 25411687 A JP25411687 A JP 25411687A JP H0195373 A JPH0195373 A JP H0195373A
Authority
JP
Japan
Prior art keywords
likelihood
pattern
interval
series
time division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62254116A
Other languages
English (en)
Other versions
JP2951661B2 (ja
Inventor
Yoshiharu Abe
芳春 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP62254116A priority Critical patent/JP2951661B2/ja
Publication of JPH0195373A publication Critical patent/JPH0195373A/ja
Application granted granted Critical
Publication of JP2951661B2 publication Critical patent/JP2951661B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • Y02E60/122

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声パタンで代表される時系列パタンと、こ
の時系列パタンの部分時間区間のベクトルの標準的な分
布を規定するパラメータの系列からなる型版とを比較し
て、この型版に対する前記時系列パタンの尤度(尤もら
しさの度合い)を計算する装置に関する。
〔従来の技術〕
入力パタンと、基準となるパタンを規定する型版との比
較に基づく音声認識システムでは、与えられた型版に対
する入力パタンの尤度計算が重要である。音声パタンの
ように時間軸の非線型な伸縮を含む時系列パタンの、基
準の型板に対する尤度は、時間軸の正規化能力を有する
動的計画法に基づく光度計算装置によって求められる。
動的計画法の時間正規化能力は動的計画法の状態経路に
対する傾斜制限によって規定される。
引用文献(電子通信学会論文誌(A)、第69−A巻、
第2号、pp261−270)は、従来からよく用いら
れている172〜2の時間軸に対する−様な傾斜制限に
おける問題点として、係る方法では音声パタンの定常部
と過渡部における時間軸の伸縮の度合いの違いを扱うに
は不十分である事を挙げ、きめ細かい傾斜制限を行う方
法について述べている。
その方法は、入力パタンを3個の区間に分割する時の各
分割区間に対する自己相関係数ベクトルの平均値の系列
と、各分割区間の区間長の許容最小値と許容最大値の系
列を含む型版を与え、この型版に対する入力パタンの尤
度は、各分割区間の区間長の許容範囲の中で人力パタン
を3個の区間に分割するときの各分割区間での型版に含
まれる自己相関係数の平均ベクトルとその区間内のベク
トルとから計算される尤度を3個の分割区間について加
算して得られるパタンの尤度の中で各分割区間の区間長
の許容範囲の中で分割方法を変化させる時の最大のパタ
ンの尤度で与えている。(この計算は動的計画法を用い
れば効率的に行える。)係る方法で、入力パタンが分割
区間の長さの違いが主たる弁別要因である単語9例えば
、10okti/(大きい)と10ki/ (沖)のよ
うに母音部に対応する分割区間の区間長の違いで対立す
る単語を上記のパタン尤度の比較によって識別できるた
めには、例えば、10/に対する分割区間長と10o/
に対する分割区間長の違いを型版に含まれる分割区間の
区間長の許容値の違いとして表す必要がある。
しかし、実際には音声速度によって両者の許容範囲が重
なる事がある。
第5図は両者の区間長の頻度分布を模型的に示している
が、もし、区間長の許容範囲を分布の上限と下限に選ぶ
(即ち、10/に対してはtlとt 2.10o/に対
してはT1とT2とする)と、区間長がT1とt2の範
囲にある時、この分割区間が10/であるか10o/で
あるかパタン尤度から識別する事は困難である。また、
もし、10/の区間長の上限及び10o/の区間長の下
限を分布の交点t。
に選べば、toを超える10/の区間長、または、tQ
を下回る10o/の区間長に対しては正しく整合が行わ
れずパタン尤度が誤って減少する。
〔発明が解決しようとする問題点〕
従来の入力パタンの尤度の計算は、以上説明したように
区間長の分布範囲を制限して、行うていたので、区間長
の大きな変動を許容することが難しいという問題点があ
った。
この発明は上記問題点を解決するためになされたもので
、分割区間の区間長の違いで対立する時系列パタン間の
識別を容易にし、また、区間長の大きな変動による誤整
合を改善することを目的としている。
〔問題点を解決するための手段〕
この発明に係るパタン尤度計算方式は、型版に各時間分
割区間のベクトルの分布パラメータの系列の他に各時間
分割区間の区間長の分布パラメータの系列を含ませ、パ
タンの先度の計算は入力パタンの時間分割区間のベクト
ルの分布パラメータの型版に含まれるベクトルの分布パ
ラメータの系列との間の尤度と、入力パタンの時間分割
区間の区間長の分布パラメータの系列と型版に含まれる
時間分割区間の区間長の分布パラメータの系列との間の
尤度との和を用いて計算することを特徴としている。
〔作用〕
入力パタンに対して尤度を比較する型版は各時間分割区
間におけるベクトルの標準的な分布を規定するパラメー
タの系列の他に各時間分割区間の区間長の分布パラメー
タの系列を含んでいる。
ここで尤度を計算する場合には、各時間分割区間のベク
トルの分布を規定するパラメータの系列の尤度と各時間
分割区間の区間長の分布を規定するパラメータの系列の
尤度との和を用いて行う。
〔実施例〕
以下この発明の一実施例を図について説明する。
第1図はこの発明の一実施例を示す機能ブロック図であ
る。
図において、1は音声等の時系列パタンからなる入力パ
タンを記憶する入力パタン記憶部、2は入力パタンに対
する尤度を計算するために標準的な分布を規定したパラ
メータの系列からなる型版を記憶する型版記憶部、3は
累積尤度を記憶する累積尤度記憶部、4は尤度を計算す
る数値演算部である。
ここにおいて、型版記憶部2は入力パタンの各時間分割
区間における区間長の分布パラメータの系列を記憶する
区間長系列記憶部21と、各時間分割区間におけるベク
トルの分布パラメータの系列を記憶する分布パラメータ
系列記憶部22とを含んでいる。
第2図は入力パタン記憶部1に格納されている入力パタ
ンの記憶構成を示す図で、図のように、入力パタンは1
個のフレームから構成され、さらに、各フレームは15
次元のケプストラム係数c (i、m)  (iはフレ
ーム番号2mは次数)からなる。また、第3図は型版記
憶部2に格納されている型版の記憶構成を示す図で、図
のように、型版は5個の分割区間に対応する5個の記憶
領域から構成され、各記憶領域には、入力パタンの各分
割区間におけるベクトル(この場合各フレームに°おけ
る15次元のケプストラム係数を一つρベクトルと考え
る)の分布パラメータとして15次元の平均ケプストラ
ム係数a(j、m)  (jは分割区間の番号1mは次
数)が、また、分割区間の区間長の分布パラメータとし
て区間長の平均μ[j)及び分散σ2(j)が格納され
ている。更に、第4図は累積尤度記憶部3に格納される
累積尤度の記憶構成を示す図で、図のように、累積尤度
は全体で(I + 1) X(Jl1)の大きさを持つ
配列で、この配列の要素は、ベクトル尤度の累積和LS
(1+j)+及び、区間長尤度の累積和Lt(i、j)
からなる。(但し、1≦i≦I jl及びl≦j≦J+
1) 型版記憶部2に格納されている型版に対する入力パタン
記憶部1に格納されている入力パタンの尤度の計算は数
値演算部4によって次のように行われる。即ち、数値演
算部4は次の第(1)式で定義されるパタン尤度Sを動
的計画法に基づき計算する。
Σ Is(ν(j)、ν(j”1)IJ)S’= wa
x [□ (ν(j) )       J Σ It(ν(j)、ν(jl1)、j)J為1 +                    ]   
 Tllここで、ν(Jlは第j分割区間の開始端フレ
ーム番号(従って、第j分割区間の終了端はν(jl1
)−1で与えられる)で、 1ヨシ(1)<ν(2)<ν(3)<・−・くν(J)
<ν(Jl1)=1+1を満たすものとする。又、第(
1)式の第1項の中のIs(ν(」)、νU+ILj)
は第j分割区間の中のベクトルc(i、m)(ν(jl
≦iくν(jl1))とこの区間のベクトルの分布パラ
メータである平均ケプストラム係数a(j、m)に基づ
き第(3)式のように計算される第j区間のベクトル光
度である。
is(ν(j)、ν(jl1)+D =  −max       Σ l c(i、m)−
a(j、m) l ”1!1 ν01≦i〈ν(j + 1 )          
   (3)更に、第(1)式の第2項の中のIt(ν
(j)、ν(jl1)。
j)は第j分割区間の中の区間長ν(jl1)−ν(J
lとこの区間の区間長の分布パラメータである区間長の
平均μ(J)及び分散σ2(J)とに基づいて第(4)
式のように計算される第j分割区間の中の区間長尤度で
ある。
It(ν(J)、ν(jl1)、j) 1ν(jl1)−νU)−μ(jl 1 ”=−□・−
t(4) σ2(j) (れは区間長尤度に対する重み係数である。)上記第+
11式は区間分割の方法(即ち、(νU)))に関する
最大化を含む。そこで、数値演算部4は、第+1)式を
動的計画法に基づく次の漸化式漸化式 %式%) )] Ls (i+ j)=Ls (i−τo+J−1)+1
s(i−τo + 1 + J )    (61Lt
(i、j)=Lt(i−τo、j−1)+1t(i−τ
o * 1 + J )    (71(2≦i≦ 1
+1.2≦jsJ+1)  −を次の初期条件のもとて 初期条件 Ls(1,j)=Lt(1,3)=O(1≦j 5J+
1)    (8)Ls(i、1)=Lt(i、1)=
 oo(2≦i≦1 + 1 )    (91解き、
パタン尤度Sを Ls(1+1.J+1)   Lt(I+1.J+1)
S・□+□    αω J             J と置くことによって効率的に求める。
材目梓 以上のように、この装置は入力パタン記憶部1に格納さ
れた入力パタンの、型版記憶部2に格納された型版に対
する尤度を、数値演算部4が累積尤度記憶部3に漸化式
の計算の途中の結果を残しながら最終的に第αΦ式のよ
うにパタン尤度を計算するものである。
ところで、第OI式の第2項は各分割区間の区間長の光
度を平均したものであるため、本装置を10ki/(沖
)と10oki i八人きい)のようなセグメント長の
違いが主たる弁別要因である単語の識別のため利用する
ことによって両者の分割区間の区間長の分布に重なりが
あっても判別が可能となるし、区間長の大きな変動があ
っても誤整合を起こりにくくすることができる。
以上の説明では、本発明に係るパタン尤度計算装置を音
声認識システムのパタン尤度計算部に用いる場合につい
て説明したが、本装置は他の音声パタンと型版の整合を
利用する装置2例えば、音声データの自動ラベル付は装
置等にも応用することができる。
〔発明の効果〕
以上のように、本発明では、ベクトルの時系列パタンに
対し、各時間分割区間の中のベクトルの分布を規定する
パラメータの系列と各分割区間の区間長の分布を規定す
るパラメータの系列とを含む型版を用いて、各分割区間
の中のベクトルと型版に含まれるベクトルの分布を規定
するパラメータとに基づき計算される尤度に、各分割区
間の区間長と型版に含まれる分割区間の区間長の分布パ
ラメータとに基づいて計算される尤度の和をパタン尤度
として計算するため、分割区間の区間長の違いで対立す
る時系列パタン間の識別を容易にし、また、区間長の大
きな変動による誤整合を改善できるという利点がある。
【図面の簡単な説明】
第1図は本発明の一実施例の機能ブロック図、第2図は
入力パタン記憶部の記憶構成図、第3図は型版記憶部の
記憶構成図、第4図は累積尤度記憶部の記憶構成図、第
5図は従来のパタンの尤度を計算する方式の説明図であ
る。 図において、1は入力パタン記憶部、2は型版記憶部、
3は累積尤度記憶部、4は数値演算部、21は区間長系
列記憶部、22は分布パラメータ系列記憶部である。 なお、図中、同一あるいは相当部分には同一の符号を付
して示している。 代理人  大  岩  増  雄(ほか2名)第1凶 易40 i −l       i−2i−3i−1++3: 
 屋釆【七ノえ書己tt部             
    ≦ト第50 tlT、to【2T2 区間長 −−→ 1、事件の表示   特願昭62−254116号2、
発明の名称 パタン尤度計算方式 3、補正をする者 事件との関係 特許出願人 住 所    東京都千代田区丸の内二丁目2番3号。 名 称  (601)三菱電機株式会社代表者志岐守哉 4、代理人 住 所    東京都千代田区丸の内二丁目2番3号ミ 住 ノ 5、補正の対象 特許請求の範囲、発明の詳細な説明の欄。 6、補正の内容 (1)特許請求の範囲を別紙のとおり補正する。 (2)明細書第5頁第13行目乃至第14行目。 第15行目、第17行目乃至第18行目、第20行目、
第6頁第9行目、第11行目、第19行目。 第7頁第4行目乃至第5行目、第6行目乃至第7行目、
「の系列」とあるのを削除する。 (3)同書第5頁第16行目乃至第17行目「ベクトル
の分布パラメータの型版に」とあるのを「ベクトルと型
版に」と補正する。 (4)同書第5頁第19行目「の分布パラメータの系列
」とあるのを削除する。 以上 2、特許請求の範囲 ベクトルの時系列パタンを各区間毎に分割し、分割した
各時間分割区間のベクトルと、各時間分割区間における
標準的なベクトルの  R’tJ−9+規定した型版と
を比較してパタンの尤度を計算するパタン尤度計算装置
において、 前記型版は前記各時間分割区間のベクトルの公布ぺ立り
二叉反だ各時間分割区間の区間長の公布パラメータを含
み、前記パタンの尤度は、前記時間分割区間の中のベク
トルと前記型版に含まれるベクトルの\布パラメータと
の間の尤度と、前記時間分割区間の区肌1点前記型版に
倉l起ゑ!皿!■区間長の  パラメータとの間の尤度
との和を用いて計算することを特徴とするパタン尤度計
算方式。

Claims (1)

  1. 【特許請求の範囲】 ベクトルの時系列パタンを各区間毎に分割し、分割した
    各時間分割区間のベクトルの分布パラメータの系列と、
    各時間分割区間における標準的なベクトルの分布パラメ
    ータの系列を規定した型版とを比較してパタンの尤度を
    計算するパタン尤度計算装置において、 前記型版は前記各時間分割区間のベクトルの分布パラメ
    ータの系列及び各時間分割区間の区間長の分布パラメー
    タの系列を含み、前記パタンの尤度は、前記時間分割区
    間の中のベクトルの分布パラメータの系列と前記型版に
    含まれるベクトルの分布パラメータの系列との間の尤度
    と、前記時間分割区間の区間長の分布パラメータの系列
    と前記型版に含まれる各時間分割区間の区間長の分布パ
    ラメータの系列との間の尤度との和を用いて計算するこ
    とを特徴とするパタン尤度計算方式。
JP62254116A 1987-10-08 1987-10-08 パタン尤度計算方式 Expired - Lifetime JP2951661B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62254116A JP2951661B2 (ja) 1987-10-08 1987-10-08 パタン尤度計算方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62254116A JP2951661B2 (ja) 1987-10-08 1987-10-08 パタン尤度計算方式

Publications (2)

Publication Number Publication Date
JPH0195373A true JPH0195373A (ja) 1989-04-13
JP2951661B2 JP2951661B2 (ja) 1999-09-20

Family

ID=17260444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62254116A Expired - Lifetime JP2951661B2 (ja) 1987-10-08 1987-10-08 パタン尤度計算方式

Country Status (1)

Country Link
JP (1) JP2951661B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145421A (zh) * 2018-08-08 2019-01-04 中南大学 一种应用于分布参数系统的时空模糊建模方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60129798A (ja) * 1983-12-16 1985-07-11 沖電気工業株式会社 音声認識方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60129798A (ja) * 1983-12-16 1985-07-11 沖電気工業株式会社 音声認識方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145421A (zh) * 2018-08-08 2019-01-04 中南大学 一种应用于分布参数系统的时空模糊建模方法
CN109145421B (zh) * 2018-08-08 2020-04-21 中南大学 一种应用于分布参数系统的时空模糊建模方法

Also Published As

Publication number Publication date
JP2951661B2 (ja) 1999-09-20

Similar Documents

Publication Publication Date Title
EP0706171A1 (en) Speech recognition method and apparatus
US4829575A (en) Apparatus and methods for analyzing transitions in finite state machines
CN110738163A (zh) 一种矿井人员违规动作识别系统
JPS61219099A (ja) 音声認識装置
JPH0195373A (ja) パタン尤度計算方式
JP2964881B2 (ja) 音声認識装置
EP0215573B1 (en) Apparatus and methods for speech recognition
US20060143005A1 (en) Method and apparatus for determining the possibility of pattern recognition of time series signal
GB2179483A (en) Speech recognition
JPS59161782A (ja) パタ−ン・マツチング方法
JPS62162182A (ja) 手書き画入力装置の屈曲点抽出方式
KR100282555B1 (ko) 음성 인식 속도 향상을 위한 동적 시간 와핑 방법
CN112883829A (zh) 一种行人重识别的方法及设备
CN113535976A (zh) 一种路径的向量化表征方法、装置、计算设备及存储介质
JPS6283798A (ja) 連続音声認識装置
JPH0449954B2 (ja)
JPS5972498A (ja) パタ−ン比較装置
JPH0363080B2 (ja)
JPS63291100A (ja) 音声認識の方法
JPS60179799A (ja) 音声認識装置
JPH04151700A (ja) パターンマッチング制御回路
JPH03253900A (ja) 音声認識装置
JPS61200596A (ja) 連続音声認識装置
JPS60201395A (ja) 音声認識方法
JPS6344240B2 (ja)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070709

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 9