JPH07104680B2 - パタンマツチング装置 - Google Patents

パタンマツチング装置

Info

Publication number
JPH07104680B2
JPH07104680B2 JP59250806A JP25080684A JPH07104680B2 JP H07104680 B2 JPH07104680 B2 JP H07104680B2 JP 59250806 A JP59250806 A JP 59250806A JP 25080684 A JP25080684 A JP 25080684A JP H07104680 B2 JPH07104680 B2 JP H07104680B2
Authority
JP
Japan
Prior art keywords
section
input
template
matching
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP59250806A
Other languages
English (en)
Other versions
JPS61128391A (ja
Inventor
義照 三船
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59250806A priority Critical patent/JPH07104680B2/ja
Publication of JPS61128391A publication Critical patent/JPS61128391A/ja
Publication of JPH07104680B2 publication Critical patent/JPH07104680B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、2段D.P.(ダイナミックプログラミング)マ
ッチング法において、接合部分の最適化を数学的な解
(2段目D.P.マッチングによる最適解)のみに依存する
ことなしに、入力未知パタン系列の特徴部分によって接
合部を規制することによって最適化し、よりよい最適解
を得るパタンマッチング装置に関するもので、例えば音
声認識装置における入力音声と登録テンプレート(音節
or単語)との連続的なマッチングや、行入力の文字認識
装置における入力文字列と登録活字フォントとのマッチ
ングに使用する。
従来の技術 ここで従来の入力未知パタン系列をテンプレートの組み
合せ及び並びの系列として最適近似する2段マッチング
の数学的解法について説明する。
テンプレートをn(n=1,2,3,……,N−1,N)とし、 Dx-1(i0)を入力パタンのi0−1フレームまでをx−1
個からなるテンプレートの組み合わせた系列とのマッチ
ング計算による最適距離(最小距離)とし、 Nx-1(i0)を同上のx−1個からなる最適テンプレート
系列とし、 Bx-1(i0)を同上のx−1個からなる最適テンプレート
とのマッチングにおけるx−1番目のテンプレートの先
頭座標を表わしているとする。
上記のように変数を定義したとすると、入力未知パタン
のi軸までのテンプレート組み合せによる最適解は次の
軟化式で与えられる。
▲Dn 0▼はm+1からiフレームまでの入力未知パタン
とテンプレートnとの距離を示している。
上記に示したような2段DPマッチングの手法を用いた従
来のパタンマッチング装置では最適解を求める手順を簡
略化するものは存在したが(レベルヒルディング(L.
B.)法,クロック同期伝搬形D.P.法(CWDP法),一定時
間遅れ同期型D.P.法(CTDP法)およびテンプレート比例
型D.P.法(O(N)OP法)等が有る。)最適解そのもの
を、入力未知パタン系列の特徴によって規制して最適解
をより最適化する方法は存在しなかった。
発明が解決しようとする問題点 このような従来の2段マッチングの最適解のみに解を依
存したようなマッチング装置では、例えば音声入力の無
音区間や入力文字系列の白紙部分や、音声の母音区間や
子音区間のように定常性と非定常性が著しく分離されて
いる区間に対しても同様なテンプレート(音節,単語音
声テンプレート)のマッチングによる組み合せと並びに
対する最適化が行なわれていたために、無音区間や白紙
部分にもテンプレートマッチングを行ったり、やや定常
性のある子音区間(例えば有声子音区間)にも母音部テ
ンプレートをマッチングして最適解を求める等認識結果
に問題があり、実用化に供し得なかった。
問題点を解決するための手段 本発明は、上記問題点を解決するために、音声入力道パ
ンタン系列の中で、2段マッチングによる最適解よりも
信頼性が高い特徴部分を事前に検出するための入力パタ
ン系列特徴部検出部を備えている。前記特徴部検出部で
は、語中の無音区間、非定常性と電力のくぼみによる小
音区間、定常性による母音定常部を検出し、2段マッチ
ングにおけるテンプレートの種類の絞り込みやテンプレ
ートの並べ方の規制を行うものである。
作用 本発明は前記した構成により、音声入力未知パタン系列
の2段マッチングの最適解以上の信頼性をもつような特
徴のある部分を前もって検出しておき、音声入力未知パ
タン系列の認識を、CV,VCV音節単位のテンプレート群と
の2段マッチングによって行う際に、前記特徴部分とし
て子音区間部,母音定常部,無音区間(語頭含)を使用
して、2段マッチングのようにテンプレートとの総当り
マッチングでは無く、語頭及び無音区間の終りから母音
定常部までではCVテンプレートのみを選択し、母音定常
部から母音定常部までの範囲については、その間に子音
区間が検出されている場合には1つのVCV区間と見な
し、子音区間部が検出されていない場合には複数のVCV
区間が存在すると見なしてVCVテンプレートを選択する
事で2段マッチングの並べ方を規制することによって、
2段マッチングの最適解以上の認識率をより高速に行え
るものである。従って本発明では、音節単位での2段マ
ッチングを基本とし、さらに高い認識率をより高速に行
うため、完全な連続音声の実時間処理を高い認識率で実
現することが可能となる。
実 施 例 第1図は本発明によるパタンマッチング装置の一実施例
を示すブロック図である。1は入力未知パタン系列、2
は入力未知パタン系列を一時記憶する入力パタン系列記
憶部である。3は入力未知パタン系列21を入力としてブ
ランク部や定常性部あるいは非定常性部を検出して該当
区間座標31を出力する入力パタン系列特徴部検出部であ
る。5は入力パタン系列特徴部検出部3で検出された座
標範囲をもとに、2段マッチングを行うべき入力パタン
系列の始端フレーム51と終端フレーム52を指定するマッ
チング範囲制御部である。4はテンプレート記憶部6の
テンプレートパタン61と入力パタン系列記憶部2の入力
パタン系列中でマッチング範囲制御部5で指定された入
力フレーム範囲のパタン系列とマッチング計算を行うマ
ッチング計算実行部である。
各部の動作の詳細な説明を、第1図と第2図を用いて以
下に行う。
第2図は、入力パタン系列を音声パタン系列としてい
る。(a)は入力信号が、『山添から』と発声された場
合を示しており、子音区間に多く検出される非定常部71
と母音区間に多く検出される定常部72およびブランク区
間としての無音区間73を出力している。(b)はテンプ
レートをCV(子音+母音)音節及びVCV(母音+子音+
母音)音節とした場合に、入力音声パタン系列との2段
マッチングを行う様子を示している。ただし2段マッチ
ングを実行するに際しては、非定常部71,定常部72およ
び無音区間73の範囲を規制条件としている。
ここで、第2図に示した『山添から』という音声パタン
系列が入力された場合の動作例の説明を第1図,第2図
を用いて以下に行う。
入力音声は第1図に示したように、入力パタン系列記憶
部2に入力され、入力パタン系列特徴部検出部3によっ
て子音部の非定常部71、定常部72および無音区間73等を
マッチング範囲制御部5へ出力31する。本例ではテンプ
レート記憶部6に記憶しているテンプレートはCVもしく
はVCV音節であるので、マッチング範囲制御部5は、入
力音声パタン系列のテンプレートとのマッチングにおけ
る始端フレーム51と終端フレーム52を無音区間73を除く
定常部72から定常部72の範囲として指定する。さらにマ
ッチング計算実行部4では入力音声系列の非定常部71は
テンプレートの子音部に対応するために、第2図81,84
に示したように入力音声パタン系列の語頭もしくは無音
区間の終りiseから直後の定常部72までの範囲に対して
はテンプレート記憶部6のCVテンプレートとのマッチン
グをマッチング計算実行部4で行う。それ以外で第2図
82,85に示したように入力音声パタン系列の語中の定常
部72と定常部72の間に非定常部73が検出されている場合
には、テンプレート記憶部のVCVテンプレートの内最適
なものを1つだけ、前記定常部72から定常部72の範囲に
適合させるようにマッチングをマッチング計算実行部4
で行う。また第2図83,86に示したように入力音声パタ
ン系列の語中の定常部72が複数個連続しかつその間に非
定常部73が存在しない場合には、明確な子音区間が定義
されていないので、テンプレート記憶部6VCVテンプレー
トと2段マッチングをマッチング計算実行部4で行い最
適解を決定する。このようにして無音区間73を除く範囲
に対して行なわれた演算結果は、音節列Nx(i)62,バ
ックポインタBx(i)53として与えられ、バックポイン
タBx(i)53のiを語頭方向にたどった(i=0まで)
音節列Nx(i)で与えられる。
発明の効果 以上述べてきたように、本発明によると、連続音声の認
識をCV,VCV音節を単位とするテンプレートとの2段マッ
チングによる最適解によって行うことを基本とし、さら
に音声入力パタン系列における2段マッチングの最適解
以上の信頼性を持つような子音区間部,母音定常部,無
音区間(語頭含)の特徴部を検出するような特徴検出部
を具備し、前記特徴検出部の情報によって2段マッチン
グ行う際に、語頭及び無音区間の終りから母音定常部ま
ではCVテンプレートのみ選択したり母音定常部から母音
定常部までの範囲に子音区間部がある場合には1つのみ
のVCV区間と見なす規制処理を行うものである。従って
より信頼性の高い情報によって2段マッチングのテンプ
レートの絞り込みやテンプレートの並びを規制して高速
化も同時に行えるため、連続音声認識装置におけるパタ
ンマッチン装置を実時間処理で、高速かつ高い認識率で
実現することができ、実用的にきわめて有用である。
【図面の簡単な説明】
第1図は本発明の一実施例におけるパタンマッチング装
置の構成を示すブロック図、第2図は第1図に示した実
施例について入力パタン系列を音声パタン系列とし、テ
ンプレートをCV,VCV音節とした場合のテンプレートの接
合状態を示す説明図である。 2……入力パタン系列記憶部,3……入力パタン系列特徴
部検出部、4……マッチング計算実行部、5……マッチ
ング範囲制御部、6……テンプレート記憶部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】異なるCV(子音+母音)音節,VCV(母音+
    子音+母音)音節の単位に対応して前もって記憶された
    標準パタンよりなるテンプレートと、音声入力未知パタ
    ン系列を記憶する入力系列記憶部と、前記入力未知パタ
    ン系列をテンプレートの最適な組み合わせ及び最適な並
    びで近似する2段マッチング制御部と、音声入力未知パ
    タン系列の子音区間部,母音定常部,無音区間の特徴部
    分を検出する入力パタン系列特徴部検出部を備え、入力
    未知パタン系列に対して前記入力パタン系列特徴部検出
    部により前記特徴部分を検出し、前記2段マッチング制
    御部においてテンプレートの組み合わせを行う際に前記
    入力未知パタン系列の検出された特徴部分に対応させて
    語頭及び無音区間の終りから母音定常部までの範囲につ
    いてはCVテンプレートを選択し、母音定常部から母音定
    常部までの範囲については、その間に子音区間部が検出
    されている場合には1つのVCV区間と見なし、子音区間
    部が検出されていない場合には複数のVCV区間が存在す
    ると見なしてVCVテンプレートを選択することで前記2
    段マッチングの並べ方を規制することを特徴とするパタ
    ンマッチング装置。
JP59250806A 1984-11-28 1984-11-28 パタンマツチング装置 Expired - Fee Related JPH07104680B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59250806A JPH07104680B2 (ja) 1984-11-28 1984-11-28 パタンマツチング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59250806A JPH07104680B2 (ja) 1984-11-28 1984-11-28 パタンマツチング装置

Publications (2)

Publication Number Publication Date
JPS61128391A JPS61128391A (ja) 1986-06-16
JPH07104680B2 true JPH07104680B2 (ja) 1995-11-13

Family

ID=17213321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59250806A Expired - Fee Related JPH07104680B2 (ja) 1984-11-28 1984-11-28 パタンマツチング装置

Country Status (1)

Country Link
JP (1) JPH07104680B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472095B (zh) * 2019-08-16 2023-03-10 百度在线网络技术(北京)有限公司 语音引导方法、装置、设备和介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5613879A (en) * 1979-07-13 1981-02-10 Toshiba Corp Motor control device
JPS5977500A (ja) * 1982-10-25 1984-05-02 日本電信電話株式会社 単語音声認識方式
JPS59204099A (ja) * 1983-05-06 1984-11-19 沖電気工業株式会社 音声認識方式

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
日本音響学会講演論文集昭和56年10月2−1−14P.103−104
電子情報通信学会誌昭和58年6月Vol.J66−D,No.6P.637−644

Also Published As

Publication number Publication date
JPS61128391A (ja) 1986-06-16

Similar Documents

Publication Publication Date Title
JPH07219579A (ja) 音声認識装置
JPH07104680B2 (ja) パタンマツチング装置
JPS59216242A (ja) 音声認識応答装置
JPS62145322A (ja) 音声出力装置
JP2603920B2 (ja) 音声認識装置
JPH067346B2 (ja) 音声認識装置
JPS61292199A (ja) 音声認識装置
JPH05303391A (ja) 音声認識装置
JPS63161499A (ja) 音声認識装置
JPH0534677B2 (ja)
JPH0635494A (ja) 音声認識装置
JP2578771B2 (ja) 音声認識装置
JPS63236094A (ja) 音声認識方法
JPS61200596A (ja) 連続音声認識装置
JPS632100A (ja) 音声認識装置
JPS6180298A (ja) 音声認識装置
JPH0827640B2 (ja) 音声認識装置
JPH04128800A (ja) パターンマッチング制御回路
JPS63217399A (ja) 音声区間検出装置
JPH06110491A (ja) 音声認識装置
JPH0719159B2 (ja) 音声認識装置
JPH0638198B2 (ja) 連続音声認識装置
JPH0449953B2 (ja)
JPH0646357B2 (ja) 連続音声認識装置
JPH08110797A (ja) パターンマッチング装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees