JPH01152498A - 標準パターン作成方式 - Google Patents

標準パターン作成方式

Info

Publication number
JPH01152498A
JPH01152498A JP62311396A JP31139687A JPH01152498A JP H01152498 A JPH01152498 A JP H01152498A JP 62311396 A JP62311396 A JP 62311396A JP 31139687 A JP31139687 A JP 31139687A JP H01152498 A JPH01152498 A JP H01152498A
Authority
JP
Japan
Prior art keywords
pattern
state
standard pattern
standard
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62311396A
Other languages
English (en)
Other versions
JP2749811B2 (ja
Inventor
Tetsuya Muroi
室井 哲也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62311396A priority Critical patent/JP2749811B2/ja
Publication of JPH01152498A publication Critical patent/JPH01152498A/ja
Application granted granted Critical
Publication of JP2749811B2 publication Critical patent/JP2749811B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、標準パターン作成方式、より詳細には、音声
認識におけるパターンマツチング技術に関する。
従来技術 音声認識におけるパターンマツチング手法としてDPマ
ツチングがある。これは局所距離を累積して認識結果を
得るものであり、累積の音声区間中の短い区間(例えば
単語音声における破裂部等)が全体に与える影響は全ん
ど無い。しかしながら、音声区間全体の各フレームの特
徴ベクトルを標準パターンとしており非常に効率が悪い
目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、少ないメモリーを用いて音声パターンを効率よく
表現できる標準パターンを作成する事を目的としてなさ
れたものである。
構   成 本発明は、上記目的を達成するために、入力した音声を
特徴ベクトルの時系列に変換する特徴系列変換手段を用
い、音声パターンを一定数N(>1)の状態に分割し、
各状態ごとに継続時間と該状態に帰属するフレームの特
徴ベクトルのセントロイドを登録する標準パターン作成
方式において、標準パターンと音声パターンとのパター
ンマツチングを行なって音声パターンの分割点を変更し
て標準パターンを更新し、パターンマツチングと標準パ
ターンの更新を繰り返して分割点が収束した後、状態内
の歪が最大となる状態を分割し、連続する状態のセント
ロイドの距離が最も小さい部分を1つの状態として標準
パターンを更新する事を特徴としたものである。以下、
本発明の実施例に基いて説明する。
第1図は、本発明による標準パターン作成方式の一実施
例を説明するためのアルゴリズム、第2図は、全体構成
図、第3図は、音声パターンと標準パターンとの最適な
マツチングパスの例(N=4)を示す図で、第2図にお
いて、1はマイク、2は特徴系列変換部、3は標準パタ
ーン作成部である。マイク1から入力された音声は、特
徴系列変換手段2により特徴ベクトルの時系列に変換さ
れる。特徴ベクトルとしては、様々なものが考えられる
が、例えば、中心周波数を250〜6300 Hzに1
/3オクターブごとに配置した15チヤンネルのバンド
パスフィルター群の出力を用いれば良い。また、フレー
ム周期は10 m s程度とする。ここで、入力音声の
フレーム数をIとすれば、音声パターンXは、 X−X 1X 7 X a ”’ ”’ X tXi”
(X!++ X:2+ x;f、”’・x 115)と
表現される(x、はiフレームの特徴ベクトル、xlf
はiフレームの特徴ベクトルのf番目の要素、即ち、f
チャンネルの出力)。
まず、音声パターンをN等分してN個の状態に分割し、
各状態に帰属する特徴ベクトルのセントロイドを計算し
て、初期標準パターンとする。次に、標準パターンと音
声パターンとのマツチングを行なう。ここでパターンマ
ツチングの方法について簡単に説明する。
5tep1.   D(1,1)=d(1,1)DH,
j)=ω   (2< 、j< N )step2. 
  全てのi = 2からi=IについてD(i、1)
=d(i、1)+D(i−1,1)(2<j<N) 但し、d(X+ J)は、入力音声のiフレームの特徴
ベクトルと標準パターンの、j状態の特徴ベクトル(セ
ントロイド)との局所距離、D(11j)は、格子点(
i、j)に到達する最適なマツチングパスによる累積距
離。
以上のような漸化式を用いて、最終格子点(I。
N)に到達する最適パスを見つける。
第3図では、第1状態に1〜b1フレーム、第2状態に
b1+1〜b2フレーム、第3状態にb2+1〜b1フ
レーム、第4状態にb3+1〜Iフレームが帰属してい
る。ここで、新たに各状態に帰属したフレームからセン
トロイドを計算し、新しい標準パターンを作成する。
以上のように、パターンマツチング→分割点の変更→標
準パターンの更新を収束するまで繰り返す。
このとき、第、j状態を代表する特徴ベクトルをYjと
すると、音声パターンと標準パターンとの誤差D(I、
N)は、 λT S(、j)=Σdlst(X i’ r yJ)i′ε
AJ 但し、Ajは状態jに帰属するフレームの集合と表現で
きる。標準パターンの更新を繰り返しでD(I、N)を
小さくしていくわけであるが、収束後、D(I、N)は
極小であっても最小である保証はなV’s そこで、まず、最大の状態内憂5(j)を持つ状態を2
つに分割する。
(i /εA、i) = < i s< i ’ < 
i e)とすると、全ての分割点P(EA、i)につい
て、前端(is−P)のセントロイドy、と後端(P−
ie)のセントロイドy、を求める。このとき状態を分
割することによる歪の改善度F1は、 Fl−Σdist(Xi+ yl)+Σdist(xl
、 yz) −8(j)ig<i<p       p
<i<ieと表わされる。
また、連続する2つの状態j、j+1(1<、j<N)
のセントロイトの距離が最も小さい部分を見つけ、この
2つの状態を統合してセントロイドy3を計算する。こ
のとき、状態を統合することによる歪の劣化率F2は、 F2=、Σdisj(Xi+ y3)  S (j) 
 S (J +1 )1′ε(A、i+A、]+L) F、、>F2であれば、この状態の分割、統合によって
音声パターンと標準パターンとの誤差D(I。
N)は状態数Nがかわらず、改善されたことになる。
また、この分割、統合部だけでは、周囲の状態への影響
を考慮していないので、さらにパターンマツチング→分
割点の変更→標準パターンの更新を繰り返す。
また、F、<F2であれば、分割・統合は行なわず、従
来のセントロイドを登録する。また、このときの各状態
の継続時間を計算して登録する。
効   果 以上の説明から明らかなように、本発明による一7= と、少ないメモリーで効率的に音声パターンを表現でき
る標準パターンが作成できる。
【図面の簡単な説明】
第1図は、本発明による標準パターン作成方式の一実施
例を説明するためのアルゴリズム、第2図は、全体構成
図、第3図は、音声パターンと標準パターンとの最適な
マツチングバスの例を示す図である。 1・・・マイク、2・・特徴系列変換部、3・・・標準
パターン作成部。 一8= 第1図 第2図 第3図

Claims (1)

    【特許請求の範囲】
  1.  入力した音声を特徴ベクトルの時系列に変換する特徴
    系列変換手段を用い、音声パターンを一定数N(>1)
    の状態に分割し、各状態ごとに継続時間と該状態に帰属
    するフレームの特徴ベクトルのセントロイドを登録する
    標準パターン作成方式において、標準パターンと音声パ
    ターンとのパターンマッチングを行なって音声パターン
    の分割点を変更して標準パターンを更新し、パターンマ
    ッチングと標準パターンの更新を繰り返して分割点が収
    束した後、状態内の歪が最大となる状態を分割し、連続
    する状態のセントロイドの距離が最も小さい部分を1つ
    の状態として標準パターンを更新する事を特徴とする標
    準パターン作成方式。
JP62311396A 1987-12-09 1987-12-09 標準パターン作成方式 Expired - Fee Related JP2749811B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62311396A JP2749811B2 (ja) 1987-12-09 1987-12-09 標準パターン作成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62311396A JP2749811B2 (ja) 1987-12-09 1987-12-09 標準パターン作成方式

Publications (2)

Publication Number Publication Date
JPH01152498A true JPH01152498A (ja) 1989-06-14
JP2749811B2 JP2749811B2 (ja) 1998-05-13

Family

ID=18016687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62311396A Expired - Fee Related JP2749811B2 (ja) 1987-12-09 1987-12-09 標準パターン作成方式

Country Status (1)

Country Link
JP (1) JP2749811B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04334206A (ja) * 1991-05-10 1992-11-20 Matsushita Electric Ind Co Ltd ベクトル量子化用コードブック作成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6227798A (ja) * 1985-07-29 1987-02-05 株式会社日立製作所 音声認識装置
JPS62101183A (ja) * 1985-10-28 1987-05-11 Hitachi Ltd 画像データ符号化方法
JPS62217292A (ja) * 1986-03-19 1987-09-24 日本電信電話株式会社 音声符号化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6227798A (ja) * 1985-07-29 1987-02-05 株式会社日立製作所 音声認識装置
JPS62101183A (ja) * 1985-10-28 1987-05-11 Hitachi Ltd 画像データ符号化方法
JPS62217292A (ja) * 1986-03-19 1987-09-24 日本電信電話株式会社 音声符号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04334206A (ja) * 1991-05-10 1992-11-20 Matsushita Electric Ind Co Ltd ベクトル量子化用コードブック作成方法

Also Published As

Publication number Publication date
JP2749811B2 (ja) 1998-05-13

Similar Documents

Publication Publication Date Title
Wu et al. Enhanced Karnik-Mendel algorithms for Interval Type-2 fuzzy sets and systems
JPH01265297A (ja) マルコフ・モデル単語ベースフオーム構築方法
CN104616653B (zh) 唤醒词匹配方法、装置以及语音唤醒方法、装置
JPH01152498A (ja) 標準パターン作成方式
JPH07506202A (ja) 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法
KR20230007767A (ko) 데이터 증강 방법 및 장치
Engquist et al. One-sided difference schemes and transonic flow
JPS6140120B2 (ja)
Weigel et al. Virtually free pro-p products
JP4042176B2 (ja) 音声認識方式
JPH04195099A (ja) 連続単語認識方法
JP2003099085A (ja) 音源の分離方法および音源の分離装置
Koza et al. The importance of reuse and development in evolvable hardware
JP2001265383A (ja) 音声認識方法および音声認識処理プログラムを記録した記録媒体
JP2001092481A (ja) 規則音声合成方法
CN113345406B (zh) 神经网络声码器语音合成的方法、装置、设备以及介质
Ahangar et al. Voice conversion based on state space model and considering global variance
JPH02167599A (ja) 音声認識方式及び標準パターン作成方式
Mathur et al. On Pál type weighted lacunary (0, 2; 0)-interpolation on infinite interval (−∞,+∞)
TW201830381A (zh) 語音信號處理裝置及語音信號處理方法
JPH02123399A (ja) 連続単語音声認識方法
JP2785939B2 (ja) 連続音声認識装置
JP2003015685A (ja) グラフ変更装置及び時系列データ統合装置及びグラフ変更プログラム並びに時系列データ統合プログラム
JPH06180724A (ja) パラメトリック曲線群のb−スプライン曲線群近似変換装置
JPH04311997A (ja) Dpマッチング法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees