JPH01152498A - 標準パターン作成方式 - Google Patents
標準パターン作成方式Info
- Publication number
- JPH01152498A JPH01152498A JP62311396A JP31139687A JPH01152498A JP H01152498 A JPH01152498 A JP H01152498A JP 62311396 A JP62311396 A JP 62311396A JP 31139687 A JP31139687 A JP 31139687A JP H01152498 A JPH01152498 A JP H01152498A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- state
- standard pattern
- standard
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は、標準パターン作成方式、より詳細には、音声
認識におけるパターンマツチング技術に関する。
認識におけるパターンマツチング技術に関する。
従来技術
音声認識におけるパターンマツチング手法としてDPマ
ツチングがある。これは局所距離を累積して認識結果を
得るものであり、累積の音声区間中の短い区間(例えば
単語音声における破裂部等)が全体に与える影響は全ん
ど無い。しかしながら、音声区間全体の各フレームの特
徴ベクトルを標準パターンとしており非常に効率が悪い
。
ツチングがある。これは局所距離を累積して認識結果を
得るものであり、累積の音声区間中の短い区間(例えば
単語音声における破裂部等)が全体に与える影響は全ん
ど無い。しかしながら、音声区間全体の各フレームの特
徴ベクトルを標準パターンとしており非常に効率が悪い
。
目 的
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、少ないメモリーを用いて音声パターンを効率よく
表現できる標準パターンを作成する事を目的としてなさ
れたものである。
特に、少ないメモリーを用いて音声パターンを効率よく
表現できる標準パターンを作成する事を目的としてなさ
れたものである。
構 成
本発明は、上記目的を達成するために、入力した音声を
特徴ベクトルの時系列に変換する特徴系列変換手段を用
い、音声パターンを一定数N(>1)の状態に分割し、
各状態ごとに継続時間と該状態に帰属するフレームの特
徴ベクトルのセントロイドを登録する標準パターン作成
方式において、標準パターンと音声パターンとのパター
ンマツチングを行なって音声パターンの分割点を変更し
て標準パターンを更新し、パターンマツチングと標準パ
ターンの更新を繰り返して分割点が収束した後、状態内
の歪が最大となる状態を分割し、連続する状態のセント
ロイドの距離が最も小さい部分を1つの状態として標準
パターンを更新する事を特徴としたものである。以下、
本発明の実施例に基いて説明する。
特徴ベクトルの時系列に変換する特徴系列変換手段を用
い、音声パターンを一定数N(>1)の状態に分割し、
各状態ごとに継続時間と該状態に帰属するフレームの特
徴ベクトルのセントロイドを登録する標準パターン作成
方式において、標準パターンと音声パターンとのパター
ンマツチングを行なって音声パターンの分割点を変更し
て標準パターンを更新し、パターンマツチングと標準パ
ターンの更新を繰り返して分割点が収束した後、状態内
の歪が最大となる状態を分割し、連続する状態のセント
ロイドの距離が最も小さい部分を1つの状態として標準
パターンを更新する事を特徴としたものである。以下、
本発明の実施例に基いて説明する。
第1図は、本発明による標準パターン作成方式の一実施
例を説明するためのアルゴリズム、第2図は、全体構成
図、第3図は、音声パターンと標準パターンとの最適な
マツチングパスの例(N=4)を示す図で、第2図にお
いて、1はマイク、2は特徴系列変換部、3は標準パタ
ーン作成部である。マイク1から入力された音声は、特
徴系列変換手段2により特徴ベクトルの時系列に変換さ
れる。特徴ベクトルとしては、様々なものが考えられる
が、例えば、中心周波数を250〜6300 Hzに1
/3オクターブごとに配置した15チヤンネルのバンド
パスフィルター群の出力を用いれば良い。また、フレー
ム周期は10 m s程度とする。ここで、入力音声の
フレーム数をIとすれば、音声パターンXは、 X−X 1X 7 X a ”’ ”’ X tXi”
(X!++ X:2+ x;f、”’・x 115)と
表現される(x、はiフレームの特徴ベクトル、xlf
はiフレームの特徴ベクトルのf番目の要素、即ち、f
チャンネルの出力)。
例を説明するためのアルゴリズム、第2図は、全体構成
図、第3図は、音声パターンと標準パターンとの最適な
マツチングパスの例(N=4)を示す図で、第2図にお
いて、1はマイク、2は特徴系列変換部、3は標準パタ
ーン作成部である。マイク1から入力された音声は、特
徴系列変換手段2により特徴ベクトルの時系列に変換さ
れる。特徴ベクトルとしては、様々なものが考えられる
が、例えば、中心周波数を250〜6300 Hzに1
/3オクターブごとに配置した15チヤンネルのバンド
パスフィルター群の出力を用いれば良い。また、フレー
ム周期は10 m s程度とする。ここで、入力音声の
フレーム数をIとすれば、音声パターンXは、 X−X 1X 7 X a ”’ ”’ X tXi”
(X!++ X:2+ x;f、”’・x 115)と
表現される(x、はiフレームの特徴ベクトル、xlf
はiフレームの特徴ベクトルのf番目の要素、即ち、f
チャンネルの出力)。
まず、音声パターンをN等分してN個の状態に分割し、
各状態に帰属する特徴ベクトルのセントロイドを計算し
て、初期標準パターンとする。次に、標準パターンと音
声パターンとのマツチングを行なう。ここでパターンマ
ツチングの方法について簡単に説明する。
各状態に帰属する特徴ベクトルのセントロイドを計算し
て、初期標準パターンとする。次に、標準パターンと音
声パターンとのマツチングを行なう。ここでパターンマ
ツチングの方法について簡単に説明する。
5tep1. D(1,1)=d(1,1)DH,
j)=ω (2< 、j< N )step2.
全てのi = 2からi=IについてD(i、1)
=d(i、1)+D(i−1,1)(2<j<N) 但し、d(X+ J)は、入力音声のiフレームの特徴
ベクトルと標準パターンの、j状態の特徴ベクトル(セ
ントロイド)との局所距離、D(11j)は、格子点(
i、j)に到達する最適なマツチングパスによる累積距
離。
j)=ω (2< 、j< N )step2.
全てのi = 2からi=IについてD(i、1)
=d(i、1)+D(i−1,1)(2<j<N) 但し、d(X+ J)は、入力音声のiフレームの特徴
ベクトルと標準パターンの、j状態の特徴ベクトル(セ
ントロイド)との局所距離、D(11j)は、格子点(
i、j)に到達する最適なマツチングパスによる累積距
離。
以上のような漸化式を用いて、最終格子点(I。
N)に到達する最適パスを見つける。
第3図では、第1状態に1〜b1フレーム、第2状態に
b1+1〜b2フレーム、第3状態にb2+1〜b1フ
レーム、第4状態にb3+1〜Iフレームが帰属してい
る。ここで、新たに各状態に帰属したフレームからセン
トロイドを計算し、新しい標準パターンを作成する。
b1+1〜b2フレーム、第3状態にb2+1〜b1フ
レーム、第4状態にb3+1〜Iフレームが帰属してい
る。ここで、新たに各状態に帰属したフレームからセン
トロイドを計算し、新しい標準パターンを作成する。
以上のように、パターンマツチング→分割点の変更→標
準パターンの更新を収束するまで繰り返す。
準パターンの更新を収束するまで繰り返す。
このとき、第、j状態を代表する特徴ベクトルをYjと
すると、音声パターンと標準パターンとの誤差D(I、
N)は、 λT S(、j)=Σdlst(X i’ r yJ)i′ε
AJ 但し、Ajは状態jに帰属するフレームの集合と表現で
きる。標準パターンの更新を繰り返しでD(I、N)を
小さくしていくわけであるが、収束後、D(I、N)は
極小であっても最小である保証はなV’s そこで、まず、最大の状態内憂5(j)を持つ状態を2
つに分割する。
すると、音声パターンと標準パターンとの誤差D(I、
N)は、 λT S(、j)=Σdlst(X i’ r yJ)i′ε
AJ 但し、Ajは状態jに帰属するフレームの集合と表現で
きる。標準パターンの更新を繰り返しでD(I、N)を
小さくしていくわけであるが、収束後、D(I、N)は
極小であっても最小である保証はなV’s そこで、まず、最大の状態内憂5(j)を持つ状態を2
つに分割する。
(i /εA、i) = < i s< i ’ <
i e)とすると、全ての分割点P(EA、i)につい
て、前端(is−P)のセントロイドy、と後端(P−
ie)のセントロイドy、を求める。このとき状態を分
割することによる歪の改善度F1は、 Fl−Σdist(Xi+ yl)+Σdist(xl
、 yz) −8(j)ig<i<p p
<i<ieと表わされる。
i e)とすると、全ての分割点P(EA、i)につい
て、前端(is−P)のセントロイドy、と後端(P−
ie)のセントロイドy、を求める。このとき状態を分
割することによる歪の改善度F1は、 Fl−Σdist(Xi+ yl)+Σdist(xl
、 yz) −8(j)ig<i<p p
<i<ieと表わされる。
また、連続する2つの状態j、j+1(1<、j<N)
のセントロイトの距離が最も小さい部分を見つけ、この
2つの状態を統合してセントロイドy3を計算する。こ
のとき、状態を統合することによる歪の劣化率F2は、 F2=、Σdisj(Xi+ y3) S (j)
S (J +1 )1′ε(A、i+A、]+L) F、、>F2であれば、この状態の分割、統合によって
音声パターンと標準パターンとの誤差D(I。
のセントロイトの距離が最も小さい部分を見つけ、この
2つの状態を統合してセントロイドy3を計算する。こ
のとき、状態を統合することによる歪の劣化率F2は、 F2=、Σdisj(Xi+ y3) S (j)
S (J +1 )1′ε(A、i+A、]+L) F、、>F2であれば、この状態の分割、統合によって
音声パターンと標準パターンとの誤差D(I。
N)は状態数Nがかわらず、改善されたことになる。
また、この分割、統合部だけでは、周囲の状態への影響
を考慮していないので、さらにパターンマツチング→分
割点の変更→標準パターンの更新を繰り返す。
を考慮していないので、さらにパターンマツチング→分
割点の変更→標準パターンの更新を繰り返す。
また、F、<F2であれば、分割・統合は行なわず、従
来のセントロイドを登録する。また、このときの各状態
の継続時間を計算して登録する。
来のセントロイドを登録する。また、このときの各状態
の継続時間を計算して登録する。
効 果
以上の説明から明らかなように、本発明による一7=
と、少ないメモリーで効率的に音声パターンを表現でき
る標準パターンが作成できる。
る標準パターンが作成できる。
第1図は、本発明による標準パターン作成方式の一実施
例を説明するためのアルゴリズム、第2図は、全体構成
図、第3図は、音声パターンと標準パターンとの最適な
マツチングバスの例を示す図である。 1・・・マイク、2・・特徴系列変換部、3・・・標準
パターン作成部。 一8= 第1図 第2図 第3図
例を説明するためのアルゴリズム、第2図は、全体構成
図、第3図は、音声パターンと標準パターンとの最適な
マツチングバスの例を示す図である。 1・・・マイク、2・・特徴系列変換部、3・・・標準
パターン作成部。 一8= 第1図 第2図 第3図
Claims (1)
- 入力した音声を特徴ベクトルの時系列に変換する特徴
系列変換手段を用い、音声パターンを一定数N(>1)
の状態に分割し、各状態ごとに継続時間と該状態に帰属
するフレームの特徴ベクトルのセントロイドを登録する
標準パターン作成方式において、標準パターンと音声パ
ターンとのパターンマッチングを行なって音声パターン
の分割点を変更して標準パターンを更新し、パターンマ
ッチングと標準パターンの更新を繰り返して分割点が収
束した後、状態内の歪が最大となる状態を分割し、連続
する状態のセントロイドの距離が最も小さい部分を1つ
の状態として標準パターンを更新する事を特徴とする標
準パターン作成方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62311396A JP2749811B2 (ja) | 1987-12-09 | 1987-12-09 | 標準パターン作成方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62311396A JP2749811B2 (ja) | 1987-12-09 | 1987-12-09 | 標準パターン作成方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01152498A true JPH01152498A (ja) | 1989-06-14 |
JP2749811B2 JP2749811B2 (ja) | 1998-05-13 |
Family
ID=18016687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62311396A Expired - Fee Related JP2749811B2 (ja) | 1987-12-09 | 1987-12-09 | 標準パターン作成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2749811B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04334206A (ja) * | 1991-05-10 | 1992-11-20 | Matsushita Electric Ind Co Ltd | ベクトル量子化用コードブック作成方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6227798A (ja) * | 1985-07-29 | 1987-02-05 | 株式会社日立製作所 | 音声認識装置 |
JPS62101183A (ja) * | 1985-10-28 | 1987-05-11 | Hitachi Ltd | 画像データ符号化方法 |
JPS62217292A (ja) * | 1986-03-19 | 1987-09-24 | 日本電信電話株式会社 | 音声符号化方法 |
-
1987
- 1987-12-09 JP JP62311396A patent/JP2749811B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6227798A (ja) * | 1985-07-29 | 1987-02-05 | 株式会社日立製作所 | 音声認識装置 |
JPS62101183A (ja) * | 1985-10-28 | 1987-05-11 | Hitachi Ltd | 画像データ符号化方法 |
JPS62217292A (ja) * | 1986-03-19 | 1987-09-24 | 日本電信電話株式会社 | 音声符号化方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04334206A (ja) * | 1991-05-10 | 1992-11-20 | Matsushita Electric Ind Co Ltd | ベクトル量子化用コードブック作成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2749811B2 (ja) | 1998-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Enhanced Karnik-Mendel algorithms for Interval Type-2 fuzzy sets and systems | |
JPH01265297A (ja) | マルコフ・モデル単語ベースフオーム構築方法 | |
CN104616653B (zh) | 唤醒词匹配方法、装置以及语音唤醒方法、装置 | |
JPH01152498A (ja) | 標準パターン作成方式 | |
JPH07506202A (ja) | 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法 | |
KR20230007767A (ko) | 데이터 증강 방법 및 장치 | |
Engquist et al. | One-sided difference schemes and transonic flow | |
JPS6140120B2 (ja) | ||
Weigel et al. | Virtually free pro-p products | |
JP4042176B2 (ja) | 音声認識方式 | |
JPH04195099A (ja) | 連続単語認識方法 | |
JP2003099085A (ja) | 音源の分離方法および音源の分離装置 | |
Koza et al. | The importance of reuse and development in evolvable hardware | |
JP2001265383A (ja) | 音声認識方法および音声認識処理プログラムを記録した記録媒体 | |
JP2001092481A (ja) | 規則音声合成方法 | |
CN113345406B (zh) | 神经网络声码器语音合成的方法、装置、设备以及介质 | |
Ahangar et al. | Voice conversion based on state space model and considering global variance | |
JPH02167599A (ja) | 音声認識方式及び標準パターン作成方式 | |
Mathur et al. | On Pál type weighted lacunary (0, 2; 0)-interpolation on infinite interval (−∞,+∞) | |
TW201830381A (zh) | 語音信號處理裝置及語音信號處理方法 | |
JPH02123399A (ja) | 連続単語音声認識方法 | |
JP2785939B2 (ja) | 連続音声認識装置 | |
JP2003015685A (ja) | グラフ変更装置及び時系列データ統合装置及びグラフ変更プログラム並びに時系列データ統合プログラム | |
JPH06180724A (ja) | パラメトリック曲線群のb−スプライン曲線群近似変換装置 | |
JPH04311997A (ja) | Dpマッチング法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |