JPS6177899A - 標準パタ−ン作成法 - Google Patents
標準パタ−ン作成法Info
- Publication number
- JPS6177899A JPS6177899A JP59199448A JP19944884A JPS6177899A JP S6177899 A JPS6177899 A JP S6177899A JP 59199448 A JP59199448 A JP 59199448A JP 19944884 A JP19944884 A JP 19944884A JP S6177899 A JPS6177899 A JP S6177899A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- sample
- patterns
- distance
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔技術分野〕
本発明は不特定話者用の音声認識などに使用されるクラ
スタリングの手法を用いた標準パターンの作成法に関す
るものである。
スタリングの手法を用いた標準パターンの作成法に関す
るものである。
この発明による標準パターン作成法で磯シ扱えるパター
ンは、パターン間の距離が定義されていればどのような
パターンでもよいが、以下では代表的な例として不特定
話者用の音声認識(7)標4パターンについて説明する
。
ンは、パターン間の距離が定義されていればどのような
パターンでもよいが、以下では代表的な例として不特定
話者用の音声認識(7)標4パターンについて説明する
。
不特定話者が発声した単語音声を認識する方式として、
各単語毎に多数話者のパターンから代表的な複数のパタ
ーンを選んで蓄えておき。
各単語毎に多数話者のパターンから代表的な複数のパタ
ーンを選んで蓄えておき。
未知入力音声のパター7とこれらのパターンとのマツチ
ングを行って最も距離の近いパターンの単語を認識結果
とする方式がある。この時多数話者のパターンから代表
的なパターンを選択するのにクラスタリングの手法が用
いられる(たとえばLAWRENCE R,RABIN
ER: 5psakar −Independent
Recognition of l5olated W
ords UsingClustering Tech
niques、 IEEE Trans、 ASSP−
27゜4、p336.1979)。 クラスタリングの
手法としてに平均アルゴリズムがあるが、これは次のよ
うなステップからなる(長屋:パターン情報処理、コロ
ナ社、pp、”7)。
ングを行って最も距離の近いパターンの単語を認識結果
とする方式がある。この時多数話者のパターンから代表
的なパターンを選択するのにクラスタリングの手法が用
いられる(たとえばLAWRENCE R,RABIN
ER: 5psakar −Independent
Recognition of l5olated W
ords UsingClustering Tech
niques、 IEEE Trans、 ASSP−
27゜4、p336.1979)。 クラスタリングの
手法としてに平均アルゴリズムがあるが、これは次のよ
うなステップからなる(長屋:パターン情報処理、コロ
ナ社、pp、”7)。
ステップ1:■(個の初期クラスタ中心Z、 (t)、
z、 (1)。
z、 (1)。
・・・、 Zk(11を適当に決める。
ステップ2:に回目の繰返しステップで、す/プル(χ
)を次の方法でに個のクラスタに分類する。
)を次の方法でに個のクラスタに分類する。
すべてのi=1.2.・・・IK(”J)について11
χ−zj(kll<If z−z3(k)IIであれば
χ5j(k) ・・・・・・・・・・・・
・・・・・・(1)とする。ここにSj、(k)はz
j−(k)をクラスタ中心とするサンプル集合である。
χ−zj(kll<If z−z3(k)IIであれば
χ5j(k) ・・・・・・・・・・・・
・・・・・・(1)とする。ここにSj、(k)はz
j−(k)をクラスタ中心とするサンプル集合である。
ステップ5ニステツプ2で得られたS j (k)の新
しいクラスタ中心をz j(k+ 1 )として*
J”L2+・・・、Kに対して を最小にするようにz i (k + 1 )を決める
。
しいクラスタ中心をz j(k+ 1 )として*
J”L2+・・・、Kに対して を最小にするようにz i (k + 1 )を決める
。
ステップ4:すべてのj=1,2.・・・、Kに対して
2・(k + 1 ) =z j(k)となればアルゴ
リズムは収束コ したものとして終了する。そうでなければステップ2に
戻る。
2・(k + 1 ) =z j(k)となればアルゴ
リズムは収束コ したものとして終了する。そうでなければステップ2に
戻る。
第2図は従来の標準パターン作成法を実行するだめの回
路構成を示す図である。(χ)であられされるサンプル
11は、初期設定部12の初期クラスフ中心作成部13
に入力され、i設定部14によりサンプルの先頭からに
個或いはランダムにに個選ばれて初期クラスタ中心が決
められ(第1ステツプ)、に初期設定部15でに=1に
され。
路構成を示す図である。(χ)であられされるサンプル
11は、初期設定部12の初期クラスフ中心作成部13
に入力され、i設定部14によりサンプルの先頭からに
個或いはランダムにに個選ばれて初期クラスタ中心が決
められ(第1ステツプ)、に初期設定部15でに=1に
され。
Z J (k)であられされるクラスタ中心16となる
。
。
このクラスタ中心16はサンプル11と共にクラスタ判
定部17に入力され、以下あとに詳しく説明するが、こ
こで第2のステップを実行し、更にクラスタ中心判定部
18で第5のステップを実行し、z j(k + 1
)であられされるに+1回目のクラスタ中心19を決め
る。収束条件比較部加はステップ4の収束条件をチェッ
クし、収束条件を満足している場合はアルゴリズムは収
束したものとしてZ j(”)を出力端21に出力し、
満足されていなければにカウンタnでに=にII した
のち第2のステップおよび第3のステップを繰返す。
定部17に入力され、以下あとに詳しく説明するが、こ
こで第2のステップを実行し、更にクラスタ中心判定部
18で第5のステップを実行し、z j(k + 1
)であられされるに+1回目のクラスタ中心19を決め
る。収束条件比較部加はステップ4の収束条件をチェッ
クし、収束条件を満足している場合はアルゴリズムは収
束したものとしてZ j(”)を出力端21に出力し、
満足されていなければにカウンタnでに=にII した
のち第2のステップおよび第3のステップを繰返す。
ここでこれら第2および第5のステップの実行について
詳しく説明すると、クラスタ判定部17において、距離
計算部nはクラスタ中心16とサンプル11を入力し、
サンプル(χ)とクラスタ中心z j(k)の距離11
χ−Zj(k)IIをすべての(χ)について求め、最
小値選択回路24では前記の距離を入力し、ステップ2
で述べたように、すべてのi=1,2.・・・、K(i
+j)についてII I z i (k翔が11χ−3
i(k)Ifより小さければχ5j(k)と判定し、そ
の距離が最も小さいクラスタ中心を求めてサンプル集合
S j (k)の新しいクラスタ中心を所属クラスタ5
として出力する。中心クラスタ判定部18は加算部26
と除算部27から成り、所属クラスタ5に従って、第3
のステップのところで説明したように、 j=1.2
.・・・、Kに対して(2)式に示すJ・を最小にする
ようにz j(k+ 1 )を決める。別の表現をすれ
ば、NjをS j (k)に含まれるχの数とすると。
詳しく説明すると、クラスタ判定部17において、距離
計算部nはクラスタ中心16とサンプル11を入力し、
サンプル(χ)とクラスタ中心z j(k)の距離11
χ−Zj(k)IIをすべての(χ)について求め、最
小値選択回路24では前記の距離を入力し、ステップ2
で述べたように、すべてのi=1,2.・・・、K(i
+j)についてII I z i (k翔が11χ−3
i(k)Ifより小さければχ5j(k)と判定し、そ
の距離が最も小さいクラスタ中心を求めてサンプル集合
S j (k)の新しいクラスタ中心を所属クラスタ5
として出力する。中心クラスタ判定部18は加算部26
と除算部27から成り、所属クラスタ5に従って、第3
のステップのところで説明したように、 j=1.2
.・・・、Kに対して(2)式に示すJ・を最小にする
ようにz j(k+ 1 )を決める。別の表現をすれ
ば、NjをS j (k)に含まれるχの数とすると。
を計算してz 3. (k+ 1 )を決める。
以上のようにして標準パターンの作成が行われるが、先
に記したように、従来はに個のサンプルを選ぶのに、サ
ンプルの先頭からに個選んだシ、或いはランダムにに個
選んだりしていた。
に記したように、従来はに個のサンプルを選ぶのに、サ
ンプルの先頭からに個選んだシ、或いはランダムにに個
選んだりしていた。
このため選び方によりクラスタ中心がかたま9易く、孤
立パターンを分離しにくいという問題があった。
立パターンを分離しにくいという問題があった。
したがって本発明の目的は、孤立パターンを分離し効率
的な代表パターンを選択する標準パターン作成法を提供
することにある。
的な代表パターンを選択する標準パターン作成法を提供
することにある。
本発明によれば、データベースよりクラスタリングの手
法によυに個の標準パターンを作成する方法において、
に個の初期クラスタ中心としてデータベース中の相互に
最も離れたに個のサンプルを選択することを特徴とする
標準パターン作成法を得ようとするものである。
法によυに個の標準パターンを作成する方法において、
に個の初期クラスタ中心としてデータベース中の相互に
最も離れたに個のサンプルを選択することを特徴とする
標準パターン作成法を得ようとするものである。
第1図は本発明の一実施例を実行するのに用いられる標
準パターン作成装置の構成を示す図である。この装置が
第2図の従来の方法を実行するための装置と異るのは、
初期クラスタを決めるだめの初期設定部の構造従って動
作が異っていることである。すなわち本発明の初期設定
部31においては、初期クラスタを決めるのに相に 互に最も距離の大きい7個のサンプルを初期クラスタ中
心に設定するために、まずサンプル間隔距離計算部32
でサンプル11の距離を計算して次に示すサンプル間距
離マトリックスを求める。
準パターン作成装置の構成を示す図である。この装置が
第2図の従来の方法を実行するための装置と異るのは、
初期クラスタを決めるだめの初期設定部の構造従って動
作が異っていることである。すなわち本発明の初期設定
部31においては、初期クラスタを決めるのに相に 互に最も距離の大きい7個のサンプルを初期クラスタ中
心に設定するために、まずサンプル間隔距離計算部32
でサンプル11の距離を計算して次に示すサンプル間距
離マトリックスを求める。
第5図はこのサンプル間距離マトリックスの説明図でち
る。この第3図において+ D(’ ! J )はサン
プルiとサンプルjとの距離であり、距離尺度としては
ユークリッド距離、チェビシェフ距離等が考えられ、い
ずれでもよい。このサンプル間距離計算部32にて算出
される距離マトリックスをもとに、最大値選択部33に
おいて相に 互に最も距離の大きい2個のサンプルを初期クラスタ中
心に設定する。
る。この第3図において+ D(’ ! J )はサン
プルiとサンプルjとの距離であり、距離尺度としては
ユークリッド距離、チェビシェフ距離等が考えられ、い
ずれでもよい。このサンプル間距離計算部32にて算出
される距離マトリックスをもとに、最大値選択部33に
おいて相に 互に最も距離の大きい2個のサンプルを初期クラスタ中
心に設定する。
第4図は最大値選択部33をマイクロプロセッサ−で構
成した場合のプログラム70−の一例を示す図である。
成した場合のプログラム70−の一例を示す図である。
この内容は第1〜第4のステップの説明と照らし合せれ
ば容易に理解できるので、説明は省略する。
ば容易に理解できるので、説明は省略する。
この発明の有効性を明確にするために、2次元データに
てクラスタリング例を従来法と比較して実行した、K次
元データとして92個の音声サンプルから先頭2次元だ
けをそれぞれ取シ出したものを用いた。
てクラスタリング例を従来法と比較して実行した、K次
元データとして92個の音声サンプルから先頭2次元だ
けをそれぞれ取シ出したものを用いた。
第5図は従来法によるクラスタリング、第6図は本発明
の方法によるクラスタリングによりおのおの15クラス
タに分けた例である。第5図の従来法では、サンプルの
集中している部分に多くのクラスタができており、右上
の孤立サンプルが分離していない。これに比較し、第6
図の本発明によるクラスタリング法では、孤立サンプル
が分離し効率的にクラスタが構成されている。
の方法によるクラスタリングによりおのおの15クラス
タに分けた例である。第5図の従来法では、サンプルの
集中している部分に多くのクラスタができており、右上
の孤立サンプルが分離していない。これに比較し、第6
図の本発明によるクラスタリング法では、孤立サンプル
が分離し効率的にクラスタが構成されている。
なお上記の装置はいくつかの回路を使用しているが、い
ずれも公知のディジタル回路、及びマイクロプロセッサ
−にて容易に構成できる。
ずれも公知のディジタル回路、及びマイクロプロセッサ
−にて容易に構成できる。
以上の説明から明らかなように1本発明による標準パタ
ーン作成法は、初期クラスタ中心として相互に最も離れ
たパターンを選択することにより、孤立パターンの分離
をよくし効率的な代表パターンを求めることができ、し
たがって認識率の高い標準パターンを作成することがで
きる。
ーン作成法は、初期クラスタ中心として相互に最も離れ
たパターンを選択することにより、孤立パターンの分離
をよくし効率的な代表パターンを求めることができ、し
たがって認識率の高い標準パターンを作成することがで
きる。
第1図は本発明による標準パターン作成法を実行するた
めの装置のブロック回路図、第2図は従来の標準パター
ン作成法を実行する装置のブロック回路図、第6図はサ
ンプル間距離マトリックスの説明図、第4図は最大値選
択のプログラムを示すフローチャートを示す図、第5図
は従来法によるクラスタリング例を示す図、第6図は本
発明によるクラスタリング例を示す図である。 記号の説明:11はサンプル、12は初期設定部。 13は初期クラスタ中心作成部、15はに初期設定部、
16はクラスタ中心、17はクラスタ判定部。 18はクラスタ中心判定部、19は21回目のクラスタ
中心、 20は収束条件比較部、21は出力端、22は
にカウンタ、31は初期設定部、32はサンプル間距離
計算部、33は最大値選択部をそれぞれあ第5図 DIMEMSION I 第6図 DIMEMSION +
めの装置のブロック回路図、第2図は従来の標準パター
ン作成法を実行する装置のブロック回路図、第6図はサ
ンプル間距離マトリックスの説明図、第4図は最大値選
択のプログラムを示すフローチャートを示す図、第5図
は従来法によるクラスタリング例を示す図、第6図は本
発明によるクラスタリング例を示す図である。 記号の説明:11はサンプル、12は初期設定部。 13は初期クラスタ中心作成部、15はに初期設定部、
16はクラスタ中心、17はクラスタ判定部。 18はクラスタ中心判定部、19は21回目のクラスタ
中心、 20は収束条件比較部、21は出力端、22は
にカウンタ、31は初期設定部、32はサンプル間距離
計算部、33は最大値選択部をそれぞれあ第5図 DIMEMSION I 第6図 DIMEMSION +
Claims (1)
- 1、データベースよりクラスタリングの手法によりK個
の標準パターンを作成する方法において、K個の初期ク
ラスタ中心として前記データベース中の相互に最も離れ
たに個のサンプルを選択することを特徴とした標準パタ
ーン作成法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59199448A JPS6177899A (ja) | 1984-09-26 | 1984-09-26 | 標準パタ−ン作成法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59199448A JPS6177899A (ja) | 1984-09-26 | 1984-09-26 | 標準パタ−ン作成法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6177899A true JPS6177899A (ja) | 1986-04-21 |
Family
ID=16407980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59199448A Pending JPS6177899A (ja) | 1984-09-26 | 1984-09-26 | 標準パタ−ン作成法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6177899A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63124099A (ja) * | 1986-11-13 | 1988-05-27 | 日本電気株式会社 | スペクトル標準パタンの作成方法 |
WO2003088209A1 (fr) * | 2002-04-12 | 2003-10-23 | Mitsubishi Denki Kabushiki Kaisha | Systeme de navigation de voiture et dispositif de reconnaissance vocale de ce systeme |
-
1984
- 1984-09-26 JP JP59199448A patent/JPS6177899A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63124099A (ja) * | 1986-11-13 | 1988-05-27 | 日本電気株式会社 | スペクトル標準パタンの作成方法 |
JPH0785200B2 (ja) * | 1986-11-13 | 1995-09-13 | 日本電気株式会社 | スペクトル標準パタンの作成方法 |
WO2003088209A1 (fr) * | 2002-04-12 | 2003-10-23 | Mitsubishi Denki Kabushiki Kaisha | Systeme de navigation de voiture et dispositif de reconnaissance vocale de ce systeme |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Levinson et al. | Interactive clustering techniques for selecting speaker-independent reference templates for isolated word recognition | |
JP4828091B2 (ja) | クラスタリング方法プログラム及び装置 | |
Flamary et al. | Spoken WordCloud: Clustering recurrent patterns in speech | |
WO2021072893A1 (zh) | 一种声纹聚类方法、装置、处理设备以及计算机存储介质 | |
JPS6177899A (ja) | 標準パタ−ン作成法 | |
JPH10143613A (ja) | パタン認識方法 | |
Yip et al. | Aca-net: towards lightweight speaker verification using asymmetric cross attention | |
US20020143536A1 (en) | Method for generating candidate word strings in speech recognition | |
CN115472181A (zh) | 基于特征融合和聚类的翻唱识别方法、装置和存储介质 | |
US20140343944A1 (en) | Method of visual voice recognition with selection of groups of most relevant points of interest | |
CN112017641A (zh) | 一种语音处理方法、装置及存储介质 | |
CN106971731B (zh) | 一种声纹识别的修正方法 | |
Ravindran et al. | Boosting as a dimensionality reduction tool for audio classification | |
Shen et al. | Max-Pooling Based Self-Attention with Transformer for Speaker Verification | |
CN117750148A (zh) | 一种戏曲字幕识别方法及系统、电子设备、存储介质 | |
JP2890753B2 (ja) | 特徴選択方法 | |
CN115881135A (zh) | 说话人确定方法、装置、电子设备及存储介质 | |
JP2755738B2 (ja) | 文字認識装置 | |
JPS62144200A (ja) | 連続音声認識装置 | |
CN115374769A (zh) | 词语的对齐方法、装置、电子设备及介质 | |
JPH1185179A (ja) | 統計的言語モデルの作成方法 | |
JP2602271B2 (ja) | 連続音声中の子音識別方式 | |
JPS6346496A (ja) | 音声認識装置 | |
JPS6315295A (ja) | 音声認識装置 | |
JPH05216938A (ja) | 仮想ファイルの検索方式 |