JPS6177899A - 標準パタ−ン作成法 - Google Patents

標準パタ−ン作成法

Info

Publication number
JPS6177899A
JPS6177899A JP59199448A JP19944884A JPS6177899A JP S6177899 A JPS6177899 A JP S6177899A JP 59199448 A JP59199448 A JP 59199448A JP 19944884 A JP19944884 A JP 19944884A JP S6177899 A JPS6177899 A JP S6177899A
Authority
JP
Japan
Prior art keywords
cluster
sample
patterns
distance
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59199448A
Other languages
English (en)
Inventor
保屋野 純
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59199448A priority Critical patent/JPS6177899A/ja
Publication of JPS6177899A publication Critical patent/JPS6177899A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は不特定話者用の音声認識などに使用されるクラ
スタリングの手法を用いた標準パターンの作成法に関す
るものである。
〔従来技術とその問題点〕
この発明による標準パターン作成法で磯シ扱えるパター
ンは、パターン間の距離が定義されていればどのような
パターンでもよいが、以下では代表的な例として不特定
話者用の音声認識(7)標4パターンについて説明する
不特定話者が発声した単語音声を認識する方式として、
各単語毎に多数話者のパターンから代表的な複数のパタ
ーンを選んで蓄えておき。
未知入力音声のパター7とこれらのパターンとのマツチ
ングを行って最も距離の近いパターンの単語を認識結果
とする方式がある。この時多数話者のパターンから代表
的なパターンを選択するのにクラスタリングの手法が用
いられる(たとえばLAWRENCE R,RABIN
ER: 5psakar −Independent 
Recognition of l5olated W
ords UsingClustering Tech
niques、 IEEE Trans、 ASSP−
27゜4、p336.1979)。 クラスタリングの
手法としてに平均アルゴリズムがあるが、これは次のよ
うなステップからなる(長屋:パターン情報処理、コロ
ナ社、pp、”7)。
ステップ1:■(個の初期クラスタ中心Z、 (t)、
 z、 (1)。
・・・、 Zk(11を適当に決める。
ステップ2:に回目の繰返しステップで、す/プル(χ
)を次の方法でに個のクラスタに分類する。
すべてのi=1.2.・・・IK(”J)について11
χ−zj(kll<If z−z3(k)IIであれば
χ5j(k)       ・・・・・・・・・・・・
・・・・・・(1)とする。ここにSj、(k)はz 
j−(k)をクラスタ中心とするサンプル集合である。
ステップ5ニステツプ2で得られたS j (k)の新
しいクラスタ中心をz j(k+ 1 )として*  
J”L2+・・・、Kに対して を最小にするようにz i (k + 1 )を決める
ステップ4:すべてのj=1,2.・・・、Kに対して
2・(k + 1 ) =z j(k)となればアルゴ
リズムは収束コ したものとして終了する。そうでなければステップ2に
戻る。
第2図は従来の標準パターン作成法を実行するだめの回
路構成を示す図である。(χ)であられされるサンプル
11は、初期設定部12の初期クラスフ中心作成部13
に入力され、i設定部14によりサンプルの先頭からに
個或いはランダムにに個選ばれて初期クラスタ中心が決
められ(第1ステツプ)、に初期設定部15でに=1に
され。
Z J (k)であられされるクラスタ中心16となる
このクラスタ中心16はサンプル11と共にクラスタ判
定部17に入力され、以下あとに詳しく説明するが、こ
こで第2のステップを実行し、更にクラスタ中心判定部
18で第5のステップを実行し、z j(k + 1 
)であられされるに+1回目のクラスタ中心19を決め
る。収束条件比較部加はステップ4の収束条件をチェッ
クし、収束条件を満足している場合はアルゴリズムは収
束したものとしてZ j(”)を出力端21に出力し、
満足されていなければにカウンタnでに=にII した
のち第2のステップおよび第3のステップを繰返す。
ここでこれら第2および第5のステップの実行について
詳しく説明すると、クラスタ判定部17において、距離
計算部nはクラスタ中心16とサンプル11を入力し、
サンプル(χ)とクラスタ中心z j(k)の距離11
χ−Zj(k)IIをすべての(χ)について求め、最
小値選択回路24では前記の距離を入力し、ステップ2
で述べたように、すべてのi=1,2.・・・、K(i
+j)についてII I z i (k翔が11χ−3
i(k)Ifより小さければχ5j(k)と判定し、そ
の距離が最も小さいクラスタ中心を求めてサンプル集合
S j (k)の新しいクラスタ中心を所属クラスタ5
として出力する。中心クラスタ判定部18は加算部26
と除算部27から成り、所属クラスタ5に従って、第3
のステップのところで説明したように、  j=1.2
.・・・、Kに対して(2)式に示すJ・を最小にする
ようにz j(k+ 1 )を決める。別の表現をすれ
ば、NjをS j (k)に含まれるχの数とすると。
を計算してz 3. (k+ 1 )を決める。
以上のようにして標準パターンの作成が行われるが、先
に記したように、従来はに個のサンプルを選ぶのに、サ
ンプルの先頭からに個選んだシ、或いはランダムにに個
選んだりしていた。
このため選び方によりクラスタ中心がかたま9易く、孤
立パターンを分離しにくいという問題があった。
〔発明の目的〕
したがって本発明の目的は、孤立パターンを分離し効率
的な代表パターンを選択する標準パターン作成法を提供
することにある。
〔発明の構成〕
本発明によれば、データベースよりクラスタリングの手
法によυに個の標準パターンを作成する方法において、
に個の初期クラスタ中心としてデータベース中の相互に
最も離れたに個のサンプルを選択することを特徴とする
標準パターン作成法を得ようとするものである。
〔実施例〕
第1図は本発明の一実施例を実行するのに用いられる標
準パターン作成装置の構成を示す図である。この装置が
第2図の従来の方法を実行するための装置と異るのは、
初期クラスタを決めるだめの初期設定部の構造従って動
作が異っていることである。すなわち本発明の初期設定
部31においては、初期クラスタを決めるのに相に 互に最も距離の大きい7個のサンプルを初期クラスタ中
心に設定するために、まずサンプル間隔距離計算部32
でサンプル11の距離を計算して次に示すサンプル間距
離マトリックスを求める。
第5図はこのサンプル間距離マトリックスの説明図でち
る。この第3図において+ D(’ ! J )はサン
プルiとサンプルjとの距離であり、距離尺度としては
ユークリッド距離、チェビシェフ距離等が考えられ、い
ずれでもよい。このサンプル間距離計算部32にて算出
される距離マトリックスをもとに、最大値選択部33に
おいて相に 互に最も距離の大きい2個のサンプルを初期クラスタ中
心に設定する。
第4図は最大値選択部33をマイクロプロセッサ−で構
成した場合のプログラム70−の一例を示す図である。
この内容は第1〜第4のステップの説明と照らし合せれ
ば容易に理解できるので、説明は省略する。
この発明の有効性を明確にするために、2次元データに
てクラスタリング例を従来法と比較して実行した、K次
元データとして92個の音声サンプルから先頭2次元だ
けをそれぞれ取シ出したものを用いた。
第5図は従来法によるクラスタリング、第6図は本発明
の方法によるクラスタリングによりおのおの15クラス
タに分けた例である。第5図の従来法では、サンプルの
集中している部分に多くのクラスタができており、右上
の孤立サンプルが分離していない。これに比較し、第6
図の本発明によるクラスタリング法では、孤立サンプル
が分離し効率的にクラスタが構成されている。
なお上記の装置はいくつかの回路を使用しているが、い
ずれも公知のディジタル回路、及びマイクロプロセッサ
−にて容易に構成できる。
〔発明の効果〕
以上の説明から明らかなように1本発明による標準パタ
ーン作成法は、初期クラスタ中心として相互に最も離れ
たパターンを選択することにより、孤立パターンの分離
をよくし効率的な代表パターンを求めることができ、し
たがって認識率の高い標準パターンを作成することがで
きる。
【図面の簡単な説明】
第1図は本発明による標準パターン作成法を実行するた
めの装置のブロック回路図、第2図は従来の標準パター
ン作成法を実行する装置のブロック回路図、第6図はサ
ンプル間距離マトリックスの説明図、第4図は最大値選
択のプログラムを示すフローチャートを示す図、第5図
は従来法によるクラスタリング例を示す図、第6図は本
発明によるクラスタリング例を示す図である。 記号の説明:11はサンプル、12は初期設定部。 13は初期クラスタ中心作成部、15はに初期設定部、
 16はクラスタ中心、17はクラスタ判定部。 18はクラスタ中心判定部、19は21回目のクラスタ
中心、 20は収束条件比較部、21は出力端、22は
にカウンタ、31は初期設定部、32はサンプル間距離
計算部、33は最大値選択部をそれぞれあ第5図 DIMEMSION  I 第6図 DIMEMSION  +

Claims (1)

    【特許請求の範囲】
  1. 1、データベースよりクラスタリングの手法によりK個
    の標準パターンを作成する方法において、K個の初期ク
    ラスタ中心として前記データベース中の相互に最も離れ
    たに個のサンプルを選択することを特徴とした標準パタ
    ーン作成法。
JP59199448A 1984-09-26 1984-09-26 標準パタ−ン作成法 Pending JPS6177899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59199448A JPS6177899A (ja) 1984-09-26 1984-09-26 標準パタ−ン作成法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59199448A JPS6177899A (ja) 1984-09-26 1984-09-26 標準パタ−ン作成法

Publications (1)

Publication Number Publication Date
JPS6177899A true JPS6177899A (ja) 1986-04-21

Family

ID=16407980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59199448A Pending JPS6177899A (ja) 1984-09-26 1984-09-26 標準パタ−ン作成法

Country Status (1)

Country Link
JP (1) JPS6177899A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63124099A (ja) * 1986-11-13 1988-05-27 日本電気株式会社 スペクトル標準パタンの作成方法
WO2003088209A1 (fr) * 2002-04-12 2003-10-23 Mitsubishi Denki Kabushiki Kaisha Systeme de navigation de voiture et dispositif de reconnaissance vocale de ce systeme

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63124099A (ja) * 1986-11-13 1988-05-27 日本電気株式会社 スペクトル標準パタンの作成方法
JPH0785200B2 (ja) * 1986-11-13 1995-09-13 日本電気株式会社 スペクトル標準パタンの作成方法
WO2003088209A1 (fr) * 2002-04-12 2003-10-23 Mitsubishi Denki Kabushiki Kaisha Systeme de navigation de voiture et dispositif de reconnaissance vocale de ce systeme

Similar Documents

Publication Publication Date Title
Levinson et al. Interactive clustering techniques for selecting speaker-independent reference templates for isolated word recognition
JP4828091B2 (ja) クラスタリング方法プログラム及び装置
Flamary et al. Spoken WordCloud: Clustering recurrent patterns in speech
WO2021072893A1 (zh) 一种声纹聚类方法、装置、处理设备以及计算机存储介质
JPS6177899A (ja) 標準パタ−ン作成法
JPH10143613A (ja) パタン認識方法
Yip et al. Aca-net: towards lightweight speaker verification using asymmetric cross attention
US20020143536A1 (en) Method for generating candidate word strings in speech recognition
CN115472181A (zh) 基于特征融合和聚类的翻唱识别方法、装置和存储介质
US20140343944A1 (en) Method of visual voice recognition with selection of groups of most relevant points of interest
CN112017641A (zh) 一种语音处理方法、装置及存储介质
CN106971731B (zh) 一种声纹识别的修正方法
Ravindran et al. Boosting as a dimensionality reduction tool for audio classification
Shen et al. Max-Pooling Based Self-Attention with Transformer for Speaker Verification
CN117750148A (zh) 一种戏曲字幕识别方法及系统、电子设备、存储介质
JP2890753B2 (ja) 特徴選択方法
CN115881135A (zh) 说话人确定方法、装置、电子设备及存储介质
JP2755738B2 (ja) 文字認識装置
JPS62144200A (ja) 連続音声認識装置
CN115374769A (zh) 词语的对齐方法、装置、电子设备及介质
JPH1185179A (ja) 統計的言語モデルの作成方法
JP2602271B2 (ja) 連続音声中の子音識別方式
JPS6346496A (ja) 音声認識装置
JPS6315295A (ja) 音声認識装置
JPH05216938A (ja) 仮想ファイルの検索方式