JPS61163396A - 音声辞書パタ−ン作成方式 - Google Patents

音声辞書パタ−ン作成方式

Info

Publication number
JPS61163396A
JPS61163396A JP60004456A JP445685A JPS61163396A JP S61163396 A JPS61163396 A JP S61163396A JP 60004456 A JP60004456 A JP 60004456A JP 445685 A JP445685 A JP 445685A JP S61163396 A JPS61163396 A JP S61163396A
Authority
JP
Japan
Prior art keywords
patterns
dictionary
pattern
speech
dictionary pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60004456A
Other languages
English (en)
Inventor
佐々部 昭一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60004456A priority Critical patent/JPS61163396A/ja
Publication of JPS61163396A publication Critical patent/JPS61163396A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 栽」りとJ 本発明は、パターンマツチング方式の音声認識システム
における辞書パターン作成方式に関する。
l米1権 パターンマツチング方式の音声認識システムは。
入力パターンと予め登録されている辞書パターンとのマ
ツチングを行い、該類似度あるいは距離によって入力パ
ターンを識別している。音声では同一音声でも発声の差
異、個人差により多数の異なるパターンが存在する。認
識対象カテゴリ毎に該多数のパターンを辞書として登録
することはパターンマツチングの処理時間を増大するこ
とになる。
辞書パターン数を減らし、認識精度の高いものとするに
は、カテゴリー毎に複数の音声パターンを選別して重み
付けを行い、辞書パターンとして登録することが有効で
あるが、その場合、辞書作成用の多数のパターンから辞
書パターン作成に用いるパターンを選択する方法が辞書
の性能に対して特に重要となる。しかし、これまで、適
切な辞書作成用パターンの選択と重み付け辞書パターン
の作成とを行う方式がなかった。
なお、クラスタリング手法を使用した音声認識装置とし
て1例えば、特開昭58−223193号公報があるが
、この公報に記載された音声認識装置においては、標準
パターン群をまとめてクラスタリングを行い、クラスタ
リングによって得られた中心を一代表標準パターンとす
るものであり。
従って、に個の代表標準パターンガ選ばれる。これに対
して、後述する本発明は、標準パターン群を認識対象と
なるカテゴリー(例えば認識単語「移動」 「印刷」・
・・・・・のようなカテゴリー)に分けた後、各カテゴ
リー毎にクラスタリングを行い、各カテゴリーでのクラ
スタリングにより得られた複数の中心パターンを用いて
重み付けをして各カテゴリーに一つの標準パターンを作
成するものであり、従って、標準パターンの数はカテゴ
リー数となる。
旦−−」q 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、パターンマツチング方式の音声認識システムにお
ける辞書パターン作成において。
辞書ハターン作成用のパターンを容易にかつ客観的に選
択して誤認識の少ない性能の良い辞書パターンを作成す
る方式を提供することを目的としてなされたものである
構   成 本発明は、上記目的を達成するため、入力音声の特徴を
抽出した入力パターンと予め登録された辞書パターンと
のマツチングを行って音声を認識する音声認識システム
において、辞書作成用パターン群を認識対象カテゴリー
毎にクラスタリング手法によって複数のグループに分割
し、各グループ毎にその中心を求め、該中心となる複数
のパターンを用いて重み付けをした辞書パターンを作成
することを特徴としたものである。以下、本発明の実施
例に基づいて説明する。
前記特開昭58−223193号公報に開示された音声
認識装置は、標準パターン群をクラスタリングし、その
中心を代表標準パターンとするものであるが、これは本
発明において、カテゴリーに分けることに相当するもの
であり1本発明では、さらにカテゴリー毎にクラスタリ
ングすることにより複数の中心パターンを得、これらに
より重み付けをしてカテゴリーに1つの標準パターンを
作成するようにしており、これにより発声の相違、個人
性などの変動要因を吸収しやすくしたものである。
すなわち、本発明による音声辞書パターン作成方式は、
辞書作成用パターン群を認識対象カテゴリー毎にクラス
タリング手法によって複数のグループに分割し各グルー
プ毎に中心を求め、該中心となる少なくとも2個のパタ
ーンを加重平均して辞書パターンとして登録するように
したものである。
第1図は1本発明の実施に使用する電気回路の一例を示
すブロック線図で、図中、lはマイクロホン、2は分析
部、3はデータ記憶部、4、はクラスタリング部、5は
荷重平均部、6は辞書パターン部で、マイクロホンlか
ら入ってくる音声を分析部2で分析して特徴抽出し、そ
の音声パターンをデータ記憶部3に記憶1M積する。こ
のようにして多数の不特定な話者の音声パターンを記録
した後、同一なL!&mカテゴリーのパターンについて
クラスタリング部4でクラスタリングを行い、その中心
パターンを荷重平均部5で荷重平均して辞書パターンと
して辞書パターン部6に登録する。
第2図は、本発明の動作説明をするための図で。
図中、Aは辞書作成用パターン群で、先づ、該辞書作成
用パターン群AをカテゴリーC1,C2・・・CN毎に
収集し、各カテゴリー毎にクラスタリング手法によりグ
ループGl + G2 r・・・、Gkに分割し、該グ
ループの中心のパターンP1pP2+・・・、1)l−
を求める(k≧2)。K個の中心のパターンを加重平均
して各カテゴリー毎に辞書パターンSc1 、 Sc2
 、・・・、Sc、yを作成して登録する。
また、クラスタリング手法により分割されたグループの
中心のに個のパターンPl+P2+・・・、 Pkの中
で、その相互間の類似度が規定値以下のに個のパターン
を除いたに−に個(K−に≧2)のパターンを加重平均
して辞書パターンを作成することも考えられるが、この
ようにすれば、パターンデータの切出しの誤り、ノイズ
の混入等による特異な不良パターンを排除することがで
きる。
効   果 以上の説明から明らかなように1本発明によると、音声
認識システムの辞書パターン作成において、辞書作成用
パターンをクラスタリング手法によって容易かつ客観的
に選択でき、選択されたパターンを加重平均することに
よって性能の良い辞書パターンを作成することができる
【図面の簡単な説明】
第1図は、本発明の実施に使用する電気回路の一例を示
すブロック線図、第2図は、本発明の動作説明をするた
めの図である。 1・・マイクロホン、2・・・分析部、3・・・データ
記憶部、4・・・クラスタリング部、5・・・荷重平均
部、6・・・辞書パターン部。 第  1  図 第2図

Claims (2)

    【特許請求の範囲】
  1. (1)、入力音声の特徴を抽出した入力パターンと予め
    登録された辞書パターンとのマッチングを行って音声を
    認識する音声認識システムにおいて、辞書作成用パター
    ン群を認識対象カテゴリー毎にクラスタリング手法によ
    って複数のグループに分割し、各グループ毎にその中心
    を求め、該中心となる複数のパターンを用いて重み付け
    をした辞書パターンを作成することを特徴とする音声辞
    書パターン作成方式。
  2. (2)、前記クラスタリング手法により分割して得られ
    る複数の中心のパターンの中でグループ内での相互間の
    類似度が規定値以下のパターンを除いて重み付け辞書パ
    ターンを作成することを特徴とする特許請求の範囲第(
    1)項に記載の音声辞書パターン作成方式。
JP60004456A 1985-01-14 1985-01-14 音声辞書パタ−ン作成方式 Pending JPS61163396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60004456A JPS61163396A (ja) 1985-01-14 1985-01-14 音声辞書パタ−ン作成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60004456A JPS61163396A (ja) 1985-01-14 1985-01-14 音声辞書パタ−ン作成方式

Publications (1)

Publication Number Publication Date
JPS61163396A true JPS61163396A (ja) 1986-07-24

Family

ID=11584650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60004456A Pending JPS61163396A (ja) 1985-01-14 1985-01-14 音声辞書パタ−ン作成方式

Country Status (1)

Country Link
JP (1) JPS61163396A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123468A (ja) * 1994-10-24 1996-05-17 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 不特定話者モデル作成装置及び音声認識装置
WO2008111190A1 (ja) * 2007-03-14 2008-09-18 Pioneer Corporation 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123468A (ja) * 1994-10-24 1996-05-17 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 不特定話者モデル作成装置及び音声認識装置
WO2008111190A1 (ja) * 2007-03-14 2008-09-18 Pioneer Corporation 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム
JP4897040B2 (ja) * 2007-03-14 2012-03-14 パイオニア株式会社 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム

Similar Documents

Publication Publication Date Title
WO2002103680A3 (en) Speaker recognition system ____________________________________
JPH02238495A (ja) 時系列信号認識装置
EP0326927A3 (en) Method and apparatus for processing a database
WO2006073802A3 (en) Methods and apparatus for audio recognition
CN106297776A (zh) 一种基于音频模板的语音关键词检索方法
FR2520911B1 (fr) Procede et appareil d'analyse pour la reconnaissance de parole
US4776017A (en) Dual-step sound pattern matching
US5101434A (en) Voice recognition using segmented time encoded speech
JPS61163396A (ja) 音声辞書パタ−ン作成方式
JPS5952388A (ja) 辞書照合方式
JPS6346496A (ja) 音声認識装置
JP2655637B2 (ja) 音声パターン照合方式
JPH0830960B2 (ja) 高速音声認識装置
JPS62275300A (ja) 連続音声認識方法
JPS6182282A (ja) パタ−ン認識方式
JPS63187376A (ja) パタ−ン認識装置
JPS62111292A (ja) 音声認識装置
JPH01156798A (ja) パターン類似度演算方式
JPS6059394A (ja) 音声認識装置
JPS61131184A (ja) パタ−ン認識装置
JPS6148000A (ja) 連続音声認識方式
JPS5857195A (ja) 音声認識方式
JPH04109300A (ja) 衝撃音識別装置
JPS61133995A (ja) 音声認識方式
JPS6328315B2 (ja)