JPS6125199A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS6125199A
JPS6125199A JP14618884A JP14618884A JPS6125199A JP S6125199 A JPS6125199 A JP S6125199A JP 14618884 A JP14618884 A JP 14618884A JP 14618884 A JP14618884 A JP 14618884A JP S6125199 A JPS6125199 A JP S6125199A
Authority
JP
Japan
Prior art keywords
pattern
representative
feature
registered
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14618884A
Other languages
English (en)
Inventor
福井 昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP14618884A priority Critical patent/JPS6125199A/ja
Publication of JPS6125199A publication Critical patent/JPS6125199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は音声認識方式に関し、特に認識ずべき音声の特
徴パターンと予め登録されている複数の特徴パターンと
の距離計算を行って音声を識別する音声認識方式に関す
る。
従来技術 従来、特定話者用の音声認識装置では、まず、認識の対
象となる単語等の音声を登録して認識時に登録された特
徴パターンと入力音声の特徴パターンとを比較し、距離
が最も小さいものを認識結果とするのが一般的である。
この方法では、語灸が増大すると、比較すべき特徴パタ
ーンが増して認識に要する時間が長くなることから、比
較するパターンをいくつかのグループに予め分けでおき
、認識の対象とする器素を制限していくつかのグループ
に属する特徴パターンとのみ比較するようにし゛たり、
また距離計算の途中で距離が予め定められた閾値を越え
た場合に、その特徴パターンとの距離計算を途中で打切
ったりして時間短縮を計っている。
また、特定話者用の音声認識装置では、特徴パターンを
予め大型田算機等でクラスタリングした後に登録して入
力音声の特徴パターンと各クラスタの代表パターンとの
距離を比較し、この距離が予め定めた値以下の代表パタ
ーンのクラスタに属する特徴パターンとのみ入力音声の
特徴パターンを比較したりりる方法がとられている。
しかし、前者の特定話者用の方法では、短時間に認識で
きる語乗数にかなり制限があり、不特定話者用のクラス
タリングでは、かなりの計算量が必要であり、クラスタ
リングを音声認識装置上で行うのは困難である。
発明の目的 本発明は音声認識装置上で容易に簡易クラスタリングを
行い大語寅の認識を短時間でなし得る音声認識方式を提
供することを目的としている。
発明の構成 本発明による音声認識方式は、認識されるべき音声の特
徴パターンと予め登録されている複数の音声の特徴パタ
ーンとの距離計算を行うことにより音声認識判定をなす
ようにした音声認識1ノ式であって、音声登録時には入
力音声の特徴パターンをすでに登録されている特徴パタ
ーンの代表パターンと比較してこの代表パターンとの距
離が所定閾値以下のとき入力音声の特徴パターンをこの
代表パターンと同しクラスタに属させて登録し、当該閾
値以下となる代表パターンが存在しないときは入力音声
のパターンを代表パターンとし−C登録し、音声認識時
には入力音声の特徴パターンを登録されている代表パタ
ーンと比較して、この代表パターンとの距離が当該閾値
の少なくとも2倍以内の代表パターンのクラスタに属す
る特徴パターンと入力音声の特徴パターンとを比較する
ようにしたことを特徴とする。
実施例 以下に、図面を使用して本発明の詳細な説明する。
♂は本発明の実施例の概略ブロック図であり、入力端子
1から入力された音声は分析回路2において特徴パター
ンが抽出ざる。パターンメモリ3は特徴パターンを蓄え
るものであり、このメモリ3に蓄えられた特徴パターン
と分析回路2により得られた特徴パターンとの距離が比
較回路4にて求められる。制御回路5はパターンメモリ
3の読み出し書込み制御や比較回路4の出力により認識
判定を行なうもので、この認識判定結果が出力端子6へ
導出される。
第2図は第1図のブロックの動作を説明するための図で
あり、特徴パターンの分布を分りやすいように2次元的
に示したものである。ai、oはクラスタAiの代表パ
ターンであり、ai、jはクラスタAiに属する特徴パ
ターンである。rはクラスタの半・径を示す距離である
音声パターンの登録時には、入力端子1から分析回路2
へ入力された音声はその特徴パターンbが求められる1
、パターンメモリ3に1つも特徴パターンが登録されC
いないときは、この入力音声の特徴パターンbは第1の
クラスタAOの代表パターンaO10としてパターンメ
モリ3に書込まれる。
パターンメモリ3に1以上の特徴パターンが書込まれて
いるときは、入力音声の特徴パターンは比較回路4にて
、パターンメモリ3に書込まれているクラスタの代表パ
ターンai、O(i=0.1,2,3.・・・)と順次
距離計算される。この距離が閾値1以内であって代表パ
ターンai、0のクラスタAi内に属づ−るものであれ
ば、この入力音声の特徴パターンは当該クラスタAiに
登録されるが、このときこのクラスタAi内に特徴パタ
ーンがai、0からai、jまですでにあれば、この入
力音声の特徴パターンbはクラスタAiの新しい特徴パ
ターンai、j+1としてメモリ3に登録される。
入力音声の特徴パターンbとクラスタの代表パターンと
の距離が2以上のクラスタの半径r以内であれば、これ
等クラスタのいずれか1つに属するように登録する。入
力音声の特徴パターンbがどのクラスタの代表パターン
との距離rよりも大なるときは、この特徴パターンbを
新しいクラス夕の代表パターンとして登録する。
音声認識時には、入力音声は登録時と同様に、入力端子
1から分析回路2へ入力されてその特徴パターンbが求
められる。この特徴パターンbはまずパターンメモリ3
に登録されでいるクラスタの全ての代表パターンとの距
@diが比較回路4により求められる。次に、クラスタ
半径rの少なくとも2倍(各クラスタの直径に相当)の
値りを予め設定しておき、diがこの値り以下となった
クラスタA1に含まれる特徴パターンai、jと特徴パ
ターンbとを順次比較し、距離d i 、 j h’最
小となったパターンai、jが認識結果となる。クラス
タの代表パターンai、Oと特徴パターンbとの距離が
0以上の場合にはai、jどbとは比較されないので、
Dはリジェクト(認識不能)値にクラスタ半径rを加え
た値よりも大きくなりればならない。
尚、制御回路5は、音声パターン登録時、音声パターン
認識時に比較回路4の出力である距離によってパターン
メモリ3のアドレスを制御してパターンメモリ3のデー
タ読み出し及び書込みの制御をなすものである。また、
認識時比較回路4の出力によって認識結果の出力制御を
もなす。
発明の効果 本発明によれば、認識時に入力音声の特徴パターンbと
比較しなければならないパターンの数は、リジェクト値
にクラスタ半径rを加えた範囲内の特徴パターンと、ク
ラスタの各代表パターンとに限定されるので、大語乗の
音声認識を短時間で実現できるという効果がある。
【図面の簡単な説明】
第1図は本発明の実施例のプロyり図、第2図は第1図
のブロックの動作を説明するための特徴パターンの分布
態様を示す図である。 主要部分の符号の説明 2・・・・・・音声分析回路 3・・・・・・パターンメモリ 4・・・・・・比較回路

Claims (1)

    【特許請求の範囲】
  1. 認識されるべき音声の特徴パターンと予め登録されてい
    る複数の音声の特徴パターンとの距離計算を行うことに
    より音声認識判定をなすようにした音声認識方式であっ
    て、音声登録時には入力音声の特徴パターンをすでに登
    録されている特徴パターンの代表パターンと比較してこ
    の代表パターンとの距離が所定閾値以下のとき前記入力
    音声の特徴パターンを前記代表パターンと同じクラスタ
    に属させて登録し、前記閾値以下となる代表パターンが
    存在しないときは前記入力音声のパターンを代表パター
    ンとして登録し、音声認識時には入力音声の特徴パター
    ンを登録されている代表パターンと比較してこの代表パ
    ターンとの距離が前記閾値の少なくとも2倍以内の代表
    パターンのクラスタに属する特徴パターンと入力音声の
    特徴パターンとを比較するようにしたことを特徴とする
    音声認識方式。
JP14618884A 1984-07-14 1984-07-14 音声認識方式 Pending JPS6125199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14618884A JPS6125199A (ja) 1984-07-14 1984-07-14 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14618884A JPS6125199A (ja) 1984-07-14 1984-07-14 音声認識方式

Publications (1)

Publication Number Publication Date
JPS6125199A true JPS6125199A (ja) 1986-02-04

Family

ID=15402123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14618884A Pending JPS6125199A (ja) 1984-07-14 1984-07-14 音声認識方式

Country Status (1)

Country Link
JP (1) JPS6125199A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02135585A (ja) * 1988-11-16 1990-05-24 Fujitsu Ltd 色識別回路
JPH02137079A (ja) * 1988-11-18 1990-05-25 Fujitsu Ltd 色識別回路
WO2002080141A1 (fr) * 2001-03-30 2002-10-10 Sony Corporation Appareil de traitement du son

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02135585A (ja) * 1988-11-16 1990-05-24 Fujitsu Ltd 色識別回路
JPH02137079A (ja) * 1988-11-18 1990-05-25 Fujitsu Ltd 色識別回路
WO2002080141A1 (fr) * 2001-03-30 2002-10-10 Sony Corporation Appareil de traitement du son
US7228276B2 (en) 2001-03-30 2007-06-05 Sony Corporation Sound processing registering a word in a dictionary

Similar Documents

Publication Publication Date Title
CN109448725A (zh) 一种语音交互设备唤醒方法、装置、设备及存储介质
CN108630193A (zh) 语音识别方法及装置
Lukashevich Towards Quantitative Measures of Evaluating Song Segmentation.
JPS62133500A (ja) 音響信号から導かれた電気信号を区分する方法及び装置
CN113380247A (zh) 多音区语音唤醒、识别方法和装置、设备、存储介质
JPS6125199A (ja) 音声認識方式
WO2022158824A1 (en) Method and device for controlling electronic apparatus
CN105719650A (zh) 一种语音识别的方法及系统
JPS6135494A (ja) 音声認識処理装置
JPS6332596A (ja) 音声認識装置
JP2569304B2 (ja) 声音認識装置
JPH07101382B2 (ja) マ−ジ処理装置
JPS62206596A (ja) 音声認識システム
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JPS59107400A (ja) 音声認識方法
CN115963999A (zh) 一种基于分类模型的数据存储节能方法
JPS5731066A (en) Memory access controlling system
CN114500140A (zh) 用于语音设备唤醒的方法、装置、平台设备及存储介质
CN115691474A (zh) 一种说话人音频分离方法、终端设备及存储介质
JPS6265088A (ja) 不特定話者用音声認識装置
CN111583956A (zh) 语音处理方法和装置
CN115862642A (zh) 一种听歌识人方法、终端设备及存储介质
JPS61136181A (ja) 文字認識装置用辞書作成方法
JPS6084598A (ja) 音声入力装置
JPS61251983A (ja) 認識装置