JPS6344239B2 - - Google Patents

Info

Publication number
JPS6344239B2
JPS6344239B2 JP56014147A JP1414781A JPS6344239B2 JP S6344239 B2 JPS6344239 B2 JP S6344239B2 JP 56014147 A JP56014147 A JP 56014147A JP 1414781 A JP1414781 A JP 1414781A JP S6344239 B2 JPS6344239 B2 JP S6344239B2
Authority
JP
Japan
Prior art keywords
word
words
signal
pattern
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56014147A
Other languages
English (en)
Other versions
JPS57128400A (en
Inventor
Takao Watanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56014147A priority Critical patent/JPS57128400A/ja
Publication of JPS57128400A publication Critical patent/JPS57128400A/ja
Publication of JPS6344239B2 publication Critical patent/JPS6344239B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は単語音声認識装置に関し、特に不特定
多数の利用者が話す単語音声を識別し認識する単
語音声認識装置に関する。
利用者が話す単語音声を分析して得られる音声
パターンは、話者の発声速度の変動に対応する時
間軸上のパターンの変動を有する。このような変
動をもつ音声パターンを予め登録された標準パタ
ーンと照合して両者の類似度を算定する方法とし
て、動的計画法を用いる時間軸正規化マツチング
方式(特願昭45−53896号明細書)がある。この
方式により特定話者の単語音声を精度良く認識す
ることができる。しかしこの方式は、予め登録さ
れた標準パターンとのマツチングをとる方式であ
るため、不特定話者の単語音声の認識を行なうた
めには厖大な演算量を必要とし装置の規模が大き
くなりまた演算時間が長くなり、不特定話者を対
象とする装置には適さないという問題点がある。
この問題点を解決するものとして、認識する対象
の単語群において各単語の音韻構造の特徴を抽出
して各単語を他の単語から識別できるような時点
の系列を選定しておき、その系列の各時点ごとの
音声パターンのみをサンプリングすることにより
音声パターンの時間軸でのデータ圧縮を行ない同
時に時間軸正規化を行なう装置(特願昭52−
82584号および特願昭52−82585号明細書)があ
る。
第1図は前記の単語音声認識装置(特願昭52−
82585明細書)を示すブロツク図である。同図に
おいて入力端1から入力された音声信号は音声パ
ラメータ抽出部2において予め定めた周期で周波
数分析されて、その結果得られる各周期ごとの音
声パラメータがベクトルの時系列の形で処理部3
へ送られる。バツフア4はメモリーであり、認識
すべき各単語(または各単語群)の単語テーブル
が格納されている。単語テーブルは、認識すべき
単語(または単語群)ごとにその音韻構成を代表
できるような時点の系列を示す情報すなわち各単
語(または各単語群)ごとのサンプリング情報の
テーブルである。処理部3へ送られた音声パラメ
ータの時系列は、処理部3においてバツフア4内
の単語テーブルすなわち各単語ごとのサンプリン
グ情報のテーブルに示されている時点における部
分だけをサンプリングされ時間圧縮を受けてパタ
ーンベクトルとして送出される。パターンベクト
ルの個数は単語テーブルの個数に等しい。なお処
理部3においては、前記のサンプリングによる時
間圧縮と同時に時間軸上でのパターンの変動の正
規化をも行なう(特願昭52−82584号明細書)。バ
ツフア6はメモリーであり、認識すべき各単語
(または各単語群)の識別関数の係数ベクトル
(または標準パターン)が格納されている。内積
演算部5は複数個のパターンベクトルを受けて、
各パターンベクトルとそれに対応する単語の識別
関数の係数ベクトル(または標準パターン)との
内積を計算して、これらの内積値を送出する。従
つて送出される内積値の個数はパターンベクトル
の個数に等しい。判別部7は複数個の内積値の大
小を比較して最も大きな値をとるパターンベクト
ルに対応する単語(または単語群)を表示する番
号(またはコード)を、また必要であればその内
積値をともに、出力端8から識別結果として出力
する。
以上説明した如く音声パラメータの時系列から
各単語ごとに該単語を他の単語から識別するに足
りるだけの部分時系列すなわち前記パターンベク
トルを抽出して時間圧縮を行なうことによつて、
動的計画法を用いる方法に比べて少ない演算量で
単語音声の認識を行なうことができる。しかしな
がら第1図の装置において、認識対象語いすなわ
ち識別して認識すべき対象とする単語の集まりの
中に類似度の高い単語が存在する場合には、それ
らの単語を識別するための演算量が増大する。す
なわち、認識対象語いの中で類似度の高い単語が
増えるとそれらの単語を第1図の装置により一括
して処理し識別するためには、類似度の高い単語
の差異を識別できるように音声パターンをサンプ
リングする時点の個数を著しく増やさなければな
らない。これに伴なつて演算量も厖大なものとな
り、装置の規模が大きくなりかつ演算時間が長く
なるという問題点がある。
本発明の目的は、前記の問題点を解決して類似
度の高い単語を含む語いに対しても識別能力が高
くかつ小形な単語音声認識装置を提供することに
ある。
本発明の装置は、入力単語の音声信号を分析し
た第1の信号を送出する手段と、前記第1の信号
を受けて予め定めた認識対象語いのうち前記入力
単語との類似度が高い複数(m)個の単語を選択
する手段と、前記複数(m)個の単語のうちから
複数(n)個の単語(ただしn<m)を組合せた
複数(mCn)個の単語対ごとに該単語対に含ま
れる複数(n)個の単語を互いに識別するための
サンプリング情報を格納する手段と、前記単語対
ごとに前記サンプリング情報により前記第1の信
号をサンプリングした複数(mCn)個の第2の
信号を送出する手段と、前記第2の信号を受けて
これに対応する前記単語対のうち前記第2の信号
との類似度が最も高い単語を選択する複数
(mCn)個の識別手段と、前記識別手段が選択し
た単語のうち最多数の単語を示す信号を出力する
手段とを有する。
次に図面を参照して本発明を詳細に説明する。
第2図は本発明の一実施例を示すブロツク図で
ある。入力端1から入力した音声信号は音声パラ
メータ抽出部2において音声分析されて、その結
果得られる音声パラメータがベクトルの時系列の
形で予備選択部11および処理部12へ送られ
る。予備選択部11は第1図の装置のうち処理部
3よりあとの部分と同様の構成である。すなわち
予備選択部11は、音声パラメータをサンプリン
グし時間圧縮してパターンベクトルを送出する処
理部と、単語テーブルを格納するバツフアと、各
単語の識別関数の係数ベクトル(または各単語の
標準パターン)を格納するバツフアと、各パター
ンベクトルとそれに対応する単語の識別関数の係
数ベクトル(または標準パターン)との内積を計
算する内積演算部と、これらの内積の大小を比較
判別する判別部とから構成される。予備選択部1
1のバツフア内の単語テーブルは、類似度の低い
単語の対は完全に識別しまた類似度の高い単語の
対は大まかに識別できる程度に、各単語ごとのサ
ンプリング情報を含んでいる。従つて予備選択部
11での演算量は、全部の単語を完全に識別でき
るようにした場合と比べて著しく減らすことがで
きる。予備選択部11へ送られた音声パラメータ
はサンプリングされて複数個のパターンベクトル
となり、各パターンベクトルはそれに対応する単
語の識別関数の係数ベクトル(または標準パター
ン)との内積演算を施される。内積の値の大きい
方から上位の3個のパターンベクトルに対応する
単語を表示する番号(またはコード)が予備選択
部11から処理部12へ送られる。記憶部13は
メモリーであり、認識対象語いの中から2個の単
語をとつた単語対ごとにその2個の単語を互いに
識別できるようなサンプリング情報のテーブル
(以下では単語対テーブルと略称する)が格納さ
れている。予備選択部11から3個の単語を表示
する番号l1、l2、l3が送られると、それを受けた
処理部12は音声パラメータ抽出部2から送られ
る音声パラメータの時系列のうち番号の対(l1
l2)、(l2、l3)および(l3、l1)に対応する単語対
テーブルに示される時点の部分だけをサンプリン
グした3個のパターンベクトルをそれぞれ識別部
51,52および53へ送る。識別部51,52
および53はそれぞれ、第1図の内積演算部5と
同様に各パターンベクトルとそれに対応する単語
の識別関数の係数ベクトル(または標準パター
ン)との内積を計算してその値を送出する内積演
算部と、第1図の判別部7と同様に内積の値を比
較して最も大きな値をとるパターンベクトルに対
応する単語の識別番号(またはコード)を送出す
る判別部とから成る。記憶部14はメモリーであ
り、処理部12が送出するパターンベクトルを識
別するための識別関数の係数ベクトル(または標
準パターン)が格納されている。識別部51は1
個のパターンベクトルを受けて、そのパターンベ
クトルと番号l1に対応する単語の識別関数の係数
ベクトルとの内積P1およびパターンベクトルと
番号l2に対応する単語の識別関数の係数ベクトル
との内積P2とを計算し、P1>P2すなわちパター
ンベクトルが番号l1の単語のものに近いと判別さ
れたときは(1、0、0)またP1<P2すなわち
パターンベクトルが番号l2のものに近いと判別さ
れたときは(0、1、0)の2進3ビツトのコー
ドを送出する。同様にして識別部52および53
もそれぞれ1個のパターンベクトルを受けて、そ
のパターンベクトルが番号l1の単語に近いと判別
されたときは(1、0、0)、番号l2の単語に近
いと判別されたときは(0、1、0)、また番号
l3の単語に近いと判別されたときは(0、0、
1)のコードを比較判定部15へ送る。
第3図は第2図のブロツク図のうち比較判定部
15の部分を示すブロツク図である。識別部5
1,52および53から送られるコードはそれぞ
れ2進3ビツトのレジスタ21,22および23
へ送られる。演算部20はレジスタ21,22お
よび23の内容を各ビツトごとに独立に加算して
その結果を3桁のアキユームレータ24へ送る。
アキユームレータ24の各桁は2進2ビツトでレ
ジスタ21,22および23の各ビツトを加算し
た値が入れられる。識別テーブル25はメモリー
であり、予備選択部11から送られる番号l1、l2
およびl3を格納する。出力部26はアキユームレ
ータ24の内容を判定して、それが(10、0×、
0×)ならば番号l1を、(0×、10、0×)なら
ば番号l2をまた(0×、0×、10)であれば番号
l3を送出する。ただし、前記の×は0または1を
表わす。また前記のいずれにも該当しないときは
出力部26は予め定めた識別不能を表わす信号を
送出する。
このようにして第2図において比較判定部15
は、3つの識別部51,52および53のうち2
つの識別部の識別結果が一致したときその識別結
果を示す信号を出力端8から出力する。第2図に
おいて記憶部13に格納されている単語対テーブ
ルは2個の単語を互いに識別するためのサンプリ
ング情報のテーブルであるから、その2個の単語
の類似度が高い場合でもそれを識別するためのサ
ンプリング時点の個数は少なくてすむ。例えば類
似度の高い単語の対として「エイ」と「レイ」を
考えると、これを互いに識別するには単語の語頭
の近傍のみをサンプリングするようなサンプリン
グ情報を与えておけばよい。従つて、予備選択部
11が選択した複数個の単語から2個ずつ組合せ
た単語対を作り単語対ごとの識別を行なうことに
よつて、類似度の高い単語を含む語いに対しても
少ない演算量で精度よく単語の識別を行なうこと
ができ、不特定話者を対象とする装置へ適用する
ことができる。なお本実施例においては、予備選
択部11が送出する単語の個数を3個とし、また
単語対に含まれる単語の個数を2個としている
が、これらに限定する必要はなく複数個ずつと
し、前者が後者より多ければよい。
以上の説明により明らかな如く、本発明には類
似度の高い単語を含む語いに対しても識別能力が
高く、かつ小形な単語音声認識装置を構成するこ
とができるという効果がある。
【図面の簡単な説明】
第1図は従来の単語音声認識装置を示すブロツ
ク図、第2図は本発明の一実施例を示すブロツク
図および第3図は第2図の中の比較判定部15の
部分を示すブロツク図である。 図において、1……入力端、2……音声パラメ
ータ抽出部、11……予備選択部、12……処理
部、13,14……記憶部、51,52,53…
…識別部、15……比較判定部、8……出力端。

Claims (1)

    【特許請求の範囲】
  1. 1 入力単語の音声信号を分析した第1の信号を
    送出する手段と、前記第1の信号を受けて予め定
    めた認識対象語いのうち前記入力単語との類似度
    が高い複数(m)個の単語を選択する手段と、前
    記複数(m)個の単語のうちから複数(n)個の
    単語(ただしn<m)を組合せた複数(mCn)
    個の単語対ごとに該単語対に含まれる複数(n)
    個の単語を互いに識別するためのサンプリング情
    報を格納する手段と、前記単語対ごとに前記サン
    プリング情報により前記第1の信号をサンプリン
    グした複数(mCn)個の第2の信号を送出する
    手段と、前記第2の信号を受けてこれに対応する
    前記単語対のうち前記第2の信号との類似度が最
    も高い単語を選択する複数(mCn)個の識別手
    段と、前記識別手段が選択した単語のうち最多数
    の単語を示す信号を出力する手段とを有すること
    を特徴とする単語音声認識装置。
JP56014147A 1981-02-02 1981-02-02 Word voice recognition apparatus Granted JPS57128400A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56014147A JPS57128400A (en) 1981-02-02 1981-02-02 Word voice recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56014147A JPS57128400A (en) 1981-02-02 1981-02-02 Word voice recognition apparatus

Publications (2)

Publication Number Publication Date
JPS57128400A JPS57128400A (en) 1982-08-09
JPS6344239B2 true JPS6344239B2 (ja) 1988-09-02

Family

ID=11853031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56014147A Granted JPS57128400A (en) 1981-02-02 1981-02-02 Word voice recognition apparatus

Country Status (1)

Country Link
JP (1) JPS57128400A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2757356B2 (ja) * 1986-12-12 1998-05-25 株式会社日立製作所 単語音声認識方法および装置
JPS63201699A (ja) * 1987-02-18 1988-08-19 株式会社日立製作所 音声認識装置

Also Published As

Publication number Publication date
JPS57128400A (en) 1982-08-09

Similar Documents

Publication Publication Date Title
US4905287A (en) Pattern recognition system
US5353377A (en) Speech recognition system having an interface to a host computer bus for direct access to the host memory
US4910784A (en) Low cost speech recognition system and method
US6038535A (en) Speech classifier and method using delay elements
US6032115A (en) Apparatus and method for correcting the difference in frequency characteristics between microphones for analyzing speech and for creating a recognition dictionary
EP0112717A1 (en) Continuous speech recognition apparatus
CA1329275C (en) Speaker identification
US4426551A (en) Speech recognition method and device
JP2980026B2 (ja) 音声認識装置
US5274739A (en) Product code memory Itakura-Saito (MIS) measure for sound recognition
JPS6344239B2 (ja)
US6134525A (en) Identification-function calculator, identification-function calculating method, identification unit, identification method, and speech recognition system
US5930748A (en) Speaker identification system and method
US4790017A (en) Speech processing feature generation arrangement
JPS6312312B2 (ja)
JPS6129518B2 (ja)
JP3098157B2 (ja) 話者照合方法及び装置
JPS645320B2 (ja)
JPS59131999A (ja) 音声認識装置
JPS59111699A (ja) 話者認識方式
JP3144203B2 (ja) ベクトル量子化装置
JPS6336678B2 (ja)
JP2577891B2 (ja) 単語音声予備選択装置
JPS6115440B2 (ja)
JP3515143B2 (ja) パターン追加登録装置