JPS58115497A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPS58115497A
JPS58115497A JP56214175A JP21417581A JPS58115497A JP S58115497 A JPS58115497 A JP S58115497A JP 56214175 A JP56214175 A JP 56214175A JP 21417581 A JP21417581 A JP 21417581A JP S58115497 A JPS58115497 A JP S58115497A
Authority
JP
Japan
Prior art keywords
similarity
calculation
circuit
pattern
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56214175A
Other languages
English (en)
Other versions
JPS6360920B2 (ja
Inventor
充宏 斗谷
西岡 芳樹
岩橋 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP56214175A priority Critical patent/JPS58115497A/ja
Priority to US06/451,937 priority patent/US4596031A/en
Priority to DE8282306927T priority patent/DE3271598D1/de
Priority to EP19820306927 priority patent/EP0083226B1/en
Publication of JPS58115497A publication Critical patent/JPS58115497A/ja
Publication of JPS6360920B2 publication Critical patent/JPS6360920B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は、音声認識方式に関し、特にたとえば認識す
べき音声の特徴パターンと予め登録された複数−晴の音
声の特徴パターンとの類似度計算を順次行なってmgm
判定を行なうような音pR1!識方式に関する。
従来、認識すべき音声の特徴パターンと予め登録されて
いる複数種類の音声の特徴パターンとの類似度計算を順
次行ない、計算された各1似度を比較することによって
銀も類似度の大きい特−パターンを認識帖”果とするよ
うな音声imm方式があった。このような音声認識方式
では、認識すべき音声の特徴パターンとあまり似ていな
い登録特徴パターンについても特徴パターンの全フレー
ムに。
わたって類似度の計算が行なわれていた。そのため、無
駄な計算が多くなり、寓議効串が愚く処堰時園が増大す
るという欠点があった。
それゆえに、この発明の主たる目的は:上述のような欠
点をWI′I14シ得る音声認識方式を提供することで
ある。
この発明は、要約すれば、すでに類似度の計算が行なわ
れた特徴パターンの計りI結果に基づいてしきい値を求
め、各特徴パターンの類似度の計算過程において、その
計算としきい倫とに基づいて特定の条件になったとき、
そのときの特徴パターンについてはそれ繊機の晴領置計
算を行なわないようにし、無駄な計算な省き、処理速度
を向上させるようにしたものである。
この発明の上述の目的およびその倫の目的と特徴は、図
面を参照して行なう以下の詳細な説明から一■明らかと
なろう。
第1allはこの発明の一実施例を示すブロック図ぐあ
る。構成において、この音−認識装置10は認識すべき
音−の特徴パターンが格納される入カバターン格納装置
1と、予め複数種類の音声の特徴パターンが格納される
壷録パターン格納装置2とを含む、また、音真■麿装置
10は類似度計算回路3を含む、この類似度計算回路3
は入カバターン格納装置1に格納された**パターンと
置録パターン格納装置2に格納された置録特徴パターン
とをフレーム順次に読出しその類似度を計算する。*領
置計算回路3の計算結果は比較回路4およびレジスタ5
に与えられる。レジスタ5はすでに全フレームにわたっ
て計算が行なわれた類似度のうち最も大きい類似度(す
なわち最もよく似ていることを表わす類似度)を常に記
憶するように制御回路7によつ°【その−込が一回され
ている。
レジスタ5に記憶された類似度は関数発生1路6に与え
られる。この関数発生回路6はレジスタ5から与えられ
る類似度に基づいて所定のしきい値−数(リミット−数
)を発生し、比較回路4に与える。比較回路4は類似度
計算回路3から与えられる類似度と関数発生回路6から
与えられるリミット関数とをフレーム順次に比較し、そ
の比較結果を制御回路7に与える。この−一回路7は置
録パターン格納輪1112. II似座計算回路3.比
較回路4およびレジスタ5に関連して設けられている。
第211は第1allに示す音声認識装置10の概略的
な動作を説明するためのalIIIF図である。以下、
この第2IIIを参照して音声認識装置10の概略的な
動作について説明する。
説明を−単にするため、入力特徴パターンおよび登録特
徴パターンともに同じ時−幅の16フレームの特徴ベク
トルからなっており、各特徴ベグ。
トルをaf  = (alI e ’ tL2 e ”
”* ml−n )とし、1番目のフレームの類似度は
Sm=、■(aLL1 2liIN  atiREF>” t’表t) 2’ 
tL & J−16,コの場合、Stの値が小さいほど
類似度が大きくなっている。
また、関数発生回路6が発生する関数としては櫓々のも
のが壽えられるが、たとえば以下、に示すようなものを
用いるとする。
F  (s ) −5in  (Dx (1/4+a 
/16) 。
D)、あるいは F (−) −5in  (DX (1/a+/m /
4) 。
D) ここで、−はフレーム番号である。また、Dはりぐに最
終フレームまで計算の終了した類似度のうら最大の類似
度(レジスタ5に設定される)である。
1通のような条件のもとで、類似度計算回路3は入力特
徴パターンと登録特徴パターンとの類似度をフレーム順
次にかつIm@的に計算する。この計算過程におけるフ
レームごとの類似度の推移は第211の纏A、Bおよび
Cで示される。ここで、類似度の計“棹はフレームごと
に行なわれるが、各フレームで求められた類似S[は逐
次累積されていり、シたがって、フレームごとの計算が
進むにつれて類似度は小さくなっていき、最終の16フ
レームでJllIIされた類似度がその特徴パターンの
全体的な類似度を表わすことになる。
纏Aに注目した場合、その特徴パターンの全体的な類似
度は×1である。今、この類似*xiがすでに求められ
た全体的な類似度の中で一番大きいものであった場合、
この類似#IK×1はレジスタ5に設V!される。関数
発生回路6はこの類似度X1に基づいて上述のようなリ
ミット関数F(−)を発生する。このリミット関数F(
−)は各フレームにおける類似度の推移を予測する関数
1あり、第2図に示すようにフレームごとに値が興なる
一段状の関数となる。仁のようにして求められたすミツ
ト関数F(−)は類似度計算を続行すべきか否かのしき
い値として用いられる。たとえば、纏Bで示される類似
度畦締では、第6フレームにお番ノる類似度がリミット
関数F(−)よりも小さくなってしまう、このような場
合、纏Bの類似度計算をjlMの16フレームまで行な
ってもその全体的な類似度が纏Aの全体的な類似度×1
よりも大きくなることは確串的に楯めて小さい。そのた
め、纏Bの類似度計算は第6フレームで打切り、無駆な
計算が省かれる。
一方、纏Cで示される類似度計算のようにその計算過程
において求められる類似度がリミット関数F(―)より
も常に大きい場合、その類似度計算は第16フレームま
で行なわれる。このとき求められる全体的な類似度×2
は纏Aにおける全体的な類似*xiよりも大きいものと
なっている。
(のため、レジスタ5の肉寄はこの類似度×2に―換え
られ、関数発生回路6はこの類似1[X2に基づくりミ
ツト関数を発生する。
1述のような動作が繰り返され、登録特徴パターンの全
部の類似度計算が終了すると、レジスタ5には最も大き
な類似度が設定されていることになる。それに対応し゛
【、−一回路7は対応のffl感特徴パターンのアドレ
スを記憶しており、そのアドレスを認識結果として出力
する。
第3図は第1図の実施例の動作jkli1明するための
フローチャートである。以下、第iaoないし第3図を
参照して第1wAの実施例のざらに詳細な動作を説明す
る。
まず、制御回路7に認識スタート指令偲@pが与えられ
、認識動作を開始する。すなわち、−一回路7はステッ
プ(a承ではSと略す)1において、初期股定儒!i4
nによりレジスタ5の初期設定を行なう。この初期設定
では、レジスタ5に最小の類似度(最も似ていないこと
を示す類似度)が設定される。続いて、ステップ2にお
いて制御回路7はアドレスデータ1gにより謹録パター
ン格納装置2のアドレス指定を行ない、類似度計算すべ
き登録特徴パターンの選択を行なう、さらに、ステップ
3に1おいて輌−11117は類領置計鐸スタート指令
儂号jを畷領置計*a腸3に与え、鋼領置計紳の開始を
指令する。応じて、類似度計算l路3はステップ4にお
いて入力特徴パターンと登録特徴パターンとの1フレー
ム■の類似度を計算する。詳細には、類似度計算回路3
はフレーム番号指定データCおよびdを、それでれ、入
カバターン格納装置1および登録パターン格納@l12
に与える。このフレーム番号指定データに応答して、入
hパターン格納装置1は対応のフレーム特徴パターンデ
ータaflll装置計算回路3に与える。同様に、I録
パターン格納装置2は制御回路7にょつ−(選択された
登録特徴パターンにおける対応のル−ムの特徴パターン
データbtu装置計算回路3に与える。類似度計算回路
3は与えられた1ル−ム閤の類似度を計算する。この計
算された類似度tは比較囲路4およびレジスタ5に与え
られる。
このとき、類似度計算回路3は関数発生−路6にもフレ
ーム番号指定データeを与える。関数発生回路6はレジ
スタ5から与えられる類似データ1と類似度計算回路3
から与えられるフレーム番号指定データeとに基づいて
そのフレームにおけるリミット関数値りを発生し、比較
11114に4える。比較回路4は類似濱計棹回113
からの類似度データtと、関数発生回路6からのリミッ
ト関数値りとを比較し、リミット関数値りが類似度デー
タfよりも大きくなったとき、儂号庭を発生し、−一回
路7に与える。ステップ5において制御回路7はこの儂
号庭の有無を判断し、類似度データrがリミット関数値
りよりも小さくなったか台かを判Iiする。もし、類似
度データtがリミット関数値りよりも大きい場合、−一
回路7はステップ6において全フレームの類似度計算d
終了したか否かを判断する。この判断は、全フレームの
類似度計算が終了したとき類似度計算回路3から出h 
 ″される終了値@にの有無によって判断される。すな
わち、類似度計算回路3から終了信号m tfiaw回
路7に与えられなければ、再びステップ4ないし6の動
作を繰り返す。このとき、類領置針SO路3はフレーム
番号指定データc、dおよびeを順次更新し、そのフレ
ームにおける類似度の計算を行ない、それまでのフレー
ムの類似直に累積する。    。
一方、晴領置計III腸3から制御回路7に終了m@k
が与えられると、−御[1117は全フレームの類似度
計算が終了したと判断し、ステップ7においてそのとき
の登録特徴パターンのアドレスを記憶する。さらに、w
4m回路7はステップ8においてレジスタ5に書換え信
@Oを与え、レジスタ5に設定されている類似直をその
とき求めた登録特徴パターンの全体的な類似度に設定し
直す、Imいて、制御回路7はステップ9において晴領
置計−の停止指令信号」を出力し、類似度計算回路3に
へえる。応じて、類似度計算回路3は類似度計算を停止
する。
次に、制御回路7はステップ10においてアドレスデー
タOを更新し、登録パターン格納装置2における次の壷
録特−パターンを選択する。11いて、制御回路7はス
テップ11において登録パターン格納装置2における全
量録特徴パターンの類似度計算が終了したか否かを判断
する。もし、全量録特徴パターンの類似度計算が終了し
ていなければ、再びステップ3ないし11の動作を繰り
返す。
ここで、前述のステップ5において、類似直データrが
リミット関数値りよりも小さくなった場合の動作につい
て説明する。この場合、直ちにステップ9において類似
度計算が停止される。すなわち、第2図の纏Bで示され
る類似度計算のように類似度計算が連中で打切られる。
上述のようにして、ステップ3ないし11の動作が繰り
返され、全量録特徴パターンの類似度計算が終了すると
、制−一路7はステップ12においてそのときレジスタ
5に設定されている類似直に対応する登録特徴パターン
のアドレスqを認識結果として出方する。
なお、上述の実施例では、類似度計算回路3は入力特徴
パターンと登録特徴パターンの同一フレーム閤の類似直
(たとえばユークリッド距鍾)を計算するように説明し
たが、いわゆるOPマツチングのように最適なフレーム
園の類似直を計算するようにしてもよく、また値のマツ
チング法によって類似直を計算するようにしてもよい。
以上のように、この発明によれば、特徴パターンの類似
直の計鐸過程において、その計算としきい噛とに基づい
て特定の条件になってとき、そのときの特徴パターンに
ついてはそれ以後の類領置Jit鐸を行なわないように
しているので、認識性−を11δずに類似度計算の計算
量を非常に少なくすることができる□、したがって、認
識速度を向上することができる。
【図面の簡単な説明】
l11allはこの発明の一実施例を示すブロック図で
ある。第2図は第1−の実施例の概略的な一1γを説明
するためのai*saである。第311は第1図の実施
例の動作を説明するためのフローチャートCある。 図において、1は入カバターン格納装置、2は登録パタ
ーン格納装置、3は類似度計算回路、4は比較一路、5
はレジスタ、6&を関数発生am。 7は鯛−1路を示す。 ヘ  =4健− 詠

Claims (2)

    【特許請求の範囲】
  1. (1)  II−すべき音声のwi−パターンと予め日
    録された複数種類の音−の特徴パターンとの頬似1L!
    を算を順次行なって認識判定を行なうような幽−認識方
    式であって、 すCに類似度の計算が行なわれた特徴パターンのat綽
    IIaIIlに基づいてしきい値を求め、前記各特徴パ
    ターンの類似度の計算過程におい(、ぞの計算と前記し
    きい値とに基づいて特定の条件になったとき、そのとき
    の特徴パターンにうい(はそれ以俵の類似度計算を行な
    わないようにり、 /こことを特徴とする、音声認識方
    式。
  2. (2) 錠記計綽通程において前記特定の条件にならな
    かったとき、そのときの特徴パターンの組粋帖乗に基づ
    いて前記しきい値を求め直す、特1m京の範囲第1項記
    載の音声認識方式。
JP56214175A 1981-12-25 1981-12-28 音声認識方法 Granted JPS58115497A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56214175A JPS58115497A (ja) 1981-12-28 1981-12-28 音声認識方法
US06/451,937 US4596031A (en) 1981-12-28 1982-12-21 Method of speech recognition
DE8282306927T DE3271598D1 (en) 1981-12-25 1982-12-23 A method of speech recognition
EP19820306927 EP0083226B1 (en) 1981-12-25 1982-12-23 A method of speech recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56214175A JPS58115497A (ja) 1981-12-28 1981-12-28 音声認識方法

Publications (2)

Publication Number Publication Date
JPS58115497A true JPS58115497A (ja) 1983-07-09
JPS6360920B2 JPS6360920B2 (ja) 1988-11-25

Family

ID=16651474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56214175A Granted JPS58115497A (ja) 1981-12-25 1981-12-28 音声認識方法

Country Status (2)

Country Link
US (1) US4596031A (ja)
JP (1) JPS58115497A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988001090A1 (en) * 1986-07-30 1988-02-11 Ricoh Company, Ltd. Voice recognition
JPS6461799A (en) * 1987-09-01 1989-03-08 Nec Corp Fast voice recognition equipment

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4761807A (en) * 1982-09-29 1988-08-02 Vmx, Inc. Electronic audio communications system with voice authentication features
US4751737A (en) * 1985-11-06 1988-06-14 Motorola Inc. Template generation method in a speech recognition system
EP0302614B1 (en) * 1987-07-16 1993-03-10 Fujitsu Limited Speech recognition device
GB2207783B (en) * 1987-08-07 1991-05-22 Casio Computer Co Ltd Recording/reproducing apparatus with voice recognition function
US4984274A (en) * 1988-07-07 1991-01-08 Casio Computer Co., Ltd. Speech recognition apparatus with means for preventing errors due to delay in speech recognition
US5159637A (en) * 1988-07-27 1992-10-27 Fujitsu Limited Speech word recognizing apparatus using information indicative of the relative significance of speech features
US5263117A (en) * 1989-10-26 1993-11-16 International Business Machines Corporation Method and apparatus for finding the best splits in a decision tree for a language model for a speech recognizer
JP2795719B2 (ja) * 1990-03-07 1998-09-10 富士通株式会社 認識距離の差に基づく最良優先探索処理方法
US5727124A (en) * 1994-06-21 1998-03-10 Lucent Technologies, Inc. Method of and apparatus for signal recognition that compensates for mismatching
JP3625002B2 (ja) * 1996-12-26 2005-03-02 株式会社リコー 音声認識装置
US20120260176A1 (en) * 2011-04-08 2012-10-11 Google Inc. Gesture-activated input using audio recognition
US8255218B1 (en) 2011-09-26 2012-08-28 Google Inc. Directing dictation into input fields
US8543397B1 (en) 2012-10-11 2013-09-24 Google Inc. Mobile device voice activation
JP2018116206A (ja) * 2017-01-20 2018-07-26 アルパイン株式会社 音声認識装置、音声認識方法及び音声認識システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56823A (en) * 1979-04-26 1981-01-07 Gen Electric Manufacture of copolyester carbonate
JPS57102698A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Pattern matching apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56823A (en) * 1979-04-26 1981-01-07 Gen Electric Manufacture of copolyester carbonate
JPS57102698A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Pattern matching apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988001090A1 (en) * 1986-07-30 1988-02-11 Ricoh Company, Ltd. Voice recognition
GB2202667A (en) * 1986-07-30 1988-09-28 Ricoh Kk Voice recognition
GB2202667B (en) * 1986-07-30 1991-03-27 Ricoh Kk Voice recognition
JPS6461799A (en) * 1987-09-01 1989-03-08 Nec Corp Fast voice recognition equipment

Also Published As

Publication number Publication date
US4596031A (en) 1986-06-17
JPS6360920B2 (ja) 1988-11-25

Similar Documents

Publication Publication Date Title
JPS58115497A (ja) 音声認識方法
CA2013247C (en) Vector quantizer search arrangement
JPH10187410A (ja) データ圧縮方法及び装置
WO2004006126A1 (en) Searching for symbol string
US4608708A (en) Pattern matching system
JP4090755B2 (ja) 音声認識システム、学習装置、及び、最大エントロピー音声モデルのフリーパラメータの反復値計算方法
EP0488208B1 (en) High speed recognition of a string of words connected according to a regular grammar by dp matching
JP3449566B2 (ja) アドレス発生装置
JP2000059774A (ja) 映像符号化制御装置
JPWO2020156516A5 (ja)
JPH07101385B2 (ja) 情報処理装置
JP3223560B2 (ja) 波形データ読出し装置
JP3126081B2 (ja) ベクトル量子化方法及びベクトル量子化装置
JPH0683019B2 (ja) ディジタル信号処理プロセッサ
JPH0554119B2 (ja)
JP2002288155A (ja) 単語属性推定装置、単語属性推定方法、そのプログラムおよび記録媒体
JPH0652305A (ja) データの圧縮装置
JP2915182B2 (ja) Ncデータ作成方法
JP3125937B2 (ja) 音声ピッチ変換方法
JPH022159B2 (ja)
JP2684807B2 (ja) 音声認識装置
CN111048094A (zh) 音频信息调整方法、装置、设备和介质
JPH07182387A (ja) 自由曲線データの分割処理システム
JPH0259884A (ja) 文字認識装置
JPS6259999A (ja) 不特定話者音声認識装置