JPH0634185B2 - 入力語認識装置 - Google Patents
入力語認識装置Info
- Publication number
- JPH0634185B2 JPH0634185B2 JP57048183A JP4818382A JPH0634185B2 JP H0634185 B2 JPH0634185 B2 JP H0634185B2 JP 57048183 A JP57048183 A JP 57048183A JP 4818382 A JP4818382 A JP 4818382A JP H0634185 B2 JPH0634185 B2 JP H0634185B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- input
- signal
- distance
- input word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000004044 response Effects 0.000 claims description 48
- 230000009471 action Effects 0.000 description 14
- 238000000034 method Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 3
- 244000062730 Melissa officinalis Species 0.000 description 2
- 235000010654 Melissa officinalis Nutrition 0.000 description 2
- 239000000865 liniment Substances 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- SYOKIDBDQMKNDQ-XWTIBIIYSA-N vildagliptin Chemical compound C1C(O)(C2)CC(C3)CC1CC32NCC(=O)N1CCC[C@H]1C#N SYOKIDBDQMKNDQ-XWTIBIIYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Description
【発明の詳細な説明】 本発明は、音声解析システムに関し、特に、語認識装置
に関する。
に関する。
語認識装置は、通信システム、データ処理システム、制
御システム等に対する直接的入力を可能にする。このよ
うな装置は、通常、基準語彙をデジタルパターン又はテ
ンプレート(標準)として蓄えている。書かれた、ある
いは話された入力は、デジタル形式に変換され、基準語
と比較されて識別される。しかし、入力語を、類似した
基準の1つとして正確に判別することが困難であること
が多い。一例として、アルファベット文字を発音したも
のを基準語語彙とした場合、音声的類似のために識別が
妨げられる。すなわち、文字“X、S及びF”や、文字
“B、C及びD”は音声的に混同しやすく正確に区別す
ることが困難である。
御システム等に対する直接的入力を可能にする。このよ
うな装置は、通常、基準語彙をデジタルパターン又はテ
ンプレート(標準)として蓄えている。書かれた、ある
いは話された入力は、デジタル形式に変換され、基準語
と比較されて識別される。しかし、入力語を、類似した
基準の1つとして正確に判別することが困難であること
が多い。一例として、アルファベット文字を発音したも
のを基準語語彙とした場合、音声的類似のために識別が
妨げられる。すなわち、文字“X、S及びF”や、文字
“B、C及びD”は音声的に混同しやすく正確に区別す
ることが困難である。
ジイー・デイー・バルム氏(G.D.Balm)による米国
特許第4.058,795号で述べられている従来技術
の文字認識器では、入力文字の判別に疑問が生じると、
その前後の文字を考慮することにより解決を試みてい
る。この前後の文字は、その混同時の表に従ってグルー
プに類別されている。このグループを用いて文脈コード
が決定される。文脈コードにより、疑問のある入力文字
を正しく識別するものとして、グループの要素の1つが
選択される。このバルム(Balm)による構成方法では、
正確に認識された文字が、疑問のある文字をはさんでい
るものと仮定されている。しかし、隣の入力文字の識別
も疑しい場合もある。従ってバルム(Balm)による文脈
形解析にも限界がある。
特許第4.058,795号で述べられている従来技術
の文字認識器では、入力文字の判別に疑問が生じると、
その前後の文字を考慮することにより解決を試みてい
る。この前後の文字は、その混同時の表に従ってグルー
プに類別されている。このグループを用いて文脈コード
が決定される。文脈コードにより、疑問のある入力文字
を正しく識別するものとして、グループの要素の1つが
選択される。このバルム(Balm)による構成方法では、
正確に認識された文字が、疑問のある文字をはさんでい
るものと仮定されている。しかし、隣の入力文字の識別
も疑しい場合もある。従ってバルム(Balm)による文脈
形解析にも限界がある。
星野等による米国特許第4.027.284号における
機械印字文字の認識システムでは、複数の基準パターン
が、共通のパターン要素を持つ文字のグループに分割さ
れている。その共通パターン要素が各グループの標準パ
ターンを定義している。入力文字との間の差が定められ
た値より小さい標準パターンが決定される。つぎに、決
定されたグループ内の文字の共通でないパターン要素と
入力文字との間が取られる。この差の値が最も小さい文
字が入力を識別するものとして選ばれる。この星野によ
るシステムは、機械印字文字のように共通でないパター
ン要素の数が固定されている場合には、認識の正確さを
改善することができる。しかし、共通でない要素が可変
であるような類似の文字を区別することはできない。
機械印字文字の認識システムでは、複数の基準パターン
が、共通のパターン要素を持つ文字のグループに分割さ
れている。その共通パターン要素が各グループの標準パ
ターンを定義している。入力文字との間の差が定められ
た値より小さい標準パターンが決定される。つぎに、決
定されたグループ内の文字の共通でないパターン要素と
入力文字との間が取られる。この差の値が最も小さい文
字が入力を識別するものとして選ばれる。この星野によ
るシステムは、機械印字文字のように共通でないパター
ン要素の数が固定されている場合には、認識の正確さを
改善することができる。しかし、共通でない要素が可変
であるような類似の文字を区別することはできない。
従って、本発明の目的は、類似していて混同しやすい基
準語彙内の1つの語として入力文字を識別できるような
改善された装置を提供することにある。
準語彙内の1つの語として入力文字を識別できるような
改善された装置を提供することにある。
本発明は、一群の基準語の1つとして入力語を認識する
装置を目的としている。入力語と各基準語との対応性を
表わす語距離信号が作られる。荷重語距離信号も作られ
る。この語距離信号及び荷重語距離信号に応動して、入
力語に最も良く対応する基準語が選ばれる。
装置を目的としている。入力語と各基準語との対応性を
表わす語距離信号が作られる。荷重語距離信号も作られ
る。この語距離信号及び荷重語距離信号に応動して、入
力語に最も良く対応する基準語が選ばれる。
本発明の一実施例では、一群の基準語がその音声的類似
性に従って予め定めたクラスに分類されている。基準語
に対応する基準語特徴パターンが蓄えられている。この
特徴パターンは固定された数の時間フレームから成る。
話された入力語はデイジタル符号化される。符号化され
た語に応動し、一定数の時間フレームから成る入力語特
徴パターンが作られる。入力語特徴標準と各基準語特徴
パターンとの間の各フレームにおける対応の程度を表わ
す一群のフレーム距離信号が作られる。このフレーム距
離信号が結合されて、入力語と各基準語との対応の程度
を表わす語距離信号となる。この語距離信号に応動し
て、入力語に最も良く対応するクラスが選ばれる。予め
定められて蓄積されている一群の荷重パターンは、同じ
クラスに属する基準語の間のフレーム毎の期待される類
似性を表わしている。選択されたクラスに属する荷重パ
ターンとフレーム距離信号とが結合されて、荷重語距離
信号が得られる。入力語に最も良く対応する荷重語距離
信号が識別される。この識別された荷重語距離信号が、
入力語を認識する最良の候補となる基準語であるものと
指定される。
性に従って予め定めたクラスに分類されている。基準語
に対応する基準語特徴パターンが蓄えられている。この
特徴パターンは固定された数の時間フレームから成る。
話された入力語はデイジタル符号化される。符号化され
た語に応動し、一定数の時間フレームから成る入力語特
徴パターンが作られる。入力語特徴標準と各基準語特徴
パターンとの間の各フレームにおける対応の程度を表わ
す一群のフレーム距離信号が作られる。このフレーム距
離信号が結合されて、入力語と各基準語との対応の程度
を表わす語距離信号となる。この語距離信号に応動し
て、入力語に最も良く対応するクラスが選ばれる。予め
定められて蓄積されている一群の荷重パターンは、同じ
クラスに属する基準語の間のフレーム毎の期待される類
似性を表わしている。選択されたクラスに属する荷重パ
ターンとフレーム距離信号とが結合されて、荷重語距離
信号が得られる。入力語に最も良く対応する荷重語距離
信号が識別される。この識別された荷重語距離信号が、
入力語を認識する最良の候補となる基準語であるものと
指定される。
第1図は本発明の一実施例である語認識器100の一般
的ブロック図を示している。第1図のシステムは、話さ
れた会話音を識別するのに用いることができる。あるい
は、語認識器が、たとえば汎用計算機と読出し専用メモ
リ(ROM)とを含み、第1図に関して述べる信号処理
機能をこれらに行わせることも可能である。
的ブロック図を示している。第1図のシステムは、話さ
れた会話音を識別するのに用いることができる。あるい
は、語認識器が、たとえば汎用計算機と読出し専用メモ
リ(ROM)とを含み、第1図に関して述べる信号処理
機能をこれらに行わせることも可能である。
音声は特徴信号発生器101の入力に印加され、当業者
には公知の線形予測分析に基づいて音声特徴信号Tに変
換される。これとは別に、スペクトル信号、フオルマン
ト信号、あるいは他の特徴信号を用いることもできる。
特徴信号Tは、線形時間ワープ102において、例えば
40時間フレームの標準の長さに正規化される。信号処
理におけるこの正規化の方法は、アイ.イ.イ.イ.音
響上の処理、スピーチ及び信号処理誌(IEEE Transacti
ons on Acoustics,Speech,and Signal Processing)の
ASSP−29巻、622−635頁、1980年12
月号のシー.エス.メイヤ(C.S.Myers)、エル.
アール.ラビニア(L.R.Rabiner)及びエイ.イ.
ローゼンバーグ(A.E.Rosenberg)著の論文“Pevfo
rmance Tradeoffe in Dynamic Time Warping Algorithm
for Isolated Word Recognition”に示されている。
には公知の線形予測分析に基づいて音声特徴信号Tに変
換される。これとは別に、スペクトル信号、フオルマン
ト信号、あるいは他の特徴信号を用いることもできる。
特徴信号Tは、線形時間ワープ102において、例えば
40時間フレームの標準の長さに正規化される。信号処
理におけるこの正規化の方法は、アイ.イ.イ.イ.音
響上の処理、スピーチ及び信号処理誌(IEEE Transacti
ons on Acoustics,Speech,and Signal Processing)の
ASSP−29巻、622−635頁、1980年12
月号のシー.エス.メイヤ(C.S.Myers)、エル.
アール.ラビニア(L.R.Rabiner)及びエイ.イ.
ローゼンバーグ(A.E.Rosenberg)著の論文“Pevfo
rmance Tradeoffe in Dynamic Time Warping Algorithm
for Isolated Word Recognition”に示されている。
正規化された入力特徴信号 は入力特徴メモリ104に蓄えられる。
のカッコ内のkは入力の特定のフレームを指す指標であ
る。kの範囲はk=0、1、…Kで与えられる。本実施
例では、40の時間フレームがあり、Kは39に等し
い。基準語に対して予め得られている特徴標準 が基準特徴メモリ103に蓄えられている。以下、特徴
標準とは特徴パターン又は特徴テンプレートと同義語と
理解されたい。
る。kの範囲はk=0、1、…Kで与えられる。本実施
例では、40の時間フレームがあり、Kは39に等し
い。基準語に対して予め得られている特徴標準 が基準特徴メモリ103に蓄えられている。以下、特徴
標準とは特徴パターン又は特徴テンプレートと同義語と
理解されたい。
の添数iは特定の基準語を指す指標であり、カッコ内の
kは、前と同じように、フレームを指定する。iの範囲
はたとえばi=0、1、…、Iで与えられる。この上限
Iは、例えば38に等しく、この場合、基準語はアルフ
ァベット26文字と、数字の0乃至9と、指令語“ST
OP”、“ERRR”及び“REPEAT”とを含ん
でいる。しかし、実施例の説明においては、基準語の語
彙としては、A、B、C、D、F、J、K、S、X、
6、8、及びREPEATの12ケの語から成るものと
する。よって、iの範囲はi=0、1、…、11で与え
られる。
kは、前と同じように、フレームを指定する。iの範囲
はたとえばi=0、1、…、Iで与えられる。この上限
Iは、例えば38に等しく、この場合、基準語はアルフ
ァベット26文字と、数字の0乃至9と、指令語“ST
OP”、“ERRR”及び“REPEAT”とを含ん
でいる。しかし、実施例の説明においては、基準語の語
彙としては、A、B、C、D、F、J、K、S、X、
6、8、及びREPEATの12ケの語から成るものと
する。よって、iの範囲はi=0、1、…、11で与え
られる。
入力特徴信号 を一群の基準特徴標準 と比較することにより、フレーム距離発生器105にお
いて、一群のフレーム距離信号di(k)が得られる。こ
のフレーム距離信号di(k)を得るために、距離発生器
105において、当業者には公知の動的時間ワープ信号
処理方法を用いることができる。
いて、一群のフレーム距離信号di(k)が得られる。こ
のフレーム距離信号di(k)を得るために、距離発生器
105において、当業者には公知の動的時間ワープ信号
処理方法を用いることができる。
フレーム距離信号di(k)は語距離発生器200及び荷
重フレーム距離発生器500に印加される。語距離発生
器200において、フレーム距離信号di(k)が統合さ
れて、語距離信号Diになる。ただし、指標iはi=
0、1、…、11をとる。語距離信号Diに応動して、
最小語距離選択器300において、最小語距離信号Dmi
nと、これに対応する語指標信号iminが得られる。この
最小語指標信号iminに応動して、音声等価クラス信号
φminがクラス比較論理400で得られる。
重フレーム距離発生器500に印加される。語距離発生
器200において、フレーム距離信号di(k)が統合さ
れて、語距離信号Diになる。ただし、指標iはi=
0、1、…、11をとる。語距離信号Diに応動して、
最小語距離選択器300において、最小語距離信号Dmi
nと、これに対応する語指標信号iminが得られる。この
最小語指標信号iminに応動して、音声等価クラス信号
φminがクラス比較論理400で得られる。
荷重フレーム距離発生器500において、距離信号di
(k)が荷重標準 と結合され、荷重フレーム距離信号 が得られる。音声等価クラスφminに属する語iの各々
に対する荷重フレーム距離信号 が語距離発生器200で結合されて荷重語距離信号 が得られる。最小語距離選択器300において、荷重語
距離信号 から最小荷重語距離信号 が選ばれる。これに対応する語指標信号 が応用装置106に出力される。信号 は入力を識別するのに最良の候補となる基準語を指定す
る。
(k)が荷重標準 と結合され、荷重フレーム距離信号 が得られる。音声等価クラスφminに属する語iの各々
に対する荷重フレーム距離信号 が語距離発生器200で結合されて荷重語距離信号 が得られる。最小語距離選択器300において、荷重語
距離信号 から最小荷重語距離信号 が選ばれる。これに対応する語指標信号 が応用装置106に出力される。信号 は入力を識別するのに最良の候補となる基準語を指定す
る。
制御器160は、例えばデータ ジエネラル コーポレ
ーシヨン(Data General Corporation)から1979に
発行されたマイクロプロダクト ハードウエア システ
ム(Microproducts Hardware Systms)に記されている
ようなマイクロプロセッサ、あるいは当業者には公知の
他のマイクロプロセッサシステムで実現できる。このマ
イクロプロセッサは付随する読出し専用メモリに蓄えら
れた命令コードに従って動作する。この命令コードの例
として、フオートラン言語で書かれたものを付録1に示
す。
ーシヨン(Data General Corporation)から1979に
発行されたマイクロプロダクト ハードウエア システ
ム(Microproducts Hardware Systms)に記されている
ようなマイクロプロセッサ、あるいは当業者には公知の
他のマイクロプロセッサシステムで実現できる。このマ
イクロプロセッサは付随する読出し専用メモリに蓄えら
れた命令コードに従って動作する。この命令コードの例
として、フオートラン言語で書かれたものを付録1に示
す。
語認識器100の回路の動作が第6図の流れ図600で
示されている。第6図の動作ブロック602で示したよ
うに、応用装置106からの信号STARTに応動し
て、制御器160は語認識器100の動作を開始させ
る。
示されている。第6図の動作ブロック602で示したよ
うに、応用装置106からの信号STARTに応動し
て、制御器160は語認識器100の動作を開始させ
る。
語認識器100は、2つのモードA、Bのうちの1つで
動作するが、これは制御器160からの信号ABMOD
Eによって決定される。信号ABMODEが、第6図の
動作ブロック604で示すように真であると、モードA
となり、偽であるとモードBとなる。
動作するが、これは制御器160からの信号ABMOD
Eによって決定される。信号ABMODEが、第6図の
動作ブロック604で示すように真であると、モードA
となり、偽であるとモードBとなる。
モードAの動作において、語カウンタ140及びフレー
ムカウンタ150は、制御器160からの信号SETW
C及びSETFCによって初期値ゼロにセットされる。
語カウンタ140からの語指標信号i及びフレームカウ
ンタ150からのフレーム指標信号kは、これによって
ともにゼロになる。制御器160からの信号SETLP
Nに応動して、第3図のラッチ320はその最大数にセ
ットされる。この初期化動作は第6図の動作ブロック6
06及び608に示されている。
ムカウンタ150は、制御器160からの信号SETW
C及びSETFCによって初期値ゼロにセットされる。
語カウンタ140からの語指標信号i及びフレームカウ
ンタ150からのフレーム指標信号kは、これによって
ともにゼロになる。制御器160からの信号SETLP
Nに応動して、第3図のラッチ320はその最大数にセ
ットされる。この初期化動作は第6図の動作ブロック6
06及び608に示されている。
第1の基準語の第1のフレームに対応する指標信号i及
びkに応動して、基準特徴信号 が基準特徴メモリ103から出力される。入力語の第1
のフレームに対応する指標信号kに応動して、入力特徴
信号 が入力特徴メモリ104から出力される。第6図の動作
ブロック610に示したように、制御器160からのD
TWSTRAT信号に応動して、フレーム距離発生器1
05において、特徴信号 及び から距離信号d0(0)が決定される。動作ブロック61
2に示した、発生器105からの信号DTWDONE
は、フレーム距離信号d0(0)が作られた後で制御器1
60に印加される。フレーム距離信号di(k)は動作ブ
ロック614で示したように累積されるが、これについ
ては、語距離発生器200に関連して説明する。信号D
TWDONEに応動して、制御器160からの信号IN
CFCがフレームカウンタ150に印加され、フレーム
指標信号kをk=1に増分する。これは動作ブロック6
16に示されている。制御器160からのDTWSTA
RT信号に応動して、フレーム距離信号d0(1)がフレ
ーム距離発生器105で作られる。信号d0(1)が作ら
れた後、信号DTWDONEが発生器105から出力さ
れる。さらにフレーム指標信号kが増分され、判定ブロ
ック618で示すように、処理が繰返えされて、最終的
に40ケのフレーム距離信号d0(k)、k=0、1、
…、30が得られる。k=39になると、フレームカウ
ンタ150は信号EKを出力する。この信号EKに応動
し、制御器160からの信号ENWDSが印加されて、
語距離信号の比較が付勢される。これは動作ブロック6
20に示されているが、最小語距離選択器300に関連
して後述する。動作ブロック622で示すように制御器
160からの信号INCWCが印加されて語カウンタ1
40の出力iが増分される。このiが最終の語でない
と、40ケの新しいフレーム距離信号が作られる。これ
は判定ブロック624に示されている。このようにし
て、語指標信号iの0乃至11について、フレーム距離
信号di(k)が作られる。
びkに応動して、基準特徴信号 が基準特徴メモリ103から出力される。入力語の第1
のフレームに対応する指標信号kに応動して、入力特徴
信号 が入力特徴メモリ104から出力される。第6図の動作
ブロック610に示したように、制御器160からのD
TWSTRAT信号に応動して、フレーム距離発生器1
05において、特徴信号 及び から距離信号d0(0)が決定される。動作ブロック61
2に示した、発生器105からの信号DTWDONE
は、フレーム距離信号d0(0)が作られた後で制御器1
60に印加される。フレーム距離信号di(k)は動作ブ
ロック614で示したように累積されるが、これについ
ては、語距離発生器200に関連して説明する。信号D
TWDONEに応動して、制御器160からの信号IN
CFCがフレームカウンタ150に印加され、フレーム
指標信号kをk=1に増分する。これは動作ブロック6
16に示されている。制御器160からのDTWSTA
RT信号に応動して、フレーム距離信号d0(1)がフレ
ーム距離発生器105で作られる。信号d0(1)が作ら
れた後、信号DTWDONEが発生器105から出力さ
れる。さらにフレーム指標信号kが増分され、判定ブロ
ック618で示すように、処理が繰返えされて、最終的
に40ケのフレーム距離信号d0(k)、k=0、1、
…、30が得られる。k=39になると、フレームカウ
ンタ150は信号EKを出力する。この信号EKに応動
し、制御器160からの信号ENWDSが印加されて、
語距離信号の比較が付勢される。これは動作ブロック6
20に示されているが、最小語距離選択器300に関連
して後述する。動作ブロック622で示すように制御器
160からの信号INCWCが印加されて語カウンタ1
40の出力iが増分される。このiが最終の語でない
と、40ケの新しいフレーム距離信号が作られる。これ
は判定ブロック624に示されている。このようにし
て、語指標信号iの0乃至11について、フレーム距離
信号di(k)が作られる。
カウンタ140及び150からの指標信号i及びkは第
5図のRAM510のアドレス端子にも印加される。R
AM510は、たとえばテキサスインストルメント(Te
xas Instruments)社で作られている74S207型回
路で実現できる。発生器105からのフレーム距離信号
di(k)はRAM510のデータ端子に印加される。信
号LDWDG及びABMODEが制御器160からナン
ドゲート540の入力に印加される。このナンドゲート
540の出力は偽であり、これがRAM510のR/
端子に印加される。これによって、RAM510は、モ
ードAにおいて、信号i及びkで指定される位置にフレ
ーム距離信号di(k)を蓄える。このフレーム距離信号
di(k)は、後でモードB動作中にRAM510から取
り出される。
5図のRAM510のアドレス端子にも印加される。R
AM510は、たとえばテキサスインストルメント(Te
xas Instruments)社で作られている74S207型回
路で実現できる。発生器105からのフレーム距離信号
di(k)はRAM510のデータ端子に印加される。信
号LDWDG及びABMODEが制御器160からナン
ドゲート540の入力に印加される。このナンドゲート
540の出力は偽であり、これがRAM510のR/
端子に印加される。これによって、RAM510は、モ
ードAにおいて、信号i及びkで指定される位置にフレ
ーム距離信号di(k)を蓄える。このフレーム距離信号
di(k)は、後でモードB動作中にRAM510から取
り出される。
モードA動作中、第2図の語距離発生器200におい
て、制御器160からの信号ABMODEがマルチプレ
クサ210の選択端子Sに印加され、これによってマル
チプレクサ210のA入力が選択される。マルチプレク
サ210は、例えば、テキサス・インストルメント(Te
xas Instruments)社で作っている74157型回路で
実現できる。マルチプレクサ210のA端子に印加され
るフレーム距離信号di(k)入力がこのマルチプレクサ
のQ端子に出力され、加算器220のA入力に印加され
る。加算器220は、例えば、テキサスインストルメン
ト(Texas Instruments)社で作っている74283型
回路で実現できる。加算器220のB入力は、ラッチ2
30のQ出力に接続されている。ラッチ230は、例え
ばテキサスインストルメント(Texas Instruments)社
で作っている74273型回路で実現できる。ラッチ2
30のD入力端子は加算器220のQ出力に接続されて
いる。加算動作を行う時、ラッチ230は第6図の動作
ブロック608で示されているように、制御器160か
らの信号CLRWDGによってクリアされる。距離信号
di(k)の各々が作られた後、制御器160からの信号
LDWDGがラッチ230の置数端子に印加される。こ
れは動作ブロック614に示されている。このようにし
て、40ケのフレーム距離信号の和が加算器220及び
ラッチ230でとられてその合計が計算され、語距離信
号Diとなる。次の語iに対しても、ラッチ230が再
び信号CLRWDGにによってクリアされ、加算動作が
繰返えされる。このようにして全部で12ケの語距離信
号Diがi=0、1、…、11について作られる。
て、制御器160からの信号ABMODEがマルチプレ
クサ210の選択端子Sに印加され、これによってマル
チプレクサ210のA入力が選択される。マルチプレク
サ210は、例えば、テキサス・インストルメント(Te
xas Instruments)社で作っている74157型回路で
実現できる。マルチプレクサ210のA端子に印加され
るフレーム距離信号di(k)入力がこのマルチプレクサ
のQ端子に出力され、加算器220のA入力に印加され
る。加算器220は、例えば、テキサスインストルメン
ト(Texas Instruments)社で作っている74283型
回路で実現できる。加算器220のB入力は、ラッチ2
30のQ出力に接続されている。ラッチ230は、例え
ばテキサスインストルメント(Texas Instruments)社
で作っている74273型回路で実現できる。ラッチ2
30のD入力端子は加算器220のQ出力に接続されて
いる。加算動作を行う時、ラッチ230は第6図の動作
ブロック608で示されているように、制御器160か
らの信号CLRWDGによってクリアされる。距離信号
di(k)の各々が作られた後、制御器160からの信号
LDWDGがラッチ230の置数端子に印加される。こ
れは動作ブロック614に示されている。このようにし
て、40ケのフレーム距離信号の和が加算器220及び
ラッチ230でとられてその合計が計算され、語距離信
号Diとなる。次の語iに対しても、ラッチ230が再
び信号CLRWDGにによってクリアされ、加算動作が
繰返えされる。このようにして全部で12ケの語距離信
号Diがi=0、1、…、11について作られる。
次に第3図の最小語距離選択器300において、語距離
信号Diの各々が作られた時に、これが比較310のA
入力と、ラッチ320のD入力とに印加される。比較器
310は、例えばテキサスインストルメント(Texas In
struments)社で作っている7485型回路で実現でき
る。ラッチ320のQ出力は比較器310のB入力に印
加されている。動作ブロック606に関して前述したよ
うに、ラッチ320は、最初制御器160からの信号S
ETLPNによってその最大数にセットされている。次
に続くDi信号がラッチ320内の現在の値よりも小さ
いと、比較器310のB>A出力からの真の信号がアン
ドゲート340に印加される。アンドゲート340は、
モードA動作中において制御器160からの信号ENW
DSによって付勢されている。アンドゲート340の出
力により、ラッチ320は次に続くDi信号の値を取り
込む。アンドゲート340の出力はラッチ330も付勢
し、カウンタ140から送られ、ラッチ320に取り込
まれた語距離信号Diに対応する指標信号iをラッチ3
30に置数する。このように、比較器310、ラッチ3
20及び330によって、i=0から11に対するすべ
ての語距離信号Diから、最小語距離信号Dmin及び対
応する指標信号iminが得られる。
信号Diの各々が作られた時に、これが比較310のA
入力と、ラッチ320のD入力とに印加される。比較器
310は、例えばテキサスインストルメント(Texas In
struments)社で作っている7485型回路で実現でき
る。ラッチ320のQ出力は比較器310のB入力に印
加されている。動作ブロック606に関して前述したよ
うに、ラッチ320は、最初制御器160からの信号S
ETLPNによってその最大数にセットされている。次
に続くDi信号がラッチ320内の現在の値よりも小さ
いと、比較器310のB>A出力からの真の信号がアン
ドゲート340に印加される。アンドゲート340は、
モードA動作中において制御器160からの信号ENW
DSによって付勢されている。アンドゲート340の出
力により、ラッチ320は次に続くDi信号の値を取り
込む。アンドゲート340の出力はラッチ330も付勢
し、カウンタ140から送られ、ラッチ320に取り込
まれた語距離信号Diに対応する指標信号iをラッチ3
30に置数する。このように、比較器310、ラッチ3
20及び330によって、i=0から11に対するすべ
ての語距離信号Diから、最小語距離信号Dmin及び対
応する指標信号iminが得られる。
表1は、一例として、可能な語距離信号と対応する語指
標信号とを示している。語距離信号D9は14.8に等し
く、表内のすべての中で最小の大きさを持っている。従
って、最小語距離信号Dminは14.8に等しく、また対応
する最小語指標iminは9に等しい。
標信号とを示している。語距離信号D9は14.8に等し
く、表内のすべての中で最小の大きさを持っている。従
って、最小語距離信号Dminは14.8に等しく、また対応
する最小語指標iminは9に等しい。
第4図のクラス比較論理400において、ラッチ330
からの指標信号iminがマルチプレクサ410のA入力
に印加される。モードA動作において、制御器160か
らの信号ABMODEは真であり、マルチプレクサ41
0のA入力が選択される。これによって、指標信号i
minはマルチプレクサ410のQ端子に出力され、RO
M420のアドレス端子Aに印加される。
からの指標信号iminがマルチプレクサ410のA入力
に印加される。モードA動作において、制御器160か
らの信号ABMODEは真であり、マルチプレクサ41
0のA入力が選択される。これによって、指標信号i
minはマルチプレクサ410のQ端子に出力され、RO
M420のアドレス端子Aに印加される。
予め決定された音声等価クラス信号φnはROM420
に蓄えられている。ROM420は例えばテキサスイン
ストルメント(Texas Instruments)社で作っている7
4S287型回路で実現できる。音声等価クラス信号の
各各は、音声認識の妨げとなるような予め定めた類似性
を持つ基準語のグループを表わしている。本実施例の1
2ケの基準語は、一例として表2に示すように、混同す
る恐れのある3グループの語に分割されており、それぞ
れ音声等価クラス信号φ0、φ1及びφ2によって指定
される。
に蓄えられている。ROM420は例えばテキサスイン
ストルメント(Texas Instruments)社で作っている7
4S287型回路で実現できる。音声等価クラス信号の
各各は、音声認識の妨げとなるような予め定めた類似性
を持つ基準語のグループを表わしている。本実施例の1
2ケの基準語は、一例として表2に示すように、混同す
る恐れのある3グループの語に分割されており、それぞ
れ音声等価クラス信号φ0、φ1及びφ2によって指定
される。
指標信号iminがROM420のアドレス入力Aに印加
されると、表2にあるようなこれに対応する最小音声等
価クラス信号φminがROM420のQ端子に出力され
る。よって、信号iminが9である例においては、信号
φminはφ2に等しい。次に制御器160から信号LD
CCLが印加され、ラッチ440はROM420からの
信号φmin=φ2を取り込む。このことは第6図の動作
ブロック626に示されている。
されると、表2にあるようなこれに対応する最小音声等
価クラス信号φminがROM420のQ端子に出力され
る。よって、信号iminが9である例においては、信号
φminはφ2に等しい。次に制御器160から信号LD
CCLが印加され、ラッチ440はROM420からの
信号φmin=φ2を取り込む。このことは第6図の動作
ブロック626に示されている。
最小音声クラス信号φminがラッチ440に蓄えられて
しまうと、語認識器100のモードA動作が終了する。
動作ブロック628に示されているように、制御器16
0からの信号ABMODEが偽に変り、Bモードの動作
が選択される。モードBでは、音声等価クラス信号φ
minによって表わされる基準語に対する荷重距離信号 が作られる。最小音声等価クラスの信号φminがφ2に
等しい例では、i=8、9、10及び11に対する荷重
語距離信号 が作られる。表2に示したように、信号i=8、9、1
0及び11は音声的に似た語F、S、X及び6に対応し
ている。荷重語距離信号の最小値 が決定される。信号 に対応する指標信号 は、入力語を識別する最良の基準語候補を指す指標とし
て、応用装置106へ出力される。
しまうと、語認識器100のモードA動作が終了する。
動作ブロック628に示されているように、制御器16
0からの信号ABMODEが偽に変り、Bモードの動作
が選択される。モードBでは、音声等価クラス信号φ
minによって表わされる基準語に対する荷重距離信号 が作られる。最小音声等価クラスの信号φminがφ2に
等しい例では、i=8、9、10及び11に対する荷重
語距離信号 が作られる。表2に示したように、信号i=8、9、1
0及び11は音声的に似た語F、S、X及び6に対応し
ている。荷重語距離信号の最小値 が決定される。信号 に対応する指標信号 は、入力語を識別する最良の基準語候補を指す指標とし
て、応用装置106へ出力される。
モードB動作において、語カウンタは制御器160から
の信号SETWCによって初期値ゼロにセットされる。
制御器160からの信号SETLPNに応動して、第3
図のラッチ320はその最大数にセットされる。この初
期化動作は第6図の動作ブロック630に示されてい
る。次にカウンタ140からの信号iが第4図のマルチ
プレクサ410のB入力に印加される。制御器160か
らの信号ABMODEは、モードBでは偽であるため、
マルチプレクサ410のB入力が選択される。よって信
号iはROM420のアドレス入力Aに印加される。R
OM420は信号iに応動して表2にあるような対応す
る音声等価クラス信号φnを出力する。この信号φnは
比較器430のA入力に印加される。ラッチ440から
の音声等価クラス信号φminは比較器430のB入力に
印加されている。このことは、判定ブロック632で示
されている。信号φnとφminが等しくないと、比較器
430からの信号EQUALは偽となる。制御器160
からの信号INCWCが語カウンタ140に印加されて
信号iが増分される。判定ブロック632及び648で
示したように、各信号i=0、1、…、11に対して対
応する音声等価クラス信号φnが最小音声等価クラス信
号φminと比較される。ラッチ440内の最小音声等価
クラス信号φminがφ2に等しい例では、信号EQUA
Lは、音声的に似た語F、S、X及び6に対応する信号
i=8、9、10及び11においてのみ真となる。
の信号SETWCによって初期値ゼロにセットされる。
制御器160からの信号SETLPNに応動して、第3
図のラッチ320はその最大数にセットされる。この初
期化動作は第6図の動作ブロック630に示されてい
る。次にカウンタ140からの信号iが第4図のマルチ
プレクサ410のB入力に印加される。制御器160か
らの信号ABMODEは、モードBでは偽であるため、
マルチプレクサ410のB入力が選択される。よって信
号iはROM420のアドレス入力Aに印加される。R
OM420は信号iに応動して表2にあるような対応す
る音声等価クラス信号φnを出力する。この信号φnは
比較器430のA入力に印加される。ラッチ440から
の音声等価クラス信号φminは比較器430のB入力に
印加されている。このことは、判定ブロック632で示
されている。信号φnとφminが等しくないと、比較器
430からの信号EQUALは偽となる。制御器160
からの信号INCWCが語カウンタ140に印加されて
信号iが増分される。判定ブロック632及び648で
示したように、各信号i=0、1、…、11に対して対
応する音声等価クラス信号φnが最小音声等価クラス信
号φminと比較される。ラッチ440内の最小音声等価
クラス信号φminがφ2に等しい例では、信号EQUA
Lは、音声的に似た語F、S、X及び6に対応する信号
i=8、9、10及び11においてのみ真となる。
制御器160からの信号ABMODEが第5図のナンド
ゲート540の入力に印加されている。モードBでは信
号ABMODEは偽であるため、ナンドゲート540は
真信号を出力する。ナンドゲート540からの真信号は
RAM510のR/端子に印加される。これによって
RAM510は、モードBにおいては、フレーム距離信
号di(k)を出力する。
ゲート540の入力に印加されている。モードBでは信
号ABMODEは偽であるため、ナンドゲート540は
真信号を出力する。ナンドゲート540からの真信号は
RAM510のR/端子に印加される。これによって
RAM510は、モードBにおいては、フレーム距離信
号di(k)を出力する。
比較器430からの真の信号EQUALに応動し、制御
器160からの信号SETFCが印加されてフレームカ
ウンタ150をリセットする。制御器160からの信号
CLRWDGに応動して語距離発生器200内のラッチ
230もリセットされる。このリセット動作は第6図の
動作ブロック634に示されている。カウンタ140及
び150からの指標信号i及びkはRAM510のアド
レス端子Aに印加される。この信号i及びkに応動し、
RAM510内の対応するメモリ位置からのフレーム距
離信号di(k)が出力される。
器160からの信号SETFCが印加されてフレームカ
ウンタ150をリセットする。制御器160からの信号
CLRWDGに応動して語距離発生器200内のラッチ
230もリセットされる。このリセット動作は第6図の
動作ブロック634に示されている。カウンタ140及
び150からの指標信号i及びkはRAM510のアド
レス端子Aに印加される。この信号i及びkに応動し、
RAM510内の対応するメモリ位置からのフレーム距
離信号di(k)が出力される。
カウンタ140及び150からの指標信号i及びkはR
OM530のアドレス端子にも印加されている。よっ
て、i及びkに応動して、予め定めた荷重標準 がROM530のメモリ位置から出力される。
OM530のアドレス端子にも印加されている。よっ
て、i及びkに応動して、予め定めた荷重標準 がROM530のメモリ位置から出力される。
荷重標準 は、同じ音声等価クラスに属する語の間の、フレーム毎
の動的時間ワープ距離の期待値を表わしている。一例と
して、入力特徴標準が語Iを表わし、基準特徴標準が語
Yを表わしている場合について考える。語Yは、語Iの
先頭に音素/W/を付加したものであるため、IとYと
の間の動的時間ワープ距離は、最初のフレームにおいて
のみ大きくなることが期待される。この例からわかるよ
うに、期待されるフレーム毎の動的時間ワープ距離は、
考えている語の対によって変化する。
の動的時間ワープ距離の期待値を表わしている。一例と
して、入力特徴標準が語Iを表わし、基準特徴標準が語
Yを表わしている場合について考える。語Yは、語Iの
先頭に音素/W/を付加したものであるため、IとYと
の間の動的時間ワープ距離は、最初のフレームにおいて
のみ大きくなることが期待される。この例からわかるよ
うに、期待されるフレーム毎の動的時間ワープ距離は、
考えている語の対によって変化する。
荷重パターン信号 は(語認識器100のモードA又はB動作の前に)、基
準語の各々を繰返して発音することによって作られる。
繰返して発音された同じ基準語iに対する特徴パターン
が動的時間ワープ信号処理によって比較されて、フレー
ム距離信号di、i(k)が作られる。繰返しが結合され
て、平均フレーム距離信号〈di、i(k)〉が作られ
る。平均フレーム距離信号〈di、i(k)〉に対応し
て、分散信号▲σ2 i▼、i(k)が作られる。
準語の各々を繰返して発音することによって作られる。
繰返して発音された同じ基準語iに対する特徴パターン
が動的時間ワープ信号処理によって比較されて、フレー
ム距離信号di、i(k)が作られる。繰返しが結合され
て、平均フレーム距離信号〈di、i(k)〉が作られ
る。平均フレーム距離信号〈di、i(k)〉に対応し
て、分散信号▲σ2 i▼、i(k)が作られる。
基準語iとjとが同じ音声クラスに属する時、基準語i
と別の基準語jとの繰返しに対する特徴標準が動的時間
ワープ信号処理によって比較されて、フレーム距離信号
dj、i(k)が作られる。この繰返しが結合されて、平
均フレーム距離信号〈dj、i(k)〉が作られる。平均
フレーム距離信号〈dj、i(k)〉に対応して分散信号
▲σ2 j▼、i(k)が作られる。
と別の基準語jとの繰返しに対する特徴標準が動的時間
ワープ信号処理によって比較されて、フレーム距離信号
dj、i(k)が作られる。この繰返しが結合されて、平
均フレーム距離信号〈dj、i(k)〉が作られる。平均
フレーム距離信号〈dj、i(k)〉に対応して分散信号
▲σ2 j▼、i(k)が作られる。
平均フレーム距離信号〈di、i(k)〉及び〈dj、
i(k)〉、及び分散信号▲σ2 i▼、i(k)及び▲σ2 j▼、
i(k)が次の式(1)に従って結合されて、対荷重信号
Wj、i(k)が作られる。
i(k)〉、及び分散信号▲σ2 i▼、i(k)及び▲σ2 j▼、
i(k)が次の式(1)に従って結合されて、対荷重信号
Wj、i(k)が作られる。
対荷重信号Wj、i(k)は次の式(2)によって結合され
て、荷重パターン信号 が作られ、これがROM530に蓄えられる。
て、荷重パターン信号 が作られ、これがROM530に蓄えられる。
式(1)及び(2)に関して述べた信号の前処理は、荷重標準
信号 を作るための1つの方法である。本発明の精神と範囲と
を逸脱することなく、期待距離を表わす荷重標準信号を
得るための他の信号処理方式も存在することはいうまで
もない。
信号 を作るための1つの方法である。本発明の精神と範囲と
を逸脱することなく、期待距離を表わす荷重標準信号を
得るための他の信号処理方式も存在することはいうまで
もない。
第5図において、RAM510からの距離信号di(k)
は乗算器520のA入力に印加される。ROM530か
らの荷重標準信号 は乗算器520のB入力に印加される。乗算器520
は、例えば、TRW社で作られているMPY16HJ型
回路で実現できる。乗算器520は信号di(k)と との積をとり、荷重フレーム距離信号 を出力する。
は乗算器520のA入力に印加される。ROM530か
らの荷重標準信号 は乗算器520のB入力に印加される。乗算器520
は、例えば、TRW社で作られているMPY16HJ型
回路で実現できる。乗算器520は信号di(k)と との積をとり、荷重フレーム距離信号 を出力する。
第2図の語距離発生器200において、制御器160か
らの信号ABMODEは、マルチプレクサ210の選択
入力Sに印加されている。モードBでは信号ABMOD
Eは偽であるため、マルチプレクサ210のB入力が選
ばれる。動作ブロック634に関連して述べたように、
ラッチ230は制御器160からの信号CLRWDGに
よってゼロにリセットされている。次に制御器160か
らの信号LDWDGがラッチ230のL端子に印加され
る。マルチプレクサ210からの荷重フレーム距離信号 はこれによって加算器220とラッチ230で加算され
(モードAにおいて信号di(k)について述べたのと同
じ方法による)、荷重語距離信号 が得られる。この動作は動作ブロック638及び640
及び判定ブロック642に示されている。
らの信号ABMODEは、マルチプレクサ210の選択
入力Sに印加されている。モードBでは信号ABMOD
Eは偽であるため、マルチプレクサ210のB入力が選
ばれる。動作ブロック634に関連して述べたように、
ラッチ230は制御器160からの信号CLRWDGに
よってゼロにリセットされている。次に制御器160か
らの信号LDWDGがラッチ230のL端子に印加され
る。マルチプレクサ210からの荷重フレーム距離信号 はこれによって加算器220とラッチ230で加算され
(モードAにおいて信号di(k)について述べたのと同
じ方法による)、荷重語距離信号 が得られる。この動作は動作ブロック638及び640
及び判定ブロック642に示されている。
最小音声等価クラス信号φminがφ2に等しい例におい
ては、比較器430からの信号EQUALは語指標信号
i=8、9、10及び11においてのみ真となる。従っ
て、荷重フレーム距離信号 が、それぞれフレーム指標信号k=0、1、…、39に
ついて、加算器220及びラッチ230で加算され、荷
重語距離信号 となる。
ては、比較器430からの信号EQUALは語指標信号
i=8、9、10及び11においてのみ真となる。従っ
て、荷重フレーム距離信号 が、それぞれフレーム指標信号k=0、1、…、39に
ついて、加算器220及びラッチ230で加算され、荷
重語距離信号 となる。
第3図の最小語距離発生器300において、語距離発生
器200からの荷重語距離信号 は、比較器310のA入力及びラッチ320のD入力に
印加される。動作ブロック630に関して述べたよう
に、ラッチ320は最初制御器160からの信号SET
LPNに応動してその最大数にセットされている。制御
器160からの信号ENWDSに応動して、アンドゲー
ト340の出力が印加されて、ラッチ320及び330
が信号を取り込む。これによって最大荷重語距離信号 がラッチ320のQ出力に得られる(モードAにおいて
信号Diに関して述べたのと同じ方法による)。これは
動作ブロック644及び646に示されている。信号 に対応する指標信号 は、ラッチ330のQ端子に出力される。指標信号i
minは応用装置106に印加され、入力を識別するのに
最も良い候補となる基準語を指定する。次に、動作ブロ
ック650に示されているように、制御器160からの
信号DONEが応用装置106に印加される。
器200からの荷重語距離信号 は、比較器310のA入力及びラッチ320のD入力に
印加される。動作ブロック630に関して述べたよう
に、ラッチ320は最初制御器160からの信号SET
LPNに応動してその最大数にセットされている。制御
器160からの信号ENWDSに応動して、アンドゲー
ト340の出力が印加されて、ラッチ320及び330
が信号を取り込む。これによって最大荷重語距離信号 がラッチ320のQ出力に得られる(モードAにおいて
信号Diに関して述べたのと同じ方法による)。これは
動作ブロック644及び646に示されている。信号 に対応する指標信号 は、ラッチ330のQ端子に出力される。指標信号i
minは応用装置106に印加され、入力を識別するのに
最も良い候補となる基準語を指定する。次に、動作ブロ
ック650に示されているように、制御器160からの
信号DONEが応用装置106に印加される。
最小音声等価クラス信号φminがφ2に等しい例におい
て、表3は一例として、荷重語距離信号 の可能な値を示している。
て、表3は一例として、荷重語距離信号 の可能な値を示している。
荷重語距離信号 は11.6に等しく、表中で最小値をとっている。従って、
最小語距離発生器300において、最小荷重語距離信号 として信号 が選ばれる。第3図のラッチ330内の対応する指標信
号iが最小指標信号 として出力される。
最小語距離発生器300において、最小荷重語距離信号 として信号 が選ばれる。第3図のラッチ330内の対応する指標信
号iが最小指標信号 として出力される。
表2から明らかなように、モードBで得られた信号 は、基準語“X”に対応している。ところが、モードA
で得られた信号imin=9は基準語“S”に対応してい
る。モードBで得られる信号 は、入力を識別するための最も可能性の高い候補を示し
ているものとみなすことができる。なぜなら、この信号
は、音声的に類似した語の間のフレーム毎の距離を表わ
す荷重標準信号を用いて得られているためである。
で得られた信号imin=9は基準語“S”に対応してい
る。モードBで得られる信号 は、入力を識別するための最も可能性の高い候補を示し
ているものとみなすことができる。なぜなら、この信号
は、音声的に類似した語の間のフレーム毎の距離を表わ
す荷重標準信号を用いて得られているためである。
本発明について望ましい実施例を用いて説明したが、当
業者にとっては、本発明の精神と範囲を逸脱することな
く多くの修正や変更が可能であることはいうまでもな
い。たとえば、ある応用では、入力の識別の候補とし
て、順位をつけた複数のものを提供するのが望ましいこ
とがある。モードA動作において、語距離信号Diは、
その最小値から最大値へと順位をつけることができる。
同様にモードBにおいても、すべての音声等価クラスφ
nについて荷重語距離Diに、その最小値から最大値へ
順位をつけることができる。このように両方のモードで
順位つげを行うことによって、基準語候補にも順位を与
えることができる。
業者にとっては、本発明の精神と範囲を逸脱することな
く多くの修正や変更が可能であることはいうまでもな
い。たとえば、ある応用では、入力の識別の候補とし
て、順位をつけた複数のものを提供するのが望ましいこ
とがある。モードA動作において、語距離信号Diは、
その最小値から最大値へと順位をつけることができる。
同様にモードBにおいても、すべての音声等価クラスφ
nについて荷重語距離Diに、その最小値から最大値へ
順位をつけることができる。このように両方のモードで
順位つげを行うことによって、基準語候補にも順位を与
えることができる。
以上を要約すると次のようになる。
1.入力語を一群の基準語の1つとして認識するための装
置において、 該基準語を表わす複数個の基準語特徴標準を蓄える手段
と、 該入力語に応動して入力語特徴標準を発生する手段と、 該基準語特徴標準と該入力語特徴標準とに応動して該基
準語の1つとして該入力語を識別する手段とが含まれ、 さらに該入力語を識別する該手段(100)が、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の語距離信号を発生する手段(105、200)と、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の荷重語距離信号を発生する手段(105、200、5
00)と、 該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択する手段(300、4
00)とを含んでいる。
置において、 該基準語を表わす複数個の基準語特徴標準を蓄える手段
と、 該入力語に応動して入力語特徴標準を発生する手段と、 該基準語特徴標準と該入力語特徴標準とに応動して該基
準語の1つとして該入力語を識別する手段とが含まれ、 さらに該入力語を識別する該手段(100)が、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の語距離信号を発生する手段(105、200)と、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の荷重語距離信号を発生する手段(105、200、5
00)と、 該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択する手段(300、4
00)とを含んでいる。
2.上記第1項の装置において、 該基準語特徴標準と該入力語特徴標準とが複数個のフレ
ームから成り、 該一群の語距離信号を発生する該手段が、該基準語特徴
標準と該入力語特徴標準とに応動して該基準語特徴標準
と該入力語特徴標準とのフレーム間の類似性を表わす一
群のフレーム距離信号を発生する手段と、 該フレーム距離信号を結合して該語距離信号を発生する
手段とを含んでいる。
ームから成り、 該一群の語距離信号を発生する該手段が、該基準語特徴
標準と該入力語特徴標準とに応動して該基準語特徴標準
と該入力語特徴標準とのフレーム間の類似性を表わす一
群のフレーム距離信号を発生する手段と、 該フレーム距離信号を結合して該語距離信号を発生する
手段とを含んでいる。
3.上記第2項の装置において、 特徴標準が蓄えられている該基準語が等価クラスの予め
定めた群に属し、該クラスの各各は予め定めた類似の程
度内にある基準語を表わしており、 該一群の荷重語距離信号を発生する手段が、 同一の等価クラスに属する基準語の基準語特徴標準のフ
レーム間の期待される類似性を表わす複数個の荷重標準
を蓄える手段と、 該フレーム距離信号と該荷重標準とに応動して荷重フレ
ーム距離信号を発生する手段と、 該荷重フレーム距離信号を結合して該荷重語距離信号を
発生する手段とを含んでいる。
定めた群に属し、該クラスの各各は予め定めた類似の程
度内にある基準語を表わしており、 該一群の荷重語距離信号を発生する手段が、 同一の等価クラスに属する基準語の基準語特徴標準のフ
レーム間の期待される類似性を表わす複数個の荷重標準
を蓄える手段と、 該フレーム距離信号と該荷重標準とに応動して荷重フレ
ーム距離信号を発生する手段と、 該荷重フレーム距離信号を結合して該荷重語距離信号を
発生する手段とを含んでいる。
4.上記第3項の装置において、 該入力語に最も良く対応する基準語を選択する該手段
が、 該語距離信号に応動して、該入力語に最も良く対応する
語距離信号を表わす基準語の等価クラスを選択する手段
と、 該荷重語距離信号に応動して、該入力語に最も良く対応
する荷重語距離信号を表わす選択された等価クラス内の
基準語を識別する手段とを含んでおり、 これによって該識別された基準語が該入力語を認識する
候補となる。
が、 該語距離信号に応動して、該入力語に最も良く対応する
語距離信号を表わす基準語の等価クラスを選択する手段
と、 該荷重語距離信号に応動して、該入力語に最も良く対応
する荷重語距離信号を表わす選択された等価クラス内の
基準語を識別する手段とを含んでおり、 これによって該識別された基準語が該入力語を認識する
候補となる。
5.上記第1、2又は3項の装置において、 該入力語特徴標準及び該基準語特徴標準は話された語の
音声特性を表わしている。
音声特性を表わしている。
6.上記第3又は4項の装置において、該等価クラスは音
声的に類似した基準語の群を表わしており、 該フレームは時間の離散的周期を表わしている。
声的に類似した基準語の群を表わしており、 該フレームは時間の離散的周期を表わしている。
7.上記第6項の装置において、該基準語特徴標準及び該
入力語特徴標準の各々は同数の時間フレームから成る。
入力語特徴標準の各々は同数の時間フレームから成る。
8.1つの入力語を一群の基準語の1つとして認識する方
法において、 該基準語を表わす基準語特徴標準を複数個蓄えるステッ
プと、 該入力語に応動して入力語特徴標準を発生するステップ
と、 該基準語特徴標準と該入力語特徴標準とに応動して該入
力語を該基準語の1つとして識別するステップとが含ま
れ、 該入力語を識別するステップは、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の語距離信号を発生するステップと、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の荷重語距離信号を発生するステップと、 該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択するステップとを含ん
でいる。
法において、 該基準語を表わす基準語特徴標準を複数個蓄えるステッ
プと、 該入力語に応動して入力語特徴標準を発生するステップ
と、 該基準語特徴標準と該入力語特徴標準とに応動して該入
力語を該基準語の1つとして識別するステップとが含ま
れ、 該入力語を識別するステップは、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の語距離信号を発生するステップと、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の荷重語距離信号を発生するステップと、 該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択するステップとを含ん
でいる。
9.上記第8項に従って一群の基準語の1つとして入力語
を認識する方法において、 該基準語特徴標準及び該入力語特徴標準の各々が複数の
フレームを持ち、 該一群の語距離信号を発生する該ステップが、 該基準語特徴標準と該入力語特徴標準とに応動して該基
準語特徴標準と該入力語特徴標準とのフレーム間の類似
性を表わす一群のフレーム距離信号を発生するステップ
と、 該フレーム距離信号を結合して該語距離信号を発生する
ステップとを含んでいる。
を認識する方法において、 該基準語特徴標準及び該入力語特徴標準の各々が複数の
フレームを持ち、 該一群の語距離信号を発生する該ステップが、 該基準語特徴標準と該入力語特徴標準とに応動して該基
準語特徴標準と該入力語特徴標準とのフレーム間の類似
性を表わす一群のフレーム距離信号を発生するステップ
と、 該フレーム距離信号を結合して該語距離信号を発生する
ステップとを含んでいる。
10.上記第9項に従って一群の基準語の1つとして入力
語を認識する方法において、 特徴標準が蓄えられる該基準語が等価クラスの予め定め
た群に属し、該クラスの各々は予め定めた類似の程度内
にある基準語を表わしており、 一群の荷重語距離信号を発生する該ステップが、 同一の等価クラスに属する基準語の基準語特徴標準のフ
レーム間の期待される類似性を表わす複数個の画集標準
を蓄えるステップと、 該フレーム距離信号と該荷重標準とに応動して荷重フレ
ーム距離信号を発生するステップと、 該荷重フレーム距離信号を結合して該荷重距離信号を発
生するステップとを含んでいる。
語を認識する方法において、 特徴標準が蓄えられる該基準語が等価クラスの予め定め
た群に属し、該クラスの各々は予め定めた類似の程度内
にある基準語を表わしており、 一群の荷重語距離信号を発生する該ステップが、 同一の等価クラスに属する基準語の基準語特徴標準のフ
レーム間の期待される類似性を表わす複数個の画集標準
を蓄えるステップと、 該フレーム距離信号と該荷重標準とに応動して荷重フレ
ーム距離信号を発生するステップと、 該荷重フレーム距離信号を結合して該荷重距離信号を発
生するステップとを含んでいる。
11.上記第10項に従い一群の基準語の1つとして入力
語を認識する方法において、 該入力語に最も良く対応する基準語を選択する該ステッ
プが、 該語距離信号に応動して、該入力語に最も良く対応する
語距離信号を表わす基準語の等価クラスを選択するステ
ップと、 該荷重語距離信号に応動して、該入力語に最も良く対応
する荷重語距離信号を表わす選択された等価クラス内の
基準語を識別するステップとを含んでおり、 これによって該識別された基準語が該入力語を認識する
候補となる。
語を認識する方法において、 該入力語に最も良く対応する基準語を選択する該ステッ
プが、 該語距離信号に応動して、該入力語に最も良く対応する
語距離信号を表わす基準語の等価クラスを選択するステ
ップと、 該荷重語距離信号に応動して、該入力語に最も良く対応
する荷重語距離信号を表わす選択された等価クラス内の
基準語を識別するステップとを含んでおり、 これによって該識別された基準語が該入力語を認識する
候補となる。
12.上記第8、9又は10項に従って一群の基準語の1
つとして入力語を認識する方法において、 該入力語特徴標準及び該基準語特徴標準は話された語の
音声特性を表わしている。
つとして入力語を認識する方法において、 該入力語特徴標準及び該基準語特徴標準は話された語の
音声特性を表わしている。
13.上記第10又は11項に従って一群の基準語の1つ
として入力語を認識する方法において、 該等価クラスは音声的に類似した基準語の群を表わして
おり、 該フレームは時間の離散的周期を表わしている。
として入力語を認識する方法において、 該等価クラスは音声的に類似した基準語の群を表わして
おり、 該フレームは時間の離散的周期を表わしている。
14.上記第13項に従って一群の基準語の1つとして入
力語を認識する方法において、該基準語特徴標準及び該
入力語特徴標準の各々は同数の時間フレームから成る。
力語を認識する方法において、該基準語特徴標準及び該
入力語特徴標準の各々は同数の時間フレームから成る。
15.話された入力語を一群の基準語の1つとして認識す
る装置において、 該基準語の音声的特性を表わす複数個の基準語特徴標準
を蓄える手段と、該入力語に応動し該入力語の音声的特
性を表わす入力語特性標準を発生する手段と、該基準語
特徴標準及び該入力語特徴標準に応動して該入力語を該
基準語の1つとして識別する手段とが含まれ、該入力語
識別手段が、該基準語特徴標準と該入力語特徴標準とに
応動して一群の語距離信号を発生する手段と、該基準語
特徴標準と該入力語特徴標準とに応動して一群の荷重語
距離信号を発生する手段と、該語距離信号と該荷重語距
離信号とに応動して該入力語に最も良く対応する基準語
を選択する手段とを含んでいる。
る装置において、 該基準語の音声的特性を表わす複数個の基準語特徴標準
を蓄える手段と、該入力語に応動し該入力語の音声的特
性を表わす入力語特性標準を発生する手段と、該基準語
特徴標準及び該入力語特徴標準に応動して該入力語を該
基準語の1つとして識別する手段とが含まれ、該入力語
識別手段が、該基準語特徴標準と該入力語特徴標準とに
応動して一群の語距離信号を発生する手段と、該基準語
特徴標準と該入力語特徴標準とに応動して一群の荷重語
距離信号を発生する手段と、該語距離信号と該荷重語距
離信号とに応動して該入力語に最も良く対応する基準語
を選択する手段とを含んでいる。
16.上記第15項の装置において、該基準語特徴標準と
該入力語特徴標準とはともに複数個のフレームを持ち、
特徴標準を蓄えている該基準語が等価クラスの予め定め
た群に属し、該クラスの各々は予め定めた類似の程度内
にある基準語を表わしており、該一群の語距離信号を発
生する該手段が、該基準語特徴標準と該入力語特徴標準
とに応動して該基準語特徴標準と該入力語特徴標準との
フレーム間の類似性を表わす一群のフレーム距離信号を
発生する手段と、該フレーム距離信号を加算して該語距
離信号を発生する手段とを含んでおり、 該一群の荷重語距離信号を発生する該手段が、同一の等
価クラスに属する基準語の基準語特徴標準のフレーム間
の期待される類似性を表わす複数個の荷重標準を蓄える
手段と、該フレーム距離信号と該荷重標準とに応動して
荷重フレーム距離信号を発生する手段と、該荷重フレー
ム距離信号を加算して該荷重語距離信号を発生する手段
とを含んでいる。
該入力語特徴標準とはともに複数個のフレームを持ち、
特徴標準を蓄えている該基準語が等価クラスの予め定め
た群に属し、該クラスの各々は予め定めた類似の程度内
にある基準語を表わしており、該一群の語距離信号を発
生する該手段が、該基準語特徴標準と該入力語特徴標準
とに応動して該基準語特徴標準と該入力語特徴標準との
フレーム間の類似性を表わす一群のフレーム距離信号を
発生する手段と、該フレーム距離信号を加算して該語距
離信号を発生する手段とを含んでおり、 該一群の荷重語距離信号を発生する該手段が、同一の等
価クラスに属する基準語の基準語特徴標準のフレーム間
の期待される類似性を表わす複数個の荷重標準を蓄える
手段と、該フレーム距離信号と該荷重標準とに応動して
荷重フレーム距離信号を発生する手段と、該荷重フレー
ム距離信号を加算して該荷重語距離信号を発生する手段
とを含んでいる。
17.上記第16項の装置において、該入力語に最も良く
対応する基準語を選択する手段が、該語距離信号に応動
して最小の語距離信号を表わす基準語の等価クラスを選
択する手段と、該荷重語距離信号に応動して最小の荷重
語距離信号を表わす選択された等価クラス内の基準語を
識別する手段とを含んでおり、これによって該識別され
た基準語が該入力語を識別する候補となる。
対応する基準語を選択する手段が、該語距離信号に応動
して最小の語距離信号を表わす基準語の等価クラスを選
択する手段と、該荷重語距離信号に応動して最小の荷重
語距離信号を表わす選択された等価クラス内の基準語を
識別する手段とを含んでおり、これによって該識別され
た基準語が該入力語を識別する候補となる。
18.話された入力語を基準語の1つとして認識する方法
において、 該基準語の音声的特性を表わす複数個の基準語特徴標準
を蓄えるステップと、該入力語に応動し該入力語の音声
的特性を表わす入力語特徴標準を発生するステップと、
該基準語特徴標準及び該入力語特徴標準に応動して該入
力語を該基準語の1つとして識別するステップとが含ま
れ、該入力語識別ステップが、該基準語特徴標準と該入
力語特徴標準とに応動して一群の語距離信号を発生する
ステップと、該基準語特徴標準と該入力語特徴標準とに
応動して一群の荷重語距離信号を発生するステップと、
該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択するステップとを含ん
でいる。
において、 該基準語の音声的特性を表わす複数個の基準語特徴標準
を蓄えるステップと、該入力語に応動し該入力語の音声
的特性を表わす入力語特徴標準を発生するステップと、
該基準語特徴標準及び該入力語特徴標準に応動して該入
力語を該基準語の1つとして識別するステップとが含ま
れ、該入力語識別ステップが、該基準語特徴標準と該入
力語特徴標準とに応動して一群の語距離信号を発生する
ステップと、該基準語特徴標準と該入力語特徴標準とに
応動して一群の荷重語距離信号を発生するステップと、
該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択するステップとを含ん
でいる。
19.上記第18項に従い話された入力語を基準語の1つ
として認識する方法において、該基準語特徴標準と該入
力語特徴標準とはともに複数個のフレームを持ち、特徴
標準を蓄えている該基準語が等価クラスの予め定めた群
に属し、該クラスの各々は予め定めた類似の程度内にあ
る基準語を表わしており、 該一群の語距離信号を発生する該ステップが、該基準語
特徴標準と該入力語特徴標準とに応動して該基準語特徴
標準と該入力語特徴標準とのフレーム間の類似性を表わ
す一群のフレーム距離信号を発生するステップと、該フ
レーム距離信号を加算して該語距離信号を発生するステ
ップとを含んでおり、 該一群の荷重語距離信号を発生する該ステップが、同一
の等価クラスに属する基準語の基準特徴標準のフレーム
間の期待される類似性を表わす複数個の荷重標準を蓄え
るステップと、該フレーム距離信号と該荷重標準とに応
動して荷重フレーム距離信号を発生するステップと、該
荷重フレーム距離信号を加算して該荷重距離信号を発生
するステップとを含んでいる。
として認識する方法において、該基準語特徴標準と該入
力語特徴標準とはともに複数個のフレームを持ち、特徴
標準を蓄えている該基準語が等価クラスの予め定めた群
に属し、該クラスの各々は予め定めた類似の程度内にあ
る基準語を表わしており、 該一群の語距離信号を発生する該ステップが、該基準語
特徴標準と該入力語特徴標準とに応動して該基準語特徴
標準と該入力語特徴標準とのフレーム間の類似性を表わ
す一群のフレーム距離信号を発生するステップと、該フ
レーム距離信号を加算して該語距離信号を発生するステ
ップとを含んでおり、 該一群の荷重語距離信号を発生する該ステップが、同一
の等価クラスに属する基準語の基準特徴標準のフレーム
間の期待される類似性を表わす複数個の荷重標準を蓄え
るステップと、該フレーム距離信号と該荷重標準とに応
動して荷重フレーム距離信号を発生するステップと、該
荷重フレーム距離信号を加算して該荷重距離信号を発生
するステップとを含んでいる。
20.上記第19項に従い、話された入力語を基準語の1
つとして認識する方法において、該入力語に最も良く対
応する基準語を選択するステップが、該語距離信号に応
動して最小の語距離信号を表わす基準語の等価クラスを
選択するステップと、 該荷重語距離信号に応動して最小の荷重語距離信号を表
わす選択された等価クラス内の基準語を識別するステッ
プとを含んでおり、これによって該識別された基準語が
該入力語を識別する候補となる。
つとして認識する方法において、該入力語に最も良く対
応する基準語を選択するステップが、該語距離信号に応
動して最小の語距離信号を表わす基準語の等価クラスを
選択するステップと、 該荷重語距離信号に応動して最小の荷重語距離信号を表
わす選択された等価クラス内の基準語を識別するステッ
プとを含んでおり、これによって該識別された基準語が
該入力語を識別する候補となる。
入力語を識別する手段……第1図の語認識器100 語距離信号を発生する手段……第1図のフレーム距離発
生器105及び語距離発生器200 荷重語距離信号を発生する手段……第1図のフレーム距
離発生器105、語距離発生器200、及び荷重フレー
ム距離発生器500 基準語を選択する手段……第1図の最小語距離発生器3
00及びクラス比較器400 フレーム距離信号を発生する手段……第1図のフレーム
距離発生器105 フレーム距離信号を結合して語距離信号を発生する手段
……第1図、第2図の語距離発生器200 荷重標準を蓄える手段……第5図の荷重標準ROM53
0 荷重フレーム距離信号を発生する手段……第1図、第5
図の荷重フレーム距離発生器500 荷重語距離信号を発生する手段……第1図、第2図の語
距離発生器200 等価クラスを選択する手段……第1図、第4図のクラス
比較論理400 基準語を識別する手段……第1図、第3図の最小語距離
選択器300
生器105及び語距離発生器200 荷重語距離信号を発生する手段……第1図のフレーム距
離発生器105、語距離発生器200、及び荷重フレー
ム距離発生器500 基準語を選択する手段……第1図の最小語距離発生器3
00及びクラス比較器400 フレーム距離信号を発生する手段……第1図のフレーム
距離発生器105 フレーム距離信号を結合して語距離信号を発生する手段
……第1図、第2図の語距離発生器200 荷重標準を蓄える手段……第5図の荷重標準ROM53
0 荷重フレーム距離信号を発生する手段……第1図、第5
図の荷重フレーム距離発生器500 荷重語距離信号を発生する手段……第1図、第2図の語
距離発生器200 等価クラスを選択する手段……第1図、第4図のクラス
比較論理400 基準語を識別する手段……第1図、第3図の最小語距離
選択器300
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ロ−レンス・リチヤ−ド・ラビナ− アメリカ合衆国07922ニユ−ジヤ−シイ・ バ−クレイ・ハイツ・シエアブルツク・ド ライヴ58 (72)発明者 ジエイ・ゴ−ドン・ウイルポン アメリカ合衆国07060ニユ−ジヤ−シイ・ ウオ−レン・ラウンド・トツプ・ロ−ド75 (56)参考文献 特開 昭57−13494(JP,A)
Claims (5)
- 【請求項1】入力語を一群の基準語の一つとして認識す
るための装置であって、 該基準語を表す複数個の基準語特徴パターンを蓄える手
段と、 該入力語に応動して入力語特徴パターンを発生する手段
と、 該基準語特徴パターン及び該入力語特徴パターンに応動
して該基準語の一つとして該入力語を識別する手段とを
含む装置において、 該一群の基準語は、予め定めた等価クラスであって、各
クラスが予め定められた音響的類似度を有する基準語か
らなるものであるような等価クラスに分類され、 該基準語特徴パターン及び該入力語特徴パターンの各々
が複数のフレームを有しており、そして該入力語識別手
段(例えば、100)が、 該基準語特徴パターンと該入力語特徴パターンに応動し
て、一群の語距離信号であって、その各々が該基準語特
徴パターンのフレームと該入力語特徴パターンのフレー
ムの間における類似性を表すフレーム距離信号を結合し
たものであるような一群の語距離信号を発生する手段
(例えば、105、200)と、 該入力語特徴パターン、該入力語に最もよく対応するパ
ターンのクラスにおいて基準語特徴パターンを他の特徴
パターンから区別する基準語特徴パターンの1又は2以
上のフレームを強調する荷重パターン及び該クラスの基
準語特徴パターンに応動して一群の荷重された語距離信
号であって該クラスの該基準語特徴パターンと該入力語
特徴パターンとの間の類似性を表す複数のフレーム距離
信号と複数の該荷重パターンとを結合したものであるよ
うな一群の荷重された語距離信号を発生する手段(例え
ば、105、200、500)と、 該語距離信号及び該荷重された語距離信号に応動して、
それらの最小値を検出し、検出された最小値に応動し
て、該入力語に最もよく対応する基準語を選択する手段
(例えば、300、400)とを含むことを特徴とする
入力語認識装置。 - 【請求項2】特許請求の範囲第1項記載の入力語認識装
置において、 該入力語に最もよく対応する該基準語を選択する該手段
が、 該語距離信号に応動し、該入力語に最もよく対応する該
語距離信号を表す該基準語の該等価クラスを選択する手
段と、 該荷重された語距離信号に応動し、選択された該等価ク
ラス内において該入力語に最もよく対応する荷重された
語距離信号を表す該基準語を識別する手段とを含んでい
ることと、 これによって該識別された基準語を該入力語の認識の候
補とすることとを特徴とする入力語認識装置。 - 【請求項3】特許請求の範囲第1項、又は第2項記載の
入力語認識装置において、 該入力語特徴パターンと該基準語特徴パターンとが話さ
れた語の音響的特性を表していることを特徴とする入力
語認識装置。 - 【請求項4】特許請求の範囲第1項記載の入力語認識装
置において、 該等価クラスが音響的に類似した基準語を表しているこ
とと、 該フレームが時間の離散的な周期を表していることとを
特徴とする入力語認識装置。 - 【請求項5】特許請求の範囲第1項、第2項、第3項、
又は第4項記載の入力語認識装置において、 該基準語特徴パターン及び該入力語特徴パターンの各々
が同じ数の時間フレームを持っていることを特徴とする
入力語認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US06/248,547 US4400828A (en) | 1981-03-27 | 1981-03-27 | Word recognizer |
US248547 | 1981-03-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS57176100A JPS57176100A (en) | 1982-10-29 |
JPH0634185B2 true JPH0634185B2 (ja) | 1994-05-02 |
Family
ID=22939608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57048183A Expired - Lifetime JPH0634185B2 (ja) | 1981-03-27 | 1982-03-27 | 入力語認識装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US4400828A (ja) |
JP (1) | JPH0634185B2 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU7529981A (en) * | 1980-09-19 | 1982-03-25 | Hitachi Limited | Language analysis by pattern recognition |
JPS57137976A (en) * | 1981-02-18 | 1982-08-25 | Nec Corp | Zip code discriminating device |
US4761815A (en) * | 1981-05-01 | 1988-08-02 | Figgie International, Inc. | Speech recognition system based on word state duration and/or weight |
US4520500A (en) * | 1981-05-07 | 1985-05-28 | Oki Electric Industry Co., Ltd. | Speech recognition system |
US4608708A (en) * | 1981-12-24 | 1986-08-26 | Nippon Electric Co., Ltd. | Pattern matching system |
US4989248A (en) * | 1983-01-28 | 1991-01-29 | Texas Instruments Incorporated | Speaker-dependent connected speech word recognition method |
US4674066A (en) * | 1983-02-18 | 1987-06-16 | Houghton Mifflin Company | Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words |
US4580241A (en) * | 1983-02-18 | 1986-04-01 | Houghton Mifflin Company | Graphic word spelling correction using automated dictionary comparisons with phonetic skeletons |
US4771401A (en) * | 1983-02-18 | 1988-09-13 | Houghton Mifflin Company | Apparatus and method for linguistic expression processing |
US5131043A (en) * | 1983-09-05 | 1992-07-14 | Matsushita Electric Industrial Co., Ltd. | Method of and apparatus for speech recognition wherein decisions are made based on phonemes |
US4991216A (en) * | 1983-09-22 | 1991-02-05 | Matsushita Electric Industrial Co., Ltd. | Method for speech recognition |
US4783758A (en) * | 1985-02-05 | 1988-11-08 | Houghton Mifflin Company | Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words |
GB8517918D0 (en) * | 1985-07-16 | 1985-08-21 | British Telecomm | Recognition system |
US5023911A (en) * | 1986-01-10 | 1991-06-11 | Motorola, Inc. | Word spotting in a speech recognition system without predetermined endpoint detection |
US4829472A (en) * | 1986-10-20 | 1989-05-09 | Microlytics, Inc. | Spelling check module |
JPS63158596A (ja) * | 1986-12-23 | 1988-07-01 | 株式会社東芝 | 音韻類似度計算装置 |
JPH0638195B2 (ja) * | 1987-01-30 | 1994-05-18 | 日本電気株式会社 | パタンマッチング装置 |
US5027408A (en) * | 1987-04-09 | 1991-06-25 | Kroeker John P | Speech-recognition circuitry employing phoneme estimation |
DE3819178A1 (de) * | 1987-06-04 | 1988-12-22 | Ricoh Kk | Spracherkennungsverfahren und -einrichtung |
US4918731A (en) * | 1987-07-17 | 1990-04-17 | Ricoh Company, Ltd. | Speech recognition method and apparatus |
US4980917A (en) * | 1987-11-18 | 1990-12-25 | Emerson & Stern Associates, Inc. | Method and apparatus for determining articulatory parameters from speech data |
US4977604A (en) * | 1988-02-17 | 1990-12-11 | Unisys Corporation | Method and apparatus for processing sampled data signals by utilizing preconvolved quantized vectors |
JPH0821065B2 (ja) * | 1989-03-13 | 1996-03-04 | シャープ株式会社 | 文字認識装置 |
US5168524A (en) * | 1989-08-17 | 1992-12-01 | Eliza Corporation | Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation |
WO1992006469A1 (en) * | 1990-10-02 | 1992-04-16 | The Dsp Group, Inc. | Boundary relaxation for speech pattern recognition |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
US5410611A (en) * | 1993-12-17 | 1995-04-25 | Xerox Corporation | Method for identifying word bounding boxes in text |
JP3445394B2 (ja) * | 1993-12-17 | 2003-09-08 | ゼロックス・コーポレーション | 少なくとも二つのイメージセクションの比較方法 |
US5903864A (en) * | 1995-08-30 | 1999-05-11 | Dragon Systems | Speech recognition |
US5835638A (en) * | 1996-05-30 | 1998-11-10 | Xerox Corporation | Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols |
US5825855A (en) * | 1997-01-30 | 1998-10-20 | Toshiba America Information Systems, Inc. | Method of recognizing pre-recorded announcements |
US6754625B2 (en) * | 2000-12-26 | 2004-06-22 | International Business Machines Corporation | Augmentation of alternate word lists by acoustic confusability criterion |
FI121583B (fi) * | 2002-07-05 | 2011-01-14 | Syslore Oy | Symbolijonon etsintä |
US9158983B2 (en) | 2010-07-08 | 2015-10-13 | E-Image Data Corporation | Microform word search method and apparatus |
US8645136B2 (en) | 2010-07-20 | 2014-02-04 | Intellisist, Inc. | System and method for efficiently reducing transcription error using hybrid voice transcription |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5136141B2 (ja) * | 1971-11-10 | 1976-10-06 | ||
US4058795A (en) * | 1972-10-03 | 1977-11-15 | International Business Machines Corporation | Method and apparatus for context-aided recognition |
JPS5517988B2 (ja) * | 1974-06-05 | 1980-05-15 | ||
US4200861A (en) * | 1978-09-01 | 1980-04-29 | View Engineering, Inc. | Pattern recognition apparatus and method |
US4288782A (en) * | 1979-08-24 | 1981-09-08 | Compression Labs, Inc. | High speed character matcher and method |
JPS5713494A (en) * | 1980-06-26 | 1982-01-23 | Fujitsu Ltd | Voice recognition processing system |
US4355302A (en) * | 1980-09-12 | 1982-10-19 | Bell Telephone Laboratories, Incorporated | Spelled word recognizer |
-
1981
- 1981-03-27 US US06/248,547 patent/US4400828A/en not_active Expired - Lifetime
-
1982
- 1982-03-27 JP JP57048183A patent/JPH0634185B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US4400828A (en) | 1983-08-23 |
JPS57176100A (en) | 1982-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0634185B2 (ja) | 入力語認識装置 | |
US6208971B1 (en) | Method and apparatus for command recognition using data-driven semantic inference | |
US7421387B2 (en) | Dynamic N-best algorithm to reduce recognition errors | |
EP0380297B1 (en) | Method and apparatus for speech recognition | |
US6513005B1 (en) | Method for correcting error characters in results of speech recognition and speech recognition system using the same | |
US6487532B1 (en) | Apparatus and method for distinguishing similar-sounding utterances speech recognition | |
JP3168779B2 (ja) | 音声認識装置及び方法 | |
EP0109190A1 (en) | Monosyllable recognition apparatus | |
CN107180084A (zh) | 词库更新方法及装置 | |
CN109036471B (zh) | 语音端点检测方法及设备 | |
US10395109B2 (en) | Recognition apparatus, recognition method, and computer program product | |
CN110021293A (zh) | 语音识别方法及装置、可读存储介质 | |
JPH0713594A (ja) | 音声合成において音声の質を評価するための方法 | |
US5559925A (en) | Determining the useability of input signals in a data recognition system | |
CN111554276A (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
US20050187767A1 (en) | Dynamic N-best algorithm to reduce speech recognition errors | |
CN111554275A (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
US7181062B2 (en) | Modular classification architecture for a pattern recognition application | |
JPH10240930A (ja) | パターン認識方法およびパターン認識装置 | |
CN114530145B (zh) | 语音识别结果纠错方法及装置、计算机可读存储介质 | |
CN112465805A (zh) | 用于钢筋冲压折弯的质量检测的神经网络的训练方法 | |
JP3444108B2 (ja) | 音声認識装置 | |
JPH0823758B2 (ja) | 話者適応形音声認識装置 | |
JPH05314320A (ja) | 認識距離の差と候補順を利用した認識結果の評価方式 | |
JP2966002B2 (ja) | 音声認識装置 |