JPH0634185B2 - 入力語認識装置 - Google Patents

入力語認識装置

Info

Publication number
JPH0634185B2
JPH0634185B2 JP57048183A JP4818382A JPH0634185B2 JP H0634185 B2 JPH0634185 B2 JP H0634185B2 JP 57048183 A JP57048183 A JP 57048183A JP 4818382 A JP4818382 A JP 4818382A JP H0634185 B2 JPH0634185 B2 JP H0634185B2
Authority
JP
Japan
Prior art keywords
word
input
signal
distance
input word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57048183A
Other languages
English (en)
Other versions
JPS57176100A (en
Inventor
フランク・クリストフア−・ピアツ
ロ−レンス・リチヤ−ド・ラビナ−
ジエイ・ゴ−ドン・ウイルポン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Technologies Inc filed Critical AT&T Technologies Inc
Publication of JPS57176100A publication Critical patent/JPS57176100A/ja
Publication of JPH0634185B2 publication Critical patent/JPH0634185B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 本発明は、音声解析システムに関し、特に、語認識装置
に関する。
語認識装置は、通信システム、データ処理システム、制
御システム等に対する直接的入力を可能にする。このよ
うな装置は、通常、基準語彙をデジタルパターン又はテ
ンプレート(標準)として蓄えている。書かれた、ある
いは話された入力は、デジタル形式に変換され、基準語
と比較されて識別される。しかし、入力語を、類似した
基準の1つとして正確に判別することが困難であること
が多い。一例として、アルファベット文字を発音したも
のを基準語語彙とした場合、音声的類似のために識別が
妨げられる。すなわち、文字“X、S及びF”や、文字
“B、C及びD”は音声的に混同しやすく正確に区別す
ることが困難である。
ジイー・デイー・バルム氏(G.D.Balm)による米国
特許第4.058,795号で述べられている従来技術
の文字認識器では、入力文字の判別に疑問が生じると、
その前後の文字を考慮することにより解決を試みてい
る。この前後の文字は、その混同時の表に従ってグルー
プに類別されている。このグループを用いて文脈コード
が決定される。文脈コードにより、疑問のある入力文字
を正しく識別するものとして、グループの要素の1つが
選択される。このバルム(Balm)による構成方法では、
正確に認識された文字が、疑問のある文字をはさんでい
るものと仮定されている。しかし、隣の入力文字の識別
も疑しい場合もある。従ってバルム(Balm)による文脈
形解析にも限界がある。
星野等による米国特許第4.027.284号における
機械印字文字の認識システムでは、複数の基準パターン
が、共通のパターン要素を持つ文字のグループに分割さ
れている。その共通パターン要素が各グループの標準パ
ターンを定義している。入力文字との間の差が定められ
た値より小さい標準パターンが決定される。つぎに、決
定されたグループ内の文字の共通でないパターン要素と
入力文字との間が取られる。この差の値が最も小さい文
字が入力を識別するものとして選ばれる。この星野によ
るシステムは、機械印字文字のように共通でないパター
ン要素の数が固定されている場合には、認識の正確さを
改善することができる。しかし、共通でない要素が可変
であるような類似の文字を区別することはできない。
従って、本発明の目的は、類似していて混同しやすい基
準語彙内の1つの語として入力文字を識別できるような
改善された装置を提供することにある。
本発明は、一群の基準語の1つとして入力語を認識する
装置を目的としている。入力語と各基準語との対応性を
表わす語距離信号が作られる。荷重語距離信号も作られ
る。この語距離信号及び荷重語距離信号に応動して、入
力語に最も良く対応する基準語が選ばれる。
本発明の一実施例では、一群の基準語がその音声的類似
性に従って予め定めたクラスに分類されている。基準語
に対応する基準語特徴パターンが蓄えられている。この
特徴パターンは固定された数の時間フレームから成る。
話された入力語はデイジタル符号化される。符号化され
た語に応動し、一定数の時間フレームから成る入力語特
徴パターンが作られる。入力語特徴標準と各基準語特徴
パターンとの間の各フレームにおける対応の程度を表わ
す一群のフレーム距離信号が作られる。このフレーム距
離信号が結合されて、入力語と各基準語との対応の程度
を表わす語距離信号となる。この語距離信号に応動し
て、入力語に最も良く対応するクラスが選ばれる。予め
定められて蓄積されている一群の荷重パターンは、同じ
クラスに属する基準語の間のフレーム毎の期待される類
似性を表わしている。選択されたクラスに属する荷重パ
ターンとフレーム距離信号とが結合されて、荷重語距離
信号が得られる。入力語に最も良く対応する荷重語距離
信号が識別される。この識別された荷重語距離信号が、
入力語を認識する最良の候補となる基準語であるものと
指定される。
第1図は本発明の一実施例である語認識器100の一般
的ブロック図を示している。第1図のシステムは、話さ
れた会話音を識別するのに用いることができる。あるい
は、語認識器が、たとえば汎用計算機と読出し専用メモ
リ(ROM)とを含み、第1図に関して述べる信号処理
機能をこれらに行わせることも可能である。
音声は特徴信号発生器101の入力に印加され、当業者
には公知の線形予測分析に基づいて音声特徴信号Tに変
換される。これとは別に、スペクトル信号、フオルマン
ト信号、あるいは他の特徴信号を用いることもできる。
特徴信号Tは、線形時間ワープ102において、例えば
40時間フレームの標準の長さに正規化される。信号処
理におけるこの正規化の方法は、アイ.イ.イ.イ.音
響上の処理、スピーチ及び信号処理誌(IEEE Transacti
ons on Acoustics,Speech,and Signal Processing)の
ASSP−29巻、622−635頁、1980年12
月号のシー.エス.メイヤ(C.S.Myers)、エル.
アール.ラビニア(L.R.Rabiner)及びエイ.イ.
ローゼンバーグ(A.E.Rosenberg)著の論文“Pevfo
rmance Tradeoffe in Dynamic Time Warping Algorithm
for Isolated Word Recognition”に示されている。
正規化された入力特徴信号 は入力特徴メモリ104に蓄えられる。
のカッコ内のkは入力の特定のフレームを指す指標であ
る。kの範囲はk=0、1、…Kで与えられる。本実施
例では、40の時間フレームがあり、Kは39に等し
い。基準語に対して予め得られている特徴標準 が基準特徴メモリ103に蓄えられている。以下、特徴
標準とは特徴パターン又は特徴テンプレートと同義語と
理解されたい。
の添数iは特定の基準語を指す指標であり、カッコ内の
kは、前と同じように、フレームを指定する。iの範囲
はたとえばi=0、1、…、Iで与えられる。この上限
Iは、例えば38に等しく、この場合、基準語はアルフ
ァベット26文字と、数字の0乃至9と、指令語“ST
OP”、“ERRR”及び“REPEAT”とを含ん
でいる。しかし、実施例の説明においては、基準語の語
彙としては、A、B、C、D、F、J、K、S、X、
6、8、及びREPEATの12ケの語から成るものと
する。よって、iの範囲はi=0、1、…、11で与え
られる。
入力特徴信号 を一群の基準特徴標準 と比較することにより、フレーム距離発生器105にお
いて、一群のフレーム距離信号d(k)が得られる。こ
のフレーム距離信号d(k)を得るために、距離発生器
105において、当業者には公知の動的時間ワープ信号
処理方法を用いることができる。
フレーム距離信号d(k)は語距離発生器200及び荷
重フレーム距離発生器500に印加される。語距離発生
器200において、フレーム距離信号d(k)が統合さ
れて、語距離信号Dになる。ただし、指標iはi=
0、1、…、11をとる。語距離信号Dに応動して、
最小語距離選択器300において、最小語距離信号Dmi
nと、これに対応する語指標信号iminが得られる。この
最小語指標信号iminに応動して、音声等価クラス信号
φminがクラス比較論理400で得られる。
荷重フレーム距離発生器500において、距離信号d
(k)が荷重標準 と結合され、荷重フレーム距離信号 が得られる。音声等価クラスφminに属する語iの各々
に対する荷重フレーム距離信号 が語距離発生器200で結合されて荷重語距離信号 が得られる。最小語距離選択器300において、荷重語
距離信号 から最小荷重語距離信号 が選ばれる。これに対応する語指標信号 が応用装置106に出力される。信号 は入力を識別するのに最良の候補となる基準語を指定す
る。
制御器160は、例えばデータ ジエネラル コーポレ
ーシヨン(Data General Corporation)から1979に
発行されたマイクロプロダクト ハードウエア システ
ム(Microproducts Hardware Systms)に記されている
ようなマイクロプロセッサ、あるいは当業者には公知の
他のマイクロプロセッサシステムで実現できる。このマ
イクロプロセッサは付随する読出し専用メモリに蓄えら
れた命令コードに従って動作する。この命令コードの例
として、フオートラン言語で書かれたものを付録1に示
す。
語認識器100の回路の動作が第6図の流れ図600で
示されている。第6図の動作ブロック602で示したよ
うに、応用装置106からの信号STARTに応動し
て、制御器160は語認識器100の動作を開始させ
る。
語認識器100は、2つのモードA、Bのうちの1つで
動作するが、これは制御器160からの信号ABMOD
Eによって決定される。信号ABMODEが、第6図の
動作ブロック604で示すように真であると、モードA
となり、偽であるとモードBとなる。
モードAの動作において、語カウンタ140及びフレー
ムカウンタ150は、制御器160からの信号SETW
C及びSETFCによって初期値ゼロにセットされる。
語カウンタ140からの語指標信号i及びフレームカウ
ンタ150からのフレーム指標信号kは、これによって
ともにゼロになる。制御器160からの信号SETLP
Nに応動して、第3図のラッチ320はその最大数にセ
ットされる。この初期化動作は第6図の動作ブロック6
06及び608に示されている。
第1の基準語の第1のフレームに対応する指標信号i及
びkに応動して、基準特徴信号 が基準特徴メモリ103から出力される。入力語の第1
のフレームに対応する指標信号kに応動して、入力特徴
信号 が入力特徴メモリ104から出力される。第6図の動作
ブロック610に示したように、制御器160からのD
TWSTRAT信号に応動して、フレーム距離発生器1
05において、特徴信号 及び から距離信号d(0)が決定される。動作ブロック61
2に示した、発生器105からの信号DTWDONE
は、フレーム距離信号d(0)が作られた後で制御器1
60に印加される。フレーム距離信号d(k)は動作ブ
ロック614で示したように累積されるが、これについ
ては、語距離発生器200に関連して説明する。信号D
TWDONEに応動して、制御器160からの信号IN
CFCがフレームカウンタ150に印加され、フレーム
指標信号kをk=1に増分する。これは動作ブロック6
16に示されている。制御器160からのDTWSTA
RT信号に応動して、フレーム距離信号d(1)がフレ
ーム距離発生器105で作られる。信号d(1)が作ら
れた後、信号DTWDONEが発生器105から出力さ
れる。さらにフレーム指標信号kが増分され、判定ブロ
ック618で示すように、処理が繰返えされて、最終的
に40ケのフレーム距離信号d(k)、k=0、1、
…、30が得られる。k=39になると、フレームカウ
ンタ150は信号EKを出力する。この信号EKに応動
し、制御器160からの信号ENWDSが印加されて、
語距離信号の比較が付勢される。これは動作ブロック6
20に示されているが、最小語距離選択器300に関連
して後述する。動作ブロック622で示すように制御器
160からの信号INCWCが印加されて語カウンタ1
40の出力iが増分される。このiが最終の語でない
と、40ケの新しいフレーム距離信号が作られる。これ
は判定ブロック624に示されている。このようにし
て、語指標信号iの0乃至11について、フレーム距離
信号d(k)が作られる。
カウンタ140及び150からの指標信号i及びkは第
5図のRAM510のアドレス端子にも印加される。R
AM510は、たとえばテキサスインストルメント(Te
xas Instruments)社で作られている74S207型回
路で実現できる。発生器105からのフレーム距離信号
(k)はRAM510のデータ端子に印加される。信
号LDWDG及びABMODEが制御器160からナン
ドゲート540の入力に印加される。このナンドゲート
540の出力は偽であり、これがRAM510のR/
端子に印加される。これによって、RAM510は、モ
ードAにおいて、信号i及びkで指定される位置にフレ
ーム距離信号d(k)を蓄える。このフレーム距離信号
(k)は、後でモードB動作中にRAM510から取
り出される。
モードA動作中、第2図の語距離発生器200におい
て、制御器160からの信号ABMODEがマルチプレ
クサ210の選択端子Sに印加され、これによってマル
チプレクサ210のA入力が選択される。マルチプレク
サ210は、例えば、テキサス・インストルメント(Te
xas Instruments)社で作っている74157型回路で
実現できる。マルチプレクサ210のA端子に印加され
るフレーム距離信号d(k)入力がこのマルチプレクサ
のQ端子に出力され、加算器220のA入力に印加され
る。加算器220は、例えば、テキサスインストルメン
ト(Texas Instruments)社で作っている74283型
回路で実現できる。加算器220のB入力は、ラッチ2
30のQ出力に接続されている。ラッチ230は、例え
ばテキサスインストルメント(Texas Instruments)社
で作っている74273型回路で実現できる。ラッチ2
30のD入力端子は加算器220のQ出力に接続されて
いる。加算動作を行う時、ラッチ230は第6図の動作
ブロック608で示されているように、制御器160か
らの信号CLRWDGによってクリアされる。距離信号
(k)の各々が作られた後、制御器160からの信号
LDWDGがラッチ230の置数端子に印加される。こ
れは動作ブロック614に示されている。このようにし
て、40ケのフレーム距離信号の和が加算器220及び
ラッチ230でとられてその合計が計算され、語距離信
号Dとなる。次の語iに対しても、ラッチ230が再
び信号CLRWDGにによってクリアされ、加算動作が
繰返えされる。このようにして全部で12ケの語距離信
号Dがi=0、1、…、11について作られる。
次に第3図の最小語距離選択器300において、語距離
信号Dの各々が作られた時に、これが比較310のA
入力と、ラッチ320のD入力とに印加される。比較器
310は、例えばテキサスインストルメント(Texas In
struments)社で作っている7485型回路で実現でき
る。ラッチ320のQ出力は比較器310のB入力に印
加されている。動作ブロック606に関して前述したよ
うに、ラッチ320は、最初制御器160からの信号S
ETLPNによってその最大数にセットされている。次
に続くD信号がラッチ320内の現在の値よりも小さ
いと、比較器310のB>A出力からの真の信号がアン
ドゲート340に印加される。アンドゲート340は、
モードA動作中において制御器160からの信号ENW
DSによって付勢されている。アンドゲート340の出
力により、ラッチ320は次に続くD信号の値を取り
込む。アンドゲート340の出力はラッチ330も付勢
し、カウンタ140から送られ、ラッチ320に取り込
まれた語距離信号Dに対応する指標信号iをラッチ3
30に置数する。このように、比較器310、ラッチ3
20及び330によって、i=0から11に対するすべ
ての語距離信号Dから、最小語距離信号Dmin及び対
応する指標信号iminが得られる。
表1は、一例として、可能な語距離信号と対応する語指
標信号とを示している。語距離信号Dは14.8に等し
く、表内のすべての中で最小の大きさを持っている。従
って、最小語距離信号Dminは14.8に等しく、また対応
する最小語指標iminは9に等しい。
第4図のクラス比較論理400において、ラッチ330
からの指標信号iminがマルチプレクサ410のA入力
に印加される。モードA動作において、制御器160か
らの信号ABMODEは真であり、マルチプレクサ41
0のA入力が選択される。これによって、指標信号i
minはマルチプレクサ410のQ端子に出力され、RO
M420のアドレス端子Aに印加される。
予め決定された音声等価クラス信号φはROM420
に蓄えられている。ROM420は例えばテキサスイン
ストルメント(Texas Instruments)社で作っている7
4S287型回路で実現できる。音声等価クラス信号の
各各は、音声認識の妨げとなるような予め定めた類似性
を持つ基準語のグループを表わしている。本実施例の1
2ケの基準語は、一例として表2に示すように、混同す
る恐れのある3グループの語に分割されており、それぞ
れ音声等価クラス信号φ、φ及びφによって指定
される。
指標信号iminがROM420のアドレス入力Aに印加
されると、表2にあるようなこれに対応する最小音声等
価クラス信号φminがROM420のQ端子に出力され
る。よって、信号iminが9である例においては、信号
φminはφに等しい。次に制御器160から信号LD
CCLが印加され、ラッチ440はROM420からの
信号φmin=φを取り込む。このことは第6図の動作
ブロック626に示されている。
最小音声クラス信号φminがラッチ440に蓄えられて
しまうと、語認識器100のモードA動作が終了する。
動作ブロック628に示されているように、制御器16
0からの信号ABMODEが偽に変り、Bモードの動作
が選択される。モードBでは、音声等価クラス信号φ
minによって表わされる基準語に対する荷重距離信号 が作られる。最小音声等価クラスの信号φminがφ
等しい例では、i=8、9、10及び11に対する荷重
語距離信号 が作られる。表2に示したように、信号i=8、9、1
0及び11は音声的に似た語F、S、X及び6に対応し
ている。荷重語距離信号の最小値 が決定される。信号 に対応する指標信号 は、入力語を識別する最良の基準語候補を指す指標とし
て、応用装置106へ出力される。
モードB動作において、語カウンタは制御器160から
の信号SETWCによって初期値ゼロにセットされる。
制御器160からの信号SETLPNに応動して、第3
図のラッチ320はその最大数にセットされる。この初
期化動作は第6図の動作ブロック630に示されてい
る。次にカウンタ140からの信号iが第4図のマルチ
プレクサ410のB入力に印加される。制御器160か
らの信号ABMODEは、モードBでは偽であるため、
マルチプレクサ410のB入力が選択される。よって信
号iはROM420のアドレス入力Aに印加される。R
OM420は信号iに応動して表2にあるような対応す
る音声等価クラス信号φを出力する。この信号φ
比較器430のA入力に印加される。ラッチ440から
の音声等価クラス信号φminは比較器430のB入力に
印加されている。このことは、判定ブロック632で示
されている。信号φとφminが等しくないと、比較器
430からの信号EQUALは偽となる。制御器160
からの信号INCWCが語カウンタ140に印加されて
信号iが増分される。判定ブロック632及び648で
示したように、各信号i=0、1、…、11に対して対
応する音声等価クラス信号φが最小音声等価クラス信
号φminと比較される。ラッチ440内の最小音声等価
クラス信号φminがφに等しい例では、信号EQUA
Lは、音声的に似た語F、S、X及び6に対応する信号
i=8、9、10及び11においてのみ真となる。
制御器160からの信号ABMODEが第5図のナンド
ゲート540の入力に印加されている。モードBでは信
号ABMODEは偽であるため、ナンドゲート540は
真信号を出力する。ナンドゲート540からの真信号は
RAM510のR/端子に印加される。これによって
RAM510は、モードBにおいては、フレーム距離信
号d(k)を出力する。
比較器430からの真の信号EQUALに応動し、制御
器160からの信号SETFCが印加されてフレームカ
ウンタ150をリセットする。制御器160からの信号
CLRWDGに応動して語距離発生器200内のラッチ
230もリセットされる。このリセット動作は第6図の
動作ブロック634に示されている。カウンタ140及
び150からの指標信号i及びkはRAM510のアド
レス端子Aに印加される。この信号i及びkに応動し、
RAM510内の対応するメモリ位置からのフレーム距
離信号d(k)が出力される。
カウンタ140及び150からの指標信号i及びkはR
OM530のアドレス端子にも印加されている。よっ
て、i及びkに応動して、予め定めた荷重標準 がROM530のメモリ位置から出力される。
荷重標準 は、同じ音声等価クラスに属する語の間の、フレーム毎
の動的時間ワープ距離の期待値を表わしている。一例と
して、入力特徴標準が語Iを表わし、基準特徴標準が語
Yを表わしている場合について考える。語Yは、語Iの
先頭に音素/W/を付加したものであるため、IとYと
の間の動的時間ワープ距離は、最初のフレームにおいて
のみ大きくなることが期待される。この例からわかるよ
うに、期待されるフレーム毎の動的時間ワープ距離は、
考えている語の対によって変化する。
荷重パターン信号 は(語認識器100のモードA又はB動作の前に)、基
準語の各々を繰返して発音することによって作られる。
繰返して発音された同じ基準語iに対する特徴パターン
が動的時間ワープ信号処理によって比較されて、フレー
ム距離信号d(k)が作られる。繰返しが結合され
て、平均フレーム距離信号〈d(k)〉が作られ
る。平均フレーム距離信号〈d(k)〉に対応し
て、分散信号▲σ2 i▼、(k)が作られる。
基準語iとjとが同じ音声クラスに属する時、基準語i
と別の基準語jとの繰返しに対する特徴標準が動的時間
ワープ信号処理によって比較されて、フレーム距離信号
(k)が作られる。この繰返しが結合されて、平
均フレーム距離信号〈d(k)〉が作られる。平均
フレーム距離信号〈d(k)〉に対応して分散信号
▲σ2 j▼、(k)が作られる。
平均フレーム距離信号〈d(k)〉及び〈d
(k)〉、及び分散信号▲σ2 i▼、(k)及び▲σ2 j▼、
(k)が次の式(1)に従って結合されて、対荷重信号
(k)が作られる。
対荷重信号W(k)は次の式(2)によって結合され
て、荷重パターン信号 が作られ、これがROM530に蓄えられる。
式(1)及び(2)に関して述べた信号の前処理は、荷重標準
信号 を作るための1つの方法である。本発明の精神と範囲と
を逸脱することなく、期待距離を表わす荷重標準信号を
得るための他の信号処理方式も存在することはいうまで
もない。
第5図において、RAM510からの距離信号d(k)
は乗算器520のA入力に印加される。ROM530か
らの荷重標準信号 は乗算器520のB入力に印加される。乗算器520
は、例えば、TRW社で作られているMPY16HJ型
回路で実現できる。乗算器520は信号d(k)と との積をとり、荷重フレーム距離信号 を出力する。
第2図の語距離発生器200において、制御器160か
らの信号ABMODEは、マルチプレクサ210の選択
入力Sに印加されている。モードBでは信号ABMOD
Eは偽であるため、マルチプレクサ210のB入力が選
ばれる。動作ブロック634に関連して述べたように、
ラッチ230は制御器160からの信号CLRWDGに
よってゼロにリセットされている。次に制御器160か
らの信号LDWDGがラッチ230のL端子に印加され
る。マルチプレクサ210からの荷重フレーム距離信号 はこれによって加算器220とラッチ230で加算され
(モードAにおいて信号d(k)について述べたのと同
じ方法による)、荷重語距離信号 が得られる。この動作は動作ブロック638及び640
及び判定ブロック642に示されている。
最小音声等価クラス信号φminがφに等しい例におい
ては、比較器430からの信号EQUALは語指標信号
i=8、9、10及び11においてのみ真となる。従っ
て、荷重フレーム距離信号 が、それぞれフレーム指標信号k=0、1、…、39に
ついて、加算器220及びラッチ230で加算され、荷
重語距離信号 となる。
第3図の最小語距離発生器300において、語距離発生
器200からの荷重語距離信号 は、比較器310のA入力及びラッチ320のD入力に
印加される。動作ブロック630に関して述べたよう
に、ラッチ320は最初制御器160からの信号SET
LPNに応動してその最大数にセットされている。制御
器160からの信号ENWDSに応動して、アンドゲー
ト340の出力が印加されて、ラッチ320及び330
が信号を取り込む。これによって最大荷重語距離信号 がラッチ320のQ出力に得られる(モードAにおいて
信号Dに関して述べたのと同じ方法による)。これは
動作ブロック644及び646に示されている。信号 に対応する指標信号 は、ラッチ330のQ端子に出力される。指標信号i
minは応用装置106に印加され、入力を識別するのに
最も良い候補となる基準語を指定する。次に、動作ブロ
ック650に示されているように、制御器160からの
信号DONEが応用装置106に印加される。
最小音声等価クラス信号φminがφに等しい例におい
て、表3は一例として、荷重語距離信号 の可能な値を示している。
荷重語距離信号 は11.6に等しく、表中で最小値をとっている。従って、
最小語距離発生器300において、最小荷重語距離信号 として信号 が選ばれる。第3図のラッチ330内の対応する指標信
号iが最小指標信号 として出力される。
表2から明らかなように、モードBで得られた信号 は、基準語“X”に対応している。ところが、モードA
で得られた信号imin=9は基準語“S”に対応してい
る。モードBで得られる信号 は、入力を識別するための最も可能性の高い候補を示し
ているものとみなすことができる。なぜなら、この信号
は、音声的に類似した語の間のフレーム毎の距離を表わ
す荷重標準信号を用いて得られているためである。
本発明について望ましい実施例を用いて説明したが、当
業者にとっては、本発明の精神と範囲を逸脱することな
く多くの修正や変更が可能であることはいうまでもな
い。たとえば、ある応用では、入力の識別の候補とし
て、順位をつけた複数のものを提供するのが望ましいこ
とがある。モードA動作において、語距離信号Dは、
その最小値から最大値へと順位をつけることができる。
同様にモードBにおいても、すべての音声等価クラスφ
について荷重語距離Dに、その最小値から最大値へ
順位をつけることができる。このように両方のモードで
順位つげを行うことによって、基準語候補にも順位を与
えることができる。
以上を要約すると次のようになる。
1.入力語を一群の基準語の1つとして認識するための装
置において、 該基準語を表わす複数個の基準語特徴標準を蓄える手段
と、 該入力語に応動して入力語特徴標準を発生する手段と、 該基準語特徴標準と該入力語特徴標準とに応動して該基
準語の1つとして該入力語を識別する手段とが含まれ、 さらに該入力語を識別する該手段(100)が、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の語距離信号を発生する手段(105、200)と、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の荷重語距離信号を発生する手段(105、200、5
00)と、 該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択する手段(300、4
00)とを含んでいる。
2.上記第1項の装置において、 該基準語特徴標準と該入力語特徴標準とが複数個のフレ
ームから成り、 該一群の語距離信号を発生する該手段が、該基準語特徴
標準と該入力語特徴標準とに応動して該基準語特徴標準
と該入力語特徴標準とのフレーム間の類似性を表わす一
群のフレーム距離信号を発生する手段と、 該フレーム距離信号を結合して該語距離信号を発生する
手段とを含んでいる。
3.上記第2項の装置において、 特徴標準が蓄えられている該基準語が等価クラスの予め
定めた群に属し、該クラスの各各は予め定めた類似の程
度内にある基準語を表わしており、 該一群の荷重語距離信号を発生する手段が、 同一の等価クラスに属する基準語の基準語特徴標準のフ
レーム間の期待される類似性を表わす複数個の荷重標準
を蓄える手段と、 該フレーム距離信号と該荷重標準とに応動して荷重フレ
ーム距離信号を発生する手段と、 該荷重フレーム距離信号を結合して該荷重語距離信号を
発生する手段とを含んでいる。
4.上記第3項の装置において、 該入力語に最も良く対応する基準語を選択する該手段
が、 該語距離信号に応動して、該入力語に最も良く対応する
語距離信号を表わす基準語の等価クラスを選択する手段
と、 該荷重語距離信号に応動して、該入力語に最も良く対応
する荷重語距離信号を表わす選択された等価クラス内の
基準語を識別する手段とを含んでおり、 これによって該識別された基準語が該入力語を認識する
候補となる。
5.上記第1、2又は3項の装置において、 該入力語特徴標準及び該基準語特徴標準は話された語の
音声特性を表わしている。
6.上記第3又は4項の装置において、該等価クラスは音
声的に類似した基準語の群を表わしており、 該フレームは時間の離散的周期を表わしている。
7.上記第6項の装置において、該基準語特徴標準及び該
入力語特徴標準の各々は同数の時間フレームから成る。
8.1つの入力語を一群の基準語の1つとして認識する方
法において、 該基準語を表わす基準語特徴標準を複数個蓄えるステッ
プと、 該入力語に応動して入力語特徴標準を発生するステップ
と、 該基準語特徴標準と該入力語特徴標準とに応動して該入
力語を該基準語の1つとして識別するステップとが含ま
れ、 該入力語を識別するステップは、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の語距離信号を発生するステップと、 該基準語特徴標準と該入力語特徴標準とに応動して一群
の荷重語距離信号を発生するステップと、 該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択するステップとを含ん
でいる。
9.上記第8項に従って一群の基準語の1つとして入力語
を認識する方法において、 該基準語特徴標準及び該入力語特徴標準の各々が複数の
フレームを持ち、 該一群の語距離信号を発生する該ステップが、 該基準語特徴標準と該入力語特徴標準とに応動して該基
準語特徴標準と該入力語特徴標準とのフレーム間の類似
性を表わす一群のフレーム距離信号を発生するステップ
と、 該フレーム距離信号を結合して該語距離信号を発生する
ステップとを含んでいる。
10.上記第9項に従って一群の基準語の1つとして入力
語を認識する方法において、 特徴標準が蓄えられる該基準語が等価クラスの予め定め
た群に属し、該クラスの各々は予め定めた類似の程度内
にある基準語を表わしており、 一群の荷重語距離信号を発生する該ステップが、 同一の等価クラスに属する基準語の基準語特徴標準のフ
レーム間の期待される類似性を表わす複数個の画集標準
を蓄えるステップと、 該フレーム距離信号と該荷重標準とに応動して荷重フレ
ーム距離信号を発生するステップと、 該荷重フレーム距離信号を結合して該荷重距離信号を発
生するステップとを含んでいる。
11.上記第10項に従い一群の基準語の1つとして入力
語を認識する方法において、 該入力語に最も良く対応する基準語を選択する該ステッ
プが、 該語距離信号に応動して、該入力語に最も良く対応する
語距離信号を表わす基準語の等価クラスを選択するステ
ップと、 該荷重語距離信号に応動して、該入力語に最も良く対応
する荷重語距離信号を表わす選択された等価クラス内の
基準語を識別するステップとを含んでおり、 これによって該識別された基準語が該入力語を認識する
候補となる。
12.上記第8、9又は10項に従って一群の基準語の1
つとして入力語を認識する方法において、 該入力語特徴標準及び該基準語特徴標準は話された語の
音声特性を表わしている。
13.上記第10又は11項に従って一群の基準語の1つ
として入力語を認識する方法において、 該等価クラスは音声的に類似した基準語の群を表わして
おり、 該フレームは時間の離散的周期を表わしている。
14.上記第13項に従って一群の基準語の1つとして入
力語を認識する方法において、該基準語特徴標準及び該
入力語特徴標準の各々は同数の時間フレームから成る。
15.話された入力語を一群の基準語の1つとして認識す
る装置において、 該基準語の音声的特性を表わす複数個の基準語特徴標準
を蓄える手段と、該入力語に応動し該入力語の音声的特
性を表わす入力語特性標準を発生する手段と、該基準語
特徴標準及び該入力語特徴標準に応動して該入力語を該
基準語の1つとして識別する手段とが含まれ、該入力語
識別手段が、該基準語特徴標準と該入力語特徴標準とに
応動して一群の語距離信号を発生する手段と、該基準語
特徴標準と該入力語特徴標準とに応動して一群の荷重語
距離信号を発生する手段と、該語距離信号と該荷重語距
離信号とに応動して該入力語に最も良く対応する基準語
を選択する手段とを含んでいる。
16.上記第15項の装置において、該基準語特徴標準と
該入力語特徴標準とはともに複数個のフレームを持ち、
特徴標準を蓄えている該基準語が等価クラスの予め定め
た群に属し、該クラスの各々は予め定めた類似の程度内
にある基準語を表わしており、該一群の語距離信号を発
生する該手段が、該基準語特徴標準と該入力語特徴標準
とに応動して該基準語特徴標準と該入力語特徴標準との
フレーム間の類似性を表わす一群のフレーム距離信号を
発生する手段と、該フレーム距離信号を加算して該語距
離信号を発生する手段とを含んでおり、 該一群の荷重語距離信号を発生する該手段が、同一の等
価クラスに属する基準語の基準語特徴標準のフレーム間
の期待される類似性を表わす複数個の荷重標準を蓄える
手段と、該フレーム距離信号と該荷重標準とに応動して
荷重フレーム距離信号を発生する手段と、該荷重フレー
ム距離信号を加算して該荷重語距離信号を発生する手段
とを含んでいる。
17.上記第16項の装置において、該入力語に最も良く
対応する基準語を選択する手段が、該語距離信号に応動
して最小の語距離信号を表わす基準語の等価クラスを選
択する手段と、該荷重語距離信号に応動して最小の荷重
語距離信号を表わす選択された等価クラス内の基準語を
識別する手段とを含んでおり、これによって該識別され
た基準語が該入力語を識別する候補となる。
18.話された入力語を基準語の1つとして認識する方法
において、 該基準語の音声的特性を表わす複数個の基準語特徴標準
を蓄えるステップと、該入力語に応動し該入力語の音声
的特性を表わす入力語特徴標準を発生するステップと、
該基準語特徴標準及び該入力語特徴標準に応動して該入
力語を該基準語の1つとして識別するステップとが含ま
れ、該入力語識別ステップが、該基準語特徴標準と該入
力語特徴標準とに応動して一群の語距離信号を発生する
ステップと、該基準語特徴標準と該入力語特徴標準とに
応動して一群の荷重語距離信号を発生するステップと、
該語距離信号と該荷重語距離信号とに応動して該入力語
に最も良く対応する基準語を選択するステップとを含ん
でいる。
19.上記第18項に従い話された入力語を基準語の1つ
として認識する方法において、該基準語特徴標準と該入
力語特徴標準とはともに複数個のフレームを持ち、特徴
標準を蓄えている該基準語が等価クラスの予め定めた群
に属し、該クラスの各々は予め定めた類似の程度内にあ
る基準語を表わしており、 該一群の語距離信号を発生する該ステップが、該基準語
特徴標準と該入力語特徴標準とに応動して該基準語特徴
標準と該入力語特徴標準とのフレーム間の類似性を表わ
す一群のフレーム距離信号を発生するステップと、該フ
レーム距離信号を加算して該語距離信号を発生するステ
ップとを含んでおり、 該一群の荷重語距離信号を発生する該ステップが、同一
の等価クラスに属する基準語の基準特徴標準のフレーム
間の期待される類似性を表わす複数個の荷重標準を蓄え
るステップと、該フレーム距離信号と該荷重標準とに応
動して荷重フレーム距離信号を発生するステップと、該
荷重フレーム距離信号を加算して該荷重距離信号を発生
するステップとを含んでいる。
20.上記第19項に従い、話された入力語を基準語の1
つとして認識する方法において、該入力語に最も良く対
応する基準語を選択するステップが、該語距離信号に応
動して最小の語距離信号を表わす基準語の等価クラスを
選択するステップと、 該荷重語距離信号に応動して最小の荷重語距離信号を表
わす選択された等価クラス内の基準語を識別するステッ
プとを含んでおり、これによって該識別された基準語が
該入力語を識別する候補となる。
〔主要部分の符号の説明〕
入力語を識別する手段……第1図の語認識器100 語距離信号を発生する手段……第1図のフレーム距離発
生器105及び語距離発生器200 荷重語距離信号を発生する手段……第1図のフレーム距
離発生器105、語距離発生器200、及び荷重フレー
ム距離発生器500 基準語を選択する手段……第1図の最小語距離発生器3
00及びクラス比較器400 フレーム距離信号を発生する手段……第1図のフレーム
距離発生器105 フレーム距離信号を結合して語距離信号を発生する手段
……第1図、第2図の語距離発生器200 荷重標準を蓄える手段……第5図の荷重標準ROM53
0 荷重フレーム距離信号を発生する手段……第1図、第5
図の荷重フレーム距離発生器500 荷重語距離信号を発生する手段……第1図、第2図の語
距離発生器200 等価クラスを選択する手段……第1図、第4図のクラス
比較論理400 基準語を識別する手段……第1図、第3図の最小語距離
選択器300
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ロ−レンス・リチヤ−ド・ラビナ− アメリカ合衆国07922ニユ−ジヤ−シイ・ バ−クレイ・ハイツ・シエアブルツク・ド ライヴ58 (72)発明者 ジエイ・ゴ−ドン・ウイルポン アメリカ合衆国07060ニユ−ジヤ−シイ・ ウオ−レン・ラウンド・トツプ・ロ−ド75 (56)参考文献 特開 昭57−13494(JP,A)

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】入力語を一群の基準語の一つとして認識す
    るための装置であって、 該基準語を表す複数個の基準語特徴パターンを蓄える手
    段と、 該入力語に応動して入力語特徴パターンを発生する手段
    と、 該基準語特徴パターン及び該入力語特徴パターンに応動
    して該基準語の一つとして該入力語を識別する手段とを
    含む装置において、 該一群の基準語は、予め定めた等価クラスであって、各
    クラスが予め定められた音響的類似度を有する基準語か
    らなるものであるような等価クラスに分類され、 該基準語特徴パターン及び該入力語特徴パターンの各々
    が複数のフレームを有しており、そして該入力語識別手
    段(例えば、100)が、 該基準語特徴パターンと該入力語特徴パターンに応動し
    て、一群の語距離信号であって、その各々が該基準語特
    徴パターンのフレームと該入力語特徴パターンのフレー
    ムの間における類似性を表すフレーム距離信号を結合し
    たものであるような一群の語距離信号を発生する手段
    (例えば、105、200)と、 該入力語特徴パターン、該入力語に最もよく対応するパ
    ターンのクラスにおいて基準語特徴パターンを他の特徴
    パターンから区別する基準語特徴パターンの1又は2以
    上のフレームを強調する荷重パターン及び該クラスの基
    準語特徴パターンに応動して一群の荷重された語距離信
    号であって該クラスの該基準語特徴パターンと該入力語
    特徴パターンとの間の類似性を表す複数のフレーム距離
    信号と複数の該荷重パターンとを結合したものであるよ
    うな一群の荷重された語距離信号を発生する手段(例え
    ば、105、200、500)と、 該語距離信号及び該荷重された語距離信号に応動して、
    それらの最小値を検出し、検出された最小値に応動し
    て、該入力語に最もよく対応する基準語を選択する手段
    (例えば、300、400)とを含むことを特徴とする
    入力語認識装置。
  2. 【請求項2】特許請求の範囲第1項記載の入力語認識装
    置において、 該入力語に最もよく対応する該基準語を選択する該手段
    が、 該語距離信号に応動し、該入力語に最もよく対応する該
    語距離信号を表す該基準語の該等価クラスを選択する手
    段と、 該荷重された語距離信号に応動し、選択された該等価ク
    ラス内において該入力語に最もよく対応する荷重された
    語距離信号を表す該基準語を識別する手段とを含んでい
    ることと、 これによって該識別された基準語を該入力語の認識の候
    補とすることとを特徴とする入力語認識装置。
  3. 【請求項3】特許請求の範囲第1項、又は第2項記載の
    入力語認識装置において、 該入力語特徴パターンと該基準語特徴パターンとが話さ
    れた語の音響的特性を表していることを特徴とする入力
    語認識装置。
  4. 【請求項4】特許請求の範囲第1項記載の入力語認識装
    置において、 該等価クラスが音響的に類似した基準語を表しているこ
    とと、 該フレームが時間の離散的な周期を表していることとを
    特徴とする入力語認識装置。
  5. 【請求項5】特許請求の範囲第1項、第2項、第3項、
    又は第4項記載の入力語認識装置において、 該基準語特徴パターン及び該入力語特徴パターンの各々
    が同じ数の時間フレームを持っていることを特徴とする
    入力語認識装置。
JP57048183A 1981-03-27 1982-03-27 入力語認識装置 Expired - Lifetime JPH0634185B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/248,547 US4400828A (en) 1981-03-27 1981-03-27 Word recognizer
US248547 1981-03-27

Publications (2)

Publication Number Publication Date
JPS57176100A JPS57176100A (en) 1982-10-29
JPH0634185B2 true JPH0634185B2 (ja) 1994-05-02

Family

ID=22939608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57048183A Expired - Lifetime JPH0634185B2 (ja) 1981-03-27 1982-03-27 入力語認識装置

Country Status (2)

Country Link
US (1) US4400828A (ja)
JP (1) JPH0634185B2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU7529981A (en) * 1980-09-19 1982-03-25 Hitachi Limited Language analysis by pattern recognition
JPS57137976A (en) * 1981-02-18 1982-08-25 Nec Corp Zip code discriminating device
US4761815A (en) * 1981-05-01 1988-08-02 Figgie International, Inc. Speech recognition system based on word state duration and/or weight
US4520500A (en) * 1981-05-07 1985-05-28 Oki Electric Industry Co., Ltd. Speech recognition system
US4608708A (en) * 1981-12-24 1986-08-26 Nippon Electric Co., Ltd. Pattern matching system
US4989248A (en) * 1983-01-28 1991-01-29 Texas Instruments Incorporated Speaker-dependent connected speech word recognition method
US4674066A (en) * 1983-02-18 1987-06-16 Houghton Mifflin Company Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
US4580241A (en) * 1983-02-18 1986-04-01 Houghton Mifflin Company Graphic word spelling correction using automated dictionary comparisons with phonetic skeletons
US4771401A (en) * 1983-02-18 1988-09-13 Houghton Mifflin Company Apparatus and method for linguistic expression processing
US5131043A (en) * 1983-09-05 1992-07-14 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for speech recognition wherein decisions are made based on phonemes
US4991216A (en) * 1983-09-22 1991-02-05 Matsushita Electric Industrial Co., Ltd. Method for speech recognition
US4783758A (en) * 1985-02-05 1988-11-08 Houghton Mifflin Company Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words
GB8517918D0 (en) * 1985-07-16 1985-08-21 British Telecomm Recognition system
US5023911A (en) * 1986-01-10 1991-06-11 Motorola, Inc. Word spotting in a speech recognition system without predetermined endpoint detection
US4829472A (en) * 1986-10-20 1989-05-09 Microlytics, Inc. Spelling check module
JPS63158596A (ja) * 1986-12-23 1988-07-01 株式会社東芝 音韻類似度計算装置
JPH0638195B2 (ja) * 1987-01-30 1994-05-18 日本電気株式会社 パタンマッチング装置
US5027408A (en) * 1987-04-09 1991-06-25 Kroeker John P Speech-recognition circuitry employing phoneme estimation
DE3819178A1 (de) * 1987-06-04 1988-12-22 Ricoh Kk Spracherkennungsverfahren und -einrichtung
US4918731A (en) * 1987-07-17 1990-04-17 Ricoh Company, Ltd. Speech recognition method and apparatus
US4980917A (en) * 1987-11-18 1990-12-25 Emerson & Stern Associates, Inc. Method and apparatus for determining articulatory parameters from speech data
US4977604A (en) * 1988-02-17 1990-12-11 Unisys Corporation Method and apparatus for processing sampled data signals by utilizing preconvolved quantized vectors
JPH0821065B2 (ja) * 1989-03-13 1996-03-04 シャープ株式会社 文字認識装置
US5168524A (en) * 1989-08-17 1992-12-01 Eliza Corporation Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation
WO1992006469A1 (en) * 1990-10-02 1992-04-16 The Dsp Group, Inc. Boundary relaxation for speech pattern recognition
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
US5903864A (en) * 1995-08-30 1999-05-11 Dragon Systems Speech recognition
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
US5825855A (en) * 1997-01-30 1998-10-20 Toshiba America Information Systems, Inc. Method of recognizing pre-recorded announcements
US6754625B2 (en) * 2000-12-26 2004-06-22 International Business Machines Corporation Augmentation of alternate word lists by acoustic confusability criterion
FI121583B (fi) * 2002-07-05 2011-01-14 Syslore Oy Symbolijonon etsintä
US9158983B2 (en) 2010-07-08 2015-10-13 E-Image Data Corporation Microform word search method and apparatus
US8645136B2 (en) 2010-07-20 2014-02-04 Intellisist, Inc. System and method for efficiently reducing transcription error using hybrid voice transcription

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5136141B2 (ja) * 1971-11-10 1976-10-06
US4058795A (en) * 1972-10-03 1977-11-15 International Business Machines Corporation Method and apparatus for context-aided recognition
JPS5517988B2 (ja) * 1974-06-05 1980-05-15
US4200861A (en) * 1978-09-01 1980-04-29 View Engineering, Inc. Pattern recognition apparatus and method
US4288782A (en) * 1979-08-24 1981-09-08 Compression Labs, Inc. High speed character matcher and method
JPS5713494A (en) * 1980-06-26 1982-01-23 Fujitsu Ltd Voice recognition processing system
US4355302A (en) * 1980-09-12 1982-10-19 Bell Telephone Laboratories, Incorporated Spelled word recognizer

Also Published As

Publication number Publication date
US4400828A (en) 1983-08-23
JPS57176100A (en) 1982-10-29

Similar Documents

Publication Publication Date Title
JPH0634185B2 (ja) 入力語認識装置
US6208971B1 (en) Method and apparatus for command recognition using data-driven semantic inference
US7421387B2 (en) Dynamic N-best algorithm to reduce recognition errors
EP0380297B1 (en) Method and apparatus for speech recognition
US6513005B1 (en) Method for correcting error characters in results of speech recognition and speech recognition system using the same
US6487532B1 (en) Apparatus and method for distinguishing similar-sounding utterances speech recognition
JP3168779B2 (ja) 音声認識装置及び方法
EP0109190A1 (en) Monosyllable recognition apparatus
CN107180084A (zh) 词库更新方法及装置
CN109036471B (zh) 语音端点检测方法及设备
US10395109B2 (en) Recognition apparatus, recognition method, and computer program product
CN110021293A (zh) 语音识别方法及装置、可读存储介质
JPH0713594A (ja) 音声合成において音声の質を評価するための方法
US5559925A (en) Determining the useability of input signals in a data recognition system
CN111554276A (zh) 语音识别方法、装置、设备及计算机可读存储介质
US20050187767A1 (en) Dynamic N-best algorithm to reduce speech recognition errors
CN111554275A (zh) 语音识别方法、装置、设备及计算机可读存储介质
US7181062B2 (en) Modular classification architecture for a pattern recognition application
JPH10240930A (ja) パターン認識方法およびパターン認識装置
CN114530145B (zh) 语音识别结果纠错方法及装置、计算机可读存储介质
CN112465805A (zh) 用于钢筋冲压折弯的质量检测的神经网络的训练方法
JP3444108B2 (ja) 音声認識装置
JPH0823758B2 (ja) 話者適応形音声認識装置
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JP2966002B2 (ja) 音声認識装置