JPH01156876A - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JPH01156876A
JPH01156876A JP62315874A JP31587487A JPH01156876A JP H01156876 A JPH01156876 A JP H01156876A JP 62315874 A JP62315874 A JP 62315874A JP 31587487 A JP31587487 A JP 31587487A JP H01156876 A JPH01156876 A JP H01156876A
Authority
JP
Japan
Prior art keywords
syllable
similarity
word
syllables
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62315874A
Other languages
English (en)
Inventor
Hiroshi Matsuura
博 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62315874A priority Critical patent/JPH01156876A/ja
Publication of JPH01156876A publication Critical patent/JPH01156876A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は入力単語音声等の入力パターンを高精度に認識
することのできるパターン認識装置に関する。
(従来の技術) n音節からなる単語、またはn文字からなる単語等の入
力パターンを認識するパターン認識装置(単語認識装置
)として、例えば特開昭59−197974号公報に開
示されるものが知られている。
この単語認識装置は、n音節からなる入力音声単語の各
音tin A 1(t−t、2.〜.n)をそれぞれ認
識処理して各音節毎にその音節AIと認識対象音節B 
k(k−1,2,〜、m)との類似度Sk、1  (ま
たは相違度)を求め、この類似度Sk、iを上記認識対
象音節Bkとその音節位置lとによって定まる、類似度
メモリ上の特定の格納位置にそれぞれ格納する。
そして単語辞書メモリに登録されている辞書単語の各音
節コードCI(1−1,2,〜、n)と、その音節コー
ドCIの上記辞書単語内における音節位置Iとによって
定まる前記類似度メモリ上の位置に格納されている類似
度を当該辞書単語の各音節についてそれぞれ求める。し
かる後、上記類似度メモリから求められた類似度に基い
て前記入力単語音節Aiと辞書単語音節Ctとの一致度
を計算し、−致度の高い辞書単語を前記入力音声単語に
対する認識候補単語として求めるものである。
このような入力単語音声の認識法によれば、入力単語音
声を簡易に、且つ高速に、しかも適確に入力音声単語を
認識することが可能となる。
ところが発声入力される単語音声には長音化があり、例
えば往々にして「経済」なる単語が「ケイザイ」ではな
く「ケエザイ」として発声されたり、また「東京」なる
単語が「トウキヨウ」ではなく「トウキジオ」「トオキ
ョオ」「トオキョウ」として発声されることがある。こ
の為、単語を構成する音節を確実に同定することは甚だ
困難である。特に自然発声された音声にあっては上述し
た問題が生じ易い。
具体的には、長母音や撥音、また母音連続によって成る
音節の存在が分らなかったり(音節の脱落)、本来存在
しないはずの音節が加る(音節の付加)ことがある。こ
のような事態が生じると音節の位置自体にずれが生じ、
誤認識の原因となる。
尚、ここでは音声パターンの単語認識における不具合に
ついて述べたが、入力音声が文章を認識する場合にも同
様な不具合が生じ、また文字列パターンからその単語を
認識する場合にも同様な不具合を生じることがある。
(発明が解決しようとする問題点) このように従来のパターン認識装置にあっては、゛所定
のパターン構成単位毎に入力パターンを認識する際に上
記パターン構成単位の付加や脱落等が生じることがあり
、パターン構成単位の位置ずれが生じた状態で入力パタ
ーンに対する認識処理が行われて入力パターンに対する
誤認識が生じると云う問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、所定のパターン構成単位である
文字や音節等の不本意な付加や脱落が生じた場合であっ
ても、その人カバターンを高精度に認識することのでき
る実用性の高いパターン認識装置を提供することにある
[発明の構成] (問題点を解決するための手段) 本発明は、単語または文章をなす文字列パターンや音声
パターン等の入力パターンを所定のパターン構成単位(
例えば文字や音素、音節)についてそれぞれ認識し、こ
の認識によって求められる上記所定のパターン構成単位
と認識対象単位との類似度を類似度メモリ上の上記認識
対象単位と前記入力パターンにおける上記パターン構成
単位の位置とによって定まる位置にそれぞれ格納し、認
識辞書メモリに登録されている辞書項目の各認識対象単
位とその単位の位置とによって定められる前記類似度メ
モリ上の位置に格納されている類似度から前記人力・パ
ターンを認識するパターン認識装置において、 前記認識辞書メモリの辞書項目として、その認識対象単
位に対する少なくとも付加、脱落、または誤りを想定し
た項目を設定してなることを特徴とするものである。
(作用) 本発明によれば、入力パターンに対する所定のパターン
構成単位での認識処理過程において、上記所定のパター
ン構成単位の不本意な付加や脱落が生じても、これを配
慮した辞書項目が設定されているので、上記付加や脱落
に起因するパターン構成単位の位置ずれが生じても、こ
の位置ずれに影響されることなく前記入力パターンを制
度良く認識することが可能となる。
具体的には音声パターンの音節毎に類似度を求め、この
類似度の列を評価して上記音声パターンを認識する場合
、音節の脱落や不本意な付加が生じて音節位置にずれが
生じた場合であっても前記音声パターンを正しく認識す
ることが可能となる。
(実施例) 以下、図面を参照して本発明の一実施例につき説明する
第1図は入力音声単語を認識する実施例装置の要部概略
構成図であり、■はn音節からなる入力単語音声を音節
単位で認識する音節認識部である。
この音節認識部lは、入力単語音声の各音節につき音節
辞書と照合し、その類似度を計算する等して、例えば第
3位までの音節候補を求めるものである。具体的にはr
東京」なる単語が発声入力された場合、その各音節に対
して第3図に示すように第1位から第3位までの音節候
補と、その音節候補を得た類似度をそれぞれ求めるもの
となっている。
しかしてこの音節認識部1にて求められた音節候補の類
似度は、その音節候補と人力単語音声における音節位置
に従って類似度メモリ2にそれぞれ格納され、単語認識
処理に供される。
即ち、類似度メモリ2は、例えば第4図に示すように音
節基と音節位置に応じて類似度を格納するメモリ構造を
有している。そして前記入力単語音声から求められた各
音節の音節候補の類似度を、その音節候補に該当する音
節基の位置であって、且つ入力単語音声における音節位
置によって指定される位置にそれぞれ格納するものとな
っている。
具体的には、入力単語音声「東京」に対して第3図に示
すようにその音節候補がそれぞれ求められた場合、それ
らの音節候補についてそれぞれ求められた類似度を第4
図に例示するように、先ずその第1音節については音節
基「あ」の位置に類似度(30)、音節基「と」の位置
に類似度(80)、そして音節基「ぼ」の位置に類似度
(40)をそれぞれ格納している。
同様にして第2音節については音節基「ふ」の位置に類
似度(50)、音節基「<」の位置に類似度(70)、
音節基「ふ」の位置に類似度(60)をそれぞれ格納し
、更に第3音節については音節基「きょ」の位置に類似
度(70)、音節基「びょ」の位置に類似度(50)、
音節基「ぴょ」の位置に類似度(60)をそれぞれ格納
している。
そして第4音節については音節基「う」の位置に類似度
(80)、音節基「<」の位置に類似度(50)、音節
基「ぶ」の位置に類似度(40)をそれぞれ格納してい
る。
尚、ここでは第4音節目までの音節候補の類似度を類似
度メモリ2に格納するようにしているが、同音節目まで
の類似度を格納するかは入力音声単語を構成する音節数
に応じて定めれば良いことは勿論のことである。また各
音節位置に対応した類似度の格納は、音節位置カウンタ
3の制御の下で行われる。
と°ころで単語辞書メモリ4は、認識対象とする単語の
音節系列を格納したものである。この認識対象単語の各
音節系列は、例えば音節コードのつながりとしてそれぞ
れ表現される。
しかしてアドレスカウンタ5は、上記単語辞書メモリ4
に格納された辞書単語の情報(音節コード列)を順に読
出し、前記類似度メモリ2に格納された入力単語音声の
各音節候補の類似度の検索に供するものである。即ち、
アドレスカウンタ5は、制御部7の制御を受け、人力単
語音声の音節数と同じ音節数からなる辞書単語を順に読
出している。そして前記音節位置カウンタ3による音節
位置に対する制御と協働して、辞書単語の各音節基とそ
の音節位置とによって特定される前記類似度メモリ2上
の位置に格納されている類似度をそれぞれ求め、これを
−成度計算部6に与えている。
即ち、第2図にその概念を示すように、単語辞書メモリ
4に登録されている辞書単語が音節コード[C1,C2
,CB ]で与えられる場合、類似度メモリ2の音節基
[CI ] 、および第第1音目として特定される位置
に格納されている類似度S k、1を求め、同様にして
音節基[C2]と第2音節目として特定される位置に格
納されている類似度Sk、2、音節基[C3]と第第3
音目として特定される位置に格納されている類似度S 
k、3をそれぞれ求めるものとなっている。
一成度計算部6は、このようにして単語辞書メモリ4か
ら順に読出される辞書単語の音節とその音節位置とに従
って類似度メモリ2から求められる類似度を加算し、そ
の辞書単語に対する一致度を求めている。
一般的にはn音節からなる単語について、そのi音節目
の音節コードに対する類似度を前記類似度メモリ2から
81として求め、各音節位置毎に求められた類似度を加
算してその一致度TSをとして求めている。制御部7は
、このようにして各辞書単語について求められた一致度
を相互に比較し、例えば−成度の高いX個の辞書単語を
前記入力単語音声に対する認識候補単語として求めるも
のとなっている。
尚、音節認識制御部8は前記音節認識部1により入力単
語音声の音節認識処理を制御すると共に、上記制御部7
の制御を受けて入力単語音声に対する認識処理の開始を
入力単語毎に制御するものとなっている。
かくしてこのように構成された本装置によれば、例えば
前述したように単語音声「東京」が入力され、この入力
単語音声の各音節に対する音節候補が第3図に示すよう
に求められ、類似度メモリ6に第4図に示す如き類似度
の情報が求められた場合、単語辞書メモリ4に登録され
ている認識対象単語に対して次のようにして一致度の情
報が求められる。
即ち、入力単語音声が4音節からなることから、単語辞
書メモリ4から4音節の辞書単語を順に読出し、その単
語の音節と音節位置とによって特定される類似度メモリ
2の位置を検索し、そこに格納されている類似度をそれ
ぞれ読出す。
例えば「東金;トウガネJなる辞書単語について類似度
メモリ2を検索し、第1音節目について類似度(80)
、第2音節目について類似度(50)、第3音節目につ
いて類似度(0)、第4音節目について類似度(0)を
それぞれ得る。この結果、入力音声単語の辞書単語に対
する一致度TSが(80+50+0+0−130 )と
して求められる。同様にして他の辞書単語に付いての一
致度をそれぞれ順に求める。
そして単語辞書メモリ4から「東京;トウキヨウ」なる
辞書単語が読出された場合には、第1音節目について類
似度(80)、第2音節目について類似度(50)、第
3音節目について類似度(70)、第4音節目について
類似度(80)をそれぞれ得る。
そしてこの場合には、入力音声単語の辞書単語に対する
一致度TSが(80+50+70+80−280 )が
求められる。そして各単語についてそれぞれ求められた
一致度の相互比較が行われ、上記辞書単語「東京;トウ
キヨウ」について求められた一致度が最も高いことが確
認されたとき、この辞書単語「東京jが前記入力単語音
声に対する認識候補として求められる。
これに対して第5図に示すようにその音節候補がそれぞ
れ求められた場合、それらの音節候補についてそれぞれ
求められた類似度を第6図に例示するように、先ずその
第1音節については音節名「あ」の位置に類似度(30
)、音節名「と」の位置に類似度(80)、そして音節
名「ぼ」の位置に類似度(40)をそれぞれ格納してい
る。
同様にして第2音節については音節名「きょ」の位置に
類似度(70)、音節名「びょ」の位置に類似度(50
)、音節名「びょ」の位置に類似度(60)をそれぞれ
格納し、更に第3音節については音節名「う」の位置に
類似度(80)、音節名「ぶ」の位置に類似度(40)
 、音節名「<」の位置に類似度(50)をそれぞれ格
納している。
そして第4音節については、ここでは音声が検出されな
いことから類似度の格納は行われない。
即ち、「とうきよう」なる4音節の単語音声を認工処理
した際、第2音節口の「う」を捕えることができなかっ
た為、第3音節目および第4音節目が1音節ずつ繰り上
がって認識され、上記単語音声は音節の位置ずれを生じ
た3音節の単語として処理される。この結果、このまま
では単語辞書メモリ4に登録されている4音節の辞書単
語「東京;トウキヨウ」との照合に失敗することから、
前記単語音声が正しく認識されないことになる。
ちなみに先頭の音節から3音節目までのマツチングをと
り、その一致度を求めるようにした場合であっても、2
音節目からの音節位置のずれによってその一致度が非常
に低く求められる。この結果、入力された単語音声が正
しく認識されなくなる。
しかして本装置が特徴とするところは、上述した音節の
脱落や、音節の不本意な付加等に対処するべく、前記単
語辞書メモリ4に上記音節の付加・脱落を想定した辞書
項目を追加登録しておくようにした点である。例えば前
述した単語音声「東京;トウキヨウ」の場合、第2音節
目および第4音節目の「つ」の直前の音節が長母音であ
ることから、これを自然発声した場合には前の音節との
間で明確に分離できない場合がある。つまり「つ」なる
音節がそれぞれ脱落し、その認識結果が「トキヨ」とな
る場合がある。
そこで、このような音節の脱落を配慮し、前記単語辞書
メモリ4には「トウキヨウ」なる単語の2音節目が脱落
した場合の「トキヨウ」、4音節目が脱落した場合の「
トウキヨ」、そして第2および第4音節目がそれぞれ脱
落した場合の「トキョ」を、前記「トウキヨウ」なる辞
書項目に追加登録しておく。
このようにして単語辞書メモリ4を構成しておくことで
、音節の脱落が生じた場合であっても、これを正しく認
識することが可能となる。
尚、このような音節の脱落を考慮して単語に対する一致
度を求める場合には、その音節数によって一致度が大き
く変化する。従って、求められた一致度をその音節数に
よって正規化したり、或いは音節数によって定められる
係数処理を施した後、その一致度の相互比較を行なうよ
うにすれば良い。
ところで音節の脱落が生じ易い単語音声としては、上述
した長母音の場合のみならず、次のようなものがある。
例えばr新宿;シンジュク」の撥音が脱落して「シジュ
ク」となったり、「今用;イマガワ」が「イマガ」とし
て認識されることがある。更には「近鉄へ尾;キンテツ
ヤオ」が「キンテツヨ」となったり、「嵯峨駅前;サガ
エキマエjが「サガエキメ」となることがある。このよ
うな音節の脱落は、音声認識の方式にも依存するが、予
め音節の脱落の傾向を調べておき、これに対処するべく
前記単語辞書メモリ4に辞書項目を設定しておくように
すれば良い。
また単語音声r札幌;サラポロ」の促音「ツ」について
も音節の脱落が生じ易いので、「サボロ」なる辞書項目
を同様に設定しておくようにすれば良い。また音節「ん
」についも同様に脱落が生じ易いので、この音節「ン」
を含む単語についても同様に辞書項目を設定しておくよ
うにすれば良い。
尚、本発明は上述した実施例に限定されるものではない
。ここでは音節の脱落について説明したが、逆に不本意
に音節が付加される場合もある。
例えば単語音声「電話;デンソ」が「デエンワ」として
認識される場合がある。このような不本意な音節の付加
に対しても、同様にして単語辞書メモリ4に辞書項目を
設定しておけば良い。
またここでは単語音声の認識を例に説明したが、文字認
識や文章認識の場合でも、その技術思想を同様に適用し
て、その辞書項目を設定すれば良い。
その他、本発明はその要旨を逸脱しない範囲で種々変形
して実施することが可能である。
[発明の効果] 以上説明したように本発明によれば、入力パターンを認
識処理する為の所定のパターン構成単位についての脱落
や不本意な付加が生じても、これによって生じる上記構
成対の位置ずれに左右されることなく非常に簡易に、し
かも高精度に上記入力パターンを認識することができる
。また辞書項目の追加設定は、認識処理の方式と誤認識
に対する分析結果に基づいて、付加や脱落が生じやすい
ものについてのみ行なえば良いものであるから、これに
よって辞書項目が徒に増大することがない。
故に、辞書検索に要する時間が膨大化することがなく、
その認識応答性を高く維持したままで認識性能の向上を
図ることが可能となる。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、第1図は実施例装
置の要部概略構成図、第2図は実施例装置における類似
度メモリの検索処理の概念を示す図、第3図は入力単語
音声の各音節に対する音節候補とその類似度の例を示す
図、第4図は第3図に示す音節候補の情報の類似度メモ
リへの格納例を示す図、第5図は入力単語音声の音節脱
落が生じた場合の音節候補とその類似度の例を示す図、
第6図は第5図に示す音節候補の情報の類似度メモリへ
の格納例を示す図である。 ■・・・音節認識部、2・・・類似度メモリ、3・・・
音節位置カウンタ、4・・・単語辞書メモリ、5・・・
アドレス・カウンタ、6・・・−成度計算部、7・・・
制御部、訃・・音節認識制御部。 出願人代理人 弁理士 鈴江武彦 第1図 第2 図 第3図 第4図 第5図 第6 図

Claims (3)

    【特許請求の範囲】
  1. (1)入力パターンを所定のパターン構成単位について
    それぞれ認識し、この認識によって求められた上記所定
    のパターン構成単位に対する認識対象単位との類似度を
    類似度メモリ上の上記認識対象単位と前記入力パターン
    における上記パターン構成単位の位置とによって定まる
    位置にそれぞれ格納し、認識辞書メモリに登録されてい
    る辞書項目の各認識対象単位とその単位の位置とによっ
    て定められる前記類似度メモリ上の位置に格納されてい
    る類似度から前記入力パターンを認識するパターン認識
    装置において、 前記認識辞書メモリの辞書項目として、その認識対象単
    位に対する少なくとも付加、脱落、または誤りを想定し
    た項目を設定してなることを特徴とするパターン認識装
    置。
  2. (2)入力パターンは単語または文章をなす文字列パタ
    ーンであって、所定のパターン構成単位は文字パターン
    からなるものである特許請求の範囲第1項記載のパター
    ン認識装置。
  3. (3)入力パターンは音声パターンであって、所定のパ
    ターン構成単位は音素または音節からなるものである特
    許請求の範囲第1項記載のパターン認識装置。
JP62315874A 1987-12-14 1987-12-14 パターン認識装置 Pending JPH01156876A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62315874A JPH01156876A (ja) 1987-12-14 1987-12-14 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62315874A JPH01156876A (ja) 1987-12-14 1987-12-14 パターン認識装置

Publications (1)

Publication Number Publication Date
JPH01156876A true JPH01156876A (ja) 1989-06-20

Family

ID=18070634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62315874A Pending JPH01156876A (ja) 1987-12-14 1987-12-14 パターン認識装置

Country Status (1)

Country Link
JP (1) JPH01156876A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59197974A (ja) * 1983-04-25 1984-11-09 Toshiba Corp 文字認識装置
JPS62111295A (ja) * 1985-11-08 1987-05-22 松下電器産業株式会社 音声認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59197974A (ja) * 1983-04-25 1984-11-09 Toshiba Corp 文字認識装置
JPS62111295A (ja) * 1985-11-08 1987-05-22 松下電器産業株式会社 音声認識装置

Similar Documents

Publication Publication Date Title
KR910007531B1 (ko) 음성인식장치
CN114678027A (zh) 语音识别结果的纠错方法、装置、终端设备及存储介质
WO2004086357A3 (en) System and method for speech recognition utilizing a merged dictionary
KR20130126570A (ko) 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체
Kawtrakul et al. Backward transliteration for Thai document retrieval
JP2004245938A (ja) 音声認識装置及びプログラム
JPH01156876A (ja) パターン認識装置
JP2002278579A (ja) 音声データ検索装置
JP2009271117A (ja) 音声検索装置および音声検索方法
Chiang et al. On jointly learning the parameters in a character-synchronous integrated speech and language model
Lin et al. Learning acoustic frame labeling for phoneme segmentation with regularized attention mechanism
CN111914560B (zh) 文本蕴含关系识别方法、装置、设备及存储介质
EP3051437A1 (en) Method for query processing for search in multilingual audio-archive and device for search of that processed query
EP0469485B1 (en) Language processing system using an expanded LR parser
KR101983031B1 (ko) 언어 교육 방법 및 언어 교육 시스템
Tits MUST&P-SRL: Multi-lingual and Unified Syllabification in Text and Phonetic Domains for Speech Representation Learning
JPS58156998A (ja) 情報入力装置
JPS62147492A (ja) 音声認識装置における標準パラメ−タの修正方法
Wan et al. A Study of Mispronunciation Detection and Diagnosis Based on Meta-Learning
JPS60147797A (ja) 音声認識装置
JP2528105B2 (ja) 音声認識装置
JPH01191199A (ja) 音声入力装置
JPS61190395A (ja) 音声認識装置
JPS63265299A (ja) 音声認識装置
JPS60179799A (ja) 音声認識装置