JPS63798B2

JPS63798B2 -

Info

Publication number: JPS63798B2
Application number: JP53109596A
Authority: JP
Inventors: Sadaichi Watanabe; Noryuki Goto
Original assignee: Tokyo Shibaura Electric Co Ltd
Current assignee: Toshiba Corp
Priority date: 1978-09-08
Filing date: 1978-09-08
Publication date: 1988-01-08
Also published as: JPS5536825A

Description

【発明の詳細な説明】本発明は音声認識装置に係り、特に音韻レベル
で音声を認識する音声認識装置に関する。

従来より知られている音声認識は、主としてパ
ターンマツチング法がとられており、第１図はそ
の構成を示す図である。本図において入力音声は
前処理回路１に供給され、この前処理回路１で雑
音除去、エンフアシスなどの処理を行つた後、チ
ヤンネルフイルタ２で音声のスペクトル包絡を抽
出し、辞書３とのマツチング度を類似度計算回路
４で計算し、たとえば類似度が最大の辞書パター
を入力音声と判定する。類似度の計算としては、
入力音声パターンと辞書パターンとのユークリツ
ド距離、内積などが用いられる。

また別の判定方式として、類似度が一定値以下
のときはリジエクトとし、判定を行わないという
方法も知られている。

このように従来の方式はパターンマツチング法
によつて入力音声を判定するものであるが、上記
２つの判定方式のうち前者は判定誤りが多く、ま
た後者はリジエクトの割合が大きくなるという問
題があり、特に音韻認識については十分な識別率
が得られないという問題がある。すなわち従来の
音声認識はパターンマツチング、すなわち識別の
基準となる辞書パターンの中から入力音声が何で
あるかを判定する方式であるが、第１図で示した
従来の方式では類似したパターンをもつ異なる音
韻を明確に分離することができない。

このため入力音声言語の種類（カナ、漢字等）
を指定するための言語情報を利用して前後関係で
判定したり、あるいは音韻ではなく単語の形で認
識を行う方式をとるなどの考えもとられている
が、個々の音韻を音声のレベルで正しく認識する
技術が未だ実現されていない。

本発明は上記従来技術の問題点を解決するため
になされたもので、音声のレベルで音韻を正しく
認識することのできる音声認識装置を提供するこ
とを目的とする。

本発明による音声認識装置は、パターン全体の
マツチングのほかに類似パターンについて一部分
のマツチングを調べる手段を設けて特徴の違いが
明確な部分についての部分マツチングをとるよう
にしたものである。

以下図面を参照して本発明を説明する。

第２図は本発明の音声認識装置の一実施例を示
すブロツク構成図である。本図において１１は前
処理回路で、第１図で示したものと同様に入力音
声はこの前処理回路１１で雑音除去、エンフアシ
ス等の前処理を受ける。前処理回路１１の出力は
次にチヤンネルフイルタ１２に送られてスペクト
ル包絡が抽出される。そしてチヤンネルフイルタ
１２で得られたスペクトル包絡と辞書１３中の音
声パターンとマツチングが類似度計算回路１４に
より計算される。そしてもし類似度が十分大きい
ときは類似度最大のものが識別結果として合成回
路１５を介して出力端子に送出される。

一方類似度が一定値以下の場合はリジエクトと
して、いくつかの候補が部分マツチング回路１６
に送られ、部分マツチング辞書１７により部分マ
ツチングが調べられる。そして部分マツチングが
最大のものが識別結果として合成回路１５を介し
て出力端子に送出される。この場合、さらにリジ
エクトの判定を行う場合もあることは云うまでも
ない。

ここで部分マツチング回路は全体のパターンの
マツチングをとる類似度計算回路と同様に構成す
ればよい。また部分マツチング辞書には識別の困
難な音声パターンの特徴を示す部分パターンとそ
の部分を示す情報を収容する、例えば全体の標準
パターンとのマツチングを入力音声の８ｍsec毎
にサンプリングしこれを例えば時間軸方向に16点
のパターンとしてマツチングする場合であれば、
部分パターンとしては入力音声の特徴を示す部分
を２ｍsec毎にサンプリングしこれを時間軸方向
に同様に16点のパターンとしてマツチングを行な
えばよい。

以上説明したように本発明は、全体としてのパ
ターンマツチングでは十分な差がないものにつ
き、特徴的に異なる部分だけについて再度部分的
にマツチングをとることにより識別するようにし
たものである。

従つて本発明によれば全体としてみればわずか
の差しかないものでもその特徴部分の比較を行う
ことによつて十分分離が可能となり、識別率の向
上を図ることができる。しかし音韻レベルでの良
好な識別を言語情報の補助なく達成することがで
きるので、装置の小型化が可能となり、また操作
の単純化の点でも効果が大きい。

【図面の簡単な説明】

第１図は従来例を示す図、第２図は本発明の一
実施例を示すブロツク構成図である。１１……前処理回路、１２……フイルタ、１３
……辞書、１４……類似度計算回路、１５……合
成回路、１６……部分マツチング回路。

Claims

【特許請求の範囲】

１識別の基準となる音声パターンを辞書として
記憶する手段と、この手段に記憶された辞書パタ
ーンと入力音声パターンとの全体の類似度を計算
する手段とを有し、前記類似度の大きさによつて
前記入力音声を識別する音声認識装置において、
音声パターンの部分的な特徴を辞書として記憶す
る手段と、この手段に記憶された部分辞書パター
ンと前記入力音声の部分的なパターンとの類似度
を計算する部分マツチング回路とを備え、前記類
似度計算手段で十分な類似度が得られない前記入
力音声を前記部分マツチング回路によつて識別す
るようにしたことを特徴とする音声認識装置。