JPH0695689A

JPH0695689A - 音声認識システム

Info

Publication number: JPH0695689A
Application number: JP4247452A
Authority: JP
Inventors: Yoshihiro Sekiguchi; 芳廣関口; Yoshihiro Matsuura; 嘉宏松浦
Original assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Current assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Priority date: 1992-09-17
Filing date: 1992-09-17
Publication date: 1994-04-08

Abstract

(57)【要約】【目的】言語解析のための単語候補の探索を確実，容
易にして言語解析の認識速度と認識率を向上する。【構成】単語認識のための音素列比較３₁に単語辞書
３₃から単語候補を抽出するのに、単語候補に意味情報
を持たせる予測用情報３₄を使って次単語予測３₂を行
い、単語候補を意味的に制限した次単語候補の予測によ
って音素列比較を少なくすすると共に認識単語候補数も
少なくする。また、無意味な単語は音素的に類似度が高
くともその除外によって認識率を高くする。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声認識システムに係
り、特に連続音声認識における単語候補探索に関する。

【０００２】

【従来の技術】音声認識システムのうち、連続音声認識
では連続して発声された入力音声信号に対して区間ごと
に周波数分析あるいは線形予測分析を行って特徴ベクト
ルの系列に変換し（音響分析）、この特徴ベクトルから
音声信号を一定の物理的な性質を持つ部分に分割して母
音や子音の音素を抽出し（音素認識）、単語の音形を記
録した単語辞書を参照して音素認識結果から音素列比較
により単語ラティスとして認識し（単語認識）、単語ラ
ティス中の単語から構文，意味解析により個々に単語を
決定して単語列として抽出する（言語解析）。

【０００３】このような連続音声認識において、調音結
合や音の脱落など様々な原因によって音素の認識が必ず
しも正確に行われるとは限らない。

【０００４】そこで、音素認識では音素列の抽出にいく
つかの可能性を残した音素ラティスとして得、単語認識
では得られた音素列を辞書の各単語の音素列と比較し、
類似度の高いものから単語候補として残し、言語解析で
は構文・意味的に整合性のとれた候補単語を選択する。

【０００５】

【発明が解決しようとする課題】従来方式において、単
語認識では１つの音素列当たり複数の単語候補を抽出す
るため、言語解析では文章として認識するのに長い文章
になるほど単語候補の組合せが指数関数的に増加してし
まう。

【０００６】このため、認識可能な語彙数の増加に伴っ
て言語解析に要する時間が非常に大きくなり、連続音声
入力に対する音声認識の応答性が悪くなるし、認識不能
にもなる。

【０００７】本発明の目的は、単語候補の探索を確実，
容易にして言語解析の認識速度と認識率を向上する音声
認識システムを提供することにある。

【０００８】

【課題を解決するための手段】本発明は、前記課題の解
決を図るため、連続音声入力信号を音響分析し、この分
析結果から音素認識をし、この認識結果と単語の音素列
との音素列比較によって単語候補を認識し、この単語候
補から言語解析によって個々に単語を決定する音声認識
システムにおいて、前記音素列比較に供する単語に意味
情報を持たせて後続する単語候補を制限する単語予測手
段を備えたことを特徴とする。

【０００９】

【作用】単語認識における音素列比較に際し、候補単語
をその意味的に制限することによって比較対象となる候
補単語から無意味な単語を除外し、意味的に整合する候
補単語のみによる単語認識を行い、また単語認識結果に
対する言語解析に供する候補単語数を少なくする。

【００１０】

【実施例】図１は本発明の一実施例を示すシステム構成
図である。音響分析部１と音素認識部２及び言語解析部
４による各処理は従来の連続音声認識システムと同様の
ものになる。

【００１１】単語認識部３は、入力音素列から単語候補
を認識する音素列比較処理３₁に与える次単語候補デー
タを制限することで音素列比較の単語数を少なくすると
共に認識される単語候補も少なくする。

【００１２】このための次単語候補データは、次単語予
測処理３₂が単語辞書３₃と予測用情報３₄を使って、意
味的な制限の基に予測する。

【００１３】この単語予測には以下の関係を利用する。

【００１４】(1)副詞および形容詞，形容動詞の連用形
と動詞間の関係副詞と動詞および形容詞，形容動詞の連用形と動詞間の
意味的な結合情報を得る為に、動詞の意味分類を表１，
２のように与える。

【００１５】各副詞，形容詞，形容動詞にはその単語に
後続し得る動詞の意味属性を持たせる。

【００１６】例を表３に示す。こうして与えた意味属性
によって副詞などに後続する動詞を予測し制限すること
ができる。

【００１７】

【表１】

【００１８】

【表２】

【００１９】

【表３】

【００２０】(2)連体詞と連体詞の関係連体詞同士の接続に関して、接続の仕方によって意味の
通らない文が出現することがあるため、連体詞をいくつ
かのグループに分けそのグループ間での接続関係を決め
ている。例を表４，５に示す。

【００２１】

【表４】

【００２２】

【表５】

【００２３】(3)形容詞と名詞の関係各名詞には表６のようにそれぞれに単語の上位概念を意
味属性として与える。これらの意味属性間は図２に示す
ように階層構造をなしている。また意味属性のトップレ
ベルは表７のように与える。形容詞に対しても表８に示
すような意味属性を与える。

【００２４】これらに対して、形容詞の意味属性と名詞
の意味属性との間の関係を表９の例のように与える。こ
の情報を利用することによって形容詞に後続する名詞を
限定する事ができる。

【００２５】

【表６】

【００２６】

【表７】

【００２７】

【表８】

【００２８】

【表９】

【００２９】(4)名詞句と名詞の関係名詞に与えた表６のような意味属性によって、助詞が結
ぶ名詞間の意味関係を表現し、名詞句に後続する名詞を
限定するのに利用する。助詞「の」が結ぶ名詞間の意味
属性の関係を表１０に示す。

【００３０】

【表１０】

【００３１】(5)格構造をもとにした予測用知識ベース格構造の知識を単語予測用に分類整理することにより単
語予測用知識ベースを構築する。これは意味属性＋格助
詞＋格の種類＋予測される述語の全ての組み合わせを分
類することによって得られる。

【００３２】これによって、名詞の意味属性からその名
詞に結びつく可能性の高い格助詞を予測，名詞の意味属
性とそれに結びついている格助詞とから、示す可能性の
ある格の種類、同じ格構造内で使われる可能性のある意
味属性＋格助詞＋格の種類、およびその意味属性＋格助
詞が格として使われる可能性のある述語を予測する。

【００３３】

【発明の効果】以上のとおり、本発明によれば、単語認
識部における音素列比較による単語認識に単語候補を意
味的に制限して単語候補を抽出するようにしたため、意
味的に不要な単語候補を除去することができ、単語認識
のための処理時間を短縮すると共に言語解析部４での認
識処理時間を短縮することができる。

【００３４】また、無意味な単語候補は音素的に類似度
が高くても除外されるため、認識率を向上させることが
できる。

【図面の簡単な説明】

【図１】本発明の一実施例を示すシステム構成図。

【図２】意味属性の階層構造の例。

【符号の説明】

１…音響分析部２…音素認識部３…単語認識部４…言語解析部

Claims

【特許請求の範囲】

【請求項１】連続音声入力信号を音響分析し、この分
析結果から音素認識をし、この認識結果と単語の音素列
との音素列比較によって単語候補を認識し、この単語候
補から言語解析によって個々に単語を決定する音声認識
システムにおいて、前記音素列比較に供する単語に意味
情報を持たせて後続する単語候補を制限する単語予測手
段を備えたことを特徴とする音声認識システム。