JPS61208095A

JPS61208095A - 音声認識方式

Info

Publication number: JPS61208095A
Application number: JP60047894A
Authority: JP
Inventors: 中谷　奉文
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1985-03-11
Filing date: 1985-03-11
Publication date: 1986-09-16

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】五豊公互本発明は、音声認識方式、より詳細には、会話調に近い
音声の認識が可能な音声認識方式に関する。

盗ＩＬ権音声認識において、現状では会話音声の認識は困難であ
るので単語音声認識と単音節認識を用いて会話調に近い
認識をする方法が用いられている。

第３図は、上記従来の音声認識法の一例を説明するため
の図で１図中、ｌは音声入力部、２は単音節／単語判別
部、３は単音節認識部、４は単語認識部、５は結果出力
部で、この方法は、音声入力が単音節／単語判別部によ
り単語節単位か単語単位であるかが判別され、次段の単
音節認識部又は単語認識部で識別されて出力結果が出力
されるものである。この結果、第４図のように単語単位
Ａの認識が可能となり単音節単位Ｂのみより会話調に近
い発声の認識が可能となるものであるが、この方法では
単音節／単語判別部の性能に認識精度が左右される欠点
を有していた。

■−−煎本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置において、単音節認識機能と単語認
識機能を併用することにより、特に、単語認識精度を向
上させることを目的としてなされたものである。

１−一腹本発明は、上記目的を達成するため、単音節認識部と単
語認識部とを備えて音声を認識する音声認識装置におい
て、語頭の一定フレームを用いて夫々予備選択を行ない
互いに一方の認識結果を検認し合って認識率を向上させ
るようにしたことを特徴としたものである。以下、本発
明の実施例に基づいて説明する。

第１図は１本発明による音声認識方式の一実施例を説明
するための構成図で、図中、１は音声入力部、５は出力
部、６は単音節認識部、７は単語認識部、８は判定部で
、本発明は、単音節と単語の判別をしてから認識するの
ではなく、互いの認識結果を検認しながら認識精度を上
げる方法を提供しようとするものである。

第１図において、音声入力は単音節認識部６及び単語認
識部７に同時に入力されて並列に夫々のルーチンに従っ
て識別操作が実施される。この結果は判定部８において
、どちらの結果が妥当であるかが判別されて８力に結果
を出す。ここで単音節認識部６と単語認識部７の大きな
違いは単音節認識部６は単位がＩＣＶ（子音−母音）で
あり、単語認識部７は複数のＣｖから辞書が構成されて
おり、音声長が単音節の方が短い点がある。また、現状
では単語中のセグメンテーション技術が不完全であるか
ら単語中から単音節Ｃｖを正しく切出すことはできない
。そこで１本発明では、単語認識の結果を検認するため
に単音節認識部において単語の語頭の単音節部を認識し
てその結果から単語の語頭が一致するものを選択するよ
うにしている。従って、単音節認識部は夫々語頭の一定
フレームのみで予備選択する。この一定フレーム長は通
常ＩＣＶより短く次のＣＶにかからないよう１００〜３
００ｍ５程度とする。この短区間の特徴パラメータから
単語の最初のＣ■候補を選択するのであるから候補を１
つに絞ることはできない。そこで複数個の候補を選択し
てその中で最も多いＣＶを候補とする。一方、単語認識
は同じく語頭一定フレーム長の予備選択により候補単語
を絞り、その中から本選択により類似度の大きい順に複
数個の候補を選別する。このとき先のＣｖ候補と候補単
語の先頭Ｃｖを比較し、両者が一致しておればその１位
の候補単語を結果として出力する。しかし１両者の一致
が得られないときは。

（イ）、１位と２位の候補単語の類似度の得点比が大き
いときには単語認識を優先する。

（ロ）、単音節の候補を決定するとき最も多いＣｖを選
択するが、このときの選択比が一定の値より大きいとき
は単音節認識を優先する。

の一方のカテゴリーを採用する。

以上は単語認識結果の検認法であるが、同様に単音節認
識結果の検認も逆の構成で実行できる。

単語認識において、語頭の一定フレームで予備選択して
語頭のＣＶを推定する方法は単音節の場合と同様である
。

第２図は、前記単音節と単語の両方の認識結果を検認し
会う場合の例を説明するための図で、図中、６ａ、７ａ
は語頭の一定フレームで予備選択して候補を複数個に絞
り込む予備選択部であり、６ｂ、７ｂはその候補につい
て本選択により順位づけする本選択部であり、６ｅ、７
ｃは夫々７ａ。

６ａの予備選択結果との論理選択する後処理部であり、
判定部８で最終出力を判定するものである。

なお、これは前記（イ）、（ロ）のカテゴリーに基づい
て片方づつの構成にしても良いことは言うまでもない。

勿−一一艮以上の説明から明らかなように、本発明によると、会話
調に近い発声の音声入力を単音節と単語認識を同時処理
することにより、互いの認識結果を予備選択結果で検認
して認識率を向上することができる。

【図面の簡単な説明】

第１図及び第２図は、それぞれ本発明による音声認識方
式を説明するための構成図、第３図は、従来の音声認識
方式を説明するための構成図、第４図は、音声認識の一
例を説明するための図である。１・・・音声入力部、５・・・結果出力部、６・・・単
音節認識部、７・・・単語認識部、８・・・判定部、６
ａ。７ｑ・・・予備選択部、６ｂ、７ｂ・・・本選択部、６
ｃ。７ｃ・・・後処理部。第　１　図第　２　図

Claims

【特許請求の範囲】

（１）、単音節認識部と単語認識部とを備えて音声を認
識する音声認識方式において、語頭の一定フレームを用
いて夫々予備選択を行ない互いに一方の認識結果を検認
し合つて認識率を向上させるようにしたことを特徴とす
る音声認識方式。
（２）、単語認識の１位と２位の類似度得点比がある一
定値より大きいときは単語認識結果を優先することを特
徴とする特許請求の範囲第（１）項に記載の音声認識方
式。
（３）、単音節の候補を決定するとき候補単音節の中で
同じＣ（子音）又はＶ（母音）が一定値より多いとき、
その単音節認識結果から単語を判定することを特徴とす
る特許請求の範囲第（１）項に記載の音声認識方式。
（４）、単語認識の予備選択結果より、その候補単語の
中で一定値より多くしかも最も多い先頭Ｃ（子音）又は
Ｖ（母音）を判定して単音節認識結果を判定することを
特徴とする特許請求の範囲第（１）項に記載の音声認識
方式。