JPS627095A

JPS627095A - 音声認識装置

Info

Publication number: JPS627095A
Application number: JP60144744A
Authority: JP
Inventors: 義典北原; 薮内　繁; 大島　義光; 正博阿部; 武市　宜之; 遠藤　裕英
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1985-07-03
Filing date: 1985-07-03
Publication date: 1987-01-14
Anticipated expiration: 2011-03-21
Also published as: JPH0827639B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の利用分野〕本発明は、単語・文節単位あるいは複数文節で発声され
た音声を認識し出力する音声認識装置の改良に関する。

〔発明の背景〕

従来の装置は、特開昭５９−１１６８３７に記載のよう
に１文節単位で発声された音声を認識し、複数の候補系
列より、音声認識結果の確からしさ以外の自立語長、頻
度を含む条件により評価して認識候補の出力順序変更す
るようになっていた。しかし、該装置では、語長の短か
い自立語を含有する文節を入力した場合には認識性能が
低下することがあり、自立語長が影響する場合の認識性
能に対しては配慮されていなかった。

〔発明の目的〕

本発明の目的は、単語・文節・複数文節単位で発声され
た音声を正しく認識する音声認識装置を提供することに
ある。

〔発明の概要〕

上記目的を達成するために、本発明では、単語・文節・
複数文節単位で発声された音声を認識し、複数候補系列
を作成したあと、自立語辞書・付属語辞書を用いて各候
補系列中の自立語数、自立語頻度２文節間の結合の強さ
に関する情報を求め、上記３種の情報と音響的類似度に
より正しい系列を選択することを特徴する。

〔発明の実施例〕

以下１本発明の一実施例を、図を用いて説明する。第１
図は１本発明の詳細な説明するための音声認識装置の一
例のブロック図である。入力された単語／文節／複数文
節音声は、音響認識部１にて音韻／音節／単語等の標準
パターン２との照合が行なわれ、複数候補系列を音響的
類似度とともに認識結果バッファメモリ３に格納する。

認識結果バッファメモリ３の内容の一例を第２図（ａ）
に示す。候補系列選択部４は、自立語辞書６および付属
語辞書７を有し、自立語辞書６には第２図（ｂ）のよう
に自立語および該自立語の表記・出現頻度が登録されて
おり、付属語辞書７には第２図（ｃ）のように付属語お
よび該付属語の表記が登録されている。

認識結果バッファメモリ３中の候補系列は、音響的類似
度とともに１系列ずつ候補系列選択部４に送られ、自立
語辞書６および付属語辞書７の中の各項目の文字列との
比較照合により、自立語および付属語に分解する。該分
解文字列は、自立語数、系列頻度、未知語フラグ、音響
的類似度とともに、系列解析バッファメモリ５に記憶さ
れる。

例えば、第２図（ａ）の第１系列の″ヒッヨウテアル″
′場合は、自立語辞書６中の″ヒラ、″つ”、″アル″
および付属語辞書７中の“ヨ”、゛′テ″と照合がとれ
て、ヒツ＋ヨ＋つ＋テ＋アルと分解される。この時、自立語数は３、系列頻度は、（
“ヒラ”の頻度）＋（”つ”の頻度）＋（“アル”の頻
度）を自立語数で除したもの、すなわち、（２７＋３４
＋４５１）／３＝１７１となる。未知語フラグは、辞書
項目と照合がとれない文字列が存在する場合に値１をも
つ。第１系列“ヒラヨウデアル”の未知語フラグの値は
Ｏである。

第２図（ａ）の５系列について、系列解析バッファメモ
リ５に記憶される自立語数、系列頻度、未知語フラグ、
音響的類似度の内容を第３図に示す一０次に、系列解析
バッファメモリ５に記憶されている系列の中から、未知
語フラグの値が０である系列の番号を選択系列メモリ８
に記憶する０例では、１，２，３．４の系列の未知語フ
ラグの値が０であるため番号り、２，３．４が選択系列
メモリ８に記憶される６次に、選択系列メモリ８に記憶
された番号の系列のうち、自立語数が最小のものの系列
の番号を、選択系列メモリ８に記憶し直す。例では、３
，４の系列の自立語数面者ともに２で最小であるので１
選択系メモリ８に番号３゜４が記憶される０次に１選択
系列メモリ８に記憶された番号の系列のうち、音響的類
似度の値が最大である系列の番号を、選択系列メモリ８
に記憶し直す１例では、３，４の系列の音響的類似度の
値が両者とも７１であるので１選択系列メモリ８に番号
３．４が記憶される１次に、選択系列メモリ８に記憶さ
れた番号の系列のうち、系列頻度の値が最大の系列の番
号を、選択系列メモリ８に記憶し直す。例では、３の系
列の系列頻度の値が１８２．４の系列の系列頻度の値が
１６１であるので、選択系列メモリ８に番号３が記憶さ
れる。

最後に１選択系列メモリ８に記憶されている番号の系列
をディスプレイ用バッファメモリ９に記憶する。自立語
辞書６．付属語辞書７の各項目と比較照合を行なう際に
、照合のとれた項目の「表記」を記憶しておいて、最終
的に選択系列メモリ８に記憶されている番号の系列の「
表記」列を、ディスプレイ用バッファメモリ９に記憶し
てもよＬ’ｓそして、ディスプレイ用バッファメモリ９の内容を、デ
ィスプレイ１ｏに表示する。

なお、音響認識部１の直後に、日本語において出現し得
る音節の組合せ等の情報を用いて候補系列を少数に絞る
ことも可能である。

〔発明の効果〕

以上説明したように、本発明では、音声認識の結果の候
補系列に対して、系列中の自立語数、自立語頻度、音響
的類似度を用いて、正しい系列を選択するので１日本語
として妥当な系列が高い精度で選ばれ出力される。

【図面の簡単な説明】

第１図は本発明の一実施例の全体構成図、第２図（ａ）
は文節「ヒラヨウデアル」を認識した時　　　　　　　
１の音響認識部の出力候補系列を示す図、同図（ｂ）は
本発明で使用する自立語辞書を示す図、同図（ｃ）は本
発明で使用する付属語辞書を示す図、第３図は「ヒラヨ
ウデアル」を認識した時の候補系列についての自立語数
、系列頻度、未知語フラグ、音響的類似度の一例を示す
図である。

Claims

【特許請求の範囲】

単語・文節単位で発声された音声を、音韻または音節単
位で認識し、複数の認識候補系列より正しい系列を選択
する音声認識装置において、自立語辞書と、付属語辞書
と、それらの辞書を用いて各候補系列中の自立語数、自
立語頻度、音響的類似度とを求める手段とを有し、該手
段の結果により正しい系列を選択することを特徴とする
音声認識装置。