JPS627095A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS627095A JPS627095A JP60144744A JP14474485A JPS627095A JP S627095 A JPS627095 A JP S627095A JP 60144744 A JP60144744 A JP 60144744A JP 14474485 A JP14474485 A JP 14474485A JP S627095 A JPS627095 A JP S627095A
- Authority
- JP
- Japan
- Prior art keywords
- series
- independent
- words
- word
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、単語・文節単位あるいは複数文節で発声され
た音声を認識し出力する音声認識装置の改良に関する。
た音声を認識し出力する音声認識装置の改良に関する。
従来の装置は、特開昭59−116837に記載のよう
に1文節単位で発声された音声を認識し、複数の候補系
列より、音声認識結果の確からしさ以外の自立語長、頻
度を含む条件により評価して認識候補の出力順序変更す
るようになっていた。しかし、該装置では、語長の短か
い自立語を含有する文節を入力した場合には認識性能が
低下することがあり、自立語長が影響する場合の認識性
能に対しては配慮されていなかった。
に1文節単位で発声された音声を認識し、複数の候補系
列より、音声認識結果の確からしさ以外の自立語長、頻
度を含む条件により評価して認識候補の出力順序変更す
るようになっていた。しかし、該装置では、語長の短か
い自立語を含有する文節を入力した場合には認識性能が
低下することがあり、自立語長が影響する場合の認識性
能に対しては配慮されていなかった。
本発明の目的は、単語・文節・複数文節単位で発声され
た音声を正しく認識する音声認識装置を提供することに
ある。
た音声を正しく認識する音声認識装置を提供することに
ある。
上記目的を達成するために、本発明では、単語・文節・
複数文節単位で発声された音声を認識し、複数候補系列
を作成したあと、自立語辞書・付属語辞書を用いて各候
補系列中の自立語数、自立語頻度2文節間の結合の強さ
に関する情報を求め、上記3種の情報と音響的類似度に
より正しい系列を選択することを特徴する。
複数文節単位で発声された音声を認識し、複数候補系列
を作成したあと、自立語辞書・付属語辞書を用いて各候
補系列中の自立語数、自立語頻度2文節間の結合の強さ
に関する情報を求め、上記3種の情報と音響的類似度に
より正しい系列を選択することを特徴する。
以下1本発明の一実施例を、図を用いて説明する。第1
図は1本発明の詳細な説明するための音声認識装置の一
例のブロック図である。入力された単語/文節/複数文
節音声は、音響認識部1にて音韻/音節/単語等の標準
パターン2との照合が行なわれ、複数候補系列を音響的
類似度とともに認識結果バッファメモリ3に格納する。
図は1本発明の詳細な説明するための音声認識装置の一
例のブロック図である。入力された単語/文節/複数文
節音声は、音響認識部1にて音韻/音節/単語等の標準
パターン2との照合が行なわれ、複数候補系列を音響的
類似度とともに認識結果バッファメモリ3に格納する。
認識結果バッファメモリ3の内容の一例を第2図(a)
に示す。候補系列選択部4は、自立語辞書6および付属
語辞書7を有し、自立語辞書6には第2図(b)のよう
に自立語および該自立語の表記・出現頻度が登録されて
おり、付属語辞書7には第2図(c)のように付属語お
よび該付属語の表記が登録されている。
に示す。候補系列選択部4は、自立語辞書6および付属
語辞書7を有し、自立語辞書6には第2図(b)のよう
に自立語および該自立語の表記・出現頻度が登録されて
おり、付属語辞書7には第2図(c)のように付属語お
よび該付属語の表記が登録されている。
認識結果バッファメモリ3中の候補系列は、音響的類似
度とともに1系列ずつ候補系列選択部4に送られ、自立
語辞書6および付属語辞書7の中の各項目の文字列との
比較照合により、自立語および付属語に分解する。該分
解文字列は、自立語数、系列頻度、未知語フラグ、音響
的類似度とともに、系列解析バッファメモリ5に記憶さ
れる。
度とともに1系列ずつ候補系列選択部4に送られ、自立
語辞書6および付属語辞書7の中の各項目の文字列との
比較照合により、自立語および付属語に分解する。該分
解文字列は、自立語数、系列頻度、未知語フラグ、音響
的類似度とともに、系列解析バッファメモリ5に記憶さ
れる。
例えば、第2図(a)の第1系列の″ヒッヨウテアル″
′場合は、自立語辞書6中の″ヒラ、″つ”、″アル″
および付属語辞書7中の“ヨ”、゛′テ″と照合がとれ
て、 ヒツ+ヨ+つ+テ+アル と分解される。この時、自立語数は3、系列頻度は、(
“ヒラ”の頻度)+(”つ”の頻度)+(“アル”の頻
度)を自立語数で除したもの、すなわち、(27+34
+451)/3=171となる。未知語フラグは、辞書
項目と照合がとれない文字列が存在する場合に値1をも
つ。第1系列“ヒラヨウデアル”の未知語フラグの値は
Oである。
′場合は、自立語辞書6中の″ヒラ、″つ”、″アル″
および付属語辞書7中の“ヨ”、゛′テ″と照合がとれ
て、 ヒツ+ヨ+つ+テ+アル と分解される。この時、自立語数は3、系列頻度は、(
“ヒラ”の頻度)+(”つ”の頻度)+(“アル”の頻
度)を自立語数で除したもの、すなわち、(27+34
+451)/3=171となる。未知語フラグは、辞書
項目と照合がとれない文字列が存在する場合に値1をも
つ。第1系列“ヒラヨウデアル”の未知語フラグの値は
Oである。
第2図(a)の5系列について、系列解析バッファメモ
リ5に記憶される自立語数、系列頻度、未知語フラグ、
音響的類似度の内容を第3図に示す一0次に、系列解析
バッファメモリ5に記憶されている系列の中から、未知
語フラグの値が0である系列の番号を選択系列メモリ8
に記憶する0例では、1,2,3.4の系列の未知語フ
ラグの値が0であるため番号り、2,3.4が選択系列
メモリ8に記憶される6次に、選択系列メモリ8に記憶
された番号の系列のうち、自立語数が最小のものの系列
の番号を、選択系列メモリ8に記憶し直す。例では、3
,4の系列の自立語数面者ともに2で最小であるので1
選択系メモリ8に番号3゜4が記憶される0次に1選択
系列メモリ8に記憶された番号の系列のうち、音響的類
似度の値が最大である系列の番号を、選択系列メモリ8
に記憶し直す1例では、3,4の系列の音響的類似度の
値が両者とも71であるので1選択系列メモリ8に番号
3.4が記憶される1次に、選択系列メモリ8に記憶さ
れた番号の系列のうち、系列頻度の値が最大の系列の番
号を、選択系列メモリ8に記憶し直す。例では、3の系
列の系列頻度の値が182.4の系列の系列頻度の値が
161であるので、選択系列メモリ8に番号3が記憶さ
れる。
リ5に記憶される自立語数、系列頻度、未知語フラグ、
音響的類似度の内容を第3図に示す一0次に、系列解析
バッファメモリ5に記憶されている系列の中から、未知
語フラグの値が0である系列の番号を選択系列メモリ8
に記憶する0例では、1,2,3.4の系列の未知語フ
ラグの値が0であるため番号り、2,3.4が選択系列
メモリ8に記憶される6次に、選択系列メモリ8に記憶
された番号の系列のうち、自立語数が最小のものの系列
の番号を、選択系列メモリ8に記憶し直す。例では、3
,4の系列の自立語数面者ともに2で最小であるので1
選択系メモリ8に番号3゜4が記憶される0次に1選択
系列メモリ8に記憶された番号の系列のうち、音響的類
似度の値が最大である系列の番号を、選択系列メモリ8
に記憶し直す1例では、3,4の系列の音響的類似度の
値が両者とも71であるので1選択系列メモリ8に番号
3.4が記憶される1次に、選択系列メモリ8に記憶さ
れた番号の系列のうち、系列頻度の値が最大の系列の番
号を、選択系列メモリ8に記憶し直す。例では、3の系
列の系列頻度の値が182.4の系列の系列頻度の値が
161であるので、選択系列メモリ8に番号3が記憶さ
れる。
最後に1選択系列メモリ8に記憶されている番号の系列
をディスプレイ用バッファメモリ9に記憶する。自立語
辞書6.付属語辞書7の各項目と比較照合を行なう際に
、照合のとれた項目の「表記」を記憶しておいて、最終
的に選択系列メモリ8に記憶されている番号の系列の「
表記」列を、ディスプレイ用バッファメモリ9に記憶し
てもよL’s そして、ディスプレイ用バッファメモリ9の内容を、デ
ィスプレイ1oに表示する。
をディスプレイ用バッファメモリ9に記憶する。自立語
辞書6.付属語辞書7の各項目と比較照合を行なう際に
、照合のとれた項目の「表記」を記憶しておいて、最終
的に選択系列メモリ8に記憶されている番号の系列の「
表記」列を、ディスプレイ用バッファメモリ9に記憶し
てもよL’s そして、ディスプレイ用バッファメモリ9の内容を、デ
ィスプレイ1oに表示する。
なお、音響認識部1の直後に、日本語において出現し得
る音節の組合せ等の情報を用いて候補系列を少数に絞る
ことも可能である。
る音節の組合せ等の情報を用いて候補系列を少数に絞る
ことも可能である。
以上説明したように、本発明では、音声認識の結果の候
補系列に対して、系列中の自立語数、自立語頻度、音響
的類似度を用いて、正しい系列を選択するので1日本語
として妥当な系列が高い精度で選ばれ出力される。
補系列に対して、系列中の自立語数、自立語頻度、音響
的類似度を用いて、正しい系列を選択するので1日本語
として妥当な系列が高い精度で選ばれ出力される。
第1図は本発明の一実施例の全体構成図、第2図(a)
は文節「ヒラヨウデアル」を認識した時
1の音響認識部の出力候補系列を示す図、同図(b)は
本発明で使用する自立語辞書を示す図、同図(c)は本
発明で使用する付属語辞書を示す図、第3図は「ヒラヨ
ウデアル」を認識した時の候補系列についての自立語数
、系列頻度、未知語フラグ、音響的類似度の一例を示す
図である。
は文節「ヒラヨウデアル」を認識した時
1の音響認識部の出力候補系列を示す図、同図(b)は
本発明で使用する自立語辞書を示す図、同図(c)は本
発明で使用する付属語辞書を示す図、第3図は「ヒラヨ
ウデアル」を認識した時の候補系列についての自立語数
、系列頻度、未知語フラグ、音響的類似度の一例を示す
図である。
Claims (1)
- 単語・文節単位で発声された音声を、音韻または音節単
位で認識し、複数の認識候補系列より正しい系列を選択
する音声認識装置において、自立語辞書と、付属語辞書
と、それらの辞書を用いて各候補系列中の自立語数、自
立語頻度、音響的類似度とを求める手段とを有し、該手
段の結果により正しい系列を選択することを特徴とする
音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60144744A JPH0827639B2 (ja) | 1985-07-03 | 1985-07-03 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60144744A JPH0827639B2 (ja) | 1985-07-03 | 1985-07-03 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS627095A true JPS627095A (ja) | 1987-01-14 |
JPH0827639B2 JPH0827639B2 (ja) | 1996-03-21 |
Family
ID=15369350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60144744A Expired - Lifetime JPH0827639B2 (ja) | 1985-07-03 | 1985-07-03 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0827639B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59180629A (ja) * | 1983-03-30 | 1984-10-13 | Comput Basic Mach Technol Res Assoc | 日本語音声入力装置 |
-
1985
- 1985-07-03 JP JP60144744A patent/JPH0827639B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59180629A (ja) * | 1983-03-30 | 1984-10-13 | Comput Basic Mach Technol Res Assoc | 日本語音声入力装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0827639B2 (ja) | 1996-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Soong et al. | A Tree. Trellis based fast search for finding the n best sentence hypotheses in continuous speech recognition | |
US4769844A (en) | Voice recognition system having a check scheme for registration of reference data | |
El Méliani et al. | Accurate keyword spotting using strictly lexical fillers | |
JP2002278579A (ja) | 音声データ検索装置 | |
JPS627095A (ja) | 音声認識装置 | |
Kawahara et al. | Speaking-style dependent lexicalized filler model for key-phrase detection and verification | |
JPH049320B2 (ja) | ||
JPS62134698A (ja) | 多数単語の音声入力方式 | |
Kawahara et al. | Topic independent language model for key-phrase detection and verification | |
JPS6325366B2 (ja) | ||
JPH04296898A (ja) | 音声認識装置 | |
JP2979912B2 (ja) | 音声認識装置 | |
JPS60164800A (ja) | 音声認識装置 | |
Wiesen et al. | An evaluation of the Lincoln Laboratory speech recognition system | |
Hall et al. | Parsing and word matching in the Lincoln Laboratory, speech recognition system | |
JPS63158600A (ja) | 単語検出装置 | |
JPS6283796A (ja) | 音声入力装置 | |
JPS6346499A (ja) | 大語▲い▼単語音声認識方式 | |
House et al. | Automatic measurement of the formants of vowels in diverse consonantal environments | |
JPH0552506B2 (ja) | ||
Lowerre | Comparison of two speech understanding systems | |
JPS61149997A (ja) | 音声認識装置 | |
JPH0632021B2 (ja) | 日本語音声認識装置 | |
Heinz | Spectrum matching of fricative consonants | |
Ingemann et al. | Speech recognition through spectrogram matching |