JPH06180593A - 連続音声認識方法および該方法を用いた装置 - Google Patents

連続音声認識方法および該方法を用いた装置

Info

Publication number
JPH06180593A
JPH06180593A JP4352442A JP35244292A JPH06180593A JP H06180593 A JPH06180593 A JP H06180593A JP 4352442 A JP4352442 A JP 4352442A JP 35244292 A JP35244292 A JP 35244292A JP H06180593 A JPH06180593 A JP H06180593A
Authority
JP
Japan
Prior art keywords
word
predicted
words
recognition
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4352442A
Other languages
English (en)
Inventor
Kazuya Takeda
一哉 武田
Shingo Kuroiwa
眞吾 黒岩
Makoto Shosakai
誠 庄境
Kunihiko Owa
邦彦 尾和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Asahi Chemical Industry Co Ltd
Original Assignee
Kokusai Denshin Denwa KK
Asahi Chemical Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK, Asahi Chemical Industry Co Ltd filed Critical Kokusai Denshin Denwa KK
Priority to JP4352442A priority Critical patent/JPH06180593A/ja
Publication of JPH06180593A publication Critical patent/JPH06180593A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 (修正有) 【目的】 単語予測結果に応じスイッチ操作を行ない、
単語照合処理部と文法状態処理部との接続を人手の変更
なく、予測された単語のみにより生成される文のみを認
識候補とし、誤認識を抑え得る。 【構成】 入力音声を適当な時間間隔毎に特徴パラメー
タ列に変換する音響分析部1と、該による分析結果とあ
らかじめ登録した単語との照合を行う単語照合処理部2
〜6と、該から時間の累積尤度を受取り、最も良好な累
積照合結果を与える単語を保持する文法状態処理部7〜
10と、かつ単語列を決定し認識結果として出力するバ
ックトラック処理部11とからなり単語関係表を用い予
測単語を生成する単語予測部13を設け、予測された単
語のみにより構成される文のみを認識候補とし文法状態
処理部へ送出される予測単語通過スイッチ14〜16を
設け、単語予測結果に応じスイッチ操作を行ない、予測
された単語のみにより構成される文のみを認識候補とす
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は連続に発声された音声の
認識方法に関し、特に音声を用いて機械との対話を行な
う質問応答装置のための音声認識方法及び当該方法を用
いた装置に関する。
【0002】
【従来の技術】連続に発声された音声の認識は、先ず与
えられた文法拘束を満たす任意の単語列の標準パタンを
単語標準パタンの連結により作成し、次いでこれと入力
音声との照合を行ない、最も照合結果の良好な単語列を
認識結果として出力する方法が一般的に用いられてい
る。ここで文法拘束とは、認識可能な単語の組と、各々
の単語が入力文において出現可能な位置とを規定するも
のである。
【0003】また、文法拘束を満たす全ての単語列に関
し単語標準パタンを連結した文標準パタンを予め作成し
保持するのではなく、異なる文に出現する共通の単語部
分を単一の単語パタンを用いて照合する、One Pass 法
が計算効率の高い方法として知られている。
【0004】ここでは図3に示すようなオートマトンの
形式で与えられた文法拘束の下で、One Pass 法により
従来の連続音声認識を行なう方法を用いた図4に示す連
続音声認識装置を説明する。
【0005】図4において、1は音響分析部、2,3,
4,5,6はそれぞれ単語「右」、「左」、「へ」、
「進め」、「回れ」と音響分析部1からの入力音声の音
響分析結果との照合を行なう単語照合処理部である。こ
こでは、単語照合処理部2では「右」、単語照合処理部
3では「左」、単語照合処理部4では「へ」、単語照合
処理部5では「進め」、単語照合処理部6では「回れ」
とした。また、7,8,9,10は、図3のオートマト
ンにおける状態A,B,C,Dの処理を行なう文法状態
処理部である。さらに、11はバックトラック処理部で
あり、12はタイマである。
【0006】次に、従来の連続音声認識装置の動作につ
いて説明すると、先ず入力音声は音響分析部1において
適当な時間間隔毎に特徴パラメータ列に変換され、各単
語照合処理部2,3,4,5,6に送られる。それぞれ
の単語照合処理部2,3,4,5,6では、それぞれの
文法状態処理部7,8,9,10から当該時間における
累積照合結果を受取り、これを初期値として入力音声と
標準パタンとの照合を行なう。文法状態処理部7,8,
9,10では、文法拘束により接続された前段の単語照
合処理部2,3,4,5,6から各時点における累積尤
度を受取り、最も良好な累積照合結果を与える単語パタ
ンの、単語番号と当該単語の照合開始時間を保持すると
共に、最も良好な累積照合結果を後段に接続された全て
の単語照合処理部に送る。入力音声の終端に至るまでこ
の処理を繰り返した後、バックトラック処理部11にお
いて、最も良好な累積照合結果を与える単語列を決定し
認識結果として出力する。よって、連続に発声された音
声の認識は与えられた文法拘束を満たす任意の単語列の
標準パタンを単語標準パタンの連結により作成され、文
法状態毎に最適な単語を決定することで、照合を効率的
に行なうことができる。
【0007】
【発明が解決しようとする課題】しかしながら、上記従
来の連続音声認識方法は、文法拘束に従い単語照合処理
部と文法状態処理部との接続が予め決定されているた
め、照合に要さない単語照合処理部は、文法状態処理部
との接続を要しないため人手で接続を切る等の変更方法
を取っていた。また、対話の進行状況に応じて認識対象
とする単語が限定されるものでも全ての文を認識候補と
して処理を行なうことになり、誤認識が多くなる。
【0008】例えば、音声認識装置が対話の音声を認識
する目的に使われる場合、入力音声が予測可能な場合(
例えば確認を求める質問に対する「はい」、「いいえ」
等)が多いにもかかわらず、予測された単語以外の単語
を認識候補から除外せずに認識を行なうことで、誤認識
の原因となる問題点があった。
【0009】本発明はこれらの問題点を解決するための
もので、単語照合処理部と文法状態処理部との間にスイ
ッチを設け、与えられた単語予測結果に応じてスイッチ
操作を行なうことで、単語照合処理部と文法状態処理部
との接続を人手で変更することなく、予測された単語の
みにより生成される文のみを認識候補とし得る。
【0010】
【課題を解決するための手段】本発明は前記問題点を解
決するために、入力音声を適当な時間間隔毎に特徴パラ
メータ列に変換する音響分析部と、該音響分析部による
音響分析結果とあらかじめ登録しておいた単語との照合
を行う単語照合処理部と、該単語照合処理部から前記時
間における累積尤度を受取り、最も良好な累積照合結果
を与える単語を保持する文法状態処理部と、最も良好な
累積照合結果を与える単語列を決定し認識結果として出
力するバックトラック処理部とからなる連続音声認識装
置において、単語関係表を用いて実際の単語を変換して
予測単語を生成し、かつ該予測単語を音声認識における
語彙とし、該予測単語に基づいて予測された単語か否か
を判断する単語予測部を設け、さらに該単語予測部より
与えられた単語予測結果に応じてスイッチ操作を行な
い、予測された単語のみにより構成される文のみを認識
候補とし前記文法状態処理部へ送出される予測単語通過
スイッチを、前記単語照合処理部と前記文法状態処理部
との間に設けたことに特徴がある。
【0011】
【作用】以上のような構成を有する本発明によれば、複
数の単語間の接続可能性を規定する文法拘束に基づき、
連続音声を認識する音声認識方法において、予測された
単語のみ左右の端子の接続を行ない、その他の単語には
保持された非常に小さな累積対数尤度αを与える。累積
対数尤度αとは、数値ゼロを最大とする負の数値で、量
子化された非常に小さな負の値が設定されているもので
ある。これにより予測単語以外の単語を経由した累積対
数尤度は低い値に抑えられ、当該単語は認識候補として
無視し除外される。
【0012】このように単語予測結果に応じてスイッチ
操作を行なうことで、予測された一部の単語の組み合わ
せにより生成される文のみを認識候補とし、対話の進行
状況に応じて認識対象とする単語が限定されるもので
も、全ての文を認識候補として処理を行なうことにな
く、予測された単語以外の単語を認識候補から除外せず
に認識を行なうことができる。
【0013】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明の一実施例の構成を示しブロック図
である。同図において、1から12は前記従来方法の図
4と同様の処理を行う構成要素であり、異なる構成要素
として、13は単語予測部、14、15、16は予測単
語通過スイッチである。
【0014】入力音声は音響分析部1において適当な時
間間隔毎に特徴パラメータx に変換され、それぞれの単
語照合処理部2,3,4,5,6に送られる(1a)。単語
照合処理の動作を説明するために、単語照合処理部2の
構成を図5に示す。同図において、標準パタン格納部4
1では、N状態からなるマルコフモデルB, F,
【0015】
【数1】
【0016】,aijを保持しており、これらは予め学習用
音声を用いて作成する。ここでBは初期マルコフ状態の
集合、Fは最終マルコフ状態の集合、
【0017】
【数2】
【0018】は状態iにおいて信号
【0019】
【外1】
【0020】を出力する確率、aij は状態iから状態j
に遷移する確率、Piは状態尤度、τiは状態iのバック
ポインタをそれぞれ表している。
【0021】状態保持部43では、i番目のマルコフ状
態における累積対数尤度Piと当該累積対数尤度を与える
照合開始時間τを保持している。照合計算部42では、
文法状態処理部7から送られる当該文法状態までの最大
累積尤度Pb(7a)と状態保持部43に保持されているマル
コフ状態のうち初期状態となる状態の累積尤度Piとを比
較し、Pbの方が大きければPiをPbで置き換え、τを現在
時刻tで置き換える。現在の時刻tはタイマ12から供
給(12a) される。
【0022】次に、次式(1) 〜 (3)に従い状態Pi、τを
更新し結果を状態保持部43で保持する。
【0023】
【数3】
【0024】(式(1),(2) )における
【0025】
【外2】
【0026】は、入力音声の音響分析結果であり音響分
析部1より供給される。式(2),(3) におけるrは、状態
iに遷移可能な状態の中で、最も高い累積対数尤度をあ
たえる状態である。
【0027】最後に、マルコフ状態のうち最終状態とな
る状態で最も高い累積対数尤度を保持する状態mについ
て、当該単語に至る累積対数尤度(Pm)と当該単語の照合
開始時間τm を求め、予測単語通過スイッチ14にPm(2
a)を、文法状態処理部8にτ(2b)を送る。
【0028】次に、予測単語通過スイッチ14の構成を
図2に示す。同図からわかるように、単語予測部13に
より予測された単語(13a) のみ単語照合処理部3と文法
状態処理部8の端子接続を行ない(ON)、その他の単語等
には保持された非常に小さな累積対数尤度αを与える(O
FF) 。これにより予測単語以外の単語を経由した累積対
数尤度は低い値に抑えられ、認識候補から除外される。
対話の進行状況に応じて認識対象とする単語が限定され
るものでも全ての文を認識候補として処理を行なうこと
もなく、例えば確認を求める質問に対する「はい」、
「いいえ」等が多い場合にも予測された単語以外の単語
を認識候補から除外せずに認識を行なうことができる。
接続された単語は予測単語通過スイッチ14を経由して
文法状態処理部8に送られる(14b) 。
【0029】なお上記の単語予測部13は、特願平3−
268521号(発明者:野垣内氏、高橋氏)明細書に
記載の単語予測機能付き対話理解装置で、実際の単語予
測を行い音声認識装置の語彙とすることにより、音声認
識装置および構文・意味解析装置の計算領域縮小および
計算時間の縮小を目的とし、プラン認識部でプランおよ
び知識記憶部を用いて、次に動作されるべきプランを収
集し、これを予想プランとし、この予想プランを予測部
ではプラン単語関係表を用いて、実際の単語に変換して
予想単語とし、この予想単語を音声認識装置の語彙とす
ることにより、音声認識装置における語彙数とするもの
である。
【0030】次に、文法状態処理部の説明をするため
に、図6に文法状態処理部8の構成例を示す。最大照合
結果選択部101では予測単語通過スイッチ14を経て
単語毎に送られる累積対数尤度(2a 、3a) の最大値Pm
求め、対応する単語番号m、当該単語の照合開始時間(2
b 、3b) τm とをバックポインタ格納部102に送る。
さらにPmを接続された全ての単語照合処理部に送る(8
a)。
【0031】バックポインタ格納部102は、最大累積
対数尤度を与える単語の番号mと当該単語の照合開始時
間τm とを現在の時刻tと対応させ、各々をw(t)、τ
(t) として保持する(8b)。現在の時間tはタイマ12か
ら供給される(12a) 。
【0032】入力音声区間全てにわたり、それぞれの単
語照合処理部および文法状態処理部の処理が終了した時
点で、バックトラック処理部11では、それぞれの文法
状態処理部に格納されたバックポインタを用いて、最も
高い累積尤度を与える単語列wiを計算し、認識結果とす
る。
【0033】
【発明の効果】以上説明したように、本発明の連続音声
認識方法によれば、単語照合処理部と文法状態処理部と
の接続を変更することなく、予測された単語以外の単語
を含む文を認識対象から除外することで、誤認識を抑え
る効果を有する。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示すブロック図であ
る。
【図2】図1の予測単語通過スイッチの構成を示す図で
ある。
【図3】オートマトンにおける文法状態を示す図であ
る。
【図4】従来の連続音声認識装置の構成を示すブロック
図である。
【図5】単語照合処理部の構成を示すブロック図であ
る。
【図6】文法状態処理部の構成を示すブロック図であ
る。
【符号の説明】
1 音響分析部 2 タイマ 3〜6 単語照合処理部 7〜10 文法状態処理部 11 バックトラック処理部 12 タイマ 13 単語予測部 14、15、16 予測単語通過スイッチ 41 標準パタン格納部 42 照合計算部 43 状態保持部 101 最大累積尤度判定処理部 102 バックポインタ格納部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 庄境 誠 神奈川県厚木市棚沢221番地旭化成工業株 式会社内 (72)発明者 尾和 邦彦 神奈川県厚木市棚沢221番地旭化成工業株 式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 複数の単語間の接続可能性を規定する文
    法拘束に基づき、連続音声を認識する音声認識方法にお
    いて、 文法拘束を構成する単語群のうち、予測された単語以外
    の単語には累積対数尤度を付与して当該予測以外の単語
    を認識候補から除外し、予測された単語には予測された
    一部の単語の組み合わせにより生成される文のみを認識
    候補とすることを特徴とする連続音声認識方法。
  2. 【請求項2】 入力音声を適当な時間間隔毎に特徴パラ
    メータ列に変換する音響分析部と、該音響分析部による
    音響分析結果とあらかじめ登録しておいた単語との照合
    を行う単語照合処理部と、該単語照合処理部から前記時
    間における累積尤度を受取り、最も良好な累積照合結果
    を与える単語を保持する文法状態処理部と、最も良好な
    累積照合結果を与える単語列を決定し認識結果として出
    力するバックトラック処理部とからなる連続音声認識装
    置において、 単語関係表を用いて実際の単語を変換して予測単語を生
    成し、かつ該予測単語を音声認識における語彙とし、該
    予測単語に基づいて予測された単語か否かを判断する単
    語予測部を設け、 さらに該単語予測部より与えられた単語予測結果に応じ
    てスイッチ操作を行ない、予測された単語のみにより構
    成される文のみを認識候補とし前記文法状態処理部へ送
    出される予測単語通過スイッチを、前記単語照合処理部
    と前記文法状態処理部との間に設けることを特徴とする
    連続音声認識装置
JP4352442A 1992-12-11 1992-12-11 連続音声認識方法および該方法を用いた装置 Pending JPH06180593A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4352442A JPH06180593A (ja) 1992-12-11 1992-12-11 連続音声認識方法および該方法を用いた装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4352442A JPH06180593A (ja) 1992-12-11 1992-12-11 連続音声認識方法および該方法を用いた装置

Publications (1)

Publication Number Publication Date
JPH06180593A true JPH06180593A (ja) 1994-06-28

Family

ID=18424109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4352442A Pending JPH06180593A (ja) 1992-12-11 1992-12-11 連続音声認識方法および該方法を用いた装置

Country Status (1)

Country Link
JP (1) JPH06180593A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073074A (ja) * 2000-08-31 2002-03-12 Pioneer Electronic Corp 音声による数字列認識方法ならびに装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04122998A (ja) * 1990-09-13 1992-04-23 Nec Corp 音声理解方式
JPH04195100A (ja) * 1990-11-28 1992-07-15 Nec Corp 連続音声認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04122998A (ja) * 1990-09-13 1992-04-23 Nec Corp 音声理解方式
JPH04195100A (ja) * 1990-11-28 1992-07-15 Nec Corp 連続音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073074A (ja) * 2000-08-31 2002-03-12 Pioneer Electronic Corp 音声による数字列認識方法ならびに装置

Similar Documents

Publication Publication Date Title
JP3454897B2 (ja) 音声対話システム
JP2000122691A (ja) 綴り字読み式音声発話の自動認識方法
JP2815579B2 (ja) 音声認識における単語候補削減装置
WO2006054724A1 (ja) 音声認識装置及び方法ならびにプログラム
JPH0423799B2 (ja)
JP2001005488A (ja) 音声対話システム
JP2002215187A (ja) 音声認識方法及びその装置
JP2000200273A (ja) 発話意図認識装置
JP2000099087A (ja) 言語音声モデルを適応させる方法及び音声認識システム
JP4661239B2 (ja) 音声対話装置及び音声対話方法
JPH06180593A (ja) 連続音声認識方法および該方法を用いた装置
JP4094255B2 (ja) コマンド入力機能つきディクテーション装置
JP3104900B2 (ja) 音声認識方法
JPH09134191A (ja) 音声認識装置
JPH07104786A (ja) 音声対話システム
JP3873418B2 (ja) 音声スポッティング装置
JP4236502B2 (ja) 音声認識装置
JPH1097275A (ja) 大語彙音声認識装置
JPH08190470A (ja) 情報提供端末
JP2731133B2 (ja) 連続音声認識装置
JP3357752B2 (ja) パターンマッチング装置
JPH10198392A (ja) 音声認識方法
JP3100208B2 (ja) 音声認識装置
JPH09212190A (ja) 音声認識装置及び文認識装置
JP2002341891A (ja) 音声認識装置および音声認識方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19971104