JP2000250585A - 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 - Google Patents

対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体

Info

Publication number
JP2000250585A
JP2000250585A JP11048167A JP4816799A JP2000250585A JP 2000250585 A JP2000250585 A JP 2000250585A JP 11048167 A JP11048167 A JP 11048167A JP 4816799 A JP4816799 A JP 4816799A JP 2000250585 A JP2000250585 A JP 2000250585A
Authority
JP
Japan
Prior art keywords
search key
voice
recognition
likelihood
related information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11048167A
Other languages
English (en)
Other versions
JP3420965B2 (ja
Inventor
Kumiko Omori
久美子 大森
Masanobu Higashida
正信 東田
Noriko Mizusawa
紀子 水澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04816799A priority Critical patent/JP3420965B2/ja
Publication of JP2000250585A publication Critical patent/JP2000250585A/ja
Application granted granted Critical
Publication of JP3420965B2 publication Critical patent/JP3420965B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 音声検索キーの認識尤度を等価的に高める。 【解決手段】 音声検索キーを音声認識処理により検索
データベースの各検索キーに対する尤度(検索キー認識
尤度)を求め(S2)しきい値以上の尤度のものが所定
数以下であればそのしきい値以上のものについて、正誤
性を問う、検索キー確定質問を音声で提示し(S5)、
しきい値以上のものが所定数以上、またはゼロの場合
は、音声検索キーの属性(例えば検索キーが市町村名に
対しその属性として都道府県名)を関連情報として保持
する関連情報データベースをもとに検索キー確定関連質
問を音声で提示し(S9)、その応答に対し、音声認識
処理により関連情報とその認識尤度(関連情報認識尤
度)を求め、関連情報データベースにもとづき、検索キ
ー認識尤度と関連情報認識尤度を統合し(S11)、統
合した認識尤度のしきい値以上のものについて正誤性を
問う質問をする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声による対話
を用いて、ユーザが要求するタスクの達成を目的とする
装置に属するものであり、この発明では、ユーザが入力
するキーの検索をタスクとする。この発明は、ユーザが
音声を用いて入力する検索キーを、音声による対話誘導
を用いて同定することを目的とする対話型検索方法及び
装置に関するものである。
【0002】
【従来の技術】従来の対話型検索システムは、ユーザが
入力する音声検索キーに対して音声認識処理を行い、音
声検索キーが同定できるまで、音声認識装置が計算する
認識尤度の高い順に、ユーザに対して検索キーの提示を
繰り返し行うことにより、音声検索キーを同定してい
た。
【0003】
【発明が解決しようとする課題】機械による音声認識処
理では、特に、不特定話者の音声、話速が一定でない発
話に対する音声は認識が困難であり、さらに周囲の雑音
などによる音質の劣化が原因となり、100%の音声認
識精度が得られないことから、ユーザが音声により入力
した音声検索キーを、音声認識処理のみを用いて瞬時に
同定することは困難である。この点から、ユーザから要
求されるタスクを、可能な限り迅速に達成することを前
提とする対話型検索システムにおいて、ユーザとの間に
システムの音声認識精度の欠陥を感じさせない自然な対
話を実現することは困難である。
【0004】この発明は、音声認識精度の欠陥を補い、
ユーザと検索システム間の自然性及び迅速なタスク達成
を重視した対話を実現する対話型データベース検索方法
を提供することを目的とする。
【0005】
【課題を解決するための手段】この発明によれば、検索
データベース内の検索キー候補となるすべてのデータに
対して、各データが有する属性項目に関する属性情報
を、関連情報として付与した検索キー確定関連情報デー
タベースを基に、検索キー確定のための関連質問をユー
ザに対して提示することで、ユーザが入力した音声検索
キーの同定を実現する。
【0006】つまりこの発明による、検索データベース
に対し、音声認識装置を利用して、ユーザが音声を用い
て入力する音声検索キーの同定を行う対話型データベー
ス検索方法によれば、ユーザが入力した音声検索キーに
対して音声認識処理を行う際、検索データベースに付与
されている音声認識装置は、考えられるすべての音声検
索キー候補に対して検索キー認識尤度を計算し、音声認
識結果テーブルを作成し、対話型データベース検索装置
があらかじめ定めた検索キー認識尤度に対する尤度しき
い値を基に、規定尤度しきい値以上の検索キー認識尤度
を持つ音声検索キーの候補が規定された少数、例えば
2,3程度の場合、対話型データベース検索装置は、尤
度しきい値を越える検索キー認識尤度を持つ音声検索キ
ー候補それぞれについての正誤性を問う検索キー確定質
問を、ユーザに対して音声を用いて提示し、音声検索キ
ーの同定を行い、規定尤度しきい値以上の、検索キー認
識尤度を持つ音声検索キー候補が、対話型データベース
検索装置が次の対話誘導のために規定した数、つまり前
記規定された少数よりも多く出力された場合、或いは、
規定尤度しきい値以上の、検索キー認識尤度を持つ音声
検索キー候補が存在しない場合、或いは、前述の検索キ
ー確定質問により提示した音声検索キー候補が、音声検
索キーに該当しないとユーザから否定された場合、対話
型データベース検索装置は、音声検索キーが有する属性
項目の属性値を関連情報として付与した検索キー確定関
連情報データベースを基にして、検索キー確定関連質問
を、ユーザに対して音声を用いて提示し、この検索キー
確定関連質問に対するユーザからの応答に対して、再
び、音声認識装置を用いて関連情報とその関連情報認識
尤度を計算した関連情報テーブルを作成し、前述の検索
キー認識尤度と関連情報認識尤度を、検索キー確定関連
情報データベースを用いて統合し、音声検索キーと検索
キー確定関連質問から得られる関連情報との関連性を計
算することにより、検索キー認識尤度及び関連情報認識
尤度の両認識尤度の精度を高めて、音声検索キーの同定
を行うことを特徴とする。
【0007】この発明において、検索キー候補の中から
正しい検索キーを同定するために、ユーザに対して、検
索キー確定関連質問を提示する際に使用する、検索キー
確定関連情報データベースは、検索の対象となる、音声
検索キーを含む検索データベース内のすべてのデータに
対して、各データが有する属性項目の属性値関連情報と
して付与することにより作成する。
【0008】また、この発明による対話型データベース
検索装置が用いる音声検索キー確定方法は、ユーザが入
力した音声検索キーに対する音声認識の精度の欠陥を、
検索キー認識尤度、及び検索キー確定関連質問に対する
ユーザからの応答に対して計算される関連情報認識尤度
を、検索キー確定関連情報データベースを基に統合し、
両者の関連性を計算して両認識尤度の精度を高めること
により補うことで、音声検索キーの同定を実現すること
を特徴とする。
【0009】
【作用】ユーザから入力される、検索対象となる音声検
索キーをすべて含む検索データベースに対して、音声検
索キーの同定を目的とする対話型データベース検索装置
において、この発明は、ユーザが入力した音声検索キー
に対して、音声認識装置を用いて検索キー認識尤度を計
算し、検索キー認識尤度を利用して音声検索キーの同定
を実現する。
【0010】対話型データベース検索装置は、あらかじ
め検索キー認識尤度に対して尤度しきい値を定めてお
く。ユーザが入力した音声検索キーに対して、音声認識
処理を行った結果、規定尤度しきい値を越える検索キー
認識尤度を持つ音声検索キー候補が所定数以上でなく、
かつ0でない場合は、尤度しきい値以上の検索キー認識
尤度を持つすべての音声検索キー候補についての正誤性
を問う検索キー確定質問を、ユーザに対して提示するこ
とで、音声検索キーの同定を実現する。
【0011】一方、音声検索キーに対する音声認識処理
の結果、規定尤度しきい値を越える検索キー認識尤度を
持つ音声検索キー候補が、対話型データベース検索装置
が次の対話誘導のために規定した数(前記所定数)より
も多く出力された場合、或いは、規定尤度しきい値を越
える検索キー認識尤度を持つ音声検索キー候補が存在し
ない場合、或いは、前述の検索キー確定質問により提示
した音声検索キー候補が誤認識であり、ユーザからすべ
て否定された場合、音声検索キーが有する属性項目に関
する属性値を関連情報として付与した、検索キー確定関
連情報データベースを基に、音声検索キーの同定につな
がる検索キー確定関連質問を、ユーザに対して音声を用
いて提示し、ユーザからの検索キー確定関連質問の応答
に対して、再び、音声認識処理を行い、関連情報認識尤
度を計算して、検索キー認識尤度及び関連情報認識尤度
の両認識尤度を、検索キー確定関連情報データベースを
用いて統合することで、ユーザが入力した音声検索キー
に対する音声認識精度の欠陥を補い、自然な対話誘導、
及び可能な限り迅速な音声検索キーの確定を行うこと
で、仮想的に、高精度な音声認識処理機能付き対話型デ
ータベース検索装置の実現につながる。
【0012】
【発明の実施の形態】図1は、この発明による対話型デ
ータベース検索装置の実施形態の一例を示すブロック図
である。この対話型データベース検索装置1は、音声入
力部2、音声識別部3、対話制御部4、音声検索キー関
連性計算部5、音声出力部6から構成される。音声識別
部3は音声認識部3−1、音声認識結果出力部3−2か
ら構成される。対話制御部4は結果調整部4−1、対話
誘導部4−2、応答文/質問文作成部4−3から構成さ
れる。音声識別部3では音声認識装置8を、音声出力部
6では音声出力装置9を使用する。また、音声識別部3
における入力音声に対する音声認識、及び対話制御部4
の対話誘導部4−2における次の対話誘導の際、音声認
識用データベース7を使用する。
【0013】音声認識用データベース7は、ユーザが入
力する、検索対象となる音声検索キーをすべて含む検索
データベース7−1、検索データベース7−1中の各検
索キー候補が有する属性項目の属性値を、各検索キー候
補に対して記した検索キー確定関連情報データベース7
−2、Yes/Noの認識データベース7−3から構成
される。
【0014】音声入力部2は、ユーザから入力された音
声を音声識別部3に対して入力する。音声識別部3で
は、まず始めに音声認識部3−1が、音声入力部2によ
り入力された音声に対して音声認識装置8を用いて音声
認識処理を行う。その際、音声認識装置8は、入力され
た音声に応じて音声認識用データベース7を参照する。
すなわち、ユーザが音声検索キーを入力した場合は、検
索データベース7−1、検索キー確定関連質問に対する
応答を入力した場合は、検索キー確定関連情報データベ
ース7−2、音声検索キー候補を提示して、該当する入
力音声検索キーであるかどうかの確認を行う、音声検索
キー確定質問に対する返答に対してはYes/Noの認
識データベース7−3、をそれぞれ参照する。そして、
音声認識結果出力部3−2は、図3に一例を示すよう
に、入力音声に対する音声認識処理の結果、すなわち入
力音声として考えられるすべての候補に対して、認識尤
度を付与して認識尤度の高い順にならべた音声認識結果
テーブルを作成し、対話制御部4へ認識結果を送る。
【0015】対話制御部4では、音声識別部3の音声認
識結果出力部3−2から送られる認識尤度順に並べられ
た認識結果に応じて、対話型データベース検索装置1
が、ユーザに対して次に行うべき対話の誘導を行う。ま
ず始めに、音声認識結果出力部3−2によって出力され
た認識結果は、対話制御部4の結果調整部4−1へと送
られる。結果調整部4−1では、ユーザが入力した音声
検索キーに対する認識結果に対しては、規定尤度しきい
値と各音声検索キーの持つ検索キー認識尤度との比較を
行い、以下のような処理を行う。
【0016】規定尤度しきい値を超える検索キー認識尤
度を持つ音声検索キー候補が、対話型データベース検索
装置1による規定数(例えば1,2、多くても3程度)
よりも少ない場合は、対話誘導部4−2によって、規定
尤度しきい値を超える検索キー認識尤度を持つ音声検索
キー候補の提示を行うことを決定し、応答文/質問文作
成部4−3によって、各音声検索キーが該当候補である
かどうかをユーザに確認する検索キー確定質問の作成を
行う。
【0017】規定尤度しきい値を超える検索キー認識尤
度を持つ音声検索キー候補が、規定数よりも多い場合、
或いは、存在しない場合は、対話誘導部4−2は、ユー
ザに対して、検索キー同定につながる検索キー確定関連
質問を行うことを決定し、音声認識用データベース7中
の各検索キー候補の有する属性項目の属性値を記した検
索キー確定関連情報データベース7−2(図4参照)を
参照し、その結果、応答文/質問文作成部4−3によっ
て、検索キー確定関連質問が作成される。
【0018】そして、作成したそれぞれの応答文/質問
文を、ユーザに対して音声出力装置9を用いて、音声出
力部6から出力し、ユーザの応答を音声入力部2から得
る。音声入力部2から得られた、それぞれの応答文/質
問文に対するユーザの応答に対して、音声識別部3にお
いて音声認識処理を行い結果を出力する。音声認識結果
出力部3−2は、音声入力部2から送られてくるユーザ
の応答が、検索キー確定関連質問に対する応答である場
合、音声認識部3−1で音声認識処理をした結果を、関
連情報認識尤度の高い順に並べた関連情報テーブルを作
成する(図5参照)。
【0019】音声認識結果出力部3−2から、検索キー
確定関連質問に対するユーザの応答に対する音声認識結
果(関連情報テーブル)が送られた場合は、結果調整部
4−1は、音声検索キー関連性計算部5にアクセスをし
て、既に得られている音声検索キーに対する検索キー認
識尤度と、検索キー確定関連質問の応答に対する関連情
報認識尤度の正規化及び統合を、検索キー確定関連情報
データベース7−2(図4参照)を用いて行う。そし
て、その統合にもとづき検索キーの候補を選択し、応答
文/質問文作成部4−3において、ユーザに対して、選
択した候補が該当候補であるかどうかの確認を行う質問
文の作成を行う。
【0020】音声認識結果出力部3−2から送られてく
る認識結果が、同定した音声検索キーが該当候補である
かどうかの確認を行う、検索キー確定質問に対する応答
である場合、結果調整部4−1は応答が「Yes」の場
合は、音声検索キーが確定できたことを知らせる応答文
を作成することを対話誘導部4−2に指示して、応答文
/質問文作成部4−3において、実際に応答文作成を行
う。逆に、提示した検索キーが該当候補ではないと、ユ
ーザから否定された場合、すなわち、検索キー確定質問
に対して、結果調整部4−1が「No」という応答を得
た場合、さらなる対話誘導として、結果調整部4−1か
らの指示により対話誘導部4−2は、検索キー確定関連
質問を行うことを決定し、検索キー確定関連情報データ
ベースを参照して検索キー確定関連質問として、何をユ
ーザに尋ねるべきかを判断し、実際に応答文/質問文作
成部4−3において検索キー確定関連質問の作成を行
う。
【0021】音声出力部6では、対話制御部4の応答文
/質問文作成部4−3において作成された、応答文及び
質問文の出力を、音声出力装置9を用いて、ユーザに対
して提示する。図2は、この発明の動作例の概略手順を
示したものである。音声検索キー候補を選択したら、再
びS5の処理へ戻り、ユーザに対する音声検索キー候補
の提示を行うことを対話誘導部4−2は決定する。そし
て、質問文/応答文作成部4−3において、音声検索キ
ー候補の提示を行う応答文が作成され、ユーザに再び提
示し、音声入力部2、音声識別部3によってユーザから
のYes/Noの応答を得ることで音声検索キーの同定
が実現する。
【0022】
【実施例】以下、図2の概略流れ図を用いて、この発明
の音声検索キー確定手法を用いた音声対話型データベー
ス検索手法を、住所検索(市区町村検索)システムに適
用した場合の具体例を用いて説明する。ここでは、あら
かじめシステムが規定する尤度しきい値を0.80、ユ
ーザが入力し音声検索キーに対する音声認識処理の出力
結果に対して、規定尤度しきい値0.80を越える認識
尤度を持つ検索キー候補がいくつ以下の場合にユーザに
対して検索キー確定質問を行い、いくつ以上の場合に検
索キー確定関連質問によって関連情報による検索キー同
定を行うかという、システムが対話誘導のために規定す
る、規定尤度しきい値以上の候補数のしきい値を3とす
る。
【0023】以下、図2を用いて、住所検索システムに
おいて、ユーザから音声により入力される「横川市」と
いう住所を確定する流れを説明する。住所検索システム
においては、検索データベース7−1として、図6に示
すように日本全国の4000市区町村がデータとして保
持されたデータベースを利用する。S1で、ユーザが入
力した「横川市」という音声検索キーが入力される。S
1は図1における音声入力部2の動作に相当する。
【0024】S2において、S1で送られてきた入力検
索キーに対して、検索データベース7−1を用いて音声
認識処理が行われる。S2は、音声識別部3の音声認識
部3−1の動作に相当する。S3において、図7に示す
ように、検索データベース7−1内のデータを、S2に
おける音声認識結果をもとに、音声認識結果の検索キー
認識尤度の高い順に整列することにより、音声認識結果
テーブルが作成される。S3は、音声識別部3の音声認
識結果出力部3−2の動作に相当する。
【0025】S4において、図7に示した音声認識結果
テーブル中の音声検索キー候補に対して、あらかじめ定
めた尤度しきい値を越える検索キー認識尤度を持つ音声
検索キーを候補として選択する。図7において、尤度し
きい値0.80を超える検索キー認識尤度を持つ「横浜
市」「横倉市」「横山市」「横須賀市」「横川市」の5
候補が音声検索キー候補として選択される。S4は、対
話制御部4の結果調整部4−1の動作に相当する。
【0026】S7では、規定尤度しきい値を越える検索
キー認識尤度を持つ音声検索キー候補が規定数である3
以上存在するため、どれが正解の音声検索キーであるの
かを判定することが出来ない状態となるため、検索キー
同定につながる属性を関連情報として獲得することを決
定する。図8に示すように、検索キー確定関連情報デー
タベース7−2には、検索データベース7−1の各デー
タ(市名)に対して、各データが有する属性項目の属性
値として、それぞれの市が所属している都道府県名を関
連情報として付与してある。S7は、対話制御部4の結
果調整部4−1、実際に関連情報を獲得するための対話
誘導を行うことを決定する対話誘導部4−2の動作に相
当する。
【0027】S8では、S7で得られた情報を基に、音
声検索キーの同定につながる関連質問として、音声検索
キーとなっている市の所属する都道府県名を利用するこ
とにより、音声検索キーの同定を行うことができるとい
う考えから、検索キー確定関連質問を作成する。ここ
で、他の関連属性が複数存在する場合は、音声検索キー
に対する音声認識結果テーブルの内容と属性の関係を見
て、最も効率よく検索キーの絞込みを行うことができる
と考えられる属性を選択するようにする。S8は、対話
誘導部4の応答文/質問文作成部4−3の動作に相当す
る。
【0028】S9は音声出力部6の動作に相当し、S8
において作成された、「その市が所属する都道府県名を
お答えください」という検索キー確定関連質問を、音声
出力装置9を用いてユーザに提示する。ユーザは「群馬
県」と入力する。S10では、S9において音声出力し
た都道府県名を尋ねる関連質問に対するユーザの応答で
ある「群馬県」に対して、音声認識装置8を用いて、検
索キー確定関連情報データベース7−2を照合すること
により、47都道府県に対する音声認識結果が出力され
る。認識結果として、関連情報認識尤度を計算して、図
9に示すように、都道府県名(関連情報認識候補)と関
連情報認識尤度の組を1レコードとして蓄積した関連情
報テーブルが作成される。このS10の動作は、図1に
おいては再び、音声入力部2及び音声識別部3の動作に
相当する。
【0029】S11では、S10において作成された、
図9に示した関連情報テーブル内の各都道府県名の関連
情報認識尤度と、S3において作成された音声認識結果
テーブル中の音声検索キー候補である「横浜市」「横倉
市」「横山市」「横須賀市」「横川市」の検索キー認識
尤度とをそれぞれ正規化し、検索キー確定関連情報デー
タベース7−2を用いて統合することで音声検索キー候
補の同定を行う。すなわち、まず始めに、図7の音声認
識結果テーブルにおける検索キー認識尤度を図7の最右
欄のように合計が1となるように正規化する。そして、
図7の音声認識結果テーブルの検索キー認識尤度が尤度
しきい値0.80を超えなかった5つの音声検索キー候
補に対して、検索キー関連情報データベース7−2を用
いて、「神奈川県横浜市」「長野県横倉市」「三重県横
山市」「神奈川県横須賀市」「群馬県横川市」という所
属する都道府県名の情報を、関連情報データベース7−
2から関連情報として取得する。そして、図9に示した
関連情報テーブル内の各都道府県に対しても関連情報認
識尤度を最右欄のように合計が1となるように正規化
し、今、音声検索キー候補となっている「横浜市」「横
倉市」「横山市」「横須賀市」「横川市」の所属都道府
県に該当する場合は、関連情報テーブル内の各都道府県
の正規化した関連情報認識尤度を、音声認識結果テーブ
ル内の「横浜市」「横倉市」「横山市」「横須賀市」
「横川市」の正規化した検索キー認識尤度とかけあわ
せ、「横浜市」「横倉市」「横山市」「横須賀市」「横
川市」の新たな認識尤度とする。
【0030】つまり、音声検索キー候補である音声認識
結果テーブル内の横浜市と、関連情報テーブル内の都道
府県の関連性、同様に、横倉市、横山市、横須賀市、横
川市と関連情報テーブル内の都道府県の関連性を、音声
検索キー候補である各市に対して、「横浜市」「横倉
市」「横山市」「横須賀市」「横川市」の正規化した検
索キー認識尤度と、各市が所属する都道府県の正規化し
た関連情報認識尤度の積を計算することにより、検索キ
ー認識尤度と関連情報認識尤度とを統合して、新たな認
識尤度と定める。この場合、図10に示したように、
「横浜市」の正規化認識尤度が0.154であり、「横
浜市」の所属都道府県である「神奈川県」の関連情報テ
ーブル内の正規化した関連情報認識尤度は0.120で
あることから、「横浜市」の新たな認識尤度は0.15
4×0.120で0.0185、同様に「横倉市」の新
たな認識尤度は「長野県」の正規化した関連情報認識尤
度との積をとり0.0145、「横須賀市」の新たな認
識尤度は「神奈川県」の正規化した関連情報認識尤度と
の積をとり0.0166、「横山市」の新たな認識尤度
は「三重県」の正規化した関連情報認識尤度との積をと
り0.0158、そして、「横川市」の所属都道府県は
「群馬県」であることから、「横川市」の正規化した検
索キー認識尤度0.131と「群馬県」の正規化した関
連情報認識尤度0.0179の積0.0235を、新た
な「横川市」の認識尤度のように定め、新たな認識尤度
が新たに定める規定値を超えるものがあれば、その候補
数に応じて、ユーザとのやりとりを行う。ここでは規定
値を0.0200と定めると、図10に示した認識尤度
の計算結果から、統合した新たな認識尤度が0.020
0を超える候補は「群馬県横川市」の1候補しか挙がら
ないことから、「群馬県横川市」を音声検索キー候補に
同定する。このS11は、図1において対話制御部4の
結果調整部4−1の動作に相当する。
【0031】そして、音声検索キー候補を同定すること
ができたので、再び、S5の処理へ戻り、音声出力装置
9を用いて音声により「群馬県横川市ですか」とユーザ
にYes/No質問の提示をする。これは対話制御部4
の対話誘導部4−2の動作に相当する。そして、音声入
力部2及び音声識別部3の動作に相当する、S6におい
て、「Yes」というユーザからの応答を認識すること
で、音声検索キーが同定したことになる。
【0032】
【発明の効果】以上の説明からわかるように、従来、ユ
ーザとの対話を用いてユーザの要求するタスクの達成を
目的とするシステムにおいて音声を利用する場合、音声
認識精度が十分ではないことから、ユーザとシステム間
において自然な対話を実現することは困難であり、ユー
ザが要求するタスクを達成するのに、ユーザへの確認を
繰り返し行わなければならないなどの問題点があったの
に対して、この発明によれば、ユーザが入力した音声検
索キーに対する、音声認識処理の認識尤度にしきい値を
設けることで、信頼性の高い認識結果が少数の場合は、
それらをユーザに提示し確認をとる、また、信頼性の高
い認識結果が、システムが次の対話誘導のために規定し
た数よりも多い場合、或いは、信頼性の高い認識結果が
存在しない場合、或いは、第一の候補が該当検索キーで
はないとユーザから否定された場合は、検索キーが有す
る属性項目の属性値を関連情報として保持した検索キー
関連情報データベースを用いて、関連質問をし、関連質
問から得られる関連情報認識尤度と検索キー認識尤度と
の統合を図ることで、音声認識の欠陥を補い、ユーザと
システム間の自然な対話、及び迅速なタスク達成が可能
になる。
【0033】尚、例に挙げた住所検索システムの他に、
現在、音声認識処理を用いた対話誘導を利用せずに、オ
ペレータ対応でタスク達成を行っている。チケット予約
や切符予約における、座席の価格を属性として座席名を
同定する座席同定や、路線名を属性として駅名を同定す
る駅名検索に対しても、この発明は容易に拡張可能であ
ると考えられる。
【0034】さらに、検索キーが有する単一の属性から
は、検索キー同定が困難な人名検索などに関しては、住
所、性別、職業、年齢、電話番号などの複数の属性をあ
らかじめ関連情報として保持し、統合して利用すること
で、検索キーである人名の同定が可能になると考えられ
る。
【図面の簡単な説明】
【図1】この発明による対話型データベース検索装置の
実施形態の機能構成を示す図。
【図2】この発明による対話型データベース検索装置の
概略処理手順を示す流れ図。
【図3】音声検索キーに対する音声認識尤度を計算した
音声認識結果テーブルの一例を示す図。
【図4】この発明で利用する検索キー関連情報データベ
ースの一例を示す図。
【図5】検索キー確定関連質問に対するユーザの応答か
ら作成する関連情報テーブルの一例を示す図。
【図6】住所検索システムにおける検索データベースの
一例を示す図。
【図7】住所自動検索システムにおける音声認識結果テ
ーブルの一例を示す図。
【図8】住所検索システムにおける検索キー確定関連情
報データベースの一例を示す図。
【図9】住所検索システムにおける関連情報テーブルの
一例を示す図。
【図10】住所検索システムにおける音声認識結果テー
ブルと関連情報テーブルの尤度の統合を示す図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 水澤 紀子 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5B075 NK02 NK46 PP07 PP12 PP22 PQ04 5D015 AA02 BB01 LL03 LL04 LL12 9A001 BB04 FF03 HH15 HH17 JJ01 LL02

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 ユーザから音声を用いて入力される、検
    索の対象となる音声検索キーをすべて含んだ音声認識用
    検索データベースに対して、ユーザが入力する音声検索
    キーの確定を行う対話型データベース検索方法におい
    て、 音声認識装置を用いて、ユーザが入力した音声検索キー
    に対して音声認識処理を行い、音声検索キー候補と、そ
    の音声認識結果の尤度(以下、検索キー認識尤度と呼
    ぶ)を求め、 規定の尤度しきい値以上の検索キー認識尤度を持つ、音
    声検索キー候補が所定数以上でなく、かつ0でない場
    合、これら尤度しきい値を越える検索キー認識尤度を持
    つ音声検索キー候補それぞれについての正誤性を問う検
    索キー確定質問を、音声を用いてユーザに提示し、音声
    検索キーの同定を実現し、 1.規定の尤度しきい値以上の検索キー認識尤度を持つ
    音声検索キー候補が、上記所定数よりも多く出力された
    場合、 2.或いは、規定の尤度しきい値以上の検索キー認識尤
    度を持つ音声検索キー候補が存在しない場合、 3.或いは、前記検索キー確定質問により提示した音声
    検索キー候補が、入力した音声検索キーに該当しないと
    ユーザから否定された場合、 音声検索キーが有する属性項目の属性値を関連情報とし
    て保持した検索キー確定関連情報データベースを基に、
    関連情報に関連する検索キー確定関連質問を、音声を用
    いてユーザに提示し、 検索キー確定関連質問に対するユーザからの応答に対し
    て、再度、音声認識装置を用いて音声認識処理を行い、
    関連情報候補とその音声認識結果の尤度(以下、関連情
    報認識尤度と呼ぶ)を求め、 関連情報認識尤度と、前記検索キー認識尤度を、検索キ
    ー確定関連情報データベースを用いて統合して、音声検
    索キー候補と関連情報候補との関連性を計算することに
    より、ユーザが入力した音声検索キーの同定を実現する
    ことを特徴とする対話型データベース検索方法。
  2. 【請求項2】 前記請求項1の対話型データベース検索
    方法において、 前記関連情報認識尤度と前記検索キー認識尤度の前記統
    合は、前記検索キー認識尤度に対して、音声検索キー候
    補として出力された全候補の検索キー認識尤度の合計が
    1になるように正規化し、前記関連情報認識尤度に対し
    ても全関連情報候補の認識尤度の合計が1になるように
    正規化し、これら両正規化した値を乗算することにより
    両認識尤度を統合し、新たな認識尤度と定めることを特
    徴とする対話型データベース検索方法。
  3. 【請求項3】 前記請求項1の対話型データベース検索
    方法において、 ユーザが入力する音声検索キーを一度で同定することが
    できなかった場合、音声検索キーが同定できるまで、前
    記検索キー確定関連情報データベースを基に、ユーザに
    対して、検索キー確定関連質問を音声を用いて提示し、
    検索キー確定関連質問に対するユーザの応答に対して再
    度、音声認識装置を用いて音声認識処理を行うことによ
    り求められる関連情報認識尤度と、既に求められている
    検索キー認識尤度とを、用いて統合することにより、音
    声検索キーを同定し、再度ユーザに音声を用いて提示す
    ることを繰返すことを特徴とする対話型データベース検
    索方法。
  4. 【請求項4】 検索対象となる検索キーをすべて含んだ
    検索データベースと、 検索キーが有する属性に関連する関連情報を保持した検
    索キー確定関連情報データベースと、 入力された音声を音声認識する音声認識装置と、 入力された音声検索キーに対し、音声認識装置により検
    索データベース中の検索キー候補ごとの認識尤度(検索
    キー認識尤度と記す)を求める手段と、 検索キー認識尤度がしきい値以上の検索キー候補が所定
    数以上又は0であるか否か判定する手段と、 所定数以上でなく、かつ0でないと判定されると、その
    各検索キー候補について正誤性を問う検索キー確定質問
    を、音声を用いて提示する手段と、 上記判定が所定数以上又は0であれば上記検索キー確定
    関連情報データベースを基に、関連情報に関連する検索
    キー確定関連質問を、音声を用いて提示する手段と、 検索キー確定関連質問に対する応答音声に対し、音声認
    識装置により、検索キー確定関連情報データベース中の
    関連情報候補ごとの認識尤度(関連情報認識尤度と記
    す)を求める手段と、 上記検索キー認識尤度と、上記関連情報認識尤度を検索
    キー確定関連情報データベースを用いて統合して新たな
    認識尤度を生成する手段と、 その新たな認識尤度を用いて音声検索キーの同定を行う
    手段と、 を具備する対話型データベース検索装置。
  5. 【請求項5】 入力された音声検索キーを音声認識処理
    し、その処理結果にもとづき質問音声を提示して音声検
    索キーの同定を行う対話型データベース検索装置のコン
    ピュータに、 音声検索キーに対する認識結果の音声検索キー認識尤度
    と尤度しきい値とを比較する処理と、 しきい値以上の音声検索キー認識尤度が所定数以上又は
    ゼロであるか否か判定する処理と、 しきい値以上の音声検索キー認識尤度が所定数以上でな
    く、かつゼロでないと判定されると、そのしきい値以上
    の音声検索キー認識尤度をもつ音声検索キー候補につい
    て提示を行うことを決定する処理と、 その決定された音声検索キー候補が入力した音声検索キ
    ーかどうかをユーザに確認させる検索キー確定質問を作
    成する処理と、 しきい値以上の音声検索キー認識尤度が所定数以上又は
    ゼロであると判定されると、検索キー同定につながる検
    索キー確定関連質問を行うことを決定する処理と、 この決定にもとづき、検索キー候補のもつ属性と関連し
    た情報を入力させる検索キー確定関連質問を作成する処
    理と、 検索キー確定関連質問に対する応答に対する音声認識結
    果中の関連情報認識尤度と検索キー認識尤度とを、検索
    キー確定関連情報データベースを用いて統合する処理
    と、 その統合した尤度にもとづき音声検索キー候補を選択す
    る処理と、 その選択した候補が入力した音声検索キーであるかの確
    認を行う質問を作成する処理と、 を実行させるプログラムを記録した記録媒体。
JP04816799A 1999-02-25 1999-02-25 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 Expired - Lifetime JP3420965B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04816799A JP3420965B2 (ja) 1999-02-25 1999-02-25 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04816799A JP3420965B2 (ja) 1999-02-25 1999-02-25 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2000250585A true JP2000250585A (ja) 2000-09-14
JP3420965B2 JP3420965B2 (ja) 2003-06-30

Family

ID=12795848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04816799A Expired - Lifetime JP3420965B2 (ja) 1999-02-25 1999-02-25 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3420965B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003029784A (ja) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv データベースのエントリを決定する方法
JP2004219747A (ja) * 2003-01-15 2004-08-05 Nec Corp 音声認識装置、音声認識方法、及びプログラム
JP2005234688A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP2005326505A (ja) * 2004-05-12 2005-11-24 Ntt Docomo Inc 認識システム及び認識方法
JP2006039954A (ja) * 2004-07-27 2006-02-09 Denso Corp データベース検索装置、プログラム及びナビゲーション装置
CN105719643A (zh) * 2014-12-22 2016-06-29 卡西欧计算机株式会社 声音检索装置、声音检索方法
JP2016118999A (ja) * 2014-12-22 2016-06-30 カシオ計算機株式会社 音声検索装置、音声検索方法及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217611A (ja) 2008-03-11 2009-09-24 Toshiba Corp 音声対話装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057395A (ja) * 1983-09-08 1985-04-03 松下電器産業株式会社 音声認識方法
JPH05108091A (ja) * 1991-10-17 1993-04-30 Ricoh Co Ltd 音声認識装置
JPH06149287A (ja) * 1992-11-05 1994-05-27 Fujitsu Ten Ltd 音声認識装置
JPH075890A (ja) * 1993-06-16 1995-01-10 Nippon Telegr & Teleph Corp <Ntt> 音声対話装置
JPH086940A (ja) * 1994-06-16 1996-01-12 Hitachi Ltd 音声入力方式およびそれを用いた情報処理装置
JPH08506430A (ja) * 1993-06-24 1996-07-09 ノーザン・テレコム・リミテッド 2経路検索による音声認識方法
JPH08202387A (ja) * 1995-01-30 1996-08-09 Fujitsu Ten Ltd 音声認識装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057395A (ja) * 1983-09-08 1985-04-03 松下電器産業株式会社 音声認識方法
JPH05108091A (ja) * 1991-10-17 1993-04-30 Ricoh Co Ltd 音声認識装置
JPH06149287A (ja) * 1992-11-05 1994-05-27 Fujitsu Ten Ltd 音声認識装置
JPH075890A (ja) * 1993-06-16 1995-01-10 Nippon Telegr & Teleph Corp <Ntt> 音声対話装置
JPH08506430A (ja) * 1993-06-24 1996-07-09 ノーザン・テレコム・リミテッド 2経路検索による音声認識方法
JPH086940A (ja) * 1994-06-16 1996-01-12 Hitachi Ltd 音声入力方式およびそれを用いた情報処理装置
JPH08202387A (ja) * 1995-01-30 1996-08-09 Fujitsu Ten Ltd 音声認識装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003029784A (ja) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv データベースのエントリを決定する方法
JP2004219747A (ja) * 2003-01-15 2004-08-05 Nec Corp 音声認識装置、音声認識方法、及びプログラム
JP2005234688A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP4574186B2 (ja) * 2004-02-17 2010-11-04 株式会社リコー 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP2005326505A (ja) * 2004-05-12 2005-11-24 Ntt Docomo Inc 認識システム及び認識方法
JP4512417B2 (ja) * 2004-05-12 2010-07-28 株式会社エヌ・ティ・ティ・ドコモ 認識システム及び認識方法
JP2006039954A (ja) * 2004-07-27 2006-02-09 Denso Corp データベース検索装置、プログラム及びナビゲーション装置
CN105719643A (zh) * 2014-12-22 2016-06-29 卡西欧计算机株式会社 声音检索装置、声音检索方法
JP2016118999A (ja) * 2014-12-22 2016-06-30 カシオ計算機株式会社 音声検索装置、音声検索方法及びプログラム
JP2016119000A (ja) * 2014-12-22 2016-06-30 カシオ計算機株式会社 音声検索装置、音声検索方法及びプログラム

Also Published As

Publication number Publication date
JP3420965B2 (ja) 2003-06-30

Similar Documents

Publication Publication Date Title
CN108463849B (zh) 一种计算机实现的方法和计算系统
US7386440B2 (en) Method, system, and apparatus for natural language mixed-initiative dialogue processing
US6839671B2 (en) Learning of dialogue states and language model of spoken information system
CN107481720B (zh) 一种显式声纹识别方法及装置
US7711105B2 (en) Methods and apparatus for processing foreign accent/language communications
US6885990B1 (en) Speech recognition based on interactive information retrieval scheme using dialogue control to reduce user stress
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
WO2018149209A1 (zh) 语音识别方法、电子设备以及计算机存储介质
US7925507B2 (en) Method and apparatus for recognizing large list of proper names in spoken dialog systems
US20060004570A1 (en) Transcribing speech data with dialog context and/or recognition alternative information
US20140310003A1 (en) System and Method for Improving Name Dialer Performance
US20070143100A1 (en) Method &amp; system for creation of a disambiguation system
CN110060674B (zh) 表格管理方法、装置、终端和存储介质
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
US20050234720A1 (en) Voice application system
EP2863385B1 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
US20060020471A1 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
CN104299623A (zh) 语音应用中用于自动确认和消歧模块的方法和系统
JP3530109B2 (ja) 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体
US9747891B1 (en) Name pronunciation recommendation
JP2000250585A (ja) 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体
US20070239430A1 (en) Correcting semantic classification of log data
US6996519B2 (en) Method and apparatus for performing relational speech recognition
JP5326549B2 (ja) 音声認識装置及び方法
CN113535925A (zh) 语音播报方法、装置、设备及存储介质

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term