JPH07219590A - 音声情報検索装置及び方法 - Google Patents

音声情報検索装置及び方法

Info

Publication number
JPH07219590A
JPH07219590A JP6009559A JP955994A JPH07219590A JP H07219590 A JPH07219590 A JP H07219590A JP 6009559 A JP6009559 A JP 6009559A JP 955994 A JP955994 A JP 955994A JP H07219590 A JPH07219590 A JP H07219590A
Authority
JP
Japan
Prior art keywords
vocabulary
recognition
voice
result
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6009559A
Other languages
English (en)
Inventor
Keiichi Sakai
桂一 酒井
Yuji Ikeda
裕治 池田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6009559A priority Critical patent/JPH07219590A/ja
Publication of JPH07219590A publication Critical patent/JPH07219590A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 対話の進行に応じて、音声認識のための語彙
を動的に変更し、要求に応じて以前に使用した語彙に戻
すことが可能な音声情報検索装置を提供する。 【構成】 音声情報検索装置に、音声認識の対象となる
語彙を記憶し、その記憶内容を参照して入力音声情報を
認識する音声認識部105と、その認識結果を解釈する
対話管理部107と、その解釈結果に基づいて情報を検
索する情報検索部103と、その検索結果に基づいて応
答を生成する対話応答生成部104と、対話管理部10
7による解釈結果及び情報検索部103による検索結果
に基づいて、動的語彙管理部303を介して動的語彙辞
書304を参照して、音声認識部105に記憶された音
声認識の対象となる語彙と、動的語彙管理部303に管
理される使用された語彙の履歴とを更新するための動的
語彙生成部302とを具える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された音声情報に
基づいて、データベース上の情報を検索し、その結果を
出力する装置に関するものである。
【0002】
【従来の技術】人間と人間の間で行われる情報交換の媒
体の中で、最も自然に使われるのが音声である。一方、
計算機の飛躍的な進歩により、計算機は数値計算のみな
らず、様々な情報を扱えるようになってきている。そこ
で、人間と計算機の間でも、情報交換の媒体として音声
を利用したいという要求がある。
【0003】このような要求に応えるべく、音声によっ
て入力された情報に基づいて情報検索を行う音声情報検
索装置が登場してきている。
【0004】
【発明が解決しようとしている課題】しかしながら、上
記従来の音声情報検索装置には、予め登録したごく一部
の単語や文を用いてしか、音声による検索ができず、更
に、ある対話の状態においては、その状態に対して予め
登録された対話内容しか認識できないため、自然な対話
を行うことができないという問題点も生じていた。この
ため、データベース上のあらゆる検索項目を自然に検索
できないという問題が生じていた。
【0005】また、一般に、対話により自然に検索を行
う時には、対話のどの時点でも入力されうるユーザ入力
文が存在する。例えば、旅に関する情報検索における対
話では、「九州地方にあるゴルフ場を知りたい。」等の
非常にグローバルな質問や、「温泉にはどんな項目があ
りますか?」等の検索するための情報を得るための質問
(メタ質問)がある。一方、対話が進むに連れて、詳細
な内容に関わる質問、例えば、「箱根湯本温泉の電話番
号を知りたい。」とか「群馬県吉井町のゴルフ上の立地
条件は?」といった質問が入力されるようになる。
【0006】このように、対話のどの時点でも入力され
うるユーザ入力文を受け付けて音声認識するための音声
認識情報と、対話が進むに連れて変わっていく入力を受
け付けて音声認識するための音声認識情報とを同時に扱
うためには、認識装置の巨大化や認識性能の低下、制御
の複雑化が問題となっている。
【0007】そこで、本出願人は、上記問題を解決する
ために、先に出願した特願平5−117169号におい
て、対話のどの時点でも現れ得る入力文を認識するため
の語彙(静的な語彙)と、対話の進行により変更される
語彙(動的な語彙)とを区別して保持し、地名などの階
層化された情報を有する辞書(シソーラス)の情報につ
いて、対話が進むにつれて、この階層構造に従い、順
次、次の階層の情報を動的な語彙として用いるように、
動的な語彙を変化させてゆくことで、認識性能を低下さ
せたり、認識時間を増大させたりすることなく、対話全
体を通じて多数の語句を認識可能とする音声情報検索装
置及び方法を提案している。
【0008】しかしながら、上記先願の音声情報検索装
置では、シソーラスの階層化された情報に基づいて、こ
の階層を順に辿って動的な語彙を変更するために、ある
時点の動的語彙を、その語彙の階層とは離れた別の階層
の語彙に変更するためには、それらの共通の祖に当たる
階層から順次辿って行かなければならない。
【0009】例えば、地名に関するシソーラスを用いた
場合には、その階層として、「地方名」、「都道府県
名」、「市区町村名」があるが、「市区町村名」を別の
「地方名」と誤認識した場合には、動的な語彙が切り替
わってしまい、元の市区町村名を動的な語彙に戻すの
に、地方名から辿っていく必要がある。また、隣接して
いる市区町村でも、その境界が地方の境界となっている
場合には、その隣接した市区町村を認識語彙とするのに
地方名から辿って行く必要がある。
【0010】このように、ユーザが意図しない動的な語
彙に切り替わってしまった場合や、誤認識によって、ユ
ーザが以前の対話で用いた動的な語彙を用いたい場合
に、動的な語彙を元に戻すために階層を順に辿っていく
という、ユーザにとって冗長な対話処理を要するという
問題があった。
【0011】
【課題を解決するための手段】上記課題を解決するため
に、本発明の音声情報検索装置は、音声認識の対象とな
る語彙を記憶する対象語彙記憶手段と、以前に音声認識
の対象となった語彙の履歴を記憶管理する語彙履歴記憶
手段と、前記対象語彙記憶手段を参照して前記入力手段
より入力された音声情報の認識を実行する認識手段と、
該認識手段による認識結果を解釈する解釈手段と、該解
釈手段の解釈結果に基づいて、情報を検索する検索手段
と、該検索手段による検索結果に基づいて、応答を生成
する生成手段と、該生成手段により生成された応答を出
力する出力手段と、前記解釈手段による解釈結果及び前
記検索手段による検索結果に基づいて、前記語彙履歴記
憶手段を参照して、前記記憶手段に記憶された音声認識
の対象となる語彙と、前記語彙履歴記憶手段に記憶され
た語彙の履歴とを更新する更新手段とを具える。
【0012】また、本発明の他の態様によれば、音声情
報検索方法に、音声情報を入力する入力工程と、音声認
識の対象となる語彙を記憶する対象語彙記憶部を参照し
て、前記入力工程において入力された音声情報の認識を
実行する認識工程と、該認識工程による認識結果を解釈
する解釈工程と、該解釈工程の解釈結果に基づいて、情
報を検索する検索工程と、該検索工程による検索結果に
基づいて応答を生成する生成工程と、該生成工程により
生成された応答を出力する出力工程と、前記解釈工程に
よる解釈結果及び前記検索工程による検索結果に基づい
て、以前に音声認識の対象となった語彙の履歴を記憶管
理する語彙履歴記憶部を参照して、前記対象語彙記憶部
に記憶された音声認識の対象となる語彙と、前記語彙履
歴記憶部に記憶された語彙の履歴とを更新する更新工程
とを具える。
【0013】
【作用】上記音声情報検索装置は、音声認識の対象とな
る語彙を記憶する対象語彙記憶手段を参照して、入力手
段より入力された音声情報の認識を認識手段により実行
し、その認識結果を解釈手段により解釈し、その解釈結
果に基づいて、検索手段が情報を検索し、その検索結果
に基づいて生成手段が生成した応答を出力手段が出力す
る。そして前記解釈手段による解釈結果及び前記検索手
段による検索結果に基づいて、語彙履歴記憶手段を参照
して、前記対象語彙記憶手段に記憶された音声認識の対
象となる語彙と、前記語彙履歴記憶手段に記憶された語
彙の履歴とを更新する。
【0014】また、上記音声情報検索方法は、音声認識
の対象となる語彙を記憶する対象語彙記憶部を参照し
て、入力工程において入力された音声情報の認識を認識
工程により実行し、その認識結果を解釈工程により解釈
し、その解釈結果に基づいて検索工程により情報を検索
し、その検索結果に基づいて生成工程により生成された
応答を出力工程において出力する。そして、前記解釈工
程による解釈結果及び前記検索工程による検索結果に基
づいて、前記語彙履歴記憶部を参照して、前記対象語彙
記憶部に記憶された音声認識の対象となる語彙と、前記
語彙履歴記憶部に記憶された語彙の履歴とを更新工程に
おいて更新する。
【0015】
【実施例】以下、図面を参照して本発明を詳細に説明す
る。
【0016】図1は、本発明の実施例の音声情報検索装
置のブロック構成を示す図である。同図において、10
1は、マイクより入力された音声をA/D変換して装置
内部に取り込む一方、生成された応答をD/A変換して
スピーカより出力する音声入出力部である。また、10
2は、検索結果、対話の流れ、次発話情報などを文字出
力するための表示部である。103は、データベース1
10と検索部109を含み、そのデータベース110に
格納されている情報を検索部109により検索して出力
するための情報検索部である。104は、対話管理部1
07で管理される情報や情報検索部103で検索された
検索情報より、出力形式の対話応答文を生成する対話応
答生成部である。
【0017】また、105は、認識対象の情報である認
識語彙(読みと表記の対)及び文法を参照して、音声入
出力部101より入力された音声の認識を行う音声認識
部である。106は、階層辞書であるシソーラス108
を含み、それを参照して、次発話で用いられると予想さ
れる認識対象の情報を生成する認識対象生成部である。
また、107は、音声認識部で認識された情報を解釈
し、情報検索部103に検索指示を与え、次発話予測、
対話応答を行う対話管理部である。
【0018】次に、以上のように構成される音声情報検
索装置の動作を図2のフローチャートを参照して説明す
る。
【0019】まず、ステップS201では、音声入出力
部101よりの音声入力を待ち、音声入力が行われる
と、この入力情報を音声認識部105に送る。ステップ
S202では、音声認識部105が、認識対象生成部1
06にて生成された情報を参照して、入力情報の音声認
識を行う。
【0020】そして、ステップS203で、この認識の
結果を対話管理部107に送り、対話管理部107が認
識結果を解釈する。ステップS204にて、解釈結果が
動的な語彙の変更要求であれば、ステップS209に進
み、そうでなければ、ステップS205に進む。ステッ
プS205では、検索条件が整っているかを判定し、整
っていれば検索の指示が出され、ステップS206に進
む。そうでなければ、不足情報を得るために、ステップ
S209へ進む。
【0021】ステップS206では、検索条件が整って
いるので、情報検索部103において、データベース1
10より情報を検索する。続いて、ステップS207
で、対話管理部107や情報検索部103より出力され
る情報をもとに、動的な語彙の変更要求である場合の受
理の応答、検索条件が整っていない場合の不足情報を得
るための指示の応答、あるいは、検索を行なった場合の
検索結果の応答を、対話応答生成部104が生成する。
【0022】ステップS208において、生成された応
答を、音声入出力部101のスピーカより音声出力す
る、あるいは表示部102に文字出力する。一方、情報
検索部103により検索された情報や対話管理部107
にて管理される対話の状況をもとに、ステップS209
では、次発話で発生すると予測される認識対象の情報
(語彙及び文法)を、認識対象生成部106にて生成す
る。生成された認識対象の情報は、音声認識部105に
よる次の発話の認識の際に参照できるように、音声認識
部105内に保存される。認識対象の情報が生成された
ら、ステップS201に戻り、再び、次発話の音声入力
を待つ。
【0023】なお、このステップS209は、ステップ
S207〜208の対話応答の生成及び出力と並行して
実行するようにしてもよく、そのようにすれば、待ち時
間を短くすることができる。
【0024】また、図1の装置各部は、上述の如く動作
する1つまたは複数の専用ハードウエアで構成してもよ
いし、その一部を、CPUが、メモリに記憶された図2
のフローチャートに対応するプログラムを、メモリ上の
ワークエリアを利用しながら実行することで、実現する
ようにしてもよい。
【0025】図3は、認識対象生成部106の詳細構成
を示す図である。図1と同じ部分には、同じ番号を付し
ている。ただし、図1が共通バス形式による装置構成を
示しているのに対し、図3は、装置各部間のデータの流
れを明らかとするように構成されている。
【0026】前述したように、一般に、対話を自然に行
う時には、対話のどこでも発声できる入力が存在する。
例えば、旅に関する情報検索の対話においては、「九州
地方にあるゴルフ場を知りたい。」等の非常にグローバ
ルな質問や、「温泉にはどんな項目がありますか?」等
の検索するための情報を得るための質問(メタ質問)が
ある。図3において、301は、このように対話のどこ
でも発声できる入力を受け付け、音声認識するための語
彙及び文法が保持されている静的情報部である。
【0027】一方、対話が進むに連れて、詳細な内容に
関わる質問、例えば、「箱根湯本温泉の電話番号を知り
たい。」とか「群馬県吉井町のゴルフ上の立地条件は
?」といった質問が入力されるようになる。
【0028】302は動的語彙生成部であり、このよう
に対話が進むに連れて動的に変化する入力を音声認識す
るための語彙を、情報検索部103で検索された結果か
ら、シソーラス108を参照して生成する。304は、
動的語彙を保持するための動的語彙辞書である。303
は、動的語彙辞書304を管理する動的語彙管理部であ
り、動的語彙生成部302で生成された動的語彙は、動
的語彙管理部303を介して動的語彙辞書304に保持
される。
【0029】305は、動的な文法を保持する動的文法
部である。306は、動的文法生成部であり、動的な語
彙の変更要求、もしくは検索を行なった結果に応じて、
動的語彙管理部303を介して動的語彙辞書304から
得られる動的語彙、及び動的文法部305に保持されて
いる文法から、語彙を含む動的な文法を生成する。
【0030】307は、認識文法生成部であり、動的文
法生成部で生成された動的な文法に、静的情報部301
に保持されている静的な情報を付け加えて、認識対象と
する全ての情報を生成し、音声認識部105に送る。
【0031】以下、本実施例においては、シソーラス1
08に格納される階層化された単語情報を「地名」とし
た例について説明する。
【0032】「地名」は日本国内においても、関東地
方、近畿地方などの「地方名」、東京都、大阪府などの
「都道府県名」、堺市、千代田区、豊能町などの「市区
町村名」といった階層関係を持っている。シソーラス1
08には、各「地方」に存在する「都道府県名」および
各「都道府県」に存在する「市区町村名」の階層化した
情報が格納されている。
【0033】図4に地名の認識語彙を動的に変更する処
理のフローチャートを示す。
【0034】ステップS401で、静的な認識用の情報
に、地名の最上位である「地方名」を保持し、ステップ
S402で、起動時の動的な認識用の情報に、「地方
名」の次位に当たる「都道府県名」をすべて保持する。
すなわち、起動時の時点で、音声認識可能な「地名」
は、「地方名」と「都道府県名」である。
【0035】ステップS403では、音声認識を行な
い、認識結果を対話管理部107が解釈し、検索条件を
作成する。解釈結果が動的な語彙の変更要求であれば、
ステップS405に移り、そうでなければ、ステップS
406に移る。
【0036】ステップS405では、語彙の変更が要求
されたので、動的語彙辞書304から動的語彙を取り出
して、動的な認識用の情報に付け加えて、ステップS4
03に移る。
【0037】ステップS406では、作成された検索条
件により情報検索部103で情報検索が行なわれ、ステ
ップS407に移る。ステップS407では、検索条件
中の地名が「地方名」であればステップS408に移
り、「地方名」でなければステップS409に移る。ス
テップS408では、シソーラス108を参照して、検
索結果が存在する「都道府県名」を動的な認識用の情報
の地名語彙として、ステップS411に移る。
【0038】ステップS409では、検索条件中の地名
が「都道府県名」であればステップS410に移り、
「都道府県名」でなければ、地名語彙は変更せず、ステ
ップS411に移る。ステップS410では、現在動的
な認識用の情報として保持している「都道府県名」に加
えて、シソーラス108を参照して、検索結果が存在す
る「市区町村名」を動的な認識用の情報の地名語彙とし
て、ステップS411に移る。
【0039】ステップS411では、検索結果の件数が
ある閾値(ここでは、例えば10件とする)以下であれ
ば、ステップS412に移り、この閾値より多ければ、
ステップS413に進む。ステップS412では、検索
の結果得られた具体的な名称を、動的な認識用の情報に
付け加えてステップS413に移る。
【0040】本実施例に基づく対話例を図5、図7に示
し、これらの対話例によって変化する音声認識語彙を図
6、図8にそれぞれ示す。
【0041】図5中、usr3は、中国地方の都道符県名
と、鳥取県の市区町村名を動的語彙とした検索中に、入
力された「東伯町」が静的語彙の「東北地方」と誤認識
された例である。このため東北地方の寺院が検索され
る。そして、sys3に示すように、動的語彙が東北地方の
都道府県名となり、東伯町だけでなく、鳥取県まで動的
語彙からはずれてしまう。このような場合、前述した先
願の装置では、再び東伯町を動的語彙とするためには、
「中国地方」、「鳥取県」を順に指定しなければならな
かったが、本実施例では、sys2での動的語彙usr4の1対
話により、sys4に示すように、再び東伯町を動的語彙と
することができる。
【0042】また、図7の対話の例では、図8に示すよ
うに、sys2での動的語彙は、関東地方の都道府県名と、
群馬県の市区町村名であり、その後sys6では、甲信越地
方の都道府県名と、長野県の市区町村名が動的語彙とな
っている。このような場合に、以前動的語彙であった
「長野原町」を再び動的語彙とするためには、前述した
先願の装置では、「関東地方」、「群馬県」を順に指定
しなければならなかったが、本実施例では、usr7の1対
話により、sys7での動的語彙をsys2の動的語彙に戻し、
「長野原町」を再び動的語彙とすることができる。
【0043】以上のごとく、地名のように階層化した構
造を持つ情報群を認識語彙とする場合、対話を通して着
目する階層を変え、認識語彙を変更することで、認識性
能を損なうことなく、音声対話を実現するとともに、誤
認識や、対話の進行などにより、過去の動的語彙とは離
れた階層の動的語彙に切り替わってしまった場合にも、
過去の動的語彙に簡単に戻すことができるので、動的語
彙の切替が効率的に行なえるようになった。
【0044】以上のように本実施例によれば、自然でし
かも使い易い形で、音声入力による情報検索が実現でき
る。
【0045】[他の実施例]上記実施例では、地名の階
層として、「地方名」、「都道府県名」、「市区町村
名」の3階層として説明したが、これに加えて、日本、
アメリカ合衆国などの「国名」、更にはアジア、ヨーロ
ッパなどの「地域名」など、階層を増やしても構わな
い。その場合、図4のステップS407〜S410の分
岐処理を増やすことによって対処できる。
【0046】また、上記実施例では階層化された情報と
して「地名」を用いたが、例えば、「会社組織の部署
名」における「本部名」、「部名」、「課名」など、他
の階層化された情報を利用しても、同様の処理が可能で
ある。
【0047】また、以上の実施例では、階層化された情
報を対象としたが、これに限らず、動的な情報として、
単に複数のグループからなる情報の内のいくつかのグル
ープを切り替え選択して利用する場合にも、使用したグ
ループの履歴を管理することにより、上記実施例と同様
に、過去に使用した動的な情報を、再度動的な情報とす
ることが簡単に実現できる。
【0048】
【発明の効果】以上説明したように、本発明によれば、
音声認識のための認識情報を対話に応じて動的に変更で
きるとともに、認識情報を以前使用した認識情報へ簡単
に戻せるようになり、自然で使い易い音声情報検索装置
を実現できるという効果がある。
【図面の簡単な説明】
【図1】本発明による音声情報検索装置の実施例のブロ
ック構成図である。
【図2】実施例の音声情報検索処理のフローチャートで
ある。
【図3】実施例の認識対象生成部の図である。
【図4】実施例の地名認識語彙の変更処理のフローチャ
ートである。
【図5】実施例のユーザとシステムの対話例を示す図で
ある。
【図6】対話例によって変化する音声認識語彙の図であ
る。
【図7】実施例のユーザとシステムの対話例を示す図で
ある。
【図8】対話例によって変化する音声認識語彙の図であ
る。
【符号の説明】
101 音声入出力部 102 表示部 103 情報検索部 104 対話応答生成部 105 音声認識部 106 認識対象生成部 107 対話管理部 108 シソーラス 109 検索部 110 データベース 301 静的情報部 302 動的語彙生成部 303 動的語彙管理部 304 動的語彙辞書 305 動的文法部 306 動的文法生成部 307 認識文法生成部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音声情報を入力する入力手段と、 音声認識の対象となる語彙を記憶する対象語彙記憶手段
    と、 以前に音声認識の対象となった語彙の履歴を記憶管理す
    る語彙履歴記憶手段と、 前記対象語彙記憶手段を参照して前記入力手段より入力
    された音声情報の認識を実行する認識手段と、 該認識手段による認識結果を解釈する解釈手段と、 該解釈手段の解釈結果に基づいて、情報を検索する検索
    手段と、 該検索手段による検索結果に基づいて、応答を生成する
    生成手段と、 該生成手段により生成された応答を出力する出力手段
    と、 前記解釈手段による解釈結果及び前記検索手段による検
    索結果に基づいて、前記語彙履歴記憶手段を参照して、
    前記記憶手段に記憶された音声認識の対象となる語彙
    と、前記語彙履歴記憶手段に記憶された語彙の履歴とを
    更新する更新手段とを具えたことを特徴とする音声情報
    検索装置。
  2. 【請求項2】 前記更新手段は、前記解釈結果が、音声
    認識の対象となる語彙を以前の語彙へ変更する要求であ
    るとき、前記語彙履歴記憶手段を参照して、前記対象語
    彙記憶手段の語彙を以前の語彙へ変更することを特徴と
    する請求項1記載の音声情報検索装置。
  3. 【請求項3】 前記更新手段は、前記解釈結果が、音声
    認識の対象となる語彙を直前の語彙へ変更する要求であ
    るとき、前記語彙履歴記憶手段を参照して、前記対象語
    彙記憶手段の語彙を直前の語彙へ変更することを特徴と
    する請求項1記載の音声情報検索装置。
  4. 【請求項4】 前記対象語彙記憶手段は、前記更新手段
    の更新対象となる動的な語彙と、前記更新手段の更新対
    象外となる静的な語彙とを記憶することを特徴とする請
    求項1記載の音声情報検索装置。
  5. 【請求項5】 前記更新手段は、語彙を当該語彙間の階
    層関係とともに記憶する辞書を有し、当該語彙及び階層
    関係を参照して、前記対象語彙記憶手段に記憶された語
    彙を更新することを特徴とする請求項1記載の音声情報
    検索装置。
  6. 【請求項6】 音声情報を入力する入力工程と、 音声認識の対象となる語彙を記憶する対象語彙記憶部を
    参照して、前記入力工程において入力された音声情報の
    認識を実行する認識工程と、 該認識工程による認識結果を解釈する解釈工程と、 該解釈工程の解釈結果に基づいて、情報を検索する検索
    工程と、 該検索工程による検索結果に基づいて応答を生成する生
    成工程と、 該生成工程により生成された応答を出力する出力工程
    と、 前記解釈工程による解釈結果及び前記検索工程による検
    索結果に基づいて、以前に音声認識の対象となった語彙
    の履歴を記憶管理する語彙履歴記憶部を参照して、前記
    対象語彙記憶部に記憶された音声認識の対象となる語彙
    と、前記語彙履歴記憶部に記憶された語彙の履歴とを更
    新する更新工程とを具えたことを特徴とする音声情報検
    索方法。
  7. 【請求項7】 前記更新工程において、前記解釈結果
    が、音声認識の対象となる語彙を以前の語彙へ変更する
    要求であるとき、前記語彙履歴記憶部を参照して、前記
    対象語彙記憶部の語彙を以前の語彙へ変更することを特
    徴とする請求項6記載の音声情報検索方法。
  8. 【請求項8】 前記更新工程において、前記解釈結果
    が、音声認識の対象となる語彙を直前の語彙へ変更する
    要求であるとき、前記語彙履歴記憶部を参照して、前記
    対象語彙記憶部の語彙を直前の語彙へ変更することを特
    徴とする請求項6記載の音声情報検索方法。
  9. 【請求項9】 前記対象語彙記憶部に、前記更新工程の
    更新対象となる動的な語彙と、前記更新工程の更新対象
    外となる静的な語彙とを記憶させることを特徴とする請
    求項6記載の音声情報検索方法。
  10. 【請求項10】 前記更新工程では、語彙を当該語彙間
    の階層関係とともに記憶する辞書に記述された当該語彙
    及び階層関係を参照して、前記対象語彙記憶部に記憶さ
    れた語彙を更新することを特徴とする請求項4記載の音
    声情報検索方法。
JP6009559A 1994-01-31 1994-01-31 音声情報検索装置及び方法 Pending JPH07219590A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6009559A JPH07219590A (ja) 1994-01-31 1994-01-31 音声情報検索装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6009559A JPH07219590A (ja) 1994-01-31 1994-01-31 音声情報検索装置及び方法

Publications (1)

Publication Number Publication Date
JPH07219590A true JPH07219590A (ja) 1995-08-18

Family

ID=11723647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6009559A Pending JPH07219590A (ja) 1994-01-31 1994-01-31 音声情報検索装置及び方法

Country Status (1)

Country Link
JP (1) JPH07219590A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143187A (ja) * 1996-11-07 1998-05-29 Ricoh Co Ltd 作業支援システム
JPH11126089A (ja) * 1997-10-24 1999-05-11 Nissan Motor Co Ltd 音声対話装置
US6215479B1 (en) 1997-03-18 2001-04-10 Victor Company Of Japan, Ltd. Apparatus for displaying image with pointing character
US6230132B1 (en) * 1997-03-10 2001-05-08 Daimlerchrysler Ag Process and apparatus for real-time verbal input of a target address of a target address system
JP2003029784A (ja) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv データベースのエントリを決定する方法
US6522725B2 (en) 1997-12-05 2003-02-18 Nec Corporation Speech recognition system capable of flexibly changing speech recognizing function without deteriorating quality of recognition result
EP1428203A2 (en) * 2001-07-03 2004-06-16 Fonelet Technology, Inc. Method and apparatus for improving voice recognition performance in a voice application distribution system
KR100446627B1 (ko) * 2002-03-29 2004-09-04 삼성전자주식회사 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
CN1306471C (zh) * 2003-11-11 2007-03-21 三菱电机株式会社 声音操作装置
JP2007310137A (ja) * 2006-05-18 2007-11-29 Fujitsu Ltd 音声認識装置および音声認識プログラム
WO2011121649A1 (ja) * 2010-03-30 2011-10-06 三菱電機株式会社 音声認識装置
WO2016136207A1 (ja) * 2015-02-27 2016-09-01 パナソニックIpマネジメント株式会社 音声対話装置、音声対話システム、音声対話装置の制御方法、および、プログラム

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143187A (ja) * 1996-11-07 1998-05-29 Ricoh Co Ltd 作業支援システム
US6230132B1 (en) * 1997-03-10 2001-05-08 Daimlerchrysler Ag Process and apparatus for real-time verbal input of a target address of a target address system
US6215479B1 (en) 1997-03-18 2001-04-10 Victor Company Of Japan, Ltd. Apparatus for displaying image with pointing character
JPH11126089A (ja) * 1997-10-24 1999-05-11 Nissan Motor Co Ltd 音声対話装置
US6522725B2 (en) 1997-12-05 2003-02-18 Nec Corporation Speech recognition system capable of flexibly changing speech recognizing function without deteriorating quality of recognition result
JP2003029784A (ja) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv データベースのエントリを決定する方法
EP1428203A4 (en) * 2001-07-03 2005-11-02 Fonelet Technology Inc METHOD AND DEVICE FOR IMPROVING LANGUAGE RECOGNITION PERFORMANCE IN A LANGUAGE APPLICATION DISTRIBUTION SYSTEM
EP1428203A2 (en) * 2001-07-03 2004-06-16 Fonelet Technology, Inc. Method and apparatus for improving voice recognition performance in a voice application distribution system
US7643998B2 (en) * 2001-07-03 2010-01-05 Apptera, Inc. Method and apparatus for improving voice recognition performance in a voice application distribution system
KR100446627B1 (ko) * 2002-03-29 2004-09-04 삼성전자주식회사 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
CN1306471C (zh) * 2003-11-11 2007-03-21 三菱电机株式会社 声音操作装置
JP2007310137A (ja) * 2006-05-18 2007-11-29 Fujitsu Ltd 音声認識装置および音声認識プログラム
US8560317B2 (en) 2006-05-18 2013-10-15 Fujitsu Limited Voice recognition apparatus and recording medium storing voice recognition program
WO2011121649A1 (ja) * 2010-03-30 2011-10-06 三菱電機株式会社 音声認識装置
CN102770910A (zh) * 2010-03-30 2012-11-07 三菱电机株式会社 声音识别装置
DE112010005425T5 (de) 2010-03-30 2013-01-10 Mitsubishi Electric Corporation Spracherkennungsvorrichtung
WO2016136207A1 (ja) * 2015-02-27 2016-09-01 パナソニックIpマネジメント株式会社 音声対話装置、音声対話システム、音声対話装置の制御方法、および、プログラム

Similar Documents

Publication Publication Date Title
US5819220A (en) Web triggered word set boosting for speech interfaces to the world wide web
US10121468B2 (en) System and method for combining geographic metadata in automatic speech recognition language and acoustic models
EP1475780B1 (en) Voice recognition system for mobile unit
JP3454897B2 (ja) 音声対話システム
JP6073498B2 (ja) 対話制御装置及び対話制御方法
CN102549652B (zh) 信息检索装置
JP5142720B2 (ja) デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話
JPH06332493A (ja) 音声対話型情報検索装置及び方法
JP7200405B2 (ja) 音声認識のためのコンテキストバイアス
US11016968B1 (en) Mutation architecture for contextual data aggregator
EP1162602A1 (en) Two pass speech recognition with active vocabulary restriction
US7725309B2 (en) System, method, and technique for identifying a spoken utterance as a member of a list of known items allowing for variations in the form of the utterance
JP2001005488A (ja) 音声対話システム
CN109741735B (zh) 一种建模方法、声学模型的获取方法和装置
JPH07219590A (ja) 音声情報検索装置及び方法
US11289075B1 (en) Routing of natural language inputs to speech processing applications
JP2005321730A (ja) 対話システム、対話システム実行方法、及びコンピュータプログラム
US10783876B1 (en) Speech processing using contextual data
KR20060070605A (ko) 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
US20060136195A1 (en) Text grouping for disambiguation in a speech application
Young Still talking to machines (cognitively speaking).
Maqbool et al. Zero-label anaphora resolution for off-script user queries in goal-oriented dialog systems
Lin et al. The design of a multi-domain mandarin Chinese spoken dialogue system
JPH0778183A (ja) デ−タベ−ス検索システム
JP3499658B2 (ja) 対話支援装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030325