JP2001125591A - 音声対話システム - Google Patents

音声対話システム

Info

Publication number
JP2001125591A
JP2001125591A JP30575699A JP30575699A JP2001125591A JP 2001125591 A JP2001125591 A JP 2001125591A JP 30575699 A JP30575699 A JP 30575699A JP 30575699 A JP30575699 A JP 30575699A JP 2001125591 A JP2001125591 A JP 2001125591A
Authority
JP
Japan
Prior art keywords
dialogue
engine
voice
dialog
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30575699A
Other languages
English (en)
Other versions
JP2001125591A5 (ja
Inventor
Hideki Nakamura
英樹 中村
Toshitaka Yamato
俊孝 大和
Shinichi Iwamoto
真一 岩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP30575699A priority Critical patent/JP2001125591A/ja
Publication of JP2001125591A publication Critical patent/JP2001125591A/ja
Publication of JP2001125591A5 publication Critical patent/JP2001125591A5/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 車両に搭載された機器の複雑な操作を自由発
話による対話形式で遂行することを可能とする音声対話
システムを提供する。 【解決手段】 車両に搭載された機器の操作をユーザと
の対話に基づいて遂行する音声対話システムであって、
映像出力装置と、音声出力装置と、音声入力装置と、前
記映像出力装置に画像を表示する処理を行う画像表示エ
ンジンと、前記音声入力装置から入力される音声のパタ
ーンを認識する処理を行う音声認識エンジンと、前記音
声出力装置から出力されるべき音声を電子的に合成する
処理を行う音声合成エンジンと、アプリケーションプロ
グラムの指示を受けて前記画像表示エンジン、前記音声
認識エンジン及び前記音声合成エンジンを制御する対話
処理専用エンジンと、前記音声認識エンジン、前記音声
合成エンジン及び前記対話処理専用エンジンによって参
照される対話用データベースと、を具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、車両に搭載された
機器の操作をユーザとの対話に基づいて遂行する音声対
話システムに関する。
【0002】
【従来の技術】車両には、ナビゲーションシステム、情
報通信システムの車両内端末等の各種電子機器が搭載さ
れるようになってきている。そして、近年、それらの機
器においては、その操作の複雑さの影響を軽減するため
に音声認識による機能実現がなされている。しかし、そ
れらの音声認識は、孤立単語音声認識又は連続単語音声
認識によるものがほとんどであるため、発声の自由度が
なく、また、複雑な機能を実現することができない。
【0003】
【発明が解決しようとする課題】本発明は、上述した問
題点に鑑みてなされたものであり、その目的は、車両に
搭載された機器の複雑な操作を自由発話による対話形式
で遂行することを可能とする音声対話システムを提供す
ることにある。
【0004】
【課題を解決するための手段】上記目的を達成するため
に、本発明の第1の態様によれば、車両に搭載された機
器の操作をユーザとの対話に基づいて遂行する音声対話
システムであって、映像出力装置と、音声出力装置と、
音声入力装置と、前記映像出力装置に画像を表示する処
理を行う画像表示エンジンと、前記音声入力装置から入
力される音声のパターンを認識する処理を行う音声認識
エンジンと、前記音声出力装置から出力されるべき音声
を電子的に合成する処理を行う音声合成エンジンと、ア
プリケーションプログラムの指示を受けて前記画像表示
エンジン、前記音声認識エンジン及び前記音声合成エン
ジンを制御する対話処理専用エンジンと、前記音声認識
エンジン、前記音声合成エンジン及び前記対話処理専用
エンジンによって参照される対話用データベースと、を
具備する音声対話システムが提供される。
【0005】また、本発明の第2の態様によれば、前記
第1の態様に係る音声対話システムにおいて、前記対話
用データベースが外部メモリ上に構成される。
【0006】また、本発明の第3の態様によれば、前記
第1の態様に係る音声対話システムにおいて、前記対話
用データベースは、対話の流れを記述した対話モデルデ
ータ及びユーザが発生可能な語彙データを記述した発話
モデルを格納する。
【0007】また、本発明の第4の態様によれば、前記
第1の態様に係る音声対話システムにおいて、前記対話
処理専用エンジンは、対話状態と画面表示状態との対応
関係を記憶したテーブルを具備し、アプリケーションプ
ログラムに現在の対話状態を報知することにより、対話
内容に応じた画面表示の切り替えを可能にする。
【0008】また、本発明の第5の態様によれば、前記
第1の態様に係る音声対話システムにおいて、前記対話
処理専用エンジンは、アプリケーションプログラムから
スイッチ操作情報を受けて音声対話を中断及び再開す
る。
【0009】また、本発明の第6の態様によれば、前記
第1の態様に係る音声対話システムにおいて、前記対話
処理専用エンジンは、対話状態と画面表示状態との対応
関係を記憶したテーブルを具備し、アプリケーションプ
ログラムから現在の画面表示状態についての情報を受け
て、当該画面表示状態に応じた対話状態からの音声対話
を開始する。
【0010】また、本発明の第7の態様によれば、前記
第1の態様に係る音声対話システムにおいて、アプリケ
ーションプログラムが音声対話中のシステムの音声案内
を対話状態に応じて切り替えることができるように、前
記対話処理専用エンジンから報知される対話状態と案内
に関する情報との対応関係を記憶するテーブルをさらに
具備する。
【0011】また、本発明の第8の態様によれば、前記
第1の態様に係る音声対話システムにおいて、前記対話
処理専用エンジンは、遷移条件及び動作を規定する状態
遷移図に基づいて対話の流れを制御する。
【0012】また、本発明の第9の態様によれば、前記
第1の態様に係る音声対話システムにおいて、前記対話
処理専用エンジンは、ユーザの発声内容が格納されるス
ロット及び動作を有するフレーム構造に基づいて対話の
流れを制御する。
【0013】また、本発明の第10の態様によれば、前
記第1の態様に係る音声対話システムにおいて、前記対
話処理専用エンジンは、ユーザの発声内容が格納される
スロットを有するフレーム構造におけるスロットの埋ま
り方のパターンに基づいて対話の流れを制御する。
【0014】また、本発明の第11の態様によれば、前
記第1の態様に係る音声対話システムにおいて、前記対
話処理専用エンジンは、遷移条件及び動作を規定する状
態遷移パターンと、ユーザの発声内容が格納されるスロ
ットを有するフレーム構造におけるスロットの埋まり方
のパターンと、に基づいて対話の流れを制御する。
【0015】また、本発明の第12の態様によれば、前
記第1の態様に係る音声対話システムにおいて、前記対
話処理専用エンジンは、対話状態に応じた単語辞書の領
域を記憶したテーブルを参照して、対話状態が変化する
毎に対応する単語辞書の領域を前記音声認識エンジンに
報知する。
【0016】また、本発明の第13の態様によれば、前
記第1の態様に係る音声対話システムにおいて、前記対
話処理専用エンジンは、アプリケーションプログラムの
要求に応じて、前記音声認識エンジンに対する接続権を
アプリケーションプログラムに一時的に移転する機能を
有する。
【0017】また、本発明の第14の態様によれば、前
記第1の態様に係る音声対話システムにおいて、前記対
話処理専用エンジンは、対話の履歴を管理する対話履歴
管理部を有し、対話の履歴に基づくシステムの案内の変
更を可能にする。
【0018】また、本発明の第15の態様によれば、前
記第14の態様に係る音声対話システムにおいて、前記
対話履歴管理部は、前記音声認識エンジンのエラーの回
数を管理する。
【0019】また、本発明の第16の態様によれば、前
記第14の態様に係る音声対話システムにおいて、前記
対話履歴管理部は、前記音声認識エンジンの誤認識によ
る発声のやり直しの回数を管理する。
【0020】また、本発明の第17の態様によれば、前
記第14の態様に係る音声対話システムにおいて、前記
対話履歴管理部は、前記音声認識エンジンにおけるタイ
ムアウトの回数を管理する。
【0021】また、本発明の第18の態様によれば、前
記第17の態様に係る音声対話システムにおいて、前記
対話処理専用エンジンは、前記対話履歴管理部からのタ
イムアウト情報に基づいて音声対話の中断処理を行うタ
イムアウト制御部を有する。
【0022】また、本発明の第19の態様によれば、前
記第14の態様に係る音声対話システムにおいて、前記
対話履歴管理部が、前記対話処理専用エンジンとアプリ
ケーションプログラムとの共通タスクとして構成されて
いる。
【0023】また、本発明の第20の態様によれば、前
記第18の態様に係る音声対話システムにおいて、前記
対話履歴管理部は、前記対話処理専用エンジンとアプリ
ケーションプログラムとの共通タスクとして構成され
る。
【0024】また、本発明の第21の態様によれば、前
記第1の態様に係る音声対話システムにおいて、前記対
話処理専用エンジンは、前記音声認識エンジン内の意味
抽出タスクを管理及び制御し、ユーザから入力された文
章を入力して該文章の意味抽出を行うことにより、文字
入力による対話を実現する。
【0025】
【発明の実施の形態】以下、添付図面を参照して本発明
の実施形態について説明する。
【0026】図1は、本発明による音声対話システムの
一実施形態を示すシステム構成図である。このシステム
は、車両に搭載されるものであり、映像出力装置として
のディスプレイ12、音声出力装置としてのスピーカ1
4、音声入力装置としてのマイク16、音声対話開始ス
イッチ18及び処理装置20を備えている。
【0027】処理装置20は、ハードウェアとしては、
周知のように、中央処理装置(CPU)、主記憶装置等
からなるものである。また、処理装置20は、主記憶装
置上で走行せしめられるソフトウェアとして、図1に示
されるように、ディスプレイ12に画像を表示する処理
を行う画像表示エンジン、マイク16から入力される音
声のパターンを認識する処理を行う音声認識エンジン、
及びスピーカ14から出力されるべき音声を電子的に合
成する処理を行う音声合成エンジンを備えている。
【0028】さらに、処理装置20は、ソフトウェアと
して、図1に示されるように、アプリケーションプログ
ラムの指示を受けて前述の画像表示エンジン、音声認識
エンジン及び音声合成エンジンを制御する対話処理専用
エンジンを備えている。また、処理装置20は、前述の
音声認識エンジン、音声合成エンジン及び対話処理専用
エンジンによって参照される対話用データベースを備え
る。
【0029】また、図1では、アプリケーションプログ
ラムとして、アプリケーションA及びアプリケーション
Bが例示されている。なお、当然のことながら、ハード
ウェア及びソフトウェアを総合的に管理及び制御するオ
ペレーティングシステム(OS)も処理装置20におい
て走行する。
【0030】図1に示されるように、本発明による音声
対話処理システムは、システム中に対話処理専用エンジ
ン及び対話用データベースを持っている。そのため、ス
イッチによる機器操作に代えて、ユーザの自由発話とシ
ステムの案内音声とによる音声対話で機器操作が可能と
なる。すなわち、発声の自由度の向上が図られるととも
に、音声による複雑な機器操作が実現される。
【0031】なお、前述の対話用データベースは、図2
に示されるように、CD−ROM、DVD−ROM、メ
モリカード等の外部メモリ22上に構成されてもよい。
このように外部メモリ22上に対話用データベースを持
ち、そのデータを処理装置20内の主記憶装置にロード
することで、種々の対話パターンを実現することが容易
になる。すなわち、音声対話のパターンをユーザが選択
及び変更することができるようになり、ユーザの好みに
応じた対話のパターンを選択することができるため、ユ
ーザの満足度が向上する。以下、本発明を特徴付ける対
話処理専用エンジンの制御動作を中心に、本発明による
音声対話処理について説明する。
【0032】図1又は図2における対話用データベース
は、音声による対話を実現するために、対話の流れを記
述した対話モデルデータ及びユーザが発生可能な語彙デ
ータを記述した発話モデルを、対話処理専用エンジンの
外部に持つためのものである。したがって、対話の制御
を行う対話処理専用エンジンの変更を行うことなく、対
話を実現するためのデータベースのみを変更すること
で、全く異なった対話を実現することができる。その結
果、音声対話システムの開発においては、データベース
の変更に関する開発のみを行えばよいこととなり、開発
速度の向上が図られる。また、対話処理専用エンジンの
仕様を変更することなく、他のシステムへの流用が可能
になる。その結果、それぞれのシステムに対して専用の
プログラムを開発する手間を省くことができるため、や
はり開発速度の向上が図られる。
【0033】図1又は図2における対話処理専用エンジ
ンは、対話状態と画面表示状態との対応を記述したテー
ブルを具備し、アプリケーションプログラムに現在の対
話状態を返すことにより、対話内容に応じた画面表示の
切り替えを可能にする。すなわち、音声対話と連動して
画面表示が切り替えられる。換言すれば、音声対話の進
行に対応して、対話内容に応じた画面表示に切り替えら
れる。その結果、ユーザは、対話の内容を目視によって
確認することができるようになる。
【0034】また、対話処理専用エンジンは、アプリケ
ーションプログラムからスイッチ18の操作情報を受け
ると、音声対話に必要なスイッチ操作以外の場合、その
情報の種類に応じて音声対話を一旦中断する。そして、
対話処理専用エンジンは、再度、音声対話開始のスイッ
チ押下の情報を受けたときに音声対話を再開する。した
がって、ユーザは、音声対話の途中であっても、後続す
る操作を機器本体のスイッチで行うことができる。すな
わち、音声による操作とスイッチによる操作との併用に
より、機器の操作方法に多様性を持たせることができ、
使いやすさの向上が図られる。
【0035】また、対話処理専用エンジンは、対話状態
と画面表示状態との対応を記述したテーブルを持ち、ア
プリケーションプログラムから現在の画面表示状態につ
いての情報を受けて、そのテーブルを参照することによ
り、当該画面表示状態に応じた対話状態からの音声対話
を開始する。これにより、機器操作の途中であっても、
後続する操作を音声対話で行うことができる。かくし
て、音声による操作とスイッチによる操作との併用によ
り、機器の操作方法に多様性を持たせることができ、使
いやすさの向上が図られる。
【0036】また、本発明による音声対話システムにお
いては、アプリケーションプログラムが音声対話中のシ
ステムの音声案内を対話状態に応じて切り替えることが
できるように、対話処理専用エンジンから報知される対
話状態と案内に関する情報との対応を記述するテーブル
がさらに備えられている。すなわち、アプリケーション
が、対話処理専用エンジンから対話状態を得て、音声対
話中に音声合成又はPCM音声によるガイダンスを実行
する場合、対話処理専用エンジンから返される対話状態
とガイダンスの種類又は内容に関する情報との対応テー
ブルを用いることで、その機能を実現する。かくして、
音声対話中のシステムの音声案内を対話の状態によって
変えることができる。その結果、ユーザは、次に発声さ
れうる内容についての情報を対話状態ごとに把握するこ
とができ、対話がスムーズになされることとなる。
【0037】また、本発明による対話処理専用エンジン
は、遷移条件及び動作を規定する状態遷移図に基づいて
対話の流れを制御する。すなわち、対話の流れが、図3
(A)に例示されるような状態遷移図を用いて表現され
る。そして、個々の状態にシステム動作の条件や指示を
割り当てるべくその条件や指示をデータ化したものが、
図3(B)に示されるように準備されている。対話処理
専用エンジンは、図3(B)のデータを参照することに
より条件を判断し、ユーザの発する音声の認識の開始の
要求、音声による案内の要求、画面の表示の要求等の動
作要求を音声認識エンジン、音声合成エンジン又は画像
表示エンジンに対して発行する。このように、音声対話
のパターン(対話の流れに伴うシステム動作)をデータ
として表現すること、すなわち対話パターンをデータベ
ース化することにより、移植性、メンテナンス性等の向
上が図られる。
【0038】また、対話処理専用エンジンは、ユーザの
発声内容が格納されるスロット及び動作を有するフレー
ム構造に基づいて対話の流れを制御するようにしてもよ
い。すなわち、図4に例示されるようなフレーム構造を
用いることにより、対話の流れが制御される。図4に示
されるように、フレームにはそれぞれ属性を持った複数
のスロットが存在し、そのスロットにユーザの発声内容
に基づく認識結果が格納されるよう、対話処理専用エン
ジンは、図5のフローチャートに従う処理動作を実行す
る。このように、音声対話のパターン(対話の流れに伴
うシステム動作)をデータとして表現すること、すなわ
ち対話パターンをデータベース化することにより、移植
性、メンテナンス性等の向上が図られる。
【0039】また、対話処理専用エンジンは、ユーザの
発声内容が格納されるスロットを有するフレーム構造に
おけるスロットの埋まり方のパターンに基づいて対話の
流れを制御するようにしてもよい。すなわち、図6に示
されるフレーム構造を用いて対話を進める場合に、スロ
ット埋まり方のパターンを図7のテーブルのように定義
する。そして、その埋まり方のパターンに対応したシス
テム動作を図8のテーブルで定義する。例えば、図6の
フレーム構造において「目的地」及び「出発地」が埋ま
っている場合には、図7のテーブルからパターンEと認
識され、続いて図8のテーブルから当該パターンに対応
した動作、すなわち「経由地を設定しますか」という内
容の音声合成が実行される。この場合においても、音声
対話のパターン(対話の流れに伴うシステム動作)をデ
ータとして表現すること、すなわち対話パターンをデー
タベース化することにより、移植性、メンテナンス性等
の向上が図られることとなる。
【0040】さらに、対話処理専用エンジンは、遷移条
件及び動作を規定する状態遷移図と、ユーザの発声内容
が格納されるスロットを有するフレーム構造におけるス
ロットの埋まり方のパターンと、に基づいて対話の流れ
を制御するようにしてもよい。すなわち、前述した状態
遷移図から得られるデータによる対話と、やはり前述し
たフレームによって進められる対話とを、図9に示され
るように、組み合わせて実行することができる。この場
合においても、音声対話のパターン(対話の流れに伴う
システム動作)をデータとして表現すること、すなわち
対話パターンをデータベース化することにより、移植
性、メンテナンス性等の向上が図られることとなる。
【0041】また、本発明による対話処理専用エンジン
は、対話状態に応じた単語辞書の領域を記述したテーブ
ルを参照して、対話状態が変化する毎に対応する単語辞
書の領域を音声認識エンジンに報知する。すなわち、図
10に示されるように、対話状態に対応させた単語辞書
の領域を記述したテーブルが予め用意される。そして、
対話処理専用エンジンは、対話状態が変わるその都度、
図10のテーブルを参照して、単語辞書の領域のアドレ
スを音声認識エンジンに送ることにより、使用されるべ
き単語辞書を設定する。これは、対話中の各状態におい
てユーザが発声することができる単語のみを格納する単
語辞書が参照されるようにするためである。かくして、
照合に用いられる単語辞書の語彙数が限定されるため、
応答速度の向上及び認識率の向上が図られる。
【0042】また、本発明による対話処理専用エンジン
は、アプリケーションプログラムの要求に応じて、音声
認識エンジンに対する接続権をアプリケーションプログ
ラムに一時的に移転する機能を有している。音声認識エ
ンジンは、接続された唯一のアプリケーションによる動
作要求のみを受け付けるものであるが、対話処理専用エ
ンジンは、他のアプリケーションに優先して音声認識エ
ンジンとの接続権を有している。したがって、他のアプ
リケーションが音声認識エンジンを使用する場合、対話
処理専用エンジンに対して音声認識エンジンとの接続権
を開放するよう要求し、開放後に音声認識エンジンとの
接続を行う。
【0043】このように対話処理専用エンジンが音声認
識エンジンとの接続権を開放することにより、対話処理
専用エンジンだけでなく、他のアプリケーションも音声
認識エンジンを使用することができる。孤立単語音声認
識や連続単語音声認識による音声操作で機器操作を十分
に行うことができる場合には、対話処理専用エンジンを
通さないで他のアプリケーションが直接音声認識エンジ
ンを使用する方が応答時間の短縮につながるため、上述
の接続権開放が有効となる。
【0044】図11は、本発明による音声対話システム
を用いたナビゲーションシステムのソフトウェア構成を
示す図である。図11に示されるように、対話処理専用
エンジンは、対話の履歴を管理する対話履歴管理部を有
し、対話の履歴に基づくシステムの案内の変更を可能に
している。そして、対話履歴管理部は、音声認識エンジ
ンのエラーの回数、音声認識エンジンの誤認識による発
声のやり直しの回数、及び音声認識エンジンにおけるタ
イムアウトの回数を管理する。すなわち、対話中のユー
ザ発声に対する音声認識エンジンのエラーや、誤認識に
よる発声のやり直し、タイムアウトなどの回数が対話履
歴管理部でカウントされる。
【0045】そして、それらの回数を条件とすることで
エラーややり直しの回数に応じて異なる対話の遷移を実
現することができる。詳細には、音声認識エンジンが認
識エラーを返してきたときの発声のやり直しの回数によ
って、システムからのガイダンスを変更することができ
る。また、音声認識エンジンが誤認識結果を返してきた
ときの発声のやり直しの回数によって、システムからの
ガイダンスを変更することができる。また、ユーザが発
声可能なときに発声を行わなかった場合のタイムアウト
の回数によって、システムからのガイダンスを変更する
ことができる。かくして、同じ操作を複数回行うことか
ら生ずるユーザの不快感を、異なるガイダンスを提供す
ることで、軽減することができる。
【0046】また、図11に示されるように、対話処理
専用エンジンは、前記した対話履歴管理部からのタイム
アウト情報に基づいて音声対話の中断処理を行うタイム
アウト制御部を有している。対話処理専用エンジンは、
ユーザが発声可能な状態にあるときにタイムアウト処理
を行い、ある一定時間以上ユーザの発声がなかった場合
には、音声認識エンジンに音声認識中断要求を行うとと
もに、アプリケーションには再発声要求のガイダンスを
要求し、更に、対話履歴管理部にタイムアウト履歴の情
報を渡す。タイムアウトが起こったと判断された場合に
おいて、対話履歴管理部からの情報で、それが複数回目
のタイムアウトであると判断されたときには、音声認識
中断要求、ガイダンス要求をした後、対話の中断処理を
行う。このように、ユーザが発声可能なときに発声を行
わなかった場合のタイムアウトの回数によって、音声対
話の中断を行うことができる。そのため、ユーザが発声
不可能な状況にあるときには、音声操作を中断させて、
他の動作に集中させることが可能となる。
【0047】そして、前記した対話履歴管理部は、対話
処理専用エンジンとアプリケーションプログラムとの共
通タスクとして構成することが好ましい。このように構
成することにより、対話処理専用エンジンを介すること
なく、孤立単語音声認識又は連続単語音声認識を行う場
合に、音声認識エンジンが誤認識結果を返したときの発
声のやり直しの回数又は音声認識エンジンが認識エラー
を返したときの発声のやり直しの回数によって、システ
ムからのガイダンスを変更することができる。かくし
て、同じ操作を複数回行うことから生ずるユーザの不快
感を、異なるガイダンスを提供することで、軽減するこ
とができる。
【0048】また、対話履歴管理部に加えて、前記した
タイムアウト制御部も、対話処理専用エンジンとアプリ
ケーションプログラムとの共通タスクとして構成される
ことが好ましい。このように構成することにより、対話
処理専用エンジンを介することなく、孤立単語音声認識
又は連続単語音声認識を行う場合に、ユーザが発声可能
なときに発声を行わなかった場合のタイムアウトの回数
によって、システムからのガイダンスを変更することが
できる。かくして、同じ操作を複数回行うことから生ず
るユーザの不快感を、異なるガイダンスを提供すること
で、軽減することができる。
【0049】また、本発明による対話処理専用エンジン
は、図11に示される音声認識エンジン内の意味抽出タ
スクを管理及び制御し、ユーザから入力された文章を入
力して該文章の意味抽出を行うことにより、文字入力に
よる対話を実現する。かくして、対話処理専用エンジン
は、文章入力とシステムの音声案内による対話とを行う
ことができるようになり、音声による対話が不可能又は
困難である場合には、音声の代用として文章が入力され
ることで機器操作が行われる。
【0050】
【発明の効果】以上説明したように、本発明によれば、
車両に搭載された機器の複雑な操作を自由発話による対
話形式で遂行することを可能となる。
【図面の簡単な説明】
【図1】本発明による音声対話システムの一実施形態を
示すシステム構成図である。
【図2】他の実施形態を示すシステム構成図である。
【図3】状態遷移図に基づく対話の流れの制御を説明す
るための図である。
【図4】フレーム構造の例を示す図である。
【図5】図4に示されるフレーム構造に基づく対話の流
れの制御を説明するための図である。
【図6】フレーム構造の他の例を示す図である。
【図7】図6のフレーム構造におけるスロットの埋まり
方に応じて定められるパターンを示す図である。
【図8】図7のパターンに応じて定められるシステム動
作を示す図である。
【図9】状態遷移図及びフレーム構造に基づく対話の流
れの制御を説明するための図である。
【図10】対話状態に応じて単語辞書の領域を記述した
テーブルを示す図である。
【図11】本発明による音声対話システムを用いたナビ
ゲーションシステムのソフトウェア構成を示す図であ
る。
【符号の説明】
12…ディスプレイ 14…スピーカ 16…マイク 18…音声対話開始スイッチ 20…処理装置 22…外部メモリ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551J 15/28 561C 571J (72)発明者 岩本 真一 兵庫県神戸市兵庫区御所通1丁目2番28号 富士通テン株式会社内 Fターム(参考) 5D015 AA05 KK01 KK04 LL05 LL10 5D045 AB17 AB30

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 車両に搭載された機器の操作をユーザと
    の対話に基づいて遂行する音声対話システムであって、 映像出力装置と、 音声出力装置と、 音声入力装置と、 前記映像出力装置に画像を表示する処理を行う画像表示
    エンジンと、 前記音声入力装置から入力される音声のパターンを認識
    する処理を行う音声認識エンジンと、 前記音声出力装置から出力されるべき音声を電子的に合
    成する処理を行う音声合成エンジンと、 アプリケーションプログラムの指示を受けて前記画像表
    示エンジン、前記音声認識エンジン及び前記音声合成エ
    ンジンを制御する対話処理専用エンジンと、 前記音声認識エンジン、前記音声合成エンジン及び前記
    対話処理専用エンジンによって参照される対話用データ
    ベースと、 を具備する音声対話システム。
  2. 【請求項2】 前記対話用データベースが外部メモリ上
    に構成される、請求項1に記載の音声対話システム。
  3. 【請求項3】 前記対話用データベースは、対話の流れ
    を記述した対話モデルデータ及びユーザが発生可能な語
    彙データを記述した発話モデルを格納する、請求項1に
    記載の音声対話システム。
  4. 【請求項4】 前記対話処理専用エンジンは、対話状態
    と画面表示状態との対応関係を記憶したテーブルを具備
    し、アプリケーションプログラムに現在の対話状態を報
    知することにより、対話内容に応じた画面表示の切り替
    えを可能にする、請求項1に記載の音声対話システム。
  5. 【請求項5】 前記対話処理専用エンジンは、アプリケ
    ーションプログラムからスイッチ操作情報を受けて音声
    対話を中断及び再開する、請求項1に記載の音声対話シ
    ステム。
  6. 【請求項6】 前記対話処理専用エンジンは、対話状態
    と画面表示状態との対応関係を記憶したテーブルを具備
    し、アプリケーションプログラムから現在の画面表示状
    態についての情報を受けて、当該画面表示状態に応じた
    対話状態からの音声対話を開始する、請求項1に記載の
    音声対話システム。
  7. 【請求項7】 アプリケーションプログラムが音声対話
    中のシステムの音声案内を対話状態に応じて切り替える
    ことができるように、前記対話処理専用エンジンから報
    知される対話状態と案内に関する情報との対応関係を記
    憶するテーブルをさらに具備する、請求項1に記載の音
    声対話システム。
  8. 【請求項8】 前記対話処理専用エンジンは、遷移条件
    及び動作を規定する状態遷移図に基づいて対話の流れを
    制御する、請求項1に記載の音声対話システム。
  9. 【請求項9】 前記対話処理専用エンジンは、ユーザの
    発声内容が格納されるスロット及び動作を有するフレー
    ム構造に基づいて対話の流れを制御する、請求項1に記
    載の音声対話システム。
  10. 【請求項10】 前記対話処理専用エンジンは、ユーザ
    の発声内容が格納されるスロットを有するフレーム構造
    におけるスロットの埋まり方のパターンに基づいて対話
    の流れを制御する、請求項1に記載の音声対話システ
    ム。
  11. 【請求項11】 前記対話処理専用エンジンは、遷移条
    件及び動作を規定する状態遷移パターンと、ユーザの発
    声内容が格納されるスロットを有するフレーム構造にお
    けるスロットの埋まり方のパターンと、に基づいて対話
    の流れを制御する、請求項1に記載の音声対話システ
    ム。
  12. 【請求項12】 前記対話処理専用エンジンは、対話状
    態に応じた単語辞書の領域を記憶したテーブルを参照し
    て、対話状態が変化する毎に対応する単語辞書の領域を
    前記音声認識エンジンに報知する、請求項1に記載の音
    声対話システム。
  13. 【請求項13】 前記対話処理専用エンジンは、アプリ
    ケーションプログラムの要求に応じて、前記音声認識エ
    ンジンに対する接続権をアプリケーションプログラムに
    一時的に移転する機能を有する、請求項1に記載の音声
    対話システム。
  14. 【請求項14】 前記対話処理専用エンジンは、対話の
    履歴を管理する対話履歴管理部を有し、対話の履歴に基
    づくシステムの案内の変更を可能にする、請求項1に記
    載の音声対話システム。
  15. 【請求項15】 前記対話履歴管理部は、前記音声認識
    エンジンのエラーの回数を管理する、請求項14に記載
    の音声対話システム。
  16. 【請求項16】 前記対話履歴管理部は、前記音声認識
    エンジンの誤認識による発声のやり直しの回数を管理す
    る、請求項14に記載の音声対話システム。
  17. 【請求項17】 前記対話履歴管理部は、前記音声認識
    エンジンにおけるタイムアウトの回数を管理する、請求
    項14に記載の音声対話システム。
  18. 【請求項18】 前記対話処理専用エンジンは、前記対
    話履歴管理部からのタイムアウト情報に基づいて音声対
    話の中断処理を行うタイムアウト制御部を有する、請求
    項17に記載の音声対話システム。
  19. 【請求項19】 前記対話履歴管理部が、前記対話処理
    専用エンジンとアプリケーションプログラムとの共通タ
    スクとして構成されている、請求項14に記載の音声対
    話システム。
  20. 【請求項20】 前記対話履歴管理部及び前記タイムア
    ウト制御部が、前記対話処理専用エンジンとアプリケー
    ションプログラムとの共通タスクとして構成されてい
    る、請求項18に記載の音声対話システム。
  21. 【請求項21】 前記対話処理専用エンジンは、前記音
    声認識エンジン内の意味抽出タスクを管理及び制御し、
    ユーザから入力された文章を入力して該文章の意味抽出
    を行うことにより、文字入力による対話を実現する、請
    求項1に記載の音声対話システム。
JP30575699A 1999-10-27 1999-10-27 音声対話システム Pending JP2001125591A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30575699A JP2001125591A (ja) 1999-10-27 1999-10-27 音声対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30575699A JP2001125591A (ja) 1999-10-27 1999-10-27 音声対話システム

Publications (2)

Publication Number Publication Date
JP2001125591A true JP2001125591A (ja) 2001-05-11
JP2001125591A5 JP2001125591A5 (ja) 2007-08-16

Family

ID=17948977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30575699A Pending JP2001125591A (ja) 1999-10-27 1999-10-27 音声対話システム

Country Status (1)

Country Link
JP (1) JP2001125591A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053470A (ja) * 2004-08-16 2006-02-23 Nippon Telegr & Teleph Corp <Ntt> 音声対話シーケンス状態表記方法、プログラム、および音声対話装置
JP2007041319A (ja) * 2005-08-03 2007-02-15 Matsushita Electric Ind Co Ltd 音声認識装置および音声認識方法
JP2008089625A (ja) * 2006-09-29 2008-04-17 Honda Motor Co Ltd 音声認識装置、音声認識方法及び音声認識プログラム
WO2008084575A1 (ja) * 2006-12-28 2008-07-17 Mitsubishi Electric Corporation 車載用音声認識装置
JP2018120372A (ja) * 2017-01-24 2018-08-02 京セラドキュメントソリューションズ株式会社 電子機器及び画像形成装置
US10083003B2 (en) 2014-10-17 2018-09-25 Hyundai Motor Company Audio video navigation (AVN) apparatus, vehicle, and control method of AVN apparatus
JP2018181219A (ja) * 2017-04-20 2018-11-15 株式会社計数技研 音声操作デバイス及び音声操作プログラム
JP2019507895A (ja) * 2016-03-16 2019-03-22 グーグル エルエルシー 言語モデルに関する対話状態の判定
JP2019120904A (ja) * 2018-01-11 2019-07-22 トヨタ自動車株式会社 情報処理装置、方法、及びプログラム
JP2021051212A (ja) * 2019-09-25 2021-04-01 トヨタ自動車株式会社 情報処理方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4535804B2 (ja) * 2004-08-16 2010-09-01 日本電信電話株式会社 音声対話シーケンス状態表記方法、プログラム、および音声対話装置
JP2006053470A (ja) * 2004-08-16 2006-02-23 Nippon Telegr & Teleph Corp <Ntt> 音声対話シーケンス状態表記方法、プログラム、および音声対話装置
JP2007041319A (ja) * 2005-08-03 2007-02-15 Matsushita Electric Ind Co Ltd 音声認識装置および音声認識方法
JP4680714B2 (ja) * 2005-08-03 2011-05-11 パナソニック株式会社 音声認識装置および音声認識方法
JP2008089625A (ja) * 2006-09-29 2008-04-17 Honda Motor Co Ltd 音声認識装置、音声認識方法及び音声認識プログラム
US8315868B2 (en) 2006-12-28 2012-11-20 Mitsubishi Electric Corporation Vehicle-mounted voice recognition and guidance apparatus
JP2012027487A (ja) * 2006-12-28 2012-02-09 Mitsubishi Electric Corp 車載用音声認識装置
WO2008084575A1 (ja) * 2006-12-28 2008-07-17 Mitsubishi Electric Corporation 車載用音声認識装置
JP5137853B2 (ja) * 2006-12-28 2013-02-06 三菱電機株式会社 車載用音声認識装置
JPWO2008084575A1 (ja) * 2006-12-28 2010-04-30 三菱電機株式会社 車載用音声認識装置
US10083003B2 (en) 2014-10-17 2018-09-25 Hyundai Motor Company Audio video navigation (AVN) apparatus, vehicle, and control method of AVN apparatus
US10553214B2 (en) 2016-03-16 2020-02-04 Google Llc Determining dialog states for language models
JP2019507895A (ja) * 2016-03-16 2019-03-22 グーグル エルエルシー 言語モデルに関する対話状態の判定
JP2018120372A (ja) * 2017-01-24 2018-08-02 京セラドキュメントソリューションズ株式会社 電子機器及び画像形成装置
JP2018181219A (ja) * 2017-04-20 2018-11-15 株式会社計数技研 音声操作デバイス及び音声操作プログラム
JP2019120904A (ja) * 2018-01-11 2019-07-22 トヨタ自動車株式会社 情報処理装置、方法、及びプログラム
JP7069730B2 (ja) 2018-01-11 2022-05-18 トヨタ自動車株式会社 情報処理装置、方法、及びプログラム
JP2021051212A (ja) * 2019-09-25 2021-04-01 トヨタ自動車株式会社 情報処理方法
JP7259680B2 (ja) 2019-09-25 2023-04-18 トヨタ自動車株式会社 情報処理方法

Similar Documents

Publication Publication Date Title
US10496759B2 (en) User interface for realtime language translation
US20200410174A1 (en) Translating Languages
EP1175060B1 (en) Middleware layer between speech related applications and engines
US11669300B1 (en) Wake word detection configuration
EP1521239B1 (en) Multi-modal input form with dictionary and grammar
US7624018B2 (en) Speech recognition using categories and speech prefixing
US6591236B2 (en) Method and system for determining available and alternative speech commands
JP2001125591A (ja) 音声対話システム
JP2002032370A (ja) 情報処理装置
US7181397B2 (en) Speech dialog method and system
JP2002259114A (ja) 音声認識コンピュータシステム
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP4268325B2 (ja) 音声操作語句の提示装置及び提示方法
CN115171683A (zh) 语音交互方法、车载娱乐系统、车辆及存储介质
JP2001083983A (ja) 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP2008310344A (ja) 提示装置及び提示方法
JP2005309185A (ja) 音声入力装置、および音声入力方法
WO2015102039A1 (ja) 音声認識装置
JP2006330486A (ja) 音声合成装置、この音声合成装置を備えるナビゲーション装置、音声合成プログラム及びこのプログラムを記憶した情報記憶媒体
JP2007127895A (ja) 音声入力装置及び音声入力方法
JP2001083982A (ja) 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP2001242887A (ja) 音声認識装置および音声認識ナビゲーション装置
JP2006171399A (ja) データ入力装置
JPH04116699A (ja) 音声合成器
KR20040016692A (ko) 휴대용 동시 통역 장치 및 그 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061023

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070628

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091208