JP2003131692A - Interactive device - Google Patents

Interactive device

Info

Publication number
JP2003131692A
JP2003131692A JP2001326579A JP2001326579A JP2003131692A JP 2003131692 A JP2003131692 A JP 2003131692A JP 2001326579 A JP2001326579 A JP 2001326579A JP 2001326579 A JP2001326579 A JP 2001326579A JP 2003131692 A JP2003131692 A JP 2003131692A
Authority
JP
Japan
Prior art keywords
output
output information
information
unit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001326579A
Other languages
Japanese (ja)
Other versions
JP3894767B2 (en
Inventor
Masayuki Nakazawa
正幸 中沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001326579A priority Critical patent/JP3894767B2/en
Publication of JP2003131692A publication Critical patent/JP2003131692A/en
Application granted granted Critical
Publication of JP3894767B2 publication Critical patent/JP3894767B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

PROBLEM TO BE SOLVED: To make the device to be easily used by various types of people including children, adults, elderly people and persons who are not familiar with the system or feel uneasiness while using the system and to change output information in accordance with the needs of the user so that the system becomes easy to be used in accordance with the frequency of utilization and the degree of familiarity. SOLUTION: The interactive device is provided with a portion which successively controls output information of the system, a portion which halfway stops the output information of the system, a portion which changes the output information of the system and a table which holds output change patterns used to change the output information of the system.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、ユーザとの間で音
声対話を行う対話装置に関し、特にマルチモーダル・イ
ンタフェースを用いた対話装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dialog device for performing a voice dialog with a user, and more particularly to a dialog device using a multimodal interface.

【0002】[0002]

【従来の技術】一般に、ユーザとシステムとの対話イン
タフェースの利用に際しては、ユーザに適した応答機能
とその学習機能、また、「案内システム」、「秘書シス
テム」、「受付システム」など一般的なタスクの遂行を
実現する機能、音声・ジェスチャなどの入力手段とその
認識機能、擬人エージェントなどを用いた出力手段とそ
の出力機能が必要となる。
2. Description of the Related Art Generally, when using an interactive interface between a user and a system, a response function suitable for the user and a learning function for the user, and a general system such as "guidance system", "secretary system", "reception system", etc. It is necessary to have a function for realizing task execution, an input means such as voice / gesture and its recognition function, and an output means using an anthropomorphic agent and its output function.

【0003】従来、このような機能の実現のためには、
マイクによる音声入力や音声認識機能、カメラなどによ
る画像入力を用いた顔画像入力機能、ルールベースによ
る対話管理機能、あらかじめ用意された対話の流れのス
クリプトを利用する方法などが用いられている。このよ
うなシステムは、1つまたは複数の入力手段からの情報
を認識し、該当するタスクの進行に合わせて統合的に制
御する。制御結果は、1つまたは複数の出力は手段を用
いて、ユーザに出力される。
Conventionally, in order to realize such a function,
A voice input and a voice recognition function with a microphone, a face image input function using an image input with a camera, a dialogue management function with a rule base, a method of using a script of a dialogue flow prepared in advance are used. Such a system recognizes information from one or more input means and controls it integrally according to the progress of the corresponding task. The control results are output to the user using one or more output means.

【0004】ここで問題となるのは、対話システムを利
用するユーザには、子供や大人、老人など、システムに
すぐに馴染めない人や使いにくさを感じる人など、いろ
いろなタイプがあるという点である。言い換えれば、対
話システムは、不特定多数のユーザを対象としており、
使う人によって、その対応の仕方は、千差万別であると
いう点である。しかも、同一のユーザでも使用頻度や慣
れに応じて操作方法が変化する。そのため、対話システ
ムは、ユーザの好みに合わせて入力手段・出力手段の形
態や応答速度を変更できなければならない。さらに、使
用頻度や慣れに応じて、ユーザの好みに合った形態に変
化できるような機能を提供しなければならない。
The problem here is that there are various types of users who use the dialogue system, such as children, adults, and elderly people who are not immediately familiar with the system or who find it difficult to use. Is. In other words, the dialogue system is aimed at an unspecified number of users,
Depending on the user, the way to deal with it varies. Moreover, the operation method changes even for the same user depending on the frequency of use and familiarity. Therefore, the interactive system must be able to change the form of the input means / output means and the response speed according to the user's preference. Furthermore, it must provide a function that can be changed into a form that suits the user's taste according to the frequency of use and familiarity.

【0005】このような機能が欠けている場合、システ
ムの応答はどのユーザに対しても変わらず常に一定の応
対をするため、システムが本来持っている使いにくい個
所、使用頻度の多さや慣れからくる使いにくさをユーザ
に強いることになる。すなわち、対話システムに音声や
ジェスチャ、擬人化インタフェース等を用いることによ
り、一定の機能と使いやすさを提供できることは当然の
こととして、上記の問題のユーザの利用形態にも適応す
ることが求められる。そして、対話システム側からユー
ザに何等かの返答をする場合、システムの状況を適確に
伝えることが、ユーザの立場に立った使い勝手のよいヒ
ューマンインタフェースとして重要である。
When such a function is lacking, the response of the system does not change to any user and always responds to a certain amount of time. Therefore, it is difficult to use, the frequency of use and familiarity inherent in the system. It will force users to use it. That is, it is natural that it is possible to provide a certain function and usability by using a voice, gesture, anthropomorphic interface, etc. in the dialogue system, and it is required to adapt to the user's usage pattern of the above problem. . When the dialog system makes some kind of reply to the user, it is important for the user interface to be appropriately communicated as a human interface that is easy to use from the viewpoint of the user.

【0006】対話システムの従来の技術としては、NT
Tコミュニケーション科学基礎研究所で開発されている
対話システム「音声対話で柔軟なやりとりができるコン
ピュータ;音声対話システムDUG−1」(JTT誌2
000年12月号Vol.23,No.12;アドバン
ストテクノロジ株式会社)のように、逐次理解型・逐次
生成法という技術を用いることで、自然なやりとりを実
現しているものがある。ここでは、システムが出力途中
にユーザからの入力があった場合、出力停止し、ユーザ
からの新しい入力に対応するという方法を行っている。
つまり、図13(a)に示すような処理の流れになって
いる。
[0006] As a conventional technique of the dialogue system, NT
Dialogue system "Computers that can exchange flexibly in spoken dialogue; Spoken dialogue system DUG-1" developed by T Communication Science Laboratories (JTT magazine 2
December 2000 issue Vol. 23, No. 12; Advanced Technology Co., Ltd.), a natural interaction is realized by using a technique called a sequential understanding type / sequential generation method. Here, when the system receives an input from the user during the output, the output is stopped and a new input from the user is dealt with.
That is, the processing flow is as shown in FIG.

【0007】図13(a)に示す従来技術では、「水曜
日は、長谷川人事部長と打ち合わせがあります。」とい
う内容を対話システムが出力している途中で、ユーザに
「川崎課長は?」と割り込まれた場合を示している。ただ
し、「水曜日は」、「長谷川人事部長と」、「打ち合わ
せがあります。」、「川崎課長との打ち合わせは」、
「午後4時から午後5時までです。」という単位でユーザ
の入力がないかどうかチェックを行っていると仮定す
る。以下、これらの単位を入力に関する場合は単位入力
情報と、出力に関する場合は単位出力情報という。
In the prior art shown in FIG. 13 (a), while the dialogue system is outputting the content of "I have a meeting with the personnel manager of Hasegawa on Wednesday", the user is asked "What is Kawasaki?" The case is shown. However, "Wednesday", "Hasegawa Human Resources Manager", "Meetings", "Meeting with Kawasaki Manager",
It is assumed that the user is checking whether or not there is any input in the unit “4 pm to 5 pm”. Hereinafter, these units will be referred to as unit input information when inputting and unit output information when outputting.

【0008】従来の対話システムでは、「長谷川人事部
長と」という単位出力情報の出力を行っている最中に、
「川崎課長は?」という入力がユーザから割り込まれた場
合、「打ち合わせがあります。」という出力を中止し、
「はい」という相槌を生成する。その後、割り込んだユ
ーザ情報を解釈した後、「川崎課長との打ち合わせ
は」、「午後4時から午後5時までです。」というよう
に単位出力情報毎に出力を行う。中には、「はい」という
相槌がなく、そのまま「「川崎課長との打ち合わせは」、
「午後4時から午後5時までです。」という出力を行う例
もある。
In the conventional dialogue system, while the unit output information "Hasegawa Human Resources Manager" is being output,
If the user interrupts the input "What is Kawasaki?", The output "I have a meeting." Is canceled,
Creates an Azuchi "Yes". After that, after interpreting the interrupted user information, output is made for each unit output information such as "meeting with Kawasaki section manager" and "from 4 pm to 5 pm". There is no “yes” agreement inside, and “just having a meeting with manager Kawasaki”
There is also an example of outputting "4 pm to 5 pm".

【0009】図14は、従来のシステムを示すブロック
図であり、図15は、従来のシステムの処理を示すフロ
ーチャートであり、図16は、出力パターンテーブルの
一例を示す図である。図14において、ユーザ情報入力
部1401では、ユーザから入力された音声信号や画像
イメージ等の入力情報を元に認識前処理及び認識処理を
行う。この認識処理は、例えば、音声認識では、単語毎
またはユーザ発話単位毎に認識結果を出力するのではな
く、入力された信号が部分的に認識された場合でも出力
を行う。すなわち、入力された信号の認識時間待ちで、
その後の処理が遅れることのないように、ある一定の時
間間隔または、ある範囲での時間間隔で部分的な認識結
果を出力する。
FIG. 14 is a block diagram showing a conventional system, FIG. 15 is a flowchart showing the processing of the conventional system, and FIG. 16 is a diagram showing an example of an output pattern table. In FIG. 14, a user information input unit 1401 performs pre-recognition processing and recognition processing based on input information such as a voice signal and an image input by a user. In the recognition process, for example, in voice recognition, the recognition result is not output for each word or each user utterance unit, but is output even when the input signal is partially recognized. That is, waiting for the recognition time of the input signal,
The partial recognition result is output at a certain time interval or a certain range of time intervals so that the subsequent processing is not delayed.

【0010】ある一定の時間間隔または、ある範囲での
時間間隔で部分的な認識結果を出力する音声認識装置と
しては、これまでに数多くの手法が提案・開発されてい
る。その中で例えば、特開平5−197389号公報に
は、無意味な語の発声や複数の文を連続的に発声するよ
うな自然な発話について対応できるような「音声認識装
置」が開示されており、特開平3−191400号公報
には、離散型HMM(離散型の隠れマルコフモデル)を
用いて高い音声認識性能を得る「音声認識装置」が開示
されている。
As a speech recognition apparatus which outputs a partial recognition result at a certain time interval or a time interval within a certain range, many methods have been proposed and developed so far. Among them, for example, Japanese Unexamined Patent Publication (Kokai) No. 5-197389 discloses a "speech recognition device" capable of coping with utterances of meaningless words and natural utterances such as continuously uttering a plurality of sentences. Japanese Patent Laying-Open No. 3-191400 discloses a "speech recognition device" that obtains high speech recognition performance by using a discrete HMM (discrete hidden Markov model).

【0011】更に、ジェスチャ認識装置としては、これ
まで、いくつかの手法が提案・開発されており、このう
ち典型的な手法としては、例えば、特開平6−1249
3号公報に開示されているように、マウスやペンの時系
列の動きからDP(ダイナミックプログラミング;動的
計画法)マッチングを用いてジェスチャを検出し、該ジ
ェスチャに対応したコマンドを実行させるコンピュータ
のユーザインタフェース「ジェスチャ認識方法およびユ
ーザインタフェース方法」が提案されており、特開平1
0−162151号公報には、被写体のジェスチャを撮
像した画像から時間差分画像を取得して2値化し、差分
画像の特徴量から、連続DPを用いて特徴パターン用の
特徴ベクトルを取得する「ジェスチャ認識方法」が提案
されている。更に、特開2000−149025公報に
は、自由に位置/姿勢が変化するユーザのジェスチャを
認識し、仮想空間内のCG(コンピュータグラフィッ
ク)物体の操作等に用いて好適とされる「ジェスチャ認
識装置及び方法」が提案されている。
Further, as a gesture recognition device, several methods have been proposed and developed so far, and a typical method among them is, for example, Japanese Patent Laid-Open No. 6-1249.
As disclosed in Japanese Patent Publication No. 3, a computer that detects a gesture using DP (dynamic programming; dynamic programming) matching from a time-series movement of a mouse or a pen and executes a command corresponding to the gesture. A user interface "gesture recognition method and user interface method" has been proposed, and is disclosed in Japanese Patent Laid-Open No. Hei 1
In Japanese Patent Laid-Open No. 0-162151, a time difference image is acquired from a captured image of a gesture of a subject, binarized, and a feature vector for a feature pattern is acquired from a feature amount of the difference image using continuous DP. Recognition method ”has been proposed. Further, Japanese Patent Laid-Open No. 2000-149025 discloses a "gesture recognition device" which is suitable for recognizing a user's gesture whose position / orientation freely changes and for operating a CG (computer graphic) object in a virtual space. And method ”have been proposed.

【0012】システム出力情報生成部1402では、ユ
ーザ情報入力部1401から受け取ったユーザ入力情報
の部分的、あるいは全体の認識結果を元に、システムの
応答内容である出力情報の生成を出力パターンテーブル
1404の情報を参照しながら行う。ユーザの入力情報
が複数に及ぶ場合、それぞれの認識結果は、このシステ
ム出力情報生成部1402で統合される。例えば、特開
平8−234789号公報に開示されている「統合認識
対話装置」、特開平9−114634号公報に開示され
ている「マルチモーダル情報統合解析装置」では、マル
チモーダル対話データベースの情報を元にして、複数の
入力チャネルからの入力を統合して扱う方法を提案して
いる。
The system output information generation unit 1402 generates the output information which is the response content of the system based on the partial or whole recognition result of the user input information received from the user information input unit 1401 and outputs the output pattern table 1404. Refer to the information in. When the user's input information includes a plurality of pieces, the recognition results are integrated by the system output information generation unit 1402. For example, in the "integrated recognition dialogue device" disclosed in Japanese Patent Laid-Open No. 8-234789 and the "multimodal information integrated analysis device" disclosed in Japanese Patent Laid-Open No. 9-114634, information in a multimodal dialogue database is stored. Originally, we proposed a method to handle inputs from multiple input channels in an integrated manner.

【0013】システム情報出力部1403では、システ
ム出力情報生成部1402から送られてくる出力情報の
出力を行う。一般に、システムの情報を音声、擬人化エ
ージェントを用いて出力する場合、スピーカ、モニタ等
の出力装置が必要になる。システム出力情報生成部14
02から出力停止命令が送信された場合、システム情報
出力部1403は、直ちにシステム情報の出力を停止す
る。出力停止命令が送信される状態とは、システムがシ
ステム情報出力部1403において、情報を出力中で、
ユーザ情報入力部1401にユーザからの入力が入り、
システム出力情報生成部1402で、そのユーザ入力情
報に対応した情報を出力する場合である。
The system information output unit 1403 outputs the output information sent from the system output information generation unit 1402. Generally, when outputting system information using voice or anthropomorphic agent, an output device such as a speaker or a monitor is required. System output information generation unit 14
When the output stop command is transmitted from 02, the system information output unit 1403 immediately stops the output of the system information. The state in which the output stop command is transmitted means that the system is outputting information in the system information output unit 1403,
Input from the user is input to the user information input unit 1401,
This is a case where the system output information generation unit 1402 outputs information corresponding to the user input information.

【0014】図15に示すフローチャートを用いて具体
的に説明する。ステップS1501でユーザ情報入力部
1401はユーザからの入力があるかどうかチェックす
る。ユーザからの入力とは、音声・ジェスチャ・視線等
を示唆し、システムが入力対象とするユーザからの情報
である。ユーザからの入力があるまで、チェックが続け
られる。ユーザからの入力がある場合は、ステップS1
502で入力情報の解析が行われる。これは、音声入力
の場合は、音声認識であったり、CCDカメラ等からの
ジェスチャの入力であった場合は、ジェスチャ認識に相
当する。
A specific description will be given with reference to the flowchart shown in FIG. In step S1501, the user information input unit 1401 checks whether there is an input from the user. The input from the user is information from the user, which is a target of input by the system, suggesting voice, gesture, line of sight, and the like. The check continues until there is input from the user. If there is an input from the user, step S1
At 502, the input information is analyzed. This corresponds to voice recognition in the case of voice input or gesture recognition in the case of gesture input from a CCD camera or the like.

【0015】ステップS1503では、システム出力情
報生成部1402で出力パターンテーブル1404を参
照して、入力した情報に応じ単位出力情報が算出され、
出力に備えて用意される。例えば、受け付け案内システ
ムで「おはよう」というユーザ入力に対して、「おはよ
う」というシステム出力を生成するような対話システム
の場合、システムが出力する「おはよう」がそれに相当
する。すなわち、ユーザの入力に対するシステムの応答
の生成である。これらの出力情報は、ステップS150
4の出力完了チェックを経て、ステップS1505でシ
ステム情報出力部1403から単位毎に出力される。こ
のステップS1504、S1505は、出力内容を一度
に全て出力するのではなく、ある単位(発話文、節・句
単位)で出力する場合を考応している。前記例で言え
ば、「水曜日は」、「長谷川人事部長と」、「打ち合わ
せがあります。」、「川崎課長との打ち合わせは」、「午
後4時から午後5時までです。」という単位である。す
なわち、単位出力情報毎に出力される。
In step S1503, the system output information generation unit 1402 refers to the output pattern table 1404 to calculate unit output information according to the input information,
Prepared for output. For example, in the case of an interactive system in which a system input “Ohayo” is generated in response to a user input “Ohayo” in the reception guidance system, “Ohayo” output by the system corresponds to that. That is, the generation of the system's response to user input. These pieces of output information are output in step S150.
After the output completion check of No. 4, the system information output unit 1403 outputs the data for each unit in step S1505. These steps S1504 and S1505 take into consideration the case where the output contents are not output all at once but are output in a certain unit (sentence sentence, clause / phrase unit). In the example above, "Wednesday", "Hasegawa Human Resources Manager", "Meetings", "Meeting with Kawasaki Manager", "4 pm to 5 pm". . That is, it is output for each unit output information.

【0016】部分的に出力される情報(ステップS15
05)が全て出力し終わった時点、すなわち、ステップ
S1504でYesと判断された場合は、再びステップ
S1501でユーザからの情報入力チェックが行われ
る。ステップS1506では、ステップS1505で部
分的に情報を出力している途中で、ユーザ情報入力部1
401でユーザからの情報入力がないかどうかの判断が
行われる。前記例で言えば、「川崎課長は?」というユ
ーザからの割り込み入力が相当する。ユーザからの割り
込み入力がない場合は、ステップS1504に戻り、再
び、出力情報を全て出力したかどうかの判断が行われ
る。ユーザからの入力があった場合、ステップS150
7でシステム出力情報生成部1402により出力情報が
停止される。前記例で言えば、「打ち合わせがありま
す。」という出力を中止することに相当する。その後、
ステップS1502に戻り、ユーザから入力された情報
の解析を行い、出力を用意(ステップS1503)す
る。前記例で言えば「はい」という相槌を出力した後、
「川崎課長との打ち合わせは」、「午後4時から午後5
時までです。」という情報を出力することに相当する。
「はい」という相槌の出力は、対話システムの設計に依
存する。相槌出力を行わないシステムやユーザから割り
込み入力があった場合に行うなど、多くの方式がある。
Information partially output (step S15)
When the output of all of 05) is completed, that is, when it is determined Yes in step S1504, the information input check from the user is performed again in step S1501. In step S1506, the user information input unit 1 is in the process of partially outputting information in step S1505.
At 401, it is determined whether or not there is information input from the user. In the above example, the interrupt input from the user "What is Kawasaki section manager?" If there is no interrupt input from the user, the process returns to step S1504, and it is determined again whether all output information has been output. If there is an input from the user, step S150
At 7, the system output information generation unit 1402 stops the output information. In the above example, this is equivalent to canceling the output "I have a meeting." afterwards,
Returning to step S1502, the information input by the user is analyzed and output is prepared (step S1503). In the above example, after outputting the "Yes" Azuchi,
"Meeting with Manager Kawasaki", "4 pm-5 pm
Until time. Is output.
The output of the "yes" azuchi depends on the design of the dialogue system. There are many methods, such as a system that does not perform the output of a hammer and an interrupt input from the user.

【0017】図16は、ユーザの入力情報に対応するシ
ステムの出力パターンのテーブル1404の内容を示し
ている。例えば、T1601では、「おはよう。」とい
うユーザ入力に対し、システムは「おはようございま
す。」という返答を返すことを示している。T160
2、T1603、T1604でも同様に、「こんにち
は。」という入力に対して「こんにちは。」という出力
を、「こんばんは。」という入力に対して「こんばん
は。」という出力を、「さようなら。」という入力に対
して、「さようなら。」という出力を行うことを示して
いる。
FIG. 16 shows the contents of the system output pattern table 1404 corresponding to the user's input information. For example, in T1601, it is indicated that the system returns a reply of "Good morning." To the user input "Good morning." T160
2, T1603, in the same way even T1604, the output of "Hello." With respect to the input of "Hello.", The output of "Good evening." With respect to the input of "Good evening.", To the input of "goodbye." On the other hand, it indicates that the output “Goodbye.” Is performed.

【0018】T1605は、「おやすみ。」というユー
ザの入力情報に対して、「おやすみなさい。」と返答す
る。T1606及びT1607では、ユーザの入力が
「元気?」と同一であるが、システムの出力はそれぞれ、
「元気ですよ。」、「ちょっと元気がないです。」と出
力パターンが違う。これは、対話システムの構築方法、
すなわち、返答パターンをどのように用いるかによって
違う。例えば、ランダムな値を基準として、「元気です
よ。」と「ちょっと元気がないです。」を切り替えるよう
にする場合や、ある変数(対話のやり取りの回数が多い
等)を基準にして、「元気ですよ。」と「ちょっと元気が
ないです。」を切り替える場合、あるいは、両方の方法
を併用する場合も考えられる。これは、対話システムの
設計内容に依存する。
T1605 responds to the user's input information "Good night" by saying "Good night." At T1606 and T1607, the user's input is the same as "How are you?"
The output pattern is different, saying "I'm fine." This is how to build a dialogue system,
That is, it depends on how the response pattern is used. For example, when switching between "I'm fine." And "I'm not very well." Based on a random value, or on the basis of a certain variable (such as a large number of interactions), "It's possible to switch between "I'm fine." And "I'm not very well." Or to use both methods together. This depends on the design of the interactive system.

【0019】T1608は、「疲れた。」というユーザ
の入力情報に対して、「頑張りましょう。」とシステム
が応答する。T1609では、「天気はどう?」という
ユーザの入力情報に対して、天気情報を出力することを
表している。この[$WEATHER]は、その時点での
天気情報を表す変数である。例えば、[晴れ]、[曇り]、
[雨]などランダムな情報を出力することももちろん可能
であるが、通常は、インターネット上からその時々の天
気情報を取得し、出力することが多い。このような応答
例がない対話システムもあるが、実装するかどうかは、
対話システムの設計仕様に依存する。T1610は、ユ
ーザの入力がしばらくない時(NIL)、「返事がない
ですね。」とシステムが応対することを示している。ユ
ーザの入力がない時間間隔は、対話システムの設計仕様
に依存する。一定間隔にする場合や可変にする場合もあ
る。
At T1608, the system responds to the user's input information "I'm tired.""Let's do our best." In T1609, the weather information is output in response to the user's input information “How is the weather?”. This [$ WEATHER] is a variable indicating the weather information at that time. For example, [sunny], [cloudy],
Of course, it is possible to output random information such as [rain], but usually, it is often the case that weather information at that time is acquired and output from the Internet. Some dialog systems do not have such a response example.
It depends on the design specifications of the dialogue system. T1610 indicates that the system responds when there is no user input for a while (NIL), "There is no reply." The time interval without user input depends on the design specifications of the interactive system. It may be fixed or variable.

【0020】なお、このテーブルは、状態遷移(オート
マトン)という概念を用いて表現することも可能であ
る。この場合、ある遷移の場合の時にだけ、特定の応答
(「おはよう。」というシステム出力を既にしたあと
は、「こんばんは。」という応答を返さないようにす
る。)をするといった高度な応答の生成が可能になる。
これは、一般的な拡張方法であり、対話システムの設計
手法に依存する。以上が、従来技術の対話システムの典
型的な処理である。
Note that this table can also be expressed using the concept of state transition (automaton). In this case, generation of an advanced response, such as making a specific response (when the system output "Ohayo." Has already been made, the response "Good evening" is not returned) is made only at the time of a certain transition. Will be possible.
This is a general extension method and depends on the design method of the interactive system. The above is a typical process of the conventional interactive system.

【0021】[0021]

【発明が解決しようとする課題】しかしながら、かかる
従来技術では、音声・ジェスチャ等のマルチモーダルな
入力情報を統合して、ユーザに提示する場合、システム
はユーザからの入力を基準として、ユーザはシステムの
出力を基準として応答することを前提としている。すな
わち、ユーザからの入力・システムの応答・ユーザから
の入力というサイクル、もしくは、システムの応答・ユ
ーザからの入力・システムの応答という流れを単位とし
て処理を行い、システムの応答途中、もしくは、ユーザ
からの入力途中に割り込むことは考慮していない。
However, in such a conventional technique, when the multimodal input information such as voice and gesture is integrated and presented to the user, the system uses the input from the user as a reference, and the user uses the system. It is assumed that the response is based on the output of. That is, processing is performed in the cycle of input from the user, response from the system, input from the user, or response from the system, input from the user, response from the system as a unit, during the response from the system or from the user. It does not consider interrupting while inputting.

【0022】ただし、システムの出力途中にユーザが発
話等の入力で割り込む場合は、システムの出力を停止す
るという技術の紹介はある。しかし、基本的には、単位
出力情報の出力処理を停止するだけで、割り込む(割り
込まれる)ことで対話の流れが変わる(流れを変える)
という点について考慮していない。
However, there is an introduction of a technique in which the output of the system is stopped when the user interrupts the input of an utterance during the output of the system. However, basically, just by stopping the output process of the unit output information, the flow of the dialogue changes (interrupts) by being interrupted (interrupted).
I do not consider it.

【0023】このように、従来技術には、マルチモーダ
ルな情報を統合し、その結果をCGエージェントの音声
合成・ジェスチャ等を通してユーザにフィードバックす
る方法について記述したものもあるが、発話の変更は発
話単位や文節で固定されており、発話途中で変更すると
いう技術に関しては記されていない。そのため、ユーザ
とシステムとの間で、冗長な情報のやりとり(音声・ジ
ェスチャ等による会話など)が起こりえる。特に、初め
てシステムを利用する人や子供・老人等、不慣れな人の
操作で使いにくさを生じる。
As described above, the prior art also describes a method of integrating multi-modal information and feeding back the result to the user through voice synthesis, gesture, etc. of the CG agent, but the utterance is changed. It is fixed in units and bunsetsu, and there is no description about the technique of changing it during utterance. Therefore, redundant information exchange (conversation by voice, gesture, etc.) may occur between the user and the system. In particular, it is difficult for a person who is new to the system, a child, an elderly person, or other unfamiliar person to operate the system.

【0024】本発明はかかる点に鑑みてなされたもので
あり、対話システムを利用する子供や大人、老人など、
システムにすぐに馴染めない人や使いにくさを感じる人
など、いろいろなタイプ人でも使い易いようにするこ
と、また、使用頻度や慣れに応じて使い易くなるように
ユーザに合わせた出力情報の変更が可能な対話装置を提
供することを目的とする。
The present invention has been made in view of the above points, and can be applied to children, adults, old people, etc. who use the dialogue system.
Make it easy for various types of people, such as people who are not familiar with the system immediately or people who find it difficult to use, and change the output information according to the user to make it easier to use depending on the frequency of use and familiarity. It is an object of the present invention to provide a dialogue device capable of performing.

【0025】上述した問題の解決のためには、システム
の発話途中で発話内容を変更していくという仕組みつい
て考慮する必要がある。具体的には、図13(b)に示
すような応答を行う装置が望ましい。すなわち、「長谷
川人事部長と」という単位出力情報の出力を行っている
最中に、「川崎課長は?」という入力がユーザから割り
込まれた場合は、「打ち合わせがあります。」という出
力を中止せず、割り込んだユーザ情報を解釈した結果と
合わせて、自然な応答させるために「打ち合わせがあり
ますが、」、「川崎課長との打ち合わせは」、「午後4
時から午後5時までです。」というように単位出力情報
を一部変更して出力を行うことが望ましい。システムが
出力しようとしていた内容をただ単純に停止するので
は、対話が途切れ途切れの内容になってしまい、使いに
くい、対話のしにくいシステムになってしまう。
In order to solve the above-mentioned problem, it is necessary to consider a mechanism of changing the utterance content during the utterance of the system. Specifically, a device that makes a response as shown in FIG. 13B is desirable. In other words, while the unit output information "Hasegawa Human Resources Manager" is being output, if the user is interrupted by the input "What is Kawasaki Manager?", Stop the output "There is a meeting." No, there is a meeting in order to make a natural response, including the result of interpreting the interrupted user information, "There is a meeting with Mr. Kawasaki," and "4 pm
From 05:00 to 5pm. It is desirable to change part of the unit output information, such as ". If you simply stop what the system was trying to output, the dialogue would be choppy, making it difficult to use and difficult to interact with.

【0026】もし、ユーザの入力に対応させて、「打ち
合わせがあります。」という単位出力情報を変更して、
「打ち合わせがありますが、」という内容に変更するま
での処理時間が間に合わない、または、既に「打ち合わ
せがあります。」という出力内容の途中まで出力してい
る場合、すなわち、出力停止位置の想定した位置がずれ
た場合には、図13(c)に示すように単位出力情報を
再変更できることが望ましい。「打ち合わせがありま
す。」、「その他、」、「川崎課長との打ち合わせ
は」、「午後4時から午後5時までです。」という変更
が望ましい。
If the user output is changed, the unit output information "There is a meeting" is changed,
If the processing time to change to the content "There is a meeting," is not in time, or if the output content "Meeting already" has already been output to the middle, that is, the position where the output stop position is assumed. When the deviation occurs, it is desirable that the unit output information can be changed again as shown in FIG. It is desirable to make changes such as "Meetings are held.", "Others,""Meetings with Manager Kawasaki" and "From 4 pm to 5 pm."

【0027】このようなユーザの割り込み入力に対する
応対の変更は、初めてユーザが対話システムを使う場合
に多い。つまり、初めてシステムに接した時は、どのよ
うな使い方ができるのか、どのようにシステムと接すれ
ばいいのかユーザが分かっていないため、ユーザとシス
テムとの間で発話交代のタイミングがスムーズに行うこ
とができない。また、使い慣れているユーザにとって
は、会話のやり取りがまどろっこしくなり、いきなり用
件を言うなど、発話交代自体のやりとりを無視すること
が多くなる。本発明はこのような場合に有効である。
Such a change in the response to the user's interrupt input is often the first time the user uses the interactive system. In other words, when the system is first contacted with the system, the user does not know how to use the system and how to interact with the system. Therefore, the timing of utterance change between the system and the user should be smooth. I can't. In addition, for a user who is accustomed to using the conversation, the conversation becomes messy, and the user often ignores the exchange of the utterance change, such as suddenly giving a message. The present invention is effective in such a case.

【0028】[0028]

【課題を解決するための手段】本発明の対話装置は、ユ
ーザのジェスチャあるいはユーザの発話の少なくとも1
つを入力として認識する手段と、前記入力の認識結果に
基づいてユーザとの対話に応答するための出力情報を単
位出力情報毎に生成する手段と、生成された出力情報を
前記単位出力情報毎に出力する手段とを備え、ユーザと
の対話を行う対話装置であって、前記対話装置からユー
ザヘの前記単位出力情報の出力の途中において新たな入
力がされた場合に、前記新たな入力の認識結果に基づい
て前記単位出力情報を変更する手段を具備することを特
徴とする。システムが単位出力情報の出力途中にユーザ
からの入力があった場合、出力途中の単位出力情報を変
更して、ユーザからの新しい入力に対応することによ
り、自然な応答が可能になる。また、様々なユーザに合
わせた出力情報の変更が可能な対話装置を提供すること
ができる。
SUMMARY OF THE INVENTION The interaction device of the present invention comprises at least one of a user gesture or a user utterance.
One as input, means for generating output information for responding to a dialogue with the user for each unit output information based on the recognition result of the input, and generated output information for each unit output information. And a means for outputting to the user, the dialogue device performing a dialogue with the user, when a new input is made during the output of the unit output information to the user from the dialogue device, recognition of the new input It is characterized by comprising means for changing the unit output information based on the result. When the system receives an input from the user during the output of the unit output information, the unit output information is changed during the output so as to correspond to the new input from the user, which enables a natural response. Further, it is possible to provide an interactive device capable of changing output information according to various users.

【0029】また、本発明の対話装置においては、前記
ユーザヘの単位出力情報を変更する手段は、前記出力情
報を途中停止する手段を具備すること、また、ユーザに
対する出力情報を変更するための出力変更パターンを保
持するテーブルを具備すること、また、ユーザに対する
出力情報を逐次管理する手段を具備し、前記ユーザヘの
出力を変更する手段は前記新たな入力の認識結果と前記
単位出力情報の出力状況とに基づいて前記単位出力情報
を変更することを特徴とする。
Further, in the interactive apparatus of the present invention, the means for changing the unit output information to the user comprises means for stopping the output information on the way, and an output for changing the output information to the user. A table for holding change patterns is provided, and means for sequentially managing output information for the user is provided. The means for changing the output to the user is the recognition result of the new input and the output status of the unit output information. The unit output information is changed based on the following.

【0030】出力情報を途中停止する手段により、シス
テムが出力する情報を自然な区切りで停止することが可
能になる。また、ユーザに対する出力情報を変更するた
めの出力変更パターンを保持するテーブルを具備するた
め、システムの出力情報をする際の停止位置(時間)、
システムの出力情報を変更する内容を自然な形で保持す
ることが可能になる。また、出力情報を逐次管理する手
段により、システムによって生成された出力情報が、あ
る時刻でどの程度出力されているか判断・管理すること
が可能になり、出力情報を停止する場合は、どこまで出
力され、何が出力されていないか判断することができ
る。
The means for stopping the output information on the way enables the information output by the system to be stopped at natural intervals. In addition, since a table holding an output change pattern for changing the output information for the user is provided, the stop position (time) when the output information of the system is set,
It becomes possible to retain the contents that change the output information of the system in a natural form. In addition, the means for sequentially managing the output information makes it possible to determine and manage how much the output information generated by the system is output at a certain time, and when the output information is stopped, how much is output. , You can determine what is not output.

【0031】また、本発明の対話装置においては、入力
の認識結果に基づいてユーザヘの単位出力情報を変更す
る際に、実際の出力が、前記出力情報を途中停止する手
段の算出した出力停止予定位置を既に過ぎていた場合
に、前記出力情報を逐次管理する手段は実際の停止位置
の情報を新たに生成し、前記実際の停止位置と前記出力
停止予定位置との差が閾値を超えているか否かに応じて
前記単位出力情報の内容を変更することを特徴とする。
対話装置の算出した出力停止予定位置を既に過ぎていた
場合においても、過ぎた程度におうじて単位出力情報を
適宜変更することにより、対話システムを利用する子供
や大人、老人など、システムにすぐに馴染めない人や使
いにくさを感じる人など、いろいろなタイプ人でも使い
易い対話インタフェースを提供することが可能になる。
In the interactive apparatus of the present invention, when the unit output information to the user is changed based on the recognition result of the input, the actual output is the output stop schedule calculated by the means for stopping the output information on the way. If the position has already passed, the means for sequentially managing the output information newly generates information on the actual stop position, and whether the difference between the actual stop position and the planned output stop position exceeds a threshold value. It is characterized in that the content of the unit output information is changed depending on whether or not the unit output information is changed.
Even if the estimated output stop position calculated by the dialogue device has already passed, by changing the unit output information as appropriate to the extent that it passed, the system can be immediately used by children, adults, old people, etc. who use the dialogue system. It is possible to provide an interactive interface that is easy for various types of people, such as people who are unfamiliar and people who find it difficult to use.

【0032】また、本発明の対話方法は、ユーザのジェ
スチャあるいはユーザの発話の少なくとも1つを入力と
して認識する工程と、前記入力の認識結果に基づいてユ
ーザとの対話に応答するための出力情報を単位出力情報
毎に生成する工程と、生成された出力情報を前記単位出
力情報毎に出力する工程とを有し、ユーザとの対話を行
う対話方法であって、前記出力工程において前記単位出
力情報の出力途中において新たな入力がされた場合に、
前記新たな入力を認識する工程と、前記新たな入力の認
識結果に基づいて前記単位出力情報を変更して出力する
工程とを有することを特徴とする。
Further, the interaction method of the present invention includes the step of recognizing at least one of the user's gesture or the user's utterance as an input, and output information for responding to the interaction with the user based on the recognition result of the input. Is a unit of output information, and a step of outputting the generated output information for each unit of output information. If a new input is made during the output of information,
It is characterized by including a step of recognizing the new input and a step of changing and outputting the unit output information based on a recognition result of the new input.

【0033】さらに、ユーザに対する出力情報を逐次管
理する工程を有し、前記単位出力情報を変更して出力す
る工程は前記新たな入力の認識結果と前記出力情報の出
力状況とに基づいて前記単位出力情報を変更することを
特徴とする。また、本発明は、コンピュータを、本発明
の対話装置として機能させるためのプログラム及び当該
プログラムを記録したコンピュータ読み取り可能な記録
媒体としても実現可能である。
Further, the method further comprises a step of sequentially managing output information for the user, and the step of changing and outputting the unit output information is based on the recognition result of the new input and the output status of the output information. It is characterized in that the output information is changed. The present invention can also be realized as a program for causing a computer to function as the dialog device of the present invention and a computer-readable recording medium recording the program.

【0034】[0034]

【発明の実施の形態】以下、本発明の実施の形態につい
て添付図面を参照して詳細に説明する。 (実施の形態1)図1は、本発明の実施の形態1に係る
対話装置の構成を示すブロック図である。本実施の形態
の対話装置は、図1に示すように、システムの出力情報
を逐次管理する手段、システムの出力情報を途中停止す
る手段、システムの出力情報を変更する手段、システム
の出力情報を変更するための出力変更パターンを保持す
るテーブルを具備したことを特徴とする。具体的に、本
構成においては、システム出力情報逐次管理部105、
システム出力情報停止部106、システム出力情報変更
部107、出力変更パターンテーブル108を具備して
いる。これらが請求項1に記載の単位出力情報を変更す
る手段に該当する。また、システム出力情報変更部10
7は、単位出力情報を変更する手段の制御部として機能
する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described in detail below with reference to the accompanying drawings. (Embodiment 1) FIG. 1 is a block diagram showing a configuration of an interactive apparatus according to Embodiment 1 of the present invention. As shown in FIG. 1, the dialogue apparatus according to the present embodiment includes a means for sequentially managing the output information of the system, a means for temporarily stopping the output information of the system, a means for changing the output information of the system, and an output information of the system. It is characterized in that it is provided with a table holding an output change pattern for changing. Specifically, in this configuration, the system output information sequential management unit 105,
The system output information stopping unit 106, the system output information changing unit 107, and the output change pattern table 108 are provided. These correspond to the means for changing the unit output information described in claim 1. Also, the system output information changing unit 10
7 functions as a control unit of a unit that changes the unit output information.

【0035】これにより、ユーザのジェスチャあるいは
ユーザの発話の少なくとも1つを入力として認識する機
能を備え、ユーザとの対話を行う対話装置において、対
話装置からユーザヘの単位出力情報の出力の途中におい
て、入力を認識し、この入力認識結果に基づいてユーザ
ヘの単位出力情報の出力を変更することができる。
Thus, in the dialog device having the function of recognizing at least one of the gesture of the user or the utterance of the user as an input, and in the course of outputting the unit output information from the dialog device to the user, in the dialog device. It is possible to recognize the input and change the output of the unit output information to the user based on the input recognition result.

【0036】図2は本発明の対話装置の処理を示すフロ
ーチャートである。本発明の対話装置における処理は、
図2と図15に示すフローチャートの違いように、出力
停止(図15中のS1507)と、出力変更(図2中の
ステップS208)及び出力(図2中のステップS20
9)との違いにより表現される。
FIG. 2 is a flow chart showing the processing of the dialogue apparatus of the present invention. The process in the dialog device of the present invention is
2 and FIG. 15, the output is stopped (S1507 in FIG. 15), the output is changed (step S208 in FIG. 2), and the output (step S20 in FIG. 2) is performed.
It is expressed by the difference with 9).

【0037】従来の技術である図15の処理フローで
は、システムが単位出力情報の出力途中でユーザから入
力があった場合(ステップS1506)、ステップS1
507で当該単位出力情報の出力を停止する。これに対
して、本発明では、システムが単位出力情報の出力途中
でユーザから入力があった場合(ステップS206)、
その入力を解析し(ステップS207)、単位出力情報
の出力内容の変更(ステップS208)を行う。変更さ
れた出力内容は、ステップS209で出力される。図2
に示す処理フローのステップS201〜ステップS20
6と図15に示す処理フローのステップS1501〜ス
テップS1506までは同じである。なお、ステップS
208の詳細は、以下本実施の形態において説明する。
In the processing flow shown in FIG. 15 which is a conventional technique, when the system receives an input from the user while the unit output information is being output (step S1506), step S1.
At 507, the output of the unit output information is stopped. On the other hand, in the present invention, when the system inputs the user during the output of the unit output information (step S206),
The input is analyzed (step S207), and the output content of the unit output information is changed (step S208). The changed output content is output in step S209. Figure 2
S201 to S20 of the processing flow shown in FIG.
6 and steps S1501 to S1506 of the processing flow shown in FIG. 15 are the same. Note that step S
Details of 208 will be described below in the present embodiment.

【0038】図1において、ユーザ情報入力部101で
は、ユーザから入力された音声信号や画像イメージ等の
入力情報を元に認識前処理及び認識処理を行い、認識結
果をシステム出力情報生成部102に出力する。また、
この認識処理は、入力された信号が部分的に認識された
場合でも出力を行う。システム出力情報生成部102で
は、ユーザ情報入力部101から受け取ったユーザの入
力情報の部分的、あるいは全体の認識結果を元に、シス
テムの応答内容である出力情報の生成を単位出力情報毎
に行う。ユーザの入力惰報が複数に及ぶ場合、それぞれ
の認識結果は、このシステム出力情報生成部102で統
合される。例えば、特開平8−234789号公報に開
示されている「統合認織対話装置」、特開平9−114
634号公報に開示されている「マルチモーダル情報統
合解析装置」では、マルチモーダル対話データベースの
情報を元にして、複数の入力チャネルからの入力を統合
して扱う方法を提案している。
In FIG. 1, the user information input unit 101 performs pre-recognition processing and recognition processing based on input information such as a voice signal and an image input by the user, and the recognition result is sent to the system output information generation unit 102. Output. Also,
This recognition processing outputs even if the input signal is partially recognized. The system output information generation unit 102 generates the output information, which is the response content of the system, for each unit output information based on the partial or entire recognition result of the user input information received from the user information input unit 101. . When the user's input information extends over a plurality of pieces, the respective recognition results are integrated by the system output information generation unit 102. For example, "Integrated weaving dialogue device" disclosed in Japanese Patent Laid-Open No. 8-234789, Japanese Patent Laid-Open No. 9-114
The "multimodal information integrated analysis device" disclosed in Japanese Patent No. 634 proposes a method of integrating and handling inputs from a plurality of input channels based on information in a multimodal dialogue database.

【0039】ただし、本発明が、これらの技術と違うの
は、システム出力情報生成部102がシステム出力情報
変更部107からのシステム出力情報の変更情報を入力
として新たにシステム応答を生成する点と、システム出
力情報停止部106へ出力停止命令を送る点である。停
止命令がシステム出力情報停止部106へと送られるこ
とで、システム出力情報生成部102はシステムが出力
する単位出力情報を変更した新たな単位出力情報をシス
テム出力情報変更部107から受信することができ、冗
長なシステム情報の出力を回避することができる。
However, the present invention differs from these techniques in that the system output information generation unit 102 generates a new system response by inputting the change information of the system output information from the system output information change unit 107. The point of sending an output stop command to the system output information stop unit 106. By sending the stop command to the system output information stopping unit 106, the system output information generating unit 102 can receive new unit output information obtained by changing the unit output information output from the system from the system output information changing unit 107. It is possible to avoid output of redundant system information.

【0040】システム情報出力部103では、システム
出力情報生成部102から送られてくる出力情報を単位
出力情報毎に出力を行う。この出力情報の状態、すなわ
ち、ある時刻または、ある範囲での時間でどこまで情報
が出力されたかを単位出力情報の位置を含めシステム出
力情報逐次管理部105に送る。一般に、システムの情
報を音声、擬人化エージェントを用いて出力する場合、
スピーカ、モニタ等の出力装置が必要になる。本発明で
も同様に用いる。本発明では、さらに、常に出力しよう
としている情報がどの段階まで実際に出力されているか
を検出する点と、その検出した出力情報位置をシステム
出力情報逐次管理部105へと送信する点が特徴であ
る。
The system information output unit 103 outputs the output information sent from the system output information generation unit 102 for each unit output information. The state of this output information, that is, how much information has been output at a certain time or in a certain range of time, including the position of the unit output information, is sent to the system output information sequential management unit 105. Generally, when outputting system information using voice or anthropomorphic agent,
Output devices such as speakers and monitors are required. The same applies to the present invention. Further, the present invention is characterized in that it detects to what stage the information to be always output is actually output, and that the detected output information position is transmitted to the system output information sequential management unit 105. is there.

【0041】システム出力情報逐次管理部105から停
止命令が送信された場合、システム情報出力部103
は、直ちにシステム情報の出力を停止する。その後、停
止位置を再び、システム出力情報逐次管理部105へと
送信する。システム出力情報逐次管理部105では、シ
ステム情報出力部103の出力情報を元に、どの単位出
力情報のどの部分までシステムの出力情報が出力されて
いるか、単位時間あたり、または、ある範囲での時間間
隔で出力情報の管理を行う。
When a stop command is transmitted from the system output information sequential management unit 105, the system information output unit 103
Immediately stops outputting system information. Then, the stop position is transmitted again to the system output information sequential management unit 105. In the system output information sequential management unit 105, based on the output information of the system information output unit 103, up to which part of the unit output information the system output information is output, per unit time, or time within a certain range. The output information is managed at intervals.

【0042】システム出力情報逐次管理部105は、シ
ステム情報出力部103から送信される出力情報位置を
管理すると同時に、システム出力情報停止部106へ出
力情報位置を送信する。システム出力情報停止部106
から停止命令が送られると、直ちにシステム情報出力部
103へ停止命令を送信する。ここでの出力情報位置及
び停止命令は、システム出力情報生成部102が扱うシ
ステム出力情報全ての種類に及ぶ。すなわち、音声、ジ
ェスチャ、モニター画面の中のウィンドウ等、全ての出
力手段に対して制御が行われる。
The system output information sequential management unit 105 manages the output information position transmitted from the system information output unit 103 and, at the same time, transmits the output information position to the system output information stop unit 106. System output information stopping unit 106
When the stop command is sent from, the stop command is immediately transmitted to the system information output unit 103. The output information position and the stop command here extend to all types of system output information handled by the system output information generation unit 102. That is, control is performed for all output means such as voice, gesture, window in monitor screen, and the like.

【0043】システム出力情報停止部106では、シス
テム出力情報生成部102からの出力停止命令を元にシ
ステム情報の出力停止を行う。この時、停止命令は、直
ちにシステム出力情報逐次管理部105へ送信されな
い。出力変更パターンテーブル108の情報を用いて、
停止可能な位置が算出された後、その算出された位置と
実際の出力位置とが等しくなった場合、もしくは、実際
の出力位置が算出された位置よりも先まで出力されたと
判断された場合に、初めて停止命令が送信される。例え
ば図13において「打ち合わせが」が停止可能な位置と
算出されていたとした場合に、「打ち合わせがあり」ま
で出力されていても、図13(b)のように変更できる
可能性がある。どこまで可能性があるかはシステムの設
計や性能による。実際の出力位置が算出された位置に満
たない場合は、停止命令は発行されずに、システム情報
が出力されつづける。
The system output information stopping unit 106 stops the output of the system information based on the output stop command from the system output information generating unit 102. At this time, the stop command is not immediately transmitted to the system output information sequential management unit 105. Using the information of the output change pattern table 108,
If the calculated position becomes equal to the actual output position after the stoppable position is calculated, or if it is determined that the actual output position has been output before the calculated position. , The stop command is sent for the first time. For example, if it is calculated in FIG. 13 that “meeting is available” is a position where it can be stopped, even if “meeting is available” is output, it may be possible to change it as shown in FIG. 13 (b). The possibilities are dependent on the system design and performance. If the actual output position is less than the calculated position, the stop command is not issued and the system information continues to be output.

【0044】システム出力情報変更部107では、シス
テム出力情報停止部106から送られる停止位置情報を
元に、出力変更パターンテーブル108の検索を行い、
変更する出力情報の算出を行う。算出された変更情報及
び停止位置情報は、再び、システム出力情報生成部10
2へと送られる。ここで、変更情報は音声だけでなくジ
ェスチャも含む。例えば「打ち合わせがあります。」を
「打ち合わせがありますが、」に変更する場合には、
「が」の発音に対応する口元の動き等も変更される。な
お、システム出力情報停止部106では、あらかじめ停
止位置情報が分かっているので、システム情報出力部1
03でシステム情報が出力されている途中でも、停止位
置情報をシステム出力情報変更部107へと送ることが
できる。すなわち、システム情報出力部103、システ
ム出力情報逐次管理部105、システム出力情報変更部
107は、並列に動作させることができ、出力情報位置
が、出力停止位置になった時点で直ちにシステムの出力
情報を変えることができる。
The system output information changing unit 107 searches the output change pattern table 108 based on the stop position information sent from the system output information stopping unit 106,
The output information to be changed is calculated. The calculated change information and stop position information are used again for the system output information generation unit 10
Sent to 2. Here, the change information includes not only the voice but also the gesture. For example, if you change "I have a meeting" to "I have a meeting,"
The movement of the mouth corresponding to the pronunciation of "ga" is also changed. The system output information stopping unit 106 knows the stop position information in advance, so the system information outputting unit 1
Even when the system information is being output at 03, the stop position information can be sent to the system output information changing unit 107. That is, the system information output unit 103, the system output information sequential management unit 105, and the system output information changing unit 107 can be operated in parallel, and the output information of the system is immediately output when the output information position reaches the output stop position. Can be changed.

【0045】システム出力情報生成部102では、再
度、システム出力情報変更部107から送られる変更情
報及び停止位置情報を元に、新しい出力情報の生成を単
位出力情報毎に行う。その結果は、これまでと同様にシ
ステム情報出力部103へと送られる。システム情報出
力部103はシステム出力情報生成部102から送られ
た出力情報を単位出力情報毎に出力する。
The system output information generation unit 102 again generates new output information for each unit output information based on the change information and the stop position information sent from the system output information change unit 107. The result is sent to the system information output unit 103 as before. The system information output unit 103 outputs the output information sent from the system output information generation unit 102 for each unit output information.

【0046】出力変更パターンテーブル108では、出
力停止可能な一部分あるいは、全ての発話内容等の出力
情報とその時の変更情報とを保持しており、停止の可否
及び、停止の内容に応じた変更情報を検索及び生成す
る。これらの情報は、出力情報全般に及ぶもので、発話
情報(音声)のみならず、ジェスチャ、モニター画面等
への表示情報を網羅する。出力停止可能な部分が複数あ
る場合には、複数の変更情報を持つことも可能である。
また停止可能位置の先まで出力された場合には、第2の
実施の形態のように閾値を超えているか否かで前記単位
出力情報の内容を変更することも可能である。次に、上
記構成を有する対話装置の動作を具体的に説明する。
The output change pattern table 108 holds output information such as a part or all of the output utterance contents and the change information at that time, and the change information according to whether or not the output can be stopped and the content of the stop. Search and generate. These pieces of information cover output information in general and include not only utterance information (voice) but also display information on gestures, monitor screens, and the like. When there are a plurality of output stoppable parts, it is possible to have a plurality of pieces of change information.
Further, when the data is output up to the position beyond the stoppable position, the contents of the unit output information can be changed depending on whether or not the threshold value is exceeded, as in the second embodiment. Next, the operation of the dialogue device having the above configuration will be specifically described.

【0047】図3は、システム出力情報生成部102に
おける処理のフローチャートである。ここでの処理は、
特開平5−197389号公報に開示されている「音声
認識装置」や、特開平6−12493号公報に開示され
ている「ジェスチャ認識方法およびユーザインタフェー
ス方法」で示され方法で認識されたユーザ入力情報を用
いて、システム応答の生成を行う部分である。
FIG. 3 is a flow chart of processing in the system output information generation unit 102. The process here is
User input recognized by the method shown in "Voice recognition device" disclosed in Japanese Patent Laid-Open No. 5-197389 and "Gesture recognition method and user interface method" disclosed in Japanese Patent Laid-Open No. 6-12493. This is a part that generates a system response using information.

【0048】ステップS301でユーザ情報入力部10
1から認識されたユーザ入力情報の読み込みを行う。ス
テップS302では、ステップS301で認識されたユ
ーザ入力情報を元に、又はステップS306から得られ
るシステム応答変更情報を元に、システム応答生成を単
位出力情報毎に行う。この時、ステップS303で出力
停止の判断が行われた場合、ステップS305で停止命
令がシステム出力情報停止部106へ送信される。その
後、ステップS306でシステム出力情報変更部107
から変更情報の読み込みが行われる。
In step S301, the user information input unit 10
The user input information recognized from 1 is read. In step S302, system response generation is performed for each unit output information based on the user input information recognized in step S301 or based on the system response change information obtained in step S306. At this time, if the output stop determination is made in step S303, a stop command is transmitted to the system output information stop unit 106 in step S305. Then, in step S306, the system output information changing unit 107
The change information is read from.

【0049】しかし、ステップS303で出力停止の判
断が行われなかった場合、ステップS304でシステム
情報出力部103ヘシステム出力情報の送信が行われ
る。そして、再びステップS301へと処理が戻る。ス
テップS302でシステム出力情報変更部107から送
られるシステム応答変更情報がなかった場合には、ユー
ザから入力された情報のみでシステムの応答生成が行わ
れる。ステップS303の出力停止命令が発行される基
準は、ステップS301におけるユーザ入力情報がユー
ザからの割り込み入力であるかどうかである。
However, if it is not determined that the output is stopped in step S303, the system output information is transmitted to the system information output unit 103 in step S304. Then, the process returns to step S301 again. If there is no system response change information sent from the system output information changing unit 107 in step S302, the system response is generated only with the information input by the user. The criterion for issuing the output stop command in step S303 is whether or not the user input information in step S301 is an interrupt input from the user.

【0050】図4は、システム情報出力部103におけ
る処理のフローチャートである。ステップS401でシ
ステム出力情報生成部102から送られるシステム出力
情報の読み込みを行い、ステップS402でシステム出
力情報逐次管理部105から停止命令が送信されていな
いか読み込みを行う。ステップS403で停止命令が送
信されていると判断された場合は、直ちに出力情報は破
棄され(ステップS407)、再びステップS401で
システム出力情報の読み込みを行う。
FIG. 4 is a flow chart of processing in the system information output unit 103. In step S401, the system output information sent from the system output information generation unit 102 is read, and in step S402, the system output information sequential management unit 105 reads whether or not a stop command has been transmitted. If it is determined in step S403 that the stop command has been transmitted, the output information is immediately discarded (step S407), and the system output information is read again in step S401.

【0051】停止命令が送信されていないと判断された
場合には、ステップS404で実際に出力されている情
報の位置がシステム出力情報逐次管理部105へと送ら
れた後、ステップS405でスピーカ・モニター等の出
力装置を使って出力される。ステップS406では、断
片的に出力される出力情報が全て出力されたかどうかの
判断が行われ、まだ出力情報が残っている場合には、再
び、ステップS403に戻り、停止命令が送信されてい
るかどうかの判断が行われる。全て出力された場合は、
ステップS401へと戻り、再びシステム出力情報の読
み込みが行われる。すなわち、システム出力情報生成部
102から送られる出力情報を連続して出力する際、出
力情報があるかどうか、停止命令が送られているかどう
か、出力情報を全て出力したかどうかの判断を順次行っ
ていく処理フローとなっている。
When it is determined that the stop command has not been transmitted, the position of the information that is actually output is sent to the system output information sequential management unit 105 in step S404, and then the speaker output in step S405. It is output using an output device such as a monitor. In step S406, it is determined whether or not all pieces of output information that have been output in pieces have been output. If output information still remains, the process returns to step S403 again, and whether a stop command has been transmitted. Is determined. If all are output,
Returning to step S401, the system output information is read again. That is, when the output information sent from the system output information generation unit 102 is continuously output, it is sequentially determined whether there is output information, whether a stop command has been sent, and whether all output information has been output. The processing flow is as follows.

【0052】図5は、システム出力情報逐次管理部10
5における処理のフローチャートである。ステップS5
01では、システム出力情報停止部106から送られる
停止命令の読み込みを行う。出力情報停止位置も読み込
まれる。停止命令が送信されていた場合(ステップS5
02)、停止命令を出力情報停止位置とともにシステム
情報出力部103へと送る(ステップS506)。そし
て、処理は再び、ステップS501へと戻る。ステップ
S502で停止命令が送信されていないと判断された場
合、システム情報出力部103から送られる出力情報位
置をステップS503で読み込む。その情報は、ステッ
プS504で出力情報位置として管理される。この管理
されている出力情報位置は、ステップS505で用いら
れ、システム出力情報停止部106へと出力情報位置が
送信される。そして、処理は再び、ステップS501へ
と戻る。
FIG. 5 shows the system output information sequential management unit 10
6 is a flowchart of the process in 5. Step S5
In 01, the stop command sent from the system output information stop unit 106 is read. The output information stop position is also read. If the stop command has been transmitted (step S5)
02), and sends a stop command to the system information output unit 103 together with the output information stop position (step S506). Then, the process again returns to step S501. If it is determined in step S502 that the stop command has not been transmitted, the output information position transmitted from the system information output unit 103 is read in step S503. The information is managed as an output information position in step S504. This managed output information position is used in step S505, and the output information position is transmitted to the system output information stop unit 106. Then, the process again returns to step S501.

【0053】このシステム出力情報逐次管理部105で
は、実際に出力された出力情報の管理及び停止命令の送
信を行うことを主な処理内容とする。システム出力情報
逐次管理部105自らが停止命令を生成することはな
く、システム出力情報停止部106からの送信に基づい
て、システム情報出力部103へと停止命令を出力情報
停止位置とともに送信する。
The main processing contents of the system output information sequential management unit 105 are management of output information actually output and transmission of a stop command. The system output information sequential management unit 105 does not generate the stop command by itself, and based on the transmission from the system output information stop unit 106, transmits the stop command together with the output information stop position to the system information output unit 103.

【0054】図6は、システム出力情報停止部106に
おける処理のフローチャートである。ステップS601
でシステム出力情報生成部102から送信される停止命
令の読み込みを行う。ステップS602で停止命令が送
信されていないと判断された場合は、ステップS608
でシステム出力情報逐次管理部105から送信される出
力情報位置の読み込みを行う。停止命令が送信されてい
ると判断された場合には、ステップS603で現在の出
力情報位置を元に出力情報を停止する位置の算出を行
う。この停止位置の算出には、出力変更パターンテーブ
ル108に保持される情報を用いて行われる。
FIG. 6 is a flow chart of processing in the system output information stopping unit 106. Step S601
Then, the stop instruction transmitted from the system output information generation unit 102 is read. If it is determined in step S602 that the stop instruction has not been transmitted, step S608.
Then, the output information position transmitted from the system output information sequential management unit 105 is read. When it is determined that the stop command is transmitted, the position where the output information is stopped is calculated based on the current output information position in step S603. The calculation of the stop position is performed using the information held in the output change pattern table 108.

【0055】ステップS604で現在出力中である出力
情報位置の読み込みを行い、ステップS605で、算出
された実際に停止可能な情報位置との比較を行う。現在
の出力情報位置が停止可能位置に満たない場合、再びス
テップS604に戻り、停止可能位置になるまで、シス
テム情報出力部103はシステム情報の出力を継続す
る。
In step S604, the output information position currently being output is read, and in step S605, it is compared with the calculated actually stoppable information position. If the current output information position is less than the stop possible position, the process returns to step S604 again, and the system information output unit 103 continues to output the system information until the stop possible position is reached.

【0056】現在の出力情報位置が停止可能位置になっ
た場合、ステップS606で実際に出力情報を停止させ
る停止命令の発行が行われる。停止命令は、システム出
力情報逐次管理部105へと送信され、そこから再び、
システム情報出力部103へと送信された後、実際に出
力情報が停止される。ステップS606で出力情報の停
止命令が発行された後、ステップS607で停止位置が
システム出力情報変更部107へと送信される。
When the current output information position becomes the stoppable position, a stop command for actually stopping the output information is issued in step S606. The stop command is transmitted to the system output information sequential management unit 105, and from there, again,
After being transmitted to the system information output unit 103, the output information is actually stopped. After the output information stop command is issued in step S606, the stop position is transmitted to the system output information changing unit 107 in step S607.

【0057】停止位置になったどうかは、例えば、出力
情報のキーワードの一部が、停止可能位置に相当するキ
ーワードと等しくなった場合または、音声波形そのもの
やジェスチャの動き情報が一致もしくは、ある閾値以下
の範囲にある場合、すなわち一致はしないがある基準以
内の近似した状態にある場合で判断することができる。
これは、認識アルゴリズムの一部として既に実現されて
いるものであり、単純な方法としては、文字列の比較
(文字列が一致するか、何文字まで一致するか等)で容
易に行うことが可能である。
Whether or not the stop position has been reached is determined, for example, when a part of the keywords of the output information becomes equal to the keyword corresponding to the stop possible position, or the voice waveform itself and the movement information of the gesture match or a certain threshold value. The judgment can be made in the case of the following range, that is, in the case of no coincidence and in an approximate state within a certain criterion.
This is already implemented as part of the recognition algorithm, and as a simple method, it can be easily done by comparing character strings (such as how many character strings match and how many characters match). It is possible.

【0058】図7は、システム出力情報変更部107に
おける処理のフローチャートである。ステップS701
でシステム出力情報停止部106から送信される停止位
置情報の読み込みを行う。停止位置情報の読み込みが成
功しない場合(停止位置情報が送信されていない場
合)、処理は再びステップS701へと戻る。
FIG. 7 is a flow chart of processing in the system output information changing unit 107. Step S701
Then, the stop position information transmitted from the system output information stop unit 106 is read. When the reading of the stop position information is not successful (when the stop position information has not been transmitted), the process returns to step S701 again.

【0059】ステップS702で停止位置情報の読み込
みが成功した場合(停止位置情報が送信されている場
合)、ステップS703で出力変更パターンテーブル1
08を参照してシステムの単位出力情報に関する変更情
報の算出が行われる。例えば、図13で「打ち合わせが
あります。」という単位出力情報の出力を行っている最
中に、入力がユーザから割り込まれた場合、図13
(b)のように「打ち合わせがありますが、」のように
変更する。あるいは、図13(c)のように「打ち合わ
せがあります。」、「その他」と変更することもでき
る。その変更情報は、ステップS704でシステム出力
情報生成部102へと送信される。この時、システム出
力情報生成部102では、ステップS306でシステム
出力情報変更部107から送られる単位出力情報に関す
る変更情報の読み込みを行う。その後、ステップS30
2へと戻り、再びシステム応答の生成が行われる。ステ
ップS704で変更情報の送信後は、処理は再びステッ
プS701へ戻る。
If the reading of the stop position information is successful in step S702 (if the stop position information is transmitted), the output change pattern table 1 is output in step S703.
08, the change information regarding the unit output information of the system is calculated. For example, in the case where the input is interrupted by the user while the unit output information “There is a meeting” is being output in FIG.
As shown in (b), change to “There is a meeting,”. Alternatively, as shown in FIG. 13 (c), it is possible to change "we have a meeting" and "others". The change information is transmitted to the system output information generation unit 102 in step S704. At this time, the system output information generation unit 102 reads the change information regarding the unit output information sent from the system output information change unit 107 in step S306. Then, step S30
Returning to 2, the system response is generated again. After the change information is transmitted in step S704, the process returns to step S701 again.

【0060】図8は、出力変更パターンテーブル108
の例を示す図である。図8において、左の項目「停止情
報」は、システムが出力する予定の情報を示しており、
右の項目「変更情報」は、出力停止後にシステム出力情
報生成部102へ送信する内容を示している。
FIG. 8 shows the output change pattern table 108.
It is a figure which shows the example of. In FIG. 8, the item “stop information” on the left side shows information scheduled to be output by the system,
The item “change information” on the right side shows the contents to be transmitted to the system output information generation unit 102 after the output is stopped.

【0061】「停止情報」では、システムの出力情報の
種類に応じたものが列挙される。単位出力情報をこの大
きさの単位に決めることも可能であるが、ここでは、
「打ち合わせがあります。」等もう少し大きい単位のも
のを単位出力情報として説明を続ける。また、図8で
は、音声・ジェスチャを出力表現手段とする実施の一例
として想定している。T801では、「でしょうか?」
という出力情報を停止情報とした場合、「ですね。」と
いう出力情報に変換するということを表している。ここ
で、音声だけでなく発音の差異に伴う口元の動きの変更
もあり、他に手足のジェスチャの変更もありうる。T8
02も同様に「ですか?」を「ですよね。」という出力
情報に変換している。T803も、「しています。」を
「していますが、」と変更する。
In the "stop information", items corresponding to the type of output information of the system are listed. It is also possible to determine the unit output information in units of this size, but here,
The explanation will continue with a unit with a slightly larger unit such as "There is a meeting." Further, in FIG. 8, it is assumed as an example of an implementation in which a voice / gesture is used as an output expression means. In T801, "Isn't it?"
When the output information "is used as the stop information, it is converted into the output information"". Here, not only the voice but also the movement of the mouth due to the difference in pronunciation may be changed, and in addition, the gesture of the limb may be changed. T8
Similarly, in 02, "?" Is converted into output information "Is it right?" Also in T803, "I am doing." Is changed to "I am doing."

【0062】T804は、「あります。」という出力情
報を「ありますが、」という情報に変更することを示し
ている。これは、上述した図13(b)に示す場合に相
当する。T805では、「調べます。」という出力情報
を「調べています。少々お待ちくたさい。」という出力
情報に変換している。これは、「調べ」という形で途中
で出力を途切れないようにするとともに、「少々お待ち
くたさい。」という情報を付け加えることを意味してい
る。T806も同様である。「思います。」という出力
情報を遮らずに、「はい。」という情報を付け加えた
後、「思います。」と変更する。
T 804 indicates that the output information “I have it” is changed to the information “I have it”. This corresponds to the case shown in FIG. In T805, the output information of "I will investigate." Is converted into the output information of "I am investigating. Wait a while." This means that the output is not interrupted in the form of "inspection" and the information "Please wait a while" is added. The same applies to T806. Do not block the output information "I think.", Add the information "Yes.", And then change it to "I think."

【0063】T807は、呼びかけに対する応答のよう
な反応を示すパターンを定義している。すなわち、「い
かがですか?」という出力を、「はい。わかりまし
た。」と変更している。これは、「いかがですか?」と
いう出力前、もしくは、出力途中にユーザからの入力に
応答するということを意味し、ユーザからの入力にきち
んと対応するというシステムの出力例である、T808
は、「なさいますか?」に対して、「ですね。」と返答
することを意味する。これは、冗長な質問をユーザに出
力しないようにするための例である。
T807 defines a pattern indicating a reaction such as a response to a call. That is, the output "How is it?" Is changed to "Yes. I understand." This means that the system responds to the input from the user before or during the output of "How is it?", Which is an example of the system output that properly responds to the input from the user.
Means to reply to "Is it okay?" This is an example to avoid outputting redundant questions to the user.

【0064】一方、T809は、「#」という内容で、
「その他、」という変更内容を意味する。この「#」
は、システムが応答を出力前、もしくは、出力途中であ
る場合に、出力を停止しようとしたが、停止処理もしく
は、応答の生成処理が間に合わない場合を考慮したもの
で、「その他、」という出力を追加することで、ユーザ
の割り込んだ入力情報との接続を自然な形にすることを
意図する。これは、上述した図13(c)に示す場合に
相当する。T810は、「*」という内容で、全ての内
容に一致することを示している。すなわち、停止命令が
送信された場合には、直ちに出力を停止し、「失礼致し
ました。」という出力情報に変換することを表してい
る。停止情報が出力変更パターンテーブル108に無い
場合等の用いられる。
On the other hand, T809 has the content "#",
It means the change content of "other,". this"#"
Is for the case where the system tried to stop the output before or during the output of the response but the stop process or the response generation process was not in time. By adding, we intend to make the connection with the input information interrupted by the user a natural form. This corresponds to the case shown in FIG. T810 has a content of "*", which indicates that all the content matches. That is, when the stop command is transmitted, the output is immediately stopped and converted into the output information "I'm sorry." It is used when the stop information does not exist in the output change pattern table 108.

【0065】本実施の形態で説明した対話装置によれ
ば、以下のような効果が得られる。新たな入力の認識結
果に基づいて前記単位出力情報を変更する手段を具備す
ることにより、システムが単位出力情報の出力途中にユ
ーザからの入力があった場合、出力途中の単位出力情報
を変更して、ユーザからの新しい入力に対応することに
より、自然な応答が可能になる。また、様々なユーザに
合わせた出力情報の変更が可能な対話装置を提供するこ
とができる。
According to the dialog device described in this embodiment, the following effects can be obtained. By providing a unit for changing the unit output information based on the recognition result of a new input, when the system receives an input from the user during the output of the unit output information, the unit output information is changed during the output. By responding to new input from the user, a natural response is possible. Further, it is possible to provide an interactive device capable of changing output information according to various users.

【0066】システムの発話・動作などシステムからの
出力情報を逐次管理する手段を設けることにより、シス
テムによって生成された出力情報が、ある時刻でどの程
度出力されているか判断・管理することが可能になる。
そして、出力情報を停止する場合は、どこまで出力さ
れ、何が出力されていないか判断することができる。
By providing means for sequentially managing output information from the system such as utterances / operations of the system, it is possible to judge and manage how much output information generated by the system is output at a certain time. Become.
Then, when the output information is stopped, it is possible to determine how much is output and what is not output.

【0067】また、システムの出力情報を途中停止する
手段を設けることにより、システムが出力する情報を自
然な区切りで停止することが可能になる。自然な区切り
とは、単語の途中だけではなく、単語と単語の間など、
普段人間同士の会話で行われている発話の停止などの中
断位置(時刻)で区切ることである。また、システムの
出力情報を変更するための出力変更パターンを保持する
テーブルを設けることにより、システムの出力情報をす
る際の停止位置(時間)、システムの出力情報を変更す
る内容を自然な形で保持することが可能になる。
Further, by providing means for stopping the output information of the system on the way, it becomes possible to stop the information output by the system at natural intervals. A natural break is not only in the middle of a word, but between words
It is to divide at the interruption position (time) such as the stop of the utterance that is usually done in conversation between humans. Also, by providing a table that holds the output change pattern for changing the output information of the system, the stop position (time) when changing the output information of the system and the contents of changing the output information of the system can be set in a natural manner. It becomes possible to hold.

【0068】また、システムの出力情報を変更する手段
は、新たな入力の認識結果に基づいて前記単位出力情報
を変更する手段の制御部として機能し、これまでシステ
ム出力情報生成部で行っていた出力情報の変更処理をハ
ードウエア上で分けることができると共に、システムの
出力情報を逐次管理する手段が持つ停止位置(時刻)と
システムの出力情報を変更するための出力変更パターン
を用いて、自然な形でシステム出力内容を変更すること
が可能になる。
Further, the means for changing the output information of the system functions as the control portion of the means for changing the unit output information based on the recognition result of the new input, which has been performed by the system output information generating portion so far. The output information change process can be divided on the hardware, and the output position change pattern for changing the output position of the system and the stop position (time) of the means for sequentially managing the output information of the system It is possible to change the system output contents in any form.

【0069】これにより、対話システムを利用する子供
や大人、老人など、システムにすぐに馴染めない人や使
いにくさを感じる人など、いろいろなタイプ人でも使い
易い対話インタフェースを提供することが可能になる。
また、使用頻度や慣れに応じて使い易くなるようにユー
ザに合わせた出力情報の変更が可能な対話システムを提
供することも可能になる。
As a result, it is possible to provide a dialog interface that is easy to use by various types of people, such as children, adults, and elderly people who use the dialog system, those who are not immediately familiar with the system, or those who find it difficult to use. Become.
Further, it becomes possible to provide an interactive system in which output information can be changed according to the user so that it can be easily used depending on the frequency of use and familiarity.

【0070】なお、本発明の対話装置は、上述の図示例
にのみ限定されるものではなく、本発明の要旨を逸脱し
ない範囲内において種々変更を加え得ることは勿論であ
る。例えば、システム出力情報逐次管理部105を省略
し、その機能をシステム出力情報停止部106に持たせ
ることや、出力変更パターンテーブル108の情報をシ
ステム出力情報停止部106とシステム出力情報変更部
107とに、それぞれ持たせることも可能である。その
際は、テーブル情報は、同じ情報でもかまわないし、目
的の同じ違う情報でもかまわない。ただし、それぞれの
情報がシステムの情報を停止したり、変更できるように
整合性を持ったデータである必要がある。
The dialogue apparatus of the present invention is not limited to the above-mentioned illustrated example, and various changes can be made without departing from the scope of the present invention. For example, the system output information sequential management unit 105 may be omitted and the system output information stopping unit 106 may be provided with that function, or the information of the output change pattern table 108 may be stored in the system output information stopping unit 106 and the system output information changing unit 107. It is also possible to have each of them. In that case, the table information may be the same information or different information having the same purpose. However, each information needs to be consistent data so that the information of the system can be stopped or changed.

【0071】(実施の形態2)本実施の形態では、ユー
ザヘの単位出力情報の出力を変更する際の実際の出力
が、対話装置の算出した出力停止予定位置を既に過ぎて
いた場合、ユーザヘの単位出力情報の出力を変更する場
合について説明する。
(Embodiment 2) In the present embodiment, when the actual output when changing the output of the unit output information to the user has already passed the scheduled output stop position calculated by the dialog device, A case where the output of the unit output information is changed will be described.

【0072】図9は、本発明の実施の形態2に係る対話
装置の構成を示すブロック図である。図9において、図
1と同じ部分については図1と同じ符号を付してその詳
細な説明は省略する。図9に示す対話装置では、システ
ム出力情報停止部901からシステム出力情報変更部9
02に送信する情報、すなわち、実際の停止位置の情報
を新たに追加している。この送信情報の追加に伴い、シ
ステム出力情報生成部903、システム出力情報停止部
901、システム出力情報変更部902における処理の
フローが実施の形態1と異なる。
FIG. 9 is a block diagram showing the structure of the dialogue apparatus according to the second embodiment of the present invention. 9, the same parts as those in FIG. 1 are designated by the same reference numerals as those in FIG. 1 and their detailed description is omitted. In the dialog device shown in FIG. 9, the system output information stopping unit 901 to the system output information changing unit 9
02, that is, information on the actual stop position is newly added. With the addition of this transmission information, the processing flow in the system output information generation unit 903, the system output information stop unit 901, and the system output information change unit 902 is different from that in the first embodiment.

【0073】図9に示す対話装置においては、システム
出力情報停止部901で、停止させようとする出力情報
位置と実際に出力した情報との位置が異なる場合、停止
予定位置及び実際の停止位置をシステム出力情報変更部
902に送信するように変更する。この時、システム出
力情報生成部903には、実際に停止した位置及び変更
情報の読み込み処理が追加される。
In the dialog device shown in FIG. 9, in the system output information stop unit 901, when the output information position to be stopped is different from the actually output information, the planned stop position and the actual stop position are set. It is changed so as to be transmitted to the system output information changing unit 902. At this time, the system output information generation unit 903 is additionally provided with a process of reading the actually stopped position and change information.

【0074】図10は、システム出力情報生成部903
における処理を示すフローチャートである。ステップS
1001でユーザ情報入力部101からユーザの入力情
報の読み込みを行う。ステップS1002では、ステッ
プS1006から得られる実際のシステム出力停止位置
情報及び変更情報を元に、システム応答生成を単位出力
情報毎に行う。この時、ステップS1003で出力停止
の判断が行われた場合、ステップS1005で停止命令
がシステム出力情報停止部901へ送信される。その
後、ステップS1006でシステム出力情報変更部90
2から実際のシステム出力停止位置情報及び変更情報の
読み込みが行われる。しかし、ステップS1003で出
力停止の判断が行われなかった場合、ステップS100
4でシステム情報出力部103ヘシステム出力情報の送
信が行われる。そして、再びステップS1001へと処
理が戻る。
FIG. 10 shows the system output information generator 903.
3 is a flowchart showing the processing in FIG. Step S
At 1001, the input information of the user is read from the user information input unit 101. In step S1002, system response generation is performed for each unit output information based on the actual system output stop position information and the change information obtained in step S1006. At this time, if the output stop determination is made in step S1003, a stop command is transmitted to the system output information stop unit 901 in step S1005. Then, in step S1006, the system output information changing unit 90
The actual system output stop position information and change information are read from 2. However, if it is not determined that the output is stopped in step S1003, step S100
At 4, the system output information is transmitted to the system information output unit 103. Then, the process returns to step S1001 again.

【0075】図11は、システム出力情報停止部901
における処理を示すフローチャートである。ステップS
1101でシステム出力情報生成部903から送信され
る停止命令の読み込みを行う。ステップS1102で停
止命令が送信されていないと判断された場合は、ステッ
プS1109でシステム出力情報逐次管理部105から
送信される出力情報位置の読み込みを行う。停止命令が
送信されていると判断された場合には、ステップS11
03で現在の出力情報位置を元に単位出力情報の出力を
停止する位置の算出を行う。この停止位置の算出には、
出力変更パターンテーブル108に保持される情報を用
いて行われる。
FIG. 11 shows the system output information stopping unit 901.
3 is a flowchart showing the processing in FIG. Step S
At 1101, the stop instruction transmitted from the system output information generation unit 903 is read. If it is determined in step S1102 that the stop command has not been transmitted, the output information position transmitted from the system output information sequential management unit 105 is read in step S1109. When it is determined that the stop command is transmitted, step S11
At 03, the position where the output of the unit output information is stopped is calculated based on the current output information position. To calculate this stop position,
This is performed using the information held in the output change pattern table 108.

【0076】ステップS1104で現在出力中である出
力情報位置の読み込みを行い、ステップS1105で算
出された実際に停止可能な情報位置との比較を行う。現
在の出力情報位置が停止可能位置に満たない場合、再び
ステップS1104に戻り、停止可能位置になるまで、
システム情報出力部103からシステム情報の出力を継
続する。現在の出力情報位置が停止可能位置になった場
合、ステップS1106で実際に出力情報を停止させる
停止命令の発行が行われる。停止命令は、システム出力
情報逐次管理部105へと送信され、そこから再び、シ
ステム情報出力部103へと送信された後、実際に単位
出力情報の出力が停止される。
In step S1104, the output information position currently being output is read and compared with the actually stoppable information position calculated in step S1105. If the current output information position is less than the stoppable position, the process returns to step S1104 again until the stoppable position is reached.
The system information output unit 103 continues to output the system information. When the current output information position has reached the stoppable position, a stop command for actually stopping the output information is issued in step S1106. The stop command is transmitted to the system output information sequential management unit 105, is transmitted again to the system information output unit 103, and then the output of the unit output information is actually stopped.

【0077】ステップS1106で出力情報の停止命令
が発行された後、ステップS1107で停止可能位置
(停止予定位置)が、ステップS1108では、実際に
停止した位置の情報がシステム出力情報変更部902へ
と送信される。その後、処理は再びステップ1101へ
戻る。
After the output information stop command is issued in step S1106, the stoptable position (scheduled stop position) is output in step S1107, and the information of the actually stopped position is sent to the system output information changing unit 902 in step S1108. Sent. Then, the process returns to step 1101 again.

【0078】図12は、システム出力情報変更部902
における処理を示すフローチャートである。ステップS
1201でシステム出力情報停止部901から送信され
る停止位置情報(停止予定位置;種類Aと表現)の読み
込みを行う。停止位置情報の読み込みが成功しない場合
(停止位置情報が送信されていない場合)、処理は再び
ステップS1201へと戻る。ステップS1202で停
止位置情報の読み込みが成功した場合(停止位置情報が
送信されている場合)、ステップS1203で停止位置
情報(実際の停止位置;種類Bと表現)の読み込みを行
う。
FIG. 12 shows the system output information changing unit 902.
3 is a flowchart showing the processing in FIG. Step S
At 1201, the stop position information (scheduled stop position; expressed as type A) transmitted from the system output information stop unit 901 is read. When the reading of the stop position information is not successful (when the stop position information is not transmitted), the process returns to step S1201 again. If the reading of the stop position information is successful (when the stop position information is transmitted) in step S1202, the stop position information (actual stop position; expressed as type B) is read in step S1203.

【0079】ステップS1204では、この二つの停止
位置情報(A及びB)を用いて、予定していた停止位置
と実際との停止位置との比較を行う。このときの両停止
位置の差がある閾値より大きい場合は、ステップS12
06で変更情報(種類X)の算出を行う。また、ある閾
値より大きくない場合は、ステップS1205で変更情
報(種類Y)の算出を行う。例えば、図13で「打ち合
わせがあります。」という単位出力情報の出力を行って
いる最中に、入力がユーザから割り込まれた場合、閾値
以下の場合は、図13(b)のように「打ち合わせがあ
りますが、」と変更し、閾値を超えた場合は、図13
(c)のように「打ち合わせがあります。」、「その
他」と変更する。なお、ジェスチャについてもその近似
の度合いから閾値を定めることが可能である。その後、
算出された変更情報は、ステップS1207でシステム
出力情報生成部903へと送信される。その後、処理は
再びステップ1201へ戻る。
In step S1204, the planned stop position and the actual stop position are compared using the two stop position information (A and B). If the difference between the two stop positions at this time is larger than a certain threshold value, step S12.
At 06, change information (type X) is calculated. If it is not larger than a certain threshold, change information (type Y) is calculated in step S1205. For example, in the case where the input is interrupted by the user while the unit output information "There is a meeting" is being output in FIG. However, if the threshold value is exceeded,
As in (c), change to "I have a meeting." And "Other". It should be noted that it is possible to set a threshold for the gesture based on the degree of its approximation. afterwards,
The calculated change information is transmitted to the system output information generation unit 903 in step S1207. Then, the process returns to step 1201 again.

【0080】本実施の形態に係る対話装置によれば、実
際の停止位置の情報を新たに追加しているので、実際の
停止位置が対話装置の算出した出力停止予定位置を既に
過ぎていた場合においても、適宜単位出力情報の内容を
変更でき、対話システムを利用する子供や大人、老人な
ど、システムにすぐに馴染めない人や使いにくさを感じ
る人など、いろいろなタイプ人でも使い易い対話インタ
フェースを提供すること、すなわち、使用頻度や慣れに
応じて使い易くなるようにユーザに合わせた出力情報の
変更が可能な対話システムを提供することが可能にな
る。
According to the dialog device of the present embodiment, information on the actual stop position is newly added. Therefore, when the actual stop position has already passed the scheduled output stop position calculated by the dialog device. Also, even in the case of, it is possible to change the contents of the unit output information as appropriate, and it is an easy-to-use dialogue interface for various types of people, such as children, adults, and elderly people who use the dialogue system, those who are not familiar with the system immediately or those who find it difficult to use. That is, it is possible to provide an interactive system in which output information can be changed according to the user so as to be easy to use according to the frequency of use and familiarity.

【0081】なお、コンピュータもしくは対話機能はソ
フトウェアを用いて実現可能であり、本対話装置もしく
は対話機能を実現したプログラムを計算機あるいは各種
装置に実装することで、本発明に係る対話機能を搭載し
た各種装置あるいはサービスを実現することができる。
以上の各装置に係る発明は方法に係る発明としても成立
し、また、上記の発明は、相当する手順あるいは手段を
コンピュータに実行させるためのプログラム及び当該プ
ログラムを記録したコンピュータ読取り可能な記録媒体
としても成立する。
It should be noted that the computer or the interactive function can be realized by using software, and by installing the interactive device or the program realizing the interactive function in a computer or various devices, various interactive functions according to the present invention can be installed. A device or a service can be realized.
The invention related to each of the above devices is also realized as a method related invention, and the invention described above is a program for causing a computer to execute a corresponding procedure or means and a computer-readable recording medium recording the program. Also holds.

【0082】本発明では、この記録媒体として、本対話
装置のROMそのものがプログラムメディアであっても
よいし、またCD−ROMドライブ等のプログラム読み
取り装置が設けられ、そこに記録媒体を挿入することで
読み取り可能なCD−ROM等のプログラムメディアで
あってもよい。いずれの場合においても、格納されてい
るプログラムはCPUがアクセスして実行させる構成で
あってもよいし、プログラムを読み出し、読み出された
プログラムは、図示されていないプログラム記憶エリア
にダウンロードされて、そのプログラムが実行される方
式であってもよい。このダウンロード用のプログラムは
予め本対話装置に格納されているものとする。
In the present invention, as the recording medium, the ROM itself of the dialog device may be a program medium, or a program reading device such as a CD-ROM drive is provided and the recording medium may be inserted therein. It may be a program medium such as a CD-ROM that can be read by. In any case, the stored program may be configured to be accessed and executed by the CPU, or the program may be read and the read program may be downloaded to a program storage area (not shown). The method in which the program is executed may be used. It is assumed that this download program is stored in advance in this dialog device.

【0083】ここで上記プログラムメディアは、対話装
置本体と分離可能に構成される記録媒体であり、磁気テ
ープやカセットテープ等のテープ系、フロッピー(登録
商標)ディスクやハードディスク等の磁気ディスクやC
D−ROM/MO/MD/DVD等の光ディスクのディ
スク系、ICカード(メモリカードを含む)/光カード
等のカード系、あるいはマスクROM、EPROM、E
EPROM、フラッシュROM等による半導体メモリを
含めた固定的にプログラムを担持する媒体であってもよ
い。
Here, the program medium is a recording medium which can be separated from the main body of the dialogue device, and is a tape system such as a magnetic tape or a cassette tape, a magnetic disk such as a floppy (registered trademark) disk or a hard disk, or a C disk.
Disk system of optical disc such as D-ROM / MO / MD / DVD, card system such as IC card (including memory card) / optical card, mask ROM, EPROM, E
It may be a medium that fixedly carries the program, including a semiconductor memory such as an EPROM or a flash ROM.

【0084】さらに、通信ネットワークからプログラム
をダウンロードするように、流動的にプログラムを担持
する媒体であってもよい。なお、このように通信ネット
ワークからプログラムをダウンロードする場合には、そ
のダウンロード用プログラムは予め対話装置本体に格納
しておくか、あるいは別な記録媒体からインストールさ
れるものであってもよい。なお、記録媒体に格納されて
いる内容としてはプログラムに限定されず、データであ
ってもよい。
Further, it may be a medium that carries the program in a fluid manner, such as downloading the program from a communication network. When the program is downloaded from the communication network in this way, the download program may be stored in the dialogue device body in advance, or may be installed from another recording medium. The content stored in the recording medium is not limited to the program and may be data.

【0085】[0085]

【発明の効果】以上説明したように本発明に係る対話装
置によれば、システムが単位出力情報の出力途中にユー
ザからの入力があった場合、出力途中の単位出力情報を
変更して、ユーザからの新しい入力に対応することによ
り、自然な応答が可能になる。これにより、対話システ
ムを利用する子供や大人、老人など、システムにすぐに
馴染めない人や使いにくさを感じる人など、いろいろな
タイプ人でも使い易くなる。また、システムが発話やし
ぐさをしている途中に、ユーザの入力を行っても「ぶつ
ぎれ」な反応を返さずに、迅速に応答し、冗長な反応を
示さないようになるという優れた効果を奏し得る。
As described above, according to the dialogue apparatus of the present invention, when the system receives an input from the user during the output of the unit output information, the unit output information during the output is changed and the user outputs the unit output information. Responding to new input from allows a natural response. This makes it easy for various types of people, such as children, adults, and elderly people who use the dialogue system, people who are not immediately familiar with the system or people who find it difficult to use. Also, the excellent effect that the system responds quickly and does not show a redundant reaction even if the user inputs while the system is uttering or gesturing Can play.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施の形態1に係る対話装置の構成を
示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a dialogue device according to a first embodiment of the present invention.

【図2】本発明の対話装置の処理を示すフローチャート
である。
FIG. 2 is a flowchart showing the processing of the dialog device of the present invention.

【図3】システム出力情報生成部102における処理の
フローチャートである。
FIG. 3 is a flowchart of processing in the system output information generation unit 102.

【図4】システム情報出力部103における処理のフロ
ーチャートである。
FIG. 4 is a flowchart of processing in the system information output unit 103.

【図5】システム出力情報逐次管理部105における処
理のフローチャートである。
FIG. 5 is a flowchart of processing in the system output information sequential management unit 105.

【図6】システム出力情報停止部106における処理の
フローチャートである。
FIG. 6 is a flowchart of processing in the system output information stopping unit 106.

【図7】システム主力情報変更部107における処理の
フローチャートである。
FIG. 7 is a flowchart of processing in the system main power information changing unit 107.

【図8】出力変更パターンテーブル108の例を示す図
である。
FIG. 8 is a diagram showing an example of an output change pattern table 108.

【図9】本発明の実施の形態2に係る対話装置の構成を
示すブロック図である。
FIG. 9 is a block diagram showing a configuration of a dialogue device according to a second embodiment of the present invention.

【図10】システム出力情報生成部903における処理
を示すフローチャートである。
FIG. 10 is a flowchart showing processing in the system output information generation unit 903.

【図11】システム出力情報停止部901における処理
を示すフローチャートである。
FIG. 11 is a flowchart showing processing in a system output information stopping unit 901.

【図12】システム出力情報変更部902における処理
を示すフローチャートである。
FIG. 12 is a flowchart showing processing in the system output information changing unit 902.

【図13】従来技術と本発明の対話例を示す図である。FIG. 13 is a diagram showing an example of interaction between the related art and the present invention.

【図14】従来のシステムを示すブロック図である。FIG. 14 is a block diagram showing a conventional system.

【図15】従来のシステムの処理を示すフローチャート
である。
FIG. 15 is a flowchart showing processing of a conventional system.

【図16】出力パターンテーブルの一例を示す図であ
る。
FIG. 16 is a diagram showing an example of an output pattern table.

【符号の説明】[Explanation of symbols]

101 ユーザ情報入力部 102,903 システム出力情報生成部 103 システム情報出力部 104 出力パターンテーブル 105 システム出力情報逐次管理部 106,901 システム出力情報停止部 107,902 システム出力情報変更部 108 出力変更パターンテーブル 101 user information input section 102,903 System output information generation unit 103 System information output section 104 output pattern table 105 System output information sequential management unit 106,901 System output information stop unit 107,902 System output information change unit 108 Output change pattern table

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 ユーザのジェスチャあるいはユーザの発
話の少なくとも1つを入力として認識する手段と、前記
入力の認識結果に基づいてユーザとの対話に応答するた
めの出力情報を単位出力情報毎に生成する手段と、生成
された出力情報を前記単位出力情報毎に出力する手段と
を備え、ユーザとの対話を行う対話装置であって、前記
対話装置からユーザヘの前記単位出力情報の出力の途中
において新たな入力がされた場合に、前記新たな入力の
認識結果に基づいて前記単位出力情報を変更する手段を
具備することを特徴とする対話装置。
1. A unit for recognizing at least one of a user's gesture or a user's utterance as input, and output information for responding to a dialogue with the user based on the recognition result of the input, for each unit output information. And a means for outputting the generated output information for each of the unit output information, and an interactive device for interacting with a user, in the middle of outputting the unit output information from the interactive device to the user. An interactive apparatus comprising means for changing the unit output information based on a recognition result of the new input when a new input is made.
【請求項2】 前記単位出力情報を変更する手段は、前
記出力情報を途中停止する手段を具備することを特徴と
する請求項1記載の対話装置。
2. The dialogue apparatus according to claim 1, wherein the unit for changing the unit output information comprises a unit for stopping the output information on the way.
【請求項3】 前記単位出力情報を変更する手段は、ユ
ーザに対する出力情報を変更するための出力変更パター
ンを保持するテーブルを具備することを特徴とする請求
項1又は2記載の対話装置。
3. The dialogue apparatus according to claim 1, wherein the unit for changing the unit output information comprises a table holding an output change pattern for changing the output information for the user.
【請求項4】 前記単位出力情報を変更する手段は、ユ
ーザに対する出力情報を逐次管理する手段を具備し、前
記ユーザヘの出力を変更する手段は前記新たな入力の認
識結果と前記単位出力情報の出力状況とに基づいて前記
単位出力情報を変更することを特徴とする請求項1ない
し3記載の対話装置。
4. The unit for changing the unit output information comprises a unit for sequentially managing the output information for the user, and the unit for changing the output to the user includes a recognition result of the new input and the unit output information. 4. The dialogue apparatus according to claim 1, wherein the unit output information is changed based on the output status.
【請求項5】 入力の認識結果に基づいてユーザヘの単
位出力情報を変更する際に、実際の出力が、前記出力情
報を途中停止する手段の算出した出力停止予定位置を既
に過ぎていた場合に、前記出力情報を逐次管理する手段
は実際の停止位置の情報を新たに生成し、前記実際の停
止位置と前記出力停止予定位置との差が閾値を超えてい
るか否かに応じて前記単位出力情報の内容を変更するこ
とを特徴とする請求項4記載の対話装置。
5. When changing the unit output information to the user based on the recognition result of the input, when the actual output has already passed the scheduled output stop position calculated by the means for stopping the output information on the way, The means for sequentially managing the output information newly generates information on the actual stop position, and outputs the unit output according to whether or not the difference between the actual stop position and the planned output stop position exceeds a threshold value. The interactive apparatus according to claim 4, wherein the content of the information is changed.
【請求項6】 ユーザのジェスチャあるいはユーザの発
話の少なくとも1つを入力として認識する工程と、前記
入力の認識結果に基づいてユーザとの対話に応答するた
めの出力情報を単位出力情報毎に生成する工程と、生成
された出力情報を前記単位出力情報毎に出力する工程と
を有するユーザとの対話を行う対話方法であって、前記
出力工程における前記単位出力情報の出力途中において
新たな入力がされた場合に、前記新たな入力を認識する
工程と、前記新たな入力の認識結果に基づいて前記単位
出力情報を変更して出力する工程とを有することを特徴
とする対話方法。
6. A step of recognizing at least one of a user's gesture or a user's utterance as an input, and generating output information for responding to a dialogue with the user for each unit output information based on a recognition result of the input. And a step of outputting the generated output information for each of the unit output information, and a dialogue method for performing a dialogue with a user, wherein a new input is made during the output of the unit output information in the output step. And a step of recognizing the new input, and a step of changing and outputting the unit output information based on a recognition result of the new input.
【請求項7】 さらに、ユーザに対する出力情報を逐次
管理する工程を有し、前記単位出力情報を変更して出力
する工程は前記新たな入力の認識結果と前記出力情報の
出力状況とに基づいて前記単位出力情報を変更すること
を特徴とする請求項6記載の対話方法。
7. A step of sequentially managing output information for a user, wherein the step of changing and outputting the unit output information is based on a recognition result of the new input and an output status of the output information. The interaction method according to claim 6, wherein the unit output information is changed.
【請求項8】 コンピュータを、請求項1乃至5記載の
対話装置として機能させるためのプログラム。
8. A program for causing a computer to function as the dialog device according to claim 1.
【請求項9】 請求項8記載のプログラムを記録したこ
とを特徴とするコンピュータ読み取り可能な記録媒体。
9. A computer-readable recording medium on which the program according to claim 8 is recorded.
JP2001326579A 2001-10-24 2001-10-24 Dialogue device Expired - Fee Related JP3894767B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001326579A JP3894767B2 (en) 2001-10-24 2001-10-24 Dialogue device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001326579A JP3894767B2 (en) 2001-10-24 2001-10-24 Dialogue device

Publications (2)

Publication Number Publication Date
JP2003131692A true JP2003131692A (en) 2003-05-09
JP3894767B2 JP3894767B2 (en) 2007-03-22

Family

ID=19142937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001326579A Expired - Fee Related JP3894767B2 (en) 2001-10-24 2001-10-24 Dialogue device

Country Status (1)

Country Link
JP (1) JP3894767B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018091911A (en) * 2016-11-30 2018-06-14 綜合警備保障株式会社 Voice interactive system and voice interactive method
US10304460B2 (en) 2016-09-16 2019-05-28 Kabushiki Kaisha Toshiba Conference support system, conference support method, and computer program product
CN111312232A (en) * 2018-12-10 2020-06-19 珠海格力电器股份有限公司 Voice control method and device, storage medium and air conditioner

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05323993A (en) * 1992-03-16 1993-12-07 Toshiba Corp Speech interactive system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05323993A (en) * 1992-03-16 1993-12-07 Toshiba Corp Speech interactive system
JP3398401B2 (en) * 1992-03-16 2003-04-21 株式会社東芝 Voice recognition method and voice interaction device

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
M. NAKANO ET AL.: "Handling rich turn-taking in spoken dialogue systems", PROCEEDINGS OF THE 6TH EUROPEAN CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY (EUROSPEECH'99), JPN4006008097, 5 September 1999 (1999-09-05), pages 1167 - 1170, XP001075888, ISSN: 0000734729 *
M. NAKANO ET AL.: "Handling rich turn-taking in spoken dialogue systems", PROCEEDINGS OF THE 6TH EUROPEAN CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY (EUROSPEECH'99), JPNX006036381, 5 September 1999 (1999-09-05), pages 1167 - 1170, XP001075888, ISSN: 0000763560 *
M. NAKANO ET AL.: "Handling rich turn-taking in spoken dialogue systems", PROCEEDINGS OF THE 6TH EUROPEAN CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY (EUROSPEECH'99), JPNX006054457, 5 September 1999 (1999-09-05), pages 1167 - 1170, XP001075888, ISSN: 0000790640 *
平沢他: "音声対話で柔軟なやりとりができるコンピュータ 〜音声対話システムDUG−1〜", JTT(JOURNAL OF TECHNOLOGY TRANSFER), vol. 23, no. 12, JPN4006007779, December 2000 (2000-12-01), JP, pages 8 - 13, ISSN: 0000734728 *
平沢他: "音声対話で柔軟なやりとりができるコンピュータ 〜音声対話システムDUG−1〜", JTT(JOURNAL OF TECHNOLOGY TRANSFER), vol. 23, no. 12, JPNX006036380, December 2000 (2000-12-01), JP, pages 8 - 13, ISSN: 0000763559 *
平沢他: "音声対話で柔軟なやりとりができるコンピュータ 〜音声対話システムDUG−1〜", JTT(JOURNAL OF TECHNOLOGY TRANSFER), vol. 23, no. 12, JPNX006054456, December 2000 (2000-12-01), JP, pages 8 - 13, ISSN: 0000790639 *
菊池他: "音声対話インタフェースにおける発話権管理による割込みへの対処", 電子情報通信学会誌 D-II, vol. 77, no. 8, JPN4006014399, August 1994 (1994-08-01), JP, pages 1502 - 1511, ISSN: 0000763561 *
菊池他: "音声対話インタフェースにおける発話権管理による割込みへの対処", 電子情報通信学会誌 D-II, vol. 77, no. 8, JPN4006022090, August 1994 (1994-08-01), JP, pages 1502 - 1511, ISSN: 0000790641 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10304460B2 (en) 2016-09-16 2019-05-28 Kabushiki Kaisha Toshiba Conference support system, conference support method, and computer program product
JP2018091911A (en) * 2016-11-30 2018-06-14 綜合警備保障株式会社 Voice interactive system and voice interactive method
CN111312232A (en) * 2018-12-10 2020-06-19 珠海格力电器股份有限公司 Voice control method and device, storage medium and air conditioner

Also Published As

Publication number Publication date
JP3894767B2 (en) 2007-03-22

Similar Documents

Publication Publication Date Title
Oviatt et al. Designing the user interface for multimodal speech and pen-based gesture applications: State-of-the-art systems and future research directions
Oviatt Multimodal interfaces
Cassell et al. Non-verbal cues for discourse structure
RU2352979C2 (en) Synchronous comprehension of semantic objects for highly active interface
CA2397703C (en) Systems and methods for abstracting portions of information that is represented with finite-state devices
Bohus et al. The RavenClaw dialog management framework: Architecture and systems
Ball et al. Lifelike computer characters: The persona project at Microsoft research
JP3514372B2 (en) Multimodal dialogue device
US5893063A (en) Data processing system and method for dynamically accessing an application using a voice command
JP3125746B2 (en) PERSON INTERACTIVE DEVICE AND RECORDING MEDIUM RECORDING PERSON INTERACTIVE PROGRAM
WO2017200074A1 (en) Dialog method, dialog system, dialog device, and program
KR20040103445A (en) Semantic object synchronous understanding implemented with speech application language tags
JP2001229392A (en) Rational architecture for executing conversational character with communication of small number of messages
JP2000200125A (en) Interface
WO2006054724A1 (en) Voice recognition device and method, and program
Kopp et al. An architecture for fluid real-time conversational agents: integrating incremental output generation and input processing
JP2001034289A (en) Interactive system using natural language
JP4729902B2 (en) Spoken dialogue system
López-Cózar et al. Review of spoken dialogue systems
US5897618A (en) Data processing system and method for switching between programs having a same title using a voice command
JP4162074B2 (en) Interactive information retrieval device
JPH08166866A (en) Editing support system equipped with interactive interface
JP2003131692A (en) Interactive device
JPH09269889A (en) Interactive device
McGlashan Speech interfaces to virtual reality

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061212

R150 Certificate of patent or registration of utility model

Ref document number: 3894767

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees