JPH06100959B2 - Voice interaction device - Google Patents

Voice interaction device

Info

Publication number
JPH06100959B2
JPH06100959B2 JP18022685A JP18022685A JPH06100959B2 JP H06100959 B2 JPH06100959 B2 JP H06100959B2 JP 18022685 A JP18022685 A JP 18022685A JP 18022685 A JP18022685 A JP 18022685A JP H06100959 B2 JPH06100959 B2 JP H06100959B2
Authority
JP
Japan
Prior art keywords
voice
unit
output
user
specific word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP18022685A
Other languages
Japanese (ja)
Other versions
JPS6240577A (en
Inventor
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP18022685A priority Critical patent/JPH06100959B2/en
Publication of JPS6240577A publication Critical patent/JPS6240577A/en
Publication of JPH06100959B2 publication Critical patent/JPH06100959B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、利用者の音声入力に対して音声で対話を行う
音声対話装置に関する。
Description: TECHNICAL FIELD OF THE INVENTION The present invention relates to a voice interaction device for performing voice interaction with a user's voice input.

[発明の技術的背景] 近年銀行の預金残高照会等においては音声対話装置が普
及している。この音声対話装置は利用者からの音声入力
信号を認識する音声認識部と、認識された音声に対する
所定のメッセージを生成したり、利用者側に対する指示
メッセージを生成する会話制御部と、生成されたメッセ
ージを音声信号として合成し利用者側に送出する音声応
答部等からなる。音声応答部で合成される音声は、たと
えば1文節、1単語または1文章のように区切られた一
連の語が一群として利用者側に送出される。
[Technical background of the invention] In recent years, a voice dialog device has become widespread in bank balance inquiry and the like. This voice interaction device includes a voice recognition unit that recognizes a voice input signal from a user, a conversation control unit that generates a predetermined message for the recognized voice and a command message for the user side. It is composed of a voice response unit which synthesizes a message as a voice signal and sends it to the user side. The voice synthesized by the voice response unit is sent to the user side as a group of a series of delimited words such as 1 phrase, 1 word or 1 sentence.

[背景技術の問題点] しかしながら従来の音声対話装置では利用者の命令や質
問に対して音声対話装置が音声を出力する場合、または
音声対話装置側の必要性から音声を生成する場合に、一
旦音声の出力が始まると終りまで出力されるので、利用
者が途中で聞きのがすようなことがあっても、もう一度
その部分を聞き直すことはできなかった。
[Problems of the Background Art] However, in the conventional voice interaction device, when the voice interaction device outputs a voice in response to a user's command or question, or when a voice is generated due to the necessity of the voice interaction device side, Since the sound is output until the end when it starts to be output, even if the user has a difficulty in listening on the way, it was not possible to hear the part again.

このため音声出力を聞き直すことのできる音声対話装置
も考案されているが、これは一回の出力音声が終了する
のを待って改めて利用者が音声を繰り返し出力すること
を命ずるコマンドを入力して行っていたので、時間がか
かるうえ同じ音声を2度聞かねばならないという問題点
があった。
For this reason, a voice interaction device that can hear the voice output again has been devised, but this is to wait for the end of one output voice, and then enter a command to instruct the user to repeatedly output voice. Since it was going on, there was a problem that it took time and had to listen to the same voice twice.

[発明の目的] 本発明の目的は前記問題点を解決すべく迅速な聞き返し
のできる音声対話装置を提供することにある。
[Object of the Invention] It is an object of the present invention to provide a voice dialogue device capable of quick listening in order to solve the above problems.

[発明の概要] 本発明は利用者から送られる音声を認識する音声認識部
と、メッセージを語群毎に利用者に出力する音声応答部
とを備えた音声対話装置において、前記音声認識部に特
定語を認識する特定語認識回路を設け、メッセージ出力
中に特定語が認識された場合には特定語が音声入力され
た時点における出力中の語群から再びメッセージを出力
する出力回路を前記音声応答部に設けたことにより、迅
速な聞き返しができるようにしたものである。
[Summary of the Invention] The present invention provides a voice interaction device including a voice recognition unit for recognizing a voice sent from a user and a voice response unit for outputting a message for each word group to the user. A specific word recognition circuit for recognizing a specific word is provided, and if the specific word is recognized during message output, the output circuit for outputting the message again from the word group being output at the time when the specific word is input by voice By providing it in the response part, it is possible to hear back quickly.

[発明の実施例] 以下、図面に基づいて本発明の実施例を詳細に説明す
る。
Embodiments of the Invention Embodiments of the present invention will be described in detail below with reference to the drawings.

第1図は本発明の一実施例に係る音声対話装置の構成ブ
ロック図であり、この音声対話装置は、音声認識部1、
会話制御部3、音声応答部5、およびタスクとのインタ
ーフェイス部7とからなる。
FIG. 1 is a configuration block diagram of a voice dialog device according to an embodiment of the present invention. The voice dialog device includes a voice recognition unit 1,
It includes a conversation control unit 3, a voice response unit 5, and a task interface unit 7.

音声認識部1と会話制御部3とは接続線9、データ線1
1、割込み信号線13によって接続される。音声応答部5
と会話制御部3とは接続線15、データ線17、割込み信号
線19によって接続される。音声認識部1と音声応答部5
とは接続線21によって接続される。会話制御部3とタス
クとのインターフェイス部7とは接続線23、25によって
接続される。
The voice recognition unit 1 and the conversation control unit 3 have a connection line 9 and a data line 1
1, connected by interrupt signal line 13. Voice response unit 5
And the conversation control unit 3 are connected by a connection line 15, a data line 17, and an interrupt signal line 19. Voice recognition unit 1 and voice response unit 5
Are connected to each other by a connecting line 21. The conversation control unit 3 and the task interface unit 7 are connected by connecting lines 23 and 25.

音声認識部1は利用者からの音声入力信号を認識する。
利用者から音声入力があると会話制御部3へ割込み信号
線13を介して割込み信号を送出する。またこの音声認識
部1には特定語を認識する特定語認識回路(図示せず)
が設けられており、この特定語認識回路たとえば「え
っ」とか「なんですって」等の特定語を記憶する第1メ
モリ(図示せず)と、認識され電気信号に変換された入
力信号と第1メモリの内容を比較する比較回路(図示せ
ず)からなる。利用者からの音声入力が「なんですっ
て」であった場合、この文節が特定語であるという情報
を会話制御部3へ送出し、利用者からの音声入力が特定
語でない場合には音声入力が特定語でないという情報を
会話制御部3へ送出する。
The voice recognition unit 1 recognizes a voice input signal from a user.
When the user inputs a voice, an interrupt signal is sent to the conversation control unit 3 via the interrupt signal line 13. Further, the voice recognition unit 1 has a specific word recognition circuit (not shown) for recognizing a specific word.
The specific word recognition circuit, for example, a first memory (not shown) that stores a specific word such as “um” or “what” and an input signal that is recognized and converted into an electric signal. It comprises a comparison circuit (not shown) for comparing the contents of the first memory. When the voice input from the user is "what-what", the information that this clause is a specific word is sent to the conversation control unit 3, and when the voice input from the user is not the specific word, the voice is input. Information that the input is not a specific word is sent to the conversation control unit 3.

この音声認識部1には接続線21より音声応答部5の出力
中を表わす信号が入力されこの信号が入力されていると
きは特定語のみの認識を行う。
A signal indicating that the voice response unit 5 is being output is input to the voice recognition unit 1 through the connection line 21. When this signal is input, only a specific word is recognized.

音声認識部1は、音声を検出した時点で、割り込み信号
を送出するとともに、音声を検出したことを示すデータ
を会話制御部3へ知らせる。また特定語の認識を行い、
検出した語が特定語か否かを認識した時点で、割り込み
信号を送出するとともに、特定語か否かを示すデータを
会話制御部3へ知らせる。
When the voice is detected, the voice recognizer 1 sends an interrupt signal and informs the conversation controller 3 of data indicating that the voice is detected. It also recognizes specific words,
When it is recognized whether the detected word is a specific word or not, an interrupt signal is sent and the conversation control unit 3 is notified of data indicating whether or not the word is the specific word.

会話制御部3は音声認識部1から割込み信号が入力さ
れ、それが音声の検出の時点での割り込みであった場
合、音声応答部5へ割込み信号を送出し、音声を中断す
るコマンドを送出する。また音声認識部1で認識された
音声入力が特定語である場合には音声応答部5へ再合成
命令を送出し、認識された音声入力が特定語でない場合
には、音声応答部5へ中断解除命令を送出する。
The conversation control unit 3 receives an interrupt signal from the voice recognition unit 1 and, if the interrupt signal is an interrupt at the time of voice detection, sends an interrupt signal to the voice response unit 5 and a command to interrupt voice. . When the voice input recognized by the voice recognition unit 1 is a specific word, a re-synthesis command is sent to the voice response unit 5, and when the recognized voice input is not the specific word, the voice response unit 5 is interrupted. Send a release command.

タスクとのインターフェイス部7は会話制御部3よりコ
マンドを受取り一定の仕事を行い、またそれによって得
られる情報を会話制御部3へ返す。
The task interface unit 7 receives a command from the conversation control unit 3 to perform a certain task, and returns information obtained thereby to the conversation control unit 3.

音声応答部5は利用者に音声メッセージを送出するもの
で、出力される音声は1文節、1単語、または1文章の
ように区切られた一連の語が一群として送出される。
The voice response unit 5 sends a voice message to the user, and the output voice is a group of a series of words delimited such as one phrase, one word, or one sentence.

この音声応答部5は会話制御部3より割込み信号を受
け、音声の中断を示すコマンドを受けると出力中の語群
の出力が終わった時点で音声出力の中断を行う。
When the voice response unit 5 receives an interrupt signal from the conversation control unit 3 and receives a command indicating the interruption of voice, the voice response unit 5 interrupts the voice output when the output of the word group being output ends.

また会話制御部3から再合成命令が入力されると、音声
入力があった時点の語群から再びメッセージを合成す
る。また会話制御部3から中断解除命令があった場合に
は再び次のメッセージを合成して出力する。
When a recomposition command is input from the conversation control unit 3, a message is recombined from the word group at the time of voice input. When the conversation control unit 3 issues an interruption canceling command, the next message is synthesized again and output.

次にこの実施例の動作について説明する。Next, the operation of this embodiment will be described.

第2図はこの実施例における装置側Sと利用者Uとの会
話のタイムチャートであり、装置側Sが「振込人名は山
本」といいかけたときに利用者Uが「なんですって」と
聞き返した場合を想定している。
FIG. 2 is a time chart of the conversation between the device side S and the user U in this embodiment, and when the device side S calls out "The transfer person's name is Yamamoto", the user U says "what is it?" It is assumed that you asked back.

音声応答部5は会話制御部3からの指令により前述した
ように「振込人名は山本」という音声を利用者に送出す
る。音声応答部5が出力中であるときはその出力中を表
わす信号が信号線21を介して音声認識部1に入力される
ので、このとき音声認識部1は内部に記憶されたたとえ
ば「なんですって」とか「えっ」とかいう特定語のみの
認識を行っている。
As described above, the voice response unit 5 outputs the voice "name of transfer person is Yamamoto" to the user in response to a command from the conversation control unit 3. When the voice response unit 5 is outputting, a signal indicating that the voice is being output is input to the voice recognition unit 1 via the signal line 21. At this time, the voice recognition unit 1 stores, for example, "What? It recognizes only specific words such as "" or "".

音声認識部1は時刻aにおいて音声入力があると割込み
送出し、割込み要因をデータ線9によって知らせる。
The voice recognition unit 1 sends an interrupt when there is a voice input at time a, and notifies the interrupt factor by the data line 9.

会話制御部3は音声認識部1から割込み信号が送られる
と音声応答部5へ割込み信号を送出すると同時にデータ
線15によって出力中の文節が出力し終わった時点で音声
出力を中断するコマンドを送出する。
When the voice recognition unit 1 sends an interrupt signal, the conversation control unit 3 sends an interrupt signal to the voice response unit 5 and at the same time sends a command to interrupt the voice output when the phrase being output by the data line 15 has finished being output. To do.

このため音声応答部5は第2図において時刻aにおいて
音声入力があったので語群「山本」を出力した時点で音
声出力を中断する。
Therefore, the voice response unit 5 interrupts the voice output at the time when the word group "Yamamoto" is output because the voice input is made at the time a in FIG.

音声認識部1は特定語のみの認識を行っており、利用者
Uから「なんですって」という音声入力があったので、
音声認識部1はこの特定語「なんですって」を認識し、
会話制御部3へデータ線9によって特定語が認識された
ことを伝える。
Since the voice recognition unit 1 recognizes only a specific word, and the user U inputs a voice saying "What is it?",
The voice recognition unit 1 recognizes this specific word "What is it?"
Data line 9 informs conversation control unit 3 that a specific word has been recognized.

会話制御部3は特定語が認識された場合には音声応答部
5へ再合成命令を送出する。音声応答部5は再合成命令
を受けると割込みを受けた時点の語群から出力し直す。
すなわち時刻S2において音声応答部5から「山本和夫で
す」という音声が出力される。
When the specific word is recognized, the conversation control unit 3 sends a resynthesis command to the voice response unit 5. When the voice response unit 5 receives the resynthesis command, the voice response unit 5 outputs again from the word group at the time of receiving the interrupt.
That is, at time S 2 , the voice response unit 5 outputs the voice “I am Kazuo Yamamoto”.

また時刻aにおいて利用者Uから入力される音声が特定
語でない場合は、会話制御部3は音声応答部5へ割込み
信号を送り、これに伴い音声応答部5は出力中の語群の
出力が終わった時点で音声出力の中断が行っているが、
この場合特定語でないので時刻S2において会話制御部3
から音声応答部5へ中断解除命令が出され、これに応じ
て音声応答部5は次の語群のメッセージを合成し出力す
る。
If the voice input from the user U at time a is not a specific word, the conversation control unit 3 sends an interrupt signal to the voice response unit 5, and the voice response unit 5 outputs the word group being output. Although the audio output is interrupted at the end,
In this case, since it is not a specific word, the conversation control unit 3 at time S 2
An interruption cancellation command is issued from the voice response unit 5 to the voice response unit 5. In response to this, the voice response unit 5 synthesizes and outputs the message of the next word group.

したがって利用者が「なんですって」とか「えっ」とか
いう特定語を発すると、その特定語が発せられた時刻に
音声応答部5から出力されていた語群から再び利用者に
音声出力が行われるので迅速な聞き返しが可能となる。
Therefore, when the user utters a specific word such as "What's that" or "Eh", the user outputs a voice again from the word group output from the voice response unit 5 at the time when the specific word is issued. You will be able to hear back quickly.

なお特定語認識回路に設定される特定語は「なんですっ
て」とか「えっ」だけに限るものではなく他の種々のも
のを設定しておくことが可能である。
It should be noted that the specific word set in the specific word recognition circuit is not limited to "what" and "huh", and various other kinds can be set.

[発明の効果] 以上詳細に説明したように本発明によれば、迅速な聞き
返しが可能となり、効率のよい音声対話装置を提供する
ことができる。
[Effects of the Invention] As described in detail above, according to the present invention, it is possible to promptly listen and to provide an efficient voice interaction device.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例に係る音声対話装置の構成ブ
ロック図、第2図は同実施例の動作を示すタイムチャー
トである。 1……音声認識部 3……会話制御部 5……音声応答部
FIG. 1 is a block diagram showing the configuration of a voice dialogue apparatus according to an embodiment of the present invention, and FIG. 2 is a time chart showing the operation of the same embodiment. 1 ... Voice recognition unit 3 ... Conversation control unit 5 ... Voice response unit

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】利用者から送られる音声を認識する音声認
識部と、メッセージを語群毎に利用者に出力する音声応
答部とを備えた音声対話装置において、前記音声認識部
に特定語を認識する特定語認識回路を設け、メッセージ
出力中に特定語が認識された場合には特定語が音声入力
された時点における出力中の語群から再びメッセージを
出力する出力回路を前記音声応答部に設けることを特徴
とする音声対話装置。
1. A voice interactive apparatus comprising: a voice recognition unit for recognizing a voice sent from a user; and a voice response unit for outputting a message for each word group to the user. A specific word recognition circuit for recognizing is provided, and when the specific word is recognized during message output, an output circuit for outputting a message again from the word group being output at the time when the specific word is input by voice is provided in the voice response unit. A voice interaction device characterized by being provided.
JP18022685A 1985-08-16 1985-08-16 Voice interaction device Expired - Lifetime JPH06100959B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18022685A JPH06100959B2 (en) 1985-08-16 1985-08-16 Voice interaction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18022685A JPH06100959B2 (en) 1985-08-16 1985-08-16 Voice interaction device

Publications (2)

Publication Number Publication Date
JPS6240577A JPS6240577A (en) 1987-02-21
JPH06100959B2 true JPH06100959B2 (en) 1994-12-12

Family

ID=16079589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18022685A Expired - Lifetime JPH06100959B2 (en) 1985-08-16 1985-08-16 Voice interaction device

Country Status (1)

Country Link
JP (1) JPH06100959B2 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01260591A (en) * 1988-04-11 1989-10-17 Toshiba Corp Processor for paper or the like
JPH0212673U (en) * 1988-07-06 1990-01-26
JP3378595B2 (en) * 1992-09-30 2003-02-17 株式会社日立製作所 Spoken dialogue system and dialogue progress control method thereof
JPH06164710A (en) * 1992-11-18 1994-06-10 Nagano Japan Radio Co Tele-marketing equipment
JP3566977B2 (en) * 1993-12-27 2004-09-15 株式会社東芝 Natural language processing apparatus and method
JP3513232B2 (en) * 1994-11-17 2004-03-31 キヤノン株式会社 Information processing apparatus and control method thereof
JPH08146991A (en) * 1994-11-17 1996-06-07 Canon Inc Information processor and its control method
JP3199972B2 (en) * 1995-02-08 2001-08-20 シャープ株式会社 Dialogue device with response
JPH09218770A (en) * 1996-02-14 1997-08-19 Toshiba Corp Interactive processor and interactive processing method
JP3489772B2 (en) * 1996-11-07 2004-01-26 株式会社リコー Work support system
JP3894005B2 (en) * 2002-03-14 2007-03-14 株式会社デンソー In-vehicle electronic device, in-vehicle electronic device speech recognition result notification method, speech recognition confirmation notification program, and navigation system
JP2010197858A (en) * 2009-02-26 2010-09-09 Gifu Univ Speech interactive system
JP5405381B2 (en) * 2010-04-19 2014-02-05 本田技研工業株式会社 Spoken dialogue device
JP5750380B2 (en) 2012-02-10 2015-07-22 株式会社東芝 Speech translation apparatus, speech translation method, and speech translation program
JP2013167806A (en) 2012-02-16 2013-08-29 Toshiba Corp Information notification supporting device, information notification supporting method, and program
JP2013200423A (en) * 2012-03-23 2013-10-03 Toshiba Corp Voice interaction support device, method and program

Also Published As

Publication number Publication date
JPS6240577A (en) 1987-02-21

Similar Documents

Publication Publication Date Title
JPH06100959B2 (en) Voice interaction device
JP3674990B2 (en) Speech recognition dialogue apparatus and speech recognition dialogue processing method
JP3700266B2 (en) Spoken dialogue control method and spoken dialogue system
US6882973B1 (en) Speech recognition system with barge-in capability
JP3168033B2 (en) Voice telephone dialing
AU687089B2 (en) Method for recognizing a spoken word in the presence of interfering speech
US6246986B1 (en) User barge-in enablement in large vocabulary speech recognition systems
US6282268B1 (en) Voice processing system
US6496799B1 (en) End-of-utterance determination for voice processing
Bratt et al. The SRI telephone-based ATIS system
JP4667085B2 (en) Spoken dialogue system, computer program, dialogue control apparatus, and spoken dialogue method
US20050038659A1 (en) Method of operating a barge-in dialogue system
US20050069122A1 (en) System and method for operator assisted automated call handling
EP1093114B1 (en) Generation of a name dictionary from telephone recorded greetings for speech recognition
CN110602334A (en) Intelligent outbound method and system based on man-machine cooperation
JP2001154694A (en) Voice recognition device and method
KR100194765B1 (en) Speech recognition system using echo cancellation and method
JP2656234B2 (en) Conversation voice understanding method
JPS6324585B2 (en)
JPH0588480B2 (en)
JPS6190562A (en) Voice conversation system in international switchboard
JPH06338946A (en) Voice mail terminal
JPS63260253A (en) Audio response system
KR20010048905A (en) Method for connecting between voice dialing service and directory assistant service
KR20000042364A (en) Voice recognition method using recognition apparatus effectively