JP6849964B2 - Dialogue control device, dialogue engine, management terminal, dialogue device, dialogue control method, dialogue method, and program - Google Patents
Dialogue control device, dialogue engine, management terminal, dialogue device, dialogue control method, dialogue method, and program Download PDFInfo
- Publication number
- JP6849964B2 JP6849964B2 JP2016172468A JP2016172468A JP6849964B2 JP 6849964 B2 JP6849964 B2 JP 6849964B2 JP 2016172468 A JP2016172468 A JP 2016172468A JP 2016172468 A JP2016172468 A JP 2016172468A JP 6849964 B2 JP6849964 B2 JP 6849964B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- unit
- dialogue
- utterance
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、対話を制御する対話制御装置等に関するものである。 The present invention relates to a dialogue control device or the like that controls dialogue.
従来、ユーザとのコミュニケーションの柔軟性を向上させることを目的とした音声対話制御装置が存在した。かかる音声対話装置の制御は、音声を取得してから応答を生成するまでの待機時間に、応答の修正要否を判定するための修正条件が満たされたと判定したとき、生成した応答を修正する修正実行部を備える(特許文献1参照)。 Conventionally, there has been a voice dialogue control device for the purpose of improving the flexibility of communication with a user. The control of the voice dialogue device corrects the generated response when it is determined that the correction condition for determining whether or not the response needs to be corrected is satisfied in the waiting time from the acquisition of the voice to the generation of the response. It is provided with a correction execution unit (see Patent Document 1).
また、従来、実際のユーザの発話に適した分類カテゴリの設定が比較的容易に行えるようなメンテナンス性の高い対話システムがあった(特許文献2参照)。かかる対話システムは、対話の状態遷移情報を用いて対話を進行していく。 Further, conventionally, there has been a highly maintainable dialogue system in which a classification category suitable for an actual user's utterance can be set relatively easily (see Patent Document 2). Such a dialogue system advances the dialogue by using the state transition information of the dialogue.
しかしながら、従来の装置においては、一の対話エンジンのみを使用していたので、適切な対話が継続できない場合があった。 However, in the conventional device, since only one dialogue engine is used, there are cases where an appropriate dialogue cannot be continued.
また、例えば、ユーザと対話エンジンとの対話が破綻しているにも関わらず、対話を継続するか、対話を終了するかしかなかった。 Also, for example, even though the dialogue between the user and the dialogue engine is broken, there is no choice but to continue the dialogue or end the dialogue.
本第一の発明の対話制御装置は、2以上の対話エンジンから、ユーザの発話に対応する応答である自動応答情報を受け付け得る対話制御装置であって、ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信部と、ユーザ発話情報に対応する情報である発話情報を、1以上の対話エンジンに対して出力し得る発話情報出力部と、発話情報の出力に応じて、1以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、自動応答受付部が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報をユーザ端末に送信する応答送信部とを具備する対話制御装置である。 The dialogue control device of the first invention is a dialogue control device that can receive automatic response information that is a response corresponding to a user's utterance from two or more dialogue engines, and obtains user utterance information corresponding to the user's utterance. A receiving unit received from the user terminal, an utterance information output unit capable of outputting utterance information corresponding to the user utterance information to one or more dialogue engines, and one or more utterance information depending on the output of the utterance information. A response that transmits to the user terminal an automatic response reception unit that receives automatic response information from each dialogue engine and one automatic information corresponding to one of the one or more automatic response information received by the automatic response reception unit. It is a dialogue control device including a transmission unit.
かかる構成により、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。 With such a configuration, a plurality of dialogue engines can be effectively used to continue an appropriate dialogue.
また、本第二の発明の対話制御装置は、第一の発明に対して、発話情報出力部は、発話情報を、2以上の対話エンジンに出力し、自動応答受付部は、発話情報の出力に応じて、2以上の各対話エンジンから自動応答情報を受け付け、2以上の自動応答情報から一の自動応答情報を選択する選択部をさらに具備し、応答送信部は、選択部が選択した自動応答情報に対応する一の自動情報をユーザ端末に送信する対話制御装置である。 Further, in the dialogue control device of the second invention, the utterance information output unit outputs the utterance information to two or more dialogue engines, and the automatic response reception unit outputs the utterance information with respect to the first invention. The response transmission unit further includes a selection unit that receives automatic response information from two or more dialogue engines and selects one automatic response information from two or more automatic response information, and the response transmission unit is an automatic unit selected by the selection unit. It is an interactive control device that transmits one automatic information corresponding to the response information to the user terminal.
かかる構成により、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。 With such a configuration, a plurality of dialogue engines can be effectively used to continue an appropriate dialogue.
また、本第三の発明の対話制御装置は、第二の発明に対して、選択部は、2以上の自動応答情報から、予め決められた条件に合致する一の自動応答情報を選択する対話制御装置である。 Further, in the dialogue control device of the third invention, with respect to the second invention, the selection unit selects one automatic response information that matches a predetermined condition from two or more automatic response information. It is a control device.
かかる構成により、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。 With such a configuration, a plurality of dialogue engines can be effectively used to continue an appropriate dialogue.
また、本第四の発明の対話制御装置は、第二または第三の発明に対して、選択部は、2以上の自動応答情報のうちの予め決められた条件を満たす自動応答情報の中で、優先度情報に基づく優先度が最も高い対話エンジンから出力された自動応答情報を選択する対話制御装置である。 Further, in the dialogue control device of the fourth invention, with respect to the second or third invention, the selection unit is among the automatic response information satisfying the predetermined conditions among the two or more automatic response information. , A dialogue control device that selects the automatic response information output from the dialogue engine with the highest priority based on the priority information.
かかる構成により、複数の対話エンジンから一の応答を適切に選択し、適切な対話を継続させることができる。 With such a configuration, one response can be appropriately selected from a plurality of dialogue engines, and an appropriate dialogue can be continued.
また、本第五の発明の対話制御装置は、第一の発明に対して、2以上の対話エンジンから一の対話エンジンを選択する選択部をさらに具備し、発話情報出力部は、発話情報を、選択部が選択した一の対話エンジンに出力し、自動応答受付部は、発話情報の出力に応じて、一の対話エンジンから自動応答情報を受け付け、応答送信部は、自動応答受付部が受け付けた自動応答情報に対応する一の自動情報をユーザ端末に送信する対話制御装置である。 Further, the dialogue control device of the fifth invention further includes a selection unit for selecting one dialogue engine from two or more dialogue engines with respect to the first invention, and the utterance information output unit outputs utterance information. , The selection unit outputs to one dialogue engine selected, the automatic response reception unit receives the automatic response information from one dialogue engine according to the output of the utterance information, and the response transmission unit receives the automatic response reception unit. It is a dialogue control device that transmits one automatic information corresponding to the automatic response information to the user terminal.
かかる構成により、複数の対話エンジンから一の対話エンジンを適切に選択し、適切な対話を継続させることができる。 With such a configuration, one dialogue engine can be appropriately selected from a plurality of dialogue engines, and an appropriate dialogue can be continued.
また、本第六の発明の対話制御装置は、第五の発明に対して、選択部は、ユーザ発話情報または発話情報を用いて、一の対話エンジンを選択する対話制御装置である。 Further, the dialogue control device of the sixth invention is a dialogue control device for selecting one dialogue engine by using the user utterance information or the utterance information with respect to the fifth invention.
かかる構成により、ユーザの発話を用いて、複数の対話エンジンから一の対話エンジンを適切に選択し、適切な対話を継続させることができる。 With such a configuration, one dialogue engine can be appropriately selected from a plurality of dialogue engines by using the user's utterance, and an appropriate dialogue can be continued.
また、本第七の発明の対話制御装置は、第一から第六いずれか1つの発明に対して、発話情報出力部は、発話情報を管理端末に対しても出力可能であり、発話情報の管理端末への出力に応じて、管理端末からの応答である手動応答情報を受け付ける手動応答受付部をさらに具備し、応答送信部は、一の自動応答情報に対応する情報である一の自動情報または手動応答情報に対応する情報である手動情報をユーザ端末に送信する対話制御装置である。 Further, the dialogue control device of the seventh invention can output the utterance information to the management terminal for any one of the first to sixth inventions, and the utterance information output unit can output the utterance information to the management terminal. It further includes a manual response receiving unit that receives manual response information that is a response from the management terminal in response to output to the management terminal, and the response transmitting unit is one automatic information that is information corresponding to one automatic response information. Alternatively, it is an interactive control device that transmits manual information, which is information corresponding to manual response information, to a user terminal.
かかる構成により、対話エンジンからの応答と管理者からの応答とを使い分けて、ユーザ端末に出力することにより、適切な対話を継続できる。 With such a configuration, an appropriate dialogue can be continued by properly using the response from the dialogue engine and the response from the administrator and outputting them to the user terminal.
また、本第八の発明の対話制御装置は、対話エンジンを採用するか、管理端末を採用するかを決定する決定部をさらに具備し、応答送信部は、決定が対話エンジンを採用するとの決定の場合は、一の自動情報をユーザ端末に送信し、決定が管理端末を採用するとの決定の場合は、手動情報をユーザ端末に送信する請求項7載の対話制御装置である。
Further, the dialogue control device of the eighth invention further includes a decision unit for deciding whether to adopt a dialogue engine or a management terminal, and the response transmission unit determines that the decision adopts the dialogue engine. In the case of, the interactive control device according to
かかる構成により、対話エンジンからの応答と管理者からの応答とを使い分けて、ユーザ端末に出力することにより、適切な対話を継続できる。 With such a configuration, an appropriate dialogue can be continued by properly using the response from the dialogue engine and the response from the administrator and outputting them to the user terminal.
また、本第九の発明の対話制御装置は、第八の発明に対して、対話エンジンを採用する自動モード、または管理端末を採用する手動モードのいずれかを、少なくとも採り得るモード情報が格納されるモード格納部と、モード情報を変更するための予め決められた条件を満たすか否かを判断する判断部と、判断部が予め決められた条件を満たすと判断した場合に、モード情報を変更するモード変更部とをさらに具備し、決定部は、モード格納部のモード情報を取得する対話制御装置である。 Further, the dialogue control device of the ninth invention stores mode information that can at least adopt either an automatic mode that employs a dialogue engine or a manual mode that employs a management terminal for the eighth invention. Mode storage unit, a judgment unit that determines whether or not a predetermined condition for changing the mode information is satisfied, and a judgment unit that determines whether or not a predetermined condition is satisfied, the mode information is changed. The mode changing unit is further provided, and the determining unit is an interactive control device that acquires the mode information of the mode storage unit.
かかる構成により、対話エンジンからの応答と管理者からの応答とを使い分けて、ユーザ端末に出力することにより、適切な対話を継続できる。 With such a configuration, an appropriate dialogue can be continued by properly using the response from the dialogue engine and the response from the administrator and outputting them to the user terminal.
また、本第十の発明の対話制御装置は、第八の発明に対して、対話エンジンを採用する自動モード、または管理端末を採用する手動モードのいずれかを、少なくとも採り得るモード情報が格納されるモード格納部と、管理端末からモードの変更の指示である変更指示を受け付ける変更指示受付部と、変更指示に応じて、モード格納部のモード情報を変更するモード変更部とをさらに具備し、決定部は、モード格納部のモード情報に従って、対話エンジンを採用するか、管理端末を採用するかを決定する対話制御装置である。 Further, the dialogue control device of the tenth invention stores mode information that can at least take either an automatic mode adopting a dialogue engine or a manual mode adopting a management terminal for the eighth invention. It further includes a mode storage unit, a change instruction reception unit that receives a change instruction that is a mode change instruction from a management terminal, and a mode change unit that changes the mode information of the mode storage unit in response to the change instruction. The determination unit is a dialogue control device that determines whether to adopt the dialogue engine or the management terminal according to the mode information of the mode storage unit.
かかる構成により、対話エンジンからの応答と管理者からの応答とを使い分けて、ユーザ端末に出力することにより、適切な対話を継続できる。 With such a configuration, an appropriate dialogue can be continued by properly using the response from the dialogue engine and the response from the administrator and outputting them to the user terminal.
また、本第十一の発明の対話制御装置は、第七から第十いずれか1つの発明に対して、一の自動情報を管理端末に出力する自動情報出力部をさらに具備する対話制御装置である。 Further, the dialogue control device of the eleventh invention is a dialogue control device further comprising an automatic information output unit for outputting one automatic information to a management terminal for any one of the seventh to tenth inventions. is there.
かかる構成により、対話エンジンからの応答と管理者からの応答とを使い分けて、ユーザ端末に出力することにより、適切な対話を継続できる。 With such a configuration, an appropriate dialogue can be continued by properly using the response from the dialogue engine and the response from the administrator and outputting them to the user terminal.
また、本第十二の発明の対話制御装置は、第七から第十一いずれか1つの発明に対して、手動情報を対話エンジンに出力する手動情報出力部をさらに具備する対話制御装置である。 Further, the dialogue control device of the twelfth invention is a dialogue control device further provided with a manual information output unit for outputting manual information to the dialogue engine for any one of the seventh to eleventh inventions. ..
かかる構成により、対話エンジンに管理者からの応答を渡すことにより、対話エンジンの能力の向上に寄与でき得る。 With such a configuration, it is possible to contribute to the improvement of the capacity of the dialogue engine by passing the response from the administrator to the dialogue engine.
また、本第十三の発明の対話エンジンは、第一から第十二いずれか1つの発明に対して、発話情報に対応する自動応答情報を取得するための情報である学習情報が格納される学習情報格納部と、対話制御装置から発話情報を受け付ける発話受付部と、発話受付部が受け付けた発話情報に対応する応答である自動応答情報を、学習情報を用いて取得する応答取得部と、応答取得部が取得した自動応答情報を対話制御装置に出力する応答出力部と、他の対話エンジンからの応答である他自動応答情報を受け付ける学習受付部と、学習受付部が受け付けた他自動応答情報を用いて、学習情報に情報を付加する学習部とを具備する対話エンジンである。 Further, the dialogue engine of the thirteenth invention stores learning information which is information for acquiring automatic response information corresponding to speech information for any one of the first to twelfth inventions. A learning information storage unit, a utterance reception unit that receives utterance information from the dialogue control device, a response acquisition unit that acquires automatic response information that is a response corresponding to the utterance information received by the utterance reception unit, and a response acquisition unit that uses the learning information. A response output unit that outputs the automatic response information acquired by the response acquisition unit to the dialogue control device, a learning reception unit that receives other automatic response information that is a response from another dialogue engine, and another automatic response received by the learning reception unit. It is a dialogue engine including a learning unit that adds information to learning information using information.
かかる構成により、他の対話エンジンからの応答を学習できる対話エンジンを提供できる。 With such a configuration, it is possible to provide a dialogue engine capable of learning the response from another dialogue engine.
また、本第十四の発明の対話装置は、2以上の対話エンジンから、ユーザの発話に対応する応答である自動応答情報を受け付け得る対話装置であって、ユーザ発話情報に対応する情報である発話情報を、1以上の対話エンジンに対して出力し得る発話情報出力部と、発話情報の出力に応じて、1以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、自動応答受付部が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報をユーザ端末に送信する応答出力部とを具備する対話装置である。 Further, the dialogue device of the fourteenth invention is a dialogue device capable of receiving automatic response information which is a response corresponding to a user's utterance from two or more dialogue engines, and is information corresponding to the user's utterance information. An utterance information output unit that can output utterance information to one or more dialogue engines, an automatic response reception unit that receives automatic response information from one or more dialogue engines according to the output of utterance information, and an automatic response reception unit. It is an interactive device including a response output unit that transmits one automatic information corresponding to one of the one or more automatic response information received by the unit to the user terminal.
かかる構成により、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。 With such a configuration, a plurality of dialogue engines can be effectively used to continue an appropriate dialogue.
また、本第十五の発明の対話装置は、第十四の発明に対して、発話情報出力部は、ユーザ発話情報に関する発話情報を、1以上の対話エンジンまたは画面のうちの少なくともどちらか一方に出力し、発話情報の前記画面への出力に応じて、管理者からの応答である手動応答情報を受け付ける手動応答受付部をさらに具備し、応答出力部は、自動応答情報に関する自動情報または手動応答情報に関する手動情報を出力する対話装置である。 Further, in the dialogue device of the fifteenth invention, with respect to the fourteenth invention, the utterance information output unit outputs the utterance information regarding the user utterance information to at least one of one or more dialogue engines or screens. The response output unit is further provided with a manual response reception unit that outputs the utterance information to the screen and receives the manual response information that is the response from the administrator, and the response output unit is the automatic information or the manual about the automatic response information. It is an interactive device that outputs manual information about response information.
かかる構成により、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。 With such a configuration, a plurality of dialogue engines can be effectively used to continue an appropriate dialogue.
本発明による対話制御装置によれば、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。 According to the dialogue control device according to the present invention, a plurality of dialogue engines can be effectively used to continue an appropriate dialogue.
以下、対話制御装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。 Hereinafter, embodiments of the dialogue control device and the like will be described with reference to the drawings. In addition, since the components with the same reference numerals perform the same operation in the embodiment, the description may be omitted again.
(実施の形態1)
本実施の形態において、複数の対話エンジンにリクエストを送信し、複数の応答から一の応答を採用する対話システムについて説明する。
(Embodiment 1)
In the present embodiment, a dialogue system that sends a request to a plurality of dialogue engines and adopts one response from the plurality of responses will be described.
本実施の形態において、予め決められた条件に合致する対話エンジンの応答を採用する対話システムについて説明する。 In the present embodiment, a dialogue system that employs the response of the dialogue engine that meets the predetermined conditions will be described.
本実施の形態において、予め決められた条件を満たす応答の中で、対話エンジンに対する優先度が最も高い対話エンジンの応答を採用する対話システムについて説明する。 In the present embodiment, a dialogue system that adopts the response of the dialogue engine having the highest priority to the dialogue engine among the responses satisfying the predetermined conditions will be described.
本実施の形態における対話システムを構成する対話制御装置は、2以上の対話エンジンから、ユーザの発話に対応する応答である自動応答情報を受け付け得る装置である。 The dialogue control device constituting the dialogue system in the present embodiment is a device that can receive automatic response information that is a response corresponding to a user's utterance from two or more dialogue engines.
図1は、本実施の形態における対話システムAの概念図である。対話システムAは、1または2以上のユーザ端末1、対話制御装置2、および2以上の対話エンジン3を備える。ユーザ端末1は、例えば、いわゆるパーソナルコンピュータ、タブレット端末、スマートフォン等であり、その種類は問わない。なお、ユーザ端末1は、ユーザが使用する端末である。ユーザは、対話エンジンとの対話を行う人である。対話制御装置2は、対話を制御する装置である。対話制御装置2は、例えば、ASPのサーバ、クラウドサーバ等である。但し、対話制御装置2の種類は問わない。2以上の各対話エンジン3は、ユーザからの発話の情報を受け付け、応答を返す装置である。対話エンジン3は、例えば、ASPのサーバ、クラウドサーバ等である。但し、対話エンジン3の種類は問わない。また、対話エンジン3は、発話情報を受け付け、自動応答情報を出力する。対話エンジン3は、公知の対話エンジンでも良い。
FIG. 1 is a conceptual diagram of the dialogue system A according to the present embodiment. The dialogue system A includes one or
また、通常、1以上の各ユーザ端末1と対話制御装置2とはインターネット、LAN等のネットワークにより通信可能である。また、通常、対話制御装置2と1以上の各対話エンジン3とはインターネット、LAN等のネットワークにより通信可能である。ただし、対話制御装置2は、1以上のユーザ端末1、1以上の対話エンジン3のうちの1以上の装置を内部に含んでいても良い。つまり、ユーザ端末1と対話制御装置2と対話エンジン3のうちの2以上の装置は、物理的に一の装置で実現されても良い。
Further, usually, one or
図2は、本実施の形態における対話システムAのブロック図である。図3は、対話制御装置2のブロック図である。
FIG. 2 is a block diagram of the dialogue system A according to the present embodiment. FIG. 3 is a block diagram of the
ユーザ端末1は、ユーザ受付部11、ユーザ処理部12、ユーザ送信部13、ユーザ受信部14、およびユーザ出力部15を備える。
The
対話制御装置2は、格納部21、受信部22、処理部23、出力部24、受付部25、および送信部26を備える。処理部23は、選択部231を備える。出力部24は、発話情報出力部241を備える。受付部25は、自動応答受付部251を備える。送信部26は、応答送信部261を備える。
The
対話エンジン3は、学習情報格納部31、発話受付部32、応答取得部33、応答出力部34、学習受付部35、および学習部36を備える。
The
ユーザ端末1を構成するユーザ受付部11は、ユーザからの発話を受け付ける。発話の受け付けは、音声での受け付けでも良いし、テキストでの受け付けでも良い。発話は、ユーザが発した情報、ユーザが入力した情報であれば良い。発話の入力手段は、マイク、キーボード、マウス、メニュー画面によるもの等、何でも良い。ユーザ受付部11は、マイクやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
The
ユーザ処理部12は、ユーザ受付部11が受け付けた発話から、当該発話に対応するユーザ発話情報を取得する。ユーザ処理部12は、例えば、音声である発話を音声認識し、テキストであるユーザ発話情報を取得する。なお、ユーザ発話情報は、ユーザが入力した発話と同じでも良い。
The
また、ユーザ処理部12は、ユーザ受信部14が受信した自動情報がテキストの場合、当該を自動情報から音声データを生成しても良い。
Further, when the automatic information received by the
ユーザ送信部13は、ユーザ処理部12が取得したユーザ発話情報を対話制御装置2に送信する。
The
ユーザ受信部14は、後述する自動情報を受信する。自動情報は、通常、対話制御装置2から送信される。
The
ユーザ出力部15は、ユーザ受信部14が受信した自動情報を出力する。ユーザ出力部15は、ユーザ処理部12が自動情報から取得した音声データを音声出力しても良い。なお、かかる場合も、自動情報を出力したものとする。また、ここでの出力とは、通常、ディスプレイへの表示、またはスピーカーへの音声出力であるが、プロジェクターを用いた投影、プリンタでの印字、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である、と考えても良い。
The
対話制御装置2を構成する格納部21は、各種の情報が格納される。各種の情報とは、例えば、後述する自動応答情報の選択条件、後述する優先度情報、対話の履歴、2以上の各対話エンジン3と通信を行うための情報(例えば、対話エンジン3のIPアドレス、URL、MACアドレス等)である。対話の履歴は、例えば、ユーザ発話情報、発話情報、自動応答情報、自動情報等である。
Various types of information are stored in the
受信部22は、ユーザ発話情報をユーザ端末1から受信する。また、ユーザ発話情報は、通常、テキストであるが、音声データでも良い。ユーザ発話情報のデータ構造やータタイプは問わない。
The receiving
処理部23は、各種の処理を行う。各種の処理とは、選択部231が行う処理等である。
The
選択部231は、2以上の自動応答情報から一の自動応答情報を選択する。かかる選択方法は、ランダムでも良い。ランダムとは、2以上の自動応答情報から任意に一の自動応答情報を選択することである。
The
また、選択部231は、2以上の自動応答情報から、予め決められた条件に合致する一の自動応答情報を選択する。予め決められた条件は、例えば、スコアに基づく条件、自動応答情報の内容に基づく条件、時間に基づく条件、優先度に基づく条件等、またはこれらの組み合わせである。スコアに基づく条件は、例えば、自動応答情報に対応付いているスコアが最も高い、という条件である。また、自動応答情報の内容に基づく条件とは、例えば、最も長い文字列の自動応答情報、または文の数が最も多い自動応答情報、という条件である。また、時間に基づく条件とは、例えば、最も早く受け付けられた自動応答情報である、という条件である。また、優先度に基づく条件とは、例えば、閾値の時間内に受け付けられた自動応答情報の中で、優先度情報に基づく優先度が最も高い対話エンジン3から出力された自動応答情報である、という条件である。なお、かかる条件は問わない。優先度に基づく場合、通常、格納部21は優先度情報を格納している。優先度情報とは、2以上の対話エンジン3の優先度を示す情報である。優先度情報は、例えば、優先度の高い順に並べられた対話エンジン3の識別子である。優先度情報は、例えば、優先度(例えば、数値)と対話エンジン3の識別子との組を、2組以上有する情報である。
Further, the
選択部231は、2以上の自動応答情報のうちの予め決められた条件を満たす自動応答情報の中で、優先度情報に基づく優先度が最も高い対話エンジン3から出力された自動応答情報を選択する。ここで、予め決められた条件を満たす自動応答情報とは、例えば、対話の破綻を示す情報(例えば、「理解できない」「理解不能」など)を有しない自動応答情報、スコアが閾値以上の自動応答情報等である。
The
なお、選択部231が2以上の自動応答情報の中から一の自動応答情報を選択するアルゴリズム(上記の予め決められた条件)は問わない。
The algorithm (predetermined condition described above) in which the
出力部24は、各種の情報を出力する。ここでの出力とは、通常、送信である。ただし、出力とは、情報が出力先に渡れば良い。
The
発話情報出力部241は、ユーザ発話情報に対応する情報である発話情報を、1以上の各対話エンジン3に出力する。ここでは、主に、発話情報出力部241が、発話情報を、2以上の各対話エンジン3に出力する場合について説明する。ここで、発話情報は、ユーザ発話情報と同じ情報でも良い。また、発話情報は、ユーザ発話情報を音声認識し、得られたテキストでも良い。発話情報は、発話識別子が付加された情報であることは好適である。なお、発話識別子は、発話を識別する情報である。
The utterance
自動応答情報出力部242は、選択部231が選択した一の自動応答情報を、当該一の自動応答情報を出力した対話エンジン3以外の1以上の対話エンジン3に出力する。なお、自動応答情報出力部242は、自動応答受付部251が受け付けた1以上の自動応答情報を、自身が出力した自動応答情報を除いて、他の全ての対話エンジン3に出力しても良いし、他の対話エンジン3の中の一部の対話エンジン3に出力しても良い。また、自動応答情報出力部242が自動応答情報を対話エンジン3に出力するのは、対話エンジン3の学習のためである。
The automatic response
受付部25は、各種の情報や指示等を受け付ける。ここでの受け付けとは、通常、受信である。但し、受け付けは、情報等を受け取れれば良い。
The
自動応答受付部251は、発話情報の対話エンジン3への出力に応じて、対話エンジン3からの応答である1または2以上の自動応答情報を受け付ける。通常、自動応答受付部251は、発話情報の出力に応じて、2以上の各対話エンジンから自動応答情報を受け付ける。なお、ここでの受け付けとは、例えば、受信である。
The automatic
送信部26は、各種の情報を送信する。各種の情報とは、例えば、自動情報等である。
The
応答送信部261は、自動応答受付部251が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報をユーザ端末1に送信する。
The
応答送信部261は、通常、選択部231が選択した自動応答情報に対応する一の自動情報をユーザ端末1に送信する。
The
対話エンジン3を構成する学習情報格納部31は、1または2以上の学習情報を格納している。なお、単に「学習情報」と言うときは、2以上の学習情報でも良い。また、学習情報とは、発話情報に対応する自動応答情報を取得するための情報である。学習情報は、例えば、発話情報と自動応答情報との組である。また、学習情報は、例えば、発話情報の文字列パターンと自動応答情報の文字列パターンとの組である。また、学習情報は、例えば、会話の状態遷移を示す情報(例えば、特許文献2参照)等でも良い。また、学習情報は、単語の辞書等を含んでも良い。なお、学習情報のデータ構造や内容は問わないことは言うまでもない。
The learning
発話受付部32は、対話制御装置2から発話情報を受け付ける。発話受付部32は、通常、対話制御装置2から発話情報を受信する。
The
応答取得部33は、発話受付部32が受け付けた発話情報に対応する応答である自動応答情報を、学習情報格納部31の学習情報を用いて取得する。なお、かかる応答取得部33の処理は公知技術である。例えば、応答取得部33は、発話受付部32が受け付けた発話情報と対になる自動応答情報を学習情報格納部31から検索する。また、例えば、応答取得部33は、発話受付部32が受け付けた発話情報に合致する発話情報の文字列パターンを検知し、当該発話情報の文字列パターンと対になる自動応答情報の文字列パターンを取得し、当該自動応答情報の文字列パターンの変数部分に発話情報から抽出した単語または句を代入して、自動応答情報を構成する。
The
応答出力部34は、応答取得部33が取得した自動応答情報を対話制御装置2に出力する。ここでの出力は、通常、送信である。ただし、出力とは、対話制御装置2に自動応答情報が渡されれば良い。
The
学習受付部35は、他の対話エンジン3からの応答である自動応答情報を受け付ける。ここでの自動応答情報の受け付けは、自動情報の受け付けでも良い趣旨である。
The
学習部36は、学習受付部35が受け付けた自動応答情報を用いて、学習処理を行う。学習処理は、例えば、自動応答情報を用いて、学習情報格納部31の学習情報に情報を付加することである。学習処理は、例えば、自動応答情報を用いて、学習情報格納部31の学習情報を変更することである。学習情報に情報を付加する処理は、学習情報格納部31に新しい学習情報を追記する処理を含む。
The
学習部36は、例えば、自動応答情報と当該自動応答情報に対応する発話情報の組である学習情報を学習情報格納部31に追記する。
The
学習部36は、例えば、他の対話エンジン3からの自動応答情報と当該自動応答情報に対応する発話情報の組の情報から、状態遷移情報である学習情報に、当該発話情報の前の自動応答情報のノード(状態)の先の状態として、発話情報のノードを付加し、当該発話情報のノードに、自動応答情報のノードを付加する。
For example, the
学習部36は、例えば、他の対話エンジン3からの自動応答情報から自動応答情報のパターンを構成し、かつ当該自動応答情報に対応する発話情報から発話情報のパターンを構成し、発話情報のパターンと応答のパターンとの組である学習情報を学習情報格納部31に追記する。
For example, the
学習部36は、例えば、他の対話エンジン3からの自動応答情報から自動応答情報のパターンを構成し、かつ当該自動応答情報に対応する発話情報から発話情報のパターンを構成し、当該パターンの組に合致する、発話情報のパターンと自動応答情報のパターンの組の出現頻度または出現確率を増加させるように、学習情報格納部31の学習情報を更新する。かかる場合、学習情報は、発話情報のパターンと自動応答情報のパターンの組、および出現頻度または出現確率を有する。
For example, the
なお、学習部36は、例えば、発話情報に対応する発話識別子と自動応答情報に対応する発話識別子とが同一の、発話情報と自動応答情報とを用いて、上記の学習処理を行う。
The
また、他の対話エンジン3からの自動応答情報を用いた学習処理は種々あり得る。他の対話エンジン3からの自動応答情報を用いる点を除いて、学習部36が行う学習処理は他の公知の学習処理のアルゴリズムを用いても良い。
In addition, there may be various learning processes using the automatic response information from the
ユーザ処理部12、処理部23、選択部231、応答取得部33、および学習部36は、通常、MPUやメモリ等から実現され得る。ユーザ処理部12の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
The
ユーザ送信部13、出力部24、発話情報出力部241、送信部26、応答送信部261、および応答出力部34は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
The
なお、出力部24、発話情報出力部241、自動情報出力部242、および応答出力部34は、情報を出力する出力手段で実現されても良い。ここでの情報の出力とは、例えば、プログラムによる情報の引き渡しである。
The
ユーザ受信部14、受信部22、受付部25、自動応答受付部251、発話受付部32、および学習受付部35は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
The
なお、受付部25、自動応答受付部251、発話受付部32、および学習受付部35は、情報を受け付ける受付手段で実現されても良い。ここでの情報の受け付けとは、例えば、プログラムによる情報の引き渡しである。
The
ユーザ出力部15は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。ユーザ出力部15は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
The
格納部21、および学習情報格納部31は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
The
格納部21等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部21等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部21等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部21等で記憶されるようになってもよい。
The process of storing information in the
次に、対話システムAの動作について説明する。まず、ユーザ端末1の動作例について説明する。
Next, the operation of the dialogue system A will be described. First, an operation example of the
ユーザ端末1のユーザ受付部11は、ユーザからの発話を受け付ける。次に、ユーザ処理部12は、ユーザ受付部11が受け付けた発話から、当該発話に対応するユーザ発話情報を取得する。ここで、ユーザ処理部12は、例えば、音声である発話を音声認識し、テキストであるユーザ発話情報を取得する。次に、ユーザ送信部13は、ユーザ処理部12が取得したユーザ発話情報を対話制御装置2に送信する。次に、ユーザ発話情報の送信に応じて、ユーザ受信部14は、自動情報を受信する。なお、自動情報は、ユーザの発話に対する応答の情報である。次に、ユーザ出力部15は、ユーザ受信部14が受信した自動情報を出力する。以上の処理を繰り返し、ユーザと対話エンジン3との対話が継続される。なお、自動情報がテキストの場合、ユーザ出力部15は、当該テキストを音声合成し、音声出力しても良い。また、ユーザの指示等により、対話は終了する。
The
次に、対話制御装置2の動作について、図4のフローチャートを用いて説明する。
Next, the operation of the
(ステップS401)受信部22は、ユーザ発話情報をユーザ端末1から受信したか否かを判断する。ユーザ発話情報を受信した場合はステップS402に行き、受信しない場合はステップS401に戻る。
(Step S401) The receiving
(ステップS402)処理部23は、ユーザ発話情報から発話情報を取得する。
(Step S402) The
(ステップS403)出力部24は、発話情報の2以上の出力先を取得する。かかる出力先は、2以上の対話エンジン3であり、例えば、格納部21に格納されている。出力先は、例えば、後述する通信先識別子である。
(Step S403) The
(ステップS404)発話情報出力部241は、ステップS403で取得された2以上の出力先に、ステップS402で取得された発話情報を出力する。
(Step S404) The utterance
(ステップS405)受付部25は、2以上の対話エンジン3への発話情報の出力に応じて、1以上の自動応答情報を受け付ける。なお、受付部25は、発話情報の出力から閾値以内の時間のみ、自動応答情報を受け付けることは好適である。
(Step S405) The
(ステップS406)選択部231は、ステップS405で受け付けられた1以上の自動応答情報から一の自動応答情報を選択する。なお、ステップS405で受け付けられた自動応答情報が一つの場合、本ステップは省略し得る。
(Step S406) The
(ステップS407)処理部23は、ステップS406で選択された自動応答情報から自動情報を取得する。
(Step S407) The
(ステップS408)応答送信部261は、ステップS407で取得された自動情報をユーザ端末1に送信する。
(Step S408) The
(ステップS409)自動応答情報出力部242は、ステップS406で選択された一の自動応答情報を、当該一の自動応答情報を出力した対話エンジン3以外の対話エンジン3に出力する。ステップS401に戻る。
(Step S409) The automatic response
なお、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 In the flowchart of FIG. 4, the process ends when the power is turned off or an interrupt for the end of the process occurs.
次に、対話エンジン3の動作について、図5のフローチャートを用いて説明する。
Next, the operation of the
(ステップS501)発話受付部32は、対話制御装置2から発話情報を受け付けたか否かを判断する。発話情報を受け付けた場合はステップS502に行き、発話情報を受け付けない場合はステップS504に行く。
(Step S501) The
(ステップS502)応答取得部33は、ステップS501で受け付けられた発話情報に対応する自動応答情報を、学習情報格納部31の学習情報を用いて取得する。
(Step S502) The
(ステップS503)応答出力部34は、応答取得部33が取得した自動応答情報を対話制御装置2に出力する。
(Step S503) The
(ステップS504)学習受付部35は、学習対象の自動応答情報を受け付けたか否かを判断する。自動応答情報を受け付けた場合はステップS505に行き、自動応答情報を受け付けない場合はステップS501に戻る。
(Step S504) The
(ステップS505)学習部36は、学習受付部35が受け付けた自動応答情報を用いて、学習情報に、追記する情報を構成する。
(Step S505) The
(ステップS506)学習部36は、ステップS505で構成した情報を学習情報格納部31に追記する。ステップS501に戻る。
(Step S506) The
なお、図5のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 In the flowchart of FIG. 5, the process ends when the power is turned off or an interrupt for the end of the process occurs.
以下、本実施の形態における対話システムAの具体的な動作について説明する。本具体例において、対話システムAは、3つの対話エンジンを具備する、とする。なお、対話システムAの概念図は図1である。 Hereinafter, the specific operation of the dialogue system A in the present embodiment will be described. In this specific example, it is assumed that the dialogue system A includes three dialogue engines. The conceptual diagram of the dialogue system A is FIG.
今、対話制御装置2の格納部21は、図6に示す優先度情報管理表を格納している。優先度情報管理表は、各対話エンジン3の優先度等を管理する表である。優先度情報管理表は、「優先度」「対話エンジン識別子」「通知先識別子」を有する3つのレコードを有する。「優先度」は小さい数値ほど、優先度が高いことを示す。「通知先識別子」は、ここではIPアドレスであるが、対話制御装置2が対話エンジン3と通信するための情報であれば何でも良い。
Now, the
また、3つの対話エンジン3の中の一の対話エンジン3(例えば、「e1」で識別される対話エンジン3。なお、以後、かかる対話エンジンを対話エンジン「e1」とする。)を構成する学習情報格納部31は、図7に示す学習情報管理表を格納している、とする。学習情報管理表は、「ID」「学習情報」を有する1以上のレコードを管理している。「ID」はレコードを識別する情報である。「学習情報」は「発話情報」と「自動応答情報」との対である。「発話情報」「自動応答情報」は、定数(固定的な文字列)でも良いし、変数を有する情報でも良い。また、「自動応答情報」は、プログラムや検索式(ここでは、例えば、SQL文であるが、他の形式でも構わない)などの実行可能な情報でも良い。学習情報の中の{}は変数を示し、学習情報の中の*は0文字以上の文字を示す。また、自動応答情報の中の$は変数であり、学習情報格納部31に値が保持されている。なお、「$営業日」の値は、ここでは「日曜日、火曜日、水曜日、木曜日、金曜日、土曜日」である、とする。また、自動応答情報の中の「include」は、含まれるか否かの論理演算子である、とする。つまり、「{timeExpression} include $営業日」は、変数「timeExpression」の情報が変数「営業日」の中に含まれるか否かを判断することを示す。そして、含まれる場合は真「1」を、含まれない場合は偽「0」を返す、とする。
Further, learning that constitutes one of the three dialogue engines 3 (for example, the
また、対話エンジン「e1」の学習情報格納部31は、図8に示すFoodtableを格納している、とする。Foodtableは、「ID」「料理」「作り方」を有するレコードを1以上格納している。
Further, it is assumed that the learning
さらに、対話エンジン「e1」の学習情報格納部31は、料理名を格納しているfood辞書、作物名を格納しているcrops辞書を有する、とする。food辞書には、「カツ丼、牛丼、親子丼、・・・」等の多数の料理名が格納されている。また、crops辞書には、「お米、ナス、にんじん、・・・」等の多数の作物名が格納されている。
Further, it is assumed that the learning
かかる状況において、以下の3つの具体例について説明する。具体例1は、優先度に基づいて自動応答情報を選択する場合である。さらに具体的には、具体例1は、対話制御装置2が、予め決められた条件を満たす自動応答情報の中で、優先度情報に基づく優先度が最も高い対話エンジン3から出力された自動応答情報を選択する場合である。また、ここでの予め決められた条件は、例えば、対話エンジン3からの応答である自動応答情報に予め決められた用語(例えば、「理解できなかった」「理解不能」)を含まないことである。
In such a situation, the following three specific examples will be described. Specific example 1 is a case where the automatic response information is selected based on the priority. More specifically, in the specific example 1, the
具体例2は、時間条件に基づく場合である。時間条件は、自動応答情報を受け付ける早さに基づく場合と言っても良い。さらに具体的には、具体例2は、対話制御装置2が、予め決められた条件を満たす、最初に受け付けられた自動応答情報を選択する場合である。ここでの予め決められた条件も、例えば、対話エンジン3からの応答である自動応答情報に予め決められた用語(例えば、「理解できなかった」「理解不能」)を含まないこととする。
Specific example 2 is a case based on a time condition. It may be said that the time condition is based on the speed at which the automatic response information is received. More specifically, the second embodiment is a case where the
具体例3は、内容条件に基づく場合である。内容条件は、自動応答情報(応答)の内容に基づく条件である。さらに具体的には、具体例3は、対話制御装置2が、予め決められた条件を満たす自動応答情報の中で、最も文長が長い自動応答情報または自立語の数が多い自動応答情報または文の数が最も多い自動応答情報を選択する場合である。ここでの予め決められた条件も、例えば、対話エンジン3からの応答である自動応答情報に予め決められた用語(例えば、「理解できなかった」「理解不能」)を含まないこととする。
Specific example 3 is a case based on the content condition. The content condition is a condition based on the content of the automatic response information (response). More specifically, in the specific example 3, the
(具体例1)
今、ユーザは、ユーザ端末1に対して、「牛丼の作り方を教えて」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、ユーザからの発話「牛丼の作り方を教えて」を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「牛丼の作り方を教えて」を取得する。次に、ユーザ送信部13は当該ユーザ発話情報を対話制御装置2に送信する。
(Specific example 1)
Now, it is assumed that the user voice-inputs "Tell me how to make beef bowl" to the
次に、対話制御装置2の受信部22は、ユーザ発話情報「牛丼の作り方を教えて」をユーザ端末1から受信する。
Next, the receiving
そして、処理部23は、当該ユーザ発話情報から発話情報「1:牛丼の作り方を教えて」を取得する。発話情報の「1」は発話識別子である。
Then, the
次に、発話情報出力部241は、図6の優先度情報管理表から、発話情報の出力先(3つの通信先識別子)を取得する。そして、発話情報出力部241は、3つの各通信先識別子で識別される3つの対話エンジン3に、発話情報「1:牛丼の作り方を教えて」を送信する。
Next, the utterance
次に、3つの各対対話エンジン3の発話受付部32は、対話制御装置2から発話情報を受け付ける。そして、3つの各対話エンジン3の応答取得部33は、発話受付部32が受け付けた発話情報に対応する応答である自動応答情報を、学習情報格納部31の学習情報を用いて取得する。例えば、対話エンジン識別子「e1」で識別される対話エンジン3の応答取得部33は、発話情報が有する「牛丼の作り方を教えて」を形態素解析する。そして、応答取得部33は、取得した形態素「牛丼」をキーとして、辞書を検索し、「牛丼」は{food}に含まれることを検出する。次に、応答取得部33は、「牛丼の作り方を教えて」が図7の学習情報管理表の「ID=4」の発話情報に合致することを検出する。そして、応答取得部33は、「ID=4」の自動応答情報を取得し、当該自動応答情報を実行し、図8のFoodtableから料理「牛丼」に対応する作り方「4人前の材料をご紹介します。・・・」を取得する。そして、応答出力部34は、応答取得部33が取得した自動応答情報「1:4人前の材料をご紹介します。・・・」を対話制御装置2に送信する。
Next, the
次に、対話制御装置2の受付部25は、閾値の時間以内に受信された対話エンジン3から自動応答情報を受信する。ここでは、受付部25は、閾値の時間以内に3つの対話エンジン3から自動応答情報を受信した、とする。
Next, the
次に、選択部231は、3つの自動応答情報から一の自動応答情報を選択する。つまり、選択部231は、自動応答情報に予め決められた用語(「理解できなかった」または「理解不能」)を含む「e2」の対話エンジン3から送信された自動応答情報を選択しない、と決定する。次に、「e1」「e3」の対話エンジン3の優先度情報「1」「3」を取得し、優先度が高い(優先度情報「1」の)「e1」の対話エンジン3の自動応答情報「1:4人前の材料をご紹介します。・・・」を選択する。
Next, the
次に、処理部23は、選択された自動応答情報から自動情報「4人前の材料をご紹介します。・・・」を取得する。
Next, the
次に、応答送信部261は、当該自動情報をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、当該自動情報を受信する。そして、ユーザ出力部15は、当該自動情報を出力する。
Next, the
また、自動応答情報出力部242は、選択された一の自動応答情報「1:4人前の材料をご紹介します。・・・」を、当該一の自動応答情報を出力した対話エンジン3以外の対話エンジン3(「e2」「e3」の対話エンジン3)に送信する。
In addition, the automatic response
そして、「e2」「e3」の対話エンジン3の学習受付部35は、当該自動応答情報を受信する。
Then, the
次に、「e2」「e3」の対話エンジン3の学習部36は、学習受付部35が受け付けた自動応答情報を用いて、学習情報に、追記する情報を構成する。つまり、学習部36は、自動応答情報「1:4人前の材料をご紹介します。・・・」が有する発話識別子「1」に対応する発話情報を取得する。そして、発話識別子「1」に対応する発話情報の内容「牛丼の作り方を教えて」と自応答情報の内容「4人前の材料をご紹介します。・・・」との組を、図8の学習情報管理表に追記する。
Next, the
なお、学習部36は、発話情報の内容「牛丼の作り方を教えて」のうち、名詞または名詞句「牛丼」「作り方」を変数に置き換え、「{変数1}の{変数2}を教えて」というパターンに変更し、「4人前の材料をご紹介します。・・・」のうち、名詞または名詞句「4人前」「材料」を変数に置き換え、「{変数3}の{変数4}をご紹介します。・・・」というパターンに変更し、2つのパターンの組を、図8の学習情報管理表に追記するなどしても良い。
The
つまり、本具体例において、他の対話エンジン3からの入力である自動応答情報を用いて、学習情報をよくすれば良く、学習情報の構造は問わない。
That is, in this specific example, the learning information may be improved by using the automatic response information input from the
次に、ユーザは、ユーザ端末1に対して、「粉末うどんスープはどちらのスープがお勧めですか?」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、当該ユーザの音声入力を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「粉末うどんスープはどちらのスープがお勧めですか?」を取得する。次に、ユーザ送信部13は、当該ユーザ発話情報を対話制御装置2に送信する。
Next, it is assumed that the user voice-inputs "Which soup is recommended for powdered udon soup?" To the
次に、対話制御装置2の受信部22は、当該ユーザ発話情報をユーザ端末1から受信する。
Next, the receiving
そして、処理部23は、当該ユーザ発話情報から発話情報「2:粉末うどんスープはどちらのスープがお勧めですか?」を取得する。
Then, the
次に、発話情報出力部241は、図6の優先度情報管理表から3つの通信先識別子を取得する。そして、発話情報出力部241は、3つの各通信先識別子で識別される3つの対話エンジン3に、当該話情報を送信する。
Next, the utterance
次に、3つの各対話エンジン3の発話受付部32は、対話制御装置2から発話情報を受け付ける。そして、3つの各対話エンジン3の応答取得部33は、発話受付部32が受け付けた発話情報に対応する応答である自動応答情報を、学習情報格納部31の学習情報を用いて取得する。そして、3つの各対話エンジン3の応答出力部34は、応答取得部33が取得した自動応答情報を対話制御装置2に送信する。
Next, the
次に、対話制御装置2の受付部25は、閾値の時間以内に受信された対話エンジン3から自動応答情報を受信する。
Next, the
次に、選択部231は、上述した優先度情報を用いるアルゴリズムにより、受信された自動応答情報から一の自動応答情報を選択する。そして、処理部23は、当該一の自動応答情報から自動情報を取得する。
Next, the
次に、応答送信部261は、当該自動情報をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、自動情報「4人前の材料をご紹介します。・・・」を受信する。そして、ユーザ出力部15は、当該自動情報を出力する。
Next, the
また、自動応答情報出力部242は、選択された一の自動応答情報を、当該一の自動応答情報を出力した対話エンジン3以外の対話エンジン3に送信する。
Further, the automatic response
そして、当該一の自動応答情報を送信していない対話エンジン3の学習受付部35は、当該一の自動応答情報を受信する。学習部36は、学習受付部35が受け付けた自動応答情報を用いて、上述した学習処理を行う。
Then, the
以上の処理を繰り返すことにより、適切な対話を継続させることができる。また、ユーザは、適切な応答を得ることができる。さらに、対話エンジン3は、他の対話エンジン3の能力(知識といっても良い)を学習できる。
By repeating the above processing, an appropriate dialogue can be continued. In addition, the user can obtain an appropriate response. Further, the
(具体例2)
今、ユーザは、ユーザ端末1に対して、「牛丼の作り方を教えて」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、ユーザからの発話「牛丼の作り方を教えて」を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「牛丼の作り方を教えて」を取得する。次に、ユーザ送信部13は当該ユーザ発話情報を対話制御装置2に送信する。
(Specific example 2)
Now, it is assumed that the user voice-inputs "Tell me how to make beef bowl" to the
次に、対話制御装置2の受信部22は、当該ユーザ発話情報をユーザ端末1から受信する。
Next, the receiving
そして、処理部23は、当該ユーザ発話情報から発話情報「1:牛丼の作り方を教えて」を取得する。
Then, the
次に、発話情報出力部241は、3つの通信先識別子を取得する。そして、発話情報出力部241は、3つの各通信先識別子で識別される3つの対話エンジン3に、当該発話情報を送信する。なお、3つの通信先識別子は、格納部21に格納されている、とする。
Next, the utterance
次に、3つの各対話エンジン3の発話受付部32は、対話制御装置2から発話情報を受け付ける。そして、3つの各対話エンジン3の応答取得部33は、発話受付部32が受け付けた発話情報に対応する応答である自動応答情報を、学習情報格納部31の学習情報を用いて取得する。
Next, the
次に、対話制御装置2の受付部25は、3つの各対話エンジン3から自動応答情報を受信する。受付部25は、最初に対話エンジン「e2」からの自動応答情報「1:理解できなかった。・・・」を受信した、とする。次に、受付部25は、対話エンジン「e1」からの自動応答情報「1:4人前の材料をご紹介します。・・・」を受信した、とする。さらに次に、受付部25は、対話エンジン「e3」からの自動応答情報「1:まず、水、粉末うどんスープ、・・・を用意します。次に、・・・」を受信した、とする。
Next, the
次に、選択部231は、3つの自動応答情報から一の自動応答情報を選択する。つまり、選択部231は、予め決められた用語(「理解できなかった」または「理解不能」)を含まない自動応答情報の中で、最初に受信された「e1」の対話エンジン3の自動応答情報「1:4人前の材料をご紹介します。・・・」を選択する。
Next, the
次に、処理部23は、選択された自動応答情報から自動情報「4人前の材料をご紹介します。・・・」を取得する。
Next, the
次に、応答送信部261は、当該自動情報をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、当該自動情報を受信する。そして、ユーザ出力部15は、当該自動情報を出力する。
Next, the
また、自動応答情報出力部242は、選択された一の自動応答情報「1:4人前の材料をご紹介します。・・・」を、当該一の自動応答情報を出力した対話エンジン3以外の対話エンジン3(「e2」「e3」の対話エンジン3)に送信する。
In addition, the automatic response
そして、「e2」「e3」の対話エンジン3の学習受付部35は、当該自動応答情報を受信する。
Then, the
次に、「e2」「e3」の対話エンジン3の学習部36は、当該自動応答情報を用いて、上述した学習処理を行う。
Next, the
以上の処理を繰り返すことにより、適切な対話を継続させることができる。また、ユーザは、適切な応答を得ることができる。さらに、対話エンジン3は、他の対話エンジン3の能力(知識といっても良い)を得ることができる。
By repeating the above processing, an appropriate dialogue can be continued. In addition, the user can obtain an appropriate response. Further, the
(具体例3)
今、ユーザは、ユーザ端末1に対して、「牛丼の作り方を教えて」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、ユーザからの発話「牛丼の作り方を教えて」を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「牛丼の作り方を教えて」を取得する。次に、ユーザ送信部13は当該ユーザ発話情報を対話制御装置2に送信する。
(Specific example 3)
Now, it is assumed that the user voice-inputs "Tell me how to make beef bowl" to the
次に、対話制御装置2の受信部22は、当該ユーザ発話情報をユーザ端末1から受信する。
Next, the receiving
そして、処理部23は、当該ユーザ発話情報から発話情報「1:牛丼の作り方を教えて」を取得する。
Then, the
次に、発話情報出力部241は、3つの通信先識別子を取得する。そして、発話情報出力部241は、3つの各通信先識別子で識別される3つの対話エンジン3に、当該発話情報を送信する。
Next, the utterance
次に、3つの各対話エンジン3の発話受付部32は、対話制御装置2から発話情報を受け付ける。そして、3つの各対話エンジン3の応答取得部33は、発話受付部32が受け付けた発話情報に対応する応答である自動応答情報を、学習情報格納部31の学習情報を用いて取得する。
Next, the
次に、対話制御装置2の受付部25は、3つの各対話エンジン3から自動応答情報を受信する。
Next, the
次に、選択部231は、3つの自動応答情報から一の自動応答情報を選択する。つまり、選択部231は、予め決められた用語(「理解できなかった」または「理解不能」)を含まない自動応答情報の中で、文の長さが最も長い「e1」の対話エンジン3の自動応答情報「1:4人前の材料をご紹介します。・・・」を選択する。
Next, the
次に、処理部23は、選択された自動応答情報から自動情報「4人前の材料をご紹介します。・・・」を取得する。
Next, the
次に、応答送信部261は、当該自動情報をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、当該自動情報を受信する。そして、ユーザ出力部15は、当該自動情報を出力する。
Next, the
また、自動応答情報出力部242は、選択された一の自動応答情報「1:4人前の材料をご紹介します。・・・」を、当該一の自動応答情報を出力した対話エンジン3以外の対話エンジン3(「e2」「e3」の対話エンジン3)に送信する。
In addition, the automatic response
そして、「e2」「e3」の対話エンジン3の学習受付部35は、当該自動応答情報を受信する。
Then, the
次に、「e2」「e3」の対話エンジン3の学習部36は、当該自動応答情報を用いて、上述した学習処理を行う。
Next, the
以上の処理を繰り返すことにより、適切な対話を継続させることができる。また、ユーザは、適切な応答を得ることができる。さらに、対話エンジン3は、他の対話エンジン3の能力(知識といっても良い)を得ることができる。
By repeating the above processing, an appropriate dialogue can be continued. In addition, the user can obtain an appropriate response. Further, the
なお、上記具体例で、ユーザ端末1において、図9に示すようにキャラクタがお話しているように、自動情報を音声出力することは好適である。
In the above specific example, it is preferable to output the automatic information by voice on the
以上、本実施の形態によれば、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。 As described above, according to the present embodiment, it is possible to effectively use a plurality of dialogue engines to continue an appropriate dialogue.
特に、本実施の形態によれば、対話ごとに、複数の対話エンジンから送信された複数の自動応答情報から適切な自動応答情報を選択し、ユーザに応答できる。かかることにより、ユーザに極めて適切な応答を行える。 In particular, according to the present embodiment, it is possible to select appropriate automatic response information from a plurality of automatic response information transmitted from a plurality of dialogue engines and respond to the user for each dialogue. As a result, a very appropriate response can be made to the user.
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における対話制御装置2を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、2以上の対話エンジンから、ユーザの発話に対応する応答である自動応答情報を受け付け得る対話制御装置におけるプログラムであって、コンピュータを、ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信部と、前記ユーザ発話情報に対応する情報である発話情報を、1以上の対話エンジンに対して出力し得る発話情報出力部と、前記発話情報の出力に応じて、前記1以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、前記自動応答受付部が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信部として機能させるためのプログラムである。
The processing in this embodiment may be realized by software. Then, this software may be distributed by software download or the like. Further, this software may be recorded on a recording medium such as a CD-ROM and disseminated. This also applies to other embodiments herein. The software that realizes the
また、上記プログラムにおいて、前記発話情報出力部は、前記発話情報を、2以上の対話エンジンに出力し、前記自動応答受付部は、前記発話情報の出力に応じて、前記2以上の各対話エンジンから自動応答情報を受け付け、コンピュータを、前記2以上の自動応答情報から一の自動応答情報を選択する選択部としてさらに機能させ、前記応答送信部は、前記選択部が選択した自動応答情報に対応する一の自動情報を前記ユーザ端末に送信するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, the utterance information output unit outputs the utterance information to two or more dialogue engines, and the automatic response reception unit outputs the utterance information to each of the two or more dialogue engines according to the output of the utterance information. The computer further functions as a selection unit for selecting one automatic response information from the two or more automatic response information, and the response transmission unit corresponds to the automatic response information selected by the selection unit. It is preferable that the program functions the computer so as to transmit one automatic information to the user terminal.
また、上記プログラムにおいて、前記選択部は、前記2以上の自動応答情報から、予め決められた条件に合致する一の自動応答情報を選択するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, it is preferable that the selection unit is a program that causes the computer to function by selecting one automatic response information that matches a predetermined condition from the two or more automatic response information. is there.
また、上記プログラムにおいて、前記選択部は、前記2以上の自動応答情報のうちの予め決められた条件を満たす自動応答情報の中で、前記優先度情報に基づく優先度が最も高い対話エンジンから出力された自動応答情報を選択するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, the selection unit outputs from the dialogue engine having the highest priority based on the priority information among the automatic response information satisfying the predetermined conditions among the two or more automatic response information. It is preferable that the program functions the computer as the one that selects the automatic response information.
また、本実施の形態における対話エンジン3を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータがアクセス可能な記録媒体は、発話情報に対応する自動応答情報を取得するための情報である学習情報が格納される学習情報格納部を具備し、コンピュータを、対話制御装置2から発話情報を受け付ける発話受付部と、前記発話受付部が受け付けた発話情報に対応する応答である自動応答情報を、前記学習情報を用いて取得する応答取得部と、前記応答取得部が取得した自動応答情報を前記対話制御装置に出力する応答出力部と、他の対話エンジンからの応答である他自動応答情報を受け付ける学習受付部と、前記学習受付部が受け付けた他自動応答情報を用いて、前記学習情報に情報を付加する学習部として機能させるプログラムである。
Further, the software that realizes the
(実施の形態2)
本実施の形態において、複数の対話エンジンから一部の対話エンジンを選択し、当該対話エンジンと対話を行える対話システムについて説明する。なお、一部の対話エンジンは、一つであることは好適であるが、2以上でも良い。
(Embodiment 2)
In the present embodiment, a dialogue system capable of selecting a part of dialogue engines from a plurality of dialogue engines and having a dialogue with the dialogue engines will be described. It is preferable that some dialogue engines are one, but two or more may be used.
本実施の形態における対話システムBの概念図は、符号以外、図1と同様である。対話システムBは、1または2以上のユーザ端末1、対話制御装置4、および2以上の対話エンジン3を備える。対話制御装置4は、対話を制御する装置である。対話制御装置4は、例えば、ASPのサーバ、クラウドサーバ等である。但し、対話制御装置4の種類は問わない。
The conceptual diagram of the dialogue system B in the present embodiment is the same as that of FIG. 1 except for the reference numerals. The dialogue system B includes one or
また、通常、1以上の各ユーザ端末1と対話制御装置4とはインターネット、LAN等のネットワークにより通信可能である。また、通常、対話制御装置4と1以上の各対話エンジン3とはインターネット、LAN等のネットワークにより通信可能である。ただし、対話制御装置4は、1以上のユーザ端末1、1以上の対話エンジン3のうちの1以上の装置を内部に含んでいても良い。つまり、ユーザ端末1と対話制御装置4と対話エンジン3のうちの2以上の装置は、物理的に一の装置で実現されても良い。
Further, usually, one or
本実施の形態における対話システムBのブロック図は、対話制御装置の符号以外は図2と同様である。図10は、対話制御装置4のブロック図である。
The block diagram of the dialogue system B in the present embodiment is the same as that of FIG. 2 except for the reference numerals of the dialogue control device. FIG. 10 is a block diagram of the
対話制御装置4は、格納部41、受信部22、処理部43、出力部24、受付部25、および送信部26を備える。処理部43は、選択部431を備える。出力部24は、発話情報出力部241、および自動情報出力部242を備える。受付部25は、自動応答受付部251を備える。
The
対話制御装置4を構成する格納部41は、各種の情報が格納される。各種の情報とは、例えば、後述する対話エンジン3の選択条件、優先度情報、対話の履歴、2以上の各対話エンジン3と通信を行うための情報(例えば、対話エンジン3のIPアドレス、URL、MACアドレス等)、である。
Various types of information are stored in the storage unit 41 that constitutes the
処理部43は、各種の処理を行う。各種の処理とは、選択部431が行う処理等である。
The
選択部431は、2以上の対話エンジン3から一部の対話エンジン3を選択する。選択部431は、N(Nは2以上の自然数)の対話エンジン3からM(Nは1以上の自然数,M<N)の対話エンジン3を選択する。一部の対話エンジン3とは、2以上の対話エンジン3のうちの一部である。なお、一部の対話エンジン3とは、一の対話エンジン3であることは好適である。
The
選択部431は、ユーザ発話情報または発話情報を用いて、一部の対話エンジン3を選択することは好適である。
It is preferable that the
選択部431は、例えば、選択条件に基づいて、一部の対話エンジン3を選択する。 選択条件とは、例えば、対話(発話)の主題が合致することである。主題が合致するという選択条件は、例えば、発話から取得されるジャンルと、対話エンジン3に対応付けて格納されているジャンルが一致する対話エンジン3を選択することである。選択条件は、例えば、予め決められた条件を満たすほど負荷が小さい(例えば、最も負荷が小さい、ログインユーザ数が閾値以下)ことである。選択条件は、例えば、予め決められた条件を満たすほどレスポンスが早い(例えば、最もレスポンスが早い)ことである。
The
選択部431が対話エンジン3を選択するタイミングは問わない。選択部431は、ユーザ発話情報が受け付けられる毎(対話毎)に、対話エンジン3を選択しても良い。また、選択部431は、一連の対話の始まりの際に、対話エンジン3を選択しても良い。選択部431は、例えば、一連の対話の始まりの際に、主題が合致する対話エンジン3を選択したり、負荷が最小の対話エンジン3を選択したり、レスポンスが早い対話エンジン3を選択したりしても良い。なお、レスポンスを検知するために、事前に命令を対話エンジン3に送信し、応答を受信し、レスポンスの早さを検知する等しても良い。
The timing at which the
複数の対話エンジン3から自動応答情報が受け付けられた場合、選択部431は、当該自動応答情報から一の自動応答情報を選択する。なお、かかる選択は、選択部231の処理と同様である。
When the automatic response information is received from the plurality of
ここでの自動応答受付部251は、通常、一の対話エンジン3から自動応答情報を受け付ける。ただし、自動応答受付部251は、複数の各対話エンジンから自動応答情報を受け付けても良い。
The automatic
格納部41は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。 The storage unit 41 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium.
格納部41に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部41で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部41で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部41で記憶されるようになってもよい。 The process in which the information is stored in the storage unit 41 does not matter. For example, the information may be stored in the storage unit 41 via the recording medium, the information transmitted via the communication line or the like may be stored in the storage unit 41, or The information input via the input device may be stored in the storage unit 41.
処理部43、および選択部431は、通常、MPUやメモリ等から実現され得る。処理部43等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
The
次に、対話制御装置4の動作について、図11のフローチャートを用いて説明する。図11のフローチャートにおいて、図4のフローチャートと同一のステップについて説明を省略する。
Next, the operation of the
(ステップS1101)選択部431は、2以上の対話エンジン3から一部の対話エンジン3(出力先)を選択する。
(Step S1101) The
(ステップS1102)選択部431は、複数の自動応答情報から一の自動応答情報を選択するか否かを判断する。一の自動応答情報を選択する場合はステップS406に行き、一の自動応答情報を選択しない場合はステップS407に行く。ここで、選択部431は、例えば、ステップS1101で2以上の対話エンジン3を選択したか否かを判断しても良い。選択部431は、例えば、2以上の自動応答情報が受け付けられたか否かを判断しても良い。
(Step S1102) The
なお、図11のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 In the flowchart of FIG. 11, the process ends when the power is turned off or an interrupt for the end of the process occurs.
以下、本実施の形態における対話システムBの具体的な動作について説明する。本具体例において、対話システムBは、3つの対話エンジンを具備する、とする。なお、対話システムAの概念図は図1である。 Hereinafter, the specific operation of the dialogue system B in the present embodiment will be described. In this specific example, it is assumed that the dialogue system B includes three dialogue engines. The conceptual diagram of the dialogue system A is FIG.
今、3つの対話エンジン3の中の一の対話エンジン3(例えば、対話エンジン「e1」)を構成する学習情報格納部31は、図7に示す学習情報管理表を格納している、とする。また、対話エンジン「e1」の学習情報格納部31は、図8に示すFoodtableを格納している、とする。さらに、対話エンジン「e1」の学習情報格納部31は、料理名を格納しているfood辞書、作物名を格納しているcrops辞書を有する、とする。food辞書には、「カツ丼、牛丼、親子丼、・・・」等の多数の料理名が格納されている。また、crops辞書には、「お米、ナス、にんじん、・・・」等の多数の作物名が格納されている。
It is assumed that the learning
かかる状況において、以下の2つの具体例について説明する。具体例1は、一の対話エンジンを選択する場合である。具体例2は、2以上の対話エンジンを選択し、かつ2以上の自動応答情報を選択する場合である。2以上の自動応答情報を選択する方法は、実施の形態1で説明したように種々のアルゴリズムがあり得る。 In such a situation, the following two specific examples will be described. Specific example 1 is a case where one dialogue engine is selected. Specific example 2 is a case where two or more dialogue engines are selected and two or more automatic response information is selected. As a method for selecting two or more automatic response information, various algorithms may be used as described in the first embodiment.
(具体例1)
今、対話制御装置2の格納部21は、図12に示す選択条件管理表を格納している、とする。選択条件管理表は、対話エンジンを選択するための条件を管理する表である。選択条件管理表は、「対話エンジン識別子」「ジャンル」「通知先識別子」を有する3つのレコードを有する。「ジャンル」は、各対話エンジンが応答可能なジャンルである。
(Specific example 1)
Now, it is assumed that the
かかる状況において、ユーザは、ユーザ端末1に対して、「牛丼の作り方を教えて」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、ユーザからの発話「牛丼の作り方を教えて」を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「牛丼の作り方を教えて」を取得する。次に、ユーザ送信部13は当該ユーザ発話情報を対話制御装置2に送信する。
In such a situation, it is assumed that the user voice-inputs "Tell me how to make beef bowl" to the
次に、対話制御装置2の受信部22は、ユーザ発話情報「牛丼の作り方を教えて」をユーザ端末1から受信する。
Next, the receiving
そして、処理部23は、当該ユーザ発話情報から発話情報「1:牛丼の作り方を教えて」を取得する。
Then, the
次に、選択部431は、2以上の対話エンジン3から一の対話エンジン3を選択する。ここでは、選択部431は、「牛丼の作り方を教えて」に対して自然言語処理を行い、ジャンル「料理」を取得する。そして、選択部431は、ジャンル「料理」と対になる対話エンジン「e2」を選択する。なお、選択部431は、例えば、「牛丼の作り方を教えて」を形態素解析し、自立語「牛丼」「作り方」「教えて」を取得し、当該自立語から機械学習(例えば、深層学習、決定木、SVM)により、ジャンル「料理」を取得する。なお、機械学習により文を分類し、当該文のジャンル(クラスと言っても良い)を決定する技術は公知技術であるので、詳細な説明を省略する。また、選択部431は、例えば、「牛丼の作り方を教えて」を形態素解析し、自立語「牛丼」「作り方」「教えて」を取得し、当該自立語をキーとしてDB検索を行い、DBからジャンル「料理」を取得する。かかる場合、自立語とジャンルとを対応付けるレコードがDBに格納されている、とする。なお、ユーザが入力したジャンルがユーザ端末1から受信され、受信部22が当該ジャンルを受信し、選択部431が当該ジャンルを用いて、ジャンル「料理」を取得しても良い。
Next, the
そして、発話情報出力部241は、対話エンジン「e2」の通信先識別子を図12の表から取得し、当該通信先識別子で識別される対話エンジン3に、発話情報「1:牛丼の作り方を教えて」を送信する。
Then, the utterance
次に、対話エンジン「e2」の発話受付部32は、対話制御装置2から当該発話情報を受け付ける。そして、応答取得部33は、発話受付部32が受け付けた発話情報に対応する応答である自動応答情報「1:4人前の材料をご紹介します。・・・」を、学習情報格納部31の学習情報を用いて取得する。そして、応答出力部34は、応答取得部33が取得した当該自動応答情報を対話制御装置2に送信する。
Next, the
次に、対話制御装置2の受付部25は、対話エンジン「e2」から当該自動応答情報を受信する。
Next, the
次に、処理部23は、選択された自動応答情報から自動情報「4人前の材料をご紹介します。・・・」を取得する。
Next, the
次に、応答送信部261は、当該自動情報をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、当該自動情報を受信する。そして、ユーザ出力部15は、当該自動情報を出力する。
Next, the
また、自動応答情報出力部242は、選択された一の自動応答情報「1:4人前の材料をご紹介します。・・・」および発話情報「1:牛丼の作り方を教えて」を、当該一の自動応答情報を出力した対話エンジン3以外の対話エンジン3(「e1」「e3」の対話エンジン3)に送信する。
In addition, the automatic response
そして、「e1」「e3」の対話エンジン3の学習受付部35は、当該自動応答情報等受信する。
Then, the
次に、「e1」「e3」の対話エンジン3の学習部36は、学習受付部35が受け付けた自動応答情報を用いて、学習情報に、追記する情報を構成する。つまり、学習部36は、発話情報の内容「牛丼の作り方を教えて」と自応答情報の内容「4人前の材料をご紹介します。・・・」との組を、図8の学習情報管理表に追記する。
Next, the
なお、学習部36は、発話情報の内容「牛丼の作り方を教えて」のうち、名詞または名詞句「牛丼」「作り方」を変数に置き換え、「{変数1}の{変数2}を教えて」というパターンに変更し、「4人前の材料をご紹介します。・・・」のうち、名詞または名詞句「4人前」「材料」を変数に置き換え、「{変数3}の{変数4}をご紹介します。・・・」というパターンに変更し、2つのパターンの組を、図8の学習情報管理表に追記するなどしても良い。
The
つまり、本具体例において、他の対話エンジン3からの入力である自動応答情報を用いて、学習情報が充実すれば良く、学習情報の構造は問わない。
That is, in this specific example, it is sufficient that the learning information is enriched by using the automatic response information input from the
以上の処理を繰り返すことにより、適切な対話を継続させることができる。また、ユーザは、適切な応答を得ることができる。さらに、対話エンジン3は、他の対話エンジン3の能力(知識といっても良い)を得ることができる。
By repeating the above processing, an appropriate dialogue can be continued. In addition, the user can obtain an appropriate response. Further, the
(具体例2)
今、対話制御装置2の格納部21は、図12に示す選択条件管理表を格納している、とする。また、格納部21は、図6に示す優先度情報管理表を格納している。
(Specific example 2)
Now, it is assumed that the
かかる状況において、ユーザは、ユーザ端末1に対して、「京都でフットサルができるホテルを教えて」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、当該話を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「京都でフットサルができるホテルを教えて」を取得する。次に、ユーザ送信部13は当該ユーザ発話情報を対話制御装置2に送信する。
In such a situation, it is assumed that the user voice-inputs "Tell me a hotel where futsal can be played in Kyoto" to the
次に、対話制御装置2の受信部22は、当該ユーザ発話情報をユーザ端末1から受信する。
Next, the receiving
そして、処理部23は、当該ユーザ発話情報から発話情報「1:京都でフットサルができるホテルを教えて」を取得する。
Then, the
次に、選択部431は、2以上の対話エンジン3から1または2以上の対話エンジン3を選択する。ここでは、選択部431は、「京都でフットサルができるホテルを教えて」に対して自然言語処理を行い、ジャンル「旅行、スポーツ」を取得する。そして、選択部431は、ジャンル「旅行」または「スポーツ」と対になる対話エンジン「e1」「e3」を選択する。
Next, the
そして、発話情報出力部241は、対話エンジン「e1」「e3」の通信先識別子を図12の表から取得し、当該通信先識別子で識別される2つの対話エンジン3に、発話情報「1:京都でフットサルができるホテルを教えて」を送信する。
Then, the utterance
次に、「e1」「e3」の各対話エンジンの発話受付部32は、対話制御装置2から発話情報を受け付ける。そして、2つの各対話エンジン3の応答取得部33は、発話受付部32が受け付けた発話情報に対応する応答である自動応答情報を、学習情報格納部31の学習情報を用いて取得する。次に、2つの各対話エンジン3の応答出力部34は、応答取得部33が取得した自動応答情報を対話制御装置2に送信する。
Next, the
次に、対話制御装置2の受付部25は、2つの各対話エンジン3から自動応答情報を受信する。
Next, the
次に、選択部431は、2つの自動応答情報から一の自動応答情報を選択する。かかる選択方法は、実施の形態1で説明した。また、ここで、選択部431は、対話エンジン「e1」からの自動応答情報を選択した、とする。
Next, the
次に、処理部23は、選択された自動応答情報から自動情報を取得する。そして、応答送信部261は、当該自動情報をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、当該動情報を受信する。そして、ユーザ出力部15は、当該自動情報を出力する。
Next, the
また、自動応答情報出力部242は、選択された一の自動応答情報を、当該一の自動応答情報を出力した対話エンジン3以外の対話エンジン3(「e2」「e3」の対話エンジン3)に送信する。
Further, the automatic response
そして、「e2」「e3」の対話エンジン3の学習受付部35は、当該自動応答情報を受信する。
Then, the
次に、「e2」「e3」の対話エンジン3の学習部36は、学習受付部35が受け付けた自動応答情報を用いて、上述した学習処理を行う。
Next, the
以上の処理を繰り返すことにより、適切な対話を継続させることができる。また、ユーザは、適切な応答を得ることができる。さらに、対話エンジン3は、他の対話エンジン3の能力(知識といっても良い)を得ることができる。
By repeating the above processing, an appropriate dialogue can be continued. In addition, the user can obtain an appropriate response. Further, the
以上、本実施の形態によれば、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができる。特に、本実施の形態によれば、複数の対話エンジンの中から、対話エンジンを選択することにより、少ない負荷で、適切な応答をユーザに提供できる。 As described above, according to the present embodiment, it is possible to effectively use a plurality of dialogue engines to continue an appropriate dialogue. In particular, according to the present embodiment, by selecting a dialogue engine from a plurality of dialogue engines, it is possible to provide an appropriate response to the user with a small load.
なお、本実施の形態における対話制御装置4を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、2以上の対話エンジンから、ユーザの発話に対応する応答である自動応答情報を受け付け得る対話制御装置におけるプログラムであって、コンピュータを、ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信部と、前記ユーザ発話情報に対応する情報である発話情報を、1以上の対話エンジンに対して出力し得る発話情報出力部と、前記発話情報の出力に応じて、前記1以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、前記自動応答受付部が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信部として機能させるためのプログラムである。
The software that realizes the
また、上記プログラムにおいて、コンピュータを、前記2以上の対話エンジンから一部の対話エンジンを選択する選択部としてさらに機能させ、前記発話情報出力部は、前記発話情報を、前記選択部が選択した一部の対話エンジンに出力し、前記自動応答受付部は、前記発話情報の出力に応じて、前記一部の対話エンジンから自動応答情報を受け付け、前記応答送信部は、前記自動応答受付部が受け付けた自動応答情報に対応する一の自動情報を前記ユーザ端末に送信するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, the computer is further functioned as a selection unit for selecting a part of the dialogue engines from the two or more dialogue engines, and the speech information output unit selects the speech information. Output to the dialogue engine of the unit, the automatic response receiving unit receives automatic response information from some of the dialogue engines in response to the output of the spoken information, and the response transmitting unit receives the automatic response receiving unit. It is preferable that the program functions the computer so as to transmit one automatic information corresponding to the automatic response information to the user terminal.
また、上記プログラムにおいて、前記選択部は、前記ユーザ発話情報または前記発話情報を用いて、一の対話エンジンを選択するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, it is preferable that the selection unit is a program for operating a computer by using the user utterance information or the utterance information to select one dialogue engine.
(実施の形態3)
本実施の形態において、複数の対話エンジンの中のいずれかの応答を採用する自動モード、管理者の応答を採用する手動モードが存在する対話制御装置を具備する対話システムについて説明する。
(Embodiment 3)
In the present embodiment, a dialogue system including a dialogue control device having an automatic mode that adopts a response from a plurality of dialogue engines and a manual mode that adopts a response of an administrator will be described.
また、本実施の形態において、モードを自動決定、または自動変更する対話システムについて説明する。なお、本実施の形態において、対話の破綻等を自動検知し、モードを自動変更する。 Further, in the present embodiment, a dialogue system that automatically determines or automatically changes the mode will be described. In the present embodiment, the failure of the dialogue or the like is automatically detected, and the mode is automatically changed.
また、本実施の形態において、管理者からの指示によりモードを変更する対話システムについて説明する。 Further, in the present embodiment, a dialogue system that changes the mode according to an instruction from the administrator will be described.
また、本実施の形態において、自動モードの場合に、対話エンジンからの応答を管理端末に出力する対話システムについて説明する。 Further, in the present embodiment, a dialogue system that outputs a response from the dialogue engine to the management terminal in the case of the automatic mode will be described.
さらに、本実施の形態において、手動モードの場合に、管理者からの応答を対話エンジンに提供する対話システムについて説明する。 Further, in the present embodiment, a dialogue system that provides a response from the administrator to the dialogue engine in the case of the manual mode will be described.
図13は、本実施の形態における対話システムCの概念図である。対話システムAは、1または2以上のユーザ端末1、対話制御装置5、2以上の対話エンジン6、および1または2以上の管理端末7を備える。対話制御装置5は、対話を制御する装置である。対話制御装置5は、例えば、ASPのサーバ、クラウドサーバ等である。但し、対話制御装置5の種類は問わない。対話エンジン6は、ユーザからの発話の情報を受け付け、応答を返す装置である。対話エンジン6は、例えば、ASPのサーバ、クラウドサーバ等である。但し、対話エンジン6の種類は問わない。また、対話エンジン6は、発話情報を受け付け、自動応答情報を出力する。対話エンジン6は、公知の対話エンジンでも良い。管理端末7は、例えば、いわゆるパーソナルコンピュータ、タブレット端末、スマートフォン等であり、その種類は問わない。管理端末7は、管理者が使用する端末である。管理者は、対話の管理者であり、手動モードの場合に、ユーザと対話を行う人である。管理者は、対話を支援する人である、と言っても良い。
FIG. 13 is a conceptual diagram of the dialogue system C in the present embodiment. The dialogue system A includes one or
また、通常、1以上のユーザ端末1と対話制御装置5とは、インターネット、LAN等のネットワークにより通信可能である。また、通常、対話制御装置5と対話エンジン6とは、インターネット、LAN等のネットワークにより通信可能である。また、通常、対話制御装置5と1以上の管理端末7とは、インターネット、LAN等のネットワークにより通信可能である。ただし、対話制御装置5は、対話エンジン6、管理端末7のうちの1以上の装置を内部に含んでいても良い。つまり、対話制御装置5と対話エンジン6と管理端末7のうちの2以上の装置は、物理的に一の装置で実現されても良い。また、対話制御装置5は、ユーザ端末1、対話エンジン6のうちの1以上の装置を内部に含んでいても良い。つまり、対話制御装置5とユーザ端末1と対話エンジン6のうちの2以上の装置は、物理的に一の装置で実現されても良い。
Further, usually, one or
図14は、本実施の形態における対話システムCのブロック図である。また、図15は、対話制御装置5のブロック図である。
FIG. 14 is a block diagram of the dialogue system C according to the present embodiment. Further, FIG. 15 is a block diagram of the
対話制御装置5は、格納部51、受信部22、処理部53、出力部54、受付部55、および送信部56を備える。格納部51は、モード格納部511を備える。処理部53は、決定部531、判断部532、モード変更部533、および選択部534を備える。出力部54は、発話情報出力部541、自動情報出力部542、および手動情報出力部543を備える。受付部55は、自動応答受付部551、手動応答受付部552、および変更指示受付部553を備える。送信部56は、応答送信部561を備える。
The
対話エンジン6は、学習情報格納部31、発話受付部32、応答取得部33、応答出力部34、学習受付部65、および学習部66を備える。
The
管理端末7は、管理情報受付部71、管理処理部72、管理者出力部73、管理指示受付部74、および管理出力部75を備える。
The
対話制御装置5を構成する格納部51は、各種の情報が格納される。各種の情報とは、例えば、後述するモード情報、自動応答情報の選択条件、対話エンジン3の選択条件、優先度情報、対話の履歴である。
Various types of information are stored in the
モード格納部511は、モード情報が格納される。モード情報は、ユーザとの対話が自動であるか手動であるかを示す情報である。モード情報には、通常、いずれかの対話エンジン6を採用する自動モード、または管理端末7を採用する手動モードがある。つまり、モード情報は、自動モード、手動モードのいずれかを、少なくとも採り得る。ただし、モード情報は、自動モード、手動モード以外のモードを採り得ても良い。自動モード、手動モード以外のモードとは、例えば、動作しない停止モード等である。また、対話エンジン6を採用することは、対話エンジン6からの応答がユーザ端末1に送信されることである。また、管理端末7を採用することは、管理端末7からの応答がユーザ端末1に送信されることである。
Mode information is stored in the
処理部53は、各種の処理を行う。各種の処理とは、決定部531、判断部532、モード変更部533、選択部534等が行う処理である。
The
各種の処理とは、例えば、ユーザ発話情報から発話情報を取得する処理である。処理部53は、例えば、ユーザ発話情報の受信に応じて、発話識別子を生成する。そして、処理部53は、例えば、ユーザ発話情報に発話識別子を付加し、発話情報を構成する。なお、発話識別子は、ユーザ発話情報の識別子であり、ユニークな情報である。また、処理部53は、例えば、最近に生成した発話識別子を1インクリメントし、ユニークな発話識別子を生成する。
The various processes are, for example, processes for acquiring utterance information from user utterance information. The
また、処理部53は、例えば、自動応答情報または手動応答情報から自動情報または手動情報を取得しても良い。処理部53は、例えば、テキストの自動応答情報からその音声データである自動情報を生成しても良い。処理部53は、例えば、テキストの手動応答情報からその音声データである手動情報を生成しても良い。また、処理部53は、例えば、自動応答情報または手動応答情報から、送信するデータ構造の自動情報または送信するデータ構造の手動情報を取得しても良い。かかる場合、処理部53は、例えば、自動応答情報または手動応答情報のデータ構造を変更し、自動情報または手動情報を取得する。なお、処理部53は、例えば、自動応答情報と自動情報が同じ情報である場合、単に、受付部55が受け付けた自動応答情報を取得する。また、処理部53は、例えば、手動応答情報と手動情報が同じ情報である場合、単に、受付部55が受け付けた手動応答情報を取得する。
Further, the
決定部531は、対話エンジン6を採用するか、管理端末7を採用するかを決定する。対話エンジン6の採用とは、対話エンジン6の応答の採用であり、対話エンジン6の応答である自動応答情報に対する情報である自動情報をユーザ端末1に送信することである。また、管理端末7の採用とは、管理端末7からの応答の採用であり、管理端末7の応答である手動応答情報に対する情報である手動情報をユーザ端末1に送信することである。
The
決定部531は、モード格納部511のモード情報を取得する。そして、決定部531は、モード格納部511のモード情報に従って、対話エンジン6を採用するか、管理端末7を採用するかを決定する。このモード情報は、例えば、対話エンジン6を採用することを示す自動モード、または管理端末7を採用することを示す手動モードである。
The
なお、決定部531の上記決定の処理は、モード格納部511のモード情報の読み出しでも良い。
The determination process of the
また、決定部531は、発話情報の出力先を決定しても良い。決定部531は、例えば、モード格納部511のモード情報に従って、発話情報の出力先を対話エンジン6とするか、管理端末7とするかを決定する。また、決定部531は、発話情報の出力先を、常に、対話エンジン6と管理端末7との両方にする、としても良い。
Further, the
判断部532は、予め決められた条件を満たすか否かを判断する。ここで、予め決められた条件とは、モード情報を変更するための条件である。モード情報を変更するための条件は、自動モードから手動モードに変更するための第一の条件、手動モードから自動モードに変更するための第二の条件がある。
The
第一の条件は、例えば、対話が破綻していることを特定するための条件、管理端末7からの指示を受け付けたこと等である。対話が破綻していることを特定するための条件は、例えば、対話エンジン6からの応答である1または2以上の自動応答情報を用いて対話の破綻を検出するための条件、ユーザ端末1からの1または2以上のユーザ発話情報を用いて対話の破綻を検出するための条件、管理端末7からの入力に基づいて対話の破綻を検出するための条件である。対話が破綻していることを特定するための条件は、例えば、対話エンジン6からの応答である自動応答情報に予め決められた用語(例えば、「理解できなかった」「理解不能」)を含むこと、予め決められた用語を含む自動応答情報が予め決められた期間内に閾値以上または閾値より多い回数受け付けられたこと、受信された2以上の連続するユーザ発話情報が同一または閾値以上の類似度であること、ユーザ発話情報に予め決められた用語(例えば、「何言っているのか」「駄目だな」)を含むこと等である。また、管理端末7からの指示とは、例えば、モード情報を変更する指示、モード情報を指定する指示である。なお、対話の破綻とは、ユーザと対話エンジン6との対話の破綻である。また、予め決められた条件は、例えば、格納部51に格納されている。
The first condition is, for example, a condition for identifying that the dialogue is broken, an instruction from the
第二の条件は、例えば、管理端末7からの応答を閾値以上の回数受け付けたこと、管理端末7からの指示を受け付けたこと等である。
The second condition is, for example, that the response from the
モード変更部533は、判断部532が予め決められた条件を満たすと判断した場合に、モード情報を変更する。モード情報の変更とは、通常、モード情報をモード格納部211に書き込むことである。モード変更部533は、変更指示に応じて、モード格納部511のモード情報を変更する。
The
選択部534は、例えば、2以上の自動応答情報から一の自動応答情報を選択する。選択部534は、2以上の自動応答情報から、予め決められた条件に合致する一の自動応答情報を選択する。選択部534は、2以上の自動応答情報のうちの予め決められた条件を満たす自動応答情報の中で、優先度情報に基づく優先度が最も高い対話エンジン6から出力された自動応答情報を選択する。選択部534は、例えば、2以上の対話エンジン6から一の対話エンジン6を選択する。選択部534は、ユーザ発話情報または発話情報を用いて、一の対話エンジン6を選択する。選択部534は、選択部231または選択部431と同じ処理でも良い。
The
出力部54は、各種の情報を出力する。ここでの出力とは、通常、送信である。ただし、出力とは、情報が出力先に渡れば良い。
The
発話情報出力部541は、ユーザ発話情報に対応する情報である発話情報を、対話エンジン6または管理端末7のうちの少なくともどちらか一方に出力する。発話情報出力部541は、発話情報を、モード情報に関係なく、対話エンジン6および管理端末7に出力しても良い。ここで、発話情報は、ユーザ発話情報と同じ情報でも良い。また、発話情報は、ユーザ発話情報を音声認識し、得られたテキストでも良い。発話情報は、発話識別子が付加された情報であることは好適である。
The utterance
発話情報出力部541は、上記のように、発話情報を管理端末7に対して出力し得る。決定部531が管理端末7を採用すると決定した場合、発話情報出力部541は、発話情報を管理端末7に対して出力する。なお、決定部531が管理端末7を採用すると決定した場合でも、1以上の対話エンジン6に発話情報を出力しても良い。
The utterance
発話情報出力部541は、ユーザ発話情報に対応する情報である発話情報を、1以上の対話エンジン6に対して出力し得る。発話情報出力部541は、発話情報を、2以上の対話エンジン6に出力しても良い。発話情報出力部541は、発話情報を、選択部534が選択した一の対話エンジン6に出力しても良い。
The utterance
自動情報出力部542は、一の自動情報を管理端末7に出力する。自動情報出力部542は、自動応答受付部551が受け付けた自動応答情報に対応する自動情報を管理端末7に出力する。
The automatic
手動情報出力部543は、手動情報を1または2以上の対話エンジン6に出力する。手動情報出力部543は、手動応答受付部552が受け付けた手動応答情報に対応する手動情報を1以上の対話エンジン6に出力する。
The manual
受付部55は、各種の情報や指示等を受け付ける。ここでの受け付けとは、通常、受信である。但し、受け付けは、情報等を受け取れれば良い。
The
自動応答受付部551は、発話情報の1以上の対話エンジン6への出力に応じて、1以上の各対話エンジン6からの応答である自動応答情報を受け付ける。かかる受け付けは、例えば、受信である。
The automatic
手動応答受付部552は、発話情報の管理端末7への出力に応じて、管理端末7からの応答である手動応答情報を受け付ける。かかる受け付けは、例えば、受信である。
The manual
変更指示受付部553は、管理端末7からモードの変更の指示である変更指示を受け付ける。かかる受け付けは、例えば、受信である。また、この変更指示は、自動モードから手動モードへの変更でも良いし、手動モードから自動モードへの変更でも良い。
The change
送信部56は、各種の情報を送信する。各種の情報とは、例えば、手動情報、自動情報等である。
The
応答送信部561は、自動応答情報に対応する情報である自動情報または手動応答情報に対応する情報である手動情報をユーザ端末1に送信する。
The
応答送信部561は、決定部531の決定が対話エンジン6を採用するとの決定の場合は、自動情報をユーザ端末1に送信しても良い。また、応答送信部561は、決定部531の決定が管理端末7を採用するとの決定の場合は、手動情報をユーザ端末1に送信しても良い。ここで、自動情報は、自動応答情報と同じ情報でも良い。自動情報と自動応答情報の内容は、通常、同じである。自動情報は、例えば、自動応答情報を音声に変換した音声データである。手動情報は、手動応答情報と同じ情報でも良い。手動情報と手動応答情報の内容は、通常、同じである。手動情報は、例えば、手動応答情報を音声に変換した音声データである。
The
応答送信部561は、自動応答受付部551が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報をユーザ端末1に送信しても良い。応答送信部561は、選択部534が選択した自動応答情報に対応する一の自動情報をユーザ端末1に送信しても良い。応答送信部561は、自動応答受付部551が受け付けた自動応答情報に対応する一の自動情報をユーザ端末1に送信しても良い。
The
対話エンジン6を構成する学習受付部65は、管理端末7からの応答である手動応答情報を受け付ける。また、学習受付部65は、他の対話エンジン6からの応答である自動応答情報を受け付ける。ここでの手動応答情報または自動応答情報の受け付けは、手動情報または自動情報の受け付けでも良い趣旨である。
The
学習部66は、学習受付部35が受け付けた手動応答情報を用いて、学習処理を行う。また、学習部66は、学習受付部35が受け付けた自動応答情報を用いて、学習処理を行う。自動応答情報を用いた学習処理については、上述した。
The
学習処理は、例えば、手動応答情報を用いて、学習情報格納部31の学習情報に情報を付加することである。学習処理は、例えば、手動応答情報を用いて、学習情報格納部31の学習情報を変更することである。学習情報に情報を付加する処理は、学習情報格納部31に新しい学習情報を追記する処理を含む。
The learning process is, for example, adding information to the learning information of the learning
学習部66は、例えば、手動応答情報と当該手動応答情報に対応する発話情報の組である学習情報を学習情報格納部31に追記する。
The
学習部66は、例えば、手動応答情報と当該手動応答情報に対応する発話情報の組の情報から、状態遷移情報である学習情報に、当該発話情報の前の自動応答情報のノード(状態)の先の状態として、発話情報のノードを付加し、当該発話情報のノードに、手動応答情報のノードを付加する。
For example, the
学習部66は、例えば、手動応答情報から手動応答情報のパターンを構成し、かつ当該手動応答情報に対応する発話情報から発話情報のパターンを構成し、発話情報のパターンと応答のパターンとの組である学習情報を学習情報格納部31に追記する。なお、応答のパターンは、自動応答情報のパターンとなる。
For example, the
学習部66は、例えば、手動応答情報から手動応答情報のパターンを構成し、かつ当該手動応答情報に対応する発話情報から発話情報のパターンを構成し、当該パターンの組に合致する、発話情報のパターンと自動応答情報のパターンの組の出現頻度または出現確率を増加させるように、学習情報格納部31の学習情報を更新する。かかる場合、学習情報は、発話情報のパターンと自動応答情報のパターンの組、および出現頻度または出現確率を有する。
The
なお、学習部66は、例えば、発話情報に対応する発話識別子と手動応答情報に対応する発話識別子とが同一の、発話情報と手動応答情報とを用いて、上記の学習処理を行う。
The
また、学習部66が行う手動応答情報を用いた学習処理は種々あり得る。手動応答情報または他の対話エンジン6からの自動応答情報を用いる点を除いて、学習部66が行う学習処理は他の公知の学習処理のアルゴリズムを用いても良い。
In addition, there may be various learning processes using the manual response information performed by the
管理端末7を構成する管理格納部70は、各種の情報が格納される。各種の情報は、例えば、モード情報、発話情報、自動情報、手動応答情報等である。
Various information is stored in the
管理情報受付部71は、管理者からの手動応答情報を受け付ける。ここでの受け付けは、音声による受け付けでも良いし、キーボードやマウス等の入力手段からの受け付けでも良い。
The management
管理情報受付部71は、管理者からの手動応答情報を音声で受け付けることは好適である。また、管理情報受付部71は、管理者からの手動応答情報をキーボード、マウス、タッチパネル、メニュー画面によるもの等から受け付けても良い。管理情報受付部71は、一の手動応答情報を、音声で受け付けたり、キーボード等の入力手段により受け付けたりすることは好適である。つまり、管理情報受付部71は、音声による受け付け手段と、キーボード、マウス、タッチパネル、またはメニュー画面等の入力手段との両方を具備し、一の手動応答情報をいずれかの手段により受け付けることは好適である。
It is preferable that the management
管理情報受付部71は、自動情報を対話制御装置5から受け付ける。また、管理情報受付部71は、発話情報を対話制御装置5から受け付ける。なお、ここでの受け付けは、通常、受信であるが、情報が管理端末7に渡る処理であれば良い。
The management
管理処理部72は、各種の処理を行う。各種の処理とは、例えば、管理情報受付部71が受け付けた自動情報または発話情報を出力するデータ構造にしたり、かかる情報の出力画面を構成したりする処理である。
The
管理者出力部73は、各種の処理を行う。各種の処理とは、例えば、管理情報受付部71が受け付けた自動情報または発話情報を出力するデータ構造にしたり、かかる情報の出力画面を構成したりする処理である。
The
管理指示受付部74は、管理者から各種の指示を受け付ける。各種の指示とは、例えば、モードの変更の指示である変更指示等である。各種の指示の入力手段は、キーボードやタッチパネルやマウスやメニュー画面によるもの等、何でも良い。管理指示受付部74は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
The management
管理出力部75は、各種の情報や指示を対話制御装置5に出力する。各種の情報や指示は、例えば、変更指示、モード情報等である。なお、ここでの出力は、通常、送信であるが、情報等が対話制御装置2に渡れば良い。
The
格納部51、モード格納部511、および管理格納部70は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
The
格納部51等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部51等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部51等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部51で記憶されるようになってもよい。
The process of storing information in the
処理部53、決定部531、判断部532、モード変更部533、選択部534、応答取得部63、学習部66、および管理処理部72は、通常、MPUやメモリ等から実現され得る。処理部53の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
The
出力部54、発話情報出力部541、自動情報出力部542、手動情報出力部543、送信部56、応答送信部561、応答出力部64、および管理出力部75は、通常、無線または有線の通信手段で実現されるが、放送手段等で実現されても良い。
The
なお、出力部54、発話情報出力部541、自動情報出力部542、手動情報出力部543、および応答出力部64は、情報を出力する出力手段で実現されても良い。ここでの情報の出力とは、例えば、プログラムによる情報の引き渡しである。
The
受付部55、自動応答受付部551、手動応答受付部552、変更指示受付部553、発話受付部62、学習受付部65、および管理情報受付部71は、通常、無線または有線の通信手段で実現されるが、放送受信手段等で実現されても良い。
The
なお、受付部55、自動応答受付部551、手動応答受付部552、変更指示受付部553、発話受付部62、学習受付部65、および管理情報受付部71は、情報を受け付ける受付手段で実現されても良い。ここでの情報の受け付けとは、例えば、プログラムによる情報の引き渡しである。
The
管理者出力部73は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。管理者出力部73は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
The
次に、対話システムCの動作について説明する。まず、対話制御装置5の動作について、図16のフローチャートを用いて説明する。図16のフローチャートにおいて、図4のフローチャートと同一のステップについて、その説明を省略する。
Next, the operation of the dialogue system C will be described. First, the operation of the
(ステップS1601)決定部531または/および選択部534は、発話情報の出力先を決定する。決定部531は、例えば、モード格納部211のモード情報に従って、出力先を対話エンジン3とするか、管理端末7とするかを決定する。なお、決定部531は、発話情報の出力先を、常に、1以上の対話エンジン6と管理端末7との両方にする、としても良い。また、モード情報が自動モードの場合、選択部534は、2以上の対話エンジン6のうちの1以上の対話エンジン6を選択する。かかる選択方法については、実施の形態1、2で記載したいずれかの方法が使用できる。なお、選択部534は、2以上のすべての対話エンジン6を発話情報の出力先として決定しても良い。
(Step S1601) The
(ステップS1602)発話情報出力部241は、ステップS1601で決定された出力先に、ステップS402で取得された発話情報を出力する。
(Step S1602) The utterance
(ステップS1603)受付部55は、発話情報の出力に応じて、1以上の自動応答情報または手動応答情報を受け付ける。なお、受付部55は自動応答情報または手動応答情報を受け付けるまでウエイトする。
(Step S1603) The
(ステップS1604)選択部534は、複数の自動応答情報から一の自動応答情報を選択するか否かを判断する。一の自動応答情報を選択する場合はステップS1605に行き、一の自動応答情報を選択しない場合はステップS1606に行く。ここで、選択部534は、例えば、ステップS1601で2以上の対話エンジン3を選択したか否かを判断しても良い。選択部534は、例えば、2以上の自動応答情報が受け付けられたか否かを判断しても良い。
(Step S1604) The
(ステップS1605)選択部534は、2以上の自動応答情報から一の自動応答情報を選択する。
(Step S1605) The
(ステップS1606)処理部53は、受け付けられた自動応答情報または手動応答情報から、自動情報または手動情報を取得する。なお、自動応答情報および手動応答情報の両方が受け付けられた場合、処理部23は、自動応答情報および動応答情報から、自動情報および手動情報を取得する。
(Step S1606) The
(ステップS1607)処理部53は、自動情報を管理端末7に出力するか否かを判断する。管理端末7に出力する場合はステップS1608に行き、出力しない場合はステップS1609に行く。なお、例えば、自動情報を管理端末7に出力するか否かを示すフラグが格納部51で管理されており、処理部53は、かかるフラグを格納部51から読み出し、判断する。また、処理部53は、常に、自動情報を管理端末7に出力しても良いし、常に、自動情報を管理端末7に出力しなくても良い。
(Step S1607) The
(ステップS1608)自動情報出力部242は、ステップS1606で取得された自動情報を管理端末7に出力する。
(Step S1608) The automatic
(ステップS1609)処理部53は、手動情報を対話エンジン6に出力するか否かを判断する。対話エンジン6に出力する場合はステップS1610に行き、出力しない場合はステップS1611に行く。なお、例えば、手動情報を対話エンジン6に出力するか否かを示すフラグが格納部51で管理されており、処理部53は、かかるフラグを格納部51から読み出し、判断する。また、処理部53は、常に、手動情報を対話エンジン6出力しても良いし、常に、手動情報を対話エンジン6に出力しなくても良い。
(Step S1609) The
(ステップS1610)手動情報出力部543は、ステップS1606で取得された手動情報を1以上の対話エンジン6に出力する。なお、手動情報出力部543は、対話制御装置5が利用可能な複数のすべての対話エンジン6に手動情報を出力しても良いし、一部の対話エンジン6にのみ手動情報を出力しても良い。なお、手動情報の出力先となる対話エンジン6は学習機能を有する対話エンジンであることは好適である。
(Step S1610) The manual
(ステップS1611)決定部531は、対話エンジン6を採用するか、管理端末7を採用するかを決定する。そして、決定部531は、対話エンジン6を採用するとの判断である場合は自動情報を取得し、管理端末7を採用するとの判断である場合は手動情報を取得する。
(Step S1611) The
(ステップS1612)応答送信部561は、ステップS1611で取得された自動情報または手動情報をユーザ端末1に送信する。
(Step S1612) The
(ステップS1613)判断部532は、モード情報を変更するための条件を満たすか否かを判断する。
(Step S1613) The
(ステップS1614)ステップS1613における判断結果が、条件を満たすとの判断結果である場合はステップS1615に行き、条件を満たさないとの判断結果である場合はステップS1601に戻る。 (Step S1614) If the determination result in step S1613 is the determination result that the condition is satisfied, the process goes to step S1615, and if the determination result is that the condition is not satisfied, the process returns to step S1601.
(ステップS1615)モード変更部533は、モード格納部511のモード情報を変更する。ステップS1601に戻る。
(Step S1615) The
(ステップS1616)処理部53は、ステップS1615における変更が、手動モードへの変更であるか否かを判断する。手動モードへの変更である場合はステップS1617に行き、手動モードへの変更でない場合はステップS1618に行く。
(Step S1616) The
(ステップS1617)出力部54は、最新の発話情報を管理端末7に出力する。ステップS1605に戻る。
(Step S1617) The
(ステップS1618)出力部54は、最新の発話情報を対話エンジン6に出力する。ステップS1605に戻る。
(Step S1618) The
(ステップS1619)変更指示受付部553は、管理端末7から変更指示を受け付けたか否かを判断する。変更指示を受け付けた場合はステップS1620に行き、変更指示を受け付けない場合はステップS1601に戻る。
(Step S1619) The change
(ステップS1620)モード変更部533は、モード格納部511のモード情報を変更する。ステップS1601に戻る。
(Step S1620) The
なお、図16のフローチャートにおいて、ステップS1613の判断部532の判断処理のタイミングは問わない。
In the flowchart of FIG. 16, the timing of the determination process of the
また、図16のフローチャートにおいて、自動情報や手動情報の送信の順序や、送信するか否かの判断の順序等の各種の処理の順序は問わないことは言うまでもない。 Further, it goes without saying that in the flowchart of FIG. 16, the order of various processes such as the order of transmission of automatic information and manual information and the order of determination of whether or not to transmit information does not matter.
また、図16のフローチャートにおいて、ステップS1605で自動応答情報を受け付けない場合、自動情報は出力されない。また、ステップS1605で手動応答情報を受け付けない場合、手動情報は出力されない。 Further, in the flowchart of FIG. 16, if the automatic response information is not received in step S1605, the automatic information is not output. If the manual response information is not accepted in step S1605, the manual information is not output.
さらに、図16のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 Further, in the flowchart of FIG. 16, the process ends when the power is turned off or an interrupt for the end of the process occurs.
次に、対話エンジン6の動作について、図17のフローチャートを用いて説明する。
Next, the operation of the
(ステップS1701)発話受付部32は、対話制御装置2から発話情報を受け付けたか否かを判断する。発話情報を受け付けた場合はステップS1702に行き、発話情報を受け付けない場合はステップS1704に行く。
(Step S1701) The
(ステップS1702)応答取得部33は、ステップS1701で受け付けられた発話情報に対応する自動応答情報を、学習情報格納部31の学習情報を用いて取得する。
(Step S1702) The
(ステップS1703)応答出力部34は、応答取得部33が取得した自動応答情報を対話制御装置2に出力する。
(Step S1703) The
(ステップS1704)学習受付部65は、学習対象を受け付けたか否かを判断する。学習対象を受け付けた場合はステップS1705に行き、学習対象を受け付けない場合はステップS1701に戻る。学習対象とは、手動応答情報または、他の対話エンジン6の出力である自動応答情報である。
(Step S1704) The
(ステップS1705)学習部66は、学習受付部65が受け付けた学習対象を用いて、学習情報に、追記する情報を構成する。
(Step S1705) The
(ステップS1706)学習部66は、ステップS1705で構成した情報を学習情報格納部31に追記する。ステップS1701に戻る。
(Step S1706) The
なお、図5のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 In the flowchart of FIG. 5, the process ends when the power is turned off or an interrupt for the end of the process occurs.
次に、対話エンジン6の動作について、図17のフローチャートを用いて説明する。
Next, the operation of the
(ステップS1701)発話受付部32は、対話制御装置5から発話情報を受け付けたか否かを判断する。発話情報を受け付けた場合はステップS1702に行き、発話情報を受け付けない場合はステップS1704に行く。
(Step S1701) The
(ステップS1702)応答取得部33は、ステップS1701で受け付けられた発話情報に対応する自動応答情報を、学習情報格納部31の学習情報を用いて取得する。
(Step S1702) The
(ステップS1703)応答出力部34は、応答取得部33が取得した自動応答情報を対話制御装置5に出力する。
(Step S1703) The
(ステップS1704)学習受付部65は、学習対象の自動応答情報または手動応答情報を受け付けたか否かを判断する。自動応答情報または手動応答情報を受け付けた場合はステップS1705に行き、自動応答情報を受け付けない場合はステップS1701に戻る。
(Step S1704) The
(ステップS1705)学習部66は、学習受付部65が受け付けた自動応答情報または手動応答情報を用いて、学習情報に、追記する情報を構成する。
(Step S1705) The
(ステップS1706)学習部66は、ステップS1705で構成した情報を学習情報格納部31に追記する。ステップS1701に戻る。
(Step S1706) The
なお、図17のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 In the flowchart of FIG. 17, the process ends when the power is turned off or an interrupt for the end of the process occurs.
また、図17のフローチャートにおいて、学習処理自体は上記した学習のアルゴリズム、公知のアルゴリズムが採用可能である。 Further, in the flowchart of FIG. 17, the above-mentioned learning algorithm and known algorithm can be adopted for the learning process itself.
次に、管理端末7の動作について、図18のフローチャートを用いて説明する。
Next, the operation of the
(ステップS1801)管理情報受付部71は、発話情報を対話制御装置5から受け付けたか否かを判断する。発話情報を受け付けた場合はステップS1802に行き、受け付けない場合はステップS1806に行く。
(Step S1801) The management
(ステップS1802)管理者出力部73は、ステップS1801で受け付けられた発話情報を、または管理処理部72により出力用に構成された発話情報を出力する。
(Step S1802) The
(ステップS1803)管理処理部72は、発話情報の出力に対応した手動応答情報を出力するか否かを判断する。手動応答情報を出力する場合はステップS1804に行き、手動応答情報を出力しない場合はステップS1801に戻る。なお、手動応答情報を出力する場合は、モード情報が手動モードの場合である。なお、例えば、管理格納部70のモード情報が「手動モード」である場合、管理処理部72は、手動応答情報を出力すると判断する。
(Step S1803) The
(ステップS1804)管理情報受付部71は、手動応答情報を受け付けたか否かを判断する。手動応答情報を受け付けた場合はステップS1805に行き、手動応答情報を受け付けない場合はステップS1804に戻る。
(Step S1804) The management
(ステップS1805)管理者出力部73は、ステップS1804で受け付けられた手動応答情報を対話制御装置5に出力する。ステップS1801に戻る。
(Step S1805) The
(ステップS1806)管理情報受付部71は、自動情報を対話制御装置6から受け付けたか否かを判断する。自動情報を受け付けた場合はステップS1807に行き、受け付けない場合はステップS1808に行く。
(Step S1806) The management
(ステップS1807)管理者出力部73は、ステップS1806で受け付けられた自動情報を、または管理処理部72により出力用に構成された自動情報を出力する。ステップS1801に戻る。
(Step S1807) The
(ステップS1808)管理指示受付部74は、管理者からモードの変更指示を受け付けたか否かを判断する。変更指示を受け付けた場合はステップS1809に行き、変更指示を受け付けない場合はステップS1801に戻る。
(Step S1808) The management
(ステップS1809)管理者出力部75は、ステップS1808で受け付けられた変更指示を対話制御装置5に出力する。ステップS1801に戻る。
(Step S1809) The
なお、図6のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 In the flowchart of FIG. 6, the process ends when the power is turned off or an interrupt for the end of the process occurs.
以下、本実施の形態における対話システムCの具体的な動作について説明する。対話システムCの概念図は図13である。 Hereinafter, the specific operation of the dialogue system C in the present embodiment will be described. The conceptual diagram of the dialogue system C is FIG.
今、対話制御装置5の格納部51は、対話が破綻していることを特定するための条件を示す情報である破綻判断条件管理表が格納されている、とする(図19参照)。破綻判断条件管理表は、「ID」「破綻条件」を有するレコードを1以上管理している。「破綻条件」は、「情報」「条件」を有する。「ID」は、レコードを識別する情報である。「情報」は、対話の破綻を判断するために使用する情報である。「情報」は、ユーザ発話情報または自動応答情報である。なお、ユーザ発話情報の代わりに発話情報であっても良いし、自動応答情報の代わりに自動情報でも良い。また、「条件」は、対話の破綻を判断するための条件である。「ID=1」の条件は、類似度が90%以上のユーザ発話情報が連続して受け付けられることである。なお、ユーザ発話情報の類似度の算出の処理は、例えば、文の類似度の算出と同一の処理であり、公知技術であるので詳細な説明を省略する。「ID=2」の条件は、類似度が90%以上のユーザ発話情報が、連続して受け付けられる4つのユーザ発話情報の中で、3以上存在することである。「ID=3」の条件は、連続して受け付けられる4つの自動応答情報の中で、破綻用語を含む自動応答情報が2以上存在することである。「ID=4」の条件は、会話不成立を示す情報を含む自動応答情報が受け付けられたことである。なお、破綻用語は、ここでは、例えば、「理解できなかった」「理解不能」である、とする。また、会話不成立を示す情報は、例えば、自動応答情報に含まれ得るスコア「0」である、とする。さらに、例えば、モード格納部211のデフォルトのモード情報は「自動モード」である、とする。
Now, it is assumed that the
また、格納部51は、例えば、図6に示す優先度情報管理表を格納している、とする。さらに、格納部51は、例えば、図12に示す選択条件管理表を格納している、とする。
Further, it is assumed that the
また、一の対話エンジン6(例えば、「e1」)を構成する学習情報格納部61は、図7に示す学習情報管理表を格納している、とする。また、その学習情報格納部61は、図8に示すFoodtableを格納している、とする。Foodtableは、「ID」「料理」「作り方」を有するレコードを1以上格納している。さらに、その学習情報格納部61は、料理名を格納しているfood辞書、作物名を格納しているcrops辞書を有する、とする。food辞書には、「カツ丼、牛丼、親子丼、・・・」等の多数の料理名が格納されている。また、crops辞書には、「お米、ナス、にんじん、・・・」等の多数の作物名が格納されている。 Further, it is assumed that the learning information storage unit 61 constituting one dialogue engine 6 (for example, “e1”) stores the learning information management table shown in FIG. 7. Further, it is assumed that the learning information storage unit 61 stores the Foodtable shown in FIG. Foodtable stores one or more records having "ID", "cooking", and "how to make". Further, it is assumed that the learning information storage unit 61 has a food dictionary for storing the dish name and a crops dictionary for storing the crop name. The food dictionary stores a large number of dish names such as "Katsudon, Gyudon, Oyakodon, ...". In addition, a large number of crop names such as "rice, eggplant, carrot, ..." are stored in the crops dictionary.
かかる状況において、以下の3つの具体例について説明する。具体例1は、対話制御装置2が対話の破綻を自動検知して、モード情報が自動モードから手動モードに自動的に切り替わる場合である。また、具体例1において、自動で手動モードから自動モードに切り替える処理についても説明する。また、具体例2は、管理者が手動で、モード情報を自動モードから手動モードに切り替える場合である。また、具体例2において、管理者が手動で、モード情報を手動モードから自動モードに切り替える場合についても説明する。さらに、具体例3は、管理者が入力した手動応答情報を用いて、対話エンジン3が学習を行う場合である。なお、3つの具体例において、例えば、対話システムCが具備する対話エンジン6は3つである。
In such a situation, the following three specific examples will be described. A specific example 1 is a case where the
(具体例1)
今、ユーザは、ユーザ端末1に対して、「おはよう」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、ユーザからの発話「おはよう」を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「おはよう」を取得する。次に、ユーザ送信部13は、ユーザ発話情報「おはよう」を対話制御装置2に送信する。
(Specific example 1)
Now, it is assumed that the user has input the voice "Good morning" to the
次に、対話制御装置5の受信部22は、ユーザ発話情報「おはよう」をユーザ端末1から受信する。
Next, the receiving
そして、処理部53は、ユーザ発話情報「おはよう」から発話情報「1:おはよう」を取得する。つまり、処理部53は、格納されている発話識別子「0」(発話識別子の初期値である、とする)をインクリメントし、ユニークな発話識別子「1」を生成する。そして、処理部23は、ユーザ発話情報に発話識別子「1」を付加し、発話情報「1:おはよう」を構成する。
Then, the
次に、決定部531は、モード情報「自動モード」をモード格納部511から取得し、発話情報の出力先を対話エンジン6、と決定する。
Next, the
次に、選択部34は、3つの対話エンジン6の通知先情報を図6の表から取得する。
Next, the
次に、発話情報出力部241は、3つの対話エンジン6に発話情報「1:おはよう」を送信する。
Next, the utterance
次に、3つの各対話エンジン6の発話受付部32は、対話制御装置5から発話情報「1:おはよう」を受信する。
Next, the
次に、例えば、対話エンジン「e1」の応答取得部33は、発話情報が有する「おはよう」と対になる自動応答情報「おはようございます」を図7の学習情報管理表から取得する。なお、ここで、応答取得部33は、発話識別子「1」を付加した自動応答情報「1:おはようございます」を取得することは好適である。
Next, for example, the
次に、応答出力部34は、応答取得部33が取得した自動応答情報「1:おはようございます」を対話制御装置5に送信する。なお、送信される自動応答情報は、「おはようございます」でも良い。
Next, the
次に、対話制御装置5の自動応答受付部251は、3つの対話エンジン6から自動応答情報を受信する。なお、対話エンジン「e1」からは、自動応答受付部251は、自動応答情報「1:おはようございます」を受信する。
Next, the automatic
次に、選択部534は、実施の形態1で説明した選択のアルゴリズムにより、優先度が高い対話エンジン「e1」の自動応答情報を選択する。
Next, the
次に、処理部53は、「e1」の自動応答情報から、自動情報「おはようございます」を取得する。次に、応答送信部261は、自動情報「おはようございます」をユーザ端末1に送信する。なお、処理部53は、自動情報を管理端末7に出力しない、と判断する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、自動情報「おはようございます」を受信する。そして、ユーザ出力部15は、自動情報「おはようございます」を音声出力する。
Next, the
次に、ユーザは、ユーザ端末1に対して、「来週の木曜日は営業していますか?」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、ユーザからの発話「来週の木曜日は営業していますか?」を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「来週の木曜日は営業していますか?」を取得する。次に、ユーザ送信部13は、当該ユーザ発話情報を対話制御装置2に送信する。
Next, it is assumed that the user voice-inputs "Is it open next Thursday?" To the
次に、対話制御装置5の受信部22は、ユーザ発話情報「来週の木曜日は営業していますか?」をユーザ端末1から受信する。
Next, the receiving
そして、処理部53は、当該ユーザ発話情報から発話情報「2:来週の木曜日は営業していますか?」を取得する。つまり、処理部23は、格納されている発話識別子「1」をインクリメントし、ユニークな発話識別子「2」を生成する。そして、処理部23は、ユーザ発話情報に発話識別子「2」を付加し、発話情報「2:来週の木曜日は営業していますか?」を構成する。
Then, the
次に、決定部531は、モード情報から発話情報の出力先を「対話エンジン6」と決定する。
Next, the
次に、発話情報出力部241は、3つの各対話エンジン3に発話情報「2:来週の木曜日は営業していますか?」を送信する。
Next, the utterance
次に、3つの各対話エンジン3の発話受付部32は、対話制御装置2から発話情報「2:来週の木曜日は営業していますか?」を受信する。
Next, the
次に、3つの各対話エンジン3の応答取得部33は、発話情報が有する「来週の木曜日は営業していますか?」に対応する自動応答情報を取得する。
Next, the
なお、対話エンジン「e1」の応答取得部33は、「来週の木曜日は営業していますか?」が図8の学習情報管理表の中の発話情報のパターン「{timeExpression}*営業していますか?*」に合致することを検出する。なお、かかる発話情報のパターンは、図8の学習情報管理表の「ID=3」の情報である。そして、応答取得部33は、「ID=3」の自動応答情報を取得する。そして、応答取得部33は、当該自動応答情報の{timeExpression}に対して「来週の木曜日」を代入し、「$営業日」の値「日曜日、火曜日、水曜日、木曜日、金曜日、土曜日」から、来週の木曜日が営業日に含まれる(つまり、自動応答情報の実行結果「真」)、と判断する。なお、応答取得部33は、「来週の木曜日」から曜日を示す「木曜日」を抽出し、「$営業日」の値に含まれる、と判断する。次に、対話エンジン「e1」の応答取得部33は、自動応答情報のパターン"はい。{timeExpression}は営業しております"を取得する。次に、応答取得部33は、自動応答情報のパターンの{timeExpression}に対して「来週の木曜日」を代入し、自動応答情報「来週の木曜日は営業しております」を取得する。そして、応答送信部261は、自動応答情報「2:来週の木曜日は営業しております」を対話制御装置5に送信する。
In addition, in the
次に、対話制御装置5の自動応答受付部551は、自動応答情報を3つの各エンジン3から受信する。
Next, the automatic
次に、選択部534は、上述した処理により、3つの自動応答情報の中から、対話エンジン「e1」の自動応答情報「2:来週の木曜日は営業しております」を選択する。
Next, the
次に、処理部53は、自動応答情報から、自動情報「来週の木曜日は営業しております」を取得する。次に、決定部531は、モード情報「自動モード」から対話エンジン6を採用すると決定する。そして、応答送信部561は、自動情報「来週の木曜日は営業しております」をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、自動情報「来週の木曜日は営業しております」を受信する。そして、ユーザ出力部15は、自動情報「来週の木曜日は営業しております」を音声出力する。
Next, the
以上のように、ユーザと3つのうちのいずれかの対話エンジン6との対話の動作が繰り返し行われた、とする。そして、3つの対話エンジン6から送信されたすべての自動応答情報の中に「理解不能」を含む情報が、2回連続して、対話制御装置2に送信された、とする。なお、3つの各対話エンジン6は、受け付けた発話情報に対応する自動応答情報を取得することができなかった場合、「理解不能」を含む自動応答情報を構成し、送信する、とする。また、2回目の「理解不能」を含む自動応答情報に対応するユーザ発話情報は「来週の木曜日のお席の予約は可能ですか?」であった、とする。
As described above, it is assumed that the operation of the dialogue between the user and one of the three
そして、対話制御装置5の自動応答受付部551が、最終的に選択された自動応答情報が、2度目の「理解不能」を含む自動応答情報であった、とする。なお、処理部53は、選択された自動応答情報やユーザ発話情報や手動応答情報等のログを格納部51に蓄積することは好適である。または、処理部53は、1度目の「理解不能」を含む自動応答情報が選択された場合に、当該自動応答情報を格納部51に蓄積しても良い。
Then, it is assumed that the automatic
次に、判断部532は、2回の連続した「理解不能」を含む自動応答情報が、図19の「ID=3」の破綻条件に合致する、と判断5。
Next, the
次に、モード変更部533は、モード格納部211のモード情報「自動モード」から「手動モード」に変更する。
Next, the
次に、処理部53は、手動モードへの変更である、と判断する。そして、出力部54は、最新の発話情報「12:来週の木曜日のお席の予約は可能ですか?」を管理端末7に出力する。なお、「12」は発話識別子である。
Next, the
次に、管理端末7の管理情報受付部71は、発話情報「12:来週の木曜日のお席の予約は可能ですか?」を対話制御装置2から受信する。
Next, the management
次に、管理者出力部73は、発話情報のうちの発話内容「来週の木曜日のお席の予約は可能ですか?」を出力する。かかる出力例は、図20である。図20において、2001に発話情報のうちの発話内容が表示されている。
Next, the
次に、管理者は、図20の2002の「Yes」ボタンを押下した、とする。すると、管理情報受付部71は、「Yes」ボタンの押下を検知し、「Yes」ボタンに対応づけて格納されている手動応答情報「はい。」を、図21の手動応答情報管理表から取得する。なお、管理格納部70には、図20の画面上のボタンに対応する手動応答情報が管理されている。かかる手動応答情報管理表は、図21である。図21は、「ID」「ボタン」「手動応答情報」を有するレコードが管理されている。「ボタン」の各属性値は、図10のボタンに対応する。次に、管理者出力部73は、手動応答情報「はい。」を対話制御装置5に送信する。
Next, it is assumed that the administrator presses the "Yes" button of 2002 in FIG. 20. Then, the management
なお、ここで、管理者は、図20の画面内のボタンを押下せずに、または図20の2003の「音声入力」ボタンを押下した後、「はい。来週の木曜日は、4名様までご予約可能です。」などと、音声入力しても良い。かかる場合、対話制御装置2の管理情報受付部71は、音声データ「はい。来週の木曜日は、4名様までご予約可能です。」を受け付け、当該音声データを音声認識し、テキストの手動応答情報「はい。来週の木曜日は、4名様までご予約可能です。」を得る。そして、管理者出力部73は、当該手動応答情報を対話制御装置5に送信する。なお、管理情報受付部71は、デフォルトで、音声を受け付けても良い。
Here, the administrator does not press the button in the screen of FIG. 20, or after pressing the "voice input" button of 2003 of FIG. 20, "Yes. Next Thursday, up to 4 people. You can make a reservation by voice input. In such a case, the management
次に、対話制御装置5の手動情報受付部552は、手動応答情報「はい。来週の木曜日は、4名様までご予約可能です。」を受け付ける。そして、処理部53は、当該手動応答情報を手動情報として取得する。
Next, the manual
そして、モード情報が「手動モード」なので、応答送信部561は手動情報「はい。来週の木曜日は、4名様までご予約可能です。」をユーザ端末1に送信する。
Then, since the mode information is "manual mode", the
次に、ユーザ端末1のユーザ受信部14は、当該手動情報を受信する。次に、ユーザ出力部15は、手動情報「はい。来週の木曜日は、4名様までご予約可能です。」を音声出力する。
Next, the
以上の処理により、対話の破綻を自動検知し、自動モードから手動モードの自動切り替えを行うことにより、対話の継続が可能となる。 By the above processing, the failure of the dialogue is automatically detected, and the dialogue can be continued by automatically switching from the automatic mode to the manual mode.
また、手動モードの状態で、閾値以上の回数の対話(手動応答情報の受信)が行われた場合、判断部532は、「手動モード」から「自動モード」にモード情報を変更する、と判断するとする。そして、モード変更部533は、モード格納部511のモード情報を「手動モード」から「自動モード」に変更する。
Further, in the state of the manual mode, when the dialogue (reception of the manual response information) is performed more than the threshold value, the
以後、上記で説明したような「自動モード」での対話処理が継続される。なお、ユーザ端末1において、図9に示すようにキャラクタがお話しているように、自動情報または手動情報を音声出力することは好適である。
After that, the dialogue processing in the "automatic mode" as described above is continued. It is preferable that the
(具体例2)
今、ユーザは、ユーザ端末1に対して、「牛丼の作り方を教えて」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、ユーザからの発話「牛丼の作り方を教えて」を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「牛丼の作り方を教えて」を取得する。次に、ユーザ送信部13は当該ユーザ発話情報を対話制御装置5に送信する。
(Specific example 2)
Now, it is assumed that the user voice-inputs "Tell me how to make beef bowl" to the
次に、対話制御装置5の受信部22は、ユーザ発話情報「牛丼の作り方を教えて」をユーザ端末1から受信する。
Next, the receiving
そして、処理部53は、当該ユーザ発話情報から発話情報「1:牛丼の作り方を教えて」を取得する。発話情報の「1」は発話識別子である。
Then, the
次に、決定部531は、発話情報の出力先を対話エンジン6および管理端末7と決定する。なお、本具体例において、発話情報の出力先は、常に、対話エンジン6および管理端末7である、とする。
Next, the
次に、選択部534は、3つの対話エンジン6から一の対話エンジン6を選択する。ここでは、選択部534は、「牛丼の作り方を教えて」に対して自然言語処理を行い、ジャンル「料理」を取得する。そして、選択部534は、図12を参照し、ジャンル「料理」と対になる対話エンジン「e2」を選択する。なお、選択部534は、例えば、「牛丼の作り方を教えて」を形態素解析し、自立語「牛丼」「作り方」「教えて」を取得し、当該自立語から機械学習(例えば、深層学習、決定木、SVM)により、ジャンル「料理」を取得する。
Next, the
次に、発話情報出力部541は、発話情報「1:牛丼の作り方を教えて」を、対話エンジン「e2」および管理端末7に送信する。
Next, the utterance
そして、管理端末7は、発話情報「1:牛丼の作り方を教えて」を受信し、発話情報に含まれる「牛丼の作り方を教えて」を出力する。
Then, the
次に、対話エンジン「e2」の発話受付部32は、対話制御装置5から発話情報「1:牛丼の作り方を教えて」を受信する。
Next, the
次に、対話エンジン「e2」の応答取得部33は、発話情報が有する「牛丼の作り方を教えて」を形態素解析する。そして、応答取得部33は、取得した形態素「牛丼」をキーとして、辞書を検索し、「牛丼」は{food}に含まれることを検出する。次に、応答取得部33は、「牛丼の作り方を教えて」が図7の学習情報管理表の「ID=4」の発話情報に合致することを検出する。そして、応答取得部33は、「ID=4」の自動応答情報を取得し、当該自動応答情報を実行し、図8のFoodtableから料理「牛丼」に対応する作り方「4人前の材料をご紹介します。・・・」を取得する。そして、応答出力部34は、応答取得部33が取得した自動応答情報「1:4人前の材料をご紹介します。・・・」を対話制御装置5に送信する。
Next, the
次に、対話制御装置5の受付部55は、当該自動応答情報を受け付ける。そして、処理部53は、当該答情報から、自動情報「4人前の材料をご紹介します。・・・」を取得する。なお、ここでは、自動応答情報と自動情報が同じでも良い。
Next, the
次に、処理部53は、自動情報を管理端末7に出力する、と判断する。そして、自動情報出力部542は、自動情報「4人前の材料をご紹介します。・・・」を管理端末7に出力する。
Next, the
次に、決定部531は、モード情報「自動モード」から対話エンジン6を採用する、と判断する。そして、応答送信部561は、対話エンジン「e2」からの自動情報「4人前の材料をご紹介します。・・・」をユーザ端末1に送信する。
Next, the
次に、ユーザ端末1のユーザ受信部14は、当該自動情報を受信する。そして、ユーザ出力部15は、当該自動情報を出力する。
Next, the
次に、ユーザは、ユーザ端末1に対して、「粉末うどんスープはどちらのスープがお勧めですか?」と音声入力した、とする。すると、ユーザ端末1のユーザ受付部11は、当該ユーザの音声入力を受け付ける。次に、ユーザ処理部12は、ユーザの音声入力に対して音声認識し、ユーザ発話情報「粉末うどんスープはどちらのスープがお勧めですか?」を取得する。次に、ユーザ送信部13は、当該ユーザ発話情報を対話制御装置5に送信する。
Next, it is assumed that the user voice-inputs "Which soup is recommended for powdered udon soup?" To the
次に、対話制御装置5の受信部22は、当該ユーザ発話情報をユーザ端末1から受信する。
Next, the receiving
そして、処理部53は、当該ユーザ発話情報から発話情報「2:粉末うどんスープはどちらのスープがお勧めですか?」を取得する。
Then, the
次に、決定部531は、発話情報の出力先を対話エンジン6および管理端末7と決定する。そして、発話情報出力部541は、当該発話情報を、選択されている対話エンジン「e2」および管理端末7に送信する。
Next, the
次に、対話エンジン「e2」は、当該発話情報を受信し、当該発話情報に対応する自動応答情報を取得し、対話制御装置5に送信する。なお、ここでの自動応答情報は、例えば、「理解できない」旨の情報を含む、とする。
Next, the dialogue engine "e2" receives the utterance information, acquires the automatic response information corresponding to the utterance information, and transmits it to the
また、管理端末7は、当該発話情報を受信し、発話情報に含まれる「粉末うどんスープはどちらのスープがお勧めですか?」を出力する。
Further, the
そして、この出力を見た管理者は、どの対話エンジン6にも答えられないと判断し、管理端末7にモード情報の変更指示を入力した、とする。そして、管理者は、「粉末うどんスープはA社のスープがお勧めです。」と音声入力した、とする。
Then, the administrator who sees this output determines that he / she cannot answer any of the
次に、管理指示受付部74は、管理者からモードの変更指示(自動モードから手動モードへの変更指示)を受け付ける。そして、管理出力部75は、かかる変更指示を対話制御装置5に出力する。
Next, the management
また、管理情報受付部71は、音声データ「粉末うどんスープはA社のスープがお勧めです。」を受け付け、当該音声データを音声認識し、テキストに変更する。次に、管理者出力部73は、テキストの手動応答情報「2:粉末うどんスープはA社のスープがお勧めです。」を対話制御装置5に送信する。
In addition, the management
次に、対話制御装置5の変更指示受付部553は、管理端末7から変更指示を受信する。モード変更部533は、モード格納部51のモード情報を、手動モードに変更する。
Next, the change
また、手動応答受付部552は、管理端末7から手動応答情報を受信する。処理部53は、受信された自動応答情報および手動応答情報から、自動情報および手動情報を取得する。
Further, the manual
次に、決定部531は、モード情報「手動モード」から管理端末7を採用する、と決定する。
Next, the
そして、応答送信部561は、取得された手動情報「粉末うどんスープはA社のスープがお勧めです。」をユーザ端末1に送信する。
Then, the
次に、ユーザ端末1は、手動情報「粉末うどんスープはA社のスープがお勧めです。」を受信し、出力する。
Next, the
以上の処理により、管理者が適切に対話に介在し、複数の対話エンジンも用いて、効果的で継続的な対話を行える。なお、本具体例において、管理者が「自動モード」にモード情報を変更する指示を入力した後、「自動モード」で対話を行うことができる。 Through the above processing, the administrator can appropriately intervene in the dialogue, and an effective and continuous dialogue can be performed by using a plurality of dialogue engines. In this specific example, after the administrator inputs an instruction to change the mode information in the "automatic mode", the dialogue can be performed in the "automatic mode".
(具体例3)
具体例2において、対話制御装置5の手動応答受付部552が管理端末7から手動応答情報「2:粉末うどんスープはA社のスープがお勧めです。」を受信した後、処理部53は、手動応答情報を3つの各対話エンジン6に送信する、と判断する。
(Specific example 3)
In Specific Example 2, after the manual
そして、手動情報出力部543は、かかる手動応答情報を3つの各対話エンジン6に送信する。なお、ここで、手動情報出力部543は、手動情報を3つの各対話エンジン6に送信しても良い。また、手動情報出力部543は、通常、発話情報またはユーザ発話情報を、手動応答情報または手動情報と対にして、3つの各対話エンジン6に送信する。なお、手動情報出力部543は既に発話情報が送信されている対話エンジン6には、発話情報またはユーザ発話情報を送信しないことは好適である。
Then, the manual
次に、対話エンジン6の学習受付部65は、手動応答情報「2:粉末うどんスープはA社のスープがお勧めです。」を受信する。
Next, the
次に、学習部66は、学習受付部65が受け付けた手動応答情報を用いて、学習情報に、追記する情報を構成する。つまり、学習部66は、手動応答情報「2:粉末うどんスープはA社のスープがお勧めです。」が有する発話識別子「2」に対応する発話情報を取得する。そして、発話識別子「2」に対応する発話情報の内容「粉末うどんスープはどちらのスープがお勧めですか?」と手動応答情報の内容「粉末うどんスープはA社のスープがお勧めです。」との組を、図7の学習情報管理表に追記する。
Next, the
なお、学習部66は、発話情報の内容「粉末うどんスープはどちらのスープがお勧めですか?」のうち、名詞または名詞句「粉末うどんスープ」「スープ」を変数に置き換え、「{変数1}はどちらの{変数2}がお勧めですか?」というパターンに変更し、「粉末うどんスープはA社のスープがお勧めです。」のうち、名詞または名詞句「粉末うどんスープ」「A社」「スープ」を変数に置き換え、「{変数3}は{変数4}の{変数5}がお勧めです。」というパターンに変更し、2つのパターンの組を、図7の学習情報管理表に追記するなどしても良い。
In addition, the
つまり、本具体例において、管理者からの入力である手動応答情報を用いて、学習情報をよくすれば良く、学習情報の構造は問わない。 That is, in this specific example, the learning information may be improved by using the manual response information input from the administrator, and the structure of the learning information does not matter.
また、本具体例において、各対話エンジン6は、他の対話エンジン6が出力した自動応答情報を用いて、学習処理を行うことが好適である。
Further, in this specific example, it is preferable that each
以上、本実施の形態によれば、対話エンジン6からの応答と管理者からの応答とを使い分けて、ユーザ端末に出力することにより、適切な対話を継続できる。
As described above, according to the present embodiment, an appropriate dialogue can be continued by properly using the response from the
また、本実施の形態によれば、管理者からの応答を学習できる対話エンジン6を提供できる。
Further, according to the present embodiment, it is possible to provide a
また、本実施の形態によれば、例えば、対話が破綻した等の場合に、対話を支援できる管理端末7を提供できる。
Further, according to the present embodiment, it is possible to provide a
なお、本実施の形態における対話制御装置5を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、2以上の対話エンジンから、ユーザの発話に対応する応答である自動応答情報を受け付け得る対話制御装置におけるプログラムであって、コンピュータを、ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信部と、前記ユーザ発話情報に対応する情報である発話情報を、1以上の対話エンジンに対して出力し得る発話情報出力部と、前記発話情報の出力に応じて、前記1以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、前記自動応答受付部が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信部として機能させるためのプログラムである。
The software that realizes the
また、上記プログラムにおいて、前記発話情報出力部は、前記発話情報を管理端末に対しても出力可能であり、コンピュータを、前記発話情報の前記管理端末への出力に応じて、前記管理端末からの応答である手動応答情報を受け付ける手動応答受付部としてさらに機能させ、前記応答送信部は、前記一の自動応答情報に対応する情報である一の自動情報または前記手動応答情報に対応する情報である手動情報を前記ユーザ端末に送信するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, the utterance information output unit can also output the utterance information to the management terminal, and the computer can output the utterance information from the management terminal in response to the output of the utterance information to the management terminal. Further functioning as a manual response receiving unit that receives manual response information that is a response, the response transmitting unit is information corresponding to the one automatic response information, one automatic information, or information corresponding to the manual response information. It is preferable that the program operates the computer to transmit the manual information to the user terminal.
また、上記プログラムにおいて、コンピュータを、対話エンジンを採用するか、管理端末を採用するかを決定する決定部としてさらに機能させ、前記応答送信部は、前記決定が対話エンジンを採用するとの決定の場合は、前記一の自動情報を前記ユーザ端末に送信し、前記決定が管理端末を採用するとの決定の場合は、前記手動情報を前記ユーザ端末に送信するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, when the computer further functions as a decision unit for deciding whether to adopt the dialogue engine or the management terminal, and the response transmission unit determines that the decision adopts the dialogue engine. Is a program that causes the computer to function by transmitting the above-mentioned automatic information to the user terminal and, in the case of the decision to adopt the management terminal, transmitting the manual information to the user terminal. Is suitable.
また、上記プログラムにおいて、コンピュータを、対話エンジンを採用する自動モード、または管理端末を採用する手動モードのいずれかを、少なくとも採り得るモード情報が格納されるモード格納部と、モード情報を変更するための予め決められた条件を満たすか否かを判断する判断部と、前記判断部が予め決められた条件を満たすと判断した場合に、前記モード情報を変更するモード変更部としてさらに機能させ、前記決定部は、前記モード格納部のモード情報を取得するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, in order to change the mode information and the mode storage unit in which at least the mode information that can be taken is changed between the automatic mode that employs the dialogue engine and the manual mode that employs the management terminal. Further functions as a determination unit for determining whether or not the predetermined condition is satisfied, and a mode change unit for changing the mode information when the determination unit determines that the predetermined condition is satisfied. It is preferable that the determination unit is a program that causes the computer to function as a device for acquiring the mode information of the mode storage unit.
また、上記プログラムにおいて、コンピュータを、対話エンジンを採用する自動モード、または管理端末を採用する手動モードのいずれかを、少なくとも採り得るモード情報が格納されるモード格納部と、管理端末からモードの変更の指示である変更指示を受け付ける変更指示受付部と、前記変更指示に応じて、前記モード格納部のモード情報を変更するモード変更部としてさらに機能させ、前記決定部は、前記モード格納部のモード情報に従って、対話エンジンを採用するか、管理端末を採用するかを決定するものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, the computer has either an automatic mode that employs a dialogue engine or a manual mode that employs a management terminal, at least a mode storage unit that stores mode information that can be taken, and a mode change from the management terminal. The change instruction receiving unit that receives the change instruction, which is the instruction of the above, and the mode changing unit that changes the mode information of the mode storage unit in response to the change instruction are further functioned, and the determining unit is the mode of the mode storage unit. It is preferable that the program functions the computer as a decision to adopt the dialogue engine or the management terminal according to the information.
また、上記プログラムにおいて、コンピュータを、前記一の自動情報を前記管理端末に出力する自動情報出力部としてさらに機能させ、ものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, it is preferable that the computer further functions as an automatic information output unit that outputs the above-mentioned one automatic information to the management terminal, and as a program, the computer functions.
また、上記プログラムにおいて、コンピュータを、前記手動情報を前記対話エンジンに出力する手動情報出力部としてさらに機能させ、ものとして、コンピュータを機能させるプログラムであることは好適である。 Further, in the above program, it is preferable that the computer further functions as a manual information output unit that outputs the manual information to the dialogue engine, and as a program, the computer functions.
(実施の形態4)
本実施の形態において、スタンドアロンの対話装置8について説明する。ここでは、対話装置8は、通常、2以上の対話エンジン3を有する。また、対話装置8は、例えば、対話システムAのユーザ端末1、対話制御装置2、対話エンジン3を有する。ただし、ここでの対話装置8は、管理端末7は含まず、管理端末7と通信を行う。
(Embodiment 4)
In the present embodiment, the stand-
図22は、本実施の形態における対話装置8のブロック図である。
FIG. 22 is a block diagram of the
対話装置8は、受付部81、発話情報出力部82、自動応答受付部83、手動応答受付部84、応答出力部85、および1以上の対話エンジン3を備える。
The
受付部81は、ユーザが入力した発話に対応するユーザ発話情報を受け付ける。なお、受付部81は、発話を受け付け、当該発話からユーザ発話情報を構成しても良い。また、ここでの受け付けは、音声データであるユーザ発話情報の受け付けでも良いし、テキストのユーザ発話情報の受け付けでも良い。ここで、受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。
The
ユーザ発話情報の入力手段は、キーボードやマウスやメニュー画面によるもの等、何でも良い。受付部81は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
The input means of the user utterance information may be any means such as a keyboard, a mouse, and a menu screen. The
発話情報出力部82は、ユーザ発話情報に関する発話情報を、2以上の対話エンジン3または画面のうちの少なくともどちらか一方に出力する。ここでの出力とは、発話情報の引き渡しを行われれば良い。なお、画面への出力とは、管理端末7の画面への出力でも良い。
The utterance
発話情報出力部82は、通常、MPUやメモリ等から実現され得る。発話情報出力部82の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。発話情報出力部82は、無線または有線の通信手段で実現されても良い。
The utterance
自動応答受付部83は、発話情報の1以上の対話エンジン3への出力に応じて、1以上の対話エンジン3からの応答である自動応答情報を受け付ける。自動応答受付部83は、複数の自動応答情報から一の自動応答情報を選択する選択部231、または複数の対話エンジンから一の対話エンジンを選択する選択部431の機能を有する。
The automatic
手動応答受付部84は、発話情報の画面への出力に応じて、管理者からの応答である手動応答情報を受け付ける。ここでの受け付けは、管理端末7からの受信でも良い。
The manual
手動応答受付部84は、例えば、無線または有線のネットワークの受信手段等で実現され得る。
The manual
応答出力部85は、自動応答情報に関する自動情報または手動応答情報に関する手動情報を出力する。ここでの出力は、ユーザに対する出力であり、例えば、音声出力、またはディスプレイへの表示である。
The
応答出力部85は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。応答出力部85は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
The
次に、対話装置8の動作について、図23のフローチャートを用いて説明する。図23のフローチャートにおいて、図4、図11のフローチャートと同一のステップについて、説明を省略する。
Next, the operation of the
(ステップS2301)受付部81は、ユーザ発話情報を受け付けたか否かを判断する。ユーザ発話情報を受け付けた場合はステップS402に行き、受け付けない場合はステップS419に行く。なお、本ステップにおいて、受付部81は、ユーザからの発話を受け付け、当該発話からユーザ発話情報を構成しても良い。かかる処理も、ユーザ発話情報の受け付けである。
(Step S2301) The
(ステップS2302)自動応答受付部83は、対話エンジン3を動作させるか否かを判断する。対話エンジン3を動作させる場合はステップS2303に行き、対話エンジン3を動作させない場合はステップS2304に行く。なお、自動応答受付部53は、例えば、格納部51のモード情報が自動モードである場合、対話エンジン3を動作させると判断する。また、対話エンジン3を動作させる場合、自動応答受付部83は、複数の対話エンジン3を動作させても良いし、選択した一の対話エンジン3を動作させても良い。対話エンジン3を選択する処理は上述した。
(Step S2302) The automatic
(ステップS2303)自動応答受付部53は、一の対話エンジン3の出力である自動応答情報を取得する。なお、自動応答受付部83が複数の対話エンジン3を動作させた場合、通常、2以上の自動応答情報から一の自動応答情報を選択する。一の自動応答情報を選択する処理は上述した。
(Step S2303) The automatic
(ステップS2304)手動応答受付部84は、管理者の入力に対応する手動応答情報を取得する。なお、例えば、モード情報が手動モードである場合、手動応答受付部84は、手動応答情報を取得できるまでウエイトする。
(Step S2304) The manual
(ステップS2305)応答出力部85は、自動情報を画面に出力するか否かを判断する。画面に出力する場合はステップS2306に行き、出力しない場合はステップS2307に行く。なお、例えば、自動情報を画面に出力するか否かを示すフラグが格納部51で管理されており、応答出力部85は、かかるフラグを格納部80から読み出し、判断する。また、応答出力部85は、常に、自動情報を画面に出力しても良いし、常に、自動情報を画面に出力しなくても良い。また、本ステップの処理は、応答出力部85が行ったが、図示しない判断手段が行っても良い。
(Step S2305) The
(ステップS2306)応答出力部85は、自動情報を画面に出力する。
(Step S2306) The
(ステップS2307)図示しない処理部は、手動情報を対話エンジン3に出力するか否かを判断する。対話エンジン3に出力する場合はステップS2308に行き、出力しない場合はステップS2309に行く。なお、例えば、手動情報を対話エンジン3に出力するか否かを示すフラグが格納部80で管理されており、処理部23は、かかるフラグを格納部21から読み出し、判断する。また、処理部23は、常に、手動情報を対話エンジン3に出力しても良いし、常に、手動情報を対話エンジン3に出力しなくても良い。
(Step S2307) A processing unit (not shown) determines whether or not to output manual information to the
(ステップS2308)図示しない処理部は、取得された手動情報を対話エンジン3に出力する。
(Step S2308) A processing unit (not shown) outputs the acquired manual information to the
(ステップS2309)応答出力部8は、ユーザに出力する情報を取得する。かかる情報は、自動情報または手動情報である。また、応答出力部85は、例えば、モード情報が自動モードの場合は自動情報を取得し、手動モードの場合は手動情報を取得する。
(Step S2309) The
(ステップS2310)応答出力部85は、ステップS2309で取得した情報を出力する。
(Step S2310) The
(ステップS2311)図示しない判断部は、モード情報を変更するための条件を満たすか否かを判断する。 (Step S2311) A determination unit (not shown) determines whether or not the condition for changing the mode information is satisfied.
(ステップS2312)ステップS2311における判断結果が、条件を満たすとの判断結果である場合はステップS2312に行き、条件を満たさないとの判断結果である場合はステップS2314に行く。 (Step S2312) If the determination result in step S2311 is a determination result that the condition is satisfied, the process goes to step S2312, and if the determination result is that the condition is not satisfied, the process goes to step S2314.
(ステップS2313)図示しないモード変更部は、格納部80のモード情報を変更する。 (Step S2313) The mode changing unit (not shown) changes the mode information of the storage unit 80.
(ステップS2314)図示しない処理部は、ステップS2313における変更が、手動モードへの変更であるか否かを判断する。手動モードへの変更である場合はステップS2315に行き、手動モードへの変更でない場合はステップS2316に行く。 (Step S2314) A processing unit (not shown) determines whether or not the change in step S2313 is a change to the manual mode. If it is a change to the manual mode, it goes to step S2315, and if it is not a change to the manual mode, it goes to step S2316.
(ステップS2315)発話情報出力部82は、最新の発話情報を画面に出力する。ステップS2302に戻る。
(Step S2315) The utterance
(ステップS2316)発話情報出力部82は、最新の発話情報を各対話エンジン3に出力する。ステップS2302に戻る。
(Step S2316) The utterance
なお、図23のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。 In the flowchart of FIG. 23, the process ends when the power is turned off or an interrupt for the end of the process occurs.
以上、本実施の形態によれば、1または2以上の対話エンジン3からの応答と管理者からの応答とを使い分けて、ユーザに対して出力することにより、適切な対話を継続できる。
As described above, according to the present embodiment, an appropriate dialogue can be continued by properly using the response from one or two or
なお、本実施の形態において、対話装置8は、管理端末7と通信した。しかし、対話装置8は、ユーザ端末1と通信しても良い。かかる場合、対話装置8は、管理端末7を具備しても良い。
In the present embodiment, the
さらに、本実施の形態における対話装置8を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、2以上の対話エンジンから、ユーザの発話に対応する応答である自動応答情報を受け付け得る対話装置を実現するプログラムであって、コンピュータを、前記ユーザ発話情報に対応する情報である発話情報を、1以上の対話エンジンに対して出力し得る発話情報出力部と、前記発話情報の出力に応じて、前記1以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、前記自動応答受付部が受け付けた1以上の自動応答情報のうちの一の自動応答情報に対応する一の自動情報を前記ユーザ端末に出力する応答出力部として機能させるためのプログラムである。
Further, the software that realizes the
上記プログラムにおいて、前記発話情報出力部は、前記ユーザ発話情報に関する発話情報を、1以上の対話エンジンまたは画面のうちの少なくともどちらか一方に出力し、前記発話情報の前記画面への出力に応じて、管理者からの応答である手動応答情報を受け付ける手動応答受付部をさらに具備し、前記応答出力部は、前記自動応答情報に関する自動情報または前記手動応答情報に関する手動情報を出力するものとして、コンピュータを機能させるプログラムであることは好適である。 In the above program, the utterance information output unit outputs utterance information related to the user utterance information to at least one of one or more dialogue engines or screens, and responds to the output of the utterance information to the screen. The computer further includes a manual response receiving unit that receives manual response information that is a response from the administrator, and the response output unit outputs automatic information about the automatic response information or manual information about the manual response information. It is preferable that the program is to function.
また、図24は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の対話制御装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図24は、このコンピュータシステム300の概観図であり、図25は、システム300のブロック図である。
Further, FIG. 24 shows the appearance of a computer that executes the program described in the present specification to realize the dialogue control device and the like of the various embodiments described above. The embodiments described above may be implemented in computer hardware and computer programs running on it. FIG. 24 is an overview view of the
図24において、コンピュータシステム300は、CD−ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。
In FIG. 24, the
図25において、コンピュータ301は、CD−ROMドライブ3012に加えて、MPU3013と、CD−ROMドライブ3012等に接続されたバス3014と、ブートアッププログラム等のプログラムを記憶するためのROM3015と、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3017とを含む。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
In FIG. 25, in addition to the CD-
コンピュータシステム300に、上述した実施の形態の対話制御装置等の機能を実行させるプログラムは、CD−ROM3101に記憶されて、CD−ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD−ROM3101またはネットワークから直接、ロードされても良い。
A program for causing the
プログラムは、コンピュータ301に、上述した実施の形態の対話制御装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
The program does not necessarily include an operating system (OS) that causes the
なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。 In the above program, in the step of transmitting information and the step of receiving information, processing performed by hardware, for example, processing performed by a modem or interface card in the transmission step (performed only by hardware). Processing) is not included.
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。 Further, the number of computers that execute the above program may be singular or plural. That is, centralized processing may be performed, or distributed processing may be performed.
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。 Further, it goes without saying that in each of the above embodiments, the two or more communication means existing in one device may be physically realized by one medium.
また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。 Further, in each of the above-described embodiments, each process may be realized by centralized processing by a single device, or may be realized by distributed processing by a plurality of devices.
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。 It goes without saying that the present invention is not limited to the above embodiments, and various modifications can be made, and these are also included in the scope of the present invention.
以上のように、本発明にかかる対話制御装置は、複数の対話エンジンを効果的に用いて、適切な対話を継続させることができるという効果を有し、対話制御装置等として有用である。 As described above, the dialogue control device according to the present invention has an effect that an appropriate dialogue can be continued by effectively using a plurality of dialogue engines, and is useful as a dialogue control device or the like.
1 ユーザ端末
2、4、5、6 対話制御装置
3、6 対話エンジン
7 管理端末
8 対話装置
11 ユーザ受付部
12 ユーザ処理部
13 ユーザ送信部
14 ユーザ受信部
15 ユーザ出力部
21、41、51、80 格納部
22 受信部
23、43、53 処理部
24、54 出力部
25、55、81 受付部
26、56 送信部
31、61 学習情報格納部
32、62 発話受付部
33、63 応答取得部
34、64、85 応答出力部
35、65 学習受付部
36、66 学習部
51、211、511 モード格納部
53、83、251、551 自動応答受付部
70 管理格納部
71 管理情報受付部
72 管理処理部
73 管理者出力部
74 管理指示受付部
75 管理出力部
82、241、541 発話情報出力部
84、552 手動応答受付部
231、431、534 選択部
242、542 自動情報出力部
242 自動応答情報出力部
261、561 応答送信部
531 決定部
532 判断部
533 モード変更部
543 手動情報出力部
552 手動情報受付部
553 変更指示受付部
1
Claims (19)
前記ユーザ発話情報に対応する情報である発話情報を、2以上の対話エンジンに対して出力し得る発話情報出力部と、
前記発話情報の出力に応じて、前記2以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた2以上の自動応答情報のうちの一の自動応答情報を選択する選択部と、
前記選択部が選択した前記一の自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信部とを具備し、
前記受信部、前記発話情報出力部、前記自動応答受付部、前記選択部、および前記応答送信部の処理を2回以上繰り返すことにより、前記ユーザとの対話を継続するための対話制御を行う、対話制御装置。 A receiver that receives user utterance information corresponding to the user's utterance from the user terminal,
An utterance information output unit capable of outputting utterance information, which is information corresponding to the user utterance information, to two or more dialogue engines, and an utterance information output unit.
An automatic response reception unit that receives automatic response information from each of the two or more dialogue engines according to the output of the utterance information, and an automatic response reception unit.
A selection unit that selects one of the two or more automatic response information received by the automatic response reception unit, and a selection unit.
It includes a response transmission unit that transmits one automatic information corresponding to the one automatic response information selected by the selection unit to the user terminal.
By repeating the processes of the receiving unit, the utterance information output unit, the automatic response receiving unit, the selecting unit, and the response transmitting unit two or more times, dialogue control for continuing the dialogue with the user is performed. Dialogue control device.
前記2以上の自動応答情報から、予め決められた条件に合致する一の自動応答情報を選択する請求項1記載の対話制御装置。 The selection unit
The dialogue control device according to claim 1, wherein one automatic response information that matches a predetermined condition is selected from the two or more automatic response information.
前記選択部は、
前記2以上の自動応答情報のうちの予め決められた条件を満たす自動応答情報の中で、前記優先度情報に基づく優先度が最も高い対話エンジンから出力された自動応答情報を選択する請求項1または請求項2記載の対話制御装置。 Further, a storage unit for storing priority information indicating the priority of the two or more dialogue engines is provided.
The selection unit
Claim 1 for selecting the automatic response information output from the dialogue engine having the highest priority based on the priority information, among the automatic response information satisfying a predetermined condition among the two or more automatic response information. Alternatively, the dialogue control device according to claim 2.
前記ユーザ発話情報を用いて、2以上の対話エンジンから一の対話エンジンを選択する選択部と、
前記ユーザ発話情報に対応する情報である発話情報を、前記選択部が選択した一の対話エンジンに出力する発話情報出力部と、
前記発話情報の出力に応じて、前記一の対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信部とを具備し、
前記受信部、前記選択部、前記発話情報出力部、前記発話情報出力部、および前記応答送信部の処理を2回以上繰り返すことにより、前記ユーザとの対話を継続するための対話制御を行う、対話制御装置。 A receiver that receives user utterance information corresponding to the user's utterance from the user terminal,
A selection unit that selects one dialogue engine from two or more dialogue engines using the user utterance information, and
An utterance information output unit that outputs utterance information, which is information corresponding to the user utterance information, to one dialogue engine selected by the selection unit.
An automatic response reception unit that receives automatic response information from the one dialogue engine in response to the output of the utterance information, and an automatic response reception unit.
It is provided with a response transmission unit that transmits one automatic information corresponding to the automatic response information received by the automatic response reception unit to the user terminal.
By repeating the processes of the receiving unit, the selection unit, the utterance information output unit, the utterance information output unit, and the response transmission unit two or more times, dialogue control for continuing the dialogue with the user is performed. Dialogue control device.
前記発話情報を管理端末に対しても出力可能であり、
前記発話情報の前記管理端末への出力に応じて、前記管理端末からの応答である手動応答情報を受け付ける手動応答受付部をさらに具備し、
前記応答送信部は、
前記一の自動応答情報に対応する情報である一の自動情報または前記手動応答情報に対応
する情報である手動情報を前記ユーザ端末に送信する請求項1から請求項4いずれか一項に記載の対話制御装置。 The utterance information output unit
The utterance information can also be output to the management terminal,
A manual response receiving unit that receives manual response information, which is a response from the management terminal, is further provided in response to the output of the utterance information to the management terminal.
The response transmitter is
The item according to any one of claims 1 to 4, wherein the one automatic information which is the information corresponding to the one automatic response information or the manual information which is the information corresponding to the manual response information is transmitted to the user terminal. Dialogue control device.
前記応答送信部は、
前記決定が対話エンジンを採用するとの決定の場合は、前記一の自動情報を前記ユーザ端末に送信し、前記決定が管理端末を採用するとの決定の場合は、前記手動情報を前記ユーザ端末に送信する請求項5載の対話制御装置。 It also has a decision-making unit that decides whether to adopt a dialogue engine or a management terminal.
The response transmitter is
If the decision decides to adopt the dialogue engine, the one automatic information is transmitted to the user terminal, and if the decision decides to adopt the management terminal, the manual information is transmitted to the user terminal. 5. The dialogue control device according to claim 5.
モード情報を変更するための予め決められた条件を満たすか否かを判断する判断部と、
前記判断部が予め決められた条件を満たすと判断した場合に、前記モード情報を変更するモード変更部とをさらに具備し、
前記決定部は、
前記モード格納部のモード情報を取得する請求項6記載の対話制御装置。 A mode storage unit that stores at least possible mode information, either an automatic mode that employs a dialogue engine or a manual mode that employs a management terminal.
A judgment unit that determines whether or not a predetermined condition for changing the mode information is satisfied, and
When the determination unit determines that a predetermined condition is satisfied, the mode change unit for changing the mode information is further provided.
The decision unit
The dialogue control device according to claim 6, wherein the mode information of the mode storage unit is acquired.
管理端末からモードの変更の指示である変更指示を受け付ける変更指示受付部と、
前記変更指示に応じて、前記モード格納部のモード情報を変更するモード変更部とをさらに具備し、
前記決定部は、
前記モード格納部のモード情報に従って、対話エンジンを採用するか、管理端末を採用するかを決定する請求項6記載の対話制御装置。 A mode storage unit that stores at least possible mode information, either an automatic mode that employs a dialogue engine or a manual mode that employs a management terminal.
A change instruction reception unit that accepts change instructions that are mode change instructions from the management terminal,
Further provided with a mode change unit that changes the mode information of the mode storage unit in response to the change instruction.
The decision unit
The dialogue control device according to claim 6, wherein the dialogue control device determines whether to adopt a dialogue engine or a management terminal according to the mode information of the mode storage unit.
請求項1から請求項10いずれか一項に記載の対話制御装置から発話情報を受け付ける発話受付部と、
前記発話受付部が受け付けた発話情報に対応する応答である自動応答情報を、前記学習情報を用いて取得する応答取得部と、
前記応答取得部が取得した自動応答情報を前記対話制御装置に出力する応答出力部と、
他の対話エンジンからの応答である他自動応答情報を受け付ける学習受付部と、
前記学習受付部が受け付けた他自動応答情報を用いて、前記学習情報に情報を付加する学習部とを具備する対話エンジン。 A learning information storage unit that stores learning information, which is information for acquiring automatic response information corresponding to utterance information, and
An utterance receiving unit that receives utterance information from the dialogue control device according to any one of claims 1 to 10.
A response acquisition unit that acquires automatic response information, which is a response corresponding to the utterance information received by the utterance reception unit, using the learning information.
A response output unit that outputs the automatic response information acquired by the response acquisition unit to the dialogue control device, and a response output unit.
A learning reception unit that accepts other automatic response information that is a response from another dialogue engine,
A dialogue engine including a learning unit that adds information to the learning information by using other automatic response information received by the learning reception unit.
前記ユーザ発話情報に対応する情報である発話情報を、2以上の対話エンジンに対して出力し得る発話情報出力部と、
前記発話情報の出力に応じて、前記2以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた2以上の自動応答情報のうちの一の自動応答情報を選択する選択部と、
前記選択部が選択した前記一の自動応答情報に対応する一の自動情報に対応する一の自動情報を出力する応答出力部とを具備し、
前記受付部、前記発話情報出力部、前記自動応答受付部、前記選択部、および前記応答出力部の処理を2回以上繰り返すことにより、前記ユーザとの対話を行う、対話装置。 A reception unit that accepts user utterance information corresponding to the user's utterance,
An utterance information output unit capable of outputting utterance information, which is information corresponding to the user utterance information, to two or more dialogue engines, and an utterance information output unit.
An automatic response reception unit that receives automatic response information from each of the two or more dialogue engines according to the output of the utterance information, and an automatic response reception unit.
A selection unit that selects one of the two or more automatic response information received by the automatic response reception unit, and a selection unit.
It is provided with a response output unit that outputs one automatic information corresponding to the one automatic information corresponding to the one automatic response information selected by the selection unit.
A dialogue device that interacts with the user by repeating the processes of the reception unit, the utterance information output unit, the automatic response reception unit, the selection unit, and the response output unit two or more times.
前記ユーザ発話情報を用いて、2以上の対話エンジンから一の対話エンジンを選択する選択部と、
前記ユーザ発話情報に対応する情報である発話情報を、前記選択部が選択した一の対話エンジンに出力する発話情報出力部と、
前記発話情報の出力に応じて、前記一の対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた自動応答情報に対応する一の自動情報を出力する応答出力部とを具備し、
前記受付部、前記選択部、前記発話情報出力部、前記自動応答受付部、および前記応答出力部の処理を2回以上繰り返すことにより、前記ユーザとの対話を行う、対話装置。 A reception unit that accepts user utterance information corresponding to the user's utterance,
Using the user utterance information, a selection unit for selecting one of the dialog engine from two or more dialog engine,
The information der Ru speech information corresponding to the user utterance information, the utterance information output unit that outputs one of the dialog engine, wherein the selecting unit selects,
An automatic response reception unit that receives automatic response information from the one dialogue engine in response to the output of the utterance information, and an automatic response reception unit.
It is provided with a response output unit that outputs one automatic information corresponding to the automatic response information received by the automatic response reception unit.
A dialogue device that interacts with the user by repeating the processes of the reception unit, the selection unit, the utterance information output unit, the automatic response reception unit, and the response output unit two or more times.
前記受信部が、ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信ステップと、
前記発話情報出力部が、前記ユーザ発話情報に対応する情報である発話情報を、2以上の対話エンジンに対して出力し得る発話情報出力ステップと、
前記自動応答受付部が、前記発話情報の出力に応じて、前記2以上の各対話エンジンから自動応答情報を受け付ける自動応答受付ステップと、
前記選択部が、前記自動応答受付ステップで受け付けられた2以上の自動応答情報のうちの一の自動応答情報を選択する選択ステップと、
前記応答送信部が、前記選択ステップで選択された前記一の自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信ステップとを具備し、
前記受信ステップ、前記発話情報出力ステップ、前記自動応答受付ステップ、前記選択ステップ、および前記応答送信ステップを2回以上繰り返すことにより、前記ユーザとの対話を継続するための対話制御を行う、対話制御方法。 It is a dialogue control method realized by a receiving unit, an utterance information output unit, an automatic response receiving unit, a selection unit, and a response transmitting unit.
A reception step in which the receiving unit receives user utterance information corresponding to the user's utterance from the user terminal, and
An utterance information output step in which the utterance information output unit can output utterance information, which is information corresponding to the user utterance information, to two or more dialogue engines.
An automatic response reception step in which the automatic response reception unit receives automatic response information from each of the two or more dialogue engines in response to the output of the utterance information.
A selection step in which the selection unit selects one of the two or more automatic response information received in the automatic response reception step.
The response transmission unit includes a response transmission step of transmitting one automatic information corresponding to the one automatic response information selected in the selection step to the user terminal.
Dialogue control for continuing dialogue with the user by repeating the reception step, the utterance information output step, the automatic response reception step, the selection step, and the response transmission step two or more times. Method.
前記受信部が、ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信ステップと、
前記選択部が、前記ユーザ発話情報を用いて、2以上の対話エンジンから一の対話エンジンを選択する選択ステップと、
前記発話情報出力部が、前記ユーザ発話情報に対応する情報である発話情報を、前記選択部が選択した一の対話エンジンに出力する発話情報出力ステップと、
前記自動応答受付部が、前記発話情報の出力に応じて、前記選択ステップで選択された一の対話エンジンから自動応答情報を受け付ける自動応答受付ステップと、
前記応答送信部が、前記自動応答受付ステップで受け付けられた自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信ステップとを具備し、
前記受信ステップ、前記選択ステップ、前記発話情報出力ステップ、前記自動応答受付ステップ、および前記応答送信ステップを2回以上繰り返すことにより、前記ユーザとの対話を継続するための対話制御を行う、対話制御方法。 It is a dialogue control method realized by a receiving unit, a selection unit, an utterance information output unit, an automatic response receiving unit, and a response transmitting unit.
A reception step in which the receiving unit receives user utterance information corresponding to the user's utterance from the user terminal, and
The selection unit includes a selection step of using said user's utterance information, selects one interactive engine from two or more dialog engine,
The utterance information output unit, the information der Ru speech information corresponding to the user utterance information, the utterance information output step of outputting to an interactive engine in which the selecting unit selects,
An automatic response reception step in which the automatic response reception unit receives automatic response information from one dialogue engine selected in the selection step in response to the output of the utterance information.
The response transmission unit includes a response transmission step of transmitting one automatic information corresponding to the automatic response information received in the automatic response reception step to the user terminal.
Dialogue control for continuing dialogue with the user by repeating the reception step, the selection step, the utterance information output step, the automatic response reception step, and the response transmission step two or more times. Method.
ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信部と、
前記ユーザ発話情報に対応する情報である発話情報を、2以上の対話エンジンに対して出力し得る発話情報出力部と、
前記発話情報の出力に応じて、前記2以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた2以上の自動応答情報のうちの一の自動応答情報を選択する選択部と、
前記選択部が選択した前記一の自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信部として機能させるためのプログラムであって、
前記受信部、前記発話情報出力部、前記自動応答受付部、前記選択部、および前記応答送信部の処理を2回以上繰り返すことにより、前記ユーザとの対話を継続するための対話制御を行う、プログラム。 Computer,
A receiver that receives user utterance information corresponding to the user's utterance from the user terminal,
An utterance information output unit capable of outputting utterance information, which is information corresponding to the user utterance information, to two or more dialogue engines, and an utterance information output unit.
An automatic response reception unit that receives automatic response information from each of the two or more dialogue engines according to the output of the utterance information, and an automatic response reception unit.
A selection unit that selects one of the two or more automatic response information received by the automatic response reception unit, and a selection unit.
A program for functioning as a response transmission unit that transmits one automatic information corresponding to the one automatic response information selected by the selection unit to the user terminal.
By repeating the processes of the receiving unit, the utterance information output unit, the automatic response receiving unit, the selecting unit, and the response transmitting unit two or more times, dialogue control for continuing the dialogue with the user is performed. program.
ユーザの発話に対応するユーザ発話情報をユーザ端末から受信する受信部と、
前記ユーザ発話情報を用いて、2以上の対話エンジンから一の対話エンジンを選択する選択部と、
前記ユーザ発話情報に対応する情報である発話情報を、前記選択部が選択した一の対話エンジンに出力する発話情報出力部と、
前記発話情報の出力に応じて、前記一の対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた自動応答情報に対応する一の自動情報を前記ユーザ端末に送信する応答送信部として機能させ、
前記受信部、前記選択部、前記発話情報出力部、前記自動応答受付部、および前記応答送信部の処理を2回以上繰り返すことにより、前記ユーザとの対話を継続するための対話制御を行う、プログラム。 Computer,
A receiver that receives user utterance information corresponding to the user's utterance from the user terminal,
Using the user utterance information, a selection unit for selecting one of the dialog engine from two or more dialog engine,
The information der Ru speech information corresponding to the user utterance information, the utterance information output unit that outputs one of the dialog engine, wherein the selecting unit selects,
An automatic response reception unit that receives automatic response information from the one dialogue engine in response to the output of the utterance information, and an automatic response reception unit.
It functions as a response transmission unit that transmits one automatic information corresponding to the automatic response information received by the automatic response reception unit to the user terminal.
By repeating the processes of the receiving unit, the selecting unit, the utterance information output unit, the automatic response receiving unit, and the response transmitting unit two or more times, dialogue control for continuing the dialogue with the user is performed. program.
ユーザの発話に対応するユーザ発話情報を受け付ける受付部と、
前記ユーザ発話情報に対応する情報である発話情報を、2以上の対話エンジンに対して出力し得る発話情報出力部と、
前記発話情報の出力に応じて、前記2以上の各対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた2以上の自動応答情報のうちの一の自動応答情報を選択する選択部と、
前記選択部が選択した前記一の自動応答情報に対応する一の自動情報に対応する一の自動情報を出力する応答出力部として機能させ、
前記受付部、前記発話情報出力部、前記自動応答受付部、前記選択部、および前記応答出力部の処理を2回以上繰り返すことにより、前記ユーザとの対話を行う、プログラム。 Computer,
A reception unit that accepts user utterance information corresponding to the user's utterance,
An utterance information output unit capable of outputting utterance information, which is information corresponding to the user utterance information, to two or more dialogue engines, and an utterance information output unit.
An automatic response reception unit that receives automatic response information from each of the two or more dialogue engines according to the output of the utterance information, and an automatic response reception unit.
A selection unit that selects one of the two or more automatic response information received by the automatic response reception unit, and a selection unit.
It is made to function as a response output unit that outputs one automatic information corresponding to one automatic information corresponding to the one automatic response information selected by the selection unit.
A program that interacts with the user by repeating the processes of the reception unit, the utterance information output unit, the automatic response reception unit, the selection unit, and the response output unit two or more times.
ユーザの発話に対応するユーザ発話情報を受け付ける受付部と、
前記ユーザ発話情報を用いて、2以上の対話エンジンから一の対話エンジンを選択する選択部と、
前記ユーザ発話情報に対応する情報である発話情報を、前記選択部が選択した一の対話エンジンに出力する発話情報出力部と、
前記発話情報の出力に応じて、前記一の対話エンジンから自動応答情報を受け付ける自動応答受付部と、
前記自動応答受付部が受け付けた自動応答情報に対応する一の自動情報を出力する応答出力部として機能させ、
前記受付部、前記選択部、前記発話情報出力部、前記自動応答受付部、および前記応答出力部の処理を2回以上繰り返すことにより、前記ユーザとの対話を行う、プログラム。 Computer,
A reception unit that accepts user utterance information corresponding to the user's utterance,
Using the user utterance information, a selection unit for selecting one of the dialog engine from two or more dialog engine,
The information der Ru speech information corresponding to the user utterance information, the utterance information output unit that outputs one of the dialog engine, wherein the selecting unit selects,
An automatic response reception unit that receives automatic response information from the one dialogue engine in response to the output of the utterance information, and an automatic response reception unit.
It functions as a response output unit that outputs one automatic information corresponding to the automatic response information received by the automatic response reception unit.
A program that interacts with the user by repeating the processes of the reception unit, the selection unit, the utterance information output unit, the automatic response reception unit, and the response output unit two or more times.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016172468A JP6849964B2 (en) | 2016-09-05 | 2016-09-05 | Dialogue control device, dialogue engine, management terminal, dialogue device, dialogue control method, dialogue method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016172468A JP6849964B2 (en) | 2016-09-05 | 2016-09-05 | Dialogue control device, dialogue engine, management terminal, dialogue device, dialogue control method, dialogue method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018041124A JP2018041124A (en) | 2018-03-15 |
JP6849964B2 true JP6849964B2 (en) | 2021-03-31 |
Family
ID=61626134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016172468A Active JP6849964B2 (en) | 2016-09-05 | 2016-09-05 | Dialogue control device, dialogue engine, management terminal, dialogue device, dialogue control method, dialogue method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6849964B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6433614B1 (en) * | 2018-04-16 | 2018-12-05 | Jeインターナショナル株式会社 | Chatbot search system and program |
JP7063230B2 (en) * | 2018-10-25 | 2022-05-09 | トヨタ自動車株式会社 | Communication device and control program for communication device |
JP7392382B2 (en) * | 2018-11-30 | 2023-12-06 | 株式会社リコー | Information processing system, information processing device, information processing method, and information processing program |
JP6555838B1 (en) * | 2018-12-19 | 2019-08-07 | Jeインターナショナル株式会社 | Voice inquiry system, voice inquiry processing method, smart speaker operation server apparatus, chatbot portal server apparatus, and program. |
CN112329907A (en) * | 2020-12-24 | 2021-02-05 | 北京百度网讯科技有限公司 | Dialogue processing method and device, electronic equipment and storage medium |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3224999B2 (en) * | 1997-01-31 | 2001-11-05 | 株式会社東芝 | Information sharing support system |
JP4193300B2 (en) * | 1999-08-17 | 2008-12-10 | 株式会社エクォス・リサーチ | Agent device |
JP2003078625A (en) * | 2001-08-31 | 2003-03-14 | Toppan Printing Co Ltd | Method, device and program for automatic response |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
JP2005071050A (en) * | 2003-08-22 | 2005-03-17 | Nippon Hoso Kyokai <Nhk> | Information presenting system, device and program thereof |
KR100739058B1 (en) * | 2005-03-30 | 2007-07-13 | 주식회사 모비젠 | Instant Order System and Method using instant messaging, and Instant Knowledge Service System and Method using instant messaging |
US8065286B2 (en) * | 2006-01-23 | 2011-11-22 | Chacha Search, Inc. | Scalable search system using human searchers |
US8417523B2 (en) * | 2009-02-03 | 2013-04-09 | SoftHUS Sp z.o.o | Systems and methods for interactively accessing hosted services using voice communications |
JP5464295B1 (en) * | 2013-08-05 | 2014-04-09 | 富士ゼロックス株式会社 | Response device and response program |
JP6231516B2 (en) * | 2014-09-30 | 2017-11-15 | 富士フイルム株式会社 | TEAM MEDICAL SUPPORT DEVICE, TEAM MEDICAL SUPPORT DEVICE CONTROL METHOD, TEAM MEDICAL SUPPORT PROGRAM, AND TEAM MEDICAL SUPPORT SYSTEM |
-
2016
- 2016-09-05 JP JP2016172468A patent/JP6849964B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018041124A (en) | 2018-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6849964B2 (en) | Dialogue control device, dialogue engine, management terminal, dialogue device, dialogue control method, dialogue method, and program | |
US20220383864A1 (en) | Task flow identification based on user intent | |
KR102523982B1 (en) | Dynamic and/or context-specific hot words to invoke automated assistants | |
US10056078B1 (en) | Output of content based on speech-based searching and browsing requests | |
JP6819988B2 (en) | Speech interaction device, server device, speech interaction method, speech processing method and program | |
KR102030078B1 (en) | Method of and system for inferring user intent in search input in a conversαtional interaction system | |
US8935163B2 (en) | Automatic conversation system and conversation scenario editing device | |
JP3711089B2 (en) | Automatic control of home activities using speech recognition and natural language | |
KR20190028793A (en) | Human Machine Interactive Method and Device Based on Artificial Intelligence | |
US11776541B2 (en) | Communicating announcements | |
US20220414158A1 (en) | Systems and methods for generating a search query using flexible autocomplete menus | |
WO2019244455A1 (en) | Information processing device and information processing method | |
US11024303B1 (en) | Communicating announcements | |
JP2021081747A (en) | Interaction control device, interaction engine, management terminal, interaction device, and program | |
JP2014109998A (en) | Interactive apparatus and computer interactive method | |
WO2020240905A1 (en) | Audio processing device, voice pair corpus production method, and recording medium having program recorded therein | |
JP7169096B2 (en) | Dialogue system, dialogue method and program | |
JP2019046101A (en) | Interaction control device, interaction control method and interaction control program | |
RU2785950C2 (en) | Maintenance of contextual information between user interactions with voice assistant | |
JP2004144993A (en) | Unit and method for home electric appliance control, and program | |
Sun | A speech-enabled system for website bookmarking | |
JP2009053882A (en) | Information processor, information processing method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190514 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200421 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6849964 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |