JP5897240B2 - Customer service system and conversation server - Google Patents
Customer service system and conversation server Download PDFInfo
- Publication number
- JP5897240B2 JP5897240B2 JP2009150146A JP2009150146A JP5897240B2 JP 5897240 B2 JP5897240 B2 JP 5897240B2 JP 2009150146 A JP2009150146 A JP 2009150146A JP 2009150146 A JP2009150146 A JP 2009150146A JP 5897240 B2 JP5897240 B2 JP 5897240B2
- Authority
- JP
- Japan
- Prior art keywords
- conversation
- sentence
- answer
- unit
- plan
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 122
- 238000000034 method Methods 0.000 claims description 60
- 230000008569 process Effects 0.000 claims description 56
- 230000004044 response Effects 0.000 claims description 56
- 238000010586 diagram Methods 0.000 description 57
- 230000006870 function Effects 0.000 description 40
- 230000007704 transition Effects 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 13
- 230000009471 action Effects 0.000 description 11
- 230000010365 information processing Effects 0.000 description 11
- 239000000203 mixture Substances 0.000 description 10
- 241000533293 Sesbania emerus Species 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 235000020289 caffè mocha Nutrition 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Description
本発明は、顧客対応システムに関し、より詳しくはユーザの発話に応答する回答を自動的に出力して、ユーザとの会話を成立させることが可能な装置を用いた顧客対応システムに関する。 The present invention relates to a customer service system, and more particularly to a customer service system using an apparatus that can automatically output an answer in response to a user's utterance and establish a conversation with the user.
通信ネットワーク及びネットワーク通信機器の普及発展に連れて、商品やサービスの流通もネットワークを介して行われることが拡大してゆく。これに伴い顧客対応サービス(顧客の要望に応じて回答やアドバイスを提供する役務、例えばサポートサービスなど)もネットワークを介して顧客とサービス提供者の間で行われるようになってきた。 With the spread and development of communication networks and network communication devices, the distribution of goods and services through the network will expand. Along with this, customer-facing services (services that provide answers and advice in response to customer requests, such as support services) have also been provided between customers and service providers via networks.
ネットワークを介した顧客対応サービスの一形態としてはホームページに掲載するFAQ形式のサービスやオフライン方式のEメール対応によるサービスがあったが、リアルな対応が行えないという点で満足がいかない点があった。そこで、リアル性のあるチャット方式による顧客対応サービスが提供されるようになってきた(例えば、非特許文献1)。
これは、エージェントと呼ばれるオペレータがオンラインQ&A検索システム(Talisma Knowledge Management)と呼ばれるデータベースを利用してチャット方式により顧客からの質問に対する応答などを行うサービスである。
As a form of customer service via the network, there was a service in the FAQ format posted on the homepage and a service by offline e-mail support, but there was a point that it was not satisfactory in that it could not respond realistically . Therefore, a customer service using a real chat system has been provided (for example, Non-Patent Document 1).
This is a service in which an operator called an agent responds to a question from a customer by a chat method using a database called an online Q & A search system (Talisma Knowledge Management).
ヴィタル・インフォメーション株式会社、表題"Talisma CIM Channels"、[online]、[平成21年4月30日検索]、インターネット〈URL:http://www.vitals.co.jp/solution/tcim.html〉 Vital Information, Inc., Title "Talisma CIM Channels", [online], [Search April 30, 2009], Internet <URL: http://www.vitals.co.jp/solution/tcim.html>
しかし、上記の従来の方式による顧客対応サービスは、業務毎にチャットオペレータ用のデータベースをデータベース専門家が準備し提供するコストが、従来の電話対応用のマニュアルと同程度に必要となり、ランニングコストにおける人件費の節約に関しては大きな優位性を発揮することが出来ない。 However, the customer service using the conventional method described above requires the cost of preparing and providing a database for chat operators for each business as much as the manual for telephone support, which is the same as running manual. There is no significant advantage in saving labor costs.
本発明の目的は、チャットオペレータやチャットオペレータが使用するデータベース準備のためのコストの増大を押さえながら顧客に対してリアルタイムで応答して満足を与えることが出来る顧客対応サービスを提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a customer service that can respond to a customer in real time and give satisfaction while suppressing an increase in cost for preparing a chat operator and a database used by the chat operator.
上記課題を解決するための手段として、本発明は以下の特徴を備えている。
本発明は、顧客対応システムとして提案される。
ユーザ発話を送信し、その回答文を受信する第1の手段(例えば、会話装置)と、回答処理手段とを有する顧客対応システムであって、
前記回答処理手段は、
前記第1の手段から任意のユーザ発話が送信された場合又は無言のまま一定期間が経過した場合、会話シナリオに基づいて第1の回答文を決定し、決定した第1の回答文及び当該第1の回答文に対応付けされた動作制御情報を前記第1の手段に送信する処理を、前記第1の手段から第1の特定のユーザ発話が送信されるまで繰り返し、前記第1の手段から前記第1の特定のユーザ発話が送信された場合、第2の回答文及び当該第2の回答文に対応づけされた動作制御情報を第1の手段に送信する第1の機能と、
前記第1の手段から送信された第3のユーザ発話に対して、会話シナリオに基づいて第3の回答文を決定し、決定した第3の回答文及びその第3の回答文に対応付けされた動作制御情報を前記第1の手段に送信し、前記第3のユーザ発話に対する第3の回答文が前記会話シナリオから発見できない場合にその第3のユーザ発話に対する回答を専門家に回答させるように、第3のユーザ発話を送信し、これに応じた回答内容を受信し、受信した回答内容を前記第1の手段に送信し、前記第3のユーザ発話、回答文、回答内容を記憶した会話ログを送信し、この会話ログに基づいて生成された会話シナリオを受信して記憶する第2の機能と、
ユーザ発話に対する回答文が現在のプランで対応できる場合には基本制御状態を第1の制御情報と決定して、次プラン指定情報にて指定された回答文を決定し、
ユーザ発話が現在の会話の終了を要求する場合には前記基本制御状態を第2の制御情報と決定して、会話を終了し、
ユーザ発話に対する回答文が現在のプランに対応できない場合には前記基本制御状態を第3の制御情報と決定して、前記現在のプランとは異なる他のプランから回答文を決定し、
ユーザ発話からユーザの意図が明瞭でない場合には前記基本制御状態を第4の制御情報と決定して、ユーザ発話をさらに引き出す第3の機能と、を有することを特徴としている。
As means for solving the above problems, the present invention has the following features.
The present invention is proposed as a customer service system .
Sends a User chromatography The speech, a first means for receiving the reply sentence (e.g., conversation device), a customer service system and a reply process unit,
The answer processing means includes
When an arbitrary user utterance is transmitted from the first means or when a certain period of time elapses without speech, the first answer sentence is determined based on the conversation scenario, and the determined first answer sentence and the first answer sentence The process of transmitting the operation control information associated with one answer sentence to the first means is repeated until a first specific user utterance is transmitted from the first means, and from the first means, If the first specific user utterance is transmitted, a first function of transmitting an operation control information correspondence to the second reply sentence and the second reply sentence to the first means,
For the third user utterance transmitted from the first means, a third answer sentence is determined based on a conversation scenario, and is associated with the determined third answer sentence and the third answer sentence. If the third answer sentence for the third user utterance cannot be found from the conversation scenario, the expert responds to the answer to the third user utterance. The third user utterance is transmitted, the response content corresponding thereto is received, the received response content is transmitted to the first means, and the third user utterance, the response sentence, and the response content are stored. A second function for transmitting a conversation log and receiving and storing a conversation scenario generated based on the conversation log;
If the response to the user utterance can be handled by the current plan , the basic control state is determined as the first control information, the response specified in the next plan specification information is determined,
When the user utterance requests termination of the current conversation, the basic control state is determined as the second control information, the conversation is terminated,
If an answer sentence to the user utterance cannot correspond to the current plan , the basic control state is determined as the third control information, an answer sentence is determined from another plan different from the current plan ,
When the user's intention is not clear from the user utterance, the basic control state is determined as the fourth control information, and a third function for further extracting the user utterance is provided.
本発明によれば、チャットオペレータによらずとも顧客からの問い合わせや質問などに対応できるとともに、システムが回答できない未知の質問や複雑な質問などについても対応することが可能となる。 According to the present invention, it is possible to respond to inquiries and questions from customers without depending on a chat operator, and it is also possible to respond to unknown questions and complicated questions that cannot be answered by the system.
上記顧客対応システムはさらに以下の特徴を有していても良い。
前記ユーザ発話を受信し、これに対する専門家の回答を受け付け、回答内容を前記第3の手段に送信する第4の手段(例えば、専門家側端末装置)と、前記第3の手段からユーザ発話及び前記第4の手段から送信された回答内容を含む会話ログを受信し、記憶する第5の手段(例えば、会話ログDB)と、前記第5の手段に記憶された会話ログから、ユーザ発話及びこれに回答する回答内容に基づいた会話シナリオを生成し、生成した会話シナリオを前記第3の手段に送信する第6の手段(例えば、会話シナリオ編集装置)とをさらに有するようにしても良い。
また、上記顧客対応システムはさらに以下の特徴を有していても良い。
前記第3の手段が記憶する会話シナリオの内容の一部を削除する削除手段をさらに有するようにしても良い。
また、上記顧客対応システムはさらに以下の特徴を有していても良い。
前記第3の手段が記憶する会話シナリオの一部又は全部を新たな会話シナリオで置換する置換手段をさらに有するようにしてもよい。
また、上記顧客対応システムはさらに以下の特徴を有していても良い。
前記第1の手段から任意のユーザ発話が送信された場合又は無言のまま一定期間が経過した場合、会話シナリオに基づいて第4の回答文を決定し、決定した第4の回答文及び当該第4の回答文に対応付けされた動作制御情報を前記第1の手段に送信する一方、前記第1の手段から第2の特定のユーザ発話が送信された場合、第5の回答文及び当該第5の回答文に対応づけされた動作制御情報を第1の手段に送信する第7の手段と、
前記第7の手段により前記第4の回答文及び前記第4の回答文に対応付けされた動作制御情報が前記第1の手段に送信された後、前記第1の手段から任意のユーザ発話が送信された場合又は無言のまま一定期間が経過した場合、会話シナリオに基づいて第6の回答文を決定し、決定した第6の回答文及び当該第6の回答文に対応付けされた動作制御情報を前記第1の手段に送信する一方、前記第1の手段から第3の特定のユーザ発話が送信された場合、第7の回答文及び当該第7の回答文に対応づけされた動作制御情報を第1の手段に送信する第8の手段と、
前記第8の手段により前記第6の回答文及び前記第6の回答文に対応付けされた動作制御情報が前記第1の手段に送信された後、前記第1の手段から任意のユーザ発話が送信された場合又は無言のまま一定期間が経過した場合、会話シナリオに基づいて第8の回答文を決定し、決定した第8の回答文及び当該第8の回答文に対応付けされた動作制御情報を前記第1の手段に送信する一方、前記第1の手段から第4の特定のユーザ発話が送信された場合、第9の回答文及び当該第9の回答文に対応づけされた動作制御情報を第1の手段に送信する第9の手段と、をさらに有し、
前記第7の手段は、前記第9の手段により前記第8の回答文及び前記第8の回答文に対応付けされた動作制御情報が前記第1の手段に送信された後、前記第1の手段から任意のユーザ発話が送信された場合又は無言のまま一定期間が経過した場合、会話シナリオに基づいて前記第4の回答文を決定し、決定した前記第4の回答文及び前記第4の回答文に対応付けされた動作制御情報を前記第1の手段に送信する一方、前記第1の手段から前記第2の特定のユーザ発話が送信された場合、前記第5の回答文及び前記第5の回答文に対応づけされた動作制御情報を第1の手段に送信するようにしてもよい。
The customer service system may further have the following features.
4th means (for example, expert side terminal device) which receives the said user utterance, receives the reply of the expert with respect to this, and transmits a reply content to the said 3rd means, and user utterance from the said 3rd means And the fifth means for receiving and storing the conversation log including the response content transmitted from the fourth means (for example, the conversation log DB) and the user utterance from the conversation log stored in the fifth means And a sixth scenario (for example, a conversation scenario editing device) that generates a conversation scenario based on the answer contents to be answered and transmits the generated conversation scenario to the third means. .
The customer service system may further have the following features.
You may make it further have a deletion means to delete a part of content of the conversation scenario which the said 3rd means memorize | stores.
The customer service system may further have the following features.
You may make it further have the replacement means which replaces a part or all of the conversation scenario which the said 3rd means memorize | stores with a new conversation scenario.
The customer service system may further have the following features.
When an arbitrary user utterance is transmitted from the first means or when a certain period of time elapses without speech, the fourth answer sentence is determined based on the conversation scenario, and the determined fourth answer sentence and the When the second specific user utterance is transmitted from the first means while the operation control information associated with the
After the seventh means transmits the fourth answer sentence and the operation control information associated with the fourth answer sentence to the first means, an arbitrary user utterance is sent from the first means. When a certain period of time has passed without being transmitted or when it is silent, the sixth answer sentence is determined based on the conversation scenario, and the determined sixth answer sentence and the operation control associated with the sixth answer sentence are determined When the third specific user utterance is transmitted from the first means while the information is transmitted to the first means, the seventh answer sentence and the operation control associated with the seventh answer sentence An eighth means for transmitting information to the first means;
After the eighth means transmits the sixth answer sentence and the action control information associated with the sixth answer sentence to the first means, an arbitrary user utterance is sent from the first means. When a certain period of time has passed without being transmitted or when it is silent, the eighth answer sentence is determined based on the conversation scenario, and the determined eighth answer sentence and the operation control associated with the eighth answer sentence When the fourth specific user utterance is transmitted from the first means while the information is transmitted to the first means, the ninth answer sentence and the operation control associated with the ninth answer sentence And ninth means for transmitting information to the first means,
The seventh means transmits the first answer sentence and the action control information associated with the eighth answer sentence to the first means after the ninth means. When an arbitrary user utterance is transmitted from the means or when a certain period of time elapses without speech, the fourth answer sentence is determined based on a conversation scenario, and the determined fourth answer sentence and the fourth answer sentence are determined. When the second specific user utterance is transmitted from the first means while the operation control information associated with the reply sentence is transmitted to the first means, the fifth answer sentence and the first answer sentence are transmitted. The operation control information associated with the answer sentence 5 may be transmitted to the first means.
かかる発明によれば、システムが回答不能な顧客の質問などに対しても専門家の知識などを生かした回答をユーザに提供できるとともに、専門家の回答内容を会話シナリオとしてフィードバックすることにより、システムが回答できない状態の発生を暫時減少させることが可能となる。 According to this invention, it is possible to provide the user with an answer that makes use of the expert's knowledge even for a customer's question that the system cannot answer, and to feed back the answer contents of the expert as a conversation scenario. It is possible to reduce the occurrence of a state that cannot be answered for a while.
本発明によれば、チャットオペレータやチャットオペレータが使用するデータベース準備のためのコストの増大を押さえながら顧客に対してリアルタイムで応答して満足を与えることが出来る顧客対応サービスを提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the customer response service which can respond to a customer in real time and can give satisfaction can be provided, hold | suppressing the increase in the cost for database preparation which a chat operator and a chat operator use.
以下、本発明の実施の形態を、図面を参照しながら説明する。
第1の実施の形態は、予め用意された会話シナリオに基づいて、ユーザの発話などに応答して回答を出力する自動会話システム、及び会話シナリオを生成、編集する会話シナリオ編集装置として提案される。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
The first embodiment is proposed as an automatic conversation system that outputs an answer in response to a user's utterance based on a conversation scenario prepared in advance, and a conversation scenario editing apparatus that generates and edits a conversation scenario. .
[1.自動会話システム、会話シナリオ編集装置の構成例]
以下、自動会話システム、会話シナリオ編集装置の構成例について説明する。図1は、自動会話システム1の構成例を示すブロック図である。自動会話システム1は、会話装置10と、会話装置10に接続された会話サーバ20と、会話サーバ20が使用する会話シナリオを生成、編集する会話シナリオ編集装置30で構成される。
[1. Configuration example of automatic conversation system and conversation scenario editing device]
Hereinafter, configuration examples of the automatic conversation system and the conversation scenario editing apparatus will be described. FIG. 1 is a block diagram illustrating a configuration example of the
会話装置10は、ユーザが発話を入力すると、その発話内容を会話サーバ20に送信する。会話サーバ20は、発話内容を受け取ると、会話シナリオに基づいて発話内容に対する返事である回答とこの回答に対応した動作であって会話装置10に実行させる動作を記述した情報である動作制御情報を決定し、回答及び動作制御情報を会話装置10に出力する。会話シナリオ編集装置30は、会話シナリオ40を生成、編集し、生成済み、若しくは編集済みの会話シナリオを出力する。出力された会話シナリオ40は会話サーバ20に記憶される。
When the user inputs an utterance, the
以下に、上記装置のそれぞれについて詳述する。
[1.1.会話装置]
会話装置10は、ユーザの発話(ユーザ発話)を入力として取得し、この入力内容(以下、入力文と呼ぶ)を会話サーバ20に送信し、会話サーバ20から返信されてくる回答及び動作制御情報を受信し、受信内容に基づいて、回答の出力及び動作制御情報に応じた動作を実行する機能を有する。
Below, each of the said apparatus is explained in full detail.
[1.1. Conversation device]
The
会話装置10は、演算処理装置(CPU)、主メモリ(RAM)、読出し専用メモリ(ROM)、入出力装置(I/O)、必要な場合にはハードディスク装置等の外部記憶装置を具備している情報処理装置、或いはそのような情報処理装置を含む器具、おもちゃなどであって、例えばコンピュータ、携帯電話機、いわゆるインターネット家電、又はロボットなどの装置である。会話装置10の前記ROM、若しくはハードディスク装置などにプログラムが記憶されており、このプログラムを主メモリ上に載せ、CPUがこれを実行することにより会話装置が実現される。また、上記プログラムは必ずしも情報処理装置内の記憶装置に記憶されていなくともよく、外部の装置(例えば、ASP(アプリケーション・サービス・プロバイダのサーバなど))から提供され、これを主メモリに乗せる構成であってもよい。
The
図2は、会話装置10の一構成例を示すブロック図である。会話装置10は、入力部11と、入力部11に接続された会話処理部12と、会話処理部12に接続された動作制御部13と、会話処理部12及び動作制御部13に接続された出力部14とを有している。また、会話処理部12は会話サーバ20と通信可能である。
FIG. 2 is a block diagram illustrating a configuration example of the
入力部11は、ユーザの発話内容(入力文)を受け取り、これを電気信号など会話処理部12が処理可能な信号に変換して渡す機能を有する。入力部11は、例えば、キーボード、ポインティングデバイス、タッチパネル、マイクのいずれか或いはこれらの組み合わせである。
The
会話処理部12は、入力部11から受け取った入力文を会話サーバ20に送り、入力文に応じた回答文及びその回答文に対応する動作制御情報を送信するよう、会話サーバ20に要求する。また、会話処理部12は、会話サーバ20から回答文及びその回答文に対応する動作制御情報を受信すると、回答文を出力部14に渡して出力させるとともに、動作制御情報を動作制御部13に渡す。
The
動作制御部13は、会話処理部12から渡された動作制御情報に基づいて、指定された動作を実行する。指定された動作が出力部14による表示の実行(例えば、指定された動作の再生)であれば、これを出力部14に実行させる。また、指定された動作が、会話サーバ20から取得した回答文とは別の回答文の出力(例えば、会話サーバ20から取得した回答文が「何について話しますか?」、別の回答文が「何か言ってくださいね!」)である場合には、そのような回答文を出力部14に出力させる。
The
出力部14は、回答文をユーザが了知可能な態様で出力する機能を有する。回答文をどのような態様で出力するかについては、本発明において制限はない。出力部14は、例えば、回答文を文字情報としてユーザに提供する場合には、液晶ディスプレイ装置などであり、また回答文を音声情報としてユーザに提供する場合には、人工音声生成装置及びスピーカである。
The
[1.2.会話サーバ]
会話サーバ20は、会話シナリオに基づいて発話内容に対する返事である回答とこの回答に対応した動作であって会話装置10に実行させる動作を記述した情報である動作制御情報を決定し、回答及び動作制御情報を会話装置10に出力する機能を有する装置である。
[1.2. Conversation server]
The
会話サーバ20は、演算処理装置(CPU)、主メモリ(RAM)、読出し専用メモリ(ROM)、入出力装置(I/O)、必要な場合にはハードディスク装置等の外部記憶装置を具備している情報処理装置などであって、例えばコンピュータ、ワークステーション、サーバ装置などである。会話サーバ20の前記ROM、若しくはハードディスク装置などにプログラムが記憶されており、このプログラムを主メモリ上に載せ、CPUがこれを実行することにより会話サーバが実現される。また、上記プログラムは必ずしも情報処理装置内の記憶装置に記憶されていなくともよく、外部の装置(例えば、ASP(アプリケーション・サービス・プロバイダのサーバなど))から提供され、これを主メモリに乗せる構成であってもよい。
The
会話装置10と会話サーバ20とは、有線又は無線により接続される構成でも良く、また、LAN,無線LAN,インターネットなどの通信網(複数の通信網を組み合わせても良い)を介して接続されていても良い。また、会話装置10と会話サーバ20とは、必ずしも個別独立の装置でなくとも良く、会話装置10と会話サーバ20とを同一の装置により実現する構成であっても本発明は成立する。
The
図3は、会話サーバ20の一構成例を示すブロック図である。会話サーバ20は、会話装置10と通信可能な回答処理部21と、回答処理部21に接続された意味解釈辞書部23及び会話シナリオ記憶部22とを有している。
FIG. 3 is a block diagram illustrating a configuration example of the
回答処理部21は、会話装置10から入力文を受け取り、この入力文に応じた回答文を会話シナリオ記憶部22に記憶されている会話シナリオに基づいて選択若しくは決定し、決定した回答文とこの回答文に対応づけられた動作制御情報を会話装置10に送信する。また、回答処理部21は、意味解釈辞書部23が記憶する意味解釈辞書を参照して、入力文の同意語又は同意文を取得し、この同意語又は同意文に基づいた回答文の選択若しくは決定を行う。
The
意味解釈辞書部23は、入力文に対応する回答文の言い換え(同意語による拡張など)をおこなうための意味解釈辞書を記憶する機能を有する。意味解釈辞書はシソーラスのような機能を有するデータベースに相当する。
The semantic
会話シナリオ記憶部22は、会話シナリオ編集装置30によって生成、又は編集された会話シナリオ40を記憶する機能を有する。会話シナリオ40の説明については後述する。
The conversation
[1.3.会話シナリオ編集装置]
会話シナリオ編集装置30は、前述の会話サーバ20が使用する会話シナリオを新たに生成し、又は生成済みの会話シナリオを変更し、内容を追加し、又は内容の一部削除を行って修正された会話シナリオを生成する機能を有する。
[1.3. Conversation scenario editing device]
The conversation
会話シナリオ編集装置30は、演算処理装置(CPU)、主メモリ(RAM)、読出し専用メモリ(ROM)、入出力装置(I/O)、必要な場合にはハードディスク装置等の外部記憶装置を具備している情報処理装置などであって、例えばコンピュータ、ワークステーションなどである。会話シナリオ編集装置30の前記ROM、若しくはハードディスク装置などにプログラムが記憶されており、このプログラムを主メモリ上に載せ、CPUがこれを実行することにより会話シナリオ編集装置30が実現される。また、上記プログラムは必ずしも情報処理装置内の記憶装置に記憶されていなくともよく、外部の装置(例えば、ASP(アプリケーション・サービス・プロバイダのサーバなど))から提供され、これを主メモリに乗せる構成であってもよい。
The conversation
図4は、会話シナリオ編集装置30の一構成例を示すブロック図である。会話シナリオ編集装置30は、入力部31と、入力部31に接続されたエディタ部32と、エディタ部32に接続された出力部34及び会話シナリオ保持部33とを有している。
FIG. 4 is a block diagram illustrating a configuration example of the conversation
入力部31は、ユーザの入力を受け取り、これを電気信号などエディタ部32が処理可能な信号に変換して渡す機能を有する。入力部31は、例えば、キーボード、ポインティングデバイス、タッチパネル、マイクのいずれか或いはこれらの組み合わせである。
The
出力部34は、編集中又は編集完了後の会話シナリオの内容を会話シナリオ編集装置30の使用者(オペレータ)が認識可能な態様で出力する機能を有する。出力部34は、例えば、液晶ディスプレイ装置などである。
The
エディタ部32は、入力部31から入力された内容に応じて、会話シナリオとしてのデータの生成、及びその編集(追加、変更、削除)を行う機能を有する。なお、編集中の会話シナリオの内容は出力部34に表示させることにより、オペレータが会話シナリオの内容をリアルタイムで把握できるようにしている。また、エディタ部32は、編集が完了した会話シナリオのデータを会話シナリオ保持部33に出力する。
The
また、エディタ部32は、生成されている会話シナリオにおいて適正な状態遷移関係が保たれているか否かをチェックし、違反が生じている場合にはオペレータに違反が生じていること、違反が生じている入力文又は回答文を知らせるメッセージ等を生成し、出力部に表示等させる機能を有していても良い。
In addition, the
また、エディタ部32は会話サーバ20の意味解釈辞書部23に相当する意味解釈辞書部をさらに有していても良く、エディタ部32はこの意味解釈辞書部を用いて、会話シナリオにおいて重複する意味内容の入力文又は回答文が存在する場合、これらを整理したり統合したりする、或いは整理、統合をオペレータに促す機能を有していても良い。
The
会話シナリオ保持部33は、エディタ部32から受け取った会話シナリオのデータを、後に読み取りできる態様で記憶又は保持する機能を有する。会話シナリオ保持部33に記憶された会話シナリオのデータは、必要に応じて、又は、所定のタイミングなどで会話サーバ20の会話シナリオ記憶部22に送られる。会話シナリオ保持部33から会話シナリオ記憶部22への会話シナリオの転送は、記憶媒体を経由した態様で行われても良いし、通信網、通信ケーブルを経由して行われるものであってもよい。
The conversation
[1.3.1.会話シナリオについて]
ここで、会話シナリオ40について説明する。本発明における会話シナリオは下記の特徴を有する。
[1.3.1. About conversation scenario]
Here, the
(1)回答文を「対象」とし、ユーザ発話(入力文)を「射」とする。
この特徴を備えることにより、会話シナリオが定める会話の流れを「状態遷移図」で表現することが可能となる。本発明の会話シナリオは、後述する「その他」機能を用いることにより、全ての入力文(ユーザ発話)に対応した回答文の出力が可能となる。また、後述する「タイマー」発話によりユーザの「無言」(入力無し)に対応できる(無言を射として扱える)。
(1) The answer sentence is “target”, and the user utterance (input sentence) is “shot”.
By providing this feature, it is possible to express the flow of conversation defined by the conversation scenario with a “state transition diagram”. The conversation scenario of the present invention can output answer sentences corresponding to all input sentences (user utterances) by using an “other” function described later. Moreover, it can respond to a user's "silence" (no input) by "timer" utterance mentioned later (a silence can be handled as a shoot).
図5は、会話シナリオの例を示す状態遷移図である。図中、楕円枠X1,X2,X3,X4はそれぞれ回答文であり、これらは「対象」に相当する。図中、矢印近傍に表示された文は、入力文であり、これらは「射」に相当する。図中<その他>はX1からの射「好きです」及び「嫌いです」以外の入力文を示す。図中、<timer>は、ユーザが無言のまま所定期間の経過させた状態を示す。また、「<その他>|<timer>」という表記は、<その他>又は<timer>を意味する。 FIG. 5 is a state transition diagram showing an example of a conversation scenario. In the figure, ellipse frames X1, X2, X3, and X4 are respectively answer sentences, and these correspond to “objects”. In the figure, sentences displayed in the vicinity of the arrows are input sentences, and these correspond to “shooting”. <Others> in the figure indicates input sentences other than "I like" and "I don't like" from X1. In the figure, <timer> indicates a state in which the user has allowed a predetermined period of time to remain silent. The notation “<other> | <timer>” means <other> or <timer>.
図5に示した例では、「何か食べたい」という「射」は回答文X1である「あなたはラーメンが好きですか」である「対象」に遷移させる。回答文X1の出力後、第1の射「嫌いです」が発生した場合には、回答文X4「残念!話題を変えましょう」に遷移する。一方、回答文X1の出力後、第2の射「好きです」が発生した場合には、回答文X3「じゃ、美味しい店を紹介してあげる」に遷移する。一方、回答文X1の出力後、第1及び第2の射以外の射が発生した場合又はユーザが無言のまま一定期間が経過した場合、回答文X2「ラーメンは好き?嫌い?」に遷移する。 In the example shown in FIG. 5, the “shooting” “I want to eat something” is changed to the “subject” that is the answer sentence X1 “Do you like ramen”. After the answer sentence X1 is output, when the first shooting “I hate” occurs, the process proceeds to the answer sentence X4 “Sorry! Let's change the topic”. On the other hand, after the answer sentence X1 is output, if the second shooting “I like it” occurs, the process proceeds to the answer sentence X3 “I will introduce you to a delicious restaurant”. On the other hand, after the answer sentence X1 is output, when a shot other than the first and second shots occurs, or when a certain period of time has passed without the user silently, the response sentence X2 “Do you like or dislike ramen?” .
上記図5の会話シナリオをデータとして表現すると、一例として図6のような内容となる。ここで、「X1(発話A)X2」は回答列であり、X1の回答状態は発話AによりX2の回答状態に遷移することを記述している。 When the conversation scenario of FIG. 5 is expressed as data, the contents are as shown in FIG. 6 as an example. Here, “X1 (utterance A) X2” is an answer string, and describes that the answer state of X1 is changed to the answer state of X2 by the utterance A.
(2)射には合成が定義できる
この特徴により、主シナリオから分岐するような発話を受け付けることができるようになるとともに、分岐しても元(主シナリオ)に戻すことができる。従って、会話シナリオの作成者は自らが思い描く会話の流れ「ストーリー」が構築でき、このストーリーに沿った会話を会話システムに行わせることができる。
(2) Combining can be defined for shooting. This feature makes it possible to accept an utterance that branches off from the main scenario, and to return to the original (main scenario) even after branching. Therefore, the creator of the conversation scenario can construct a conversation flow “story” envisioned by the conversation scenario, and can cause the conversation system to carry out a conversation along the story.
図7は、射の合成を含む会話シナリオの例を示した状態遷移図である。図中の記号及び表記については、図5に準じる。この例の会話シナリオでは、回答文X1「あなたはラーメンが好きですか?」の出力後、第1の射「嫌いです」が発生した場合には、回答文X3「そう?ラーメンは美味しいんだけどな」に遷移する。一方、第1の射以外の射が発生した場合又はユーザが無言のまま一定期間が経過した場合、回答文X2「本当に美味しい店を紹介してあげる」に遷移する。 FIG. 7 is a state transition diagram showing an example of a conversation scenario including a composition of shooting. The symbols and notations in the figure are the same as in FIG. In the conversation scenario in this example, if the first shot “I hate” occurs after the output of answer sentence X1 “Do you like ramen?”, Answer sentence X3 “Yes? Transition to “N”. On the other hand, when a shoot other than the first shoot occurs, or when a certain period of time has passed without the user being silent, the transition is made to an answer sentence X2 “I will introduce a really delicious shop”.
上記の回答文X3「そう?ラーメンは美味しいんだけどな」の出力後は、一つの射<その他>|<timer>のみが規定されており、いずれの入力文(ユーザ発話)又は一定期間の経過により回答文X2「本当に美味しい店を紹介してあげる」に遷移する。 After the above answer sentence X3 “So? Ramen is delicious,” only one shoot <other> | <timer> is specified, and any input sentence (user utterance) or the passage of a certain period of time Makes a transition to answer sentence X2, “I will introduce you to a really delicious restaurant”.
このような射の合成を含む会話シナリオの例を使用することを可能としているため、本発明では、相手の発話を尊重しつつ、固執したい自分の発話に導くことが可能となる。 Since it is possible to use an example of a conversation scenario including such a composition of shooting, in the present invention, it is possible to lead to the utterance of one who wants to stick while respecting the utterance of the other party.
なお、上記図7の会話シナリオを回答列として表現すると、図8のような内容となる。ここにX2はX2の引用である。引用されたX2の引用元はX2であり、形式的には、対象X1とX2との間に射「(嫌いです) X3 (<その他>|<timer>)」が定められていることに相当する。この射は、射「嫌いです」と射「<その他>|<timer>」の合成である。
(3)単位元が定義できる
本発明の会話シナリオでは、単位元が定義できる。「単位元」とは対象を遷移させない射をいう。単位元が定義できることにより、以下のことが可能となる。
When the conversation scenario of FIG. 7 is expressed as an answer string, the content is as shown in FIG. Here X2 is a quote of X2. The quoted source of X2 is X2, and it is formally equivalent to the fact that the target X1 and X2 have a `` (I hate) X3 (<other> | <timer>) '' To do. This shoot is a composition of the shoot “I hate” and the shoot “<other> | <timer>”.
(3) In the conversation scenario of the present invention in which the unit element can be defined, the unit element can be defined. “Unit element” means a shoot that does not change the target. The ability to define unit elements enables the following:
(イ) ユーザ発話に対して「強制回答」をすることができる。
図9は、強制回答を行う会話シナリオの例を示した状態遷移図である。この例では、回答文X1「私はラーメンが好きです。ラーメンこそグルメの本質」の出力時において、NULLの付いた第1の射<その他>が規定されており、どのような入力文(ユーザ発話)であっても、入力文を無視して「私はラーメンが好きです。ラーメンこそグルメの本質」の強制出力がなされる。一方、回答文X1「私はラーメンが好きです。ラーメンこそグルメの本質」の出力後、第2の射<timer>により回答文X2「本当に美味しい店を紹介してあげる」に遷移する。
(A) A “forced answer” can be made to a user utterance.
FIG. 9 is a state transition diagram illustrating an example of a conversation scenario in which a forced answer is made. In this example, when outputting the reply sentence X1 “I like ramen. Ramen is the essence of gourmet”, the first shoot <Other> with NULL is specified, and what input sentence (user Even if it is uttered), the input sentence is ignored and the forced output of "I like ramen. Ramen is the essence of gourmet." On the other hand, after output of the reply sentence X1 “I like ramen. Ramen is the essence of gourmet”, the second transition “timer” makes the transition to reply sentence X2 “I will introduce a really delicious restaurant”.
この例では、相手の発話を無視することを「NULL」と表記している。図9に示した例では、全ての発話を無視するために<その他>にNULLを付けているが、「嫌い」だけを無視するようにすることもできる。
なお、上記図9の会話シナリオを回答列として表現すると、図10のような内容となる。ここにX1はX1の引用である。引用されたX1は引用元のX1と同じ遷移先を有する。このような意味でX1とX1は同形であり、この場合の射「(<その他>)」はX1からX1への射であり、単位元である。
In this example, ignoring the other party's utterance is expressed as “NULL”. In the example shown in FIG. 9, <Others> is assigned NULL in order to ignore all utterances, but only “I hate” can be ignored.
If the conversation scenario of FIG. 9 is expressed as an answer string, the content is as shown in FIG. Here X1 is a quote of X1. The quoted X1 has the same transition destination as the quoted X1. In this sense, X1 and X1 are isomorphic. In this case, the “(<other>)” is a shot from X1 to X1, and is a unit element.
(ロ)ユーザ発話に対して「固執回答」をすることができる。
図11は、ユーザ発話に対して「固執回答」をする会話シナリオの例を示す状態遷移図である。図11の例では、回答文X1「ラーメン好き?嫌い?」の出力後、第1の射「嫌いです」が発生した場合には、回答文X3「そう?ラーメンは美味しいんだけどな」に遷移する。一方、回答文X1の出力後、第2の射「好き」が発生した場合には、回答文X2「本当に美味しい店を紹介してあげる」に遷移する。一方、回答文X1の出力後、第1及び第2の射以外の射が発生した場合又はユーザが無言のまま一定期間が経過した場合、再び回答文X1「ラーメンは好き?嫌い?」に戻る。このようにして、ユーザに「好き」か「嫌い」かの二者択一を強制的に行わせることができるようになる。
(B) A “persistent answer” can be made to the user utterance.
FIG. 11 is a state transition diagram illustrating an example of a conversation scenario in which a “sticky answer” is given to a user utterance. In the example of Fig. 11, after the response sentence X1 "I like ramen? Dislike?", If the first shot "I don't like it" occurs, it will transition to answer sentence X3 "Is that ramen delicious?" To do. On the other hand, when the second shooting “like” occurs after the answer sentence X1 is output, the process proceeds to the answer sentence X2 “I will introduce a really delicious shop”. On the other hand, after the answer sentence X1 is output, if a shot other than the first and second shots occurs, or if a certain period of time elapses while the user is silent, the answer sentence X1 returns to answer sentence X1 “Do you like ramen? . In this way, it is possible to force the user to choose between “like” or “dislike”.
なお、上記図11の会話シナリオを回答列として表現すると、図12のような内容となる。ここにX1はX1の引用である。引用されたX1は引用元のX1と同じ遷移先を有する。このような意味でX1とX1は同形であり、この場合の射「(<その他>|<timer>)」もX1からX1への射に相当するので単位元と呼ぶ。
When the conversation scenario of FIG. 11 is expressed as an answer string, the content is as shown in FIG. Here
(ハ)「合成により構成された単位元」により「閉ループ回答」が構築できる。
この特徴を備えることにより、閉じられたループの中で相手の発話を促すことが可能となる。図13は、「合成により構成された単位元」により「閉ループ回答」が構築された会話シナリオの例を示した状態遷移図である。この例では、回答文X1、X2,X3,X4によって閉ループが構築されており、この閉ループにより会話の流れをコントロールすることが可能となる。上記図13の会話シナリオを回答列として表現すると、図14のような内容となる。この場合にもX1からX1の射に相当する
(C) A “closed-loop answer” can be constructed by “unit elements configured by composition”.
By providing this feature, it is possible to prompt the other party to speak in a closed loop. FIG. 13 is a state transition diagram illustrating an example of a conversation scenario in which a “closed loop answer” is constructed by “unit elements configured by composition”. In this example, a closed loop is constructed by the answer sentences X1, X2, X3, and X4, and the conversation flow can be controlled by this closed loop. When the conversation scenario of FIG. 13 is expressed as an answer string, the content is as shown in FIG. Again, this is equivalent to X1 to X1
(<その他>|<timer>) X2 (<その他>|<timer>)
X3 (<その他>|<timer>) X4 (<その他>|<timer>)
を単位元と呼ぶ。この場合の単位元は「閉ループ」を構成している。
以上で、「項目(3)単位元が定義できる」の説明を終了する。
(<Other> | <timer>) X2 (<Other> | <timer>)
X3 (<other> | <timer>) X4 (<other> | <timer>)
Is called a unit element. The unit element in this case constitutes a “closed loop”.
This completes the description of “item (3) unit element can be defined”.
(4)射の合成には結合法則が成り立つ
この特徴により、ある射に対応する回答列Sに対して、異なる2つの経路に沿う回答列S1とS2の構築が可能であり、しかもそれらが等しいものとして扱うことができる。このとき、Sをある問題に関わる回答列とすると、S1とS2は、Sに対する異なる解釈を与える回答列であり、問題解決に関わる情報を提供している。この特徴を有するが故に、本発明にかかる会話シナリオでは、ロジカルなユーザ発話に対応することができる。
(4) Combinatorial law holds for composition of shoots This feature makes it possible to construct reply sequences S1 and S2 along two different paths for a reply sequence S corresponding to a certain shoot, and they are equal. Can be treated as a thing. At this time, if S is an answer string related to a certain problem, S1 and S2 are answer strings that give different interpretations to S and provide information related to problem solving. Because of this feature, the conversation scenario according to the present invention can deal with logical user utterances.
図15に、射の合成に結合法則が成り立つ会話シナリオの例の状態遷移図を示す。なお、上記図15の会話シナリオを回答列として表現すると、図16のような内容となる。ここに、X2、X4はそれぞれX2、X4の引用である。形式的に次式が成立する。
(ヒントは)X3(××です)X4(<その他>|<timer>)
=(××です)X4(<その他>|<timer>)
=(ヒントは)X3(<その他>|<timer>)
FIG. 15 shows a state transition diagram of an example of a conversation scenario in which a coupling law is established in the composition of the projection. When the conversation scenario of FIG. 15 is expressed as an answer string, the content is as shown in FIG. Here, X2, X4 is a citation of each X2, X4. Formally, the following equation holds.
(Hint) X3 (XX) X4 (<Other> | <timer>)
= (XX is) X4 (<other> | <timer>)
= (Hint) X3 (<Other> | <timer>)
(5)可換な図式が描ける
この特徴により、任意の対象に到着するための射が定義できる。このため、シナリオにゴールが設定できるとともに、シナリオ全体の把握ができることとなる。
(5) A commutative diagram can be drawn This feature allows you to define a shot to reach any object. For this reason, a goal can be set for the scenario and the entire scenario can be grasped.
(6)その他
本発明は、「入力文を対象とし、回答文を射として扱える談話の範囲」では「検索の仕組みが全く異なるため、「入力文を射とし、回答文を対象として扱える談話の範囲」と同様の扱いはできない。本件では、前者のような談話の範囲は扱わない。
(6) Others In the present invention, “the range of the discourse that can treat the input sentence as a target and the answer sentence can be treated as a shot” is different from the search mechanism. The same treatment as “range” is not possible. In this case, the range of discourse like the former is not dealt with.
[1.4.会話シナリオ編集装置の位置づけ]
ここで、本発明の会話シナリオ編集装置30の位置づけについてまとめる。
(1)対象と射とを有する会話シナリオに関しては、以下の特徴をあげることができる。
・回答文を対象、入力文を射とする(状態遷移)
・入力文を尊重しつつ、固執したい回答文に導く(文脈維持:合成)
・入力文とは関係なく、回答文を言い切る(強制回答:単位元)
・相手に対して必要な発話を言うまで繰り返し催促する(固執回答:単位元)
・閉じられたループの中で入力文を促す(閉ループ:単位元)
・問題解決に繋がるような会話を行う(問題解決:結合法則)
・ゴールに向かうような会話を行う(ゴールのある会話:可換な図式)
[1.4. Positioning of conversation scenario editing device]
Here, the positioning of the conversation
(1) Regarding the conversation scenario having the target and the shooting, the following characteristics can be given.
・ The answer sentence is the target and the input sentence is the target (state transition)
・ Responding to the input sentence, leading to the answer sentence you want to stick to (context maintenance: composition)
・ Respond to the answer sentence regardless of the input sentence (mandatory answer: credit)
・ Repeat until the other person speaks the required utterance (sticky answer: credit)
-Prompt input sentence in a closed loop (closed loop: unit element)
・ Conversations that lead to problem solving (Problem solving: coupling law)
・ Conversation toward the goal (conversation with goal: commutative diagram)
なお、回答列によっても上記の特徴を整理することができる。会話シナリオ編集装置30は、上記の会話シナリオの特徴を回答列で表現する機能を有したものである。
上記の会話シナリオを利用することにより、会話サーバ20は、単なる検索を行えばよい。すなわち、会話サーバは、現在の状態を、会話シナリオの対象(回答文)として把握し、利用者発話が発生した場合には、会話サーバ20は、意味解析を行いながら最適な射(入力文)を検索し、次の状態は、検索された射(入力文)に対応する対象(回答文)とする。
Note that the above characteristics can also be arranged by the answer string. The conversation
By using the above conversation scenario, the
なお、上記の会話シナリオは状態遷移図やそれに基づいたデータ(図6,8,10等)として表現するだけでなく、図17に示すような、アウトラインエディタのようなGUIを用いて生成、編集されるようにしてもかまわない。 The above conversation scenario is not only expressed as a state transition diagram and data based on it (FIGS. 6, 8, 10 etc.), but also generated and edited using a GUI such as an outline editor as shown in FIG. It doesn't matter if it is done.
[2.会話シナリオ生成装置の動作例]
次に、上記会話シナリオ編集装置30の動作例について説明する。
本実施の形態にかかる会話シナリオ編集装置30は、複数の異なる主題(会話のテーマ)についてユーザとの会話を成立させることが出来る。図18は、会話シナリオ保持部33及び会話シナリオ記憶部22(以下、単に会話シナリオ保持部33と略す)が記憶する会話シナリオのデータ構成例を示す図である。
[2. Example of conversation scenario generator]
Next, an operation example of the conversation
The conversation
会話シナリオ保持部33は、談話の圏又は主題(会話テーマ)201に対応するドメイン200ごとに個別の会話シナリオデータを持つことが出来る。例えば、「天候」ドメインと「コーヒー豆」ドメインそれぞれに関する会話シナリオデータを有することが出来、ユーザが天候に関する発話をした場合には、会話サーバ20、より詳しくは回答処理部21は、「天候」ドメインである会話シナリオデータを優先して入力文(ユーザ発話ともいう)に対応する回答文(システム発話ともいう)を探索し、ユーザ発話に応答するシステム発話を出力させる。一方、ユーザが「コーヒー豆」に関する発話をした場合には、回答処理部21は、「コーヒー豆」ドメインである会話シナリオデータを優先してユーザ発話に対応するシステム発話を探索し、ユーザ発話に応答するシステム発話を出力させる。
The conversation
各ドメイン200は、ユーザ発話文210とユーザ発話文に対する自動会話システムの回答として用意されたシステム発話文220を有している。図18に示した例では、ユーザ発話分210−1と、これに関連づけされたシステム発話220−1が記録されているともに、このシステム発話220−1に応答してユーザが発話すると想定されるユーザ発話文210−2が記録され、このユーザ発話文210−2に対する自動会話システムの回答として用意されたシステム発話文220―2が記録されている。
Each
例えば、上記の会話シナリオは以下のようなユーザとシステムの会話となる。
ユーザ発話文210−1:「いい天気ですね」
システム発話文220―1:「いい天気は好きですか?」
ユーザ発話文210−1:「はい、好きですよ」
システム発話文220―1:「雨の日は嫌いですか?」
For example, the above conversation scenario is a user-system conversation as follows.
User utterance sentence 210-1: “It ’s good weather”
System utterance 220-1: “Do you like good weather?”
User utterance sentence 210-1: “Yes, I like it”
System utterance 220-1: “Do you hate rainy days?”
図18に示した会話シナリオは最も単純な形態のものを示した。本自動会話システムが扱える会話シナリオでは、同一のシステム発話に対して、ユーザが異なる反応をしてユーザ発話を返した場合に対応できるよう、一つのシステム発話文に対して複数のユーザ発話文を用意することも可能である。 The conversation scenario shown in FIG. 18 shows the simplest form. In a conversation scenario that can be handled by this automatic conversation system, multiple user utterances can be assigned to one system utterance so that the user can respond to the same system utterance and return a user utterance. It is also possible to prepare.
会話シナリオ編集装置30は、会話シナリオ保持部33に格納させる新たなドメイン200と、そのドメイン200ユーザ発話文210、システム発話文220からなる会話シナリオデータを生成し、会話シナリオ保持部33に記憶させる機能を有する。
The conversation
[3.会話シナリオの入力例]
次に、会話シナリオの入力例について説明する。図19から図23は、あるドメイン200について会話シナリオを入力した場合の入力画面の遷移の一例を示した図である。
[3. Example of conversation scenario input]
Next, an example of inputting a conversation scenario will be described. FIG. 19 to FIG. 23 are diagrams showing an example of transition of the input screen when a conversation scenario is input for a
図19は、会話シナリオ編集装置30によって生成された入力インターフェイス画面の一例を示す。ここでは、ドメイン200が「コーヒー豆」についてのものであるとして説明する。
FIG. 19 shows an example of an input interface screen generated by the conversation
会話シナリオ編集装置30、より詳しくはエディタ部32は、入力インターフェイスとなるウインドウ300を生成し、出力部34に表示させる。ウインドウ300には表示領域301が設けられており、ユーザが入力部31を操作することによって、ユーザ発話文及びシステム発話文がここに入力される。図19の例では、ドメイン名302が表示されており、このドメイン200に格納される会話シナリオの入力を待ち受けている状態である。
The conversation
図20は、このドメイン200に格納される会話シナリオの開始であるユーザ発話文401が入力された状態の画面例である。
FIG. 20 is a screen example in a state where a
実際に自動会話が実行される場合には、会話サーバ20の回答処理部21は、ユーザ発話がここで記述されているユーザ発話文401「コーヒー豆について」と一致するか、或いはこれと同一視可能な発話内容である場合には、ユーザ発話に応答するシステム発話文を抽出するドメイン200としてドメイン名302を「コーヒー豆」とするドメイン200を会話シナリオ記憶部22から選択し、このドメイン200を優先してシステム発話文を選択することになる。
When the automatic conversation is actually executed, the
会話シナリオの入力者であるユーザは、上記ユーザ発話文401に対する回答であるシステム発話文の入力を行う。図21は、ユーザ発話文401「コーヒー豆について」についてのシステム発話文501がユーザにより入力された状態のウインドウ300の表示例を示す。この例では、「コーヒー豆について」というユーザ発話文401に対して、『味の特徴についてお答えします。「モカ」、「ブルーマウンテン」、「キリマンジャロ」のうち、どれが知りたいですか?』という問いかけであるシナリオ回答文501を自動会話システムが発する会話シナリオが記述されたものとする。
A user who is an input person of a conversation scenario inputs a system utterance sentence that is an answer to the
次に、会話シナリオの入力者であるユーザは、上記シナリオ回答文501に対して、予想されるユーザ発話文を入力する。図22は、前記のシナリオ回答文501に対して、予想されるユーザ発話文601が入力された状態のウインドウ300の表示例を示す。この例では、『味の特徴についてお答えします。「モカ」、「ブルーマウンテン」、「キリマンジャロ」のうち、どれがしりたいですか?』というシステム発話文501に対して、ユーザが「ブルーマウンテン」という回答をすると予想して、ユーザ発話文601「ブルーマウンテン」がユーザにより入力されたものとする。
Next, the user who is the input person of the conversation scenario inputs an expected user utterance sentence to the
次に、会話シナリオの入力者であるユーザは、上記ユーザ発話文601に対するシステム発話文を入力する。図23は、前記のユーザ発話文601に対するシステム発話文701が入力された状態のウインドウ300の表示例を示す。会話シナリオの入力者は、ユーザ発話文601の回答として、システム発話文701を入力する。
このような会話シナリオにより、自動会話システムはユーザがコーヒー豆のブルーマウンテンについて知りたい場合に、その回答を返すことが出来るようになる。なお、これ以降も会話シナリオの入力者は、ユーザと自動会話システムの会話が続くように、ユーザ発話文、システム発話文の入力を継続することが出来る。
Next, the user who is the input person of the conversation scenario inputs a system utterance sentence for the
Such a conversation scenario enables the automatic conversation system to return an answer when the user wants to know about the blue bean of coffee beans. Note that the input user of the conversation scenario can continue to input the user utterance sentence and the system utterance sentence so that the conversation between the user and the automatic conversation system continues.
上記のようにして入力された会話シナリオ(ユーザ発話文とシステム発話文の集合)は、エディタ部32により会話シナリオ保持部33へ書き込まれ、記憶される。この会話シナリオは会話サーバ20の会話シナリオ記憶部22に移される。なお、会話シナリオ記憶部22に移される場合に、会話サーバ20に適したものとするように会話シナリオの変換、移植を行うようにしてもよい。
The conversation scenario (a set of user utterance sentences and system utterance sentences) input as described above is written and stored in the conversation
会話サーバ20の回答処理部21は会話シナリオ記憶部22に記憶された新たな会話シナリオをも参照して、ユーザ発話に対するシナリオ回答を出力できるようになる。
The
[4.変形例]
本実施の形態は、以下のように変形されても成立する。
(1)会話シナリオ編集装置の変形例
図24に変形例にかかわる会話シナリオ編集装置30Xの機能ブロック図である。会話シナリオ編集装置30Xは、基本的に前述した会話シナリオ編集装置30と同様の構成を有しており、会話シナリオ保持部33に接続された動的知識生成部35を有している点が異なっている。なお、同一の構成要素については同一の参照符号を付し、それらの説明については省略する。
[4. Modified example]
The present embodiment is valid even if it is modified as follows.
(1) Modified Example of Conversation Scenario Editing Device FIG. 24 is a functional block diagram of a conversation scenario editing device 30X according to the modified example. The conversation scenario editing device 30X basically has the same configuration as the conversation
動的知識生成部35は、会話シナリオ保持部33に記憶される会話シナリオ40にもとづいて、動的知識40Xを生成する機能を有する。動的知識40Xは、回答列である会話シナリオ40から、会話サーバ20がより高速且つ高効率に射である入力文および、その対象である回答文を検索できるように再構成されたデータである。
The dynamic
かかる変形例によれば、会話サーバ20の処理負荷を低減させ、高速な回答文の返信を可能とすることができる。
According to such a modification, it is possible to reduce the processing load on the
[5.会話サーバの構成の別の例]
本発明にかかる会話サーバ20、回答処理部21は下記のような構成を採用しても、本発明を実現可能である。、以下、会話サーバ20,より詳しくは回答処理部21の構成例について述べる。図25は、回答処理部21の拡大ブロック図であって、会話制御部300及び文解析部400の具体的構成例を示すブロック図である。回答処理部21は、会話制御部300と、文解析部400と、会話データベース500を有している。会話データベース500は、会話シナリオ40又は、動的知識40Xを記憶する機能を有する。
[5. Another example of conversation server configuration]
Even if the
[5.1.文解析部]
次に、図25を参照しながら文解析部400の構成例について説明する。
文解析部400は、入力部100又は音声認識部200で特定された文字列を解析するものである。この文解析部400は、本実施の形態では、図25に示すように、文字列特定部410と、形態素抽出部420と、形態素データベース430と、入力種類判定部440と、発話種類データベース450とを有している。文字列特定部410は、入力部100及び音声認識部200で特定された一連の文字列を一文節毎に区切るものである。この一文節とは、文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切り文を意味する。具体的に、文字列特定部410は、一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部410は、その区切った各文字列を形態素抽出部420及び入力種類判定部440に出力する。尚、以下で説明する「文字列」は、一文節毎の文字列を意味するものとする。
[5.1. Sentence Analysis Department]
Next, a configuration example of the
The
[5.1.1.形態素抽出部]
形態素抽出部420は、文字列特定部410で区切られた一文節の文字列に基づいて、その一文節の文字列の中から、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するものである。ここで、形態素とは、本実施の形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、例えば、名詞、形容詞、動詞などの品詞が挙げられる。
[5.1.1. Morphological extraction unit]
The morpheme extraction unit 420 sets, as first morpheme information, each morpheme constituting the minimum unit of the character string from the character string of the one phrase according to the character string of the one sentence divided by the character
各形態素は、図26に示すように、本実施の形態ではm1、m2、m3…、と表現することができる。図26は、文字列とこの文字列から抽出される形態素との関係を示す図である。図26に示すように、文字列特定部410から文字列が入力された形態素抽出部420は、入力された文字列と、形態素データベース430に予め格納されている形態素群(この形態素群は、それぞれの品詞分類に属する各形態素についてその形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として用意されている)とを照合する。その照合をした形態素抽出部420は、その文字列の中から、予め記憶された形態素群のいずれかと一致する各形態素(m1、m2、…)を抽出する。この抽出された各形態素を除いた要素(n1、n2、n3…)は、例えば助動詞等が挙げられる。
As shown in FIG. 26, each morpheme can be expressed as m1, m2, m3... In the present embodiment. FIG. 26 is a diagram illustrating a relationship between a character string and a morpheme extracted from the character string. As shown in FIG. 26, the morpheme extraction unit 420 to which a character string has been input from the character
この形態素抽出部420は、抽出した各形態素を第一形態素情報として話題特定情報検索蔀320に出力する。なお、第一形態素情報は構造化されている必要はない。ここで「構造化」とは、文字列の中に含まれる形態素を品詞等に基づいて分類し配列することをいい、たとえば発話文である文字列を、「主語+目的語+述語」などの様に、所定の順番で形態素を配列してなるデータに変換することを言う。もちろん、構造化した第一形態素情報を用いたとしても、それが本実施の形態を実現をさまたげることはない。
The morpheme extraction unit 420 outputs each extracted morpheme to the topic identification
[5.1.2.入力種類判定部]
入力種類判定部440は、文字列特定部410で特定された文字列に基づいて、発話内容の種類(発話種類)を判定するものである。この発話種類は、発話内容の種類を特定する情報であって、本実施の形態では、例えば図27に示す「発話文のタイプ」を意味する。図27は、「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図である。
[5.1.2. Input type determination unit]
The input
ここで、「発話文のタイプ」は、本実施の形態では、図27に示すように、陳述文(D ; Declaration)、時間文(T ; Time)、場所文(L ; Location)、反発文(N ; Negation)などから構成される。この各タイプから構成される文は、肯定文又は質問文で構成される。「陳述文」とは、利用者の意見又は考えを示す文を意味するものである。この陳述文は本実施の形態では、図27に示すように、例えば"私は佐藤が好きです"などの文が挙げられる。「場所文」とは、場所的な概念を伴う文を意味するものである。「時間文」とは、時間的な概念を伴う文を意味するものである。「反発文」とは、陳述文を否定するときの文を意味する。「発話文のタイプ」についての例文は図27に示す通りである。 In this embodiment, as shown in FIG. 27, “spoken sentence type” is a statement sentence (D; Declaration), a time sentence (T; Time), a location sentence (L; Location), and a repulsive sentence. (N; Negation). The sentence composed of each type is composed of an affirmative sentence or a question sentence. The “declaration sentence” means a sentence indicating a user's opinion or idea. In the present embodiment, this statement includes, for example, a sentence such as “I like Sato” as shown in FIG. “Place sentence” means a sentence with a place concept. “Time sentence” means a sentence with a temporal concept. “Rebound sentence” means a sentence when a statement is denied. An example sentence for “spoken sentence type” is as shown in FIG.
入力種類判定部440が「発話文のタイプ」を判定するには、入力種類判定部440は、本実施の形態では、図28に示すように、陳述文であることを判定するための定義表現辞書、反発文であることを判定するための反発表現辞書等を用いる。具体的に、文字列特定部410から文字列が入力された入力種類判定部440は、入力された文字列に基づいて、その文字列と発話種類データベース450に格納されている各辞書とを照合する。その照合をした入力種類判定部440は、その文字列の中から、各辞書に関係する要素を抽出する。
In order for the input
この入力種類判定部440は、抽出した要素に基づいて、「発話文のタイプ」を判定する。例えば、入力種類判定部440は、ある事象について陳述している要素が文字列の中に含まれる場合には、その要素が含まれている文字列を陳述文として判定する。入力種類判定部440は、判定した「発話文のタイプ」を回答取得部380に出力する。
The input
[5.1.3.会話データベース]
次に、会話データベース500が記憶するデータのデータ構成例について図29を参照しながら説明する。図29は、会話データベース500が記憶するデータの構成例を示す概念図である。
[5.1.3. Conversation database]
Next, a data configuration example of data stored in the
会話データベース500は、図29に示すように、話題を特定するための話題特定情報810を予め複数記憶している。又、それぞれの話題特定情報810は、他の話題特定情報810と関連づけられていてもよく、例えば、図29に示す例では、話題特定情報C(810)が特定されると、この話題特定情報C(810)に関連づけられている他の話題特定情報A(810)、話題特定情報B(810),話題特定情報D(810)が定まるように記憶されている。
As shown in FIG. 29, the
具体的には、話題特定情報810は、本実施の形態では、利用者から入力されると予想される入力内容、又は利用者への回答文に関連性のある「キーワード」を意味する。
Specifically, in the present embodiment, the
話題特定情報810には、一又は複数の話題タイトル820が対応付けられて記憶されている。話題タイトル820は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成されている。各話題タイトル820には、利用者への回答文830が対応付けられて記憶されている。また、回答文830の種類を示す複数の回答種類は、回答文830に対応付けられている。
One or
次に、ある話題特定情報810と他の話題特定情報810との関連づけについて説明する。図30は、ある話題特定情報810Aと他の話題特定情報810B、810C1〜810C4、810D1〜810D3…との関連付けを示す図である。なお、以下の説明において「関連づけされて記憶される」とは、ある情報Xを読み取るとその情報Xに関連づけられている情報Yを読み取りできることをいい、例えば、情報Xのデータの中に情報Yを読み出すための情報(例えば、情報Yの格納先アドレスを示すポインタ、情報Yの格納先物理メモリアドレス、論理アドレスなど)が格納されている状態を、「情報Yが情報Xに『関連づけされて記憶され』ている」というものとする。
Next, the association between certain
図30に示す例では、話題特定情報は他の話題特定情報との間で上位概念、下位概念、同義語、対義語(本図の例では省略)が関連づけされて記憶させることができる。本図に示す例では、話題特定情報810A(=「映画」)に対する上位概念の話題特定情報として話題特定情報810B(=「娯楽」)が話題特定情報810Aに関連づけされて記憶されており、たとえば話題特定情報(「映画」)に対して上の階層に記憶される。
In the example shown in FIG. 30, topic specific information can be stored in association with other topic specific information in association with a higher concept, a lower concept, a synonym, and a synonym (omitted in the example of this figure). In the example shown in this figure,
また、話題特定情報810A(=「映画」)に対する下位概念の話題特定情報810C1(=「監督」)、話題特定情報810C2(=「主演」)、話題特定情報810C3(=「配給会社」)、話題特定情報810C4(=「上映時間」)、および話題特定情報810D1(=「七人の侍」)、話題特定情報810D2(=「乱」)、話題特定情報810D3(=「用心棒」)、…、が話題特定情報810Aに関連づけされて記憶されている。
Further, topic specific information 810C 1 (= “director”), topic specific information 810C 2 (= “starring”), topic specific information 810C 3 (= “distribution company” for the topic
又、話題特定情報810Aには、同義語900が関連付けられている。この例では、話題特定情報810Aであるキーワード「映画」の同義語として「作品」、「内容」、「シネマ」が記憶されている様子を示している。このような同意語を定めることにより、発話にはキーワード「映画」は含まれていないが「作品」、「内容」、「シネマ」が発話文等に含まれている場合に、話題特定情報810Aが発話文等に含まれているものとして取り扱うことを可能とする。
In addition, the
回答処理部21は、会話データベース500の記憶内容を参照することにより、ある話題特定情報810を特定するとその話題特定情報810に関連づけられて記憶されている他の話題特定情報810及びその話題特定情報810の話題タイトル820、回答文830などを高速で検索・抽出することが可能となる。
When the
次に、話題タイトル820(「第二形態素情報」ともいう)のデータ構成例について、図31を参照しながら説明する。図31は、話題タイトル820のデータ構成例を示す図である。
Next, a data configuration example of the topic title 820 (also referred to as “second morpheme information”) will be described with reference to FIG. FIG. 31 is a diagram illustrating a data configuration example of the
話題特定情報810D1、810D2、810D3、…はそれぞれ複数の異なる話題タイトル8201、8202、…、話題タイトル8203、8204、…、話題タイトル8205、8206、…を有している。本実施の形態では、図31に示すように、それぞれの話題タイトル820は、第一特定情報1001と、第二特定情報1002と、第三特定情報1003によって構成される情報である。ここで、第一特定情報1001は、本実施の形態では、話題を構成する主要な形態素を意味するものである。第一特定情報1001の例としては、例えば文を構成する主語が挙げられる。また、第二特定情報1002は、本実施の形態では、第一特定情報1001と密接な関連性を有する形態素を意味するものである。この第二特定情報1002は、例えば目的語が挙げられる。更に、第三特定情報1003は、本実施の形態では、ある対象についての動きを示す形態素、又は名詞等を修飾する形態素を意味するものである。この第三特定情報1003は、例えば動詞、副詞又は形容詞が挙げられる。なお、第一特定情報1001、第二特定情報1002、第三特定情報1003それぞれの意味は上述の内容に限定される必要はなく、別の意味(別の品詞)を第一特定情報1001、第二特定情報1002、第三特定情報1003に与えても、これらから文の内容を把握可能な限り、本実施の形態は成立する。
The
例えば、主語が「七人の侍」、形容詞が「面白い」である場合には、図31に示すように、話題タイトル(第二形態素情報)8202は、第一特定情報1001である形態素「七人の侍」と、第三特定情報1003である形態素「面白い」とから構成されることになる。なお、この話題タイトル8202には第二特定情報1002に該当する形態素は含まれておらず、該当する形態素がないことを示すための記号「*」が第二特定情報1002として格納されている。
For example, the subject is "Seven Samurai" and the adjective is "interesting", as shown in FIG. 31, the topic title (second morpheme information) 820 2 is the
なお、この話題タイトル8202(七人の侍;*;面白い)は、「七人の侍は面白い」の意味を有する。この話題タイトル820を構成する括弧内は、以下では左から第一特定情報1001、第二特定情報1002、第三特定情報1003の順番となっている。また、話題タイトル820のうち、第一から第三特定情報に含まれる形態素がない場合には、その部分については、「*」を示すことにする。
The topic title 820 2 (Seven Samurai; *; Interesting) has the meaning of “Seven Samurai is interesting”. In the parentheses constituting the
なお、上記話題タイトル820を構成する特定情報は、上記のような第一から第三特定情報のように三つに限定されるものではなく、例えば更に他の特定情報(第四特定情報、およびそれ以上)を有するようにしてもよい。
The specific information constituting the
次に、回答文830について図32を参照して説明する。回答文830は、図32に示すように、本実施の形態では、利用者から発話された発話文のタイプに対応した回答をするために、陳述(D ; Declaration)、時間(T ; Time)、場所(L ; Location)、否定(N ; Negation)などのタイプ(回答種類)に分類されて、各タイプごとに用意されている。また肯定文は「A」とし、質問文は「Q」とする。
Next, the
話題特定情報810のデータ構成例について、図33を参照して説明する。図33は、ある話題特定情報810「佐藤」に対応付けされた話題タイトル820,回答文830の具体例を示す。
A data configuration example of the
話題特定情報810「佐藤」には、複数の話題タイトル(820)1−1、1−2、…が対応付けされている。それぞれの話題タイトル(820)1−1,1−2,…には回答文(830)1−1,1−2、…が対応付けされて記憶されている。回答文830は、回答種類840ごとに用意されている。
The
話題タイトル(820)1−1が(佐藤;*;好き){これは、「佐藤が好きです」に含まれる形態素を抽出したもの}である場合には、その話題タイトル(820)1-1に対応する回答文(830)1−1は、(DA;陳述肯定文「私も佐藤が好きです」)、(TA;時間肯定文「私は打席に立ったときの佐藤が好きです」)などが挙げられる。後述する回答取得部380は、入力種類判定部440の出力を参照しながらその話題タイトル820に対応付けられた一の回答文830を取得する。
If the topic title (820) 1-1 is (Sato; *; likes) {this is an extracted morpheme contained in "I like Sato"}, the topic title (820) 1-1 Answer sentence (830) 1-1 corresponding to (DA; statement affirmation sentence "I also like Sato"), (TA; affirmation sentence "I like Sato when I was standing at bat") Etc. An
各回答文には、当該回答文に対応するように、ユーザ発話に対して優先的に出力される回答文(「次回答文」とよぶ)を指定する情報である次プラン指定情報840が定められている。次プラン指定情報840は、次回答文を特定できる情報であれば、どのような情報であってもよく、たとえば、会話データベース500に格納されているすべての回答文から少なくとも一つの回答文を特定できる回答文ID、などである。
For each answer sentence, next
なお、本実施の形態においては、次プラン指定情報840は、回答文単位で次回答文を特定する情報(例えば、回答文ID)として説明するが、次プラン指定情報840は、話題タイトル820、話題特定情報810単位で、次回答文(この場合には、複数の回答文が次回答文として指定されるので、次回答文群とよぶ。ただし、実際に回答文として出力されるのは、この回答文群に含まれるいずれかの回答文となる)を特定する情報であってもかまわない。たとえば、話題タイトルID、話題特定情報IDを時プラン指定情報として使用しても本実施の形態は成立する。
In the present embodiment, the next
[5.1.4.会話制御部]
ここで図25に戻り、会話制御部300の構成例を説明する。
会話制御部300は、回答処理部21内の各構成要素(音声認識部200,文解析部400、会話データベース500,出力部600,音声認識辞書記憶部700)間のデータの受け渡しを制御するとともに、ユーザ発話に応答する回答文の決定、出力を行う機能を有する。
[5.1.4. Conversation control unit]
Here, returning to FIG. 25, a configuration example of the
The
会話制御部300は、本実施の形態では、図25に示すように、管理部310と、プラン会話処理部320と,談話空間会話制御処理部330と、CA会話処理部340とを有している。以下これらの構成要素について説明する。
In this embodiment, the
[5.1.4.1.管理部]
管理部310は談話履歴を記憶し、且つ必要に応じて更新する機能を有する。管理部310は話題特定情報検索部350と、省略文補完部360と、話題検索部370と、回答取得部380からの要求に応じて、記憶している談話履歴の全部又は一部をこれら各部に渡す機能を有する。
[5.1.4.1. Management Department]
The
[5.1.4.2.プラン会話処理部]
プラン会話処理部320は、プランを実行し、プランに従った会話をユーザとの間で成立させる機能を有する。「プラン」とは、予め定めた順番に従って予め定めた回答をユーザに提供することをいう。以下、プラン会話処理部320について説明する。
[5.1.4.2. Plan conversation processing section]
The plan
プラン会話処理部320は、ユーザ発話に応じて、予め定めた順番に従って予め定めた回答を出力する機能を有する。
The plan
図34は、プランを説明するための概念図である。図34に示すように、プラン空間1401には複数のプラン1、プラン2,プラン3、プラン4など様々なプラン1402があらかじめ準備されている。プラン空間1401とは、会話データベース500に格納された複数のプラン1402の集合をいう。回答処理部21は、装置起動時若しくは会話開始時にあらかじめ開始用に定められたプランを選択し、若しくは各ユーザ発話の内容に応じて、プラン空間1401の中から適宜いずれかのプラン1402を選択し、選択したプラン1402を用いてユーザ発話に対する回答文の出力を行う。
FIG. 34 is a conceptual diagram for explaining a plan. As shown in FIG. 34,
図35は、プラン1402の構成例を示す図である。プラン1402は、回答文1501と、これに関連づけられた次プラン指定情報1502を有している。次プラン指定情報1502は、当該プラン1402に含まれる回答文1501の次に、ユーザに出力する予定の回答文(次候補回答文と呼ぶ)を含むプラン1402を特定する情報である。この例では、プラン1は、プラン1実行時に回答処理部21が出力する回答文A(1501)と、この回答文A(1501)に関連づけられた次プラン指定情報1502とを有している。次プラン指定情報1502は、回答文A(1501)についての次候補回答文である回答文B(1501)を有するプラン1402を特定する情報「ID:002」である。同様に、回答文B(1501)についても、次プラン指定情報1502が定められており、回答文B(1501)が出力された場合に、次候補回答文を含むプラン2(1402)が指定される。このように、プラン1402は次プラン指定情報1502により連鎖的につながり、一連の連続した内容をユーザに出力するというプラン会話を実現する。すなわち、ユーザに伝えたい内容(説明文、案内文、アンケート、など)を複数の回答文に分割し、かつ各回答文の順番を予め定めてプランとして準備して置くことにより、ユーザの発話に応じてこれら回答文を順番にユーザに提供することが可能となる。なお、次プラン指定情報1502によって指定されたプラン1402に含まれる回答文1501は、直前の回答文の出力に応答するユーザ発話があれば、必ずしも直ちに出力される必要はなく、ユーザと回答処理部21との間で、当該プラントは別の話題についての会話を挟んだ後に、次プラン指定情報1502によって指定されたプラン1402に含まれる回答文1501が出力されることもあり得る。
FIG. 35 is a diagram illustrating a configuration example of the
なお、図35に示す回答文1501は、図33に示す回答文830の中のいずれか一の回答文文字列に対応し、また図35に示す次プラン指定情報1502は、図33に示す次プラン指定情報840に対応している。
35 corresponds to any one of the answer sentence character strings in the
なお、プラン1402のつながりは、図35に示すような一次元的配列に限られるものではない。図36は、図35とは別のつながり方を有するプラン1402の例を示す図である。図36に示す例では、プラン1(1402)は次候補回答文となる2つの回答文1501,すなわちプラン1402を指定できるよう、2つの次プラン指定情報1502を有している。ある回答文A(1501)を出力した場合の次候補回答文を有するプラン1402として、回答文B(1501)を有するプラン2(1402)、及び回答文C(1501)を有するプラン3(1402)の2つのプラン1402が定まるよう、次プラン指定情報1502が2つ設けられる。なお、回答文B、回答文Cは選択的・択一的であり、一方が出力された場合は他方は出力されず、当該プラン1(1402)は終了する。このように、プラン1402のつながりは一次元的順列の形態に限定されるものではなく、樹形図的な連結、網的な連結であってもかまわない。
Note that the connection of the
なお、各プランがいくつの次候補回答文を有するかは限定されるものではない。また、話の終了となるプラン1402については、次プラン指定情報1502が存在しないこともあり得る。
Note that the number of next candidate answer sentences each plan has is not limited. Further, the next
図37に、ある一連のプラン1402の具体例を示す。この一連のプラン14021〜14024は、危機管理に関する情報をユーザに知らせるための4つの回答文15011〜15014に対応している。4つの回答文15011〜15014は全部で一つのまとまりのある話(説明文章)を構成する。各プラン14021〜14024はそれぞれ「1000−01」「1000−02」「1000−03」「1000−04」というIDデータ17021〜17024を有している。なお、IDデータ中のハイフン以下の番号は、出力の順番を示す情報である。また、各プラン14021〜14024はそれぞれ次プラン指定情報15021〜15024を有している。次プラン指定情報15024の内容は、「1000−0F」というデータであるが、このハイフン以下の番号「0F」は、次に出力する予定のプランは存在せず、当該回答文が一連の話(説明文章)の終わりであることを示す情報である。
FIG. 37 shows a specific example of a series of
この例では、ユーザ発話が「大地震が発生したときの危機管理を教えて」である場合に、プラン会話処理部320がこの一連のプランを実行開始する。すなわち、ユーザ発話「大地震が発生したときの危機管理を教えて」をプラン会話処理部320が受け付けると、プラン会話処理部320はプラン空間1401を検索して、ユーザ発話「大地震が発生したときの危機管理を教えて」に対応する回答文15011を有するプラン1402があるかどうかを調べる。この例では、「大地震が発生したときの危機管理を教えて」に対応するユーザ発話文字列17011が、プラン14021に対応するものとする。
In this example, when the user utterance is “Tell me about crisis management when a large earthquake occurs”, the plan
プラン会話処理部320はプラン14021を発見すると、そのプラン14021に含まれる回答文15011を取得し、この回答文15011をユーザ発話に対する回答として出力するとともに、次プラン指定情報15021により次候補回答文を特定する。
When the plan
つぎに、回答文15011の出力後に入力部100や音声認識部200などを介してユーザ発話を受け付けると、プラン会話処理部320は、プラン14022の実行を行う。すなわち、プラン会話処理部320は、次プラン指定情報15021により指定されたプラン14022の実行、すなわち2番目の回答文15012を出力するか否かを判定する。具体的には、プラン会話処理部320は当該回答文15012に対応づけられたユーザ発話文字列(用例文ともいう)17012、あるいは話題タイトル820(図37において図略)と、受け付けたユーザ発話とを比較し、これらが一致するか否かを判定する。一致する場合には、2番目の回答文15012を出力する。また、2番目の回答文15012を含むプラン14022には、次プラン指定情報15022が記述されているので、次候補回答文が特定される。
Then, when receiving the user's utterance via a
同様に、これ以降継続して成されるユーザ発話に応じて、プラン会話処理部320はプラン14023、プラン14024に順に移行して、3番目の回答文15013、4番目の回答文15013の出力を行うことができる。なお、4番目の回答文15014は最終回答文であり、4番目の回答文15014の出力が完了すると、プラン会話処理部320はプラン実行を終了する。
Similarly, the plan
このように、プラン14021〜14024を次々と実行することにより、あらかじめ用意した会話内容を定めた順番通りにユーザに提供することが可能となる。
As described above, by executing the
[5.1.4.3.談話空間会話制御処理部]
図25に戻り、会話制御部300の構成例の説明を続ける。
談話空間会話制御処理部330は、話題特定情報検索部350と、省略文補完部360と、話題検索部370と、回答取得部380とを有している。前記管理部310は、会話制御部300の全体を制御するものである。
[5.1.4.3. Discourse space conversation control processing section]
Returning to FIG. 25, the description of the configuration example of the
The discourse space conversation
「談話履歴」とは、ユーザと回答処理部21間の会話の話題や主題を特定する情報であって、談話履歴は後述する「着目話題特定情報」「着目話題タイトル」「利用者入力文話題特定情報」「回答文話題特定情報」の少なくともいずれか一つを含む情報である。また、談話履歴に含まれる「着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」は直前の会話によって定められたものに限定されず、過去の所定期間の間に着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」となったもの、若しくはそれらの累積的記録であってもよい。
以下、談話空間会話制御処理部330を構成するこれら各部について説明する。
The “discourse history” is information for specifying the topic and subject of the conversation between the user and the
Hereinafter, each of these units constituting the discourse space conversation
[5.1.4.3.1.話題特定情報検索部]
話題特定情報検索部350は、形態素抽出部420で抽出された第一形態素情報と各話題特定情報とを照合し、各話題特定情報の中から、第一形態素情報を構成する形態素と一致する話題特定情報を検索するものである。具体的に、話題特定情報検索部350は、形態素抽出部420から入力された第一形態素情報が「佐藤」及び「好き」の二つの形態素で構成される場合には、入力された第一形態素情報と話題特定情報群とを照合する。
[5.1.4.1.3.1. Topic specific information search section]
The topic identification
この照合をした話題特定情報検索部320は、着目話題タイトル820focus(前回までに検索された話題タイトル、他の話題タイトルと区別するため820focusと表記する)に第一形態素情報を構成する形態素(例えば「佐藤」)が含まれているときは、その着目話題タイトル820focusを回答取得部380に出力する。一方、着目話題タイトル820focusに第一形態素情報を構成する形態素が含まれていないときは、話題特定情報検索部350は、第一形態素情報に基づいて利用者入力文話題特定情報を決定し、入力された第一形態素情報及び利用者入力文話題特定情報を省略文補完部360に出力する。なお、「利用者入力文話題特定情報」は、第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する形態素に相当する話題特定情報、若しくは第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する可能性がある形態素に相当する話題特定情報をいう。
The topic identification
[5.1.4.3.2.省略文補完部]
省略文補完部360は、前記第一形態素情報を、前回までに検索された話題特定情報810(以下、「着目話題特定情報」と呼ぶ)及び前回の回答文に含まれる話題特定情報810(以下、「回答文話題特定情報」と呼ぶ)を利用して、補完することにより複数種類の補完された第一形態素情報を生成する。例えばユーザ発話が「好きだ」という文であった場合、省略文補完部360は、着目話題特定情報「佐藤」を、第一形態素情報「好き」に含めて、補完された第一形態素情報「佐藤、好き」を生成する。
[5.1.3.2.2. Abbreviated sentence completion part]
The abbreviated
すなわち、第一形態素情報を「W」、着目話題特定情報や回答文話題特定情報の集合を「D」とすると、省略文補完部360は、第一形態素情報「W」に集合「D」の要素を含めて、補完された第一形態素情報を生成する。
That is, if the first morpheme information is “W” and the set of the topic topic identification information and the answer sentence topic specification information is “D”, the abbreviated
これにより、第一形態素情報を用いて構成される文が、省略文であって日本語として明解でない場合などにおいて、省略文補完部360は、集合「D」を用いて、その集合「D」の要素(例えば、"佐藤")を第一形態素情報「W」に含めることができる。この結果、省略文補完部360は、第一形態素情報「好き」を補完された第一形態素情報「佐藤、好き」にすることができる。なお、補完された第一形態素情報「佐藤、好き」は、「佐藤が好きだ」というユーザ発話に対応する。
Thereby, when the sentence composed using the first morpheme information is an abbreviated sentence and is not clear as Japanese, the abbreviated
すなわち、省略文補完部360は、利用者の発話内容が省略文である場合などであっても、集合「D」を用いて省略文を補完することができる。この結果、省略文補完部360は、第一形態素情報から構成される文が省略文であっても、その文が適正な日本語となるようにすることができる。
That is, the abbreviated
また、省略文補完部360が、前記集合「D」に基づいて、補完後の第一形態素情報に一致する話題タイトル820を検索する。補完後の第一形態素情報に一致する話題タイトル820を発見した場合は、省略文補完部360はこの話題タイトル820を回答取得部380に出力する。回答取得部380は、省略文補完部360で検索された適切な話題タイトル820に基づいて、利用者の発話内容に最も適した回答文830を出力することができる。
In addition, the abbreviated
尚、省略文補完部360は、集合「D」の要素を第一形態素情報に含めるだけに限定されるものではない。この省略文補完部360は、着目話題タイトルに基づいて、その話題タイトルを構成する第一特定情報、第二特定情報又は第三特定情報のいずれかに含まれる形態素を、抽出された第一形態素情報に含めても良い。
Note that the abbreviated
[5.1.4.3.3.話題検索部]
話題検索部370は、省略文補完部360で話題タイトル810が決まらなかったとき、第一形態素情報と、利用者入力文話題特定情報に対応する各話題タイトル810とを照合し、各話題タイトル810の中から、第一形態素情報に最も適する話題タイトル810を検索するものである。
[5.1.3.3. Topic Search Department]
When the
具体的に、省略文補完部360から検索命令信号が入力された話題検索部370は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトルの中から、その第一形態素情報に最も適した話題タイトル810を検索する。話題検索部370は、その検索した話題タイトル810を検索結果信号として回答取得部380に出力する。
Specifically, the
先に掲げた図33は、ある話題特定情報810(=「佐藤」)に対応付けされた話題タイトル820,回答文830の具体例を示す。図33に示すように、例えば、話題検索部370は、入力された第一形態素情報「佐藤、好き」に話題特定情報810(=「佐藤」)が含まれるので、その話題特定情報810(=「佐藤」)を特定し、次に、その話題特定情報810(=「佐藤」)に対応付けられた各話題タイトル(820)1-1,1-2,…と入力された第一形態素情報「佐藤、好き」とを照合する。
FIG. 33 shown above shows a specific example of the
話題検索部370は、その照合結果に基づいて、各話題タイトル(820)1-1〜1-2の中から、入力された第一形態素情報「佐藤、好き」と一致する話題タイトル(820)1-1(佐藤;*;好き)を特定する。話題検索部340は、検索した話題タイトル(820)1-1(佐藤;*;好き)を検索結果信号として回答取得部380に出力する。
Based on the collation result, the
[5.1.4.3.4.回答取得部]
回答取得部380は、省略文補完部360,或いは話題検索部370で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた回答文830を取得する。また、回答取得部380は、話題検索部370で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた各回答種類と、入力種類判定部440で判定された発話種類とを照合する。その照合をした回答取得部380は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する。
[5.1.3.4. Response acquisition department]
The
図33に示す例においては、回答取得部350は、話題検索部370で検索された話題タイトルが話題タイトル1-1(佐藤;*;好き)である場合には、その話題タイトル1-1に対応付けられている回答文1-1(DA,TAなど)の中から、入力種類判定部440で判定された「発話文のタイプ」(例えばDA)と一致する回答種類(DA)を特定する。この回答種類(DA)を特定した回答取得部380は、特定した回答種類(DA)に基づいて、その回答種類(DA)に対応付けられた回答文1-1(「私も佐藤が好きです。」)を取得する。
In the example shown in FIG. 33, when the topic title searched by the
ここで、上記"DA"、"TA"等のうち、"A"は、肯定形式を意味する。従って、発話種類及び回答種類に"A"が含まれているときは、ある事柄について肯定することを示している。また、発話種類及び回答種類には、"DQ"、"TQ"等の種類を含めることもできる。この"DQ"、"TQ"等のうち"Q"は、ある事柄についての質問を意味する。 Here, among the “DA”, “TA”, etc., “A” means an affirmative form. Therefore, when “A” is included in the utterance type and the answer type, it indicates that a certain matter is affirmed. In addition, types such as “DQ” and “TQ” can be included in the utterance type and the answer type. Of these “DQ”, “TQ”, etc., “Q” means a question about a certain matter.
回答種類が上記質問形式(Q)からなるときは、この回答種類に対応付けられる回答文は、肯定形式(A)で構成される。この肯定形式(A)で作成された回答文としては、質問事項に対して回答する文等が挙げられる。例えば、発話文が「あなたはスロットマシンを操作したことがありますか?」である場合には、この発話文についての発話種類は、質問形式(Q)となる。この質問形式(Q)に対応付けられる回答文は、例えば「私はスロットマシンを操作したことがあります」(肯定形式(A))が挙げられる。 When the answer type is the above question format (Q), the answer text associated with the answer type is configured in an affirmative format (A). Examples of the answer sentence created in this affirmative form (A) include a sentence that answers a question item. For example, when the utterance sentence is “Have you operated the slot machine?”, The utterance type for this utterance sentence is a question form (Q). An example of an answer sentence associated with the question format (Q) is “I have operated a slot machine” (affirmative format (A)).
一方、発話種類が肯定形式(A)からなるときは、この回答種類に対応付けられる回答文は、質問形式(Q)で構成される。この質問形式(Q)で作成された回答文としては、発話内容に対して聞き返す質問文、又は特定の事柄を聞き出す質問文等が挙げられる。例えば、発話文が「私はスロットマシンで遊ぶのが趣味です」である場合には、この発話文についての発話種類は、肯定形式(A)となる。この肯定形式(A)に対応付けられる回答文は、例えば"パチンコで遊ぶのは趣味ではないのですか?"(特定の事柄を聞き出す質問文(Q))が挙げられる。 On the other hand, when the utterance type is an affirmative form (A), the answer sentence associated with the answer type is configured with a question form (Q). Examples of the answer sentence created in the question format (Q) include a question sentence that is replied to the utterance content or a question sentence that asks a specific matter. For example, if the utterance sentence is “I am playing with a slot machine”, the utterance type for this utterance sentence is an affirmative form (A). The answer sentence associated with this affirmative form (A) is, for example, “isn't it a hobby to play with pachinko?” (Question sentence (Q) to ask for a specific matter).
回答取得部380は、取得した回答文830を回答文信号として管理部310に出力する。回答取得部350から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。
The
[5.1.4.4.CA会話処理部]
CA会話処理部340は、ユーザ発話に対して、プラン会話処理部320および談話空間会話制御処理部330のいずれにおいても回答文が決定しない場合に、ユーザ発話の内容に応じて、ユーザとの会話を継続できるような回答文を出力する機能を有する。
以上で回答処理部21の構成例の説明を終了する。
[5.1.4.4. CA conversation processing department]
The CA
This is the end of the description of the configuration example of the
[5.2.会話制御方法]
上記構成を有する回答処理部21は、以下のように動作することにより会話制御方法を実行する。本実施の形態にかかる回答処理部21,より詳しくは会話制御部300の動作について説明する。
[5.2. Conversation control method]
The
図38は、会話制御部300のメイン処理の一例を示すフローチャートである。このメイン処理は、会話制御部300がユーザ発話を受け付けるごとに実行される処理であり、このメイン処理が行われることによりユーザ発話に対する回答文の出力が行われ、会話装置10と会話サーバ20(回答処理部21)間の会話(対話)が成立する。
FIG. 38 is a flowchart illustrating an example of main processing of the
メイン処理にはいると、会話制御部300、より詳しくはプラン会話処理部320はまずプラン会話制御処理(S1801)を実行する。プラン会話制御処理は、プランを実行する処理である。
When entering the main process, the
図39、図40はプラン会話制御処理の一例を示すフローチャートである。以下に図39、図40を参照しながら、プラン会話制御処理の例について説明する。 39 and 40 are flowcharts showing an example of the plan conversation control process. An example of the plan conversation control process will be described below with reference to FIGS. 39 and 40.
プラン会話制御処理を開始すると、プラン会話処理部320はまず、基本制御状態情報チェックを行う(S1901)。基本制御状態情報は、プラン1402の実行の完了の有無が、基本制御状態情報として所定の記憶領域に格納される。
基本制御状態情報は、プランの基本制御状態を記述する役割を有する。
When the plan conversation control process is started, the plan
The basic control state information has a role of describing the basic control state of the plan.
図41は、シナリオと呼ばれるタイプのプランについて生じうる4つの基本制御状態を示す図である。以下、それぞれの状態について説明する。 FIG. 41 is a diagram showing four basic control states that can occur for a type of plan called a scenario. Hereinafter, each state will be described.
(1)結束
この基本制御状態は、ユーザ発話が実行中のプラン1402、より詳しくはプラン1402に対応する話題タイトル820や用例文1701に一致する場合である。この場合は、プラン会話処理部320は当該プラン1402を終了し、次プラン指定情報1502にて指定された回答文1501に対応するプラン1402に移行する。
(1) Unity This basic control state is when the user utterance matches the
(2)破棄
この基本制御状態は、ユーザ発話内容がプラン1402の終了を要求していると判断される場合、またはユーザの関心が実行中のプラン以外の事項に移ったと判定される場合に、設定される基本制御状態である。基本制御状態情報が破棄を示している場合は、プラン会話処理部320は、破棄の対象となったプラン1402以外にユーザ発話に対応するプラン1402がないかどうかを検索し、存在する場合にはそのプラン1402の実行を開始し、存在しない場合には、プランの実行を終了する。
(2) Discard This basic control state is determined when it is determined that the user utterance content is requesting the termination of the
(3)維持
この基本制御状態は、ユーザ発話が、実行中のプラン1402に対応するに対応する話題タイトル820(図33参照)や用例文1701(図37参照)に該当しない場合であって、かつユーザ発話が基本制御状態「破棄」に該当するものではないと判断される場合に、基本制御状態情報に記述される基本制御状態である。
(3) Maintenance This basic control state is when the user utterance does not correspond to the topic title 820 (see FIG. 33) or example sentence 1701 (see FIG. 37) corresponding to the
この基本制御状態である場合には、プラン会話処理部320は、ユーザ発話を受け付けると、まず保留・中止しているプラン1402を再開するか否かを検討し、ユーザ発話がプラン1402再開に適さない場合、例えばユーザ発話がプラン1402に対応する話題タイトル802や用例文1702に対応しない場合は、他のプラン1402の実行を開始したり、或いは後述の談話空間会話制御処理(S1902)などをおこなう。ユーザ発話がプラン1402再開に適している場合は、記憶している次プラン指定情報1502に基づいて、回答文1501の出力を行う。
In this basic control state, when receiving a user utterance, the plan
基本制御状態が「維持」である場合は、プラン会話処理部320は、当該プラン1402に対応する回答文1501以外の回答を出力できるように、他のプラン1402を検索し、あるいは後述の談話空間会話制御処理などをおこなうが、ユーザ発話が再びプラン1402に関するものとなった場合は、そのプラン1402の実行を再開する。
When the basic control state is “maintained”, the plan
(4)継続
この状態は、ユーザ発話が、実行中のプラン1402に含まれる回答文1501に対応しない場合であって、かつユーザ発話内容が基本制御状態「破棄」に該当するものではないと判断され、かつユーザ発話から解釈されるユーザの意図が明瞭でない場合に、設定される基本制御状態である。
(4) Continuation In this state, it is determined that the user utterance does not correspond to the
基本制御状態が「継続」である場合は、プラン会話処理部320は、ユーザ発話を受け付けるとまず保留・中止しているプラン1402を再開するか否かを検討し、ユーザ発話がプラン1402の再開に適さない場合は、ユーザからさらなる発話を引き出すための回答文を出力できるように、後述のCA会話制御処理などをおこなう。
When the basic control state is “continuation”, the plan
図39に戻り、プラン会話制御処理の説明を続ける。 Returning to FIG. 39, the description of the plan conversation control process will be continued.
基本制御状態情報を参照したプラン会話処理部320は、基本制御状態情報が示す基本制御状態が「結束」であるか否かを判定する(S1902)。基本制御状態が「結束」であると判定した場合(S1902、Yes)は、プラン会話処理部320は、基本制御状態情報が示す実行中のプラン1402において、回答文1501が最終回答文であるかどうかを判定する(S1903)。
The plan
最終回答文1501が出力済みであると判定した場合(S1903、Yes)、プラン会話処理部320は、すでにそのプラン1402においてユーザに回答すべき内容をすべて伝え終えているので、新たな別のプラン1402を開始するかいなかを判定するため、プラン空間内にユーザ発話に対応するプラン1402が存在するか検索を行う(S1904)。この検索の結果ユーザ発話に対応するプラン1402が発見できなかった場合(S1905、No)、ユーザに提供すべきプラン1402は存在していないので、プラン会話処理部320はそのままプラン会話制御処理終了する。
If it is determined that the
一方、この検索の結果、ユーザ発話に対応するプラン1402を発見した場合(S1905、Yes)、プラン会話処理部320は当該プラン1402に移行する(S1906)。これは、ユーザに提供すべきプラン1402が存在しているため、当該プラン1402の実行(プラン1402に含まれる回答文1501の出力)を開始するためである。
On the other hand, if the
次に、プラン会話処理部320は当該プラン1402の回答文1501を出力する(S1908)。出力された回答文1501は、ユーザ発話に対する回答となり、プラン会話処理部320はユーザに伝えたい情報を提供することとなる。
Next, the plan
回答文出力処理(S1908)後、プラン会話処理部320はプラン会話制御処理を終了する。
After the answer sentence output process (S1908), the plan
一方、先に出力した回答文1501が最終の回答文1501であるか否かの判定(S1903)において、先に出力した回答文1501が最終の回答文1501でない場合(S1903,No)は、プラン会話処理部320は、先に出力した回答文1501に続く回答文1501、すなわち次プラン指定情報1502により特定されている回答文1501に対応するプラン1402に移行する(S1907)。
On the other hand, when it is determined whether or not the previously
この後、プラン会話処理部320は該当するプラン1402に含まれる回答文1501を出力し、ユーザ発話に対する回答を行う(S1908)。出力された回答文1501は、ユーザ発話に対する回答となり、プラン会話処理部320はユーザに伝えたい情報を提供することとなる。回答文出力処理(S1908)後、プラン会話処理部320はプラン会話制御処理を終了する。
Thereafter, the plan
さて、S1902の判定処理において、基本制御状態情報が「結束」でない場合(S1902,No)は、プラン会話処理部320は基本制御状態情報が示す基本制御状態が「破棄」であるか否かを判定する(S1909)。基本制御状態が「破棄」であると判定した場合(S1909、Yes)は、継続すべきプラン1402が存在していないため、プラン会話処理部320は、開始すべき新たな別のプラン1402が存在するか判定すべく、プラン空間1401内にユーザ発話に対応するプラン1402が存在するか検索を行う(S1904)。この後、先に述べたS1903(Yes)における処理と同様に、S1905からS1908までの処理をプラン会話処理部320は実行する。
In the determination process of S1902, if the basic control state information is not “union” (S1902, No), the plan
一方、基本制御状態情報が示す基本制御状態が「破棄」であるか否かの判定(S1909)において、基本制御状態が「破棄」でないと判定した場合(S1909,No)は、プラン会話処理部320は、基本制御状態情報が示す基本制御状態が「維持」であるか否かの判定(S1910)をさらに行う。
On the other hand, when it is determined that the basic control state indicated by the basic control state information is “discard” (S1909) and the basic control state is not “discard” (S1909, No), the plan
基本制御状態情報が示す基本制御状態が「維持」である場合(S1910、Yes)には、プラン会話処理部320は、保留・停止しているプラン1402についてユーザが再び関心を示したか否かを調べ、関心を示した場合には、一時保留・停止しているプラン1402を再開するように動作する。すなわち、プラン会話処理部320は、保留・停止中のプラン1402を検査(図40;S2001)し、ユーザ発話が保留・停止中の当該プラン1402が対応するか否かを判定する(S2002)。
When the basic control state indicated by the basic control state information is “maintained” (S1910, Yes), the plan
ユーザ発話が当該プラン1402に対応すると判定された場合(S2002、Yes)は、プラン会話処理部320はそのユーザ発話に対応するプラン1402に移行し(S2003)、その後、そのプラン1402に含まれる回答文1501を出力するように、回答文出力処理(図39;S1908)を実行する。このように動作することにより、プラン会話処理部320は、保留・中断していたプラン1402を、ユーザ発話に応じて、再開することが可能となり、あらかじめ用意していたプラン1402に含まれる内容をすべてユーザに伝達することが可能となる。
When it is determined that the user utterance corresponds to the plan 1402 (S2002, Yes), the plan
一方、先のS2002(図40参照)において、保留・停止中のプラン1402がユーザ発話に対応しないと判定された場合(S2002、No)は、プラン会話処理部320は、開始すべき新たな別のプラン1402が存在するか判定すべく、プラン空間1401内にユーザ発話に対応するプラン1402が存在するか検索を行う(図39;S1904)。この後、先に述べたS1903(Yes)における処理と同様に、S1905からS1909までの処理をプラン会話処理部320は実行する。
On the other hand, in the previous S2002 (see FIG. 40), when it is determined that the suspended / suspended
さて、S1910の判定において、基本制御状態情報が示す基本制御状態が「維持」でない場合(S1910、No)は、基本制御状態情報が示す基本制御状態が「継続」であることを意味する。この場合には、プラン会話処理部320は、回答文の出力を行うことなく、プラン会話制御処理を終了する。
以上で、プラン会話制御処理の説明を終了する。
In the determination of S1910, when the basic control state indicated by the basic control state information is not “maintained” (S1910, No), it means that the basic control state indicated by the basic control state information is “continue”. In this case, the plan
This is the end of the description of the plan conversation control process.
図38に戻り、メイン処理の説明を続ける。
プラン会話制御処理(S1801)を終了すると、会話制御部300は談話空間会話制御処理を開始する(S1802)。ただし、プラン会話制御処理(S1801)において回答文出力を行った場合は、会話制御部300は談話空間会話制御処理(S1802)、および後に説明するCA会話制御処理(S1803)のいずれも行わず、基本制御情報更新処理(S1904)を行ってメイン処理を終了する。
Returning to FIG. 38, the description of the main process is continued.
When the planned conversation control process (S1801) ends, the
図42は、本実施の形態に係る談話空間会話制御処理の一例を示すフローチャートである。
先ず、入力部100が、利用者からの発話内容を取得するステップを行う(ステップS2201)。具体的には、入力部100は、利用者の発話内容を構成する音声を取得する。入力部100は、取得した音声を音声信号として音声認識部200に出力する。なお、入力部100は、利用者からの音声ではなく、利用者から入力された文字列(例えば、テキスト形式で入力された文字データ)を取得してもよい。この場合、入力部100はマイクではなく、キーボードやタッチパネルなどの文字入力装置となる。
FIG. 42 is a flowchart showing an example of the discourse space conversation control process according to the present embodiment.
First, the
次いで、音声認識部200が、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定するステップを行う(ステップS2202)。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号に基づいて、その音声信号に対応する単語仮説(候補)を特定する。音声認識部200は、特定した単語仮説(候補)に対応付けられた文字列を取得し、取得した文字列を文字列信号として会話制御部300、より詳しくは談話空間会話制御部330に出力する。
Next, the
そして、文字列特定部410が、音声認識部200で特定された一連の文字列を一文毎に区切るステップを行う(ステップS2203)。具体的には、管理部310から文字列信号(あるいは形態素信号)が入力された文字列特定部410は、その入力された一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部410は、その区切った各文字列を形態素抽出部420及び入力種類判定部440に出力する。なお、文字列特定部410は、入力された文字列がキーボードから入力された文字列である場合には、句読点又はスペース等のある部分で文字列を区切るのが好ましい。
Then, the character
その後、形態素抽出部420が、文字列特定部410で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップを行う(ステップS2204)。具体的に、文字列特定部410から文字列が入力された形態素抽出部420は、入力された文字列と、形態素データベース430に予め格納されている形態素群とを照合する。なお、その形態素群は、本実施の形態では、それぞれの品詞分類に属する各形態素について、その形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として準備されている。
Thereafter, the morpheme extraction unit 420 performs a step of extracting each morpheme constituting a minimum unit of the character string as first morpheme information based on the character string specified by the character string specifying unit 410 (step S2204). Specifically, the morpheme extraction unit 420 to which the character string is input from the character
この照合をした形態素抽出部420は、入力された文字列の中から、予め記憶された形態素群に含まれる各形態素と一致する各形態素(m1、m2、…)を抽出する。形態素抽出部420は、抽出した各形態素を第一形態素情報として話題特定情報検索部350に出力する。
The matched morpheme extraction unit 420 extracts each morpheme (m1, m2,...) That matches each morpheme included in the previously stored morpheme group from the input character string. The morpheme extraction unit 420 outputs each extracted morpheme to the topic identification
次いで、入力種類判定部440が、文字列特定部410で特定された一文を構成する各形態素に基づいて、「発話文のタイプ」を判定するステップを行う(ステップS2205)。具体的には、文字列特定部410から文字列が入力された入力種類判定部440は、入力された文字列に基づいて、その文字列と発話種類データベース450に格納されている各辞書とを照合し、その文字列の中から、各辞書に関係する要素を抽出する。この要素を抽出した入力種類判定部440は、抽出した要素に基づいて、その要素がどの「発話文のタイプ」に属するのかを判定する。入力種類判定部440は、判定した「発話文のタイプ」(発話種類)を回答取得部380に出力する。
Next, the input
そして、話題特定情報検索部350が、形態素抽出部420で抽出された第一形態素情報と着目話題タイトル820focusとを比較するステップを行う(ステップS2206)。
Then, the topic identification
第一形態素情報を構成する形態素と着目話題タイトル820focusとが一致する場合、話題特定情報検索部350は、その話題タイトル820を回答取得部380に出力する。一方、話題特定情報検索部350は、第一形態素情報を構成する形態素と話題タイトル820とが一致しなかった場合には、入力された第一形態素情報及び利用者入力文話題特定情報を検索命令信号として省略文補完部360に出力する。
When the morpheme constituting the first morpheme information matches the topic topic title 820focus, the topic identification
その後、省略文補完部360が、話題特定情報検索部350から入力された第一形態素情報に基づいて、着目話題特定情報及び回答文話題特定情報を、入力された第一形態素情報に含めるステップを行う(ステップS2207)。具体的には、第一形態素情報を「W」、着目話題特定情報及び回答文話題特定情報の集合を「D」とすると、省略文補完部360は、第一形態素情報「W」に話題特定情報「D」の要素を含めて、補完された第一形態素情報を生成し、この補完された第一形態素情報と集合「D」に関連づけされたすべての話題タイトル820とを照合し、補完された第一形態素情報と一致する話題タイトル820があるか検索する。補完された第一形態素情報と一致する話題タイトル820がある場合は、省略文補完部360は、その話題タイトル820を回答取得部380に出力する。一方、補完された第一形態素情報と一致する話題タイトル820を発見しなかった場合は、省略文補完部360は、第一形態素情報と利用者入力文話題特定情報とを話題検索部370に渡す。
Thereafter, the abbreviated
次いで、話題検索部370は、第一形態素情報と、利用者入力文話題特定情報とを照合し、各話題タイトル820の中から、第一形態素情報に適した話題タイトル820を検索するステップを行う(ステップS2208)。具体的には、省略文補完部360から検索命令信号が入力された話題検索部370は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトル820の中から、その第一形態素情報に適した話題タイトル820を検索する。話題検索部370は、その検索の結果得られた話題タイトル820を検索結果信号として回答取得部380に出力する。
Next, the
次いで、回答取得部380が、話題特定情報検索部350、省略文補完部360,あるいは話題検索部370で検索された話題タイトル820に基づいて、文解析部400により判定された利用者の発話種類と、話題タイトル820に対応付けられた各回答種類とを照合し、回答文830の選択を行う(ステップS2209)。
Next, the
具体的には、以下のようにして回答文830の選択が行われる。すなわち、話題検索部370から検索結果信号と、入力種類判定部440から「発話文のタイプ」とが入力された回答取得部380は、入力された検索結果信号に対応する「話題タイトル」と、入力された「発話文のタイプ」とに基づいて、その「話題タイトル」に対応付けられている回答種類群の中から、「発話文のタイプ」(DAなど)と一致する回答種類を特定する。
Specifically, the
続いて、回答取得部380は、管理部310を介して、ステップS2209において取得した回答文830を出力部600に出力する(ステップS2210)。管理部310から回答文を受け取った出力部600は、入力された回答文830を出力する。
Subsequently, the
以上で、談話空間会話制御処理の説明を終了し、図38に戻りメイン処理の説明を再開する。 This is the end of the description of the discourse space conversation control process. Returning to FIG. 38, the description of the main process is resumed.
会話制御部300は談話空間会話制御処理を終了すると、CA会話制御処理を実行する(S1803)。ただし、プラン会話制御処理(S1801)および談話空間会話制御処理(S1801)において回答文出力を行った場合は、会話制御部300はCA会話制御処理(S1803)を行わず、基本制御情報更新処理(S1804)を行ってメイン処理を終了する。
When the
CA会話制御処理(S1803)は、ユーザ発話が、「何かを説明している」のか、「何かを確認している」のか、「非難や攻撃をしている」のか、「これら以外」なのかを判定し、ユーザ発話の内容および判定結果に応じた回答文を出力する処理である。このCA会話制御処理を行うことにより、プラン会話制御処理、および談話空間会話制御処理のいずれにおいても、ユーザ発話に適した回答文が出力できなくとも、ユーザとの会話の流れをとぎれさせることなく継続できるような、いわば「つなぎ」の回答文を出力することが可能となる。 In the CA conversation control process (S1803), whether the user utterance is “explaining something”, “confirming something”, “condemning or attacking”, “other than these” This is a process of determining whether or not the answer is in accordance with the content of the user utterance and the determination result. By performing this CA conversation control process, the flow of conversation with the user is not interrupted even if an answer sentence suitable for the user utterance cannot be output in either the plan conversation control process or the discourse space conversation control process. In other words, it is possible to output an answer sentence of “Tsunagi” that can be continued.
つぎに、会話制御部300は基本制御情報更新処理を行う(S1804)。この処理において、会話制御部300,より詳しくは管理部310は、プラン会話処理部320が回答文出力を行った場合は基本制御情報を「結束」に設定し、プラン会話処理部320が回答文出力を停止した場合は基本制御情報を「破棄」に設定し、談話空間会話制御処理部330が回答文出力を行った場合は基本制御情報を「維持」に設定し、CA会話処理部340が回答文出力を行った場合は基本制御情報を「継続」に設定する。
Next, the
この基本制御情報更新処理で設定された基本制御情報は、前述のプラン会話制御処理(S1801)において参照され、プランの継続や再開に利用される。 The basic control information set in the basic control information update process is referred to in the above-described plan conversation control process (S1801), and is used for continuation and resumption of the plan.
以上、メイン処理をユーザ発話を受け付けるごとに実行することにより、回答処理部21は、ユーザ発話に応じて、予め用意したプランを実行できるとともに、プランに含まれない話題についても適宜応答することができる。
As described above, by executing the main process every time a user utterance is received, the
[6.第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。第2の実施の形態は顧客対応システムとして提案される。
[6.1.構成例]
以下に、本発明の実施の形態の一つである顧客対応システムについて説明する。顧客対応システムは、ネットワークを介して受信した顧客からの質問や問い合わせに対して回答や情報をネットワークを介して送信するシステムである。
[6. Second Embodiment]
Next, a second embodiment of the present invention will be described. The second embodiment is proposed as a customer service system.
[6.1. Configuration example]
A customer service system that is one embodiment of the present invention will be described below. The customer response system is a system that transmits answers and information via a network in response to questions and inquiries from customers received via the network.
図43は、本実施の形態にかかる顧客対応システムの構成例を示したブロック図である。
顧客対応システム100は、広域通信網(WAN)110に接続可能なユーザ側端末機として機能する会話装置10と、広域通信網に接続された会話サーバ20Aと、構内通信網(LAN)120に接続された専門家側端末装置130、会話シナリオ編集装置30、会話ログデータベース(DBと略す)140、及び会話ログ分析装置150とで構成されている。なお、会話サーバ20Aは構内通信網120を介して専門家側端末装置130、会話シナリオ編集装置30、会話ログDB140、及び会話ログ分析装置150と通信可能である。
FIG. 43 is a block diagram showing a configuration example of the customer service system according to the present embodiment.
The customer-facing
また、上記構成例では、構内通信網120を介して会話サーバ20Aと、専門家側端末装置130、会話シナリオ編集装置30、会話ログDB140、及び会話ログ分析装置150とが通信する構成としたが、前記広域通信網110或いは他の広域通信網を介してこれら装置が通信する構成であっても本発明は成立する。
In the above configuration example, the
なお、ここでいう「専門家」とはユーザからの質問や問い合わせに対して回答をなすことを役割として担う者をいい、必ずしも専門的知識を有する者であることまでは要しない。 The “expert” referred to here means a person who plays a role in answering questions and inquiries from users, and does not necessarily need to be a person who has expert knowledge.
以下に、上記顧客対応システム100の構成要素について説明する。
[6.1.1.会話装置]
1.本発明の第1の手段に相当する会話装置10は、ユーザ(顧客)が質問や問い合わせなどをユーザ発話(入力文)として会話サーバ20Aに送信し、会話サーバ20Aからその回答文を受信する装置である。本顧客対応システムの会話装置10は、第1の実施の形態の会話装置20と同様の構成を有する装置であるので、その詳細な構成例の説明は省略することとする。
Below, the component of the said
[6.1.1. Conversation device]
1. The
[6.1.2.会話サーバ]
本発明の第2の手段に相当する会話サーバ20Aは、会話装置10から送信されたユーザ発話に対して、会話シナリオ40に基づいて回答文を決定し、決定した回答文及びその回答文に対応付けされた動作制御情報をその会話装置10に送信する機能と、ユーザ発話に対する回答文が会話シナリオから発見できない場合にそのユーザ発話に対する回答を専門家に回答させるように、ユーザ発話の内容を専門家側端末装置130に送信し、これに応じて専門家側端末装置130から送信される回答内容を受信し、受信した回答内容を会話装置10に送信する機能と、前記ユーザ発話、回答文、専門家側端末装置130からの回答内容をそれらの時系列に従って記憶し、記憶した内容(「会話ログ」とよぶ)を会話ログDB140に送信する機能と、会話シナリオ編集装置30から送信される会話シナリオ40を受信し、その会話内容をすでに記憶済みの会話シナリオ40に追加し、或いは置換する機能とを有する。
[6.1.2. Conversation server]
The
会話サーバ20Aは、演算処理装置(CPU)、主メモリ(RAM)、読出し専用メモリ(ROM)、入出力装置(I/O)、及び必要な場合にはハードディスク装置等の外部記憶装置を具備している情報処理装置によって実現される。情報処理装置は、PC、ワークステーション、サーバなどである。会話サーバ20Aは、複数の情報処理装置をネットワークで接続して構成されるものであってもよい。
The
図44は、会話サーバ20Aの構成例を示した機能ブロック図である。なお、本実施の形態における会話サーバ20Aは、前述した会話サーバ20と共通の構成要素を有するので、それら共通の構成要素については同一の参照符号を付してそれらの詳細な説明は省略するものとする。
FIG. 44 is a functional block diagram showing a configuration example of the
会話サーバ20Aは、回答処理部21と、回答処理部21に接続された回答中継部24及びログ収集部25と、回答処理部21に接続された意味解釈辞書部23及び会話シナリオ記憶部22と、会話シナリオ記憶部22に接続された会話シナリオ更新部26とを有する。
The
回答処理部21、意味解釈辞書部23、及び会話シナリオ記憶部22は、第1の実施の形態の会話サーバ20のものと同様の機能を有する構成要素であるため、これらの説明は省略する。但し、回答処理部21には、回答中継部24及びログ収集部25にユーザ発話、回答文、回答内容を渡し、或いは受け取る機能が付加されている。
Since the
回答中継部24は、専門家側端末装置130との通信して、回答処理部21から受け取ったユーザ発話の内容を専門家側端末装置130に送信し、これに応じて専門家側端末装置から送信された回答内容を受信し、受信した回答内容を回答処理部21に渡す機能を有する。
The
ログ収集部25は、回答処理部21が受け取るユーザ発話及び専門家側端末装置130からの回答内容、及び回答処理部21が会話装置10に送信する回答文を回答処理部21から取得し、これらのデータを会話ログとして会話ログDB140に送信する機能を有する。なお、会話ログを送信するタイミングは、会話サーバ20Aが決定する任意のタイミングであっても良いし、会話ログDB140から送信要求を受信したタイミングでも良いし、その他のタイミング(例えば、オペレータが会話ログ送信処理を実行したとき)でもよい。
The
会話シナリオ更新部26は、会話シナリオ記憶部22に記憶された会話シナリオ40に新たな会話シナリオ40を追加したり、一部又は全部を置換したりする機能を有する。例えば、ユーザ発話である質問と、それに対する専門家の回答内容からなる新たな会話シナリオ(区別のため、「追加会話シナリオ」と呼ぶ)が会話シナリオ編集装置30により生成され、その追加会話シナリオを会話シナリオ編集装置30より会話シナリオ更新部26が受信し、会話シナリオ記憶部22にすでに記憶されている会話シナリオ40に追加して記憶させる。この処理後に、会話サーバ20Aは前記ユーザ発話である質問を再び受け付けた場合、回答処理部21が追加会話シナリオ部分に基づいて前記回答内容と同じ内容の回答文を会話装置10に送信することが出来るようになる。
以上で会話サーバ20Aの構成例の説明を終了する。
The conversation
This is the end of the description of the configuration example of the
図43に戻り、顧客対応システム100の構成要素の説明を続ける。
[6.1.3.専門家側端末装置]
本発明の第3の手段に相当する専門家側端末装置130は、会話サーバ20Aから送信(転送)されてくるユーザ発話を受信して、ユーザ発話の内容を専門家側端末装置130の操作者である専門家に提示してその回答を入力すること促し、回答が入力された場合には回答内容であるデータを会話サーバ20Aに送信する機能を有する装置である。
Returning to FIG. 43, description of the components of the
[6.1.3. Expert side terminal device]
The
専門家側端末装置130は、ユーザ発話の受信、回答内容の送信が実行できる装置であればどのような装置であっても良い。例えば、専門家側端末装置130は、パーソナルコンピュータ、移動体通信機(携帯電話機)、専用端末装置などである。
The expert-
[6.1.4.会話シナリオ編集装置]
本発明の第5の手段に相当する会話シナリオ編集装置30は、第1の実施の形態における会話シナリオ編集装置30と同様の装置であるので、ここでは構成の詳細な説明は省略する。但し、本実施の形態における会話シナリオ編集装置30は、会話ログDB140より会話ログ、とりわけ専門家側端末装置130から送信された回答内容を含む会話ログを取得し、これを編集して会話シナリオ40として出力し、会話サーバ20Aに送信して会話シナリオの追加・更新を行わせる機能をさらに備えている。
[6.1.4. Conversation scenario editing device]
Since the conversation
[6.1.5.会話ログDB]
本発明の第4の手段に相当する会話ログDB140は、会話サーバ20Aから送信された会話ログを受信し、これを記憶する機能を有する装置である。会話ログDB140は、演算処理装置(CPU)、主メモリ(RAM)、読出し専用メモリ(ROM)、入出力装置(I/O)、及び必要な場合にはハードディスク装置等の外部記憶装置を具備している情報処理装置によって実現される。情報処理装置は、PC、ワークステーション、サーバなどである。会話ログDBは、複数の情報処理装置をネットワークで接続して構成されるものであってもよい。
[6.1.5. Conversation log DB]
The
[6.1.6.会話ログ分析装置]
会話ログ分析装置150は、会話ログDB140から会話ログを受信し、会話ログを分析することにより会話傾向統計(例えば、質問ごとのアクセス数の統計データ)の生成を行う。
以上で、顧客対応システム100の構成例の説明を終了する。
[6.1.6. Conversation log analyzer]
The conversation
Above, description of the structural example of the
[6.2.顧客対応システムの動作]
次に、上記顧客対応システム100の動作について説明する。
[6.2.1.会話サーバが会話シナリオに基づいて回答可能な場合の動作]
図45は、会話サーバ20Aが会話シナリオに基づいて回答可能な場合のユーザ発話を受け付けた場合の、顧客対応システム100の動作例を示したシーケンス図である。
[6.2. Operation of customer service system]
Next, the operation of the
[6.2.1. Operation when conversation server can answer based on conversation scenario]
FIG. 45 is a sequence diagram illustrating an operation example of the
まずユーザは会話装置10から会話サーバにアクセスし、通信を確立させた後、会話装置10にユーザ発話(この例ではある質問であるとする)を入力する。会話装置10はユーザ発話を会話サーバ20Aに送信する(S3010)。ユーザ発話を受信した会話サーバ20Aは、会話シナリオ記憶部22に記憶されている会話シナリオに基づいて、回答文及びその回答文に対応する動作制御情報を抽出する(S3020)。会話サーバ20Aは、抽出した回答文及び動作制御情報を会話装置10に送信する(S3030)。会話装置10は受信した回答文を表示して、ユーザに回答内容を提供する(S3040)。ユーザは回答内容から質問に対する回答を得る。
First, the user accesses the conversation server from the
一方、会話サーバ20Aは、前記ユーザ発話、回答文を会話ログとして取得し(S3050)、この会話ログを会話ログDB140に送信する(S3060)。会話ログDB140は受信した会話ログを記憶する(S3070)。
On the other hand, the
[会話サーバが専門家側端末装置に回答を求める場合の動作]
図46は、会話サーバ20Aが会話シナリオに適当な回答がないと判定し、専門家側端末装置130に回答を求める場合の、顧客対応システム100の動作例を示したシーケンス図である。
[Operation when conversation server asks expert terminal device for answer]
FIG. 46 is a sequence diagram showing an operation example of the
ユーザは会話装置10から会話サーバ20Aにアクセスし、通信を確立させた後、会話装置10にユーザ発話(この例でもある質問であるとする)を入力する。会話装置10はユーザ発話を会話サーバ20Aに送信する(S3110)。ユーザ発話を受信した会話サーバ20Aは、会話シナリオ記憶部22に記憶されている会話シナリオ40に基づいて、回答文及びその回答文に対応する動作制御情報を検索する(S3120)が、記憶している会話シナリオ40には適当な回答文はないと判断したものとする。会話サーバ20Aは、専門家側端末装置130と通信を確立し、先のステップS3110において会話装置10から受信したユーザ発話を専門家側端末装置130に送信し(S3130)、専門家側端末装置130で待ち受けている専門家に当該ユーザ発話である質問に回答するよう求める。
The user accesses the
専門家側端末装置130は、ユーザ発話を受信するとその内容を表示(例えば、液晶ディスプレイ装置にユーザ発話の内容であるテキストを表示する)する(S3140)。専門家はユーザ発話の内容に対して、自己の知識や或いは別途用意されているデータベースを参照することにより質問に対する回答を用意し、回答を専門家側端末装置130に入力する(S3150)。回答の入力が行われると、専門家側端末装置130は回答をデータとして会話サーバ20Aに送信する(S3160)。
Upon receiving the user utterance, the
専門家側端末装置130から回答であるデータを受信した会話サーバ20Aは、受信した回答を会話装置10に送信する(S3170)。会話装置10は受信した回答文を表示して、ユーザに回答内容を提供する(S3180)。ユーザは回答内容から質問に対する回答を得る。
The
一方、会話サーバ20Aは、前記ユーザ発話、回答を会話ログとして取得し(S3190)、この会話ログを会話ログDB140に送信する(S3200)。会話ログDB140は受信した会話ログを記憶する(S3210)。
On the other hand, the
その後会話ログDB140はステップS3200において送信された会話ログ、すなわち専門家側端末装置130から送信された回答とそれと対となるユーザ発話(質問)を内容とする会話ログを会話シナリオ編集装置30に送信する(S3220)。会話ログを受信した会話シナリオ編集装置30は、その会話ログに基づいて会話シナリオ40を生成する(S3230)。なお、この会話シナリオ40の生成は会話シナリオ編集装置30のオペレータにより行われるようにしても良いし、別途自動編集プログラムを会話シナリオ編集装置30にインストールしておき、この自動編集プログラムにより会話シナリオの生成を行わせるようにしても良い。
Thereafter, the
会話シナリオ編集装置30は、先のステップS3230において生成された会話シナリオ40を会話サーバに送信する(S3240)。会話シナリオ40を受信した会話サーバ20Aは、受信した会話シナリオ40を自己の会話シナリオ記憶部22に記憶させ、会話シナリオの更新を行う(S3250)。これにより、再びステップS3110において送信されたユーザ発話と同様の質問を受け付けた場合には、会話サーバ20Aが会話シナリオ40から回答文及び動作制御情報を抽出して、専門家による回答を求めることなく、ユーザに回答を提供することが可能になる。
The conversation
[6.2.2.会話ログ解析]
次に、会話ログの解析の動作例について説明する。
図47は、顧客対応システム100が会話ログの分析を行う場合の動作例を示したシーケンス図である。
[6.2.2. Conversation log analysis]
Next, an operation example of conversation log analysis will be described.
FIG. 47 is a sequence diagram illustrating an operation example when the customer-facing
まず、会話ログ分析装置150は、会話ログDB140に会話ログの送信要求を送る(S3310)。会話ログDB140は会話ログ分析装置150に会話ログを送信する(S3320)。会話ログ分析装置150は受信した会話ログを分析処理し(S3330)、その分析結果を出力する(S3340)。分析結果はユーザの関心事項や、ユーザの属性毎の反応など、マーケティングに利用可能な情報として利用される。
First, the conversation
以上で、顧客対応システム100の動作の説明を終了する。
Above, description of operation | movement of the
1 … 自動会話装置
10 … 会話装置
20、20A… 会話サーバ
30 …会話シナリオ編集装置
40 …会話シナリオ
100 …顧客対応システム
130 …専門家側端末装置
140 …会話ログDB
150 …会話ログ分析装置
DESCRIPTION OF
150 ... Conversation log analyzer
Claims (1)
前記回答処理手段は、
前記第1の手段から任意のユーザ発話が送信された場合又は無言のまま一定期間が経過した場合、会話シナリオに基づいて第1の回答文を決定し、決定した第1の回答文及び当該第1の回答文に対応付けされた動作制御情報を前記第1の手段に送信する処理を、前記第1の手段から第1の特定のユーザ発話が送信されるまで繰り返し、前記第1の手段から前記第1の特定のユーザ発話が送信された場合、第2の回答文及び当該第2の回答文に対応づけされた動作制御情報を第1の手段に送信する第1の機能と、
前記第1の手段から送信された第3のユーザ発話に対して、会話シナリオに基づいて第3の回答文を決定し、決定した第3の回答文及びその第3の回答文に対応付けされた動作制御情報を前記第1の手段に送信し、前記第3のユーザ発話に対する第3の回答文が前記会話シナリオから発見できない場合にその第3のユーザ発話に対する回答を専門家に回答させるように、第3のユーザ発話を送信し、これに応じた回答内容を受信し、受信した回答内容を前記第1の手段に送信し、前記第3のユーザ発話、回答文、回答内容を記憶した会話ログを送信し、この会話ログに基づいて生成された会話シナリオを受信して記憶する第2の機能と、
ユーザ発話に対する回答文が現在のプランで対応できる場合には基本制御状態を第1の制御情報と決定して、次プラン指定情報にて指定された回答文を決定し、
ユーザ発話が現在の会話の終了を要求する場合には前記基本制御状態を第2の制御情報と決定して、会話を終了し、
ユーザ発話に対する回答文が現在のプランに対応できない場合には前記基本制御状態を第3の制御情報と決定して、前記現在のプランとは異なる他のプランから回答文を決定し、
ユーザ発話からユーザの意図が明瞭でない場合には前記基本制御状態を第4の制御情報と決定して、ユーザ発話をさらに引き出す第3の機能と、を有することを特徴とする顧客対応システム。 A customer response system having a first means for transmitting a user utterance and receiving an answer sentence thereof, and an answer processing means ,
The answer processing means includes
When an arbitrary user utterance is transmitted from the first means or when a certain period of time elapses without speech, the first answer sentence is determined based on the conversation scenario, and the determined first answer sentence and the first answer sentence The process of transmitting the operation control information associated with one answer sentence to the first means is repeated until a first specific user utterance is transmitted from the first means, and from the first means, If the first specific user utterance is transmitted, a first function of transmitting an operation control information correspondence to the second reply sentence and the second reply sentence to the first means,
For the third user utterance transmitted from the first means, a third answer sentence is determined based on a conversation scenario, and is associated with the determined third answer sentence and the third answer sentence. If the third answer sentence for the third user utterance cannot be found from the conversation scenario, the expert responds to the answer to the third user utterance. The third user utterance is transmitted, the response content corresponding thereto is received, the received response content is transmitted to the first means, and the third user utterance, the response sentence, and the response content are stored. A second function for transmitting a conversation log and receiving and storing a conversation scenario generated based on the conversation log;
If the response to the user utterance can be handled by the current plan , the basic control state is determined as the first control information, the response specified in the next plan specification information is determined,
When the user utterance requests termination of the current conversation, the basic control state is determined as the second control information, the conversation is terminated,
If an answer sentence to the user utterance cannot correspond to the current plan , the basic control state is determined as the third control information, an answer sentence is determined from another plan different from the current plan ,
And a third function for further determining the basic control state as the fourth control information when the user's intention is not clear from the user utterance, and further extracting the user utterance.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009150146A JP5897240B2 (en) | 2008-08-20 | 2009-06-24 | Customer service system and conversation server |
US12/542,170 US8374859B2 (en) | 2008-08-20 | 2009-08-17 | Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method |
EP09168152.8A EP2157571B1 (en) | 2008-08-20 | 2009-08-19 | Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method |
CN200910167065.4A CN101656800B (en) | 2008-08-20 | 2009-08-19 | Automatic answering device and method thereof, conversation scenario editing device, conversation server |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008212190 | 2008-08-20 | ||
JP2008212190 | 2008-08-20 | ||
JP2009150146A JP5897240B2 (en) | 2008-08-20 | 2009-06-24 | Customer service system and conversation server |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010073191A JP2010073191A (en) | 2010-04-02 |
JP5897240B2 true JP5897240B2 (en) | 2016-03-30 |
Family
ID=41710876
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009150147A Active JP5829000B2 (en) | 2008-08-20 | 2009-06-24 | Conversation scenario editing device |
JP2009150146A Active JP5897240B2 (en) | 2008-08-20 | 2009-06-24 | Customer service system and conversation server |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009150147A Active JP5829000B2 (en) | 2008-08-20 | 2009-06-24 | Conversation scenario editing device |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP5829000B2 (en) |
CN (1) | CN101656800B (en) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013072887A (en) * | 2011-09-26 | 2013-04-22 | Toshiba Corp | Interactive device |
WO2014020835A1 (en) * | 2012-07-31 | 2014-02-06 | 日本電気株式会社 | Agent control system, method, and program |
KR101508429B1 (en) * | 2013-08-22 | 2015-04-07 | 주식회사 엘지씨엔에스 | System and method for providing agent service to user terminal |
JP2015129793A (en) * | 2014-01-06 | 2015-07-16 | 株式会社デンソー | Voice recognition apparatus |
JP6255274B2 (en) * | 2014-02-19 | 2017-12-27 | シャープ株式会社 | Information processing apparatus, voice dialogue apparatus, and control program |
JP2015184563A (en) * | 2014-03-25 | 2015-10-22 | シャープ株式会社 | Interactive household electrical system, server device, interactive household electrical appliance, method for household electrical system to interact, and program for realizing the same by computer |
JP6271361B2 (en) * | 2014-07-18 | 2018-01-31 | ヤフー株式会社 | Information processing apparatus, information processing method, and information processing program |
US10778754B2 (en) * | 2015-05-05 | 2020-09-15 | Telecom Italia S.P.A. | Subscriber session re-distribution in a communication network |
KR20160136837A (en) * | 2015-05-21 | 2016-11-30 | 라인 가부시키가이샤 | Method, system and recording medium for providing content in messenger |
JP2017146782A (en) * | 2016-02-17 | 2017-08-24 | ソニー株式会社 | Information processing apparatus, information processing method, and program |
WO2018097181A1 (en) * | 2016-11-25 | 2018-05-31 | 株式会社 東芝 | Knowledge construction and utilization system and program |
JP2018159729A (en) * | 2017-03-22 | 2018-10-11 | 株式会社東芝 | Interaction system construction support device, method and program |
US11126920B2 (en) | 2017-05-12 | 2021-09-21 | Fujitsu Limited | Interaction scenario display control method and information processing apparatus |
WO2019026716A1 (en) * | 2017-08-04 | 2019-02-07 | ソニー株式会社 | Information processing device and information processing method |
JP6695850B2 (en) * | 2017-12-27 | 2020-05-20 | ヤフー株式会社 | Information processing apparatus, information processing method, and information processing program |
US10997222B2 (en) * | 2018-06-29 | 2021-05-04 | International Business Machines Corporation | Conversational agent dialog flow user interface |
CN110570866A (en) * | 2019-09-11 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | Voice skill creating method, device, electronic equipment and medium |
CN111243587A (en) * | 2020-01-08 | 2020-06-05 | 北京松果电子有限公司 | Voice interaction method, device, equipment and storage medium |
US20230335128A1 (en) * | 2020-04-24 | 2023-10-19 | Easy Dialog G.K. | Assistance device, conversation control device, and program |
JP2022067823A (en) * | 2020-10-21 | 2022-05-09 | 学校法人早稲田大学 | Information reproduction program, information reproduction method, information processing device, and data structure |
CN113609273A (en) * | 2021-08-12 | 2021-11-05 | 云知声(上海)智能科技有限公司 | Method and device for configuring mechanical speech technology, electronic equipment and storage medium |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3378595B2 (en) * | 1992-09-30 | 2003-02-17 | 株式会社日立製作所 | Spoken dialogue system and dialogue progress control method thereof |
JPH1125174A (en) * | 1997-07-02 | 1999-01-29 | Nec Corp | System and method for automatically sending answer in help disk system and recording medium recording automatic answer sending program |
JP3178426B2 (en) * | 1998-07-29 | 2001-06-18 | 日本電気株式会社 | Natural language dialogue system and natural language dialogue program recording medium |
US7137126B1 (en) * | 1998-10-02 | 2006-11-14 | International Business Machines Corporation | Conversational computing via conversational virtual machine |
US6314402B1 (en) * | 1999-04-23 | 2001-11-06 | Nuance Communications | Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system |
JP2001236401A (en) * | 2000-02-24 | 2001-08-31 | Nec Eng Ltd | Device and method for answering by help desk system and recording medium with control program recording thereon |
JP2001273310A (en) * | 2000-03-27 | 2001-10-05 | Livlib Co Ltd | Various inquiry/answer service system through internet and intranet |
JP3654850B2 (en) * | 2000-05-17 | 2005-06-02 | 松下電器産業株式会社 | Information retrieval system |
JP2002169818A (en) * | 2000-12-04 | 2002-06-14 | Sanyo Electric Co Ltd | Device and system for supporting user |
WO2002060162A2 (en) * | 2000-11-30 | 2002-08-01 | Enterprise Integration Group, Inc. | Method and system for preventing error amplification in natural language dialogues |
JP4336808B2 (en) * | 2000-11-30 | 2009-09-30 | 富士通株式会社 | Spoken dialogue program generation system and recording medium |
JP3450823B2 (en) * | 2000-12-01 | 2003-09-29 | 株式会社ナムコ | Simulated conversation system, simulated conversation method, and information storage medium |
US6882723B1 (en) * | 2001-03-05 | 2005-04-19 | Verizon Corporate Services Group Inc. | Apparatus and method for quantifying an automation benefit of an automated response system |
JP2002287791A (en) * | 2001-03-21 | 2002-10-04 | Global Data System Co Ltd | Intellectual interactive device based on voice recognition using expert system and its method |
JP2002324019A (en) * | 2001-04-24 | 2002-11-08 | Sony Communication Network Corp | Virtual world presentment method, virtual world presentment system, user terminal that can be used for these, server and computer program |
JP2004054883A (en) * | 2001-11-13 | 2004-02-19 | Equos Research Co Ltd | Onboard agent system and interactive operation control system |
JP4132962B2 (en) * | 2002-05-16 | 2008-08-13 | パイオニア株式会社 | Interactive information providing apparatus, interactive information providing program, and storage medium storing the same |
JP3945356B2 (en) * | 2002-09-17 | 2007-07-18 | 株式会社デンソー | Spoken dialogue apparatus and program |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
JP2004355386A (en) * | 2003-05-29 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | Method and apparatus for repeating question conversation in question-answer system, question conversation repeating program and recording medium with question conversation repeating program recorded thereon |
JP4408665B2 (en) * | 2003-08-11 | 2010-02-03 | 富士通株式会社 | Speech recognition apparatus for speech recognition, speech data collection method for speech recognition, and computer program |
JP2006133296A (en) * | 2004-11-02 | 2006-05-25 | Matsushita Electric Ind Co Ltd | Voice interactive device |
JP2006277519A (en) * | 2005-03-30 | 2006-10-12 | Toshiba Corp | Interaction device, interaction scenario editing device, interaction method and program |
JP2007114621A (en) * | 2005-10-21 | 2007-05-10 | Aruze Corp | Conversation controller |
JP4849662B2 (en) * | 2005-10-21 | 2012-01-11 | 株式会社ユニバーサルエンターテインメント | Conversation control device |
JP2008052449A (en) * | 2006-08-23 | 2008-03-06 | Synapse Communications Kk | Interactive agent system and method |
CN101075435B (en) * | 2007-04-19 | 2011-05-18 | 深圳先进技术研究院 | Intelligent chatting system and its realizing method |
CN101122972A (en) * | 2007-09-01 | 2008-02-13 | 腾讯科技(深圳)有限公司 | Virtual pet chatting system, method and virtual pet server for answering question |
-
2009
- 2009-06-24 JP JP2009150147A patent/JP5829000B2/en active Active
- 2009-06-24 JP JP2009150146A patent/JP5897240B2/en active Active
- 2009-08-19 CN CN200910167065.4A patent/CN101656800B/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010073192A (en) | 2010-04-02 |
CN101656800B (en) | 2013-07-24 |
CN101656800A (en) | 2010-02-24 |
JP2010073191A (en) | 2010-04-02 |
JP5829000B2 (en) | 2015-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5897240B2 (en) | Customer service system and conversation server | |
JP5149737B2 (en) | Automatic conversation system and conversation scenario editing device | |
EP2157571B1 (en) | Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method | |
US20200395008A1 (en) | Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models | |
CN107944027B (en) | Method and system for creating semantic key index | |
Zajic et al. | Single-document and multi-document summarization techniques for email threads using sentence compression | |
US20140046876A1 (en) | System and method of providing a computer-generated response | |
CN108228132A (en) | Promote the establishment and playback of audio that user records | |
JP6345577B2 (en) | Information providing system, information providing method, program, and data structure | |
Nedoluzhko et al. | ELITR Minuting Corpus: A novel dataset for automatic minuting from multi-party meetings in English and Czech | |
Yadav et al. | Automatic annotation of voice forum content for rural users and evaluation of relevance | |
JP5420874B2 (en) | Digital story providing system, digital story providing method, and computer program for causing computer system to execute this method | |
US20170316807A1 (en) | Systems and methods for creating whiteboard animation videos | |
Cuomo et al. | A virtual assistant in cultural heritage scenarios | |
Kim et al. | Extracting keywords from multi-party live chats | |
Maladry et al. | The limitations of irony detection in dutch social media | |
US10531154B2 (en) | Viewer-relation broadcasting buffer | |
Sodré et al. | Chatbot Optimization using Sentiment Analysis and Timeline Navigation | |
Gohsen et al. | Guiding Oral Conversations: How to Nudge Users Towards Asking Questions? | |
JP5378717B2 (en) | Conversation control system and terminal device | |
Tonkin et al. | Using the crowd to update cultural heritage catalogue | |
US20240070434A1 (en) | Conversational knowledge base | |
Hrešková et al. | Haiku poetry generation using interactive evolution vs. poem models | |
Jorgensen | Utilizing Natural Language Processing to Produce and Present Film: An Exploratory Analysis | |
Eskevich | Towards effective retrieval of spontaneous conversational spoken content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110224 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120509 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120509 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140411 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141120 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20141128 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20150109 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160302 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5897240 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |