JP2021157419A - Interactive business support system and interactive business support method - Google Patents

Interactive business support system and interactive business support method Download PDF

Info

Publication number
JP2021157419A
JP2021157419A JP2020056247A JP2020056247A JP2021157419A JP 2021157419 A JP2021157419 A JP 2021157419A JP 2020056247 A JP2020056247 A JP 2020056247A JP 2020056247 A JP2020056247 A JP 2020056247A JP 2021157419 A JP2021157419 A JP 2021157419A
Authority
JP
Japan
Prior art keywords
customer
person
charge
utterance
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020056247A
Other languages
Japanese (ja)
Inventor
日向 岡崎
Hyuga Okazaki
日向 岡崎
賢佑 追立
Kensuke Oitate
賢佑 追立
程 張
Cheng Zhang
程 張
夏輝 佐久間
Natsuki Sakuma
夏輝 佐久間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Priority to JP2020056247A priority Critical patent/JP2021157419A/en
Publication of JP2021157419A publication Critical patent/JP2021157419A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To enable a person in charge of a business to produce a speech with an optimal content when he/she produces the speech responding to a speech of a customer in the business.SOLUTION: In an interactive business support system, voice of a customer is input from a customer terminal, voice of a person in charge is received from a person-in-charge terminal to be transmitted to a voice recognition server and a feeling analysis server. The voice recognition server converts the received voice into speech text, transmits the speech text to an interactive business support device, and the feeling analysis server calculates feeling scores representing feelings of the customer for every speech from the received voice to be transmitted to the interactive business support device. The interactive business support device calculates speech candidates, and prediction scores for every affirmation, negation, subject conversion as a response pattern of the person in charge to the speech of the customer by inference of machine learning for considering data of interaction between the customer and the person in charge with high skill in the past as teacher data on the basis of the speech text and the feeling scores, and displays the calculated speech candidates and the calculated prediction scores on the person-in-charge terminal.SELECTED DRAWING: Figure 8

Description

本発明は、対話型業務支援システムおよび対話型業務支援方法に係り、特に、業務担当者が、業務時に顧客の発話に応答する発話を行う場合に、最適な内容の発話を行うのに好適な対話型業務支援システムおよび対話型業務支援方法に関する。 The present invention relates to an interactive business support system and an interactive business support method, and is particularly suitable for uttering the optimum content when a business person makes an utterance in response to a customer's utterance during business. Regarding interactive business support system and interactive business support method.

現状の顧客対応業務においては、業務担当者(以下、単に「担当者」という)と顧客がコミュニケーションを取り、顧客との関係性構築やトラブル対応等を行うのが一般的である。このような場合に、業務に熟練した担当者やコミュニケーション能力に優れた担当者ならよいが、コミュニケーションを上手く取れない担当者やスキル不足担当者の場合には、顧客の対応において、顧客の発話に対して適切な対応が取れず顧客の満足度低下により、販売機会損失による売上減少やクレームにつながるおそれがある。 In the current customer service business, it is common for the person in charge of business (hereinafter, simply referred to as "person in charge") and the customer to communicate with each other to build a relationship with the customer and deal with troubles. In such a case, a person who is skilled in business or a person who has excellent communication ability is sufficient, but in the case of a person who cannot communicate well or a person who lacks skills, in dealing with the customer, the customer speaks. On the other hand, if appropriate measures cannot be taken and customer satisfaction declines, sales may decrease due to lost sales opportunities and complaints may occur.

このような顧客と担当者が対話を行う対話型の業務において、担当者の対応を情報処理装置により、支援するシステムが知られている。 In such an interactive business in which a customer and a person in charge have a dialogue, a system is known that supports the correspondence of the person in charge by an information processing device.

例えば、特許文献1には、ランキングサイトの情報に基づいて、質問文の回答候補を生成し、その質問文と回答により、対話シナリオに生成する対話シナリオ生成装置が開示されている。 For example, Patent Document 1 discloses a dialogue scenario generator that generates answer candidates for a question sentence based on information on a ranking site and generates a dialogue scenario based on the question sentence and the answer.

特開2018−180936号公報Japanese Unexamined Patent Publication No. 2018-180936

一般に、従来技術では、顧客満足度低下を防ぐため、顧客の発生した音声を解析することにより、顧客の感情状態可視化や、パターンによる応対文の抽出で、顧客対応を支援する既存システムが存在する。 In general, in the conventional technology, in order to prevent a decrease in customer satisfaction, there is an existing system that supports customer response by visualizing the emotional state of the customer by analyzing the voice generated by the customer and extracting the response sentence by the pattern. ..

しかしながら、顧客の感情状態を可視化しても、担当者は、具体的に次に何を話せばよいかわからないことが課題となる。また、特許文献1のような技術によると、パターンによる応対文の抽出では、肯定的な対応やシナリオ通りにしか対応できないことが課題となる。 However, even if the emotional state of the customer is visualized, the problem is that the person in charge does not know what to say next. Further, according to a technique such as Patent Document 1, in extracting a response sentence by a pattern, it is a problem that a positive response or a response can be made only according to a scenario.

本発明の目的は、業務担当者が、業務時に顧客の発話に応答する発話を行う場合に、最適な内容の発話を行うことができる対話型業務支援システムおよび対話型業務支援方法を提供することにある。 An object of the present invention is to provide an interactive business support system and an interactive business support method capable of making an utterance having an optimum content when a business person makes an utterance in response to a customer's utterance during business. It is in.

本発明に係る対話型業務支援システムは、好ましくは、顧客の発話に業務の担当者が応答する際の発話を提示することにより、業務を支援する対話型業務支援システムであって、顧客から音声を入力する顧客端末と、担当者から音声を入力し、担当者の発話候補を表示する担当者端末と、顧客の音声と担当者の音声とを受取り、発話テキストに変換して、出力する音声認識サーバと、顧客の音声と担当者の音声とを受取り、感情スコアに変換して、出力する感情分析サーバと、音声認識サーバが出力した音声と、音声認識サーバが出力した感情スコアとを入力して、担当者の発話候補を生成し、表示する対話型業務支援装置とを有し、対話型業務支援装置は、顧客の発話に対する担当者の発話の応答パターンの分類ごとに、発話候補と、その発話候補の評価値となる予測スコアを表示するようにしたものである。
本発明はまた、対話型業務支援方法としても把握される。
The interactive business support system according to the present invention is preferably an interactive business support system that supports business by presenting an utterance when a person in charge of business responds to a customer's utterance, and is a voice from the customer. The customer terminal that inputs the voice, the person in charge terminal that inputs the voice from the person in charge and displays the speech candidate of the person in charge, the voice of the customer and the voice of the person in charge are received, converted into the voice text, and output. The recognition server receives the voice of the customer and the voice of the person in charge, converts it into an emotion score, and outputs it. The emotion analysis server, the voice output by the voice recognition server, and the emotion score output by the voice recognition server are input. Then, it has an interactive business support device that generates and displays a speech candidate of the person in charge, and the interactive business support device is a speech candidate for each classification of the response pattern of the person in charge to the customer's speech. , The predicted score, which is the evaluation value of the speech candidate, is displayed.
The present invention is also grasped as an interactive business support method.

本発明によれば、業務担当者が、業務時に顧客の発話に応答する発話を行う場合に、最適な内容の発話を行うことができる対話型業務支援システムおよび対話型業務支援方法を提供することができる。 According to the present invention, it is possible to provide an interactive business support system and an interactive business support method capable of making an utterance having an optimum content when a business person makes an utterance in response to a customer's utterance during business. Can be done.

対話型業務支援システムの構成とデータフロを示す図である。It is a figure which shows the structure and data flow of an interactive business support system. 対話型業務支援装置の機能構成図である。It is a functional block diagram of an interactive business support device. 対話型業務支援装置のハードウェア・ソフトウェア構成図である。It is a hardware / software configuration diagram of an interactive business support device. 話題抽出モデルの一例を示す図である。It is a figure which shows an example of a topic extraction model. シナリオ判定モデルの一例を示す図である。It is a figure which shows an example of a scenario determination model. 関心度判定モデルの一例を示す図である。It is a figure which shows an example of the interest degree determination model. 発話候補生成モデルの一例を示す図である。It is a figure which shows an example of the utterance candidate generation model. 顧客反応予測モデルの一例を示す図である。It is a figure which shows an example of the customer reaction prediction model. 現状理解情報テーブルの一例を示す図である。It is a figure which shows an example of the present state understanding information table. 候補生成テーブルの一例を示す図である。It is a figure which shows an example of a candidate generation table. 対話型業務支援装置が行う一連の処理について説明するフローチャートである。It is a flowchart explaining a series of processing performed by an interactive business support apparatus. 担当者発話支援画面の一例を示す図である。It is a figure which shows an example of the person in charge utterance support screen.

以下、本発明に係る各実施形態を、図1ないし図8を用いて説明する。 Hereinafter, each embodiment of the present invention will be described with reference to FIGS. 1 to 8.

先ず、図1および図2を用いて対話型業務支援システムの構成について説明する。
本実施形態の対話型業務支援システムは、顧客が担当者と対話しながら、業務を行う場合に、顧客の発話に対して、担当者がその応答となる発話の候補を示して、業務支援を行うものである。
First, the configuration of the interactive business support system will be described with reference to FIGS. 1 and 2.
In the interactive business support system of the present embodiment, when a customer conducts business while interacting with a person in charge, the person in charge indicates a candidate for utterance that is a response to the customer's utterance to provide business support. It is something to do.

本実施形態の対話型業務支援システムは、図1に示されるように、顧客端末10、担当者端末20、コミュニケーションサーバ40、対話型業務支援装置100、音声認識サーバ60、感情分析サーバ80がネットワークにより接続された形態である。 In the interactive business support system of the present embodiment, as shown in FIG. 1, a customer terminal 10, a person in charge terminal 20, a communication server 40, an interactive business support device 100, a voice recognition server 60, and a sentiment analysis server 80 are networked. It is a form connected by.

顧客端末10は、顧客が音声を入力して、担当者と対話を行うための端末である。それに対する担当者端末20は、担当者が音声を入力して、業務のために顧客と対話を行うための端末である。コミュニケーションサーバ40は、顧客端末10と担当者端末20のなかだちをし、相互に音声を伝えるためのサーバである。ここで、顧客端末10と、担当者端末20は、電話端末であって、コミュニケーションサーバ40は、交換機を介したCTIサーバであってもよいし、顧客端末10と、担当者端末20は、PC(Personal Computer)のような情報処理装置で、音声チャットやTV電話などの手段により、顧客と担当者が、対話を行うようにしてもよい。 The customer terminal 10 is a terminal for a customer to input voice and have a dialogue with a person in charge. The person in charge terminal 20 is a terminal for the person in charge to input voice and have a dialogue with a customer for business. The communication server 40 is a server for communicating voice with each other between the customer terminal 10 and the person in charge terminal 20. Here, the customer terminal 10 and the person in charge terminal 20 may be a telephone terminal, the communication server 40 may be a CTI server via an exchange, and the customer terminal 10 and the person in charge terminal 20 may be a PC. In an information processing device such as (Personal Computer), the customer and the person in charge may have a dialogue by means such as voice chat and TV telephone.

音声認識サーバ60は、顧客端末10から入力される顧客の音声と、担当者端末20から入力される担当者の音声とに対して、音声認識を行い、テキストを生成するサーバである。音声認識サーバ60は、顧客端末10と担当者端末20から送信されてくる発話の音声に対して、音声認識を行い、個々の発話を特定できる形式で、それぞれテキストに変換して、対話型業務支援装置100に送信する。ここで、発話とは、ある一定の既存により、通話を区切った単位であり、音声認識サーバ60は、音声認識をするときの単位として取り扱う。 The voice recognition server 60 is a server that performs voice recognition on the customer's voice input from the customer terminal 10 and the voice of the person in charge input from the person in charge terminal 20, and generates a text. The voice recognition server 60 performs voice recognition on the voices of utterances transmitted from the customer terminal 10 and the person in charge terminal 20, converts each utterance into text in a format that can identify each utterance, and performs interactive work. It is transmitted to the support device 100. Here, the utterance is a unit that divides the call according to a certain existing state, and the voice recognition server 60 handles it as a unit for voice recognition.

感情分析サーバ80は、顧客端末10から入力される顧客の音声の特徴量(抑揚や声の大きさなど)から、感情分析を行い、感情スコアを算出するサーバである。感情スコアは、対話型業務支援装置100に送信される。なお、感情スコアについては、後に詳説する。 The emotion analysis server 80 is a server that performs emotion analysis and calculates an emotion score from the feature amount (inflection, loudness, etc.) of the customer's voice input from the customer terminal 10. The emotion score is transmitted to the interactive business support device 100. The emotion score will be described in detail later.

対話型業務支援装置100は、既存のモデル(詳細は後述)に基づいて、顧客と担当者の対話から、顧客の発話に対して、担当者が発話するべき候補とその付加情報を求めて、それらを担当者に表示する装置である。 Based on an existing model (details will be described later), the interactive business support device 100 seeks candidates to be spoken by the person in charge and additional information thereof in response to the customer's utterance from the dialogue between the customer and the person in charge. It is a device that displays them to the person in charge.

次に、対話型業務支援装置100の機能構成について説明する。
対話型業務支援装置100は、図2に示されるように、話題抽出部110、シナリオ判定部120、関心度判定部130、発話候補生成部140、顧客反応予側部150、表示出力部160、記憶部170の各構成部よりなる。
Next, the functional configuration of the interactive business support device 100 will be described.
As shown in FIG. 2, the interactive business support device 100 includes a topic extraction unit 110, a scenario determination unit 120, an interest level determination unit 130, an utterance candidate generation unit 140, a customer reaction prediction side unit 150, and a display output unit 160. It is composed of each component of the storage unit 170.

話題抽出部110は、入力される顧客と担当者の対話から、話のトピックを抽出する機能部である。シナリオ判定部120は、発話の大分類となるシナリオ(日常会話、商談、顧客事情など)を判定する機能部である。関心度判定部130は、顧客と担当者の対話の内容について、関心度を判定する機能部である。発話候補生成部140は、顧客の発話に対して、担当者が応答すべき発話の候補を生成する機能部である。顧客反応予側部150は、発話の候補に対して、顧客の反応を予測スコアとして数値化して求める機能部である。表示出力部160は、発話の候補とその発話候補の評価値となる予測スコアを、担当者に出力して表示する機能部である。記憶部170は、対話型業務支援装置で使用されるデータを記憶する機能部である。 The topic extraction unit 110 is a functional unit that extracts the topic of the story from the input dialogue between the customer and the person in charge. The scenario determination unit 120 is a function unit that determines a scenario (daily conversation, business negotiation, customer situation, etc.) that is a major classification of utterances. The interest level determination unit 130 is a functional unit that determines the degree of interest in the content of the dialogue between the customer and the person in charge. The utterance candidate generation unit 140 is a functional unit that generates utterance candidates for which the person in charge should respond to the customer's utterance. The customer reaction prediction side unit 150 is a functional unit that quantifies and obtains the customer's reaction as a prediction score for the utterance candidate. The display output unit 160 is a functional unit that outputs and displays the utterance candidate and the predicted score that is the evaluation value of the utterance candidate to the person in charge. The storage unit 170 is a functional unit that stores data used in the interactive business support device.

記憶部170には、図2に示されるように、話題抽出モデル200、シナリオ判定モデル201、関心度判定モデル202、発話候補生成モデル203、顧客反応予測モデル204、現状理解情報テーブル300、候補生成テーブル301が保持される。なお、各モデルとテーブルの詳細は、後に説明する。 As shown in FIG. 2, the storage unit 170 includes a topic extraction model 200, a scenario determination model 201, an interest degree determination model 202, an utterance candidate generation model 203, a customer reaction prediction model 204, a current status understanding information table 300, and a candidate generation. Table 301 is held. The details of each model and table will be described later.

次に、図3を用いて対話型業務支援装置のハードウェア・ソフトウェア構成について説明する。
対話型業務支援装置100のハードウェア構成としては、例えば、図3に示されるパーソナルコンピュータのような一般的な情報処理装置で実現される。
Next, the hardware / software configuration of the interactive business support device will be described with reference to FIG.
The hardware configuration of the interactive business support device 100 is realized by, for example, a general information processing device such as the personal computer shown in FIG.

対話型業務支援装置100は、CPU(Central Processing Unit)402、主記憶装置404、ネットワークI/F(InterFace)406、表示I/F408、入出力I/F410、補助記憶I/F412が、バスにより結合された形態になっている。 The interactive business support device 100 includes a CPU (Central Processing Unit) 402, a main storage device 404, a network I / F (InterFace) 406, a display I / F 408, an input / output I / F 410, and an auxiliary storage I / F 412 by bus. It is in a combined form.

CPU402は、対話型業務支援装置100の各部を制御し、主記憶装置404に必要なプログラムをロードして実行する。 The CPU 402 controls each part of the interactive business support device 100, and loads and executes a program required for the main storage device 404.

主記憶装置404は、通常、RAMなどの揮発メモリで構成され、CPU402が実行するプログラム、参照するデータが記憶される。 The main storage device 404 is usually composed of a volatile memory such as a RAM, and stores a program executed by the CPU 402 and data to be referred to.

ネットワークI/F406は、ネットワークと接続するためのインタフェースである。 The network I / F406 is an interface for connecting to a network.

表示I/F408は、LCD(Liquid Crystal Display)などの表示装置420を接続するためのインタフェースである。 The display I / F 408 is an interface for connecting a display device 420 such as an LCD (Liquid Crystal Display).

入出力I/F410は、入出力装置を接続するためのインタフェースである。図3の例では、キーボード430とポインティングデバイスのマウス432が接続されている。 The input / output I / F 410 is an interface for connecting an input / output device. In the example of FIG. 3, the keyboard 430 and the mouse 432 of the pointing device are connected.

補助記憶I/F412は、HDD(Hard Disk Drive)450やSSD(Solid State Drive)などの補助記憶装置を接続するためのインタフェースである。 The auxiliary storage I / F412 is an interface for connecting an auxiliary storage device such as an HDD (Hard Disk Drive) 450 or an SSD (Solid State Drive).

HDD450は、大容量の記憶容量を有しており、本実施形態を実行するためのプログラムが格納されている。対話型業務支援装置100には、話題抽出プログラム461、シナリオ判定プログラム462、関心度判定プログラム463、発話候補生成プログラム464、顧客反応予側プログラム465、表示出力プログラム466がインストールされている。 The HDD 450 has a large storage capacity, and stores a program for executing the present embodiment. The topic extraction program 461, the scenario determination program 462, the interest level determination program 463, the utterance candidate generation program 464, the customer reaction prediction side program 465, and the display output program 466 are installed in the interactive business support device 100.

話題抽出プログラム461、シナリオ判定プログラム462、関心度判定プログラム463、発話候補生成プログラム464、顧客反応予側プログラム465、表示出力プログラム466は、それぞれ話題抽出部110、シナリオ判定部120、関心度判定部130、発話候補生成部140、顧客反応予側部150、表示出力部160の機能を実行するプログラムである。 The topic extraction program 461, the scenario determination program 462, the interest level determination program 463, the utterance candidate generation program 464, the customer reaction prediction side program 465, and the display output program 466 are the topic extraction unit 110, the scenario determination unit 120, and the interest level determination unit, respectively. This is a program that executes the functions of 130, the utterance candidate generation unit 140, the customer reaction prediction side unit 150, and the display output unit 160.

また、HDD450には、話題抽出モデル200、シナリオ判定モデル201、関心度判定モデル202、発話候補生成モデル203、顧客反応予測モデル204、現状理解情報テーブル300、候補生成テーブル301が格納されている。 Further, the HDD 450 stores a topic extraction model 200, a scenario determination model 201, an interest degree determination model 202, an utterance candidate generation model 203, a customer reaction prediction model 204, a current status understanding information table 300, and a candidate generation table 301.

次に、図4Aないし図6を用いて対話型業務支援装置で用いられるデータ構造について説明する。
話題抽出モデル200は、教師データあり機械学習の手法により、トピックを求めるためのモデルであり、図4Aに示されるように、発話主体、発話テキスト、トピックの項目からなる教師データから、発話テキスト、トピックの正解データを対応付けるモデルである。発話主体には、その発話の主体に従って、「顧客」、「担当者」のいずれかが格納される。発話テキストには、過去のスキルの高い担当者(いわゆる熟練者)の時系列順に並べられた顧客との発話履歴から持ってきたテキストが格納される。トピックには、その発話テキストに対してラベルづけしたトピックが格納される。
Next, the data structure used in the interactive business support device will be described with reference to FIGS. 4A to 6.
The topic extraction model 200 is a model for finding a topic by a machine learning method with teacher data, and as shown in FIG. 4A, the utterance text is composed of the utterance subject, the utterance text, and the teacher data consisting of the topic items. It is a model that associates the correct answer data of the topic. In the utterance subject, either a "customer" or a "person in charge" is stored according to the utterance subject. In the utterance text, the text brought from the utterance history with the customer arranged in chronological order of the person in charge (so-called expert) with high skill in the past is stored. The topic stores the topic labeled for the spoken text.

なお、発話主体、発話テキストは、以下のモデルについても同様である。 The utterance subject and the utterance text are the same for the following models.

シナリオ判定モデル201は、教師データあり機械学習の手法により、シナリオを求めるためのモデルであり、図4Bに示されるように、発話主体、発話テキスト、シナリオの項目からなる教師データから、発話テキスト、シナリオの正解データを対応付けるモデルである。シナリオは、既に説明したように、日常会話、商談、顧客事情などのように、発話の大分類とするものである。 The scenario judgment model 201 is a model for obtaining a scenario by a machine learning method with teacher data, and as shown in FIG. 4B, the utterance text is composed of the utterance subject, the utterance text, and the teacher data consisting of the scenario items. It is a model that associates the correct answer data of the scenario. As already explained, the scenario is a major classification of utterances such as daily conversation, business negotiations, and customer circumstances.

関心度判定モデル202は、教師データあり機械学習の手法により、感情スコアを求めるためのモデルであり、図4Cに示されるように、発話主体、発話テキスト、感情スコアの項目からなる教師データから、発話テキスト、感情スコアの正解データを対応付けるモデルである。 The interest degree determination model 202 is a model for obtaining an emotion score by a machine learning method with teacher data, and as shown in FIG. 4C, from teacher data consisting of an utterance subject, an utterance text, and an emotion score item, It is a model that associates correct answer data of utterance text and emotion score.

感情スコアは、顧客が担当者との対話の内容に、どれだけ関心を持っているかという感情を数値化したスコアであり、関心を持っているときに、数値が大きくなる。また、教師データの感情スコアは、発話主体が「顧客」のときにのみ有効であり、発話主体が「担当者」のときには、「−」(該当せず)になる。 The emotion score is a score that quantifies the emotion of how much the customer is interested in the content of the dialogue with the person in charge, and the numerical value increases when the customer is interested. Further, the emotion score of the teacher data is valid only when the uttering subject is the "customer", and becomes "-" (not applicable) when the uttering subject is the "person in charge".

発話候補生成モデル203は、教師データあり機械学習の手法により、担当者の発話候補を求めるためのモデルであり、図4Dに示されるように、発話主体、発話テキスト、シナリオ、関心度有無の項目からなる教師データから、発話テキストの正解データを対応付けるモデルである。関心度有無は、感情スコアの値より設定され、感情スコアが一定の閾値より以上のときには、関心度有無は、「有り」とされ、感情スコアが一定の閾値より未満のときには、関心度有無は、「無し」とされる。また、教師データの関心度有無は、発話主体が「顧客」のときにのみ有効であり、発話主体が「担当者」のときには、「−」(該当せず)になる。 The utterance candidate generation model 203 is a model for obtaining utterance candidates of the person in charge by a machine learning method with teacher data, and as shown in FIG. 4D, items of utterance subject, utterance text, scenario, and presence / absence of interest level. It is a model that associates the correct answer data of the utterance text with the teacher data consisting of. The presence or absence of interest is set from the value of the emotion score. When the emotion score is above a certain threshold, the presence or absence of interest is considered to be "yes", and when the emotion score is below a certain threshold, the presence or absence of interest is determined. , "None". The degree of interest in the teacher data is valid only when the uttering subject is the "customer", and is "-" (not applicable) when the uttering subject is the "person in charge".

なお、対話型業務支援装置100は、顧客の応答の分類が、「肯定」、「反論」、「話題転換」の場合について、それぞれ別のモデルを保持している。 The interactive business support device 100 holds different models for the cases where the classification of the customer's response is "affirmation", "counter-argument", and "topic change".

顧客反応予測モデル204は、教師データあり機械学習の手法により、予測スコアを求めるためのモデルであり、図4Eに示されるように、発話主体、発話テキスト、シナリオ、関心度有無の項目と、発話候補からなる教師データから、予測スコアの正解データを対応付けるモデルである。 The customer reaction prediction model 204 is a model for obtaining a prediction score by a machine learning method with teacher data, and as shown in FIG. 4E, the utterance subject, the utterance text, the scenario, the items of the degree of interest, and the utterance. It is a model that associates the correct answer data of the predicted score with the teacher data consisting of candidates.

予測スコアは、担当者がその発話候補の発話を選択したときの評価スコアであり、予測スコアが高いほど適切なスコアであると評価される。また、また、教師データの予測スコアは、発話主体が「担当者」のときにのみ有効であり、発話主体が「顧客」のときには、「−」(該当せず)になる。 The predicted score is an evaluation score when the person in charge selects the utterance of the utterance candidate, and the higher the predicted score, the more appropriate the score is evaluated. Further, the predicted score of the teacher data is valid only when the uttering subject is the "person in charge", and becomes "-" (not applicable) when the uttering subject is the "customer".

なお、対話型業務支援装置100は、顧客の応答の分類が、「肯定」、「反論」、「話題転換」の場合について、それぞれ別のモデルを保持している。 The interactive business support device 100 holds different models for the cases where the classification of the customer's response is "affirmation", "counter-argument", and "topic change".

現状理解情報テーブル300は、これまでの実際に行った過去のN件(Nは、システムの運用により定められる正の整数)の顧客と担当者の発話に対して、推論により得た結果を対応付けるテーブルであり、図5に示されるように、発話主体300a、発話内容300b、トピック300c、ラベル300d、関心度有無300ceの各項目からなる。 The current state understanding information table 300 associates the results obtained by inference with the utterances of the past N cases (N is a positive integer determined by the operation of the system) actually performed so far by the customer and the person in charge. It is a table, and as shown in FIG. 5, it is composed of each item of the utterance subject 300a, the utterance content 300b, the topic 300c, the label 300d, and the presence / absence of interest 300ce.

発話主体300aは、顧客と担当者の対話における発話主体の「顧客」か「担当者」のいずれかが格納される。発話内容300bは、対話における発話のテキストが格納される。トピック300cには、教師データあり機械学習の手法により、話題抽出モデル200からの推論により求めたトピックの値が格納される。シナリオ300dには、教師データあり機械学習の手法により、シナリオ判定モデル201からの推論により求めたシナリオの値が格納される。関心度有無300には、教師データあり機械学習の手法により、関心度判定モデル202からの推論により求めた関心度有無の値が格納される。 In the utterance subject 300a, either the "customer" or the "person in charge" of the utterance subject in the dialogue between the customer and the person in charge is stored. The utterance content 300b stores the text of the utterance in the dialogue. The topic 300c stores the value of the topic obtained by inference from the topic extraction model 200 by the machine learning method with teacher data. In the scenario 300d, the value of the scenario obtained by inference from the scenario determination model 201 is stored by the method of machine learning with teacher data. The interest level presence / absence 300 stores the value of the interest level presence / absence obtained by inference from the interest level determination model 202 by the method of machine learning with teacher data.

候補生成テーブル301は、教師データあり機械学習の手法により、発話候補生成モデル203からの推論により求めた発話候補と、顧客反応予測モデル204からの推論により求めた予測スコアを保持するテーブルであり、図6に示されるように、分類301a、候補発話テキスト301b、予測スコア301cの各項目からなる。分類301aには、「肯定」、「反論」、「話題転換」のいずれかの値が格納される。「肯定」は、その候補となる担当者の発話が、前の顧客の発話に対して肯定的な意味合いを持つことを意味する。「反論」は、その逆であり、その候補となる担当者の発話が、前の顧客の発話に対して反論していることを意味する。「話題転換」は、前の顧客の発話に対して、話題転換していることを意味する。候補発話テキスト301bには、教師データあり機械学習の手法により、発話候補生成モデル203からの推論により求めた発話候補のテキストが格納される。予測スコア301cには、教師データあり機械学習の手法により、顧客反応予測モデル204からの推論により求めた予測スコアの値が格納される。 The candidate generation table 301 is a table that holds the utterance candidates obtained by inference from the utterance candidate generation model 203 and the prediction score obtained by inference from the customer reaction prediction model 204 by the method of machine learning with teacher data. As shown in FIG. 6, it is composed of each item of classification 301a, candidate utterance text 301b, and prediction score 301c. A value of any one of "affirmation", "counter-argument", and "topic change" is stored in the classification 301a. "Affirmation" means that the utterance of the candidate person has a positive meaning to the utterance of the previous customer. "Counter-argument" is the opposite, meaning that the utterance of the candidate person in charge is a counter-argument to the utterance of the previous customer. "Topic change" means that the topic is changed from the previous customer's utterance. The candidate utterance text 301b stores the utterance candidate text obtained by inference from the utterance candidate generation model 203 by a machine learning method with teacher data. In the prediction score 301c, the value of the prediction score obtained by inference from the customer reaction prediction model 204 by the machine learning method with teacher data is stored.

図6の候補生成テーブル301は、「肯定」、「反論」、「話題転換」ごとに一つの発話候補を示しているが、各々複数あってもよいし、予測スコアの値が一定の閾値より大きい発話候補を保持するようにしてもよい。 The candidate generation table 301 in FIG. 6 shows one utterance candidate for each of “affirmation”, “counter-argument”, and “topic change”, but there may be a plurality of each, and the value of the predicted score is above a certain threshold value. Large utterance candidates may be retained.

次に、図7および図8を用いて対話型業務支援装置が行う処理について説明する。 Next, the processing performed by the interactive business support device will be described with reference to FIGS. 7 and 8.

先ず、対話型業務支援装置100は、現状理解処理を行う(S100)。
現状理解処理は、これまでの顧客と担当者との対話に対して、教師データあり機械学習の手法により、各モデルを用いた推論により、トピック、シナリオ、関心度有無の値を得て、それを図5に示した現状理解情報テーブル300に格納する処理である。
First, the interactive business support device 100 performs the current status understanding process (S100).
In the current situation understanding process, the topic, scenario, and the value of the degree of interest are obtained by inference using each model by the machine learning method with teacher data for the dialogue between the customer and the person in charge so far. Is a process of storing in the current state understanding information table 300 shown in FIG.

トピック、シナリオ、関心度有無は、それぞれ、話題抽出モデル200、シナリオ判定モデル201、関心度判定モデル202に、発話テキストを入力した推論により得られる。 The topic, the scenario, and the presence / absence of the degree of interest are obtained by inference in which the utterance text is input to the topic extraction model 200, the scenario determination model 201, and the interest degree determination model 202, respectively.

次に、対話型業務支援装置100は、候補生成処理を行う(S101)。
候補生成処理は、発話候補生成モデル203に、パラメタとして、直前のN件(図5に示す例では、N=4)の現状理解情報テーブル300のレコードのデータを入力して、候補発話テキストを得る処理である。候補発話テキストは、図6に示した候補生成テーブル301に、分類ごとに、該当する項目に格納される。
Next, the interactive business support device 100 performs a candidate generation process (S101).
In the candidate generation process, the data of the record of the immediately preceding N cases (N = 4 in the example shown in FIG. 5) of the current state understanding information table 300 is input to the utterance candidate generation model 203 as a parameter, and the candidate utterance text is input. It is a process to obtain. The candidate utterance text is stored in the candidate generation table 301 shown in FIG. 6 in the corresponding item for each classification.

次に、対話型業務支援装置100は、顧客反応予測処理を行う(S102)。
顧客反応予測処理は、顧客反応予測モデルに、パラメタとして、直前のN件の現状理解情報テーブル300のレコードのデータと、S101で推論によって得た候補発話テキストを、入力して予測スコアを得る処理である。予測スコアは、図6に示した候補生成テーブル301に、分類ごとに、該当する項目に格納される。
Next, the interactive business support device 100 performs customer reaction prediction processing (S102).
The customer reaction prediction process is a process of inputting the data of the records of the immediately preceding N current situation understanding information table 300 and the candidate utterance text obtained by inference in S101 into the customer reaction prediction model as parameters to obtain a prediction score. Is. The predicted score is stored in the corresponding item in the candidate generation table 301 shown in FIG. 6 for each classification.

次に、対話型業務支援装置100は、表示出力処理を行う(S103)。
表示出力処理は、S101とS102の推論により得た候補発話テキストと、予測スコア、および、それらに付随する処理を、担当者に表示出力する処理であり、例えば、表示装置に、図8に示す担当者発話支援画面500を表示する。
Next, the interactive business support device 100 performs display output processing (S103).
The display output process is a process of displaying and outputting the candidate utterance text obtained by the inference of S101 and S102, the predicted score, and the process associated therewith to the person in charge. For example, it is shown on the display device in FIG. The person in charge speech support screen 500 is displayed.

担当者発話支援画面500は、担当者に、推論により得た候補発話テキストと、予測スコア、および、それらに付随する処理を、担当者に表示出力して、担当者の顧客に応答を支援する画面であり、図8に示されるように、発話候補表示領域410と時系列スコアグラフ表示領域420よりなる。 The person in charge utterance support screen 500 displays and outputs the candidate utterance text obtained by inference, the predicted score, and the processing associated therewith to the person in charge, and supports the customer in charge of the response. It is a screen, and as shown in FIG. 8, it is composed of an utterance candidate display area 410 and a time series score graph display area 420.

発話候補表示領域510は、候補生成テーブル301の内容、すなわち、分類ごとの担当者の候補となる発話とその予測スコアを表示する領域である。 The utterance candidate display area 510 is an area for displaying the contents of the candidate generation table 301, that is, the utterances that are candidates for the person in charge for each classification and their predicted scores.

時系列スコアグラフ表示領域520は、顧客と担当者の対話の流れを視覚的に分かりやすく示す時系列スコアグラフ521を表示する領域である。 The time-series score graph display area 520 is an area for displaying the time-series score graph 521 that visually shows the flow of dialogue between the customer and the person in charge.

時系列スコアグラフ521は、横軸に時間の流れ、縦軸にスコア(感情スコアと予測スコア)をとった折れ線グラフである。カレントマーカ522より、左側523は、直前までの対話の流れを現し、該当する点には、顧客の感情スコアが表示される。カレントマーカ522より、右側524は、それぞれの「肯定」、「反論」、「話題転換」ごとに、担当者が行う発話の候補に対する予測スコアが表示される。 The time-series score graph 521 is a line graph in which the horizontal axis is the flow of time and the vertical axis is the score (emotion score and predicted score). From the current marker 522, the left side 523 shows the flow of the dialogue until just before, and the customer's emotion score is displayed at the corresponding point. On the right side 524 of the current marker 522, the predicted score for the utterance candidate performed by the person in charge is displayed for each "affirmation", "counter-argument", and "topic change".

担当者発話支援画面500により、担当者は、これから行うべき発話とその発話を行った見通しの予測スコアを視覚的に分かりやすく理解することができる。 The person in charge utterance support screen 500 allows the person in charge to visually and easily understand the utterance to be made and the predicted score of the prospect of making the utterance.

以上、本実施形態により、ベテランの業務の担当者の対応を教師データとする機械学習を用いた手法により、担当者の行うべき発話の具体的な候補を、それぞれの「肯定」、「反論」、「話題転換」ということなった応答の分類ごとに示して、担当者の発話を示し、それの具体的な予測スコアを定量的に示すことによって、担当者は、より適切な発話を選択することができる。すなわち、生成した候補発話に対する顧客の反応(ポジティブ/ネガティブ)を予測し、状況に応じて最も顧客の反応がポジティブになる応答や顧客が提案に対してポジティブなタイミングを提案することができる。 As described above, according to this embodiment, specific candidates for utterances to be made by the person in charge can be selected as "affirmation" and "counter-argument" by the method using machine learning using the correspondence of the person in charge of veteran work as teacher data. , The person in charge selects a more appropriate utterance by showing the utterance of the person in charge by showing each classification of the response that is called "topic change" and quantitatively showing the concrete predicted score of the utterance. be able to. That is, it is possible to predict the customer's reaction (positive / negative) to the generated candidate utterance, and to propose a response in which the customer's reaction is most positive or a positive timing for the customer's proposal depending on the situation.

10…顧客端末、20…担当者端末、40…コミュニケーションサーバ、60…音声認識サーバ、80…感情分析サーバ、100…対話型業務支援装置 10 ... Customer terminal, 20 ... Person in charge terminal, 40 ... Communication server, 60 ... Voice recognition server, 80 ... Sentiment analysis server, 100 ... Interactive business support device

Claims (7)

顧客の発話に業務の担当者が応答する際の発話を提示することにより、業務を支援する対話型業務支援システムであって、
顧客から音声を入力する顧客端末と、
担当者から音声を入力し、担当者の発話候補を表示する担当者端末と、
前記顧客の音声と前記担当者の音声とを受取り、発話テキストに変換して、出力する音声認識サーバと、
前記顧客の音声と前記担当者の音声とを受取り、感情スコアに変換して、出力する感情分析サーバと、
前記音声認識サーバが出力した音声と、音声認識サーバが出力した感情スコアとを入力して、前記担当者の発話候補を生成し、表示する対話型業務支援装置とを有し、
前記対話型業務支援装置は、前記顧客の発話に対する前記担当者の発話の応答パターンの分類ごとに、発話候補と、その発話候補の評価値となる予測スコアを表示することを特徴とする対話型業務支援システム。
It is an interactive business support system that supports business by presenting the utterance when the person in charge of business responds to the customer's utterance.
A customer terminal that inputs voice from a customer and
The person in charge terminal that inputs voice from the person in charge and displays the utterance candidates of the person in charge,
A voice recognition server that receives the voice of the customer and the voice of the person in charge, converts it into spoken text, and outputs it.
An emotion analysis server that receives the voice of the customer and the voice of the person in charge, converts it into an emotion score, and outputs it.
It has an interactive business support device that inputs the voice output by the voice recognition server and the emotion score output by the voice recognition server to generate and display utterance candidates of the person in charge.
The interactive business support device is characterized in that it displays a utterance candidate and a predicted score as an evaluation value of the utterance candidate for each classification of the utterance response pattern of the person in charge to the customer's utterance. Business support system.
前記顧客の発話に対する前記担当者の発話の応答パターンの分類は、顧客の発話に対する肯定、反論、話題転換であることを特徴とする請求項1記載の対話型業務支援システム。 The interactive business support system according to claim 1, wherein the classification of the response pattern of the utterance of the person in charge to the utterance of the customer is an affirmation, a counterargument, and a topic change to the utterance of the customer. 前記対話型業務支援装置は、
顧客と業務の担当者の教師データありモデルによる機械学習の推論によって、前記発話候補を得ることを特徴とする請求項1記載の対話型業務支援システム。
The interactive business support device is
The interactive business support system according to claim 1, wherein the utterance candidate is obtained by machine learning inference based on a model with teacher data of a customer and a person in charge of business.
顧客と業務の担当者の教師データありモデルは、顧客と業務の対話のトピック、シナリオ、顧客の対話に対する関心度有無を含むことを特徴とする請求項2記載の対話型業務支援システム。 The interactive business support system according to claim 2, wherein the model with teacher data of the person in charge of the customer and the business includes the topic, the scenario, and the degree of interest in the dialogue between the customer and the business. 前記対話型業務支援装置は、
顧客と業務の担当者の教師データありモデルによる機械学習の推論によって、前記予測スコアを得ることを特徴とする請求項1記載の対話型業務支援システム。
The interactive business support device is
The interactive business support system according to claim 1, wherein the predicted score is obtained by machine learning inference based on a model with teacher data of a customer and a person in charge of business.
前記対話型業務支援装置は、
分類ごとに発話候補と予測スコアを示す画面を表示し、
前記画面に、時系列的に、発話ごとの顧客の感情スコアと、分類ごとの担当者の発話候補の予測スコアを示すことを特徴とする請求項1記載の対話型業務支援システム。
The interactive business support device is
Display a screen showing utterance candidates and predicted scores for each classification,
The interactive business support system according to claim 1, wherein the screen shows the customer's emotion score for each utterance and the predicted score of the utterance candidate of the person in charge for each classification in chronological order.
顧客の発話に業務の担当者が応答する際の発話を提示することにより、業務を支援する対話型業務支援方法であって、
顧客端末が、顧客から音声を入力するステップと、
担当者端末が、担当者から音声を入力するステップと、
音声認識サーバが、前記顧客の音声と前記担当者の音声とを受取り、発話テキストに変換して、出力するステップと、
感情分析サーバが、前記顧客の音声と前記担当者の音声とを受取り、感情スコアに変換して、出力するステップと
前記対話型業務支援装置が、顧客と業務の担当者の教師データありモデルによる機械学習の推論によって、前記担当者の発話候補を得るステップと、
前記対話型業務支援装置が、顧客と業務の担当者の教師データありモデルによる機械学習の推論によって、前記発話候補の評価値となる予測スコアを得るステップと、
前記顧客の発話に対する前記担当者の発話の応答パターンの分類として、顧客の発話に対する肯定、反論、話題転換ごとに、発話候補と、その予測スコアを表示するステップとを有することを特徴とする対話型業務支援方法。
It is an interactive business support method that supports business by presenting the utterance when the person in charge of business responds to the customer's utterance.
The step that the customer terminal inputs voice from the customer,
The step that the person in charge terminal inputs voice from the person in charge,
A step in which the voice recognition server receives the voice of the customer and the voice of the person in charge, converts it into utterance text, and outputs it.
The step that the sentiment analysis server receives the voice of the customer and the voice of the person in charge, converts it into an emotion score, and outputs it, and the interactive work support device are based on a model with teacher data of the customer and the person in charge of work. The step of obtaining the speech candidate of the person in charge by the reasoning of machine learning,
A step in which the interactive work support device obtains a predicted score as an evaluation value of the utterance candidate by machine learning inference based on a model with teacher data of a customer and a person in charge of work.
As a classification of the response pattern of the utterance of the person in charge to the utterance of the customer, the dialogue is characterized by having a utterance candidate and a step of displaying the predicted score for each affirmation, counterargument, and topic change to the customer's utterance. Type business support method.
JP2020056247A 2020-03-26 2020-03-26 Interactive business support system and interactive business support method Pending JP2021157419A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020056247A JP2021157419A (en) 2020-03-26 2020-03-26 Interactive business support system and interactive business support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020056247A JP2021157419A (en) 2020-03-26 2020-03-26 Interactive business support system and interactive business support method

Publications (1)

Publication Number Publication Date
JP2021157419A true JP2021157419A (en) 2021-10-07

Family

ID=77918386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020056247A Pending JP2021157419A (en) 2020-03-26 2020-03-26 Interactive business support system and interactive business support method

Country Status (1)

Country Link
JP (1) JP2021157419A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023243273A1 (en) * 2022-06-17 2023-12-21 国立研究開発法人情報通信研究機構 Utterance data generation device, interaction device, and method for creating generation model
JP7487986B1 (en) 2023-12-11 2024-05-21 株式会社コアバリュー EQ (emotional intelligence quotient) measuring device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023243273A1 (en) * 2022-06-17 2023-12-21 国立研究開発法人情報通信研究機構 Utterance data generation device, interaction device, and method for creating generation model
JP7487986B1 (en) 2023-12-11 2024-05-21 株式会社コアバリュー EQ (emotional intelligence quotient) measuring device

Similar Documents

Publication Publication Date Title
US11847422B2 (en) System and method for estimation of interlocutor intents and goals in turn-based electronic conversational flow
US11004013B2 (en) Training of chatbots from corpus of human-to-human chats
US10776580B2 (en) Method for providing dialogue service with chatbot assisted by human agents
US20200175964A1 (en) System and Method for a Computer User Interface for Exploring Conversational Flow with Selectable Details
US11770476B2 (en) Intent analysis for call center response generation
US20170213190A1 (en) Method and system for analysing subjects
US10764431B1 (en) Method for conversion and classification of data based on context
CN107818798A (en) Customer service quality evaluating method, device, equipment and storage medium
CN115335902A (en) System and method for automatic candidate evaluation in asynchronous video settings
US11736310B2 (en) Conversational AI for intelligent meeting service
JP2017016566A (en) Information processing device, information processing method and program
US11363141B2 (en) Systems and methods relating to asynchronous resolution of customer requests in contact center
US11120798B2 (en) Voice interface system for facilitating anonymized team feedback for a team health monitor
KR102523638B1 (en) Method of real time intent recognition
CN110475032A (en) Multi-service interface switching method, device, computer installation and storage medium
KR20190117840A (en) Method and computer readable recording medium for, during a customer consulting by a conversation understanding ai system, passing responsibility of proceeding with subsequent customer consulting to a human consultant
CA3147634A1 (en) Method and apparatus for analyzing sales conversation based on voice recognition
US20230154457A1 (en) Communication System And Related Methods
JP2021157419A (en) Interactive business support system and interactive business support method
US20230237276A1 (en) System and Method for Incremental Estimation of Interlocutor Intents and Goals in Turn-Based Electronic Conversational Flow
KR20190116044A (en) Method and computer readable recording medium for actively analyzing a online chatting session between users and providing analysis results visually to a user, by a conversation understanding ai system
JP6994531B2 (en) Call center equipment, processing methods and programs
US20240137444A1 (en) Intent analysis for call center response generation
CN117609463A (en) Digital customer service question answering method and device, computer equipment and storage medium
CN112463796A (en) Database interface conversion system