WO2018166115A1 - 客服问答数据的处理方法、电子装置及计算机可读存储介质 - Google Patents
客服问答数据的处理方法、电子装置及计算机可读存储介质 Download PDFInfo
- Publication number
- WO2018166115A1 WO2018166115A1 PCT/CN2017/091372 CN2017091372W WO2018166115A1 WO 2018166115 A1 WO2018166115 A1 WO 2018166115A1 CN 2017091372 W CN2017091372 W CN 2017091372W WO 2018166115 A1 WO2018166115 A1 WO 2018166115A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- question
- answer
- statement
- customer service
- log
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Definitions
- the present invention relates to the field of computer software technologies, and in particular, to a method for processing customer service question and answer data, an electronic device, and a computer readable storage medium.
- the object of the present invention is to provide a method for processing customer service question and answer data, an electronic device and a computer readable storage medium, which are designed to automatically generate a question and answer pair based on the question and answer log of the customer service question and answer database, and the coverage of the problem answer is wide and constructed. High efficiency and fast update speed.
- the first aspect of the present invention provides a method for processing customer service question and answer data, and the method for processing the customer service question and answer data includes:
- S2 Match the question and answer log in each group according to a matching rule of a predetermined question and answer to obtain a pair of question answers to be added to the customer service knowledge base.
- the step S1 comprises:
- a second aspect of the present invention provides an electronic device, including a processing device, a storage device, and a processing system for customer service question and answer data.
- the processing system for the customer service question data is stored in the storage device, and includes at least one computer readable instruction, the at least one Computer readable instructions are executable by the processing device to:
- S2 Match the question and answer log in each group according to a matching rule of a predetermined question and answer to obtain a pair of question answers to be added to the customer service knowledge base.
- FIG. 2 is a schematic flow chart of an embodiment of a method for processing customer service question and answer data according to the present invention
- FIG. 3 is a schematic diagram showing the refinement process of step S2 shown in FIG. 2;
- FIG. 4 is a schematic structural diagram of an embodiment of a processing system for customer service question and answer data according to the present invention.
- FIG. 1 it is a schematic diagram of an application environment of an embodiment of a method for processing customer service question and answer data according to the present invention.
- the application environment diagram includes an electronic device 1 and a terminal device 2.
- the electronic device 1 can perform data interaction with the terminal device 2 through a suitable technology such as a network or a near field communication technology.
- the terminal device 2 includes, but is not limited to, any electronic product that can interact with a user through a keyboard, a mouse, a remote controller, a touch pad, or a voice control device, for example, a personal computer, a tablet computer, a smart phone, or an individual.
- PDA Personal Digital Assistant
- game console Internet Protocol Television (IPTV)
- smart wearable device etc.
- the storage device 11 includes a memory and at least one type of readable storage medium.
- the memory provides a cache for the operation of the electronic device 1;
- the readable storage medium may be a non-volatile storage medium such as a flash memory, a hard disk, a multimedia card, a card type memory, or the like.
- the readable storage medium may be an internal storage unit of the electronic device 1, such as a hard disk of the electronic device 1; in other embodiments, the non-volatile storage medium may also be external to the electronic device 1.
- a storage device such as a plug-in hard disk equipped with an electronic device 1, a smart memory card (SMC), a Secure Digital (SD) card, a flash card, or the like.
- SMC smart memory card
- SD Secure Digital
- Step S1 obtaining a pre-stored question and answer log from the customer service question and answer database, and grouping the question and answer log according to the question and answer correspondence between the customer service and the customer within a preset time;
- the customer service question and answer database stores all the question and answer logs generated during the manual customer service and customer dialogue process
- the customer service question and answer data processing system communicates with the customer service question and answer database, and can automatically obtain the question and answer log from the customer service question and answer database. Carry out further processing.
- the question and answer log can be obtained from the customer service question and answer database in real time, for example, the new customer service and the customer's question and answer log can be obtained in real time; the question and answer log can also be obtained from the customer service question and answer database periodically, for example, every 6 hours.
- Get the Q&A log in the customer service Q&A database Get the latest Q&A log by getting the Q&A log in the customer service Q&A database in real time or regularly.
- the question and answer log in each group is matched according to a matching rule of a predetermined question and answer, for example, the question statement and the answer sentence in the question and answer log are first extracted according to the time of the question and the time of the answer, and the analysis is performed.
- the keyword corresponds to or corresponds to the expanded word of the business keyword
- the question statement and the answer sentence are paired according to the analysis result described above, and the like.
- the matching of the predetermined problem and the matching rule of the answer in this embodiment does not limit the above two modes.
- Other ways of matching the question statement and the answer sentence to complete the pairing are also within the protection scope of the embodiment.
- the processing system of the customer service question and answer data automatically obtains the question and answer log from the customer service question and answer database, and groups the question and answer logs so that the question and answer log in the same group has certain The same attribute, the question and answer log with some identical attributes in each group is matched according to the matching rule of the predetermined question and answer, to match the answer pair to be added to the customer service knowledge base, and the embodiment is based on the customer service question and answer database.
- the question and answer log is automatically matched to get the answer to the question. It does not need to be written by the customer service staff.
- the answer to the question has a wide coverage, high construction efficiency and fast update speed.
- the customer's question and answer logs of the same customer service are divided into the same group in the preset time.
- the above question and answer logs 1, 2 and 4 are grouped into one group, and the question and answer logs 3 and 5 are grouped.
- the embodiment is not limited to the above grouping method.
- word segmentation of statements in the question and answer log can be performed using the following three categories of word segmentation methods: based on A word-matching word segmentation method, an understanding-based word segmentation method, and a statistical-based word segmentation method.
- the customer's question statement and the customer service answer sentence in the data-pre-processed question and answer log are analyzed according to a preset analysis rule.
- the preset analysis rule includes an analysis rule of the question statement and an analysis rule of the answer sentence.
- the analysis rules of the problem statement are:
- the problem statement is reserved as the problem statement to be matched, or if the key indicator value S is less than or equal to the preset indicator threshold, for example, S ⁇ 0, Remove the problem statement.
- the analysis rule of the answer statement is: if the answer statement is not a declarative statement, the answer sentence and its corresponding question statement are removed.
- the grouping module 101 is configured to obtain a pre-stored question and answer log from the customer service question and answer database, and group the question and answer logs according to the question and answer correspondence between the customer service and the customer within a preset time;
- the customer service question and answer database stores all the question and answer logs generated during the manual customer service and customer dialogue process
- the customer service question and answer data processing system 10 is connected with the customer service question and answer database, and the customer service question and answer data processing system 10 can automatically receive the customer service. Get a Q&A log in the Q&A database for further processing.
- the customer service Q&A data processing system 10 can obtain the Q&A log from the customer service Q&A database in real time, for example, obtaining the new customer service and customer Q&A logs in real time; or periodically obtaining the Q&A log from the customer service Q&A database. For example, get a question and answer log from the customer service Q&A database every 6 hours. Get the latest Q&A log by getting the Q&A log in the customer service Q&A database in real time or regularly.
- the question and answer log obtained is based on the correspondence between the customer service and the customer's question and answer within the preset time.
- the grouping is performed. For example, if a customer service conducts a Q&A session with k customers on the same day, the Q&A log corresponding to the k-client's Q&A session will be grouped in the same day.
- the main purpose of grouping the question and answer logs is to group the question and answer logs with common attributes into one group to facilitate subsequent processing analysis.
- the matching module 102 is configured to match the question and answer log in each group according to a matching rule of a predetermined question and answer to obtain a question answer pair to be added to the customer service knowledge base.
- the question and answer log in each group is matched according to a matching rule of a predetermined question and answer, for example, the question statement and the answer sentence in the question and answer log are first extracted according to the time of the question and the time of the answer, and the analysis is performed.
- the keyword corresponds to or corresponds to the expanded word of the business keyword
- the question statement and the answer sentence are paired according to the analysis result described above, and the like.
- the matching of the predetermined problem and the matching rule of the answer in this embodiment does not limit the above two modes.
- Other ways of matching the question statement and the answer sentence to complete the pairing are also within the protection scope of the embodiment.
- the question answer pair is added to the customer service knowledge base to continuously increase or enrich the knowledge in the customer service knowledge base.
- the customer's question and answer logs of the same customer service are divided into the same group in the preset time.
- the above question and answer logs 1, 2 and 4 are grouped into one group, and the question and answer logs 3 and 5 are grouped.
- the embodiment is not limited to the above grouping method.
- the grouped question and answer log of this embodiment has some of the same attributes, for example, the same customer may ask similar questions, the question statement has similar characteristics, or the same customer service may answer similar questions, and the answer sentences have similar characteristics.
- a question and answer log with the same attributes can facilitate further analysis.
- the matching module 102 includes:
- a pre-processing unit 1021 configured to perform data pre-processing on the question and answer log in each group
- the analyzing unit 1022 is configured to analyze the customer's problem statement and the customer service answer statement in the question and answer log after the data preprocessing according to a preset analysis rule, to analyze the problem statement to be matched and the corresponding answer statement;
- the association unit 1023 is configured to extract the problem statement to be matched and the corresponding answer statement, associate the extracted question statement with the corresponding answer statement as the question answer pair, and add the question answer pair to the customer service knowledge base.
- the data is pre-processed in the question and answer log in each group.
- the pre-processing unit 1021 is specifically configured to uniformly convert the fonts in the question and answer log in each group into traditional characters or simplified characters, and each will be The letters in the question and answer log in the group are uniformly converted into uppercase letters or lowercase letters, the specific sentences in the question and answer log are removed, and the sentences in the question and answer log in each group are processed for word segmentation and the like.
- word segmentation of statements in the question and answer log can be performed using the following three categories of word segmentation methods: based on A word-matching word segmentation method, an understanding-based word segmentation method, and a statistical-based word segmentation method.
- the customer's question statement and the customer service answer sentence in the data-pre-processed question and answer log are analyzed according to a preset analysis rule.
- the preset analysis rule includes an analysis rule of the question statement and an analysis rule of the answer sentence.
- the analysis rules of the problem statement are:
- the problem statement is reserved as the problem statement to be matched, or if the key indicator value S is less than or equal to the preset indicator threshold, for example, S ⁇ 0, Remove the problem statement.
- the analysis rule of the answer statement is: if the answer statement is not a declarative statement, the answer sentence and its corresponding question statement are removed.
- the question statement to be matched and the corresponding answer sentence are extracted, if there are duplicate question sentences and corresponding answer words a sentence, only one of the repeated question statements and the corresponding answer statement and the corresponding answer statement can be extracted; and the question statement to be matched and the corresponding answer sentence are weighted according to the key business words they contain Arranging from large to small, extracting the question statement to be matched and the corresponding answer sentence whose key business words in the queue are greater than a certain threshold, and associating the extracted question statement with the corresponding answer sentence as the question answer pair, Add the answer pair to the customer knowledge base.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种客服问答数据的处理方法、电子装置及存储介质,所述客服问答数据的处理方法包括:从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组(S1);对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对(S2)。上述基于客服问答数据库的问答日志自动匹配得出问题答案对,不需要客服人员进行编写,问题答案对的覆盖面广、构建效率高且更新速度快。
Description
优先权申明
本申请基于巴黎公约申明享有2017年3月13日递交的申请号为CN201710147702.6、名称为“客服问答数据的处理方法及系统”中国专利申请的优先权,该中国专利申请的整体内容以参考的方式结合在本申请中。
本发明涉及计算机软件技术领域,尤其涉及一种客服问答数据的处理方法、电子装置及计算机可读存储介质。
目前,客服自动问答系统一般是基于问题答案对作为知识库进行设计的,根据用户的问题检索到知识库中最相似的问题,再根据知识库中已有的问题答案对(即问题与答案的映射对),直接给出回答。在这种系统设计框架下,有三个主要核心:问题理解、检索算法以及知识库构建。对于知识库,传统的构建方法一般是由具备多年专业经验的客服人员人工进行编写,这种构建知识库的方式存在的不足之处为:问题答案对的覆盖面窄、构建效率低且更新速度慢。
发明内容
本发明的目的在于提供一种客服问答数据的处理方法、电子装置及计算机可读存储介质,旨在基于客服问答数据库的问答日志自动匹配得出问题答案对,且问题答案对的覆盖面广、构建效率高且更新速度快。
本发明第一方面提供一种客服问答数据的处理方法,所述客服问答数据的处理方法包括:
S1,从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;
S2,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
优选地,所述步骤S1包括:
将预设时间内的同一客户与同一客服的问答日志分为同一分组;或
将预设时间内的同一客户与各客服的问答日志分为同一分组;或
将预设时间内的各客户与同一客服的问答日志分为同一分组。
本发明第二方面提供一种电子装置,包括处理设备、存储设备及客服问答数据的处理系统,该客服问答数据的处理系统存储于该存储设备中,包括至少一个计算机可读指令,该至少一个计算机可读指令可被所述处理设备执行,以实现以下操作:
S1,从客服问答数据库获取预存的问答日志,并基于预设时间内客服与
客户的问答对应关系对所述问答日志进行分组;
S2,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
本发明第三方面提供一种计算机可读存储介质,其上存储有至少一个可被处理设备执行以实现以下操作的计算机可读指令:
S1,从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;
S2,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
本发明的有益效果是:本发明在构建客服知识库时,由客服问答数据的处理系统自动从客服问答数据库中获取问答日志,对问答日志进行分组,使得同一分组中的问答日志具有某些相同的属性,对于每一分组中具有某些相同属性的问答日志按照预定的问题与答案的匹配规则进行匹配,以匹配得出待加入至客服知识库问题答案对,本发明基于客服问答数据库的问答日志自动匹配得出问题答案对,不需要客服人员进行编写,问题答案对的覆盖面广、构建效率高且更新速度快。
图1是本发明实现客服问答数据的处理方法的一实施例的应用环境示意图;
图2为本发明客服问答数据的处理方法一实施例的流程示意图;
图3为图2所示步骤S2的细化流程示意图;
图4为本发明客服问答数据的处理系统一实施例的结构示意图;
图5为图4所示匹配模块的结构示意图。
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
参阅图1所示,是本发明实现客服问答数据的处理方法的一实施例的应用环境示意图。所述应用环境示意图包括电子装置1、终端设备2。所述电子装置1可以通过网络、近场通信技术等适合的技术与所述终端设备2进行数据交互。
终端设备2包括,但不限于,任何一种可与用户通过键盘、鼠标、遥控器、触摸板或者声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA),游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴设备等。
电子装置1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。电子装置1可以是计算机、也可以是单个网络服务
器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,电子装置1包括,但不仅限于,可通过系统总线相互通信连接的存储设备11、处理设备12、及网络接口13。需要指出的是,图1仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,存储设备11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子装置1的内部存储单元,例如该电子装置1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储设备11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件,例如本申请一实施例中的客服问答数据的处理系统10的程序代码等。此外,存储设备11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理设备12在一些实施例中可以包括一个或者多个微处理器、微控制器、数字处理器等。该处理设备12通常用于控制电子装置1的运行,例如执行与终端设备2进行数据交互或者通信相关的控制和处理等。在本实施例中,处理设备12用于运行存储设备11中存储的程序代码或者处理数据,例如运行客服问答数据的处理系统10等。
网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在电子装置1与其他电子设备之间建立通信连接。本实施例中,网络接口13主要用于将电子装置1与一个或多个终端设备2相连,在电子装置1与一个或多个终端设备2之间建立数据传输通道和通信连接。
客服问答数据的处理系统10包括至少一个存储在存储设备11中的计算机可读指令,该至少一个计算机可读指令可被处理设备12执行,以实现本申请各实施例的控件响应区域显示控制方法。如后续所述,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被划为不同的逻辑模块。
在一实施例中,客服问答数据的处理系统10被处理设备12执行时,实现以下操作:从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
如图2所示,图2为本发明客服问答数据的处理方法一实施例的流程示意图,该客服问答数据的处理方法包括以下步骤:
步骤S1,从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;
本实施例中,客服问答数据库中存储有所有的人工客服与客户对话过程中产生的问答日志,客服问答数据的处理系统与客服问答数据库通信连接,能够自动从客服问答数据库中获取问答日志,以进行进一步的处理。
本实施例中,可以实时地从客服问答数据库中获取问答日志,例如实时地获取新增的客服与客户的问答日志;也可以定时地从客服问答数据库中获取问答日志,例如每隔6小时从客服问答数据库中获取问答日志。通过实时或定时地获取客服问答数据库中的问答日志,以获取最新的问答日志。
然后,对获取的问答日志基于预设时间内客服与客户的问答对应关系进行分组,例如,一天内某一客服当天内与k个客户进行问答对话,则将该客服当天内与k个客户进行问答对话对应的问答日志分为一组。对问答日志进行分组的主要目的在于,将具有共同属性的问答日志归为一组,以方便后续进行处理分析。
步骤S2,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
本实施例中,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,例如按照提问的时间及回答的时间的先后顺序先提取出问答日志中的问题语句及回答语句,分析问题语句中的长度及所包括的业务关键词等,分析回答语句的长度及业务关键词是否与问题语句中的业务关键词对应等等,根据上述的分析结果将问题语句及回答语句进行配对;又如,按照提问的时间及回答的时间的先后顺序先提取出问答日志中的问题语句及回答语句,分析问题语句中的业务关键词及对业务关键词进行扩展,分析回答语句是否与该业务关键词对应或者与该业务关键词进行扩展后的词语对应,根据上述的分析结果将问题语句及回答语句进行配对,等等。当然,本实施例按照预定的问题与答案的匹配规则进行匹配不限定上述的这两种方式,其他能够将问题语句及回答语句进行匹配以完成配对的方式也在本实施例的保护范围内。
本实施例中,在将问题语句与回答语句进行匹配以配对出问题答案对之后,将问题答案对加入至客服知识库中,以不断地增加或丰富客服知识库中的知识。
与现有技术相比,本实施例在构建客服知识库时,由客服问答数据的处理系统自动从客服问答数据库中获取问答日志,对问答日志进行分组,使得同一分组中的问答日志具有某些相同的属性,对于每一分组中具有某些相同属性的问答日志按照预定的问题与答案的匹配规则进行匹配,以匹配得出待加入至客服知识库问题答案对,本实施例基于客服问答数据库的问答日志自动匹配得出问题答案对,不需要客服人员进行编写,问题答案对的覆盖面广、构建效率高且更新速度快。
在一优选的实施例中,在上述图2的实施例的基础上,上述步骤S1包括:将同一预设时间内的同一客户与同一客服的问答日志分为同一分组,例如以预设时间(例如一天或者一周)为划分依据,将同一天内的同一客户与同一客服的问答日志分为同一分组,例如问答日志包括:客户A与客服a的问答日志1、客户A与客服a的问答日志2、客户A与客服b的问答日志3、/客服B与客户a的问答日志4、客服B与客户b的问答日志5,则将问答日志1及2分为一组,其他的问答日志3、4及5各自为一组;或
将同一预设时间内的同一客户与各客服的问答日志分为同一分组,例如将上述的问答日志1、2及3分为一组,将问答日志4及5分为一组;或
将预设时间内的各客户与同一客服的问答日志分为同一分组,例如将上述的问答日志1、2及4分为一组,将问答日志3及5分为一组。当然本实施例不限定于上述的分组方式。
本实施例经过分组后的问答日志具有某些相同的属性,例如同一客户可能提问相似的问题,其提问语句具有相似的特点,或者同一客服可能回答类似的问题,其回答语句具有相似的特点,具有相同的属性的问答日志能够为后续进一步的分析提供便利。
在一优选的实施例中,如图3所示,在上述图2的实施例的基础上,上述步骤S2包括:
S21,对每一分组中的问答日志进行数据预处理;
S22,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,以分析出待匹配的问题语句与对应的回答语句;
S23,抽取待匹配的问题语句与对应的回答语句,将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
本实施例中,对每一分组中的问答日志进行数据预处理,优选地,进行数据预处理包括:将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句,以及对每一分组中的问答日志中的语句进行分词处理等等。特定语句包括重复的语句、常用寒暄语(例如经常使用的一些礼貌用语“你好”、“谢谢”等);对问答日志中的语句进行分词处理可以使用以下三大类的分词方法执行:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
然后,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,优选地,预设的分析规则包括问题语句的分析规则及回答语句的分析规则,所述问题语句的分析规则为:
计算问题语句的关键指标值S:
S=Sa+Sb+Sc,其中,l为问题语句的长度,长度l可以以分词后的词语个数进行度量,即词语个数越多则长度l越大,m为问题语句所含的业务关键词的数目,m越大则关键指标值S越大,n为问题语句的停用词的数目,n越大则关键指标值S越小,问题质量得分越低,a为问题语句的第一长度预设值,b为问题语句的第二长度预设值,长度l在[a,b]之内时,该问题语句的长度适中,问题质量得分高;长度l在[a,b]之外时,相差越多,问题质量得分越低。
若关键指标值S大于预设指标阈值,例如S>0,则保留所述问题语句作为待匹配的问题语句,或者,若关键指标值S小于或者等于预设指标阈值,例如S<0,则去除所述问题语句。
优选地,回答语句的分析规则为:若回答语句不是陈述性语句,则去除该回答语句及其对应的问题语句。
另外,在分析出待匹配的问题语句与对应的回答语句后,在抽取待匹配的问题语句与对应的回答语句时,如果有重复的问题语句与对应的回答语句,则仅抽取重复的问题语句与对应的回答语句中的一个问题语句与对应的回答语句即可;以及,将待匹配的问题语句与对应的回答语句按照其所包含的关键业务词权重由大至小进行排列,抽取队列中关键业务词权重大于某一预设阈值的待匹配的问题语句与对应的回答语句,将所抽取出来的问题语句与对应的回答语句关联为问题答案对,以将问题答案对加入至客服知识库中。
如图4所示,图4为本发明客服问答数据的处理系统10一实施例的结构示意图,该客服问答数据的处理系统10包括:
分组模块101,用于从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;
本实施例中,客服问答数据库中存储有所有的人工客服与客户对话过程中产生的问答日志,客服问答数据的处理系统10与客服问答数据库通信连接,客服问答数据的处理系统10能够自动从客服问答数据库中获取问答日志,以进行进一步的处理。
本实施例中,客服问答数据的处理系统10可以实时地从客服问答数据库中获取问答日志,例如实时地获取新增的客服与客户的问答日志;也可以定时地从客服问答数据库中获取问答日志,例如每隔6小时从客服问答数据库中获取问答日志。通过实时或定时地获取客服问答数据库中的问答日志,以获取最新的问答日志。
然后,对获取的问答日志基于预设时间内客服与客户的问答对应关系进
行分组,例如,一天内某一客服当天内与k个客户进行问答对话,则将该客服当天内与k个客户进行问答对话对应的问答日志分为一组。对问答日志进行分组的主要目的在于,将具有共同属性的问答日志归为一组,以方便后续进行处理分析。
匹配模块102,用于对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
本实施例中,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,例如按照提问的时间及回答的时间的先后顺序先提取出问答日志中的问题语句及回答语句,分析问题语句中的长度及所包括的业务关键词等,分析回答语句的长度及业务关键词是否与问题语句中的业务关键词对应等等,根据上述的分析结果将问题语句及回答语句进行配对;又如,按照提问的时间及回答的时间的先后顺序先提取出问答日志中的问题语句及回答语句,分析问题语句中的业务关键词及对业务关键词进行扩展,分析回答语句是否与该业务关键词对应或者与该业务关键词进行扩展后的词语对应,根据上述的分析结果将问题语句及回答语句进行配对,等等。当然,本实施例按照预定的问题与答案的匹配规则进行匹配不限定上述的这两种方式,其他能够将问题语句及回答语句进行匹配以完成配对的方式也在本实施例的保护范围内。
本实施例中,在将问题语句与回答语句进行匹配以配对出问题答案对之后,将问题答案对加入至客服知识库中,以不断地增加或丰富客服知识库中的知识。
在一优选的实施例中,在上述图4的实施例的基础上,所述分组模块101具体用于将同一预设时间内的同一客户与同一客服的问答日志分为同一分组,例如以预设时间(例如一天或者一周)为划分依据,将同一天内的同一客户与同一客服的问答日志分为同一分组,例如问答日志包括:客户A与客服a的问答日志1、客户A与客服a的问答日志2、客户A与客服b的问答日志3、/客服B与客户a的问答日志4、客服B与客户b的问答日志5,则将问答日志1及2分为一组,其他的问答日志3、4及5各自为一组;或
将同一预设时间内的同一客户与各客服的问答日志分为同一分组,例如将上述的问答日志1、2及3分为一组,将问答日志4及5分为一组;或
将预设时间内的各客户与同一客服的问答日志分为同一分组,例如将上述的问答日志1、2及4分为一组,将问答日志3及5分为一组。当然本实施例不限定于上述的分组方式。
本实施例经过分组后的问答日志具有某些相同的属性,例如同一客户可能提问相似的问题,其提问语句具有相似的特点,或者同一客服可能回答类似的问题,其回答语句具有相似的特点,具有相同的属性的问答日志能够为后续进一步的分析提供便利。
在一优选的实施例中,如图5所示,在上述图4的实施例的基础上,匹配模块102包括:
预处理单元1021,用于对每一分组中的问答日志进行数据预处理;
分析单元1022,用于对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,以分析出待匹配的问题语句与对应的回答语句;
关联单元1023,用于抽取待匹配的问题语句与对应的回答语句,将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
本实施例中,对每一分组中的问答日志进行数据预处理,优选地,预处理单元1021具体用于将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句,以及对每一分组中的问答日志中的语句进行分词处理等等。特定语句包括重复的语句、常用寒暄语(例如经常使用的一些礼貌用语“你好”、“谢谢”等);对问答日志中的语句进行分词处理可以使用以下三大类的分词方法执行:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
然后,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,优选地,预设的分析规则包括问题语句的分析规则及回答语句的分析规则,所述问题语句的分析规则为:
计算问题语句的关键指标值S:
S=Sa+Sb+Sc,其中,l为问题语句的长度,长度l可以以分词后的词语个数进行度量,即词语个数越多则长度l越大,m为问题语句所含的业务关键词的数目,m越大则关键指标值S越大,n为问题语句的停用词的数目,n越大则关键指标值S越小,问题质量得分越低,a为问题语句的第一长度预设值,b为问题语句的第二长度预设值,长度l在[a,b]之内时,该问题语句的长度适中,问题质量得分高;长度l在[a,b]之外时,相差越多,问题质量得分越低。
若关键指标值S大于预设指标阈值,例如S>0,则保留所述问题语句作为待匹配的问题语句,或者,若关键指标值S小于或者等于预设指标阈值,例如S<0,则去除所述问题语句。
优选地,回答语句的分析规则为:若回答语句不是陈述性语句,则去除该回答语句及其对应的问题语句。
另外,在分析出待匹配的问题语句与对应的回答语句后,在抽取待匹配的问题语句与对应的回答语句时,如果有重复的问题语句与对应的回答语
句,则仅抽取重复的问题语句与对应的回答语句中的一个问题语句与对应的回答语句即可;以及,将待匹配的问题语句与对应的回答语句按照其所包含的关键业务词权重由大至小进行排列,抽取队列中关键业务词权重大于某一预设阈值的待匹配的问题语句与对应的回答语句,将所抽取出来的问题语句与对应的回答语句关联为问题答案对,以将问题答案对加入至客服知识库中。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (20)
- 一种客服问答数据的处理方法,其特征在于,所述客服问答数据的处理方法包括:S1,从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;S2,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
- 根据权利要求1所述的客服问答数据的处理方法,其特征在于,所述步骤S2包括:S21,对每一分组中的问答日志进行数据预处理;S22,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,以分析出待匹配的问题语句与对应的回答语句;S23,抽取待匹配的问题语句与对应的回答语句,将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
- 根据权利要求2所述的客服问答数据的处理方法,其特征在于,所述步骤S21包括:将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句,以及对每一分组中的问答日志中的语句进行分词处理。
- 根据权利要求1所述的客服问答数据的处理方法,其特征在于,所述步骤S1包括:将预设时间内的同一客户与同一客服的问答日志分为同一分组;或将预设时间内的同一客户与各客服的问答日志分为同一分组;或将预设时间内的各客户与同一客服的问答日志分为同一分组。
- 根据权利要求5所述的客服问答数据的处理方法,其特征在于,所述步骤S2包括:S21,对每一分组中的问答日志进行数据预处理;S22,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,以分析出待匹配的问题语句与对应的回答语句;S23,抽取待匹配的问题语句与对应的回答语句,将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
- 根据权利要求6所述的客服问答数据的处理方法,其特征在于,所述步骤S21包括:将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句,以及对每一分组中的问答日志中的语句进行分词处理。
- 一种电子装置,包括处理设备、存储设备及客服问答数据的处理系统,该客服问答数据的处理系统存储于该存储设备中,包括至少一个计算机可读指令,该至少一个计算机可读指令可被所述处理设备执行,以实现以下操作:S1,从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;S2,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹 配,以得出待加入至客服知识库中的问题答案对。
- 根据权利要求9所述的电子装置,其特征在于,所述步骤S2包括:S21,对每一分组中的问答日志进行数据预处理;S22,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,以分析出待匹配的问题语句与对应的回答语句;S23,抽取待匹配的问题语句与对应的回答语句,将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
- 根据权利要求10所述的电子装置,其特征在于,所述步骤S21包括:将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句,以及对每一分组中的问答日志中的语句进行分词处理。
- 根据权利要求9所述的电子装置,其特征在于,所述步骤S1包括:将预设时间内的同一客户与同一客服的问答日志分为同一分组;或将预设时间内的同一客户与各客服的问答日志分为同一分组;或将预设时间内的各客户与同一客服的问答日志分为同一分组。
- 根据权利要求13所述的电子装置,其特征在于,所述步骤S2包括:S21,对每一分组中的问答日志进行数据预处理;S22,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,以分析出待匹配的问题语句与对应的回答语句;S23,抽取待匹配的问题语句与对应的回答语句,将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
- 根据权利要求14所述的电子装置,其特征在于,所述步骤S21包括:将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句,以及对每一分组中的问答日志中的语句进行分词处理。
- 一种计算机可读存储介质,其上存储有至少一个可被处理设备执行以实现以下操作的计算机可读指令:S1,从客服问答数据库获取预存的问答日志,并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组;S2,对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配,以得出待加入至客服知识库中的问题答案对。
- 根据权利要求17所述的存储介质,其特征在于,所述步骤S2包括:S21,对每一分组中的问答日志进行数据预处理;S22,对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析,以分析出待匹配的问题语句与对应的回答语句;S23,抽取待匹配的问题语句与对应的回答语句,将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
- 根据权利要求18所述的存储介质,其特征在于,所述步骤S21包括:将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句,以及对每一分组中的问答日志中的语句进行分词处理。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710147702.6 | 2017-03-13 | ||
CN201710147702.6A CN107066541A (zh) | 2017-03-13 | 2017-03-13 | 客服问答数据的处理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018166115A1 true WO2018166115A1 (zh) | 2018-09-20 |
Family
ID=59622075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2017/091372 WO2018166115A1 (zh) | 2017-03-13 | 2017-06-30 | 客服问答数据的处理方法、电子装置及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107066541A (zh) |
WO (1) | WO2018166115A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110213344A (zh) * | 2019-05-14 | 2019-09-06 | 长沙手之声信息科技有限公司 | 一种多中心远程手语在线翻译系统及方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108415980A (zh) * | 2018-02-09 | 2018-08-17 | 平安科技(深圳)有限公司 | 问答数据处理方法、电子装置及存储介质 |
CN109189803A (zh) * | 2018-09-03 | 2019-01-11 | 深圳前海微众银行股份有限公司 | 问答对构建方法、装置及计算机可读存储介质 |
CN109272129B (zh) * | 2018-09-20 | 2022-03-18 | 重庆先特服务外包产业有限公司 | 呼叫中心业务管理系统 |
CN109670021A (zh) * | 2018-12-12 | 2019-04-23 | 安徽讯呼信息科技有限公司 | 一种自由流转和自定义字段的客服系统 |
CN111949772A (zh) * | 2019-05-17 | 2020-11-17 | 上海戈吉网络科技有限公司 | 一种智能客服与知识库系统及管理方法 |
CN110321416A (zh) * | 2019-05-23 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 基于aiml的智能问答方法、装置、计算机设备及存储介质 |
CN110781284B (zh) * | 2019-09-18 | 2024-05-28 | 平安科技(深圳)有限公司 | 基于知识图谱的问答方法、装置和存储介质 |
CN112148743A (zh) * | 2020-09-18 | 2020-12-29 | 北京达佳互联信息技术有限公司 | 智能客服知识库的更新方法、装置、设备及存储介质 |
CN112800219B (zh) * | 2021-01-19 | 2022-12-30 | 苏宁金融科技(南京)有限公司 | 客服日志反馈回流数据库的方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102099803A (zh) * | 2007-10-23 | 2011-06-15 | 瑞5优特有限公司 | 用于自动回答自然语言问题的方法和计算机系统 |
US20140122619A1 (en) * | 2012-10-26 | 2014-05-01 | Xiaojiang Duan | Chatbot system and method with interactive chat log |
CN104679815A (zh) * | 2014-12-08 | 2015-06-03 | 北京云知声信息技术有限公司 | 一种筛选问答对并实时更新问答库的方法及系统 |
CN105608221A (zh) * | 2016-01-11 | 2016-05-25 | 北京光年无限科技有限公司 | 一种面向问答系统的自学习方法和装置 |
CN105786851A (zh) * | 2014-12-23 | 2016-07-20 | 北京奇虎科技有限公司 | 问答知识库的构建方法、提供搜索的方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204751B1 (en) * | 2006-03-03 | 2012-06-19 | At&T Intellectual Property Ii, L.P. | Relevance recognition for a human machine dialog system contextual question answering based on a normalization of the length of the user input |
CN101520802A (zh) * | 2009-04-13 | 2009-09-02 | 腾讯科技(深圳)有限公司 | 一种问答对的质量评价方法和系统 |
-
2017
- 2017-03-13 CN CN201710147702.6A patent/CN107066541A/zh active Pending
- 2017-06-30 WO PCT/CN2017/091372 patent/WO2018166115A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102099803A (zh) * | 2007-10-23 | 2011-06-15 | 瑞5优特有限公司 | 用于自动回答自然语言问题的方法和计算机系统 |
US20140122619A1 (en) * | 2012-10-26 | 2014-05-01 | Xiaojiang Duan | Chatbot system and method with interactive chat log |
CN104679815A (zh) * | 2014-12-08 | 2015-06-03 | 北京云知声信息技术有限公司 | 一种筛选问答对并实时更新问答库的方法及系统 |
CN105786851A (zh) * | 2014-12-23 | 2016-07-20 | 北京奇虎科技有限公司 | 问答知识库的构建方法、提供搜索的方法及装置 |
CN105608221A (zh) * | 2016-01-11 | 2016-05-25 | 北京光年无限科技有限公司 | 一种面向问答系统的自学习方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110213344A (zh) * | 2019-05-14 | 2019-09-06 | 长沙手之声信息科技有限公司 | 一种多中心远程手语在线翻译系统及方法 |
CN110213344B (zh) * | 2019-05-14 | 2022-05-17 | 株洲手之声信息科技有限公司 | 一种多中心远程手语在线翻译系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107066541A (zh) | 2017-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018166115A1 (zh) | 客服问答数据的处理方法、电子装置及计算机可读存储介质 | |
CN113962315B (zh) | 模型预训练方法、装置、设备、存储介质以及程序产品 | |
TWI737006B (zh) | 一種跨模態訊息檢索方法、裝置和儲存介質 | |
WO2018205389A1 (zh) | 语音识别方法、系统、电子装置及介质 | |
JP6634515B2 (ja) | 自動質問応答システムにおける質問クラスタリング処理方法及び装置 | |
US20200193217A1 (en) | Method for determining sentence similarity | |
US10630798B2 (en) | Artificial intelligence based method and apparatus for pushing news | |
WO2018166113A1 (zh) | 随机森林模型训练的方法、电子装置及存储介质 | |
CN111159220B (zh) | 用于输出结构化查询语句的方法和装置 | |
WO2020052069A1 (zh) | 用于分词的方法和装置 | |
US10474747B2 (en) | Adjusting time dependent terminology in a question and answer system | |
WO2019062078A1 (zh) | 智能客服方法、电子装置及计算机可读存储介质 | |
WO2020052061A1 (zh) | 用于处理信息的方法和装置 | |
WO2022073341A1 (zh) | 基于语音语义的疾病实体匹配方法、装置及计算机设备 | |
US20230342667A1 (en) | Classification model training method, semantic classification method, device and medium | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN107766498B (zh) | 用于生成信息的方法和装置 | |
US12086171B2 (en) | Word mining method and apparatus, electronic device and readable storage medium | |
JP2022116231A (ja) | 生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体 | |
JP2023002690A (ja) | セマンティックス認識方法、装置、電子機器及び記憶媒体 | |
CN109214445A (zh) | 一种基于人工智能的多标签分类方法 | |
CN117556050B (zh) | 数据分类分级方法、装置、电子设备及存储介质 | |
JP2022088540A (ja) | ユーザ興味画像の生成方法、装置、電子機器及び記憶媒体 | |
WO2020052060A1 (zh) | 用于生成修正语句的方法和装置 | |
JP2019021194A5 (zh) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17901289 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 06.12.2019) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 17901289 Country of ref document: EP Kind code of ref document: A1 |