CN110705245B - 一种获取参考处理方案的方法及装置、存储介质 - Google Patents
一种获取参考处理方案的方法及装置、存储介质 Download PDFInfo
- Publication number
- CN110705245B CN110705245B CN201810745743.XA CN201810745743A CN110705245B CN 110705245 B CN110705245 B CN 110705245B CN 201810745743 A CN201810745743 A CN 201810745743A CN 110705245 B CN110705245 B CN 110705245B
- Authority
- CN
- China
- Prior art keywords
- feature vector
- current
- work order
- historical
- complaint work
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种获取参考处理方案的方法,该方法包括:当检测到新的投诉工单时,获取新的投诉工单对应的当前投诉内容;根据当前投诉内容,构建当前特征向量序列;从本地信息库中获取历史投诉工单、历史投诉工单对应的历史特征向量序列和历史投诉工单对应的历史处理方案,历史投诉工单为生成新的投诉工单之前生成的投诉工单;根据当前特征向量序列和历史投诉工单对应的历史特征向量序列,计算新的投诉工单和历史投诉工单的相似度;当相似度满足预设阈值时,将历史投诉工单对应的历史处理方案作为新的投诉工单的参考处理方案。
Description
技术领域
本发明涉及计算机领域中的文本分析技术,尤其涉及一种获取参考处理方案的方法及装置、存储介质。
背景技术
随着各类业务的迅猛发展,客户数量与业务类型也随之增长,如何根据庞杂多样的投诉内容,准确有效地给予客户相应投诉内容的处理方案,是客服工作面临的巨大挑战。
现有技术中,在给予客户相应投诉内容的处理方案时,通常是从预设的专家知识库中获取相关的知识信息,作为客户相应投诉内容的处理方案的参考信息。然而,由于预设的专家知识库仅是预先存储的解决方案,与新的投诉工单的关联性低,因此,根据预设的专家知识库确定新的投诉工单的参考处理方案存在准确率低的问题。
发明内容
为解决上述技术问题,本发明实施例期望提供一种获取参考处理方案的方法及装置、存储介质,能够提高新的投诉工单的参考处理方案的准确率。
本发明的技术方案是这样实现的:
本发明实施例提供了一种获取参考处理方案的方法,所述方法包括:
当检测到新的投诉工单时,获取所述新的投诉工单对应的当前投诉内容;
根据所述当前投诉内容,构建当前特征向量序列;
从本地信息库中获取历史投诉工单、所述历史投诉工单对应的历史特征向量序列和所述历史投诉工单对应的历史处理方案,所述历史投诉工单为生成所述新的投诉工单之前生成的投诉工单;
根据所述当前特征向量序列和所述历史投诉工单对应的所述历史特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度;
当所述相似度满足预设阈值时,将所述历史投诉工单对应的所述历史处理方案作为所述新的投诉工单的所述参考处理方案。
在上述方案中,所述根据所述当前投诉内容,构建当前特征向量序列,包括:
根据所述当前投诉内容,确定当前特征项;
计算所述当前特征项对应的当前权重;
将所述当前特征项与对应的所述当前权重作为一个当前特征向量;
将所述当前特征向量组合为所述当前特征向量序列。
在上述方案中,所述根据所述当前投诉内容,确定当前特征项,包括:
对所述当前投诉内容进行分词处理,得到当前分词信息;
获取所述新的投诉工单的业务信息;
从所述当前分词信息中确定与所述业务信息对应的当前关键词;
从所述当前关键词中确定所述当前特征项。
在上述方案中,所述从所述当前关键词中确定所述当前特征项,包括:
利用预设提取算法从所述当前关键词中确定所述当前特征项。
在上述方案中,所述根据所述当前特征向量序列和所述历史投诉工单对应的历史特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度,包括:
将所述当前特征向量序列和历史投诉工单对应的历史特征向量序列进行特征项对比重构,得到当前待比较特征向量序列和历史待比较特征向量序列,所述当前待比较特征向量序列和所述历史待比较特征向量序列包含有相同的特征项、且所述特征项的排列顺序相同;
基于所述当前待比较特征向量序列和所述历史待比较特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度。
在上述方案中,所述基于所述当前待比较特征向量序列和所述历史待比较特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度,包括:
构建横坐标为特征向量在对应的特征向量序列中的排序位置和纵坐标为对应的所述特征向量中所述特征项的权重的二维坐标;
分别将所述当前待比较特征向量序列和历史待比较特征向量序列映射到所述二维坐标中,得到对应的当前待计算特征向量序列和历史待计算特征向量序列;
基于所述当前待计算特征向量序列和所述历史待计算特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度。
在上述方案中,所述根据所述当前特征向量序列和所述历史投诉工单对应的历史特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度之前,所述方法还包括:
获取所述历史投诉工单的历史投诉内容,确定历史特征项;
计算所述历史特征向对应的历史权重;
将所述历史特征项与对应的所述历史权重作为一个历史特征向量;
将所述历史特征向量组合为所述历史特征向量序列;
将所述历史投诉工单对应的所述历史特征向量序列存储在所述本地信息库。
在上述方案中,所述当所述相似度满足预设阈值时,将所述历史投诉工单对应的所述历史处理方案作为所述新的投诉工单的所述参考处理方案之后,所述方法还包括:
将所述新的投诉工单对应的当前特征向量序列存储在所述本地信息库。
本发明实施例提供了一种获取参考处理方案的装置,所述装置包括:处理器、接收器、存储器和通信总线,所述接收器和所述存储器通过所述通信总线与所述处理器进行通信,所述存储器存储所述处理器可执行的指令,当所述指令被执行时,通过所述处理器执行如上述
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现如上述所述的获取参考处理方案的方法。
本发明实施例提供了一种获取参考处理方案的方法及设备、存储介质,首先,当检测到新的投诉工单时,获取新的投诉工单对应的当前投诉内容;并根据当前投诉内容,构建当前特征向量序列;然后,从本地信息库中获取历史投诉工单、历史投诉工单对应的历史特征向量序列和历史投诉工单对应的历史处理方案,历史投诉工单为生成新的投诉工单之前生成的投诉工单;最后,根据当前特征向量序列和历史投诉工单对应的历史特征向量序列,计算新的投诉工单和历史投诉工单的相似度;并当相似度满足预设阈值时,将历史投诉工单对应的历史处理方案作为新的投诉工单的参考处理方案。由于采用上述技术实现方案,通过计算新的投诉工单与历史投诉工单的相似度,并基于该相似度得到新的投诉工单的参考处理方案,使得该参考处理方案与新的投诉工单的关联性高,从而提高了新的投诉工单的参考处理方案的准确率。
附图说明
图1为本发明实施例提供的一种获取参考处理方案的方法实现流程图;
图2为本发明实施例提供的一种示例性地计算新的投诉工单和历史投诉工单的相似度的流程示意图;
图3为本发明实施例提供的一种示例性的计算新的投诉工单和历史投诉工单的相似度的示意图;
图4为本发明实施例提供的一种获取参考处理方案的装置的结构示意图一;
图5为本发明实施例提供的一种获取参考处理方案的装置的结构示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本发明实施例提供了一种获取参考处理方案的方法,图1为本发明实施例提供的一种获取参考处理方案的方法实现流程图,如图1所示,该获取参考处理方案的方法包括:
S101、当检测到新的投诉工单时,获取新的投诉工单对应的当前投诉内容;
在本发明实施例中,客服设备为了计算生成的新的投诉工单与历史投诉工单之间的相似度以将满足条件的历史投诉工单对应的历史处理方案作为新的投诉工单的参考处理方案,首先,当收到用户的投诉时,记录该投诉信息,作为一个新的投诉工单存储在本地信息库中,此时,客服设备即检测到了新的投诉工单,获取该新的投诉工单的内容,作为该新的投诉工单对应的当前投诉内容。
这里,新的投诉工单为客服设备最新接收到的待处理的投诉工单;客服设备为获取参考处理方案的装置的具体应用。
需要说明的是,具体客服设备当收到用户的投诉时,如果是话务员收到用户的语音投诉,此时,由话务员记录用户的投诉内容,生成新的投诉工单;如果是客服设备侧收到的用户的投诉,由设备将用户的投诉内容转化为文本信息后作为当前投诉内容。也就是说,这里的当前投诉内容为文本信息。
S102、根据当前投诉内容,构建当前特征向量序列;
在本发明实施例中,由于当前投诉内容中会存在特殊字符或者不标准的描述语言,计算机不能完全识别该当前投诉内容,因此,客服设备根据该当前投诉内容,构建当前特征向量序列,该当前特征向量是能够被计算机识别的信息。
进一步地,在本发明实施例中,S102中客服设备根据当前投诉内容,构建当前特征向量序列,具体包括S102a-S102d,其中:
S102a、根据当前投诉内容,确定当前特征项;
需要说明的是,当前特征项为新的投诉工单中能够表征投诉内容的关键词,而该当前特征项的数量至少为一个。
S102b、计算当前特征项对应的当前权重;
在本发明实施例中,客服设备在得到了新的投诉工单的当前特征项之后,需要计算当前特征项对应的当前权重。
需要说明的是,当前权重与当前特征项相对应,即当前权重是当前特征项在该条新的投诉工单的重要程度,如果有N个当前特征项,则有N个当前权重与N个当前特征项相对应。
S102c、将当前特征项与对应的当前权重作为一个当前特征向量;
在本发明实施例中,特征向量由当前特征项与对应的当前权重一一对应组成,如果有N个当前特征项和对应的N个当前权重,则构建对应的N个当前特征向量。这里,N为大于等于1的正整数。
S102d、将当前特征向量组合为当前特征向量序列。
在本发明实施例中,所有的当前特征向量构成当前特征向量序列,如果新的投诉工单存在N个当前特征向量,则将N个当前特征向量组合为一个当前特征向量序列。这里,N为大于等于1的正整数。
示例性地,[ai,wi]为新的投诉工单的当前特征向量,其中,ai为该条新的投诉工单中的第i个当前特征项,wi为ai在该条新的投诉工单中的权重。再比如,式(1)即为一个新的投诉工单的当前特征向量序列。式(1)如下所示:
A={[a1,w1],[a2,w2],…,[an,wn]} (1)
进一步地,在本发明实施例中,S102a中客服设备根据当前投诉内容,确定当前特征项,具体包括S102a1-S102a4,其中:
S102a1、客服设备对当前投诉内容进行分词处理,得到当前分词信息;
需要说明的是,由于当前投诉内容为文本信息,本发明实施例借用现有技术中的分词技术对当前投诉内容进行分词处理。
S102a2、获取新的投诉工单的业务信息;
在本发明实施例中,新的投诉工单中包含了与业务相关的描述和与业务无关的描述,客服设备确定与业务相关的描述新的过程即是获取新的投诉工单的业务信息的过程。
S102a3、从当前分词信息中确定与业务信息对应的当前关键词;
在本发明实施例中,新的投诉工单中只有与业务相关的描述才能表征客户的投诉问题,因此,客服设备从当前分词信息中提取出与业务信息相关的分词作为当前关键词。
S102a4、从当前关键词中确定当前特征项。
需要说明的是,客服设备从当前关键词中确定当前特征项,可以将当前关键词全部作为当前特征项,还可以从当前关键词中提取部分作为当前特征项,本发明实施例对此不作具体限定。
示例性地,对新的投诉工单中的资费描述关键词进行统计以分析造成资费投诉的主要资费套餐时,在“Python”工具上利用“jieba”分词的精确模式对新的投诉内容进行分词,并从中提取与资费相关的关键词,而关键词可能涉及到的有:具体的套餐名称和用户投诉的主要问题,这里,仅需要将具体的套餐名称对应的关键词作为当前特征项。
进一步地,在本发明实施例中,客服设备从当前关键词中提取部分作为当前特征项时,S102a4具体包括:
S102a40、客服设备利用预设提取算法从当前关键词中确定当前特征项。
需要说明的时,预设提取算法为能够从当前关键词中选择出能够表征新的投诉工单的当前投诉内容的计算方法。
优选地,预设提取算法可以为TF-IDF(Term Frequency-Inverse DocumentFrequency,词频-逆文档频率)是一种用于情报检索与文本挖掘的常用加权技术,用以评估一个词对于一个文件或者一个语料库中的一个领域文件集的重要程度。在一份给定的文件里,TF(Term Frequency,词频)指的是某一个给定的词语在该文件中出现的次数。IDF(Inverse Document Frequency,逆向文件频率)是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语的文件的数目,再将得到的商取对数得到。词频是一词语出现的次数除以该文件的总词语数。比如一篇文件的总词语数是100个,而词语“动感地带”出现了3次,那么“动感地带”一词在该文件中的词频就是3/100。一个计算文件频率的方法是测定有多少份文件出现过“动感地带”一词,然后除以文件集里包含的文件总数。比如,如果“动感地带”一词在1,000份文件出现过,而文件总数是10,000,000份的话,其逆向文件频率就是log(10,000,000/(1,000+1))。最后的TF-IDF为(3/100)*(log(10,000,000/(1,000+1)))。
在本发明实施例中,将词频-逆文档频率应用在客服设备从当前关键词中确定当前特征项时,当前关键词c的词频-逆文档频率如式(2)所示,其中,TF(c)是当前关键词c的词频,TF(c)的具体计算方式如式(3)所示。w(c)是当前关键词c在新的投诉工单中的出现次数,NumC是新的投诉工单中提取的所有当前关键词数,IDF(c)是当前关键词c的逆文档频率,IDF(c)的具体计算方式如式(4)所示。NumG是当天的所有新的投诉工单总数,NumG(c)是当天包含有当前关键词c的新的投诉工单数。在得到了所有当前关键词对应的词频-逆文档频率之后,对所有当前关键词对应的词频-逆文档频率按照从大到小的顺序进行排序,然后从中挑选出排在最前的预设个数的当前关键词作为新的投诉工单的当前特征项。式(2)、式(3)和式(4)如下所示:
TF_IDF(c)=TF(c)×IDF(c) (2)
优选地,在本发明实施例中,当前特征项对应的当前权重的计算通过式(5)计算得出,式(5)如下所示:
其中,awi是第i个当前特征项在该条新的投诉工单中的出现次数,max_aw是该条新的投诉工单中所有当前特征项出现次数的最大值。
S103、从本地信息库中获取历史投诉工单、历史投诉工单对应的历史特征向量序列和历史投诉工单对应的历史处理方案,历史投诉工单为生成新的投诉工单之前生成的投诉工单;
在本发明实施例中,当客服设备对新的投诉工单进行分析处理得到当前特征向量序列之后,就可以通过将当前特征向量序列与历史投诉工单对应的历史特征向量序列确定新的投诉工单与该条历史投诉工单的相似度。这里,客服设备需先从本地信息库中获取历史投诉工单、历史投诉工单对应的历史特征向量序列和历史投诉工单对应的历史处理方案。
这里,历史投诉工单为生成新的投诉工单之前生成的投诉工单,即历史投诉工单为客服设备已经处理过的投诉工单,每条历史投诉工单都在本地信息库中存储有对应的历史处理方案。
另外,为了简化客服设备将新的投诉工单与每条历史投诉工单进行相似度比较的计算量,客服设备在本地信息库中存储有历史投诉工单对应的历史特征向量序列。具体地,从每条历史投诉工单得到对应的历史特征向量序列的过程可参考本发明实施例中S101-S102由新的投诉工单得到对应的当前特征向量序列的过程,本发明实施例对此不再赘述。
也就是说,在本发明实施例中,客服设备根据当前特征向量序列和历史投诉工单对应的历史特征向量序列,计算新的投诉工单和历史投诉工单的相似度之前,还包括:客服设备获取历史投诉工单的历史投诉内容,确定历史特征项;并计算历史特征向对应的历史权重;然后,将历史特征项与对应的历史权重作为一个历史特征向量;并将历史特征向量组合为历史特征向量序列;最后,将历史投诉工单对应的历史特征向量序列存储在本地信息库。
需要说明的是,本地信息库由客服设备中具有存储功能的模块实现。
S104、根据当前特征向量序列和历史投诉工单对应的历史特征向量序列,计算新的投诉工单和历史投诉工单的相似度;
在本发明实施例中,客服设备得到当前特征向量序列和历史特征向量序列之后,通过对两者的特征项和对应的权重进行分析和计算,就能够得到新的投诉工单和历史投诉工单的相似度。
进一步地,在本发明实施例中,S104中客服设备根据当前特征向量序列和历史投诉工单对应的历史特征向量序列,计算新的投诉工单和历史投诉工单的相似度,具体包括S104a-S104b,其中:
S104a、客服设备将当前特征向量序列和历史投诉工单对应的历史特征向量序列进行特征项对比重构,得到当前待比较特征向量序列和历史待比较特征向量序列;
需要说明的是,客服设备将当前特征向量序列和历史特征向量序列进行对比重构时,逐一判断其中一个特征向量序列中的每个特征项是否存在于另一个特征向量序列中,如果否,则在另一个特征向量序列中增加由该特征项和权重值为0的特征向量。这里,可以先将当前向量序列作为其中一个特征向量序列,将历史特征向量序列作为另一个特征向量序列进行对比重构,然后将历史特征向量序列作为其中一个特征向量序列,将当前特征向量序列作为另一个特征向量序列进行对比重构,得到当前待比较特征向量序列和历史待比较特征向量序列,至此,当前待比较特征向量序列和历史待比较特征向量序列包含有相同的特征项。对待比较特征向量序列和历史待比较特征向量序列进行调整,以使待比较特征向量序列和历史待比较特征向量序列中的特征项的排序位置相同。
示例性地,A1为当前特征向量序列,A2为历史特征向量序列。首先,从A2中逐一提取每个历史特征向量,并判断所提取的历史特征向量中的历史特征项是否存在于A1中,如果是,则继续从A2中提取下一个历史特征向量,直至提取完A2中的所有历史特征向量;如果否,则在A1中增加一个当前特征向量,新增的当前特征向量对应的当前特征项是从A2中提取的历史特征向量中的历史特征项,新增的当前特征向量对应的当前权重为0,然后继续从A2中提取下一个历史特征向量,直至提取完A2中的所有历史特征向量。然后,从A1中逐一提取每个当前特征向量,并判断所提取的当前特征向量中的当前特征项是否存在于A2中,如果是,则继续从A1中提取下一个当前特征向量,直至提取完A1中的所有当前特征向量;如果否,则在A2中增加一个历史特征向量,新增的历史特征向量对应的历史特征项是从A1中提取的当前特征向量中对应的当前特征项,新增的历史特征向量对应的历史权重为0,然后继续从A1中提取下一个当前特征向量,直至提取完A1中的所有当前特征向量。至此,A1和A2中包含有相同数量的特征向量,且特征向量中所包含的特征项也相同。最后,按照特征向量中特征项的权重从大到小的次序,对新的投诉工单的当前特征向量序列A1中的所有当前特征向量进行排序;并按照A1中所有当前特征向量的当前特征项的排列次序,将历史投诉工单的历史特征向量序列A2中的所有历史特征向量进行排序,从而使得A1和A2中相同特征项所对应的特征向量的排序位置也相同。
需要说明的是,客服设备在对当前特征向量序列和历史特征向量序列中的特性向量的序列进行调整时,除了先调整当前特征向量序列中的当前特征向量的排序位置,再对历史特征向量序列中的历史特征向量按当前特征向量的排序位置进行调整外;还可以直接将历史特征向量序列中的历史特征向量按当前特征向量的排序位置进行调整。本发明实施例对此不作具体限定。
S104b、基于当前待比较特征向量序列和历史待比较特征向量序列,计算新的投诉工单和历史投诉工单的相似度。
在本发明实施例中,在得到了当前待比较特征向量序列和历史待比较特征向量序列之后,客服设备就能够比较其中的特征项得到投诉工单和历史投诉工单的相似度
进一步地,在本发明实施例中,S104b中客服设备基于当前待比较特征向量序列和历史待比较特征向量序列,计算新的投诉工单和历史投诉工单的相似度,具体包括S104b1-S104b3,其中:
S104b1、构建横坐标为特征向量在对应的特征向量序列中的排序位置和纵坐标为对应的特征向量中特征项的权重的二维坐标;
在本发明实施例中,为了以每个特征向量为节点进行比较计算新的投诉工单和历史投诉工单的相似度的计算,客服设备需构建横坐标为特征向量在对应的特征向量序列中的排序位置和纵坐标为对应的特征向量中特征项的权重的二维坐标。
S104b2、分别将当前待比较特征向量序列和历史待比较特征向量序列映射到二维坐标中,得到对应的当前待计算特征向量序列和历史待计算特征向量序列;
需要说明的是,在本发明实施例中,客服设备在得到当前待比较特征向量序列和历史待比较特征向量序列之后,将其中特征项所属的特征向量在对应的投诉工单中的位置序号,以及该特征项对应的权重重新构成对应的当前待计算特征向量序列和历史待计算特征向量序列。
S104b3、基于当前待计算特征向量序列和历史待计算特征向量序列,计算新的投诉工单和历史投诉工单的相似度。
在本发明实施例中,客服设备根据当前待计算特征向量序列和历史待计算特征向量序列,以其中的每个特征向量为节点进行新的投诉工单和历史投诉工单的相似度的计算。
示例性地,式(1)为当前特征向量序列,该当前特征向量序列中的一个当前特征向量[ai,wi]所对应的当前待计算特征向量序列中的特征向量节点为q(i,wi)。
优选地,客服设备在构建好二维坐标之后,将新的待比较特征向量序列和历史待比较特征向量序列映射到二维坐标中,得到对应的当前特征向量曲线和历史特征向量曲线;计算当前特征向量曲线和历史特征向量曲线所围成区域的几何面积,将几何面积作为新的投诉工单和历史投诉工单的相似度。
示例性地,图2为本发明实施例提供的一种示例性地计算新的投诉工单和历史投诉工单的相似度的流程示意图,如图2所示:计算开始后,设定i为1;分别从新的投诉工单的当前特征向量曲线Q1、历史投诉工单的历史特征向量曲线Q2中提取第i和i+1个特征向量节点,其中,和分别是Q1的第i和i+1个当前特征向量节点,和分别是Q2的第i、i+1个历史特征向量节点,计算由所提取的特征向量节点 和所构成的几何面的面积s(i,i+1);更新i为i+1,然后判断i是否为N,如果是,则继续下一步;如果否,则继续上一步特征向量节点的提取以及对应面积的计算,其中,N是新的投诉工单的当前特征向量序列对应的所有当前特征向量数;统计新的投诉工单和历史投诉工单之间的相似度如式(6)所示。容易想到的是,S的值越趋向于0,说明两条投诉工单越相似,S的值越大,说明两条投诉工单的相似性越小。式(6)如下所示:
图3为本发明实施例提供的一种示例性的计算新的投诉工单和历史投诉工单的相似度的示意图,如图3所示,新的投诉工单的当前待计算特征向量序列为A1,如式(7)所示,历史投诉工单的历史待计算特征向量序列为A2,如式(8)所示,X表征横坐标,为特征向量在对应的特征向量序列中的排序位置;Y表征纵坐标,为对应的特征向量中特征项的权重。Q1是新的投诉工单的当前特征向量曲线、Q2是历史投诉工单的历史特征向量曲线,两条特征向量曲线之间所围成的区域的几何面积即是两条投诉工单之间的相似度。其中,Q1的4个当前特征向量节点分别为:Q2的4个历史特征向量节点分别为:每个特征向量节点的横坐标是其在特征向量序列中的排序位置,纵坐标是其特征向量中的权重。s(1,2)是和所构成的区域的几何面积,s(2,3)是和所构成的区域的几何面积,s(3,4)是 和所构成的区域的几何面积,新的投诉工单和历史投诉工单之间的相似度如式(9)所示。式(7)、式(8)和式(9)如下所示:
A1={[a1,1],[a2,0.8],[a3,0.8],[a4,0.6]} (7)
A2={[a1,0.8],[a2,0.6],[a3,0.5],[a4,0.4]} (8)
S=s(1,2)+s(2,3)+s(3,4) (9)
需要说明的是,客服设备在得到当前待计算特征向量序列和历史待计算特征向量序列之后,还可以基于各对应特征向量之间的连接线信息计算新的投诉工单和历史投诉工单的相似度。也就是说,凡是基于当前待计算特征向量序列和历史待计算特征向量序列计算新的投诉工单和历史投诉工单的相似度的技术方案,均属于本发明实施例要保护的范围。
S105、当相似度满足预设条件时,将历史投诉工单对应的历史处理方案作为新的投诉工单的参考处理方案。
在本发明实施例中,客服设备通过比较新的投诉工单与历史投诉工单的特征向量序列计算新的投诉工单与历史投诉工单,旨在将相似度高的历史投诉工单对应的历史处理方案作为新的投诉工单的参考处理方案。
需要说明的是,预设条件为预存在客服设备中信息,比如预设条件为相似度:小于10,则当相似度为11时相应的历史投诉工单对应的历史处理方案不能作为新的投诉工单的参考处理方案;而相似度为10时相应的历史投诉工单对应的历史处理方案能够作为新的投诉工单的参考处理方案。
另外,在本发明实施例中,预设条件还可以实时确定,比如当计算得到新的投诉工单和每条历史投诉工单的多个相似度后,由该多个相似度确定预设条件。
示例性地,根据相似度从大到小的顺序进行排列,遴选排在前面的多条(例如50条)投诉工单,作为与新的投诉工单最相似的历史投诉工单,并将该历史投诉工单对应的历史处理方案作为新的投诉工单的参考处理方案。
进一步地,在本发明实施例中,S105之后,即客服设备在当相似度满足预设条件时,将历史投诉工单对应的历史处理方案作为新的投诉工单的参考处理方案之后,还包括S106:
S106、客服设备将新的投诉工单对应的当前特征向量序列存储在本地信息库。
在本发明实施例中,为了进一步简化计算量,客服设备在对新的投诉工单处理完之后,该条新的投诉工单就已是历史投诉工单,通过将该条新的投诉工单对应的当前特征向量序列作为历史投诉工单对应的历史特征向量序列存储在本地信息库,以使再次检测到新的投诉工单时,从本地信息库中获取历史特征向量序列进行对比。
在本发明实施例中,客服设备还可以将新的投诉工单的处理方案存储在本地信息库,以作为再次检测到新的投诉工单的参考处理方案的选择处理方案。
需要说的是,本发明实施例所涉及的当前特征项和历史特征项均称为特征项,当前特征向量和历史特征向量均称为特征向量,当前特征向量序列和历史特征向量序列均称为特征向量序列,当前特征向量曲线和历史特征向量曲线均称为特征向量曲线,新的投诉工单和历史投诉工单均称为投诉工单。
可以理解的是,通过计算新的投诉工单与历史投诉工单的相似度,并基于该相似度得到新的投诉工单的参考处理方案,使得该参考处理方案与新的投诉工单的关联性高,从而提高了新的投诉工单的参考处理方案的准确率。另外,本发明实施例通过计算新的投诉工单和数据库中每条历史投诉工单之间的相似度,并从中挑选相似度最高的若干历史投诉工单的历史投诉内容和历史处理方案来展示给话务员,从而使得话务员能及时处理一些能现场解决的用户投诉,有效节省人工成本、提高客服服务质量;此外,本发明实施例还进一步从每条投诉工单中提取特征项,并构成该条投诉工单的特征向量序列,然后通过两条投诉工单的特征向量序列与坐标轴之间的面积差计算来获得这两条投诉工单之间的相似度,即只需对两条投诉工单进行特征项对等、计算即可,从而有效地控制了投诉工单的特征向量序列长度、避免了不必要的计算,具有较强的可行性。
实施例二
基于与实施例一同一发明构思,本发明实施例提供了一种获取参考处理方案的装置1,对应于一种获取参考处理方案的方法,图4为本发明实施例提供的一种获取参考处理方案的装置的结构示意图一,如图4所示,该获取参考处理方案的装置1包括:
获取单元10,用于当检测到新的投诉工单时,获取所述新的投诉工单对应的当前投诉内容;
构建单元11,用于根据所述当前投诉内容,构建当前特征向量序列;
所述获取单元10,还用于从本地信息库中获取历史投诉工单、所述历史投诉工单对应的历史特征向量序列和所述历史投诉工单对应的历史处理方案,所述历史投诉工单为生成所述新的投诉工单之前生成的投诉工单;
计算单元12,用于根据所述当前特征向量序列和所述历史投诉工单对应的所述历史特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度;以及当所述相似度满足预设条件时,将所述历史投诉工单对应的所述历史处理方案作为所述新的投诉工单的所述参考处理方案。
可选地,所述构建单元11,具体用于根据所述当前投诉内容,确定当前特征项;并计算所述当前特征项对应的当前权重;将所述当前特征项与对应的所述当前权重作为一个当前特征向量;以及将所述当前特征向量组合为所述当前特征向量序列。
可选地,所述构建单元11,还具体用于对所述当前投诉内容进行分词处理,得到当前分词信息;并获取所述新的投诉工单的业务信息;以及从所述当前分词信息中确定与所述业务信息对应的当前关键词;以及从所述当前关键词中确定所述当前特征项。
可选地,所述构建单元11,还具体用于利用预设提取算法从所述当前关键词中确定所述当前特征项。
可选地,所述计算单元12,具体用于将所述当前特征向量序列和历史投诉工单对应的历史特征向量序列进行特征项对比重构,得到当前待比较特征向量序列和历史待比较特征向量序列,所述当前待比较特征向量序列和所述历史待比较特征向量序列包含有相同的特征项、且所述特征项的排列顺序相同;以及基于所述当前待比较特征向量序列和所述历史待比较特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度。
可选地,所述计算单元12,还具体用于构建横坐标为特征向量在对应的特征向量序列中的排序位置和纵坐标为对应的所述特征向量中所述特征项的权重的二维坐标;以及分别将所述当前待比较特征向量序列和历史待比较特征向量序列映射到所述二维坐标中,得到对应的当前待计算特征向量序列和历史待计算特征向量序列;并基于所述当前待计算特征向量序列和所述历史待计算特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度。
可选地,所述获取参考处理方案的装置1还包括:生成单元13,用于获取所述历史投诉工单的历史投诉内容,确定历史特征项;计算所述历史特征向对应的历史权重;将所述历史特征项与对应的所述历史权重作为一个历史特征向量;将所述历史特征向量组合为所述历史特征向量序列;将所述历史投诉工单对应的所述历史特征向量序列存储在所述本地信息库。
可选地,所述获取参考处理方案的装置1还包括:存储单元14,用于将所述新的投诉工单对应的当前特征向量序列存储在所述本地信息库。
需要说明的是,在实际应用中,上述获取单元10、构建单元11、计算单元12和生成单元13可由位于装置1上的处理器15实现,具体为CPU(Central Processing Unit,中央处理器)、MPU(Microprocessor Unit,微处理器)、DSP(Digital Signal Processing,数字信号处理器)或现场可编程门阵列(FPGA,Field Programmable Gate Array)等实现;上述存储单元14可由位于获取参考处理方案的装置1上的存储器17实现。
本发明实施例还提供了一种获取参考处理方案的装置1,如图5所示,所述获取参考处理方案的装置1包括:处理器15、接收器16、存储器17和通信总线18,所述接收器16和所述存储器17通过所述通信总线18与所述处理器15进行通信,所述存储器17存储所述处理器15可执行的指令,当所述指令被执行时,通过所述处理器15执行如实施例一所述的获取参考处理方案的方法。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器15执行时实现如实施例一所述的获取参考处理方案的方法。
可以理解的是,通过计算新的投诉工单与历史投诉工单的相似度,并基于该相似度得到新的投诉工单的参考处理方案,使得该参考处理方案与新的投诉工单的关联性高,从而提高了新的投诉工单的参考处理方案的准确率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (8)
1.一种获取参考处理方案的方法,其特征在于,所述方法包括:
当检测到新的投诉工单时,获取所述新的投诉工单对应的当前投诉内容;
根据所述当前投诉内容,构建当前特征向量序列;
从本地信息库中获取历史投诉工单、所述历史投诉工单对应的历史特征向量序列和所述历史投诉工单对应的历史处理方案,所述历史投诉工单为生成所述新的投诉工单之前生成的投诉工单;
根据所述当前特征向量序列和所述历史投诉工单对应的所述历史特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度;
当所述相似度满足预设阈值时,将所述历史投诉工单对应的所述历史处理方案作为所述新的投诉工单的所述参考处理方案;
所述根据所述当前特征向量序列和所述历史投诉工单对应的所述历史特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度,包括:
将所述当前特征向量序列和历史投诉工单对应的历史特征向量序列进行特征项对比重构,得到当前待比较特征向量序列和历史待比较特征向量序列,所述当前待比较特征向量序列和所述历史待比较特征向量序列包含有相同的特征项、且所述特征项的排列顺序相同;
基于所述当前待比较特征向量序列和所述历史待比较特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度;
所述基于所述当前待比较特征向量序列和所述历史待比较特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度,包括:
构建横坐标为特征向量在对应的特征向量序列中的排序位置和纵坐标为对应的所述特征向量中所述特征项的权重的二维坐标;
分别将所述当前待比较特征向量序列和历史待比较特征向量序列映射到所述二维坐标中,得到对应的当前待计算特征向量序列和历史待计算特征向量序列;
基于所述当前待计算特征向量序列和所述历史待计算特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前投诉内容,构建当前特征向量序列,包括:
根据所述当前投诉内容,确定当前特征项;
计算所述当前特征项对应的当前权重;
将所述当前特征项与对应的所述当前权重作为一个当前特征向量;
将所述当前特征向量组合为所述当前特征向量序列。
3.根据权利要求2所述的方法,其特征在于,所述根据所述当前投诉内容,确定当前特征项,包括:
对所述当前投诉内容进行分词处理,得到当前分词信息;
获取所述新的投诉工单的业务信息;
从所述当前分词信息中确定与所述业务信息对应的当前关键词;
从所述当前关键词中确定所述当前特征项。
4.根据权利要求3所述的方法,其特征在于,所述从所述当前关键词中确定所述当前特征项,包括:
利用预设提取算法从所述当前关键词中确定所述当前特征项。
5.根据权利要求1所述的方法,其特征在于,所述根据所述当前特征向量序列和所述历史投诉工单对应的历史特征向量序列,计算所述新的投诉工单和所述历史投诉工单的相似度之前,所述方法还包括:
获取所述历史投诉工单的历史投诉内容,确定历史特征项;
计算所述历史特征向对应的历史权重;
将所述历史特征项与对应的所述历史权重作为一个历史特征向量;
将所述历史特征向量组合为所述历史特征向量序列;
将所述历史投诉工单对应的所述历史特征向量序列存储在所述本地信息库。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述当所述相似度满足预设阈值时,将所述历史投诉工单对应的所述历史处理方案作为所述新的投诉工单的所述参考处理方案之后,所述方法还包括:
将所述新的投诉工单对应的当前特征向量序列存储在所述本地信息库。
7.一种获取参考处理方案的装置,其特征在于,所述装置包括:处理器、接收器、存储器和通信总线,所述接收器和所述存储器通过所述通信总线与所述处理器进行通信,所述存储器存储所述处理器可执行的指令,当所述指令被执行时,通过所述处理器执行如权利要求1-6任一项所述的方法。
8.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810745743.XA CN110705245B (zh) | 2018-07-09 | 2018-07-09 | 一种获取参考处理方案的方法及装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810745743.XA CN110705245B (zh) | 2018-07-09 | 2018-07-09 | 一种获取参考处理方案的方法及装置、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110705245A CN110705245A (zh) | 2020-01-17 |
CN110705245B true CN110705245B (zh) | 2023-04-28 |
Family
ID=69192572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810745743.XA Active CN110705245B (zh) | 2018-07-09 | 2018-07-09 | 一种获取参考处理方案的方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705245B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738596B (zh) * | 2020-06-22 | 2024-03-22 | 中国银行股份有限公司 | 工单派发方法及装置 |
CN113993141B (zh) * | 2020-07-27 | 2024-02-27 | 北京市天元网络技术股份有限公司 | 网络优化方法及装置 |
CN112107866A (zh) * | 2020-09-28 | 2020-12-22 | 腾讯科技(深圳)有限公司 | 用户行为数据处理方法、装置、设备及存储介质 |
CN112258201A (zh) * | 2020-10-29 | 2021-01-22 | 广州新奥达云科技有限公司 | 基于电商平台的客服工单的处理方法、装置、计算机设备 |
CN113128223A (zh) * | 2021-05-17 | 2021-07-16 | 深圳博沃智慧科技有限公司 | 污染投诉重复线索的识别方法、装置及设备 |
CN115170153B (zh) * | 2022-06-10 | 2023-04-21 | 天翼爱音乐文化科技有限公司 | 一种基于多维属性的工单处理方法、装置及存储介质 |
CN116993133B (zh) * | 2023-09-27 | 2024-01-26 | 尚云(广州)信息科技有限公司 | 一种基于人脸识别的智能工单系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104699786A (zh) * | 2015-03-17 | 2015-06-10 | 浪潮通信信息系统有限公司 | 一种语义智能搜索的通信网络投诉系统 |
CN105938600A (zh) * | 2016-04-15 | 2016-09-14 | 北京思特奇信息技术股份有限公司 | 一种基于b/s架构工单流转的客户投诉解决方法及系统 |
CN107844559A (zh) * | 2017-10-31 | 2018-03-27 | 国信优易数据有限公司 | 一种文件分类方法、装置及电子设备 |
CN107861942A (zh) * | 2017-10-11 | 2018-03-30 | 国网浙江省电力公司电力科学研究院 | 一种基于深度学习的电力疑似投诉工单识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170123964A1 (en) * | 2015-11-04 | 2017-05-04 | International Business Machines Corporation | Finding Duplicates in Prior Runs of Static Analysis Tools |
-
2018
- 2018-07-09 CN CN201810745743.XA patent/CN110705245B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104699786A (zh) * | 2015-03-17 | 2015-06-10 | 浪潮通信信息系统有限公司 | 一种语义智能搜索的通信网络投诉系统 |
CN105938600A (zh) * | 2016-04-15 | 2016-09-14 | 北京思特奇信息技术股份有限公司 | 一种基于b/s架构工单流转的客户投诉解决方法及系统 |
CN107861942A (zh) * | 2017-10-11 | 2018-03-30 | 国网浙江省电力公司电力科学研究院 | 一种基于深度学习的电力疑似投诉工单识别方法 |
CN107844559A (zh) * | 2017-10-31 | 2018-03-27 | 国信优易数据有限公司 | 一种文件分类方法、装置及电子设备 |
Non-Patent Citations (4)
Title |
---|
基于文本向量化方法构建IT运维服务台事中处置参考模型;陈晓伟等;《计算机系统应用》;20161015(第10期);正文1-3 * |
基于文本挖掘技术的客服投诉工单自动分类探讨;李颢等;《移动通信》;20171215(第23期);全文 * |
工作流技术在交通投诉信息系统中的应用;何俊等;《科技资讯》;20141023(第30期);全文 * |
深度学习在电力潜在投诉识别分类中的应用;罗欣等;《浙江电力》;20171025(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110705245A (zh) | 2020-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110705245B (zh) | 一种获取参考处理方案的方法及装置、存储介质 | |
US9569499B2 (en) | Method and apparatus for recommending content on the internet by evaluating users having similar preference tendencies | |
CN108021691B (zh) | 答案查找方法、客服机器人以及计算机可读存储介质 | |
CN108833458B (zh) | 一种应用推荐方法、装置、介质及设备 | |
KR102109995B1 (ko) | 검색 결과를 랭킹하는 방법과 시스템 및 검색 결과 랭킹을 최적화하는 방법과 시스템 | |
US11403303B2 (en) | Method and device for generating ranking model | |
JP2019519027A (ja) | 履歴ログからの学習と、etlツール内のデータアセットに関するデータベースオペレーションの推奨 | |
KR20180118597A (ko) | 네트워크 액세스 행동을 식별하는 방법 및 장치, 서버와 저장 매체 | |
EP3279806A1 (en) | Data processing method and apparatus | |
WO2020253357A1 (zh) | 数据产品推荐方法、装置、计算机设备和存储介质 | |
WO2012018694A1 (en) | Predicting a user behavior number of a word | |
CN101127049A (zh) | 结构化数据的聚类 | |
CN103136213A (zh) | 一种提供相关词的方法及装置 | |
CN110675179A (zh) | 营销信息处理方法、装置、电子设备及可读存储介质 | |
CN110008396B (zh) | 对象信息推送方法、装置、设备及计算机可读存储介质 | |
JP5367632B2 (ja) | 知識量推定装置及びプログラム | |
CN109992659B (zh) | 用于文本排序的方法和装置 | |
CN111159131A (zh) | 性能优化方法、装置、设备及计算机可读存储介质 | |
CN110827101B (zh) | 一种店铺推荐的方法和装置 | |
JP5461058B2 (ja) | レコメンド情報生成装置、端末装置、レコメンド情報生成方法及びレコメンド情報提示システム | |
JP7450190B2 (ja) | 特許情報処理装置、特許情報処理方法、およびプログラム | |
CN110569268A (zh) | 数据查询方法、系统及计算机可读存储介质 | |
CN111538905B (zh) | 一种对象的推荐方法及装置 | |
CN113763080A (zh) | 推荐物品的确定方法、装置、电子设备和存储介质 | |
CN111694872A (zh) | 一种业务处置的数据化方案的提供方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220706 Address after: 610041 China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan Applicant after: China Mobile (Chengdu) information and Communication Technology Co.,Ltd. Applicant after: CHINA MOBILE COMMUNICATIONS GROUP Co.,Ltd. Address before: 100032 No. 29, Finance Street, Beijing, Xicheng District Applicant before: CHINA MOBILE COMMUNICATIONS GROUP Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |