CN116823069B - 基于文本分析的智能客服服务质检方法及相关设备 - Google Patents

基于文本分析的智能客服服务质检方法及相关设备 Download PDF

Info

Publication number
CN116823069B
CN116823069B CN202311102104.9A CN202311102104A CN116823069B CN 116823069 B CN116823069 B CN 116823069B CN 202311102104 A CN202311102104 A CN 202311102104A CN 116823069 B CN116823069 B CN 116823069B
Authority
CN
China
Prior art keywords
quality inspection
customer service
target
vector
scattering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311102104.9A
Other languages
English (en)
Other versions
CN116823069A (zh
Inventor
张琦
周健
刘涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongguancun Kejin Technology Co Ltd
Original Assignee
Beijing Zhongguancun Kejin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongguancun Kejin Technology Co Ltd filed Critical Beijing Zhongguancun Kejin Technology Co Ltd
Priority to CN202311102104.9A priority Critical patent/CN116823069B/zh
Publication of CN116823069A publication Critical patent/CN116823069A/zh
Application granted granted Critical
Publication of CN116823069B publication Critical patent/CN116823069B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种基于文本分析的智能客服服务质检方法及相关设备,通过获取目标客服名单中各个目标客服各自对应的对话文本表征向量集合,通过违规项质检网络对对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况进行解析,通过各个违规项质检网络的散布情况确定目标客服对应的质检信息。上述以质检要素为不同的维度对对话文本表征向量的散布情况进行解析,结合每个质检要素的散布情况得到目标客服对应的质检信息,所以可以联合目标客服各个质检要素的对话文本表征向量来对目标客服进行违规识别,提高了网络得到的质检信息准确性,此外违规项质检机制不同,归集不同质检信息,进一步提高目标客服违规识别的准确性。

Description

基于文本分析的智能客服服务质检方法及相关设备
技术领域
本申请涉及文本处理、机器学习、客服领域,具体而言,涉及一种基于文本分析的智能客服服务质检方法及相关设备。
背景技术
客服是建立企业与用户重要的交流纽带,可以提供如营销、销售、售后支持、技术支持等于客户相关的服务。为了增加客服服务的及时性、规范性,以及降低企业成本,目前,较多企业的客服平台引入了智能机器人对用户的问题进行智能应答。但是,受限于目前智能客服机器人的能力,仍有大量客户有人工服务的需求,而人工客服中,可能产生客服服务合规性问题,例如用语不规范、错误信息表达、回复率低和响应速度慢等多种维度的合规要素,为了提高用户的客服使用体验,企业需要定期或实时对客服对话进行质检,如何提高质检效率和准确性是需要考虑的技术问题。
发明内容
本发明的目的在于提供一种基于文本分析的智能客服服务质检方法及相关设备。
本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供了一种基于文本分析的智能客服服务质检方法,应用于质检设备,所述方法包括:
获取拟进行违规识别的目标客服名单,所述目标客服名单包括多个目标客服;
获取各个所述目标客服各自对应的对话文本表征向量集合,所述对话文本表征向量集合包括多个质检要素各自对应的对话文本表征向量;
确定违规项质检网络集合,所述违规项质检网络集合包括多个违规项质检网络;所述违规项质检网络集合中的违规项质检网络使用的违规项质检机制不同;
依据各个所述违规项质检网络,确定所述目标客服对应的对话文本表征向量集合中,各个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况;
通过所述违规项质检网络输出的所述散布情况确定所述违规项质检网络对所述目标客服的质检信息;
对所述违规项质检网络集合中各个违规项质检网络对所述目标客服的质检信息进行信息归集,得到所述目标客服的客服服务质检结果。
作为一种实施方式,所述依据各个所述违规项质检网络,确定所述目标客服对应的对话文本表征向量集合中,各个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况,包括:
在所述目标客服对应的对话文本表征向量集合中获取质检要素对应的对话文本表征向量,获得每个质检要素各自对应的目标表征向量集合;
获取违规项质检网络中所述目标表征向量集合对应的散布分类机制;
通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
作为一种实施方式,所述目标表征向量集合对应的散布分类机制包括通过临界值进行划类的机制,所述获取违规项质检网络中所述目标表征向量集合对应的散布分类机制,通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:
获取表征向量散布层级图,所述表征向量散布层级图包括多个分支层级;
将表征向量散布层级图的起始层级确定为所述目标客服对应的当下分支层级,获取当下分支层级对应的当下质检要素,获取所述当下质检要素对应的当下目标表征向量集合的当下表征向量分类临界值;
通过当下表征向量分类临界值和所述目标客服在所述当下质检要素的对话文本表征向量,确定所述对话文本表征向量在当下目标表征向量集合中的散布情况;
通过所述散布情况确定所述目标客服对应的下一分支层级,将下一层级作为迭代后的当下分支层级,跳转到获取当下分支层级对应的当下质检要素,获取所述当下质检要素对应的当下目标表征向量集合的当下表征向量分类临界值的步骤进行循环,直到所述目标客服对应的分支层级迭代结束。
作为一种实施方式,所述通过所述违规项质检网络输出的所述散布情况确定所述违规项质检网络对所述目标客服的质检信息,包括:
通过所述散布情况确定所述目标客服对应的分支层级;
对所述目标客服对应的分支层级的个数进行信息归集,得到所述目标客服在所述表征向量散布层级图中的扩散范围;
通过所述扩散范围确定所述目标客服对应的第一违规识别结果,所述违规识别结果与所述扩散范围呈反向关联;
通过所述第一违规识别结果确定所述违规项质检网络对所述目标客服的质检信息。
作为一种实施方式,所述散布分类机制包括通过散布范围进行划类的机制,所述获取违规项质检网络中所述目标表征向量集合对应的散布分类机制;通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:
获取违规项质检网络中所述目标表征向量集合对应的表征向量分类范围集合,所述表征向量分类范围集合包括多个表征向量分类范围;
获取所述目标表征向量集合中的对话文本表征向量在各个表征向量分类范围的表征向量个数;
通过所述表征向量个数确定所述表征向量分类范围对应的散布集中度,将所述散布集中度作为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
作为一种实施方式,所述通过所述违规项质检网络输出的所述散布情况确定所述违规项质检网络对所述目标客服的质检信息,包括:
通过所述散布集中度确定所述对话文本表征向量对应的向量违规识别结果,所述向量违规识别结果与所述散布集中度呈反向关联;
对所述目标客服对应的对话文本表征向量集合中各个对话文本表征向量对应的向量违规识别结果进行信息归集,得到所述目标客服对应的第二违规识别结果;
通过所述第二违规识别结果确定所述违规项质检网络对所述目标客服的质检信息。
作为一种实施方式,所述获取违规项质检网络中所述目标表征向量集合对应的散布分类机制;通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:
确定边界分类临界值;
通过所述边界分类临界值确定所述目标表征向量集合中表征向量末端对应的末端表征向量集合以及表征向量首端对应的首端表征向量集合;
对所述末端表征向量集合进行信息归集,得到所述表征向量集合对应的末端表征向量归集值;
通过所述表征向量集合对应的末端表征向量归集值确定所述对话文本表征向量对应末端散布概率;
对所述首端表征向量集合进行信息归集,得到所述表征向量集合对应的首端表征向量归集值;
通过所述表征向量集合对应的首端表征向量归集值确定所述对话文本表征向量对应首端散布概率;
通过所述末端散布概率以及所述首端散布概率确定所述对话文本表征向量对应的目标散布概率,将所述目标散布概率确定为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
作为一种实施方式,所述通过所述末端散布概率以及所述首端散布概率确定所述对话文本表征向量对应的目标散布概率,将所述目标散布概率确定为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:
获取对话文本表征向量集合中各个对话文本表征向量的均值结果,通过所述对话文本表征向量集合对应的均值结果确定所述目标客服对应的偏态系数;
获取对照偏态系数,确定所述偏态系数与所述对照偏态系数的差值;
通过所述偏态系数与所述对照偏态系数的差值,从所述末端散布概率和所述首端散布概率中确定偏态散布概率;
将所述末端散布概率、所述首端散布概率和所述偏态散布概率进行差值计算,通过差值计算结果在所述末端散布概率、所述首端散布概率和所述偏态散布概率中确定所述对话文本表征向量对应的目标散布概率;
将所述目标散布概率确定为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
作为一种实施方式,所述对所述违规项质检网络集合中各个违规项质检网络对所述目标客服的质检信息进行信息归集,得到所述目标客服的客服服务质检结果,包括:
通过对所述目标客服的质检信息确定质检信息为违规的违规信息数目;
当所述违规信息数目大于违规数目临界值时,确定所述目标客服为违规服务客服,得到所述目标客服的客服服务质检结果;
所述方法还包括:
获取所述目标客服的违规指示信息注释时刻,所述违规指示信息注释时刻为注释者对所述目标客服进行违规指示信息注释处理的处理时刻;
当确定所述目标客服的客服服务质检结果为违规服务客服时,确定得到所述目标客服的客服服务质检结果的违规识别时刻;
确定所述违规指示信息注释时刻与所述违规识别时刻的时差;
通过所述时差得到客服服务停止约束值,所述客服服务停止约束值为在基于所述违规项质检网络识别出客服为违规服务客服时,对违规服务客服的对话文本进行停止的约束时间长度;
所述获取各个所述目标客服各自对应的对话文本表征向量集合,包括:
针对每一所述目标客服,获取所述目标客服对应的对话文本;
确定所述对话文本对应的质检要素;
对所述对话文本进行词嵌入,得到初始对话文本表征向量集合;
对所述初始对话文本表征向量集合中属于相同质检要素的对话文本表征向量进行归集,得到所述目标客服对应的对话文本表征向量集合。
第二方面,本申请提供了一种质检设备,包括:存储器;处理器;所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本申请至少包括的有益效果:本申请提供的基于文本分析的智能客服服务质检方法及相关设备,通过获取目标客服名单,并获取目标客服名单中各个目标客服各自对应的对话文本表征向量集合,通过违规项质检网络对对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况进行解析,通过各个违规项质检网络的散布情况确定目标客服对应的质检信息。上述以质检要素为不同的维度对对话文本表征向量的散布情况进行解析,结合每个质检要素的散布情况得到目标客服对应的质检信息,所以可以联合目标客服各个质检要素的对话文本表征向量来对目标客服进行违规识别,提高了网络得到的质检信息准确性,此外违规项质检网络使用的违规项质检机制不同,归集不同违规项质检网络对应的质检信息,得到目标客服的客服服务质检结果,可以通过多种散布情况确定目标客服的客服服务质检结果,进一步提高目标客服违规识别的准确性。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1是本申请实施例提供的基于文本分析的智能客服服务质检方法的应用场景示意图。
图2是本申请实施例提供的一种基于文本分析的智能客服服务质检方法的流程图。
图3是本申请实施例提供的质检装置的功能模块架构示意图。
图4是本申请实施例提供的一种质检设备的组成示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”、“作为一种实施方式/方案”、“在一种实施方式中”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”、“作为一种实施方式/方案”、“在一种实施方式中”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”等类似术语,仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
本申请实施例提供的基于文本分析的智能客服服务质检方法可以由质检设备执行,其中质检设备可以是笔记本电脑,平板电脑,台式计算机,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的终端,也可以实施为服务器。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
图1是本申请实施例提供的基于文本分析的智能客服服务质检方法的应用场景示意图。质检设备300可以和产生客服对话的客服人员的终端设备100通过网络200通信连接,质检设备300用于执行本申请实施例提供的方法。具体地,本申请实施例提供了一种基于文本分析的智能客服服务质检方法,如图2所示,该方法包括:
步骤110,获取拟进行违规识别的目标客服名单,目标客服名单包括多个目标客服。
本申请实施例中,目标客服为需要进行违规识别的客服,例如互联网平台的后台服务客服中心,如金融领域中的金融产品人工咨询的客服工号。用户可以通过智能手机、平板电脑、笔记本电脑等智能终端建立与目标客服之间的沟通,沟通过程中即产生客服对话。客服对话可以是文本对话或语音对话,对于语音对话,可以接着通用技术将语音转换为文本。
步骤120,获取各个目标客服各自对应的对话文本表征向量集合,对话文本表征向量集合包括多个质检要素各自对应的对话文本表征向量。
具体的,可以针对各个目标客服中的每一目标客服,获取目标客服对应的对话文本;然后,确定对话文本对应的质检要素,质检要素表示进行分析的维度,例如文本自身要素和文本附加要素,文本自身要素例如是称谓合规性要素、违规词要素、回复内容关联性要素等,文本附加要素例如是文本回复响应时间、文本回复率等;之后,对对话文本进行词嵌入,得到初始对话文本表征向量集合,具体地,可以先对客服文本进行分词,针对得到的分词进行诸如独热模型(One Hot Model)、词袋模型(Bag of Words Model)、词频-逆文档频率(TF-IDF)、N元模型(N-Gram)、单词-向量模型(Word2vec)、文档-向量模型(Doc2vec)等方式进行文本向量化,得到初始对话文本表征向量集合,初始对话文本表征向量集合中包含多个向量,一个向量代表一个特征信息;最后,对初始对话文本表征向量集合中属于相同质检要素的对话文本表征向量进行归集,得到目标客服对应的对话文本表征向量集合,可以理解,对于文本附加要素而言,其本身是连续数据,可以不进行向量化,直接和词嵌入后的初始对话文本表征向量集合进行合并。
对话文本表征向量集合中包含多个对话文本表征向量,每一个对话文本表征向量可以与一个质检要素对应,例如对于违规词检测要素,将违规词涉及的词性与对话文本分词后的各个分词进行词性对应,筛选出词性一致的分词,将各个分词的词嵌入组合得到对应的表征向量,表征向量中的每一个元素对应一个分词。基于相同的思路,得到多个对话文本表征向量,构成对话文本表征向量集合。
步骤130,确定违规项质检网络集合,违规项质检网络集合包括多个违规项质检网络;违规项质检网络集合中的违规项质检网络使用的违规项质检机制不同。
本申请实施例中,违规项质检网络是可以依据质检要素的违规项质检机制完成违规目标客服识别的神经网络。例如,违规项质检网络可以为Transformer。
违规项质检机制为进行违规识别使用的策略,违规项质检机制可以为对对话文本表征向量进行特征聚类对应的方式,各个违规项质检网络对应的违规项质检机制不同。
可选地,各个违规项质检网络部署在计算机、虚拟机或服务器等相关设备中,相关设备分别调取各个违规项质检网络对对话文本表征向量集合中的对话文本表征向量进行划类,得到对应的散布情况。
步骤140,依据各个违规项质检网络确定目标客服对应的对话文本表征向量集合中,各个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况。
散布情况为各个对话文本表征向量在对应的目标表征向量集合中的分布结果,散布情况可以依据分类标记进行表示,比如违规、合规,或者,可以依据各分类的置信度进行表示,比如0.6、0.9等。目标表征向量集合为一个质检要素下的全部或局部对话文本表征向量组成的表征向量集合。目标表征向量集合中的对话文本表征向量可以对应制定的散布状态,通过散布状态对对话文本表征向量进行划类,得到散布情况。散布状态可以采用层级图(父子关系)、鱼骨图、树状图等进行表示。不同的违规项质检网络可以基于不同的策略对对话文本表征向量进行聚类,确定各个对话文本表征向量在所在目标表征向量集合中的散布情况。
可选地,违规项质检网络可以确定一质检要素对应的目标表征向量集合,依据对应的违规项质检机制对质检要素对应的目标表征向量集合的散布情况进行解析并进行分类,获得和质检要素对应的散布情况,接着,将各质检要素下的散布情况进行合并,获得每个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况。
步骤150,通过违规项质检网络输出的散布情况确定违规项质检网络对目标客服的质检信息。
本申请实施例中,质检信息为违规项质检网络对目标客服对应的分类的识别结果,可以依据对应分类的标签来指示违规项质检网络对目标客服的质检信息。质检信息中还可以包含各个违规项质检网络的网络标签,方便相关设备确定各个质检信息是哪个违规项质检网络输出的。各违规项质检网络的散布情况指示各个违规项质检网络对各个对话文本表征向量的分类结果,基于此,可以对散布情况进行解析,确定各违规项质检网络对目标客服的质检信息。可选地,可以将依据分类标签、置信度等方式进行表示的散布情况(散布结果)进行数值转化,将转换后的数值作定为质检信息。比如将置信度和置信度临界值进行对比,如果超过置信度临界值,将质检信息确定成1,如果小于置信度临界值,将质检信息确定成0。
可选地,步骤150可以是相关设备确定违规项质检网络所确定的对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况,对各个质检要素对应的散布情况进行信息归集,得到目标客服在对应违规项质检网络下的散布情况;对目标客服在对应违规项质检网络下的散布情况进行数值转换得到的数值,作为违规项质检网络对目标客服的质检信息。
步骤160,对违规项质检网络集合中各个违规项质检网络对目标客服的质检信息进行信息归集,得到目标客服的客服服务质检结果。
客服服务质检结果可以是表示目标客服是否为违规目标客服,对质检信息进行信息归集可以是对质检信息的个数等进行统计计算(如聚合、提升、堆积),将统计计算的值确定为客服服务质检结果。可以在质检信息的个数符合个数要求时将目标客服的客服服务质检结果确定为违规目标客服。个数要求例如是大于预设的个数临界值(根据实际需要设定)。通过各个违规项质检网络对应的质检信息得到客服服务质检结果的过程是对各违规项质检网络的Ensemble learning(集成学习),当违规项质检网络为弱分类器时,弱分类器学习获得的违规项质检网络集合为强分类器。
本申请实施例提供的基于文本分析的智能客服服务质检方法,因为以质检要素为不同的维度对对话文本表征向量的散布情况进行解析,结合每个质检要素的散布情况得到目标客服对应的质检信息,所以可以联合目标客服各个质检要素的对话文本表征向量来对目标客服进行违规识别,令网络得到的质检信息准确性高,而且违规项质检网络使用的违规项质检机制不同,联合统计违规项质检网络对应的质检信息,得到目标客服的客服服务质检结果,可以通过多种散布情况来确定目标客服的客服服务质检结果,可增加目标客服识别的准确性。并且,依据违规项质检网络对对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况进行解析,在没有样例标记的情况下,各违规项质检网络也能获取散布情况,不仅可以确保获得的客服服务质检结果准确,同时不需要获取样例标记,提高目标客服违规检测的速度,便于及时干预,提高用户体验。
可选地,依据各个违规项质检网络,确定目标客服对应的对话文本表征向量集合中,各个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况,包括:在目标客服对应的对话文本表征向量集合中获取质检要素对应的对话文本表征向量,获得每个质检要素各自对应的目标表征向量集合;获取违规项质检网络中目标表征向量集合对应的散布分类机制;通过散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
散布分类机制是将目标表征向量集合中的对话文本表征向量归类到对应的特征范围的机制。例如,散布分类机制可以是通过临界值进行划类的机制,也可以是通过散布范围进行划类的机制。
其中,通过临界值进行划类的机制具体为:将对话文本表征向量与表征向量分类临界值进行对比,当对话文本表征向量小于表征向量分类临界值时,将对话文本表征向量归类到一个表征向量范围1中,当对话文本表征向量不小于表征向量分类临界值时,将对话文本表征向量归类到另一个表征向量范围2中。通过散布范围进行划类的机制具体为:确定多个表征向量分类范围,每个表征向量分类范围对应有对话文本表征向量对应的向量元素值范围,将对话文本表征向量的向量元素值与向量元素值范围进行对比,将对话文本表征向量划分到向量元素值的表征向量分类范围。其中,对话文本表征向量的向量元素值可以为对话文本表征向量中的各个元素的值。
可选地,从目标客服对应的对话文本表征向量集合中选择各个质检要素对应的对话文本表征向量,一个质检要素下的对话文本表征向量构成一个目标表征向量集合,通过散布分类机制对目标表征向量集合中的对话文本表征向量进行划类,以将各个对话文本表征向量归类到对应的表征向量范围中,一个表征向量范围可以对应一个散布情况,以得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。可选地,散布分类机制可以通过各个违规项质检网络的违规项质检机制确定。依据各个违规项质检网络确定目标客服对应的对话文本表征向量集合中,每一对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况,具体包括:在目标客服对应的对话文本表征向量集合中获取质检要素对应的对话文本表征向量,获得每个质检要素各自对应的目标表征向量集合;通过各个违规项质检网络对应的违规项质检机制确定违规项质检网络中目标表征向量集合对应的散布分类机制,通过散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。基于此,将对话文本表征向量在质检要素对应的目标表征向量集合中进行划类,可以确定各质检要素下的散布情况,哪怕没有对话文本表征向量之间的空间相似性,也可以精确确定对话文本表征向量对应的散布情况,能大大增加目标客服质检效率。
可选地,目标表征向量集合对应的散布分类机制包括通过临界值进行划类的机制,获取违规项质检网络中目标表征向量集合对应的散布分类机制;通过散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:获取表征向量散布层级图,表征向量散布层级图包括多个分支层级(可以理解为按照父级子级组成的树图,如随机树,各个对话文本表征向量作为表征向量散布层级图中的层级,表征向量散布层级图可以作为违规项质检网络);将表征向量散布层级图的起始层级确定为目标客服对应的当下分支层级,获取当下分支层级对应的当下质检要素,获取当下质检要素对应的当下目标表征向量集合的当下表征向量分类临界值;通过当下表征向量分类临界值和目标客服在当下质检要素的对话文本表征向量,确定对话文本表征向量在当下目标表征向量集合中的散布情况;通过散布情况确定目标客服对应的下一分支层级,将下一层级作为迭代后的当下分支层级,跳转到获取当下分支层级对应的当下质检要素,获取当下质检要素对应的当下目标表征向量集合的当下表征向量分类临界值的步骤进行循环,直到目标客服对应的分支层级迭代结束。
表征向量散布层级图的个数为一个或多个,如果表征向量散布层级图的个数为多个,将全部或者局部表征向量散布层级图共同作为违规项质检网络,违规项质检网络中的表征向量散布层级图可以同时对对话文本表征向量进行划类,以将目标客服对应的对话文本表征向量归类到对应的分支层级。可以将某一目标客服对应的对话文本表征向量集合分别加载至各个表征向量散布层级图,各个表征向量散布层级图输出目标客服的散布情况,对各个表征向量散布层级图的散布情况进行合并,得到表征向量散布层级图对应的整体散布情况,确定为对应违规项质检网络的散布情况。同理,将其他目标客服对应的对话文本表征向量集合分别输入到各个表征向量散布层级图中,得到对应的散布情况。
当下表征向量分类临界值可以进行事先部署,或者通过目标客服在当下质检要素下的对话文本表征向量的向量元素值确定,比如将目标客服在当下质检要素下的对话文本表征向量的向量元素值的均值结果确定为当下表征向量分类临界值,当然,在其他实施方式中,还可以是获取中值、方差等统计计算结果作为当下表征向量分类临界值,根据实际情况进行适应性选择。
分支层级迭代结束的判断层级可以是对话文本表征向量对应的分支层级为最下位分支层级,后面没有层级了。将对话文本表征向量所在的最下位分支层级对应的散布情况确定为对话文本表征向量所在质检要素的目标表征向量集合中的散布情况。可选地,通过当下表征向量分类临界值和目标客服在当下质检要素的对话文本表征向量,确定对话文本表征向量在当下目标表征向量集合中的散布情况,具体包括:将目标客服在当下质检要素的对话文本表征向量与当下表征向量分类临界值进行对比;当目标客服在当下质检要素的对话文本表征向量小于当下表征向量分类临界值时,将目标客服在当下质检要素的对话文本表征向量划分到第一层级;当目标客服在当下质检要素的对话文本表征向量不小于当下表征向量分类临界值时,将目标客服在当下质检要素的对话文本表征向量划分到第二层级。
基于此,通过渐渐获取当下分支层级对应的当下质检要素,再通过当下表征向量分类临界值对目标客服在当下质检要素的对话文本表征向量进行划类,每完成一次对话文本表征向量的划分,即实现一个层级分类,每一层级的质检要素间彼此是相关且递进的,则可获得精准的散布情况,获得的目标客服质检结果准确。
可选地,通过违规项质检网络输出的散布情况确定违规项质检网络对目标客服的质检信息,包括:通过散布情况确定目标客服对应的分支层级;对目标客服对应的分支层级的个数进行信息归集,得到目标客服在表征向量散布层级图中的扩散范围;通过扩散范围确定目标客服对应的第一违规识别结果,违规识别结果与扩散范围呈反向关联;通过第一违规识别结果确定违规项质检网络对目标客服的质检信息。其中,目标客服对应的分支层级可以为目标客服的对话文本表征向量从上位层级到最下位分支层级之间的各个层级,将以上分支层级的个数确定为目标客服在表征向量散布层级图中的扩散范围,也就是延伸的“长度”,为一个数值。第一违规识别结果为可以评估目标客服是否是违规服务客服的识别值。
可选地,通过扩散范围确定目标客服对应的第一违规识别结果时,可以包括:如果表征向量散布层级图为一个,确定表征向量散布层级图确定的目标客服对应的扩散范围,以扩散范围为指数,建立预设常数的指数函数,将目标客服对应的扩散范围输入指数函数,得到第一违规识别结果。如果表征向量散布层级图为多个,通过扩散范围确定目标客服对应的扩散范围的均值(期望),以扩散范围的均值为指数建立预设常数的指数函数,将目标客服对应的扩散范围的均值输入指数函数得到第一违规识别结果。
通过目标客服对应的分支层级在表征向量散布层级图中的扩散范围得到对应的违规识别结果,扩散范围越小,目标客服对应的对话文本表征向量例正常点越远,违规识别结果就越大。为了确保违规识别结果与扩散范围呈反向关联,指数函数的指数值为负值。可选地,通过第一违规识别结果确定违规项质检网络对目标客服的质检信息,具体包括:将第一违规识别结果与第一违规识别结果临界值进行对比,当第一违规识别结果大于第一违规识别结果临界值时,将目标客服的质检信息确定为违规服务客服。其中,第一违规识别结果临界值可以是事先确定的值,也可以是通过目标表征向量集合中的对话文本表征向量的向量元素值计算的值。
作为一种实施方式,通过扩散范围确定目标客服对应的第一违规识别结果的方式例如为通过x个样本建立表征向量散布层级图,确定表征向量散布层级图的平均扩散范围的公式为:
L(x)=R(x-1)-((x-1)/x)
针对目标客服的对话文本表征向量i,确定目标客服对应的第一违规识别结果的公式可以为:
V(i,x)=-2E(R(i))/L(x)
E(R(i))为i在一表征向量散布层级图中的扩散范围的均值,R(x-1)为调节参数。
可选地,表征向量散布层级图在生成时,可以是通过多个学习样例生成多个表征向量散布层级图。其中,学习样例可以不携带指示标记,以通过无监督学习进行表征向量散布层级图的生成。表征向量散布层级图的生成过程包括:
设具有i个学习样例,i个学习样例是m个维数的对话文本表征向量,任意选取一个对话文本表征向量v1和对应的切分值c,对i个学习样例进行切分,也就是通过切分值c将当下分支层级对应的学习样例切分为多个层级,一直到层级图的“长度”达到约束值,或者层级仅有一个学习样例,抑或层级上的学习样例的全部表征向量都一致。
可选地,散布分类机制包括通过散布范围进行划类的机制,那么获取违规项质检网络中目标表征向量集合对应的散布分类机制;通过散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,具体包括:获取违规项质检网络中目标表征向量集合对应的表征向量分类范围集合,表征向量分类范围集合包括多个表征向量分类范围;获取目标表征向量集合中的对话文本表征向量在各个表征向量分类范围的表征向量个数;通过表征向量个数确定表征向量分类范围对应的散布集中度,将散布集中度作为对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
每个表征向量分类范围对应有对话文本表征向量的向量元素值范围,每个表征向量分类范围的向量元素值范围值可以相同或不同,上述的散布集中度例如是概率密度。可选地,分别确定各质检要素对应的目标表征向量集合,通过目标表征向量集合中的对话文本表征向量确定表征向量分类范围对应的散布集中度,分别获得每个散布情况,在获得每个质检要素对应的散布情况后,对散布情况进行信息归集,通过信息归集结果得到目标客服的对话文本表征向量的整体散布情况。
以上过程通过多个表征向量分类范围对目标表征向量集合中的对话文本表征向量进行划类,通过对话文本表征向量在各个表征向量分类范围的表征向量个数确定对应的散布集中度,从而得到散布情况,在没有标记信息的情况也可以通过散布集中度对目标客服的对话文本表征向量进行准确归类,得到准确的散布情况。
可选地,通过违规项质检网络输出的散布情况确定违规项质检网络对目标客服的质检信息,包括:通过散布集中度确定对话文本表征向量对应的向量违规识别结果,向量违规识别结果与散布集中度呈反向关联;对目标客服对应的对话文本表征向量集合中各个对话文本表征向量对应的向量违规识别结果进行信息归集,得到目标客服对应的第二违规识别结果;通过第二违规识别结果确定违规项质检网络对目标客服的质检信息。
其中,向量违规识别结果为可以判断目标客服是否为违规服务客服的识别数值。向量违规识别结果可以是对散布集中度确定对话文本表征向量对应的向量违规识别结果进行统计计算(如倒数计算)得到的。其中,第二违规识别结果为可以判断目标客服是否为违规服务客服的识别数值。
确定目标客服对应的对话文本表征向量集合中各个对话文本表征向量对应的向量违规识别结果后,再确定各个质检要素对应的向量违规识别结果,对各个质检要素下的向量违规识别结果进行信息归集,得到目标客服对应的第二违规识别结果。
示例性的,对于目标客服对应的对话文本表征向量集合Q,向量违规识别结果可以是概率密度ρ。质检要素为n时,确定目标客服对应的第二违规识别结果的过程可以依据以下公式实现:
可选地,通过第二违规识别结果确定违规项质检网络对目标客服的质检信息,包括:将第二违规识别结果与第二违规识别结果临界值进行对比,当第二违规识别结果大于第二违规识别结果临界值时,将目标客服的质检信息确定为违规服务客服。其中,第二违规识别结果临界值可以是事先部署的值,或者是通过目标表征向量集合中的对话文本表征向量的向量元素值计算的值。
可选地,获取违规项质检网络中目标表征向量集合对应的散布分类机制;通过散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,具体包括:确定边界分类临界值;通过边界分类临界值确定目标表征向量集合中表征向量末端对应的末端表征向量集合以及表征向量首端对应的首端表征向量集合;对末端表征向量集合进行信息归集,得到表征向量集合对应的末端表征向量归集值;通过表征向量集合对应的末端表征向量归集值确定对话文本表征向量对应末端散布概率;对首端表征向量集合进行信息归集,得到表征向量集合对应的首端表征向量归集值;通过表征向量集合对应的首端表征向量归集值确定对话文本表征向量对应首端散布概率;通过末端散布概率以及首端散布概率确定对话文本表征向量对应的目标散布概率,将目标散布概率确定为对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
其中,边界分类临界值是将位于目标表征向量集合的边界的对话文本表征向量分割出来的临界值。例如包括首端分割临界值和末端分割临界值,边界分类临界值可以是事先部署的值,或者是通过目标表征向量集合中的对话文本表征向量的向量元素值计算的值。
可选地,将目标表征向量集合中,小于首端分割临界值的对话文本表征向量作为首端表征向量集合,将目标表征向量集合中不小于末端分割临界值的对话文本表征向量作为末端表征向量集合。可选地,末端表征向量归集值可以是对末端表征向量集合中的对话文本表征向量的向量元素值进行均值结果运算,将均值结果运算的值确定为末端表征向量归集值。首端表征向量归集值可以是对首端表征向量集合中的对话文本表征向量的向量元素值进行均值结果运算,将均值结果运算的值确定为末端表征向量归集值。另外,在确定末端表征向量归集值和首端表征向量归集值时,可对末端表征向量集合和首端表征向量集合中的对话文本表征向量的向量元素值进行另外的计算。末端散布概率是一对话文本表征向量散布到末端表征向量集合的概率,首端散布概率为一对话文本表征向量散布到首端表征向量集合的概率。
可选地,通过末端散布概率和首端散布概率确定对话文本表征向量对应的目标散布概率,包括:对末端散布概率和首端散布概率进行均值计算,将均值结果作为目标散布概率。
可选地,通过末端散布概率以及首端散布概率确定对话文本表征向量对应的目标散布概率,将目标散布概率确定为对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:获取对话文本表征向量集合中各个对话文本表征向量的均值结果,通过对话文本表征向量集合对应的均值结果确定目标客服对应的偏态系数;获取对照偏态系数,确定偏态系数与对照偏态系数的差值;通过偏态系数与对照偏态系数的差值,从末端散布概率和首端散布概率中确定偏态散布概率;将末端散布概率、首端散布概率和偏态散布概率进行差值计算,通过差值计算结果在末端散布概率、首端散布概率和偏态散布概率中确定对话文本表征向量对应的目标散布概率;将目标散布概率确定为对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。其中,对照偏态系数用于对偏态系数进行对照,具体的值根据实际需要进行设定。获取目标客服的一对话文本表征向量对应的偏态系数的过程可以采用通用的偏态系数公式进行,此处不做赘述。
可选地,确定末端散布概率、首端散布概率和偏态散布概率的方式例如是,针对对话文本表征向量集合中的一对话文本表征向量vn,首端表征向量归集值为g(vn),末端表征向量归集值为h(vn)。依据以下公式确定连接识别数值:
Xk,n=gk(vn);Yk,n=hk(vn)
Zk,n=Xk,n,if ρ<0;
Zk,n=Yk,n,if ρ≥0
上述ρ为第k个质检要素的偏态系数;针对Zk,n而言,如果偏态系数小于0,代表目标表征向量集合的散布情况集中在首端,那么将首端表征向量归集值确定为Zk,n;如果偏态系数不小于0,代表目标表征向量集合的散布情况集中在尾端,那么将末端表征向量归集值确定为Yk,n。
通过连接识别数值,确定首端散布概率ps为
末端散布概率pe为
偏态散布概率pρ为
可选地,通过差值计算结果在末端散布概率、首端散布概率和偏态散布概率中确定对话文本表征向量对应的目标散布概率可以是将末端散布概率、首端散布概率和偏态散布概率中最大的值作为对话文本表征向量对应的目标散布概率。
本申请实施例通过各个质检要素的偏态系数与对照偏态系数的差值来确定对应的散布概率,可通过目标表征向量集合的中心集中结果确定得到准确的散布概率,以便得到准确的散布情况。
可选地,对违规项质检网络集合中各个违规项质检网络对目标客服的质检信息进行信息归集,得到目标客服的客服服务质检结果,具体包括:通过对目标客服的质检信息确定质检信息为违规的违规信息数目;当违规信息数目大于违规数目临界值时,确定目标客服为违规服务客服,得到目标客服的客服服务质检结果。其中,违规数目临界值的数值根据实际需要进行设置。可选地,当违规信息数目大于违规数目临界值时,判定大于违规数目临界值的违规项质检网络将目标客服识别为违规目标客服,此时,确定目标客服为违规服务客服。可选地,如果目标客服的个数为多个,在违规信息数目大于违规数目临界值时,将全部的目标客服均确定为违规服务客服,或者将违规信息数目大于违规数目临界值对应的目标客服确定为违规服务客服。
当确定大于违规数目临界值的质检信息为违规时,将目标客服确定为违规服务客服,将多个违规项质检网络的结果合并,得到客服服务质检结果,比依据一个违规项质检网络得到客服服务质检结果来说,更加可靠。
可选地,质检信息可以依据目标客服为违规目标客服的置信水平进行表示,对违规项质检网络集合中各个违规项质检网络对目标客服的质检信息进行信息归集,得到目标客服的客服服务质检结果,可以包括:通过各个违规项质检网络对目标客服的质检信息,确定各个违规项质检网络对目标客服为违规目标客服的网络置信度;分别获取各个违规项质检网络的网络置信度相对置信度临界值的对比结果,通过对比结果将各个违规项质检网络的网络置信度转化为目标客服为违规目标客服的分值;对各个违规项质检网络对应的分值进行信息归集(比如归集数量,判断数量和阈值的大小,大于分支阈值就判断为违规),得到目标客服的客服服务质检结果。
可选地,对违规项质检网络集合中各个违规项质检网络对目标客服的质检信息进行信息归集,得到目标客服的客服服务质检结果后,方法还可以包括:在标记存储集合(标记存储集合为包含清单中各目标客服是否为违规目标客服的标记)中获取目标客服对应的违规标记;将目标客服的客服服务质检结果与目标客服对应的违规标记进行对比,通过对比结果确定违规项质检网络集合对应的识别准确信息;识别准确信息中包含客服服务质检结果为违规且违规标记为合规的候选目标客服;依据目标客服分类网络通过候选目标客服对应的对话文本表征向量集合确定候选目标客服的目标客服分类结果;通过候选目标客服的目标客服分类结果确定违规项质检网络集合相对于标记存储集合的识别准确率。识别准确率可以反映违规项质检网络集合对于标记存储集合的精度,识别准确率的计算方式可以是:确定被违规项质检网络集合精确识别,但是标记存储集合没有精确识别的目标客服的个数,计算两个数值的比例,得到识别准确率。
可选地,对违规项质检网络集合中各个违规项质检网络对目标客服的质检信息进行信息归集,得到目标客服的客服服务质检结果之后,方法还包括:确定目标客服的客服服务质检结果的第一时刻;获取标记存储集合中与客服服务质检结果匹配的目标违规标记;标记存储集合中包含的违规标记为通过对目标客服的对话文本表征向量集合的响应而构成的目标客服标记;确定目标违规标记加入标记存储集合的第二时刻;如果第一时刻小于第二时刻,通过第一时刻和第二时刻的时间差确定违规项质检网络集合对于标记存储集合的提前系数。可确定第一时刻比第二时刻提前的数量,计算该数量和目标客服的总目标客服数量的比例,作为提前系数。如果第一时刻小于第二时刻,可以认定违规项质检网络集合先于标记存储集合将对应的违规目标客服进行识别。
可选地,基于文本分析的智能客服服务质检方法还包括:获取目标客服的违规指示信息注释时刻,违规指示信息注释时刻为注释者对目标客服进行违规指示信息注释处理的处理时刻;当确定目标客服的客服服务质检结果为违规服务客服时,确定得到目标客服的客服服务质检结果的违规识别时刻;确定违规指示信息注释时刻与违规识别时刻的时差;通过时差得到客服服务停止约束值,客服服务停止约束值为在基于违规项质检网络识别出客服为违规服务客服时,对违规服务客服的对话文本进行停止的约束时间长度。其中,注释者是为每个目标客服添加违规标记的管理者,客服服务停止约束值为对违规服务客服进行对话文本关停的约束时长。可选地,通过时差得到客服服务停止约束值时,可以获取时刻系数(按照实际需要进行设定),将时差与时刻系数作积,将该作积的结果确定为客服服务停止约束值。
可选地,确定违规指示信息注释时刻与违规识别时刻的时差;通过时差得到客服服务停止约束值为:如果违规识别时刻先于违规指示信息注释时刻,则确定违规指示信息注释时刻与违规识别时刻的时差;通过时差得到客服服务停止约束值。依据上述实施例,可以在违规项质检网络集合先于标记存储集合将对应的违规服务客服进行识别时,约束违规服务客服的对话,防止通过标记存储集合进行管理引起的滞后,及时进行服务干预。
可选地,确定违规项质检网络集合的过程可以包括:获取用以生成违规项质检网络的网络内部变量集,网络内部变量集包括多个网络内部变量,如权重、学习率、超参等,获取网络内部变量集中各个网络内部变量对应的变量取值范围,通过网络内部变量集中各个网络内部变量对应的变量取值范围得到候选变量分组,通览候选变量分组,通过选取的变量分组对违规项质检网络进行准确性判断,得到第一判断结果,通过第一判断结果在候选变量分组中确定目标变量分组,通过目标变量分组对违规项质检网络进行网络内部变量优化,通过优化后的违规项质检网络得到违规项质检网络集合。
其中,可选地,获取网络内部变量集中各个网络内部变量对应的变量取值范围,包括:获取网络内部变量集中各个网络内部变量各自对应的多个起始变量,得到多个初始变量分组;通过多个初始变量分组对违规项质检网络进行准确性判断,得到第二判断结果;通过第二判断结果确定网络内部变量集中各个网络内部变量对应的变量取值范围。可选地,通过所选取的变量分组对违规项质检网络进行准确性判断,得到第一判断结果,包括:依据违规项质检网络通过所选取的变量分组对样本目标客服的客服服务质检结果;从标记存储集合中获取样本目标客服的违规标记;通过样本目标客服的客服服务质检结果与样本目标客服的违规标记的匹配性,确定违规项质检网络对应的准确性判断结果,得到第一判断结果。
以上实施方式,通过确定变量取值范围,再通过变量取值范围通览各个变量分组,可以用获得准确的网络内部变量,确保违规项质检网络的精度。
基于上述实施例,本申请实施例提供一种质检装置,图3是本申请实施例提供的一种质检装置340,如图3所示,所述装置340包括:
客服名单获取模块341,用于获取拟进行违规识别的目标客服名单,所述目标客服名单包括多个目标客服;
表征向量获取模块342,用于获取各个所述目标客服各自对应的对话文本表征向量集合,所述对话文本表征向量集合包括多个质检要素各自对应的对话文本表征向量;
质检网络调取模块343,用于确定违规项质检网络集合,所述违规项质检网络集合包括多个违规项质检网络;所述违规项质检网络集合中的违规项质检网络使用的违规项质检机制不同;
向量散布确定模块344,用于依据各个所述违规项质检网络,确定所述目标客服对应的对话文本表征向量集合中,各个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况;
质检信息确定模块345,用于通过所述违规项质检网络输出的所述散布情况确定所述违规项质检网络对所述目标客服的质检信息;
质检结果归集模块346,用于对所述违规项质检网络集合中各个违规项质检网络对所述目标客服的质检信息进行信息归集,得到所述目标客服的客服服务质检结果。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
若本申请技术方案涉及个人或私密信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求,同时在法律法规的范围内收集。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式、处理的个人信息种类等信息。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台质检设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
本申请实施例提供一种质检设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法。所述计算机可读存储介质可以是瞬时性的,也可以是非瞬时性的。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序被计算机读取并执行时,实现上述方法中的部分或全部步骤。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software DevelopmentKit,SDK)等等。
需要说明的是,图4是本申请实施例提供的一种质检设备的硬件实体示意图,如图4所示,该质检设备300的硬件实体包括:处理器310、通信接口320和存储器330,其中:处理器310通常控制质检设备300的总体操作。通信接口320可以使质检设备通过网络与其他终端或服务器通信。存储器330配置为存储由处理器310可执行的指令和应用,还可以缓存待处理器310以及质检设备300中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(RandomAccess Memory,RAM)实现。处理器310、通信接口320和存储器330之间可以通过总线340进行数据传输。这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台质检设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (6)

1.一种基于文本分析的智能客服服务质检方法,其特征在于,应用于质检设备,所述方法包括:
获取拟进行违规识别的目标客服名单,所述目标客服名单包括多个目标客服;
获取各个所述目标客服各自对应的对话文本表征向量集合,所述对话文本表征向量集合包括多个质检要素各自对应的对话文本表征向量;
确定违规项质检网络集合,所述违规项质检网络集合包括多个违规项质检网络;所述违规项质检网络集合中的违规项质检网络使用的违规项质检机制不同;
依据各个所述违规项质检网络,确定所述目标客服对应的对话文本表征向量集合中,各个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况;
通过所述违规项质检网络输出的所述散布情况确定所述违规项质检网络对所述目标客服的质检信息;
对所述违规项质检网络集合中各个违规项质检网络对所述目标客服的质检信息进行信息归集,得到所述目标客服的客服服务质检结果;
其中,所述依据各个所述违规项质检网络,确定所述目标客服对应的对话文本表征向量集合中,各个对话文本表征向量在所在质检要素对应的目标表征向量集合中的散布情况,包括:
在所述目标客服对应的对话文本表征向量集合中获取质检要素对应的对话文本表征向量,获得每个质检要素各自对应的目标表征向量集合;
获取违规项质检网络中所述目标表征向量集合对应的散布分类机制;
通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况;
其中,所述目标表征向量集合对应的散布分类机制包括通过临界值进行划类的机制,所述获取违规项质检网络中所述目标表征向量集合对应的散布分类机制,通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:获取表征向量散布层级图,所述表征向量散布层级图包括多个分支层级;将表征向量散布层级图的起始层级确定为所述目标客服对应的当下分支层级,获取当下分支层级对应的当下质检要素,获取所述当下质检要素对应的当下目标表征向量集合的当下表征向量分类临界值;通过当下表征向量分类临界值和所述目标客服在所述当下质检要素的对话文本表征向量,确定所述对话文本表征向量在当下目标表征向量集合中的散布情况;通过所述散布情况确定所述目标客服对应的下一分支层级,将下一层级作为迭代后的当下分支层级,跳转到获取当下分支层级对应的当下质检要素,获取所述当下质检要素对应的当下目标表征向量集合的当下表征向量分类临界值的步骤进行循环,直到所述目标客服对应的分支层级迭代结束;
或者,所述散布分类机制包括通过散布范围进行划类的机制,所述获取违规项质检网络中所述目标表征向量集合对应的散布分类机制;通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:获取违规项质检网络中所述目标表征向量集合对应的表征向量分类范围集合,所述表征向量分类范围集合包括多个表征向量分类范围;获取所述目标表征向量集合中的对话文本表征向量在各个表征向量分类范围的表征向量个数;通过所述表征向量个数确定所述表征向量分类范围对应的散布集中度,将所述散布集中度作为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况;
或者,所述获取违规项质检网络中所述目标表征向量集合对应的散布分类机制;通过所述散布分类机制对对话文本表征向量在所在质检要素的目标表征向量集合中进行划类,得到对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:确定边界分类临界值;通过所述边界分类临界值确定所述目标表征向量集合中表征向量末端对应的末端表征向量集合以及表征向量首端对应的首端表征向量集合;对所述末端表征向量集合进行信息归集,得到所述表征向量集合对应的末端表征向量归集值;通过所述表征向量集合对应的末端表征向量归集值确定所述对话文本表征向量对应末端散布概率;对所述首端表征向量集合进行信息归集,得到所述表征向量集合对应的首端表征向量归集值;通过所述表征向量集合对应的首端表征向量归集值确定所述对话文本表征向量对应首端散布概率;通过所述末端散布概率以及所述首端散布概率确定所述对话文本表征向量对应的目标散布概率,将所述目标散布概率确定为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
2.根据权利要求1所述的方法,其特征在于,当所述目标表征向量集合对应的散布分类机制包括通过临界值进行划类的机制时,所述通过所述违规项质检网络输出的所述散布情况确定所述违规项质检网络对所述目标客服的质检信息,包括:
通过所述散布情况确定所述目标客服对应的分支层级;
对所述目标客服对应的分支层级的个数进行信息归集,得到所述目标客服在所述表征向量散布层级图中的扩散范围;
通过所述扩散范围确定所述目标客服对应的第一违规识别结果,所述违规识别结果与所述扩散范围呈反向关联;
通过所述第一违规识别结果确定所述违规项质检网络对所述目标客服的质检信息。
3.根据权利要求1所述的方法,其特征在于,当所述散布分类机制包括通过散布范围进行划类的机制时,所述通过所述违规项质检网络输出的所述散布情况确定所述违规项质检网络对所述目标客服的质检信息,包括:
通过所述散布集中度确定所述对话文本表征向量对应的向量违规识别结果,所述向量违规识别结果与所述散布集中度呈反向关联;
对所述目标客服对应的对话文本表征向量集合中各个对话文本表征向量对应的向量违规识别结果进行信息归集,得到所述目标客服对应的第二违规识别结果;
通过所述第二违规识别结果确定所述违规项质检网络对所述目标客服的质检信息。
4.根据权利要求1所述的方法,其特征在于,当所述散布分类机制包括通过边界分类临界值进行划类的机制时,所述通过所述末端散布概率以及所述首端散布概率确定所述对话文本表征向量对应的目标散布概率,将所述目标散布概率确定为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况,包括:
获取对话文本表征向量集合中各个对话文本表征向量的均值结果,通过所述对话文本表征向量集合对应的均值结果确定所述目标客服对应的偏态系数;
获取对照偏态系数,确定所述偏态系数与所述对照偏态系数的差值;
通过所述偏态系数与所述对照偏态系数的差值,从所述末端散布概率和所述首端散布概率中确定偏态散布概率;
将所述末端散布概率、所述首端散布概率和所述偏态散布概率进行差值计算,通过差值计算结果在所述末端散布概率、所述首端散布概率和所述偏态散布概率中确定所述对话文本表征向量对应的目标散布概率;
将所述目标散布概率确定为所述对话文本表征向量在所在质检要素的目标表征向量集合中的散布情况。
5.根据权利要求1所述的方法,其特征在于,所述对所述违规项质检网络集合中各个违规项质检网络对所述目标客服的质检信息进行信息归集,得到所述目标客服的客服服务质检结果,包括:
通过对所述目标客服的质检信息确定质检信息为违规的违规信息数目;
当所述违规信息数目大于违规数目临界值时,确定所述目标客服为违规服务客服,得到所述目标客服的客服服务质检结果;
所述方法还包括:
获取所述目标客服的违规指示信息注释时刻,所述违规指示信息注释时刻为注释者对所述目标客服进行违规指示信息注释处理的处理时刻;
当确定所述目标客服的客服服务质检结果为违规服务客服时,确定得到所述目标客服的客服服务质检结果的违规识别时刻;
确定所述违规指示信息注释时刻与所述违规识别时刻的时差;
通过所述时差得到客服服务停止约束值,所述客服服务停止约束值为在基于所述违规项质检网络识别出客服为违规服务客服时,对违规服务客服的对话文本进行停止的约束时间长度;
所述获取各个所述目标客服各自对应的对话文本表征向量集合,包括:
针对每一所述目标客服,获取所述目标客服对应的对话文本;
确定所述对话文本对应的质检要素;
对所述对话文本进行词嵌入,得到初始对话文本表征向量集合;
对所述初始对话文本表征向量集合中属于相同质检要素的对话文本表征向量进行归集,得到所述目标客服对应的对话文本表征向量集合。
6.一种质检设备,其特征在于,包括:
存储器;
处理器;
所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~5任一项所述的方法。
CN202311102104.9A 2023-08-30 2023-08-30 基于文本分析的智能客服服务质检方法及相关设备 Active CN116823069B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311102104.9A CN116823069B (zh) 2023-08-30 2023-08-30 基于文本分析的智能客服服务质检方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311102104.9A CN116823069B (zh) 2023-08-30 2023-08-30 基于文本分析的智能客服服务质检方法及相关设备

Publications (2)

Publication Number Publication Date
CN116823069A CN116823069A (zh) 2023-09-29
CN116823069B true CN116823069B (zh) 2023-12-05

Family

ID=88118826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311102104.9A Active CN116823069B (zh) 2023-08-30 2023-08-30 基于文本分析的智能客服服务质检方法及相关设备

Country Status (1)

Country Link
CN (1) CN116823069B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507121A (zh) * 2020-12-01 2021-03-16 平安科技(深圳)有限公司 客服违规质检方法、装置、计算机设备及存储介质
CN112804400A (zh) * 2020-12-31 2021-05-14 中国工商银行股份有限公司 客服呼叫语音质检方法、装置、电子设备及存储介质
CN113628627A (zh) * 2021-08-11 2021-11-09 广东电网有限责任公司广州供电局 一种基于结构化语音分析的电力行业客户服务质检系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10699009B2 (en) * 2018-02-28 2020-06-30 Microsoft Technology Licensing, Llc Automatic malicious session detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507121A (zh) * 2020-12-01 2021-03-16 平安科技(深圳)有限公司 客服违规质检方法、装置、计算机设备及存储介质
CN112804400A (zh) * 2020-12-31 2021-05-14 中国工商银行股份有限公司 客服呼叫语音质检方法、装置、电子设备及存储介质
CN113628627A (zh) * 2021-08-11 2021-11-09 广东电网有限责任公司广州供电局 一种基于结构化语音分析的电力行业客户服务质检系统

Also Published As

Publication number Publication date
CN116823069A (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
CN107463605B (zh) 低质新闻资源的识别方法及装置、计算机设备及可读介质
CN110163647B (zh) 一种数据处理方法及装置
US10637826B1 (en) Policy compliance verification using semantic distance and nearest neighbor search of labeled content
CN109492772B (zh) 生成信息的方法和装置
CN116049412B (zh) 文本分类方法、模型训练方法、装置及电子设备
CN110046251B (zh) 社区内容风险评估方法及装置
CN111626821A (zh) 基于集成特征选择实现客户分类的产品推荐方法及系统
CN115860836B (zh) 一种基于用户行为大数据分析的电商服务推送方法及系统
CN110533094B (zh) 一种用于驾驶员的评价方法和系统
CN110704738B (zh) 基于法官画像的服务信息推送方法、装置、终端及存储介质
CN117409419A (zh) 图像检测方法、设备及存储介质
WO2019242453A1 (zh) 信息处理方法及装置、存储介质、电子装置
CN115062709A (zh) 模型优化方法、装置、设备、存储介质及程序产品
CN117291428A (zh) 一种基于企业管理app的数据后台管理系统
CN116823069B (zh) 基于文本分析的智能客服服务质检方法及相关设备
CN116958622A (zh) 数据的分类方法、装置、设备、介质及程序产品
CN117216249A (zh) 数据分类方法、装置、电子设备、介质及车辆
CN114528908A (zh) 网络请求数据分类模型训练方法、分类方法及存储介质
CN116842936A (zh) 关键词识别方法、装置、电子设备和计算机可读存储介质
CN113722484A (zh) 基于深度学习的谣言检测方法、装置、设备及存储介质
CN112307133A (zh) 安全防护方法、装置、计算机设备及存储介质
Li et al. Classification of mobile APPs with combined information
CN114339859B (zh) 识别全屋无线网络WiFi潜在用户的方法、装置及电子设备
CN117668205B (zh) 智慧物流客服处理方法、系统、设备及存储介质
CN116304058B (zh) 企业负面信息的识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant