CN117093464B - 一种用户进线实时监控预警方法及系统 - Google Patents
一种用户进线实时监控预警方法及系统 Download PDFInfo
- Publication number
- CN117093464B CN117093464B CN202311336705.6A CN202311336705A CN117093464B CN 117093464 B CN117093464 B CN 117093464B CN 202311336705 A CN202311336705 A CN 202311336705A CN 117093464 B CN117093464 B CN 117093464B
- Authority
- CN
- China
- Prior art keywords
- text
- initial
- complexity
- demand
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012544 monitoring process Methods 0.000 title claims abstract description 58
- 238000004458 analytical method Methods 0.000 claims abstract description 52
- 230000005856 abnormality Effects 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000012937 correction Methods 0.000 claims description 19
- 238000011084 recovery Methods 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 5
- 230000002452 interceptive effect Effects 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 abstract description 13
- 238000001514 detection method Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3017—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is implementing multitasking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3495—Performance evaluation by tracing or monitoring for systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/064—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0681—Configuration of triggering conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/865—Monitoring of software
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Environmental & Geological Engineering (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种用户进线实时监控预警方法及系统,包括:采集若干客服系统数据;根据客服系统数据获取需求文本,根据需求文本得到初始干扰文字以及初始分析文字;根据初始干扰文字得到初始干扰文字复杂度;根据初始干扰文字复杂度以及初始分析文字得到内容复杂度;对需求文本进行分组得到单字词组;根据单字词组以及内容复杂度得到修正内容复杂度;获取每个需求文本的内部时间联系程度;根据修正内容复杂度、内容时间联系程度以及回复时间得到异常程度;根据异常程度进行实时监控预警。本发明降低了监控成本,扩大了监控范围,提高了异常检测预警的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种用户进线实时监控预警方法及系统。
背景技术
用户进线是指用户通过电话、在线聊天、邮件等渠道与客服人员进行沟通的过程。目前用户进线过程通常是由人工智能客服首先对用户的简单问题进行处理。在处理过程中,可能会涉及用户的一些隐私信息等,为了保证用户隐私信息不被泄漏,需要对用户进线过程进行实时监控。
在对用户进线过程进行实时监控时,传统方法会将用户与客服人员的沟通内容进行加密,并利用入侵检测系统和安全审计机制对客服系统进行保护;传统方法虽然可以一定程度地保证信息的安全性,但是会存在较高的成本,并且监控范围会存在一定的限制,不易发现除了恶意监控以外其他原因造成的异常情况。
发明内容
本发明提供一种用户进线实时监控预警方法及系统,以解决现有的问题:传统的用户进线过程进行实时监控方法会存在较高的成本,并且监控范围会存在一定的限制,不易发现除了恶意监控以外其他原因造成的异常情况。
本发明的一种用户进线实时监控预警方法及系统采用如下技术方案:
本发明一个实施例提供了一种用户进线实时监控预警方法,该方法包括以下步骤:
采集若干客服系统数据,所述客服系统数据包含回复时间、网络延迟、用户数量、并行处理最大用户数量以及多个需求描述,需求描述中包含多个文字;
将每个客服系统数据上每个需求描述中所有文字构成的集合记为需求文本,根据需求文本得到若干初始干扰文字以及初始分析文字;根据初始干扰文字得到每个需求文本的初始干扰文字复杂度;根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度;
对需求文本进行分组得到若干词组,所述词组包含多个单字词组;根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度;根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度;
根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系,所述三维坐标系包含多个文本数据点;获取每个文本数据点的异常程度;根据异常程度进行实时监控预警。
优选的,所述根据需求文本得到若干初始干扰文字以及初始分析文字,包括的具体方法为:
对于任意一个需求文本,将预设词组词表每个文字在需求文本中出现的频次记为初始频次,将初始频次不为0的文字均记为初始分析文字;将需求文本中除初始分析文字以外的文字均记为初始干扰文字。
优选的,所述根据初始干扰文字得到每个需求文本的初始干扰文字复杂度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的初始干扰文字复杂度;/>表示需求文本内所有初始干扰文字的数量;/>表示需求文本内所有文字的数量;表示需求文本内初始干扰文字的信息熵。
优选的,所述根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的内容复杂度;/>表示需求文本内所有初始分析文字的数量;/>表示需求文本内第/>个初始分析文字在所有需求文本中出现的频次;/>表示需求文本的初始干扰文字复杂度;表示以自然常数为底的指数函数。
优选的,所述对需求文本进行分组得到若干词组,包括的具体方法为:
对于任意一个需求文本,利用jieba中文分词组件对需求文本进行分词得到若干词组,将词组包含文字数量为1且文字不为特殊字符的词组记为单字词组。
优选的,所述根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的初始修正内容复杂度;/>表示需求文本的内容复杂度;/>表示需求文本中单字词组的数量;/>表示需求文本中所有词组的数量;/>表示需求文本内所有初始分析文字的数量;获取所有需求文本的初始修正内容复杂度,对所有需求文本的初始修正内容复杂度进行线性归一化,将归一化后的每个初始修正内容复杂度记为修正内容复杂度。
优选的,所述根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的内部数据时间联系程度;/>表示客服系统数据的用户数量;/>表示客服系统数据的并行处理最大用户数量;/>表示该需求文本的网络延迟;/>表示取绝对值;获取所有需求文本的内部数据时间联系程度,将所有需求文本的内部数据时间联系程度进行线性归一化,将归一化后的每个内部数据时间联系程度记为内容时间联系程度。
优选的,所述获取每个文本数据点的异常程度,包括的具体方法为:
利用最小二乘法对所有需求文本的所有文本数据点进行拟合得到拟合曲线;将回复时间距离当前采集时间最小的客服系统数据记为目标客服系统数据,将目标客服系统数据内每个需求文本记为目标需求文本,对于任意一个目标需求文本中任意一个文本数据点,将在拟合曲线上与该文本数据点欧式距离最小的点记为该文本数据点的样本预测点,获取目标需求文本中所有文本数据点的样本预测点;
对于任意一个目标需求文本中任意一个文本数据点,式中,/>表示文本数据点的异常程度;/>表示文本数据点的回复时间;/>表示文本数据点的样本预测数据点的回复时间;/>表示以自然常数为底的指数函数;/>表示取绝对值。
优选的,所述根据异常程度进行实时监控预警,包括的具体方法为:
将预设的一个文本数据点数量占比阈值以及一个异常程度阈值分别记为T1、T2;在所有目标需求文本的所有文本数据点中,若超过T1的文本数据点的异常程度大于T2,那么对目标客服系统数据进行预警。
本发明的实施例提供了一种用户进线实时监控预警系统,该系统包括客服系统数据采集模块、内容复杂度获取模块、修正内容复杂度与内部时间联系程度获取模块以及监控预警模块,其中:
客服系统数据采集模块,用于采集若干客服系统数据,所述客服系统数据包含回复时间、网络延迟、用户数量、并行处理最大用户数量以及多个需求描述,需求描述中包含多个文字;
内容复杂度获取模块,用于将每个客服系统数据上每个需求描述中所有文字构成的集合记为需求文本,根据需求文本得到若干初始干扰文字以及初始分析文字;根据初始干扰文字得到每个需求文本的初始干扰文字复杂度;根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度;
修正内容复杂度与内部时间联系程度获取模块,用于对需求文本进行分组得到若干词组,所述词组包含多个单字词组;根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度;根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度;
监控预警模块,用于根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系,所述三维坐标系包含多个文本数据点;获取每个文本数据点的异常程度;根据异常程度进行实时监控预警。
本发明的技术方案的有益效果是:根据客服系统数据得到初始干扰文字复杂度,根据初始干扰文字复杂度得到内容复杂度,根据内容复杂度得到修正内容复杂度,获取内部时间联系程度,根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系,根据三维坐标系得到文本数据点的异常程度,根据异常程度进行实时监控预警;相较于现有技术进行实时监控方法会存在较高的成本,并且监控范围会存在一定的限制,不易发现除了恶意监控以外其他原因造成的异常情况;本发明的初始干扰文字复杂度反映了客户系统数据中的用户所表达需求的不明确程度,内容复杂度反映了客户系统数据中的用户所表达需求的特征多样性,内部时间联系程度反映了需求文本的回复时间受到干扰的程度,异常程度反映了文本数据点受外界干扰的程度;降低了监控成本,扩大了监控范围,提高了异常检测预警的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种用户进线实时监控预警方法的步骤流程图;
图2为本发明的一种用户进线实时监控预警系统的结构框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用户进线实时监控预警方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种用户进线实时监控预警方法及系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种用户进线实时监控预警方法的步骤流程图,该方法包括以下步骤:
步骤S001:采集若干客服系统数据。
需要说明的是,在对用户进线过程进行实时监控时,传统方法会将用户与客服人员的沟通内容进行加密,并利用入侵检测系统和安全审计机制对客服系统进行保护;传统方法虽然可以一定程度地保证信息的安全性,但是会存在较高的成本,并且监控范围会存在一定的限制,不易发现除了恶意监控以外其他原因造成的异常情况。为此,本实施例提出了一种用户进线实时监控预警方法。
具体的,为了实现本实施例提出的一种用户进线实时监控预警方法,首先需要采集若干客服系统数据,具体过程为:
在客服系统数据库中获取近一周的客服系统数据,每条客服系统数据包含需求描述、回复时间、网络延迟、用户数量以及并行处理最大用户数量这五种客服数据种类。其中每条客服系统数据包含多个需求描述,每个需求描述对应一个回复时间以及一个网络延迟,需求描述这一客服数据种类中包含多个文字。
至此,通过上述方法得到若干客服系统数据。
步骤S002:根据客服系统数据得到需求文本,根据需求文本得到若干初始干扰文字以及初始分析文字;根据初始干扰文字得到每个需求文本的初始干扰文字复杂度;根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度。
需要说明的是,当客服系统被恶意监听时,通信渠道或服务器可能会受到干扰,导致人工智能客服的回复延迟或中断,使回复速度较大幅度地降低;又因在实际的用户进线过程中,通常先由人工智能客服根据用户的需求描述进行智能分析,然后对该需求描述进行回复;所以人工智能客服的回复速度通常主要会受到需求描述中内容信息的影响,所以可以通过分析需求描述中内容信息,获取当前用户进线过程被恶意监听的可能性。
进一步需要说明的是,人工智能客服通常会识别预设词组词表在需求描述中出现过的关键字,并利用对应的问答话术或任务话术对需求描述进行回复;对于这些关键字而言,关键字数量越多,用户的需求表示会越明确,分析时的复杂程度就会越低。另外,由于智能客服系统具备一定的自我学习能力,会将除预设词组词表以外出现频率高的词组进行学习记录,对这些词组分析时的复杂程度同时也会较低。
具体的,以任意一个客服系统数据为例,将该客服系统数据的每个需求描述中所有文字构成的集合记为需求文本,将预设词组词表中每个文字在该需求文本中出现的频次记为初始频次,将初始频次不为0的文字均记为初始分析文字;将该需求文本中除初始分析文字以外的文字均记为初始干扰文字;根据初始分析文字以及初始干扰文字得到该需求文本的初始干扰文字复杂度。另外需要说明的是,预设词组词表包含了用户自定义预设若干核心词组。其中该需求文本的初始干扰文字复杂度的计算方法为:
式中,/>表示需求文本的初始干扰文字复杂度;/>表示需求文本内所有初始干扰文字的数量;/>表示需求文本内所有文字的数量;/>表示需求文本内初始干扰文字的信息熵;其中针对初始干扰文字计算信息熵,即是对所有初始干扰文字根据出现的频次计算信息熵,信息熵计算为公知技术,本实施例不再赘述。其中若该需求文本的初始干扰文字复杂度越大,说明该客户系统数据中的用户所表达的需求越不明确。另外需要说明的是,信息熵的获取是公知技术,本实施例不进行叙述。
进一步的,根据初始干扰文字复杂度得到该需求文本的内容复杂度。其中该需求文本的内容复杂度的计算方法为:
式中,表示需求文本的内容复杂度;/>表示需求文本内所有初始分析文字的数量;/>表示需求文本内第/>个初始分析文字在所有需求文本中出现的频次;/>表示需求文本的初始干扰文字复杂度;/>表示以自然常数为底的指数函数;实施例采用函数来呈现反比例关系及归一化处理,实施者可根据实际情况选择反比例函数及归一化函数;/>表示该需求文本中所有初始分析文字的平均出现频次。其中若该需求文本的内容复杂度越大,说明该客户系统数据中的用户所表达的特征越多,需求越明显。获取所有需求文本的内容复杂度。
至此,通过上述方法得到所有需求文本的内容复杂度。
步骤S003:对需求文本进行分组得到单字词组;根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度;根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度。
需要说明的是,需求文本的内容复杂度是基于需求文本中不包含错别字以及内容描述较明确的基础上获取的,若需求文本中包含若干个错别字或者内容描述较模糊,那么可能会导致内容复杂度本身的准确性较低,影响后续的分析处理,所以需要对内容复杂度进行情况补充,从而获取较准确的修正内容复杂度。在正常情况下,由于错别字或者描述模糊的文字存在的数量会远远小于需求文本中总体文字的数量,所以可以根据占比分析对内容复杂度进行补充修正。
进一步需要说明的是,由于客服系统被恶意监听时,通信渠道或服务器可能会受到干扰,导致人工智能客服的回复延迟或中断,使回复速度较大幅度地降低;所以回复速度除了与目标需求文本的修正内容复杂度相关以外,还与客服系统自身负载或网络连接稳定性有关;而在若干客服数据种类中,用户数量直接影响着客服系统自身负载,网络延迟直接影响着网络连接稳定性,因此可以通过分析用户数量与网络延迟得到内容时间联系程度。
具体的,以任意一个客服系统数据中任意一个需求文本为例,利用jieba中文分词组件对该需求文本进行分词得到若干词组,将词组包含文字数量为1且文字不为特殊字符的词组记为单字词组;根据单字词组以及该需求文本的内容复杂度得到该需求文本的修正内容复杂度。其中利用jieba中文分词组件进行分词的过程是公知技术,本实施例不进行叙述。另外需要说明的是,词组中不止包含单字词组。其中该需求文本的修正内容复杂度的计算方法为:
式中,/>表示需求文本的初始修正内容复杂度;/>表示需求文本的内容复杂度;/>表示需求文本中单字词组的数量;/>表示需求文本中所有词组的数量;/>表示需求文本内所有初始分析文字的数量。其中若该需求文本的初始修正内容复杂度越大,说明该客户系统数据中的用户所表达的特征越多,需求越明显。获取所有需求文本的初始修正内容复杂度,对所有需求文本的初始修正内容复杂度进行线性归一化,将归一化后的每个初始修正内容复杂度记为修正内容复杂度。
进一步的,以任意一个客服系统数据中任意一个需求文本为例,根据客服系统数据的用户数量、并行处理最大用户数量以及该需求文本的网络延迟,得到该需求文本的内部数据时间联系程度。其中该需求文本的内容时间联系程度的计算方法为:
式中,/>表示需求文本的内部数据时间联系程度;/>表示客服系统数据的用户数量;/>表示客服系统数据的并行处理最大用户数量;表示该需求文本的网络延迟;/>表示取绝对值;/>用于防止用户数量小于并行处理最大用户数量的情况。其中若该需求文本的内部数据时间联系程度越大,说明需求文本的回复时间受到干扰的程度越低,反映需求文本内文字之间的时间联系越紧密。获取所有需求文本的内部数据时间联系程度,将所有需求文本的内部数据时间联系程度进行线性归一化,将归一化后的每个内部数据时间联系程度记为内容时间联系程度。另外需要说明的是,/>所表示的并行处理最大用户数量具体是指客服系统最大可以同时处理的用户数量,而/>所表示的用户数量具体是指客服系统容纳的用户数量;对于客服系统而言,若当前容纳的用户数量大于最大可以同时处理的用户数量,那么多余的用户数量会进行排队,等待正在处理的用户处理完毕;所以/>可能会大于或等于/>,也可能会小于/>。
至此,通过上述方法得到所有需求文本的内容时间联系程度。
步骤S004:根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系;根据三维坐标系获取每个文本数据点的异常程度;根据异常程度进行实时监控预警。
具体的,将所有需求文本的修正内容复杂度作为x轴,将所有需求文本的内容时间联系程度作为y轴,将所有需求文本的回复时间作为z轴,根据x、y、z轴构建三维坐标系;以任意一个需求文本为例,将该需求文本的修正内容复杂度、内容时间联系程度以及回复时间在三维坐标系中共同构成的数据点记为文本数据点,获取所有需求文本的所有文本数据点,利用最小二乘法对所有文本数据点进行拟合得到拟合曲线。
进一步的,将回复时间距离当前采集时间最小的客服系统数据记为目标客服系统数据,将目标客服系统数据内每个需求文本记为目标需求文本,以任意一个目标需求文本中任意一个文本数据点为例,将在拟合曲线上与该文本数据点欧式距离最小的点记为该文本数据点的样本预测点,获取目标需求文本中所有文本数据点的样本预测点。其中三维坐标系中包含多个文本数据点,每个文本数据点对应一个修正内容复杂度、一个内容时间联系程度以及一个回复时间,每个文本数据点在拟合曲线上均对应一个点;最小二乘法对数据点进行拟合的过程是最小二乘法的公知内容,欧式距离是公知技术,本实施例不进行叙述。
进一步的,以任意一个目标需求文本中任意一个文本数据点为例,根据该文本数据点以及该文本数据点的样本预测点得到该文本数据点的异常程度。其中该文本数据点的异常程度的计算方法为:
式中,表示文本数据点的异常程度;/>表示文本数据点的回复时间;/>表示文本数据点的样本预测数据点的回复时间;/>表示取绝对值;/>表示以自然常数为底的指数函数;实施例采用/>函数来呈现反比例关系及归一化处理,实施者可根据实际情况选择反比例函数及归一化函数。其中若该文本数据点的异常程度越大,说明该文本数据点越有可能存在异常,反映该文本数据点受外界干扰的程度越大。获取该目标需求文本中所有文本数据点的异常程度,获取所有目标需求文本中所有文本数据点的异常程度。
进一步的,预设一个文本数据点数量占比阈值T1以及一个异常程度阈值T2,其中本实施例以T1=40%,T2=0.35为例进行叙述,本实施例不进行具体限定,其中T1、T2可根据具体实施情况而定;在所有目标需求文本的所有文本数据点中,若超过T1的文本数据点的异常程度大于T2,那么对目标客服系统数据进行预警。
通过以上步骤,根据用户进线产生的客服系统数据进行分析,完成用户进线实时监控预警方法。
请参阅图2,其示出了本发明一个实施例提供的一种用户进线实时监控预警系统的结构框图,该系统包括以下模块:
客服系统数据采集模块,用于采集若干客服系统数据,所述客服系统数据包含回复时间、网络延迟、用户数量、并行处理最大用户数量以及多个需求描述,需求描述中包含多个文字;
内容复杂度获取模块,用于将每个客服系统数据上每个需求描述中所有文字构成的集合记为需求文本,根据需求文本得到若干初始干扰文字以及初始分析文字;根据初始干扰文字得到每个需求文本的初始干扰文字复杂度;根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度;
修正内容复杂度与内部时间联系程度获取模块,用于对需求文本进行分组得到若干词组,所述词组包含多个单字词组;根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度;根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度;
监控预警模块,用于根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系,所述三维坐标系包含多个文本数据点;获取每个文本数据点的异常程度;根据异常程度进行实时监控预警。
本实施例根据客服系统数据得到初始干扰文字复杂度,根据初始干扰文字复杂度得到内容复杂度,根据内容复杂度得到修正内容复杂度,获取内部时间联系程度,根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系,根据三维坐标系得到文本数据点的异常程度,根据异常程度进行实时监控预警;相较于现有技术进行实时监控方法会存在较高的成本,并且监控范围会存在一定的限制,不易发现除了恶意监控以外其他原因造成的异常情况;本实施例的初始干扰文字复杂度反映了客户系统数据中的用户所表达需求的不明确程度,内容复杂度反映了客户系统数据中的用户所表达需求的特征多样性,内部时间联系程度反映了需求文本的回复时间受到干扰的程度,异常程度反映了文本数据点受外界干扰的程度;降低了监控成本,扩大了监控范围,提高了异常检测预警的准确性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种用户进线实时监控预警方法,其特征在于,该方法包括以下步骤:
采集若干客服系统数据,所述客服系统数据包含回复时间、网络延迟、用户数量、并行处理最大用户数量以及多个需求描述,需求描述中包含多个文字;
将每个客服系统数据上每个需求描述中所有文字构成的集合记为需求文本,根据需求文本得到若干初始干扰文字以及初始分析文字;根据初始干扰文字得到每个需求文本的初始干扰文字复杂度;根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度;
对需求文本进行分组得到若干词组,所述词组包含多个单字词组;根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度;根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度;
根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系,所述三维坐标系包含多个文本数据点;获取每个文本数据点的异常程度;根据异常程度进行实时监控预警;
所述根据需求文本得到若干初始干扰文字以及初始分析文字,包括的具体方法为:
对于任意一个需求文本,将预设词组词表每个文字在需求文本中出现的频次记为初始频次,将初始频次不为0的文字均记为初始分析文字;将需求文本中除初始分析文字以外的文字均记为初始干扰文字;
所述根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的初始修正内容复杂度;/>表示需求文本的内容复杂度;/>表示需求文本中单字词组的数量;/>表示需求文本中所有词组的数量;/>表示需求文本内所有初始分析文字的数量;获取所有需求文本的初始修正内容复杂度,对所有需求文本的初始修正内容复杂度进行线性归一化,将归一化后的每个初始修正内容复杂度记为修正内容复杂度;
所述根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的内部数据时间联系程度;/>表示客服系统数据的用户数量;/>表示客服系统数据的并行处理最大用户数量;/>表示该需求文本的网络延迟;/>表示取绝对值;获取所有需求文本的内部数据时间联系程度,将所有需求文本的内部数据时间联系程度进行线性归一化,将归一化后的每个内部数据时间联系程度记为内容时间联系程度。
2.根据权利要求1所述一种用户进线实时监控预警方法,其特征在于,所述根据初始干扰文字得到每个需求文本的初始干扰文字复杂度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的初始干扰文字复杂度;/>表示需求文本内所有初始干扰文字的数量;/>表示需求文本内所有文字的数量;/>表示需求文本内初始干扰文字的信息熵。
3.根据权利要求1所述一种用户进线实时监控预警方法,其特征在于,所述根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的内容复杂度;表示需求文本内所有初始分析文字的数量;/>表示需求文本内第/>个初始分析文字在所有需求文本中出现的频次;/>表示需求文本的初始干扰文字复杂度;/>表示以自然常数为底的指数函数。
4.根据权利要求1所述一种用户进线实时监控预警方法,其特征在于,所述对需求文本进行分组得到若干词组,包括的具体方法为:
对于任意一个需求文本,利用jieba中文分词组件对需求文本进行分词得到若干词组,将词组包含文字数量为1且文字不为特殊字符的词组记为单字词组。
5.根据权利要求1所述一种用户进线实时监控预警方法,其特征在于,所述获取每个文本数据点的异常程度,包括的具体方法为:
利用最小二乘法对所有需求文本的所有文本数据点进行拟合得到拟合曲线;将回复时间距离当前采集时间最小的客服系统数据记为目标客服系统数据,将目标客服系统数据内每个需求文本记为目标需求文本,对于任意一个目标需求文本中任意一个文本数据点,将在拟合曲线上与该文本数据点欧式距离最小的点记为该文本数据点的样本预测点,获取目标需求文本中所有文本数据点的样本预测点;
对于任意一个目标需求文本中任意一个文本数据点,式中,/>表示文本数据点的异常程度;/>表示文本数据点的回复时间;/>表示文本数据点的样本预测数据点的回复时间;/>表示以自然常数为底的指数函数;/>表示取绝对值。
6.根据权利要求5所述一种用户进线实时监控预警方法,其特征在于,所述根据异常程度进行实时监控预警,包括的具体方法为:
将预设的一个文本数据点数量占比阈值以及一个异常程度阈值分别记为T1、T2;在所有目标需求文本的所有文本数据点中,若超过T1的文本数据点的异常程度大于T2,那么对目标客服系统数据进行预警。
7.一种用户进线实时监控预警系统,其特征在于,该系统包括以下模块:
客服系统数据采集模块,用于采集若干客服系统数据,所述客服系统数据包含回复时间、网络延迟、用户数量、并行处理最大用户数量以及多个需求描述,需求描述中包含多个文字;
内容复杂度获取模块,用于将每个客服系统数据上每个需求描述中所有文字构成的集合记为需求文本,根据需求文本得到若干初始干扰文字以及初始分析文字;根据初始干扰文字得到每个需求文本的初始干扰文字复杂度;根据初始干扰文字复杂度以及初始分析文字得到每个需求文本的内容复杂度;
修正内容复杂度与内部时间联系程度获取模块,用于对需求文本进行分组得到若干词组,所述词组包含多个单字词组;根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度;根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度;
监控预警模块,用于根据修正内容复杂度、内容时间联系程度以及回复时间构建三维坐标系,所述三维坐标系包含多个文本数据点;获取每个文本数据点的异常程度;根据异常程度进行实时监控预警;
所述根据需求文本得到若干初始干扰文字以及初始分析文字,包括的具体方法为:
对于任意一个需求文本,将预设词组词表每个文字在需求文本中出现的频次记为初始频次,将初始频次不为0的文字均记为初始分析文字;将需求文本中除初始分析文字以外的文字均记为初始干扰文字;
所述根据单字词组、初始分析文字以及内容复杂度得到每个需求文本的修正内容复杂度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的初始修正内容复杂度;/>表示需求文本的内容复杂度;/>表示需求文本中单字词组的数量;/>表示需求文本中所有词组的数量;/>表示需求文本内所有初始分析文字的数量;获取所有需求文本的初始修正内容复杂度,对所有需求文本的初始修正内容复杂度进行线性归一化,将归一化后的每个初始修正内容复杂度记为修正内容复杂度;
所述根据用户数量、并行处理最大用户数量以及网络延迟得到每个需求文本的内部时间联系程度,包括的具体方法为:
对于任意一个需求文本,式中,/>表示需求文本的内部数据时间联系程度;/>表示客服系统数据的用户数量;/>表示客服系统数据的并行处理最大用户数量;/>表示该需求文本的网络延迟;/>表示取绝对值;获取所有需求文本的内部数据时间联系程度,将所有需求文本的内部数据时间联系程度进行线性归一化,将归一化后的每个内部数据时间联系程度记为内容时间联系程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311336705.6A CN117093464B (zh) | 2023-10-17 | 2023-10-17 | 一种用户进线实时监控预警方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311336705.6A CN117093464B (zh) | 2023-10-17 | 2023-10-17 | 一种用户进线实时监控预警方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117093464A CN117093464A (zh) | 2023-11-21 |
CN117093464B true CN117093464B (zh) | 2024-01-26 |
Family
ID=88775645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311336705.6A Active CN117093464B (zh) | 2023-10-17 | 2023-10-17 | 一种用户进线实时监控预警方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117093464B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009032240A (ja) * | 2007-06-27 | 2009-02-12 | Nagaoka Univ Of Technology | 文章の読み易さ評価システム及び文章の読み易さ評価方法 |
CN109543020A (zh) * | 2018-11-27 | 2019-03-29 | 科大讯飞股份有限公司 | 问询处理方法及系统 |
CN110335595A (zh) * | 2019-06-06 | 2019-10-15 | 平安科技(深圳)有限公司 | 基于语音识别的插问对话方法、装置及存储介质 |
WO2021135444A1 (zh) * | 2020-06-28 | 2021-07-08 | 平安科技(深圳)有限公司 | 一种基于人工智能的文本纠错方法、装置、计算机设备及存储介质 |
KR102309633B1 (ko) * | 2020-12-30 | 2021-10-07 | 한국교육방송공사 | 양적/질적 평가에 기반한 독서 교육을 위한 컴퓨터 프로그램, 그러한 방법 및 이를 위한 컴퓨터 시스템 |
CN114782054A (zh) * | 2022-03-14 | 2022-07-22 | 中国人寿保险股份有限公司 | 基于深度学习算法的客服服务质量检测方法及相关设备 |
CN115840799A (zh) * | 2023-02-24 | 2023-03-24 | 南通专猎网络科技有限公司 | 一种基于深度学习的知识产权综合管理系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9558448B2 (en) * | 2014-02-20 | 2017-01-31 | International Business Machines Corporation | Dynamic interfacing in a deep question answering system |
-
2023
- 2023-10-17 CN CN202311336705.6A patent/CN117093464B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009032240A (ja) * | 2007-06-27 | 2009-02-12 | Nagaoka Univ Of Technology | 文章の読み易さ評価システム及び文章の読み易さ評価方法 |
CN109543020A (zh) * | 2018-11-27 | 2019-03-29 | 科大讯飞股份有限公司 | 问询处理方法及系统 |
CN110335595A (zh) * | 2019-06-06 | 2019-10-15 | 平安科技(深圳)有限公司 | 基于语音识别的插问对话方法、装置及存储介质 |
WO2021135444A1 (zh) * | 2020-06-28 | 2021-07-08 | 平安科技(深圳)有限公司 | 一种基于人工智能的文本纠错方法、装置、计算机设备及存储介质 |
KR102309633B1 (ko) * | 2020-12-30 | 2021-10-07 | 한국교육방송공사 | 양적/질적 평가에 기반한 독서 교육을 위한 컴퓨터 프로그램, 그러한 방법 및 이를 위한 컴퓨터 시스템 |
CN114782054A (zh) * | 2022-03-14 | 2022-07-22 | 中国人寿保险股份有限公司 | 基于深度学习算法的客服服务质量检测方法及相关设备 |
CN115840799A (zh) * | 2023-02-24 | 2023-03-24 | 南通专猎网络科技有限公司 | 一种基于深度学习的知识产权综合管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117093464A (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112087334B (zh) | 告警根因分析方法、电子设备和存储介质 | |
CN110378430B (zh) | 一种基于多模型融合的网络入侵检测的方法及系统 | |
US20210026341A1 (en) | Network analysis program, network analysis device, and network analysis method | |
CN113641993A (zh) | 一种基于云计算的数据安防处理方法及数据安防服务器 | |
CN113762377A (zh) | 网络流量识别方法、装置、设备及存储介质 | |
CN112214342B (zh) | 一种联邦学习场景中高效的错误数据检测方法 | |
CN109462580B (zh) | 训练流量检测模型、检测业务流量异常的方法及装置 | |
WO2023207557A1 (zh) | 评估业务预测模型鲁棒性的方法、装置及计算设备 | |
CN116955091A (zh) | 基于机器学习的数据中心故障检测系统 | |
CN114429633A (zh) | 文本识别方法、模型的训练方法、装置、电子设备及介质 | |
CN113643033A (zh) | 一种用于大数据风控分析的信息处理方法及服务器 | |
CN117041019A (zh) | 内容分发网络cdn的日志分析方法、装置及存储介质 | |
CN117093464B (zh) | 一种用户进线实时监控预警方法及系统 | |
CN117312098B (zh) | 一种日志异常告警方法及装置 | |
CN113705164A (zh) | 一种文本处理方法、装置、计算机设备以及可读存储介质 | |
CN111431884B (zh) | 一种基于dns分析的主机失陷检测方法及装置 | |
CN117235608A (zh) | 风险检测方法、装置、电子设备及存储介质 | |
CN115292008A (zh) | 用于分布式系统的事务处理方法、装置、设备及介质 | |
CN106815772A (zh) | 电力数据上报方法及装置 | |
CN114157553A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN112989805A (zh) | 一种文本检测方法、装置、设备及存储介质 | |
CN111930884A (zh) | 一种确定回复语句的方法、设备和人机对话系统 | |
CN117235549B (zh) | 基于内存增强自编码器集成结构的无人机异常检测方法 | |
CN109753599A (zh) | 推荐业务的方法和装置 | |
CN109685101A (zh) | 一种多维数据自适应采集方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |