CN117157628A - 与所应用的异常检测和联络中心计算环境相关的系统和方法 - Google Patents
与所应用的异常检测和联络中心计算环境相关的系统和方法 Download PDFInfo
- Publication number
- CN117157628A CN117157628A CN202180090443.2A CN202180090443A CN117157628A CN 117157628 A CN117157628 A CN 117157628A CN 202180090443 A CN202180090443 A CN 202180090443A CN 117157628 A CN117157628 A CN 117157628A
- Authority
- CN
- China
- Prior art keywords
- sphere
- spheres
- data
- generating
- metric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 125
- 238000001514 detection method Methods 0.000 title description 20
- 230000004044 response Effects 0.000 claims abstract description 35
- 230000015654 memory Effects 0.000 claims abstract description 26
- 238000003860 storage Methods 0.000 claims description 29
- 238000001914 filtration Methods 0.000 claims description 7
- 230000003993 interaction Effects 0.000 description 49
- 238000004891 communication Methods 0.000 description 43
- 238000012545 processing Methods 0.000 description 37
- 230000006870 function Effects 0.000 description 23
- 239000003795 chemical substances by application Substances 0.000 description 22
- 230000008569 process Effects 0.000 description 15
- 230000000007 visual effect Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 8
- 238000013450 outlier detection Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000000052 comparative effect Effects 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000006855 networking Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000005641 tunneling Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 238000010162 Tukey test Methods 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/064—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
- H04L43/067—Generation of reports using time frame reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Regulation And Control Of Combustion (AREA)
- Infusion, Injection, And Reservoir Apparatuses (AREA)
Abstract
根据实施方案所述的一种用于检测由一个或多个客户提供的度量数据中的异常的系统包括至少一个处理器和至少一个存储器,该至少一个存储器包括存储在其上的多个指令,该多个指令响应于由该至少一个处理器执行致使该系统:接收指示针对特定客户度量的多个基于时间序列的观察结果的度量数据;基于该度量数据来限定用于表征一个或多个球体的多个参数,每个球体被配置为捕获针对该特定客户度量的若干基于时间序列的观察结果;以及基于该多个参数来生成该一个或多个球体,以确定在该一个或多个球体内的该度量数据的覆盖范围并检测该度量数据中的一个或多个异常。
Description
相关申请的交叉引用
本申请要求于2020年12月21日提交的美国临时专利申请序列63/128,277号的优先权,该美国临时专利申请的内容全文以引用方式并入本文中。
背景技术
数据分析可涉及检测各种数据集中的异常。在一些情况下,异常检测可能需要评估新观察结果是属于与先前的观察结果相同的分布还是应当被分类为异常值。用于异常检测的各种系统和方法具有若干缺点。因此,用于异常检测的另选系统和方法的开发仍然是感兴趣的领域。
发明内容
一个实施方案涉及用于检测由一个或多个客户提供的度量数据中的异常的独特系统、部件和方法。其他实施方案涉及用于检测由一个或多个客户提供的数据中的异常的装置、系统、设备、硬件、方法及其组合。
根据实施方案,一种用于检测由一个或多个客户提供的度量数据中的异常的系统可包括至少一个处理器和至少一个存储器,该至少一个存储器包括存储在其上的多个指令,该多个指令响应于由该至少一个处理器执行,致使该系统:接收指示针对特定客户度量的多个基于时间序列的观察结果的度量数据;基于度量数据来限定用于表征一个或多个球体的多个参数,每个球体被配置为捕获针对特定客户度量的若干基于时间序列的观察结果;以及基于该多个参数来生成该一个或多个球体,以确定在该一个或多个球体内的度量数据的覆盖范围并检测度量数据中的一个或多个异常。基于该多个参数来生成该一个或多个球体可包括动态地生成多个球体,每个球体具有基于针对特定客户度量的多个基于时间序列的观察结果而变化的半径。
在一些实施方案中,基于度量数据来限定多个参数可包括:限定用于生成至少一个球体的最小半径;限定用于生成一个或多个新球体的半径增量,每个新球体具有变化的半径;以及限定覆盖范围极限,该覆盖范围极限指示待由所生成的球体覆盖的度量数据点的最大数量。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:基于最小半径来确定对应于度量数据的最高集中的位置。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:确定是否已达到覆盖范围极限;以及响应于确定尚未达到覆盖范围极限,基于半径增量来递增用于生成至少一个新球体的半径。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:确定至少一个新球体是否提供先前未提供的度量数据的覆盖范围;以及响应于确定至少一个新球体不提供先前未提供的度量数据的覆盖范围,过滤掉已经被先前的球体覆盖的度量数据。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:响应于确定至少一个新球体提供先前未提供的度量数据的覆盖范围,更新最小半径;以及响应于确定至少一个新球体提供先前未提供的度量数据的覆盖范围,而更新位置。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:基于至少一个球体的最小半径以及至少一个球体与至少一个最近邻球体之间的距离来确定对应于度量数据的最高集中的另一位置;以及生成至少一个新球体,使得该至少一个新球体的中心定位在另一位置处。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:将由至少一个球体提供的度量数据的覆盖范围与由至少一个最近邻球体或至少一个新球体提供的度量数据的覆盖范围进行比较;以及基于该比较来选择提供度量数据的最大覆盖范围的无论哪个球体,以生成另一新球体。
在一些实施方案中,基于度量数据来限定多个参数可包括:从度量数据过滤掉异常值;以及至少部分地基于经过滤的度量数据来限定覆盖范围极限。
根据另一个实施方案,一种或多种非暂态机器可读存储介质可包括存储在其上的多个指令,该多个指令响应于由至少一个处理器执行,致使系统:接收指示针对特定客户度量的多个基于时间序列的观察结果的度量数据;基于度量数据来限定用于表征一个或多个球体的多个参数,每个球体被配置为捕获针对特定客户度量的若干基于时间序列的观察结果;以及基于该多个参数来生成一个或多个球体,以确定在一个或多个球体内的度量数据的覆盖范围并检测度量数据中的一个或多个异常。基于该多个参数来生成该一个或多个球体可包括动态地生成多个球体,每个球体具有基于针对特定客户度量的多个基于时间序列的观察结果而变化的半径。
在一些实施方案中,基于度量数据来限定多个参数可包括:限定用于生成至少一个球体的最小半径;限定用于生成一个或多个新球体的半径增量,每个新球体具有变化的半径;以及限定覆盖范围极限,该覆盖范围极限指示待由所生成的球体覆盖的度量数据点的最大数量。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:基于最小半径来确定对应于度量数据的最高集中的位置。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:确定是否已达到覆盖范围极限;以及响应于确定尚未达到覆盖范围极限,基于半径增量来递增用于生成至少一个新球体的半径。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:确定至少一个新球体是否提供先前未提供的度量数据的覆盖范围;以及响应于确定至少一个新球体不提供先前未提供的度量数据的覆盖范围,过滤掉已经被先前的球体覆盖的度量数据。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:响应于确定至少一个新球体提供先前未提供的度量数据的覆盖范围,更新最小半径;以及响应于确定至少一个新球体提供先前未提供的度量数据的覆盖范围,而更新位置。
在一些实施方案中,基于度量数据来限定多个参数可包括:从度量数据过滤掉异常值;以及至少部分地基于经过滤的度量数据来限定覆盖范围极限。
根据又一实施方案,一种检测由一个或多个客户提供的度量数据中的异常的方法可包括:通过联络中心系统或计算设备来接收指示针对特定客户度量的多个基于时间序列的观察结果的度量数据;通过联络中心系统或计算设备基于度量数据来限定用于表征一个或多个球体的多个参数,每个球体被配置为捕获针对特定客户度量的若干基于时间序列的观察结果;以及通过联络中心系统或计算设备基于多个参数来生成一个或多个球体,以确定在一个或多个球体内的度量数据的覆盖范围并检测度量数据中的一个或多个异常。基于多个参数来生成一个或多个球体可包括通过联络中心系统或计算设备来动态地生成多个球体,每个球体具有基于针对特定客户度量的多个基于时间序列的观察结果而变化的半径。
在一些实施方案中,基于度量数据来限定多个参数可包括:通过联络中心系统或计算设备来限定用于生成至少一个球体的最小半径;通过联络中心系统或计算设备来限定用于生成一个或多个新球体的半径增量,每个新球体具有变化的半径;以及通过联络中心系统或计算设备来限定覆盖范围极限,该覆盖范围极限指示待由所生成的球体覆盖的度量数据点的最大数量。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:通过联络中心系统或计算设备基于最小半径来确定对应于度量数据的最高集中的位置。
在一些实施方案中,基于多个参数来生成一个或多个球体可包括:通过联络中心系统或计算设备来确定是否已达到覆盖范围极限;以及响应于确定尚未达到覆盖范围极限,通过联络中心系统或计算设备基于半径增量来递增用于生成至少一个新球体的半径。
本发明内容不旨在识别所要求保护的主题的关键或必要特征,也不旨在用作限制所要求保护的主题的范围的辅助。本申请的其他实施方案、形式、特征和方面将根据随本文提供的描述和附图变得显而易见。
附图说明
本文描述的概念在附图中通过举例的方式并且不是通过限制的方式进行说明。为了简单和清楚说明,图中示出的元件不一定按比例绘制。在认为适当的情况下,参考标记已在附图中重复以指示对应或类似的元件。
图1是联络中心系统的至少一个实施方案的简化框图;
图2是计算设备的至少一个实施方案的简化框图;
图3是检测由一个或多个客户提供的数据中的异常的方法的至少一个实施方案的简化流程图;
图4是检测由一个或多个客户提供的数据中的异常的方法的另一个实施方案的简化流程图;
图5是可在图4的方法的球体生成期间执行的生成一个或多个球体的方法的至少一个实施方案的简化流程图;
图6是度量数据点/观察结果的集合的视觉表示;
图7是具有根据图5的方法生成的球体的度量数据点/观察结果的集合的视觉表示;
图8是具有根据图5的方法生成的两个球体的度量数据点/观察结果的集合的视觉表示;
图9是具有根据图5的方法生成的三个球体的度量数据点/观察结果的集合的视觉表示;
图10是具有根据比较方法生成的多个球体的度量数据点/观察结果的集合的视觉表示;
图11是具有根据图5的方法生成的多个球体的度量数据点/观察结果的集合的视觉表示;
图12是用于检测各种数据集中的异常的针对各种算法/模型的性能评估的视觉表示;
图13是具有根据比较方法生成的球体的度量数据的集合的视觉表示;
图14是具有根据图5的方法生成的球体的图13的度量数据的集合的视觉表示;
图15是具有根据比较方法生成的球体的度量数据的集合的视觉表示;
图16是具有根据图5的方法生成的球体的图15的度量数据的集合的视觉表示;
图17是针对根据比较方法获得的度量的异常检测信息的图形描绘;并且
图18是针对根据图5的方法获得的度量的异常检测信息的图形描绘。
具体实施方式
尽管本公开的概念易受各种修改和可替代形式的影响,但特定实施方案在附图中已通过举例的方式示出,并且将在本文中详细描述。然而,应当理解,不意图将本公开的概念限制为所公开的特定形式,但是相反,意图是涵盖与本公开和所附权利要求一致的所有修改、等同形式和替代方案。
说明书中对“一个实施方案”、“实施方案”、“例示性实施方案”等的提及指示所描述的实施方案可以包括特定特征、结构或特性,但是每个实施方案可以或可以不一定包括该特定特征、结构或特性。此外,此类短语不一定是指同一实施方案。还应当理解,尽管提及“优选的”部件或特征可以指示特定部件或特征关于实施方案的合意性,但是本公开不因此关于可以省略此种部件或特征的其他实施方案进行限制。此外,当结合实施方案描述特定特征、结构或特性时,认为结合其他实施方案实施此种特征、结构或特性在本领域技术人员的知识范围内,无论是否明确地描述。此外,在各种实施方案中,特定特征、结构或特性可以任何合适的组合和/或子组合进行组合。
另外,应当理解,以“A、B和C中的至少一者”的形式包括在列表中的项目可以意指(A);(B);(C);(A和B);(B和C);(A和C);或(A、B和C)。相似地,以“A、B或C中的至少一者”的形式列出的项目可以意指(A);(B);(C);(A和B);(B和C);(A和C);或(A、B和C)。此外,关于权利要求,单词和短语诸如“一个(a)”、“一个(an)”、“至少一个”、和/或“至少一部分”的使用不应被解释为限制于仅一个此种元件,除非相反地具体陈述,并且短语诸如“至少一部分”和/或“一部分”的使用应被解释为涵盖仅包括此种元件中的一部分的实施方案和包括整个此种元件的实施方案两者,除非相反地具体陈述。
在一些情况下,所公开的实施方案可以硬件、固件、软件或它们的组合来实施。所公开的实施方案还可以实施为在一个或多个暂态或非暂态机器可读(例如,计算机可读)存储介质上携载或存储的指令,该指令可以由一个或多个处理器读取和执行。机器可读存储介质可以体现为用于以机器可读的形式(例如,易失性或非易失性存储器、介质盘或其他介质设备)存储或传输信息的任何存储设备、机构或其他物理结构。
在附图中,可以在特定布置和/或排序中示出一些结构或方法特征。然而,应当理解,可以不需要此类特定布置和/或排序。相反,在一些实施方案中,除非相反指示,否则此类特征可以与例示性图所示不同的方式和/或顺序进行布置。另外,在特定图中包括结构或方法特征并不意味着暗示所有实施方案中需要此种特征,并且在一些实施方案中,可以不包括此种特征或可以将其与其他特征组合。
为了数据收集和/或数据分析的目的,在一些应用中,查明新的观察结果/数据点是否属于与现有的观察结果/数据点相同的数据分布可提供有用信息。属于与现有的观察结果相同的数据分布的观察结果在本文中可被称为正常值(inlier),而不属于与现有的观察结果相同的分布的观察结果在本文中可被称为异常值。区分正常值与异常值的能力对于清理真实数据集特别有用。
应当理解,在许多情况下,基于数据的一个或多个视觉表示,数据(例如,训练数据)中包含的异常值可被限定为远离其他观察结果的观察结果。因此,在一些情况下,异常值检测估计器可致力于拟合和/或捕获数据最集中的区域,同时通常忽略偏离的观察结果或异常值。
然而,在一些情况下,异常值可能尚未存在于感兴趣的数据中。在那些情况下,检测新的观察结果是否为异常值可能是有益的。至少在一些实施方案中,被检测为异常值的新的观察结果可以被称为新颖性。另外,此类异常值的检测在本文中可被称为新颖性检测。
可执行异常值检测和新颖性检测以检测数据中的异常,特别是在期望检测异常或不正常观察结果的情况下。在一些情况下,异常值检测可被称为“无监督异常检测”,而新颖性检测可被称为“半监督异常检测”。在异常值检测的背景下,因为估计器通常假设异常值/异常位于低密度/浓度区域中,所以异常值/异常通常不能形成致密集群。然而,在新颖性检测的背景下,新颖性/异常可形成致密集群,只要它们位于数据的低密度/浓度区域中即可,这可被认为是正常的。
本公开的系统和方法被配置为实现在下文中被称为INS(隔离最近球体)模型的模型。应当理解,INS模型衍生于对于以下的需要并受其启发:可视化用于实现模型的系统、方法和/或工具如何学习针对不同度量的不同行为。INS模型甚至依赖于可用于检测和评估异常的严重性的视觉表示和/或图形描绘。因此,针对时间序列观察结果的异常检测可被认为与多变量系统中的异常值检测类似或以其他方式通过其被告知。为了将针对时间严重观察结果的异常检测与多变量系统中的异常值检测相关联,本公开设想从时间序列数据提取有用特征,该有用特征有助于描述各种度量的连续行为并且对异常值敏感。
在一些实施方案中,本公开提供了用于检测产生模型的任何时间序列度量数据中的异常的机器学习算法。在一些情况下,本文设想的异常检测模型是无监督的,并且不需要任何参数限定来从度量数据学习正常行为。另外,在一些情况下,从度量数据学习的行为基于知识球体,每个知识球体在一个或多个高密度区域中具有动态半径。
在一些实施方案中,本公开设想用于针对各种度量的基于时间序列的观察结果的特征选择过程或机制。该过程可包括考虑基于时间序列的度量数据的(视觉)表示、对数据中的异常值的敏感性以及数据的标准化(例如,确保数据集的维度能力)。鉴于那些考虑,根据本发明的技术选择和/或确定的特征的数量(例如,n)基于针对特定度量的当前值/观察结果和针对该度量的历史值/观察结果(例如,在前一小时或前一天内接收到的观察结果)。在一些实施方案中,本公开设想的n个特征可包括但不限于度量值、导数和移动平均数。
为了本公开的目的,下面提供的定义适用于随后对所定义的术语的讨论。
·隔离–将数据缩减(即,通过INS模型执行)为特定知识单元。执行此类缩减以达到知识极限。
·最近–INS模型依赖于最近邻居距离来确定数据点之间的接近度。使用与仅未被覆盖的行为相关联的数据来细化和/或改善那些距离。
·球体–知识单元在视觉上表示为数据点/观察结果的集群。每个知识单元由动态半径和中心来限定。
·行为–针对特定度量的特征的每个数量(例如,n)。
·覆盖范围–位于所有球体内部/被所有球体捕获的观察结果/数据点的百分比。
下面参考图3至图5提供对INS模型和以上限定的术语的进一步讨论。
现在参考图1,示出了可与本文描述的实施方案中的一者或多者结合使用的通信基础结构和/或联络中心系统的至少一个实施方案的简化框图。在例示性实施方案中,联络中心系统100体现为或以其他方式包括以下系统:该系统被配置为实现INS模型,以检测由一个或多个客户提供的数据中的异常。联络中心系统100可体现为能够向终端用户提供联络中心服务(例如,呼叫中心服务、聊天中心服务、SMS中心服务等)以及以其他方式执行本文所述的功能的任何系统。例示性联络中心系统100包括客户设备102、网络104、交换机/媒体网关106、呼叫控制器108、交互式媒体应答(IMR)服务器110、路由服务器112、存储设备114、统计服务器116、座席设备118A、118B、118C、媒体服务器120、知识管理服务器122、知识系统124、聊天服务器126、网络服务器128、交互(iXn)服务器130、通用联络服务器132、报告服务器134、媒体服务服务器136和分析模块138。尽管在图1的例示性实施方案中示出了仅一个客户设备102、一个网络104、一个交换机/媒体网关106、一个呼叫控制器108、一个IMR服务器110、一个路由服务器112、一个存储设备114、一个统计服务器116、一个媒体服务器120、一个知识管理服务器122、一个知识系统124、一个聊天服务器126、一个iXn服务器130、一个通用联络服务器132、一个报告服务器134、一个媒体服务服务器136和一个分析模块138,但是在其他实施方案中联络中心系统100可包括多个客户设备102、网络104、交换机/媒体网关106、呼叫控制器108、IMR服务器110、路由服务器112、存储设备114、统计服务器116、媒体服务器120、知识管理服务器122、知识系统124、聊天服务器126、iXn服务器130、通用联络服务器132、报告服务器134、媒体服务服务器136和/或分析模块138。此外,在一些实施方案中,本文所述的部件中的一者或多者可从系统100中被排除,被描述为独立的部件中的一者或多者可形成另一部件的一部分,和/或被描述为形成另一部件的一部分的部件中的一者或多者可以是独立的。
应当理解,术语“联络中心系统”在本文用来指图1所示的系统和/或其部件,而术语“联络中心”更一般地用来指联络中心系统、操作那些系统的客户服务提供方和/或与其相关联的组织或企业。因此,除非另有明确限制,否则术语“联络中心”一般是指联络中心系统(诸如联络中心系统100),相关联的客户服务提供方(诸如通过联络中心系统100提供客户服务的特定客户服务提供方)以及代表其提供那些客户服务的组织或企业。
就后台而言,客户服务提供商可以通过联络中心提供多种类型的服务。此类联络中心可配备员工或客户服务座席(或简称为“座席”),其中座席充当公司、企业、政府机构或组织(在下文可互换地称为“组织”或“企业”)与个人诸如用户、个体或客户(在下文可互换地称为“个体”或“客户”)之间的中介。例如,联络中心处的座席可协助客户做出购买决定、接收订单,或者解决已接收到的产品或服务的问题。在联络中心内,联络中心座席与外部实体或客户之间的此类交互可在各种通信渠道上进行,诸如例如经由语音(例如,电话呼叫或IP语音或VoIP呼叫)、视频(例如,视频会议)、文本(例如,电子邮件和文本聊天)、屏幕共享、共同浏览和/或其他通信渠道。
在操作上,联络中心一般努力为客户提供高质量的服务,同时使成本最小化。例如,联络中心操作的一种方式是处理每个客户与实时座席的交互。虽然这种方法在服务质量方面可能评分良好,但由于座席劳动力的成本高,它也可能也会非常昂贵。因此,大多数联络中心利用某种程度的自动化过程来代替实时座席,诸如例如交互式语音应答(IVR)系统、交互式媒体应答(IMR)系统、互联网机器人或“机器人”、自动聊天模块或“聊天机器人”和/或其他自动化过程。在许多情况下,这已被证明是一种成功的策略,因为自动化过程可非常高效地处理某些类型的交互,并有效地减少对实时座席的需求。此类自动化允许联络中心针对更困难的客户交互使用人工座席,而自动化过程处理更重复或例行的任务。此外,可以优化效率并促进可重复性的方式构建自动化过程。虽然人工座席或实时座席可能忘记询问某些问题或跟进特定细节,但通常可通过使用自动化过程来避免此类错误。虽然客户服务提供商越来越依赖于自动化过程来与客户进行交互,但客户对此类技术的使用仍然少得多。因此,虽然IVR系统、IMR系统和/或机器人用于在交互的联络中心侧自动执行部分交互,但客户侧的动作仍由客户手动执行。
应当理解,客户服务提供方可使用联络中心系统100向客户提供各种类型的服务。例如,联络中心系统100可用于参与和管理自动化过程(或机器人)或人工座席与客户通信的交互。应当理解,联络中心系统100可以为业务或企业的内部设施,用于相对于通过企业可用的产品和服务执行销售和客户服务的功能。在另一个实施方案中,联络中心系统100可由签约向另一个组织提供服务的第三方服务提供方操作。此外,联络中心系统100可被部署在专用于企业或第三方服务提供方的装备上,和/或部署在远程计算环境中,诸如例如具有用于为多个企业支持多个联络中心的基础结构的私有或公共云环境。联络中心系统100可包括软件应用程序或程序,其可在现场或在远程或以它们的某种组合执行。还应当理解,联络中心系统100的各种部件可分布在各种地理位置上,并且不一定包含在单个位置或计算环境中。
还应当理解,除非另有明确限制,否则本文描述的技术的计算元件中的任一个计算元件也可在基于云的或云计算环境中实现。如本文所用以及下文参考计算设备200进一步描述,“云计算”(或简称“云”)被限定为一种用于实现对可配置计算资源(例如,网络、服务器、存储装置、应用程序和服务)的共享池的无处不在、方便的按需网络访问的模型,该模型可经由虚拟化快速配置,并且以最少的管理工作或服务提供方交互发布,然后相应地扩展。云计算可由各种特征(例如,按需自助服务、广泛的网络访问、资源池、快速弹性、可计量的服务等)、服务模型(例如,软件即服务(“SaaS”)、平台即服务(“PaaS”)、基础结构即服务(“IaaS”)和部署模型(例如,私有云、社区云、公共云、混合云等)构成。云执行模型通常被称为“无服务器架构”,其通常包括动态地管理远程服务器的分配和配置以实现所需功能的服务提供商。
应当理解,相对于图1描述的计算机实现的部件、模块或服务器中的任一者都可经由一种或多种类型的计算设备(诸如例如图2的计算设备200)实现。如将所见的,联络中心系统100一般管理资源(例如,人员、计算机、电信装备等)以使得能够经由电话、电子邮件、聊天或其他通信机制递送服务。此类服务可取决于联络中心的类型而变化,并且例如可以包括客户服务、帮助台功能、紧急应答、远程营销、接订单和/或其他特性。
期望从联络中心系统100接收服务的客户可经由客户设备102发起到联络中心系统100的入站通信(例如,电话呼叫、电子邮件、聊天等)。虽然图1示出了一个此类客户设备(即,客户设备102),但是应当理解,可存在任何数量的客户设备102。客户设备102例如可以为通信设备,诸如电话、智能电话、计算机、平板电脑或膝上型电脑。根据本文所述的功能,客户一般可使用客户设备102来发起、管理和进行与联络中心系统100的通信,诸如电话呼叫、电子邮件、聊天、文本消息、网络浏览会话和其他多媒体事务处理。
来自和通向客户设备102的入站通信和出站通信可遍历网络104,其中网络的性质通常取决于所使用的客户设备的类型和通信的形式。例如,网络104可包括电话、蜂窝和/或数据服务的通信网络。网络104可以为专用或公共交换电话网络(PSTN)、局域网(LAN)、专用广域网(WAN)和/或公共WAN诸如互联网。此外,网络104可包括无线运营商网络,该无线运营商网络包括码分多址(CDMA)网络、全球移动通信系统(GSM)网络或本领域中常规的任何无线网络/技术,包括但不限于3G、4G、LTE、5G等。
交换机/媒体网关106可耦接到网络104,以用于在客户与联络中心系统100之间接收和传输电话呼叫。交换机/媒体网关106可包括电话交换机或通信交换机,该电话交换机或通信交换机被配置为用作用于中心内的座席级别路由的中心交换机。交换机可以是硬件交换系统或经由软件实现。例如,交换机106可包括自动呼叫分配器、专用交换分机(PBX)、基于IP的软件交换机和/或具有专用硬件和软件的任何其他交换机,该专用硬件和软件被配置为从客户接收互联网来源的交互和/或电话网络来源的交互,并且将那些交互路由到例如座席设备118中的一者。因此,一般来讲,交换机/媒体网关106通过在客户设备102与座席设备118之间建立连接来在客户与座席之间建立语音连接。
如进一步所示,交换机/媒体网关106可耦接到呼叫控制器108,该呼叫控制器例如用作交换机与联络中心系统100的其他路由、监视和通信处理部件之间的适配器或接口。呼叫控制器108可被配置为处理PSTN呼叫、VoIP呼叫和/或其他类型的呼叫。例如,呼叫控制器108可包括用于与交换机/媒体网关和其他部件接合的计算机电话集成(CTI)软件。呼叫控制器108可包括用于处理SIP呼叫的会话发起协议(SIP)服务器。呼叫控制器108还可提取关于传入交互的数据,诸如客户的电话号码、IP地址或电子邮件地址,然后在处理交互时将这些数据与其他联络中心部件进行通信。
交互式媒体应答(IMR)服务器110可被配置为启用自助或虚拟助理功能。具体地,IMR服务器110可类似于交互式语音应答(IVR)服务器,不同的是IMR服务器110不限于语音并且还可覆盖各种媒体渠道。在示出语音的示例中,IMR服务器110可被配置有IMR脚本以用于向客户询问其需求。例如,银行的联络中心可经由IMR脚本指示客户如果他们希望检索其账户余额,则“按下1”。通过与IMR服务器110继续交互,客户可接收服务而无需与座席说话。IMR服务器110还可被配置为查明客户为何联络联络中心,使得可将通信路由到适当的资源。IMR配置可通过使用自助和/或辅助服务工具来执行,该工具包括用于开发在联络中心环境中运行的IVR应用程序和路由应用程序的基于web的工具(例如,设计器)。
路由服务器112可用于路由传入交互。例如,一旦确定入站通信应该由人工座席处理,路由服务器112内的功能就可选择最适当的座席并向其路由通信。该座席选择可基于哪个可用座席最适合于处理通信。更具体地,适当座席的选择可基于由路由服务器112实现的路由策略或算法。这样做时,路由服务器112可查询与传入交互相关的数据,例如与特定客户、可用座席和交互类型相关的数据,如本文所述,这些数据可存储在特定数据库中。一旦选择了座席,路由服务器112就可与呼叫控制器108进行交互以将传入交互路由(即,连接)到对应的座席设备118。作为该连接的一部分,关于客户的信息可经由其座席设备118提供给所选择的座席。该信息旨在增强座席能够向客户提供的服务。
应当理解,联络中心系统100可包括一个或多个海量存储设备(通常由存储设备114表示),以用于将数据存储在与联络中心的功能相关的一个或多个数据库中。例如,存储设备114可存储保持在客户数据库中的客户数据。此类客户数据可以包括例如客户档案、联系人信息、服务级别协议(SLA)和交互历史(例如,与特定客户的先前交互的细节,包括先前交互的性质、处置数据、等待时间、处理时间和联络中心为解决客户问题而采取的行动)。又如,存储设备114可将座席数据存储在座席数据库中。由联络中心系统100保持的座席数据可包括例如座席可用性和座席档案、安排、技能、处理时间和/或其他相关数据。又如,存储设备114可将交互数据存储在交互数据库中。交互数据可以包括例如与客户和联络中心之间的许多过往交互相关的数据。更一般地,应当理解,除非另外指明,否则存储设备114可被配置为包括数据库和/或存储与本文所述的任何类型的信息相关的数据,其中这些数据库和/或数据能够以促进本文所述的功能的方式被联络中心系统100的其他模块或服务器访问。例如,联络中心系统100的服务器或模块可查询此类数据库以检索存储在其中的数据或向其中传输数据以供存储。例如,存储设备114可采取任何常规存储介质的形式,并且可本地容纳或从远程位置操作。例如,数据库可以是Cassandra数据库、NoSQL数据库或SQL数据库,并且由数据库管理系统(诸如Oracle、IBM DB2、Microsoft SQL服务器、MicrosoftAccess、PostgreSQL)管理。
统计服务器116可被配置为记录和聚合与联络中心系统100的性能和操作方面相关的数据。此类信息可由统计服务器116编译并且对其他服务器和模块诸如报告服务器134可用,然后该其他服务器和模块可使用该数据产生报告,该报告用于管理联络中心的操作方面并且根据本文所述的功能执行自动化动作。此类数据可涉及联络中心资源的状态,例如,平均等待时间、放弃率、座席占用率以及如本文描述的功能所需的其他数据。
联络中心系统100的座席设备118可以为通信设备,该通信设备被配置为以促进本文所述的功能的方式与联络中心系统100的各个部件和模块进行交互。例如,座席设备118可包括适用于常规电话呼叫或VoIP呼叫的电话。座席设备118还可包括计算设备,该计算设备被配置为根据本文所述的功能与联络中心系统100的服务器通信,执行与操作相关联的数据处理,并且经由语音、聊天、电子邮件和其他多媒体通信机制与客户进行交互。虽然图1示出了三个此类座席设备118(即,座席设备118A、118B和118C),但是应当理解,在特定实施方案中可存在任何数量的座席设备118。
多媒体/社交媒体服务器120可被配置为促进与客户设备102和/或服务器128的媒体交互(语音除外)。此类媒体交互可与例如电子邮件、语音邮件、聊天、视频、文本消息收发、网络、社交媒体、共同浏览等相关。多媒体/社交媒体服务器120可采用本领域中常规的具有用于接收、处理和转发多媒体事件和通信的专用硬件和软件的任何IP路由器的形式。
知识管理服务器122可被配置为促进客户与知识系统124之间的交互。一般来讲,知识系统124可以为能够接收问题或查询并作为响应提供回答的计算机系统。知识系统124可被包括作为联络中心系统100的一部分或由第三方远程操作。知识系统124可包括人工智能计算机系统,该人工智能计算机系统能够通过从诸如百科全书、词典、新闻专线文章、文学作品或作为参考材料提交给知识系统124的其他文档的信息源检索信息来回答以自然语言提出的问题。例如,知识系统124可体现为IBM Watson或类似系统。
聊天服务器126可被配置为进行、编排和管理与客户的电子聊天通信。一般来讲,聊天服务器126被配置为实现和保持聊天会话并生成聊天转录。此类聊天通信可由聊天服务器126以客户与自动化聊天机器人、人工座席或两者通信的方式进行。在示例性实施方案中,聊天服务器126可用作聊天编排服务器,该聊天编排服务器在聊天机器人和可用人工座席之间调度聊天会话。在此类情况下,聊天服务器126的处理逻辑可由规则驱动,以便利用可用聊天资源之间的智能工作负载分布。聊天服务器126还可实现、管理和促进与聊天特征相关联的用户界面(UI),包括在客户设备102或座席设备118处生成的那些UI。聊天服务器126可被配置为在自动化资源和人力资源之间在与特定客户的单个聊天会话内转移聊天,使得例如聊天会话从聊天机器人转移到人工座席或从人工座席转移到聊天机器人。聊天服务器126还可耦接到知识管理服务器122和知识系统124,以用于接收对客户在聊天期间提出的查询的建议和回答,使得例如可提供到相关文章的链接。
可包括网络服务器128以向客户订阅的各个社交交互站点(诸如Facebook、Twitter、Instagram等)提供站点主机。尽管被描绘为联络中心系统100的一部分,但是应当理解,网络服务器128可由第三方提供和/或远程维护。网络服务器128还可为正由联络中心系统100支持的企业或组织提供网页。例如,客户可浏览网页并接收关于特定企业的产品和服务的信息。在此类企业网页内,可提供用于例如经由网络聊天、语音或电子邮件发起与联络中心系统100的交互的机制。此类机制的示例是可部署在网络服务器128上托管的网页或网站上的桌面小程序。如本文所用,桌面小程序是指执行特定功能的用户界面部件。在一些具体实施中,桌面小程序可包括图形用户界面控件,该图形用户界面控件可覆盖在经由互联网向客户显示的网页上。桌面小程序可诸如在窗口或文本框中显示信息,或者包括允许客户访问某些功能诸如共享或打开文件或发起通信的按钮或其他控件。在一些具体实施中,桌面小程序包括用户界面部件,该用户界面部件具有代码的可移植部分,该可移植部分可在单独的网页内安装和执行而无需编译。一些桌面小程序可包括对应的或附加的用户界面,并且可被配置为经由网络(例如,即时消息、电子邮件或社交网络更新)访问多种本地资源(例如,客户设备上的日历或联系人信息)或远程资源。
交互(iXn)服务器130可被配置为管理联络中心的可延期活动及其到人工座席的路由以供完成。如本文所用,可延期活动可以包括可离线执行的后台工作,例如回复电子邮件、参加培训以及不需要与客户实时通信的其他活动。例如,交互(iXn)服务器130可被配置为与路由服务器112交互以用于选择适当座席来处理可延期活动中的每一者。一旦分配给特定座席,就将可延期活动推送到该座席,使得其出现在所选择座席的座席设备118上。可延期活动可作为所选择座席完成的任务出现在工作区中。工作区的功能可以通过任何常规数据结构来实施,诸如例如链表、阵列和/或其他合适的数据结构。座席设备118中的每一者可包括工作区。例如,工作区可保持在对应座席设备118的缓冲存储器中。
通用联络服务器(UCS)132可被配置为检索存储在客户数据库中的信息和/或向其传输信息以便存储在其中。例如,UCS 132可用作聊天特征的一部分以促进维护关于如何处理与特定客户的聊天的历史,然后可将其用作对应该如何处理未来聊天的参考。更一般地,UCS 132可被配置为促进维护客户偏好的历史,诸如优选媒体渠道和最佳联络时间。为此,UCS 132可被配置为识别与每个客户的交互历史相关的数据,诸如例如与来自座席的评论、客户通信历史等相关的数据。然后,可将这些数据类型中的每种数据类型存储在客户数据库中或存储在其他模块上,并根据本文描述的功能需要进行检索。
报告服务器134可被配置为从由统计服务器116或其他源编译和聚合的数据生成报告。此类报告可以包括近实时报告或历史报告,并且涉及联络中心资源的状态和性能特性,诸如例如平均等待时间、放弃率和/或座席占用率。报告可自动生成或响应于来自请求者(例如,座席、管理员、联络中心应用程序等)的特定请求而生成。然后,这些报告可用于根据本文描述的功能来管理联络中心操作。
媒体服务服务器136可被配置为提供音频和/或视频服务以支持联络中心特征。根据本文描述的功能,此类特征可以包括对IVR或IMR系统的提示(例如,音频文件的回放)、保持音乐、语音邮件/单方记录、多方记录(例如,音频和/或视频呼叫的多方记录)、语音识别、双音多频(DTMF)识别、传真、音频和视频转码、安全实时传输协议(SRTP)、音频会议、视频会议、教程(例如,支持教练收听客户与座席之间的交互以及支持教练在客户未听到评论的情况下向座席提供评论)、呼叫分析、关键字定位和/或其他相关特征。
分析模块138可被配置为提供用于对从多个不同数据源接收的数据执行分析的系统和方法,如本文所述的功能可能需要的。根据示例性实施方案,分析模块138还可基于收集的数据(诸如例如,客户数据、座席数据和交互数据)生成、更新、训练和修改预测器或模型。模型可以包括客户或座席的行为模型。行为模型可用于在各种情况下预测例如客户或座席的行为,从而允许本文所述的技术的实施方案基于此类预测来定制交互或分配资源以针对未来交互的预测特性进行准备,从而改善总体联络中心性能和客户体验。应当理解,虽然分析模块被描述为联络中心的一部分,但此类行为模型也可在客户系统上(或者,也如本文所用,在交互的“客户侧”上)实现并用于客户利益。
根据示例性实施方案,分析模块138可访问存储在存储设备114中的数据,包括客户数据库和座席数据库。分析模块138还可访问交互数据库,该交互数据库存储与交互相关的数据和交互内容(例如,其中检测到的交互和事件的转录)、交互元数据(例如,客户标识符、座席标识符、交互媒体、交互时长、交互开始和结束时间、部门、带标签的类别)以及应用程序设定(例如,通过联络中心的交互路径)。此外,分析模块138可被配置为检索存储在存储设备114内的数据,以用于例如通过应用机器学习技术开发和训练算法和模型。
所包括的模型中的一个或多个模型可被配置为预测客户或座席行为和/或与联络中心操作和性能相关的方面。此外,模型中的一个或多个模型可用于自然语言处理,并且例如包括意图识别等。可以基于以下内容来开发模型:描述系统的已知第一原理方程;产生经验模型的数据;或已知第一原理方程和数据的组合。在开发与本发明的实施方案一起使用的模型时,由于第一原理公式通常是不可用的或不容易导出的,因此通常可能优选的是基于收集和存储的数据来构建经验模型。为了正确地捕获复杂系统的操纵/干扰变量与受控变量之间的关系,在一些实施方案中,可能优选的是模型是非线性的。这是因为非线性模型可表示操纵/干扰变量与控制变量之间的曲线关系而不是直线关系,这对于复杂系统诸如本文所讨论的那些是常见的。鉴于前述要求,基于机器学习或神经网络的方法是用于实现模型的优选实施方案。例如,可使用高级回归算法基于经验数据来开发神经网络。
分析模块138还可包括优化器。应当理解,可使用优化器来使受制于一组约束的“成本函数”最小化,其中成本函数是期望目标或系统操作的数学表示。由于模型可以是非线性的,因此优化器可以是非线性编程优化器。然而,可以设想的是,本文描述的技术可通过单独地或组合地使用多种不同类型的优化方法来实现,包括但不限于线性编程、二次编程、混合整数非线性编程、随机编程、全局非线性编程、遗传算法、粒子/群技术等。
根据一些实施方案,模型和优化器可在优化系统内一起使用。例如,分析模块138可利用优化系统作为优化过程的一部分,通过该优化过程优化或至少增强联络中心性能和操作的方面。例如,这可以包括与客户体验、座席体验、交互路由、自然语言处理、意图识别相关的特征或与自动化过程相关的其他功能。
图1(以及本文包括的其他图)的各个部件、模块和/或服务器可各自包括一个或多个处理器,该一个或多个处理器执行计算机程序指令并且与其他系统部件交互以执行本文所述的各种功能。此类计算机程序指令可存储在使用标准存储设备(诸如例如随机存取存储器(RAM))实现的存储器中,或存储在其他非暂态计算机可读介质(诸如例如CD-ROM、闪存驱动器等)中。尽管每个服务器的功能被描述为由特定服务器提供,但本领域的技术人员应当认识到,在不脱离本文描述的技术的范围的情况下,各种服务器的功能可被组合或集成到单个服务器中,或者特定服务器的功能可分布在一个或多个其他服务器上。此外,术语“交互”和“通信”可互换使用,并且通常是指使用任何通信渠道的任何实时和非实时交互,包括但不限于电话呼叫(PSTN或VoIP呼叫)、电子邮件、语音邮件、视频、聊天、屏幕共享、文本消息、社交媒体消息、WebRTC呼叫等。通过可在客户设备102和/或座席设备118上生成的用户界面(UI)可影响对联络中心系统100的部件的访问和控制。如已经指出,联络中心系统100可作为混合系统操作,其中远程托管一些或所有部件,诸如在基于云的或云计算环境中。应当理解,联络中心系统100的设备中的每一者可体现为、包括或形成类似于下文参考图2描述的计算设备200的一个或多个计算设备的一部分。
现在参考图2,示出了计算设备200的至少一个实施方案的简化框图。在例示性实施方案中,计算设备200体现为或以其他方式包括以下设备:该设备被配置为实现INS模型以检测由一个或多个客户提供的数据中的异常。例示性计算设备200描绘了本文所述的计算设备、系统、服务器、控制器、交换机、网关、引擎、模块和/或计算部件(例如,为了描述的简洁性,它们可以可互换地统称为计算设备、服务器或模块)中的每一者的至少一个实施方案。例如,各种计算设备可以为在一个或多个计算设备200的一个或多个处理器上运行的过程或线程,该过程或线程可执行计算机程序指令并且与其他系统模块交互以便执行本文所述的各种功能。除非另有明确限制,否则关于多个计算设备描述的功能可集成到单个计算设备中,或者关于单个计算设备描述的各种功能可分布在若干计算设备上。此外,关于本文所述的计算系统(诸如图1的联络中心系统100),各种服务器及其计算机设备可位于本地计算设备200上(例如,在与联络中心的座席相同的物理位置处现场)、远程计算设备200上(例如,在场外或在基于云的或云计算环境中,例如,在经由网络连接的远程数据中心中)或它们的某种组合。在一些实施方案中,由位于现场外的计算设备上的服务器提供的功能可通过虚拟专用网络(VPN)来访问和提供,就像此类服务器在现场一样,或者可使用软件即服务(SaaS)(使用各种协议通过互联网来访问)来提供功能,诸如通过经由可扩展标记语言(XML)和JSON来交换数据,和/或该功能可以以其他方式被访问/利用。
在一些实施方案中,计算设备200可体现为服务器、台式计算机、膝上型计算机、平板计算机、笔记本、上网本、UltrabookTM、蜂窝电话、移动计算设备、智能手机、可穿戴计算设备、个人数字助理、物联网(IoT)设备、处理系统、无线接入点、路由器、网关和/或能够执行本文所述的功能的任何其他计算设备、处理设备和/或通信设备。
计算设备200包括根据操作逻辑208执行算法和/或处理数据的处理设备202、实现计算设备200与一个或多个外部设备210之间的通信的输入/输出设备204以及存储例如经由输入/输出设备204从外部设备210接收的数据的存储器206。
输入/输出设备204允许计算设备200与外部设备210进行通信。例如,输入/输出设备204可包括收发器、网络适配器、网卡、接口、一个或多个通信端口(例如,USB端口、串行端口、并行端口、模拟端口、数字端口、VGA、DVI、HDMI、火线、CAT 5或任何其他类型的通信端口或接口)和/或其他通信电路系统。取决于特定计算设备200,计算设备200的通信电路系统可被配置为使用任何一种或多种通信技术(例如,无线或有线通信)和相关联的协议(例如,以太网、WiMAX等)实现此类通信。输入/输出设备204可包括适用于执行本文所述的技术的硬件、软件和/或固件。
外部设备210可以为允许从计算设备200输入或输出数据的任何类型的设备。例如,在各种实施方案中,外部设备210可体现为本文所述的设备/系统中的一者或多者和/或它们的一部分。此外,在一些实施方案中,外部设备210可体现为另一计算设备、交换机、诊断工具、控制器、打印机、显示器、报警器、外围设备(例如,键盘、鼠标、触摸屏显示器等)和/或能够执行本文所述的功能的任何其他计算设备、处理设备和/或通信设备。此外,在一些实施方案中,应当理解,外部设备210可集成到计算设备200中。
处理设备202可体现为能够执行本文所述的功能的任何类型的处理器。具体地,处理设备202可体现为一个或多个单核或多核处理器、微控制器或其他处理器或处理/控制电路。例如,在一些实施方案中,处理设备202可包括或体现为算术逻辑单元(ALU)、中央处理单元(CPU)、数字信号处理器(DSP)、图形处理单元(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)和/或另一个合适处理器。处理设备202可以为可编程类型、专用硬连线状态机或它们的组合。在各种实施方案中,具有多个处理单元的处理设备202可利用分布式、流水线和/或并行处理。此外,处理设备202可专用于仅本文所述操作的执行,或可在一个或多个附加应用程序中被利用。在例示性实施方案中,处理设备202可编程并且根据操作逻辑208执行算法和/或处理数据,如由存储在存储器206中的编程指令(诸如软件或固件)限定的。附加地或另选地,用于处理设备202的操作逻辑208可至少部分地由硬连线逻辑部件或其他硬件限定。此外,处理设备202可包括适用于处理从输入/输出设备204或从其他部件或设备接收的信号以及提供期望的输出信号的任何类型的一个或多个部件。此类部件可以包括数字电路系统、模拟电路系统或它们的组合。
存储器206可以为一种或多种类型的非暂态计算机可读介质,诸如固态存储器、电磁存储器、光学存储器或它们的组合。此外,存储器206可以为易失性和/或非易失性,并且在一些实施方案中,存储器206中的一些或全部存储器可以为便携式类型,诸如盘、磁带、记忆棒、盒式磁带和/或其他合适的便携式存储器。在操作中,存储器206可存储在计算设备200的操作期间使用的各种数据和软件,诸如操作系统、应用程序、程序、库和驱动程序。应当理解,除了或代替存储限定操作逻辑208的编程指令,存储器206可存储由处理设备202的操作逻辑208操纵的数据,诸如例如表示从输入/输出设备204接收和/或发送到该输入/输出设备的信号的数据。如图2所示,取决于特定实施方案,存储器206可与处理设备202一起被包括和/或耦接到处理设备202。例如,在一些实施方案中,处理设备202、存储器206和/或计算设备200的其他部件可形成片上系统(SoC)中的一部分并且并入单个集成电路芯片上。
在一些实施方案中,计算设备200的各个部件(例如,处理设备202和存储器206)可经由输入/输出子系统通信地耦接,该输入/输出子系统可体现为电路系统和/或部件以促进与计算设备200的处理设备202、存储器206和其他部件的输入/输出操作。例如,输入/输出子系统可以体现为或以其他方式包括存储器控制器集线器、输入/输出控制集线器、固件设备、通信链路(即,点对点链路、总线链路、电线、电缆、光导、印刷电路板迹线等)和/或其他部件和子系统,以促进输入/输出操作。
在其他实施方案中,计算设备200可包括其他或附加部件,诸如在典型的计算设备中常见的那些部件(例如,各种输入/输出设备和/或其他部件)。还应当理解,本文所述的计算设备200的部件中的一者或多者可跨多个计算设备分布。换句话讲,本文描述的技术可以由包括一个或多个计算设备的计算系统采用。另外,尽管在图2中例示性地示出了仅单个处理设备202、I/O设备204和存储器206,但是应当理解,在其他实施方案中,特定计算设备200可包括多个处理设备202、I/O设备204和/或存储器206。此外,在一些实施方案中,多于一个外部设备210可与计算设备200通信。
计算设备200可以为通过网络连接或经由网络连接到其他系统/资源的多个设备中的一个设备。网络可以体现为能够促进经由网络通信地连接的各种设备之间的通信的任何一种或多种类型的通信网络。因此,网络可以包括一个或多个网络、路由器、交换机、接入点、集线器、计算机、客户端设备、终端、节点和/或其他中间网络设备。例如,网络可以体现为或以其他方式包括一个或多个蜂窝网络、电话网络、局域网或广域网、公共可用的全局网络(例如,互联网)、自组织网络、短程通信链路或它们的组合。在一些实施方案中,网络可以包括电路交换语音或数据网络、分组交换语音或数据网络和/或能够承载语音和/或数据的任何其他网络。具体地,在一些实施方案中,网络可以包括基于互联网协议(IP)和/或基于异步传输模式(ATM)的网络。在一些实施方案中,网络可处理语音流量(例如,经由IP语音(VOIP)网络)、web流量和/或取决于彼此通信的系统的特定实施方案和/或设备的其他网络流量。在各种实施方案中,网络可以包括模拟或数字有线和无线网络(例如,IEEE 802.11网络、公共交换电话网络(PSTN)、集成服务数字网络(ISDN)和数字订户线路(xDSL))、第三代(3G)移动电信网络、第四代(4G)移动电信网络、第五代(5G)移动电信网络、有线以太网网络、专用网络(例如诸如内联网)、无线电、电视、电缆、卫星和/或用于承载数据的任何其他递送或隧道机制,或此类网络的任何适当组合。应当理解,各种设备/系统可取决于源和/或目的地设备经由不同网络彼此通信。
应当理解,计算设备200可经由任何类型的网关或隧道协议(诸如安全套接层或传输层安全)与其他计算设备200通信。网络接口可包括内置网络适配器(诸如网络接口卡),其适于将计算设备接合到能够执行本文所述的操作的任何类型的网络。此外,网络环境可以是虚拟网络环境,其中各种网络部件被虚拟化。例如,各种机器可以是被实现为在物理机器上运行的基于软件的计算机的虚拟机。虚拟机可共享相同的操作系统,或者在其他实施方案中,可在每个虚拟机实例上运行不同的操作系统。例如,使用了“虚拟机管理程序”类型的虚拟化,其中多个虚拟机在相同主机物理机器上运行,每个虚拟机的作用就好像其具有自身的专用盒一样。在其他实施方案中,可以采用其他类型的虚拟化,诸如例如网络(例如,经由软件定义联网)或功能(例如,经由网络功能虚拟化)。
因此,本文所述的计算设备200中的一者或多者可体现为或者形成一个或多个基于云的系统的一部分。在基于云的实施方案中,基于云的系统可以体现为服务器模糊的计算解决方案,该服务器模糊计算解决方案例如按需执行多个指令,包含仅在由特定活动/触发事件提示时执行指令的逻辑,并且在不使用时不消耗计算资源。也就是说,系统可以体现为驻留在计算系统“上”的虚拟计算环境(例如,设备的分布式网络),其中各种虚拟函数(例如,λ函数、Azure函数、Google cloud函数和/或其他合适的虚拟函数)可对应于本文描述的系统的函数来执行。例如,当发生事件时(例如,数据被传输到系统以用于处理),可与虚拟计算环境通信(例如,经由对虚拟计算环境的API的请求),由此API可基于规则集合将请求路由到正确虚拟函数(例如,特定的服务器模糊的计算资源)。因此,当用户进行对数据传输的请求(例如,经由到系统的适当用户界面)时,可执行适当的虚拟函数以在消除虚拟函数的实例之前执行动作。
现在参考图3,在使用中,系统或设备可执行检测由一个或多个客户提供的数据中的异常的方法300。应当理解,在一些实施方案中,系统可体现为联络中心系统(例如,图1的联络中心系统100)和/或计算设备(例如,图2的计算设备200)或其系统/设备。此外,在一些实施方案中,系统可体现为或以其他方式包括成套工具以辅助各种平台的操作监视、管理和故障诊断。在一个示例中,系统可体现为或以其他方式包括由Genesys Workbench(WB)9.2提供的成套工具或其任何后续版本。具体地,系统可并入例如Workbench AnomalyDetection(AD)特征的各种特征。最后,应当理解,除非另有说明,否则方法300的特定框以举例的方式示出,并且此类框可根据特定实施方案全部或部分地组合或划分、添加或移除和/或重排序。
例示性方法300开始于框312,其中系统接收度量数据。在一些实施方案中,可从系统外部和/或远离系统的源提供度量数据,并且系统可通信地耦接到源以从源接收度量数据。在任何情况下,在例示性实施方案中,度量数据指示针对特定客户度量的基于时间序列的观察,并且对度量的选择和/或指定可基于特定客户的独特需求和/或针对特定客户的独特需求定制。在框312中通过系统对度量数据的接收可包括从源(例如,CPU、RAM、盘、网络)摄取度量数据或以其他方式与之相关联。
在例示性方法300的框314中,系统基于度量数据来限定用于表征一个或多个球体的参数。下文参考图4(即,在框414中)描述关于那些参数的限定的进一步细节。如从前面的讨论中可以明显看出的,该一个或多个球体中的每一者被配置为从针对特定客户度量的度量数据捕获若干基于时间序列的观察结果,使得观察结果位于球体内部。
在例示性方法300的框316中,系统基于在框314中限定的参数来生成一个或多个球体。下面参考图5来描述关于球体的生成的进一步细节。在例示性实施方案中,为了执行框316,系统执行框318和框320。在框318中,系统确定该一个或多个球体内的度量数据的覆盖范围。在框320中,系统动态地生成具有以下半径的多个球体:该半径基于来自针对特定客户度量的度量数据的基于时间序列的观察结果而变化。在一些实施方案中,框318和框320可组合成单个框。在一个示例中,在框318中对覆盖范围的确定可与在框320中的球体的动态生成组合。
在例示性方法300的框322中,系统保存模型参数(例如,与在框316中的球体生成相关联的参数)。在一些实施方案中,框322的执行可表示INS模型的完整创建或以其他方式与之相关联。
在例示性方法300的框324中,系统基于在框316中生成的球体和/或在框322中保存的模型参数来检测度量数据中的一个或多个异常。在一些实施方案中,框324的执行可表示在创建INS模型之后执行的异常检测活动或以其他方式与之相关联。
尽管以相对串行的方式描述了框312至框324,但是应当理解,在一些实施方案中,方法300的各个框可并行执行。
现在参考图4,在使用中,系统或设备可执行检测由一个或多个客户提供的数据中的异常的方法400。方法400可类似于方法300,并且方法400的一些框可提供关于方法300的对应框的进一步细节,如上文所建议的。应当理解,在一些实施方案中,系统可体现为联络中心系统(例如,图1的联络中心系统100)和/或计算设备(例如,图2的计算设备200)或其系统/设备。最后,应当理解,除非另有说明,否则方法400的特定框以举例的方式示出,并且此类框可根据特定实施方案全部或部分地组合或划分、添加或移除和/或重排序。
例示性方法400开始于框402,其中系统接收度量数据。应当理解,至少在一些实施方案中,框402对应于方法300的框302。在例示性实施方案中,为了执行框402,系统执行框404。在框404中,系统从源(例如,客户平台)检索或摄取度量数据。然而,在一些实施方案中,应当理解,可省略框404。
在例示性方法400的框406中,系统初始化异常检测模型(INS模型)。在一些实施方案中,框406可体现为或以其他方式包括到INS模型的输入框,其中在框402中接收到的度量数据被馈送到INS模型中。另外,在一些实施方案中,框406可并入到框402中。
在例示性方法400的框408中,系统标准化INS模型的一个或多个特征。为此,在例示性实施方案中,系统执行框410和框412。在框410中,系统识别在框402中接收到的度量数据的一个或多个感兴趣的特征。至少在一些实施方案中,那些特征可包括用于分析度量数据(例如,统计值、导数、加权平均数等)、用于确定度量数据的特定分布和/或用于识别包含度量数据的一个或多个异常值的数学参数。在框412中,系统基于一个或多个参考系来归一化在框410中识别的特征。在一些实施方案中,在框412中,系统建立一个或多个参考系以用于评估在框410中识别的特征。
在例示性方法400的框414中,系统基于度量数据来限定用于表征一个或多个球体的参数。应当理解,至少在一些实施方案中,框414对应于方法300的框304。此外,应当理解,在至少一些实施方案中,通过系统对框414的执行用作随后生成一个或多个球体的预备活动在例示性实施方案中,为了执行框414,系统执行框416、框418、框424、框426、框428、框430、框432。下面讨论这些框中的每一者。
在例示性方法400的框416中,系统获得或开发在框402中接收到的度量数据的距离矩阵。在一些实施方案中,框416可并入到框410中。在任何情况下,在框416中获得的距离矩阵允许系统确定包含在度量数据中的观察结果/数据点之间的距离。
在例示性方法400的框418中,基于在框416中获得的距离矩阵,系统确定度量数据中的每个观察结果/数据点的最近邻距离值。在例示性实施方案中,为了执行框418,系统执行框420和框422。在框420中,系统确定度量数据中的所有观察结果/数据点的最近邻距离的平均数。在框422中,系统根据Tukey测试来确定最近邻距离值的最大极限。在一些实施方案中,系统可彼此并行地执行框420和框422。
在例示性方法400的框424中,系统限定用于生成一个或多个球体的半径增量。如从下面的讨论中可以明显看出的,至少在一些实施方案中,结合下面讨论的最小球体半径,半径增量可用于在生成第一/初始球体之后生成一个或多个新球体。此外,至少部分地由于在执行方法400的过程中半径增量和最小球体半径的变化,利用半径增量生成的该一个或多个新球体可具有变化的半径。在一些实施方案中,在框424中对半径增量的限定基于在框420中通过系统确定的平均数。
在例示性方法400的框426中,系统限定用于生成至少一个球体的最小球体半径。至少在一些实施方案中,最小球体半径可用于生成第一/初始球体。在一些实施方案中,在框426中对最小球体半径的限定基于在框422中通过系统确定的最大极限。另外,在一些实施方案中,系统可彼此并行地执行框424和框426。
在例示性方法400的框428中,系统确定用于生成至少一个球体的密度。在一些实施方案中,密度对应于或以其他方式体现为将落入第一/初始球体内并被该第一/初始球体捕获的度量数据的观察结果/数据点的数量。至少在一些实施方案中,球体的密度可通过特定区域中的观察结果/数据点的浓度来确定或体现为该浓度。另外,在一些实施方案中,在框428中对球体密度的确定基于在框416中通过系统获得的距离矩阵以及在框426中通过系统限定的最小球体半径。
在例示性方法400的框430中,系统将密度过滤器应用于在框428中做出的球体密度确定。在一些实施方案中,在框430中通过系统应用的密度过滤器从度量数据过滤掉异常值或异常/不正常观察结果,使得异常值或异常观察结果不影响下文描述的对覆盖范围极限的限定。
在例示性方法400的框432中,系统限定覆盖范围极限,该覆盖范围极限指示待由球体覆盖的观察结果/数据点的最大数量。在例示性实施方案中,在框432中通过系统限定的覆盖范围极限至少部分地基于来自框430的经过滤的度量数据。
在例示性方法400的框434中,系统基于在框414中限定的参数来生成一个或多个球体。应当理解,至少在一些实施方案中,框434对应于方法300的框306。
尽管以相对串行的方式描述了框402至框434,但是应当理解,在一些实施方案中,方法400的各个框可并行执行。
现在参考图5,在使用中,为了执行方法400的框434,系统或设备可执行方法500。至少在一些实施方案中,方法500可类似于方法300的框306。应当理解,在一些实施方案中,系统可体现为联络中心系统(例如,图1的联络中心系统100)和/或计算设备(例如,图2的计算设备200)或其系统/设备。最后,应当理解,除非另有说明,否则方法500的特定框以举例的方式示出,并且此类框可根据特定实施方案全部或部分地组合或划分、添加或移除和/或重排序。
例示性方法500开始于框502,其中系统检测已经生成的一个或多个球体。应当理解,在一些情况下(例如,在生成第一/初始球体期间),在框502中可能未检测到球体。因此,在那些情况下,框502可任选地从该方法中省略。
在例示性方法500的框504中,系统确定用于生成至少一个球体的密度。在一些实施方案中,密度对应于或以其他方式体现为将落入第一/初始球体内并被该第一/初始球体捕获的度量数据的观察结果/数据点的数量。在其他实施方案中,密度对应于或以其他方式体现为落入第一/初始球体和最接近第一/初始球体的一个或多个球体内部并被其捕获的度量数据的观察结果/数据点的数量。在例示性实施方案中,为了执行框504,系统执行框506、框508、框510和框512。
在例示性方法500的框506中,系统基于在方法400的框426中限定的最小球体半径来确定密度。在例示性方法500的框508中,系统基于最接近的检测到的球体(例如,在框502中检测到的球体)来确定密度。应当理解,在一些情况下(例如,在生成第一/初始球体期间),可能未检测到最接近的球体,并且系统可不执行框508。此外,应当理解,在其他情况下(例如,当在生成第一/初始球体之后已生成一个或多个最接近的球体时),在框504中对密度的确定可基于在方法400的框426中限定的最小球体半径以及最接近的检测到的球体(例如,来自框502)两者。因此,在那些情况下,框506和框508可组合成单个框。
在例示性方法500的框510中,系统至少部分地基于在框426中限定的最小球体半径来确定对应于度量数据的最高集中的位置。在一些情况下,在框510中通过系统确定的位置还可基于最接近的检测到的球体。在框512中,系统生成至少一个球体,使得球体的中心定位在在框510中确定的位置处。至少在一些情况下,在框512中通过系统生成的至少一个球体可对应于第一/初始球体。在其他情况下,在框512中通过系统生成的该至少一个球体可对应于在第一/初始球体之后生成的球体。在那些情况下,系统可:(i)基于在框426中限定的最小球体半径以及第一/初始球体与至少一个最近邻球体之间的距离来确定(即,在框510中)对应于度量数据的最高集中的另一位置,以及(ii)生成(即,在框512中)至少一个新球体,使得该至少一个新球体的中心定位在该另一位置处。
在例示性方法500的框514中,系统将由新的或最新生成的球体提供的度量数据的覆盖范围与由一个或多个参考球体提供的度量数据的覆盖范围进行比较。在一个示例中,参考球体包括第一/初始球体。又如,参考球体包括第一/初始球体以及在第一球体之后生成的至少一个最近邻球体。当然,至少在一些实施方案中,如果在框512中通过系统生成的球体对应于第一/初始球体,则可以省略框514的执行。
在例示性方法500的框516中,系统选择提供用于生成另一新球体的度量数据的最大覆盖范围的(即,在框514中进行比较的球体中的)无论哪个球体。应当理解,至少在一些实施方案中,如果在框512中通过系统生成的球体对应于第一/初始球体,则可以省略框516的执行。
在例示性方法500的框518中,系统确定是否已达到在方法400的框432中限定的覆盖范围极限。
在例示性方法500的框520中,响应于在框518中确定已达到覆盖范围极限,系统保存异常检测模型(即,INS模型)。
在例示性方法500的框522中,系统基于度量数据结束模型的训练。
在例示性方法500的框524中,响应于在框518中确定尚未达到覆盖范围极限,系统基于方法400的框424中限定的半径增量来递增用于生成至少一个新球体的半径。
在例示性方法500的框526中,系统确定该至少一个新球体(对于其而言在框524中半径递增)是否提供先前未提供的度量数据的覆盖范围。
在例示性方法500的框528中,响应于在框526中确定该至少一个新球体提供先前未提供的度量数据的覆盖范围,系统更新最小球体半径(例如,在方法400的框426中限定的最小球体半径)以及对应于用于生成下一球体的中心的位置(例如,上文参考框512所讨论的位置)。
在例示性方法500的框530中,响应于在框526中确定该至少一个新球体不提供先前未提供的度量数据的覆盖范围,系统过滤掉与该至少一个新球体相关联的度量数据。
尽管以相对串行的方式描述了框502至框530,但是应当理解,在一些实施方案中,方法500的各个框可并行执行。
多个独特的特征和/或优点可与通过系统对例示性INS模型的执行和实现相关联。在一个方面,因为可不考虑特定客户度量而训练模型,所以模型提供跨广泛范围的各种度量的自动参数调谐。另一方面,至少在一些情况下,由于模型不依赖于针对特定客户度量生成的预先确定数量的球体,因此可根据模型的每次迭代来生成球体,这可提供较大准确度和/或精度。在另一方面,由于通过模型生成的球体的位置基于高密度/浓度区域来确定,所以模型避免了与根据随机概率分布来定位球体相关联的缺陷。在另一方面,通过过滤/移除已经被先前迭代覆盖的度量数据点,与其他配置相比降低了模型的计算复杂性。在另一方面,在每次模型迭代期间执行的动态半径计算以及基于那些计算生成的具有变化的半径的球体允许具有比其他配置可能原本需要的球体更少的球体的增强的数据覆盖范围。在另一方面,模型可使用现有球体外部的数据点来生成新球体、将球体彼此集成和/或捕获模型突变,而不需要针对特定客户度量的历史数据。在附加方面,因为模型忽略被先前迭代覆盖的数据点,所以模型可实现其他配置无法实现的准确度和/或精度。此外,应当理解,模型的降低的计算复杂性可最小化保存模型数据所需的存储空间(例如,在存储器中)。最后,模型可为基于到最近邻球体的距离计算异常评分提供具有改善的简单性。
现在参考图6,示出了在特征选择之后并且在基于INS模型的数据分析和球体生成之前的度量数据点/观察结果的集合600。在例示性实施方案中,图6所示的度量数据点的表示与遵循模型特征的归一化的表示(例如,遵循通过系统进行的对框408的执行的表示)相关联或以其他方式与之对应。另外,在例示性示例中,数据点的集合600包括在历经一天收集的约288个点。当然,应当理解,在其他示例中,集合600可包括历经另一合适时间段收集的另一合适数量的数据点。
现在参考图7,基于数据点/观察结果的集合600,通过系统进行的对INS模型的至少一次迭代(例如,根据方法300、400、500)生成具有中心702和半径704的球体700。在例示性示例中,中心702位于具有最小球体半径的球体700内部的数据点的最高集中/密度处。此外,在例示性示例中,球体700提供集合600中的数据点的约25%的覆盖范围。在一些实施方案中,较大球体可指示涉及多个单一行为的主要行为。
现在参考图8,基于数据点/观察结果的集合600,通过系统进行的对INS模型的多次迭代(例如,根据方法300、400、500)生成具有中心802和半径804的另一球体800。在例示性示例中,半径804不同于并且小于半径704,并且球体700、800彼此间隔开。另外,在例示性示例中,中心802位于球800内部的数据点的最高集中/密度处。最后,在例示性示例中,球体700、800协同地提供集合600中的数据点的约47%的覆盖范围。
现在参考图9,基于数据点/观察结果的集合600,通过系统进行的对INS模型的多次迭代(例如,根据方法300、400、500)生成具有中心902和半径904的另一球体900。在例示性示例中,半径904不同于并且大于半径804,并且球体700、800、900彼此间隔开。另外,在例示性示例中,中心902位于球体900内部的数据点的最高集中/密度处。最后,在例示性示例中,球体700、800、900协同地提供集合600中的数据点的约72%的覆盖范围。
现在参考图10,基于数据点/观察结果的集合600,不同于INS模型的比较模型的执行(例如,根据不同于例示性方法300、400、500的方法)生成各自具有相同半径的球体的集1000。在比较例中,集1000包括21个球体。
现在参考图11,基于数据点/观察结果的集合600,通过系统进行的对INS模型的多次迭代(例如,根据方法300、400、500)生成具有变化的半径的球体的集1100。在例示性示例中,集1100包括7个球体(即,球体700、800、900、1102、1104、1106、1108)。在至少一些情况下,使用更少的球体,集1100提供等于或优于集1000的集合600的覆盖范围。
现在参考图12,性能评估1200示出了与基于各种数据集的其他算法相比的INS模型的性能。所表示的模型/算法包括:(i)一类SVM 1202,(ii)隔离森林(iForest)1204,(iii)局部异常值因子1206,(iv)隔离最近邻系综(iNNE)1208,(v)具有恒定球体半径的隔离最近邻球体(INSS)1210,以及(vi)具有可变球体半径的隔离最近邻球体1212(对应于INS模型)。数据集包括具有引入的异常的数据集1216、1218、1220、1222、1224、1226、1228、1230。评估1200示出了关于二维数据集的不同异常检测模型/算法的特性。至少在一些实施方案中,数据集可包含一个或两个模式(高密度区域)以示出模型/算法应对多峰数据的能力。
至少在一些实施方案中,对于每个数据集1216、1218、1220、1222、1224、1226、1228、1230,百分之一的样本可生成为随机噪声并且被认为是异常值。那些数据集中的数据点可通过以下来指定:(a)圆圈(即,对应于被检测为正常的正常样本),(b)起点(即,对应于被检测为异常值的异常值),(c)向上的三角形(即,对应于被检测为正常样本的异常值),以及(d)向下的三角形(即,对应于被检测为异常值的正常样本)。
现在参考图13,基于数据点/观察结果的集合1300,不同于INS模型(iNNE)的比较模型的执行(例如,根据不同于例示性方法300、400、500的方法)生成球体的集1302。在比较例中,集1302可包括320个球体。另外,在比较例中,球体的集1302可与59.3%的F1评分相关联。
现在参考图14,基于数据点/观察结果的集合1300,通过系统进行的对INS模型的多次迭代(例如,根据方法300、400、500)生成球体的集1400。在例示性示例中,集1400可包括99个球体。另外,在例示性示例中,球体的集1400可与92.0%的F1评分相关联。
现在参考图15,基于数据点/观察结果的集合1500,不同于INS模型(iNNE)的比较模型的执行(例如,根据不同于例示性方法300、400、500的方法)生成球体的集1502。在比较例中,集1502可包括320个球体。另外,在比较例中,球体的集1502可与78.9%的F1评分相关联。
现在参考图16,基于数据点/观察结果的集合1500,通过系统进行的对INS模型的多次迭代(例如,根据方法300、400、500)生成球体的集1600。在例示性示例中,集1600可包括83个球体。另外,在例示性示例中,球体的集1600可与95.5%的F1评分相关联。
现在参考图17和图18,一组比较曲线图1700与不同于INS模型的比较模型的执行相关联,并且一组曲线图1800与INS模型的执行相关联。
在一些实施方案中,一种用于自动地检测被连续监视的部件中的异常的方法可包括
-当部件操作时,连续地监视来自性能计数器的数据点,包括通过计算设备的处理器接收包括在由部件生成的时间序列中的数据点,其中数据点为性能计数器的数据点,并且其中数据点在被处理之前未被标记为正常或异常;
-不存在限定异常数据的被标记数据时以及不存在限定正常数据的被标记数据时检测时间序列内的异常;
-对产生的异常事件进行后处理,以通过将针对多个处理路径中的单个数据点产生的异常事件组合成单个事件来聚合异常事件,该单个事件携载在其中检测到该单个事件的处理路径的所有标识,其中每个处理路径标识对应于相应的异常类型;以及
-提供关于部件是正确工作还是发生故障的信息,使得在部件的异常行为发生时能够向部件的所有者或操作者通知该部件的异常行为;
-其中检测时间序列内的异常包括:根据隔离最近球体算法来检测一个样本的异常的评分与其近邻的评分。
Claims (20)
1.一种用于检测由一个或多个客户提供的度量数据中的异常的系统,所述系统包括:
至少一个处理器;和
至少一个存储器,所述至少一个存储器包括存储在其上的多个指令,所述多个指令响应于由所述至少一个处理器执行,致使所述系统:
接收指示针对特定客户度量的多个基于时间序列的观察结果的度量数据;
基于所述度量数据来限定用于表征一个或多个球体的多个参数,每个球体被配置为捕获针对所述特定客户度量的若干基于时间序列的观察结果;以及
基于所述多个参数来生成所述一个或多个球体,以确定在所述一个或多个球体内的所述度量数据的覆盖范围并检测所述度量数据中的一个或多个异常,
其中基于所述多个参数来生成所述一个或多个球体包括动态地生成多个球体,每个球体具有基于针对所述特定客户度量的所述多个基于时间序列的观察结果而变化的半径。
2.根据权利要求1所述的系统,其中基于所述度量数据来限定所述多个参数包括:
限定用于生成至少一个球体的最小半径;
限定用于生成一个或多个新球体的半径增量,每个新球体具有变化的半径;以及
限定覆盖范围极限,所述覆盖范围极限指示待由所生成的球体覆盖的度量数据点的最大数量。
3.根据权利要求2所述的系统,其中基于所述多个参数来生成所述一个或多个球体包括:基于所述最小半径来确定对应于度量数据的最高集中的位置。
4.根据权利要求3所述的系统,其中基于所述多个参数来生成所述一个或多个球体包括:
确定是否已达到所述覆盖范围极限;以及
响应于确定尚未达到所述覆盖范围极限,基于所述半径增量来递增用于生成至少一个新球体的半径。
5.根据权利要求4所述的系统,其中基于所述多个参数来生成所述一个或多个球体包括:
确定所述至少一个新球体是否提供先前未提供的所述度量数据的覆盖范围;以及
响应于确定所述至少一个新球体不提供先前未提供的所述度量数据的覆盖范围,过滤掉已经被先前的球体覆盖的度量数据。
6.根据权利要求4所述的系统,其中基于所述多个参数来生成所述一个或多个球体包括:
响应于确定所述至少一个新球体提供先前未提供的所述度量数据的覆盖范围,更新所述最小半径;以及
响应于确定所述至少一个新球体提供先前未提供的所述度量数据的覆盖范围,更新所述位置。
7.根据权利要求3所述的系统,其中基于所述多个参数来生成所述一个或多个球体包括:
基于所述至少一个球体的所述最小半径以及所述至少一个球体与至少一个最近邻球体之间的距离来确定对应于所述度量数据的最高集中的另一位置;以及
生成至少一个新球体,使得所述至少一个新球体的中心定位在所述另一位置处。
8.根据权利要求7所述的系统,其中基于所述多个参数来生成所述一个或多个球体包括:
将由所述至少一个球体提供的所述度量数据的覆盖范围与由所述至少一个最近邻球体或所述至少一个新球体提供的所述度量数据的覆盖范围进行比较;以及
基于所述比较来选择提供所述度量数据的最大覆盖范围的无论哪个球体,以生成另一新球体。
9.根据权利要求2所述的系统,其中基于所述度量数据来限定所述多个参数包括:
从所述度量数据过滤掉异常值;以及
至少部分地基于经过滤的度量数据来限定所述覆盖范围极限。
10.一种或多种非暂态机器可读存储介质,所述一种或多种非暂态机器可读存储介质包括存储在其上的多个指令,所述多个指令响应于由至少一个处理器执行,致使系统:
接收指示针对特定客户度量的多个基于时间序列的观察结果的度量数据;
基于所述度量数据来限定用于表征一个或多个球体的多个参数,每个球体被配置为捕获针对所述特定客户度量的若干基于时间序列的观察结果;以及
基于所述多个参数来生成所述一个或多个球体,以确定在所述一个或多个球体内的所述度量数据的覆盖范围并检测所述度量数据中的一个或多个异常,
其中基于所述多个参数来生成所述一个或多个球体包括动态地生成多个球体,每个球体具有基于针对所述特定客户度量的所述多个基于时间序列的观察结果而变化的半径。
11.根据权利要求10所述的一种或多种非暂态机器可读存储介质,其中基于所述度量数据来限定所述多个参数包括:
限定用于生成至少一个球体的最小半径;
限定用于生成一个或多个新球体的半径增量,每个新球体具有变化的半径;以及
限定覆盖范围极限,所述覆盖范围极限指示待由所生成的球体覆盖的度量数据点的最大数量。
12.根据权利要求11所述的一种或多种非暂态机器可读存储介质,其中基于所述多个参数来生成所述一个或多个球体包括:基于所述最小半径来确定对应于度量数据的最高集中的位置。
13.根据权利要求12所述的一种或多种非暂态机器可读存储介质,其中基于所述多个参数来生成所述一个或多个球体包括:
确定是否已达到所述覆盖范围极限;以及
响应于确定尚未达到所述覆盖范围极限,基于所述半径增量来递增用于生成至少一个新球体的半径。
14.根据权利要求13所述的一种或多种非暂态机器可读存储介质,其中基于所述多个参数来生成所述一个或多个球体包括:
确定所述至少一个新球体是否提供先前未提供的所述度量数据的覆盖范围;以及
响应于确定所述至少一个新球体不提供先前未提供的所述度量数据的覆盖范围,过滤掉已经被先前的球体覆盖的度量数据。
15.根据权利要求13所述的一种或多种非暂态机器可读存储介质,其中基于所述多个参数来生成所述一个或多个球体包括:
响应于确定所述至少一个新球体提供先前未提供的所述度量数据的覆盖范围,更新所述最小半径;以及
响应于确定所述至少一个新球体提供先前未提供的所述度量数据的覆盖范围,更新所述位置。
16.根据权利要求11所述的一种或多种非暂态机器可读存储介质,其中基于所述度量数据来限定所述多个参数包括:
从所述度量数据过滤掉异常值;以及
至少部分地基于经过滤的度量数据来限定所述覆盖范围极限。
17.一种检测由一个或多个客户提供的度量数据中的异常的方法,所述方法包括:
通过联络中心系统或计算设备来接收指示针对特定客户度量的多个基于时间序列的观察结果的度量数据;
通过所述联络中心系统或所述计算设备基于所述度量数据来限定用于表征一个或多个球体的多个参数,每个球体被配置为捕获针对所述特定客户度量的若干基于时间序列的观察结果;以及
通过所述联络中心系统或所述计算设备基于所述多个参数来生成所述一个或多个球体,以确定在所述一个或多个球体内的所述度量数据的覆盖范围并检测所述度量数据中的一个或多个异常,
其中基于所述多个参数来生成所述一个或多个球体包括通过所述联络中心系统或所述计算设备来动态地生成多个球体,每个球体具有基于针对所述特定客户度量的所述多个基于时间序列的观察结果而变化的半径。
18.根据权利要求17所述的方法,其中基于所述度量数据来限定所述多个参数包括:
通过所述联络中心系统或所述计算设备来限定用于生成至少一个球体的最小半径;
通过所述联络中心系统或所述计算设备来限定用于生成具有变化的半径的一个或多个新球体的半径增量;以及
通过所述联络中心系统或所述计算设备来限定覆盖范围极限,所述覆盖范围极限指示待由所生成的球体覆盖的度量数据点的最大数量。
19.根据权利要求18所述的方法,其中基于所述多个参数来生成所述一个或多个球体包括:通过所述联络中心系统或所述计算设备基于所述最小半径来确定对应于度量数据的最高集中的位置。
20.根据权利要求19所述的方法,其中基于所述多个参数来生成所述一个或多个球体包括:
通过所述联络中心系统或所述计算设备来确定是否已达到所述覆盖范围极限;以及
响应于确定尚未达到所述覆盖范围极限,通过所述联络中心系统或所述计算设备基于所述半径增量来递增用于生成至少一个新球体的半径。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063128277P | 2020-12-21 | 2020-12-21 | |
US63/128,277 | 2020-12-21 | ||
PCT/US2021/064569 WO2022140359A1 (en) | 2020-12-21 | 2021-12-21 | Systems and methods related to applied anomaly detection and contact center computing environments |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117157628A true CN117157628A (zh) | 2023-12-01 |
Family
ID=82023162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180090443.2A Pending CN117157628A (zh) | 2020-12-21 | 2021-12-21 | 与所应用的异常检测和联络中心计算环境相关的系统和方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220198229A1 (zh) |
EP (1) | EP4264432A1 (zh) |
JP (1) | JP2024502944A (zh) |
CN (1) | CN117157628A (zh) |
AU (1) | AU2021409790A1 (zh) |
CA (1) | CA3202829A1 (zh) |
CO (1) | CO2023008969A2 (zh) |
WO (1) | WO2022140359A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10454714B2 (en) | 2013-07-10 | 2019-10-22 | Nicira, Inc. | Method and system of overlay flow control |
US10999100B2 (en) | 2017-10-02 | 2021-05-04 | Vmware, Inc. | Identifying multiple nodes in a virtual network defined over a set of public clouds to connect to an external SAAS provider |
US10608844B2 (en) | 2017-10-02 | 2020-03-31 | Vmware, Inc. | Graph based routing through multiple public clouds |
US11115480B2 (en) | 2017-10-02 | 2021-09-07 | Vmware, Inc. | Layer four optimization for a virtual network defined over public cloud |
US11223514B2 (en) | 2017-11-09 | 2022-01-11 | Nicira, Inc. | Method and system of a dynamic high-availability mode based on current wide area network connectivity |
US11310170B2 (en) | 2019-08-27 | 2022-04-19 | Vmware, Inc. | Configuring edge nodes outside of public clouds to use routes defined through the public clouds |
US11929903B2 (en) | 2020-12-29 | 2024-03-12 | VMware LLC | Emulating packet flows to assess network links for SD-WAN |
CN116783874A (zh) | 2021-01-18 | 2023-09-19 | Vm维尔股份有限公司 | 网络感知的负载平衡 |
US11979325B2 (en) | 2021-01-28 | 2024-05-07 | VMware LLC | Dynamic SD-WAN hub cluster scaling with machine learning |
US11521639B1 (en) | 2021-04-02 | 2022-12-06 | Asapp, Inc. | Speech sentiment analysis using a speech sentiment classifier pretrained with pseudo sentiment labels |
US20220407790A1 (en) * | 2021-06-18 | 2022-12-22 | Vmware, Inc. | Method and apparatus for deploying tenant deployable elements across public clouds based on harvested performance metrics |
US11763803B1 (en) | 2021-07-28 | 2023-09-19 | Asapp, Inc. | System, method, and computer program for extracting utterances corresponding to a user problem statement in a conversation between a human agent and a user |
US11943146B2 (en) | 2021-10-01 | 2024-03-26 | VMware LLC | Traffic prioritization in SD-WAN |
US11909815B2 (en) | 2022-06-06 | 2024-02-20 | VMware LLC | Routing based on geolocation costs |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9378112B2 (en) * | 2012-06-25 | 2016-06-28 | International Business Machines Corporation | Predictive alert threshold determination tool |
US10614056B2 (en) * | 2015-03-24 | 2020-04-07 | NetSuite Inc. | System and method for automated detection of incorrect data |
EP3278213A4 (en) * | 2015-06-05 | 2019-01-30 | C3 IoT, Inc. | SYSTEMS, METHODS AND DEVICES FOR AN APPLICATION DEVELOPMENT PLATFORM OF AN INTERNET OF THE THINGS OF A COMPANY |
US20180025303A1 (en) * | 2016-07-20 | 2018-01-25 | Plenarium Inc. | System and method for computerized predictive performance analysis of natural language |
-
2021
- 2021-12-21 CN CN202180090443.2A patent/CN117157628A/zh active Pending
- 2021-12-21 AU AU2021409790A patent/AU2021409790A1/en active Pending
- 2021-12-21 US US17/557,580 patent/US20220198229A1/en active Pending
- 2021-12-21 JP JP2023537323A patent/JP2024502944A/ja active Pending
- 2021-12-21 CA CA3202829A patent/CA3202829A1/en active Pending
- 2021-12-21 EP EP21912030.0A patent/EP4264432A1/en active Pending
- 2021-12-21 WO PCT/US2021/064569 patent/WO2022140359A1/en active Application Filing
-
2023
- 2023-07-05 CO CONC2023/0008969A patent/CO2023008969A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
EP4264432A1 (en) | 2023-10-25 |
JP2024502944A (ja) | 2024-01-24 |
US20220198229A1 (en) | 2022-06-23 |
AU2021409790A1 (en) | 2023-07-27 |
WO2022140359A1 (en) | 2022-06-30 |
CO2023008969A2 (es) | 2023-09-29 |
CA3202829A1 (en) | 2022-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117157628A (zh) | 与所应用的异常检测和联络中心计算环境相关的系统和方法 | |
US11734624B2 (en) | Method and system for scalable contact center agent scheduling utilizing automated AI modeling and multi-objective optimization | |
US11588836B2 (en) | Systems and methods relating to neural network-based API request pattern analysis for real-time insider threat detection | |
US11734648B2 (en) | Systems and methods relating to emotion-based action recommendations | |
US20230196024A1 (en) | Systems and methods relating to knowledge distillation in natural language processing models | |
US11985270B2 (en) | System and methods for adaptive campaign management and predictive customer engagement utilizing a customer data platform | |
CN117795941A (zh) | 与预测性路由和占用率平衡有关的系统和方法 | |
US11968327B2 (en) | System and method for improvements to pre-processing of data for forecasting | |
WO2023129682A1 (en) | Real-time agent assist | |
US11893904B2 (en) | Utilizing conversational artificial intelligence to train agents | |
US11763318B2 (en) | Systems and methods relating to providing chat services to customers | |
CN115956359A (zh) | 用于音调和语音分类的累积平均频谱熵分析 | |
US20230208972A1 (en) | Technologies for automated process discovery in contact center systems | |
US11968329B2 (en) | Systems and methods relating to routing incoming interactions in a contact center | |
WO2023122144A1 (en) | Systems and methods relating to knowledge distillation in natural language processing models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |