CN115249098A - 数据指标的确定方法、装置、设备及存储介质 - Google Patents
数据指标的确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115249098A CN115249098A CN202110447272.6A CN202110447272A CN115249098A CN 115249098 A CN115249098 A CN 115249098A CN 202110447272 A CN202110447272 A CN 202110447272A CN 115249098 A CN115249098 A CN 115249098A
- Authority
- CN
- China
- Prior art keywords
- clustering
- data
- determining
- data index
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据指标的确定方法、装置、设备及存储介质。具体包括:获取预设时间段的目标业务的行为特征信息;计算各个行为特征信息的信息熵;确定满足预设阈值条件的信息熵对应的行为特征信息为第一数据指标;利用预设聚类模型,对第一数据指标聚类,得到目标数据指标。根据本申请实施例,能够获得的数据指标更加准确,进而由数据指标推导出的结论更加准确有效。
Description
技术领域
本申请属于计算机技术领域,尤其涉及一种数据指标的确定方法、装置、设备及存储介质。
背景技术
随着运营商的业务规模和运营业务的快速发展,支撑系统指标的数量也越来越多,业务细分趋势明显。
在相关技术中,基于业务属性或者指标趋势分析,可以得到所需的数据指标。但是,相关技术不能很好的适用于对大量细分化的业务数据指标的处理,导致分析得到数据指标存在偏差,继而导致由这些数据指标推导出的结论准确性不佳。
发明内容
本申请实施例提供一种数据指标的确定方法、装置、设备及计算机存储介质,能够获得的数据指标更加准确,进而由数据指标推导出的结论更加准确有效。
第一方面,本申请实施例提供一种数据指标的确定方法,方法包括:
获取预设时间段的目标业务的行为特征信息;
计算各个所述行为特征信息的信息熵;
确定满足预设阈值条件的所述信息熵对应的行为特征信息为第一数据指标;
利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标。
可选的,所述获取预设时间段的目标业务的行为特征信息,包括:
获取所述目标业务的用户特征信息;
根据所述用户特征信息和预设业务行为指标关系,确定预设时间段的目标业务的行为特征信息。
可选的,计算各个所述行为特征信息的信息熵,包括:
计算各个所述行为特征信息对应的归一化值;
根据各个所述行为特征信息对应的归一化值,确定所述信息熵。
可选的,所述确定满足预设阈值条件的所述信息熵对应的行为特征信息为第一数据指标,包括:
当所述信息熵小于预设阈值时,将所述信息熵对应的行为特征信息确定为第一数据指标。
可选的,所述预设聚类模型包括第一聚类模型和第二聚类模型;
所述利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标,包括:
利用所述第一聚类模型,对所述第一数据指标进行密度聚类,得到第一聚类结果;
利用所述第二聚类模型,对所述第一数据指标进行原型聚类,得到第二聚类结果;
将所述第一聚类结果和所述第二聚类结果叠加,得到所述目标数据指标。
可选的,所述利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标,包括:
利用所述预设聚类模型,对所述第一数据指标聚类,得到第一结果;
利用所述预设聚类模型,对所述第一结果聚类,得到所述目标数据指标。
可选的,所述第一聚类模型为DBSCAN聚类模型;所述第二聚类模型为K-means聚类模型。
第二方面,本申请实施例提供了一种数据指标的确定装置,装置包括:
获取模块,用于获取预设时间段的目标业务的行为特征信息;
计算模块,用于计算各个所述行为特征信息的信息熵;
确定模块,用于确定满足预设阈值条件的所述信息熵对应的行为特征信息为第一数据指标;
聚类模块,用于利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标。
第三方面,本申请实施例提供了一种数据指标的确定设备,设备包括:
处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如第一方面和第一方面可选的任意一项所述的数据指标的确定方法。
第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面和第一方面可选的任意一项所述的数据指标的确定方法。
本申请实施例的数据指标的确定方法、装置、设备及计算机存储介质,能够通过对目标业务的行为特征信息进行信息熵的计算,对行为特征信息进行筛选,得到具有关键信息的第一数据指标。并利用预设聚类模型,排除第一数据指标中的噪声数据,以确定目标数据指标。由此获得的数据指标更加准确,进而由数据指标推导出的结论更加准确有效。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一些实施例提供的数据指标的确定方法的流程示意图;
图2是本申请一些实施例提供的聚类分析的流程示意图;
图3是本申请另一些实施例提供的聚类分析过程的示意图;
图4是本申请一些实施例提供的数据指标的确定装置的结构示意图;
图5是本申请一些实施例提供的数据指标的确定设备的硬件结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
目前已建成的指标体系,通过业务逻辑进行细分而形成的指标体系,例如,按照业务属性进行单一分类,或者按照数据指标历史趋势的不同进行分类。基于相关技术中方法确定的指标体系对于支撑小范围的营销或业务保障效果是显著的。然而,随着运营商业务的快速发展,业务细分趋势明显,基于相关技术中的方式确定的数据指标,由于未充分考虑指标间的关联关系,使得数据指标存在偏差,导致数据指标体系的运行精度及运行效果不佳,由这些数据指标推导出的结论准确性不佳。
为了解决现有技术问题,本申请实施例提供了一种数据指标的确定方法、装置、设备及计算机存储介质,能够获得更加准确的数据指标,进而由数据指标推导出的结论更加准确有效。。
下面结合附图,描述根据本申请实施例提供的数据指标的确定法、装置、设备及计算机存储介质。应注意,这些实施例并不是用来限制本申请公开的范围。
下面首先对本申请实施例所提供的数据指标的确定方法进行介绍。
图1是本申请一些实施例提供的数据指标的确定方法的流程示意图。如图1所示,在本申请实施例中,该数据指标的确定方法,可以包括如下步骤:
S101:获取预设时间段的目标业务的行为特征信息。
目标业务可以包括待分析的业务场景。行为特征信息可以包括客户行为特征信息,或操作人员,如营业员的行为特征信息。该行为特征信息可以是待分析的与目标业务相关的数据指标。
示例性的,目标业务可以是收入管理业务,该收入管理业务对应的行为特征信息可以包括出账收入、数字化服务收入、主套餐、话务量、用户积分、客户星级、客户终端类型、总话务量、互通话务量、漫游、本地、长途、漫游主叫、漫游被叫、互通日份额、互通月份额等行为特征信息。
目标业务可以是用户服务管理业务,该收入管理业务对应的行为特征信息可以包括主套餐、总话务量、用户积分、客户星级、客户终端类型、互通话务量、漫游、本地、长途、漫游主叫、漫游被叫、互通日份额、互通月份额等等行为特征信息。
该预设时间段可以是当前日期之前两年的时间段。
在本申请一些实施例中,确定预设时间段的目标业务的行为特征信息具体可以包括:
首先,获取目标业务的用户特征信息。然后,根据用户特征信息和预设业务行为指标关系,确定预设时间段的目标业务的行为特征信息。
预设业务行为指标关系可以是预设的用户行为指标关系画像。预设业务行为指标关系可以包括目标业务的用户特征信息和对应的用户的行为特征信息。在对数据指标进行分析时,基于预设业务行为指标关系,可以更好的发现指标间的关联关系,以提升确定数据指标的准确性。
在本申请一些实施例中,目标业务的行为特征信息可以从运营商的客户管理系统(Customer Relationship Management,CRM)获取。
S102:计算各个行为特征信息的信息熵。
信息熵是系统复杂度综合衡量值,将排除了冗余后的平均信息量称为信息熵。
在本申请一些实施例中,首先,可以计算各个行为特征信息对应的归一化值。然后根据各个行为特征信息对应的归一化值,确定信息熵。
示例性的,如表1所示,用户的行为特征信息包括:每天操作频次、接触对象数、以及涉及金额。
用户ID | 平均操作频次 | 接触对象数 | 涉及金额(万) |
XA2238 | 569 | 65 | 12.35 |
XA2349 | 772 | 76 | 14.58 |
表1
根据表1中的各个用户和行为特征信息,先构造用户的行为特征信息矩阵X=(Xij)mxn,m为用户数,n为行为特征数,i表示第i个用户,j表示第j个行为特征信息。
计算各项行为特征信息的归一化值pij,例如,表1中所示,用户 XA2238的行为特征信息“平均操作频次”归一化值p11=569÷(569- 772)=0.426。
根据各个行为特征信息对应的归一化值,利用如下公式(1),计算信息熵ej:
i=1,2,3,…,m;
j=1,2,3,…,n
其中,pij为行为特征信息对应的归一化值,i表示第i个用户,j表示第j个行为特征信息。
S103:确定满足预设阈值条件的信息熵对应的行为特征信息为第一数据指标。
在本申请一些实施例中,预设阈值条件可以是信息熵小于预设阈值。
当用户的行为特征信息的信息熵小于预设阈值时,将信息熵对应的行为特征信息确定为第一数据指标。示例性的,预设阈值可以为0.9。
示例性的,对于行为特征信息用户平均操作频次,若每个用户行为特征信息表现趋同时,其对应的ej值最大,而此时对于方案的比较或指标分析,例如对客户分群,该行为特征信息作为数据指标是几乎没有意义的。
当各用户的行为特征信息相差越大时,ej越小,该行为特征信息的差异性越大,对于方案比较或指标分析起的作用越大,例如,该行为特征信息差异性更有利于客户分群比较。
S104:利用预设聚类模型,对第一数据指标聚类,得到目标数据指标。
在本申请一些实施例中,该预设聚类模型可以包括第一聚类模型和第二聚类模型。该预设聚类模型可以为双算法模型。该S104可以具体实施为如下步骤:
首先,利用第一聚类模型,对第一数据指标进行密度聚类,得到第一聚类结果。再利用第二聚类模型,对第一数据指标进行原型聚类,得到第二聚类结果。将第一聚类结果和第二聚类结果叠加,得到目标数据指标。
在本申请一些实施例中,该S104还可以实施为如下步骤:
首先,利用预设聚类模型,对第一数据指标聚类,得到第一结果。然后,利用预设聚类模型,对第一结果聚类,得到目标数据指标。
这里,利用预设聚类模型进行两次聚类,得到目标数据指标。第一结果可以为对第一数据指标聚类,得到数据指标。然后,利用预设聚类模型,对第一次聚类得到的数据指标再次聚类,得到目标数据指标。
由此,在本申请实施例中,该数据指标的确定方法能够通过对目标业务的行为特征信息进行信息熵的计算,对行为特征信息进行筛选,得到具有关键信息的第一数据指标。并利用预设聚类模型,排除第一数据指标中的噪声数据,以确定目标数据指标。由此获得的数据指标更加准确,进而由数据指标推导出的结论更加准确有效。
在本申请一些实施例中,为了进一步提升聚类结果的准确性。因此,可以将该步骤的上述两种实施方式结合,对第一数据指标聚类得到目标数据指标。图2是本申请一个实施例提供的聚类分析的流程示意图。如图2 所示,该S104还可以实施为如下步骤:
S201:利用第一聚类模型,对第一数据指标进行密度聚类,得到第一聚类结果。
S202:利用第二聚类模型,对第一数据指标进行原型聚类,得到第二聚类结果。
S203:将第一聚类结果和第二聚类结果叠加,得到第一结果。
这里,将第一聚类结果和第二聚类结果叠加可以包括取将第一聚类结果和第二聚类结果的交集。
S204:利用第一聚类模型,对第一结果进行密度聚类,得到第三聚类结果。
S205:利用第一聚类模型,对第三聚类结果进行密度聚类,得到第四聚类结果。
S206:利用预设聚类模型,对第四聚类结果聚类,得到目标数据指标。
在本申请一些实施例中,第一聚类模型可以为基于DBSCAN聚类算法的模型。第二聚类模型可以为基于K-means聚类算法的模型。
DBSCAN聚类是一种密度聚类算法。DBSCAN通过检查数据集中每点的Eps邻域来搜索簇,如果点p的Eps邻域包含的点多于MinPts个,则创建一个以p为核心对象的类。DBSCAN迭代地聚集从这些核心对象直接密度可达的对象,这个过程可能涉及一些密度可达类的合并。当没有新的点添加到任何类时,该过程结束,且没有包含在任何类中的数据点就构成噪音点。
K-Means聚类是一种原型聚类算法。其原理包括:首先确定K值以及初始化聚类中心,选择K个初始凝聚点,作为欲形成的类中心。然后,计算每一个观测到K个凝聚点的距离,将每个观测和最近的凝聚点分到一组,形成K个初始分类。计算每一个观测到K个凝聚点的距离,将每个观测和最近的凝聚点分到一组,形成K个初始分类;(4)重复上述距离计算,直至初始分类的重心没有明显的变化为止。
利用K-Means聚类模型和DBSCAN聚类模型,将两者结果集结合,将叠加后的二者结果集通过二次复合算法的到需要的结果集,即为目标数据指标。
在本申请一些实施例中,示例性的,以对单日营业员操作CRM系统的敏感行为指标分析为例,通过基于信息熵计算得到如表2所示的行为特征信息(数据指标)。
表2
图3是本申请另一些实施例提供的聚类分析过程的示意图。如图3所示,对表2中的单日用户的数据指标,即对每个用户及其对应的平均操作频次,接触对象数和涉及金额分别进行K-Means聚类模型和DBSCAN聚类,得到基于两个聚类算法的两个聚类结果。然后,将得到两个聚类结果结合,并利用K-Means聚类模型和DBSCAN聚类分别对结合后的聚类结果进行二次聚类,得到作为结果的目标数据指标,即用于对单日营业员操作CRM系统的敏感行为分析的数据指标。
结合K-Means聚类模型和DBSCAN聚类模型形成双算法模型,利用该双算法模型,对第一数据指标进行两次聚类,可以有效的去除“白噪音”,通过拟合能够更精准地输出目标数据指标。基于此确定的目标数据指标可以是更加符合指标分析需求的特征信息。
综上所述,在本申请实施例中,该数据指标的确定方法,能够通过对目标业务的行为特征信息进行信息熵的计算,对行为特征信息进行筛选,得到具有关键信息的第一数据指标。并利用预设聚类模型,排除第一数据指标中的噪声数据,以确定目标数据指标。由此获得的数据指标更加准确,进而由数据指标推导出的结论更加准确有效。
基于上述实施例提供的数据指标的确定方法,相应地,本申请还提供了数据指标的确定装置的具体实现方式。请参见以下实施例。
图4是本申请一个实施例提供的数据指标的确定装置的流程示意图。如图4所示,在本申请实施例中,该数据指标的确定装置,可以包括:
获取模块401,用于获取预设时间段的目标业务的行为特征信息。
计算模块402,用于计算各个行为特征信息的信息熵。
确定模块403,用于确定满足预设阈值条件的信息熵对应的行为特征信息为第一数据指标。
聚类模块404,用于利用预设聚类模型,对第一数据指标聚类,得到目标数据指标。
综上,在本申请实施例中,该数据指标的确定装置可以用于执行上述实施例中的数据指标的确定方法。该方法能够通过对目标业务的行为特征信息进行信息熵的计算,对行为特征信息进行筛选,得到具有关键信息的第一数据指标。并利用预设聚类模型,排除第一数据指标中的噪声数据,以确定目标数据指标。由此获得的数据指标更加准确,进而由数据指标推导出的结论更加准确有效。
在本申请一些实施例中,获取模块401,还用于获取目标业务的用户特征信息;根据用户特征信息和预设业务行为指标关系,确定预设时间段的目标业务的行为特征信息。
在本申请一些实施例中,计算模块402,还用于计算各个行为特征信息对应的归一化值;根据各个行为特征信息对应的归一化值,确定信息熵。
在本申请一些实施例中,确定模块403,还用于当信息熵小于预设阈值时,将信息熵对应的行为特征信息确定为第一数据指标。
在本申请一些实施例中,预设聚类模型包括第一聚类模型和第二聚类模型。
在本申请一些实施例中,聚类模块404,用于利用第一聚类模型,对第一数据指标进行密度聚类,得到第一聚类结果;利用第二聚类模型,对第一数据指标进行原型聚类,得到第二聚类结果;将第一聚类结果和第二聚类结果叠加,得到目标数据指标。
在本申请一些实施例中,聚类模块404,还用于利用预设聚类模型,对第一数据指标聚类,得到第一结果;利用预设聚类模型,对第一结果聚类,得到目标数据指标。
图4所示装置中的各个模块/单元具有实现图1和2中各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
基于上述实施例提供的数据指标的确定方法,相应地,本申请还提供了数据指标的确定装置的具体实现方式。请参见以下实施例。
图5是本申请一些实施例提供的数据指标的确定设备的硬件结构示意图。
数据指标的确定设备可以包括处理器501以及存储有计算机程序指令的存储器502。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus, USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502 是非易失性固态存储器。在特定实施例中,存储器502包括只读存储器 (ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程 ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM (EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的任意一种数据指标的确定方法。
在一个示例中,数据指标的确定设备还可包括通信接口503和总线510。其中,如图5所示,处理器501、存储器502、通信接口503通过总线510 连接并完成相互间的通信。
通信接口503,主要用于实现本申请实施例中各模块、装置、单元和/ 或设备之间的通信。
总线510包括硬件、软件或两者,将数据指标的确定设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数 (LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA) 总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该数据指标的确定设备可以执行本申请实施例中的数据指标的确定方法,从而实现结合图1和图2描述的数据指标的确定方法。
另外,结合上述实施例中的数据指标的确定方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种数据指标的确定方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种数据指标的确定方法,其特征在于,包括:
获取预设时间段的目标业务的行为特征信息;
计算各个所述行为特征信息的信息熵;
确定满足预设阈值条件的所述信息熵对应的行为特征信息为第一数据指标;
利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标。
2.根据权利要求1所述的方法,其特征在于,所述获取预设时间段的目标业务的行为特征信息,包括:
获取所述目标业务的用户特征信息;
根据所述用户特征信息和预设业务行为指标关系,确定预设时间段的目标业务的行为特征信息。
3.根据权利要求1所述的方法,其特征在于,计算各个所述行为特征信息的信息熵,包括:
计算各个所述行为特征信息对应的归一化值;
根据各个所述行为特征信息对应的归一化值,确定所述信息熵。
4.根据权利要求1所述的方法,其特征在于,所述确定满足预设阈值条件的所述信息熵对应的行为特征信息为第一数据指标,包括:
当所述信息熵小于预设阈值时,将所述信息熵对应的行为特征信息确定为第一数据指标。
5.根据权利要求1所述的方法,其特征在于,
所述预设聚类模型包括第一聚类模型和第二聚类模型;
所述利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标,包括:
利用所述第一聚类模型,对所述第一数据指标进行密度聚类,得到第一聚类结果;
利用所述第二聚类模型,对所述第一数据指标进行原型聚类,得到第二聚类结果;
将所述第一聚类结果和所述第二聚类结果叠加,得到所述目标数据指标。
6.根据权利要求1所述的方法,其特征在于,所述利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标,包括:
利用所述预设聚类模型,对所述第一数据指标聚类,得到第一结果;
利用所述预设聚类模型,对所述第一结果聚类,得到所述目标数据指标。
7.根据权利要求5所述的方法,其特征在于,所述第一聚类模型为DBSCAN聚类模型;所述第二聚类模型为K-means聚类模型。
8.一种数据指标的确定装置,其特征在于,所述装置包括:
获取模块,用于获取预设时间段的目标业务的行为特征信息;
计算模块,用于计算各个所述行为特征信息的信息熵;
确定模块,用于确定满足预设阈值条件的所述信息熵对应的行为特征信息为第一数据指标;
聚类模块,用于利用预设聚类模型,对所述第一数据指标聚类,得到目标数据指标。
9.一种数据指标的确定设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1至7任意一项所述的数据指标的确定方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至7任意一项所述的数据指标的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110447272.6A CN115249098A (zh) | 2021-04-25 | 2021-04-25 | 数据指标的确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110447272.6A CN115249098A (zh) | 2021-04-25 | 2021-04-25 | 数据指标的确定方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115249098A true CN115249098A (zh) | 2022-10-28 |
Family
ID=83697501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110447272.6A Pending CN115249098A (zh) | 2021-04-25 | 2021-04-25 | 数据指标的确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115249098A (zh) |
-
2021
- 2021-04-25 CN CN202110447272.6A patent/CN115249098A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107122369B (zh) | 一种业务数据处理方法、装置和系统 | |
CN110046929B (zh) | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 | |
CN109344154B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN107516246B (zh) | 用户类型的确定方法、确定装置、介质及电子设备 | |
CN109299356B (zh) | 基于大数据的活动推荐方法、装置、电子设备及存储介质 | |
CN110909222B (zh) | 基于聚类的用户画像建立方法、装置、介质及电子设备 | |
CN111797320B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111061842A (zh) | 一种相似文本确定方法及装置 | |
CN111612499B (zh) | 信息的推送方法及装置、存储介质、终端 | |
CN110348717B (zh) | 基于栅格粒度的基站价值评分方法和装置 | |
CN108428001B (zh) | 信用分值预测方法及装置 | |
CN112085588B (zh) | 规则模型的安全性的确定方法、装置和数据处理方法 | |
CN109902129B (zh) | 基于大数据分析的保险代理人归类方法及相关设备 | |
CN111401478A (zh) | 数据异常识别方法以及装置 | |
CN106651408B (zh) | 一种数据分析方法及装置 | |
CN109857816B (zh) | 测试样本的选取方法及装置、存储介质、电子设备 | |
CN109460778B (zh) | 活动评估方法、装置、电子设备及存储介质 | |
CN111275071A (zh) | 预测模型训练、预测方法、装置及电子设备 | |
CN111126788A (zh) | 风险识别方法及装置和电子设备 | |
CN115249098A (zh) | 数据指标的确定方法、装置、设备及存储介质 | |
CN112241820A (zh) | 资金流动中关键节点的风险识别方法、装置及计算设备 | |
CN114417830A (zh) | 风险评价方法、装置、设备及计算机可读存储介质 | |
CN114997327A (zh) | 目标对象的分类方法、装置、存储介质以及电子设备 | |
CN109033070B (zh) | 一种数据处理方法、服务器及计算机可读介质 | |
CN113688206A (zh) | 基于文本识别的趋势分析方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |