CN110147493B - 活跃因子的确定方法、装置、计算机设备及存储介质 - Google Patents

活跃因子的确定方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110147493B
CN110147493B CN201910301197.5A CN201910301197A CN110147493B CN 110147493 B CN110147493 B CN 110147493B CN 201910301197 A CN201910301197 A CN 201910301197A CN 110147493 B CN110147493 B CN 110147493B
Authority
CN
China
Prior art keywords
service
activity
group
target
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910301197.5A
Other languages
English (en)
Other versions
CN110147493A (zh
Inventor
陈伟源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201910301197.5A priority Critical patent/CN110147493B/zh
Publication of CN110147493A publication Critical patent/CN110147493A/zh
Application granted granted Critical
Publication of CN110147493B publication Critical patent/CN110147493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种活跃因子的确定方法、装置、计算机设备及存储介质,所述方法包括:获取预设数据库中的每个用户的每种业务的当前状态,并根据每种业务的当前状态,确定用户每种业务对应的基础业务参数,进而对每个基础业务参数进行归一化处理,得到用户的每种业务对应的分值,再获取每个用户对应的预设群体,从而确定每个预设群体中每种业务对应的目标分值,根据该目标分值,对每个预设群体进行活跃度评估,将活跃度最高的预设群体作为目标群体,获取目标群体的目标分值最大的业务,作为活跃因子,通过将预设群体的各个业务的当前状态进行量化来计算预设群体活跃度,提升了活跃因子的选取的准确性。

Description

活跃因子的确定方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种活跃因子的确定方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的发展和集团业务的扩大,集团旗下扩展出了各式各样的子业务的功能模块,一些用户仅使用一种功能模块,一些用户会使用集团旗下的多种功能模块,为了更好服务用户,需要对用户需求进行调查,即找出用户感兴趣的业务,从中总结经验,使得用户对产品的找出用户不感兴趣的业务,并对其分析原因,以便更好地改进,用户对业务越感兴趣关注度越高,一般使用频率会越高,也即,活跃程度会更高,这些与用户体验相关的业务均称为对用户活跃程度有影响的有效因子,其中,对用户活跃程度影响比较大的有效因子,称为活跃因子,活跃因子能够影响用户对集团业务的关注度和使用频率,因而,找到对用户活跃程度影响较大的活跃因子,对集团业务的扩展有着重要意义。
在当前,主要通过人工的方式对用户的活跃程度进行统计分析,来找出对活跃程度提升有帮忙的活跃因子,但鉴于集团业务的用户多、子业务多的特性,使得这种人工方式获取活跃因子效率低下,且确定活跃因子的准确率不高。
发明内容
本发明实施例提供一种活跃因子的确定方法、装置、计算机设备和存储介质,以解决当前活跃因子的选取的准确性低的问题。
一种活跃因子的确定方法,包括:
针对预设数据库中的每个用户,从所述预设数据库中查询所述用户的每种业务的当前状态,并根据每种所述业务的当前状态,确定所述用户的每种所述业务对应的基础业务参数;
对每个所述用户的每种所述业务对应的所述基础业务参数进行归一化处理,得到每个所述用户的每种所述业务对应的分值;
获取每个所述用户对应的预设群体;
针对每个所述预设群体中的每种所述业务,根据该预设群体中用户的所述业务对应的分值,确定该预设群体中所述业务对应的目标分值,得到每个所述预设群体中每种所述业务对应的目标分值;
根据每个所述预设群体中每种所述业务对应的目标分值,对每个所述预设群体进行活跃度评估,确定每个所述预设群体的活跃值;
对每个所述预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体;
获取所述目标群体中最大目标分值对应的所述业务,作为目标活跃因子。
一种活跃因子的确定装置,包括:
参数确定模块,用于针对预设数据库中的每个用户,从所述预设数据库中查询所述用户的每种业务的当前状态,并根据每种所述业务的当前状态,确定所述用户的每种所述业务对应的基础业务参数;
归一处理模块,用于对每个所述用户的每种所述业务对应的所述基础业务参数进行归一化处理,得到每个所述用户的每种所述业务对应的分值;
群体获取模块,用于获取每个所述用户对应的预设群体;
分值确定模块,用于针对每个所述预设群体中的每种所述业务,根据该预设群体中用户的所述业务对应的分值,确定该预设群体中所述业务对应的目标分值,得到每个所述预设群体中每种所述业务对应的目标分值;
活跃确定模块,用于根据每个所述预设群体中每种所述业务对应的目标分值,对每个所述预设群体进行活跃度评估,确定每个所述预设群体的活跃值;
活跃比较模块,用于对每个所述预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体;
目标确定模块,用于获取所述目标群体中最大目标分值对应的所述业务,作为目标活跃因子。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述活跃因子的确定方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述活跃因子的确定的步骤。
本发明实施例提供的活跃因子的确定方法、装置、计算机设备及存储介质,针对预设数据库中的每个用户,从预设数据库中查询用户的每种业务的当前状态,并根据每种业务的当前状态,更新用户每种业务对应的基础业务参数,进而针对每个用户,对该用户的每个基础业务参数进行归一化处理,得到该用户的每种业务对应的分值,再获取每个用户对应的预设群体,并针对每种业务,根据属于同一预设群体的用户的业务对应的分值,确定该预设群体中该业务对应的目标分值,得到每个预设群体中,每种业务对应的目标分值,再根据预设群体中的每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值,进而对每个预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体,获取目标群体的目标分值数值最大的业务,作为活跃因子,通过将预设群体的各个业务的当前状态进行量化,并通过这些量化数据计算预设群体活跃度,得到最活跃的预设群体,再从最活跃的预设群体中找出影响最大的业务,作为目标活跃因子,提升了活跃因子的选取的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的活跃因子的确定方法的实现流程图;
图2是本发明实施例提供的活跃因子的确定方法中对获取到的目标活跃因子的合理性进行验证的实现流程图;
图3是本发明实施例提供的活跃因子的确定方法中获取影响活跃程度的次要活跃因子的实现流程图;
图4是本发明实施例提供的活跃因子的确定装置的示意图;
图5是本发明实施例提供的计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的活跃因子的确定方法应用在多个业务中的活跃因子确定场景中。该活跃因子确定场景包括服务端,服务端通过对预设数据库中存储的用户的每种业务的当前状态进行分析,确定用户每种业务的分值,进而根据用户对应的预设群体,计算每个预设群体的活跃值,进而根据活跃值确定最活跃的预设群体为目标群体,并将目标群体中分值最大的业务确定为目标活跃因子。服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。
请参阅图1,图1示出本发明实施例提供的一种活跃因子的确定方法,以该方法应用在服务端,详述如下:
S10:针对预设数据库中的每个用户,从预设数据库中查询用户的每种业务的当前状态,并根据每种业务的当前状态,确定用户的每种业务对应的基础业务参数。
具体地,在服务端的预设数据库中,存储有每个用户的业务数据,业务数据包括每种业务和每种业务的当前状态,通过遍历查询的方式,从预设数据库中获取每个用户的每种业务对应的当前状态,并根据业务对应的当前状态,生成用户的该业务标识对应的基础业务参数。
其中,业务可以用业务标识来进行标识,业务标识是指用于标识业务产品或业务功能的标识信息,例如,业务产品“旺财”的业务标识为
“SX_WangCai”,业务功能“签到”的业务标识为“SX_Sign”。
其中,业务对应的当前状态是指在进行查询时,用户的该业务标识对应的业务产品或业务功能的状态信息,例如,在查询时,获取到用户的业务标识“SX_WangCai”的业务对应的当前状态为“开通”,获取到用户的业务标识为“SX_Sign”的业务对应的当前状态为“已签到”。
值得说明的是,业务对应的状态信息,可以根据实际需要进行预先设置,在设置该业务对应的状态信息时,为该状态信息设置一个默认值,作为当前状态,并在用户与该业务标识对应的产品信息或业务功能进行交互后,对当前状态进行更新。
例如,在一具体实施方式中,预先对业务标识为“SX_WangCai”的业务设置的状态信息包括“开通”和“未开通”,并将“未开通”设置为默认值,当服务端检测到用户与该业务标识为“SX_WangCai”的业务对应的业务产品“旺财”进行了互动后,经过识别发现业务产品“旺财”当前状态符合“开通”,即将业务标识为“SX_WangCai”的业务对应的当前状态更新为“开通”。
其中,业务对应的基础业务参数是指用户的该种业务标识对应的分值参数,在本实施例中,依据实际需求,对每种业务对应的状态信息,均设置权重分值,进而根据用户的每种业务对应的当前状态,得到用户的每种业务对应的基础业务参数,以便后续使用这些参数对群体活跃进行评估,根据每种业务的当前状态,更新每种业务对应的基础业务参数,可以根据实际情况进行确定,此处不做具体限定。
S20:对每个用户的每种业务对应的基础业务参数进行归一化处理,得到每个用户的每种业务对应的分值。
具体地,由于业务多,不同业务对应的基础业务参数波动较大,为了便于后续计算,需要对基础业务参数进行归一化处理,得到每个基础业务参数对应的分值,使得任意一个基础业务参数对应的分值处于一个固定范围之内。
其中,归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,使物理系统数值的绝对值变成某种相对值关系,归一化可以通过预设公式来实现,优选地,本实施例归一化之后的预设数值范围为[0,100],具体也可根据实际需要进行设置,此处不作限定。
例如,在一具体实施方式中,包含10个基础业务参数,分别为:15、80、250、50、0.6、210、70、56、100和90,可以通过将最大数字压缩到100的方式进行归一化,归一化之后的10个基础业务参数的分值依次为:6、32、100、20、0.24、84、28、22.4、40和36,容易理解地,归一化后分值过小的数据,对后续计算影响可忽略不计,为便于计算,可将归一化后分值过小的数据赋值为0。
应理解,上述示例中采用的归一化方式为简单的按比例调整到[0,100],仅作为本实施例的一个示例,在实际中,可以根据实际需要采用其他合适的归一化公式进行归一化操作,此处不作具体限制。
S30:获取每个用户对应的预设群体。
具体地,在服务端的预设数据库中,存储有多个预设群体,每个预设群体包含一个或多个用户,每个用户对应唯一一个预设群体,以用户为维度,获取每个用户对应的预设群体,以便后续可以通过统计预设群体中用户的每种业务对应的分值,来确定预设群体的活跃度。
其中,所属预设群体是指根据不同用户的特性,将具有相同特性的用户进行归类汇总得到的用户分类,在一种分类方式中,一个用户对应唯一一个预设群体。
值得说明的是,在预设数据库存储的用户中,存在一些“无效用户”,也即,在注册账户后,未使用任何业务或功能模块,或者,在超过预设时间阈值范围内,未使用任何业务或功能模块,针对这些“无效用户”,提出该类型用户的基础业务分值,并无需获取该类型用户对应的预设群体。“无效用户”的判断可以通过对基础业务分值的检查来实现,例如,将每项基础业务分值均为0的用户,确认为“无效用户”。
S40:针对每个预设群体中的每种业务,根据该预设群体中用户的业务对应的分值,确定该预设群体中业务对应的目标分值,得到每个预设群体中每种业务对应的目标分值。
具体地,针对每个预设群体中的每种业务,根据该预设群体中用户的业务对应的分值,确定该预设群体中业务对应的目标分值,进而得到每个预设群体中每种业务对应的目标分值。
例如,在一具体实施方式中,两种业务的业务标识分别为“SX_WangCai”和“SX_Sign”,预设群体包括男性群体和女性群体,数据库中存储的2000个用户中,1300个用户属于男性群体,700个用户属于女性群体,针对属于男性群体的1300个用户,将每个用户的业务标识“SX_WangCai”基础业务参数对应的分值进行累加,得到男性群体的业务标识“SX_WangCai”对应的目标分值,将每个用户的业务标识“SX_Sign”基础业务参数对应的分值进行累加,得到男性群体的业务标识“SX_Sign”对应的目标分值,针对女性群体,也采用上述方法,即可分别获取女性群体的这两种业务标识对应的目标分值。
需要说明的是,上述示例中对基础业务参数进行累加汇总,仅为确定预设群体中业务对应的目标分值的一个具体实施方式,实际执行时也可以是采取其他方式,此处不作具体限制。
S50:根据每个预设群体中每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值。
具体地,可使用预设的活跃评估公式和每个预设群体中每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值。
其中,预设的活跃评估公式用于根据预设群体的每种业务标识对应的目标分值,评估该预设群体的活跃程度,具体可以根据实际需要进行设定,此处不做限制。
应理解,活跃值越高的预设群体,其整体的活跃程度越高,活跃值越低的预设群体,其整体的活跃程度越低。
S60:对每个预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体。
具体地,对每个预设群体的活跃值的大小进行比较,获取活跃度最大的预设群体,也即,活跃程度最高的预设群体,并将该预设群体作为目标群体。
其中,对每个预设群体的活跃值的大小进行比较的方法,包括但不限于:冒泡排序(Bubble Sort)法、快速排序(Quicksort)法、希尔(Shell's Sort)法、多路归并(K-WayMerge Algorithm)算法和堆排序(Heapsort)法等。
S70:获取目标群体中最大目标分值对应的业务,作为目标活跃因子。
具体地,根据步骤S40中得到的每种业务对应的目标分值,从目标群体中,获取最大目标分值对应的业务,作为对活跃程度影响最大的目标活跃因子。
例如,在一具体实施方式中,获取到的目标群体为年龄分布为20岁至45的青年群体,该青年群体中包含的20种业务对应的目标分值,最大目标分值对应的业务为每日抽奖的功能模块,则确定每日抽奖的功能模块为对活跃程度影响最大的目标活跃因子。
在本实施例中,针对预设数据库中的每个用户,从预设数据库中查询用户的每种业务的当前状态,并根据每种业务的当前状态,更新用户每种业务对应的基础业务参数,进而针对每个用户,对该用户的每个基础业务参数进行归一化处理,得到该用户的每种业务对应的分值,再获取每个用户对应的预设群体,并针对每种业务,根据属于同一预设群体的用户的业务对应的分值,确定该预设群体中该业务对应的目标分值,得到每个预设群体中,每种业务对应的目标分值,再根据预设群体中的每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值,进而对每个预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体,获取目标群体的目标分值数值最大的业务,作为活跃因子,通过将预设群体的各个业务的当前状态进行量化,并通过这些量化数据计算预设群体活跃度,得到最活跃的预设群体,再从最活跃的预设群体中找出影响最大的业务,作为目标活跃因子,提升了活跃因子的选取的准确性。
在一实施例中,在步骤S70之后,该活跃因子的确定方法还包括对获取到的目标活跃因子的合理性进行验证。
请参阅图2,图2示出了本发明实施例提供的对获取到的目标活跃因子的合理性进行验证的具体实现流程,详述如下:
S81:获取任一预设群体,按照预设群体中的用户的业务中是否包含目标活跃因子,将预设群体中的用户分为测试用户和对比用户,并将测试用户归类于测试群体,将对比用户归类于对比群体,其中,测试用户的业务中包含目标活跃因子,对比用户的业务中不包含目标活跃因子。
具体地,从预设群体中,选取任意一个预设群体,并对预设群体的用户业务中是否包含目标活跃因子进行判断,将业务中包含目标活跃因子的用户作为测试用户,将业务中不包含目标活跃因子的用户,作为测试用户归类于测试群体,将对比用户归类于对比群体,使得该预设群体被划分为测试群体和对比群体。
S82:计算测试群体的活跃值,得到测试活跃值,并计算对比群体的活跃值,得到对比活跃值。
具体地,可通过步骤S50或者步骤S51提供的方法,进行测试群体的活跃值计算,得到测试活跃值,并进行对比群体的活跃值计算,得到对比活跃值,具体描述可参考步骤S50或者步骤S51,为避免重复,此处不再赘述。
S83:若测试活跃值大于对比活跃值,且测试活跃值与对比活跃值之差大于预设的测试阈值,则确定目标活跃因子验证通过。
具体地,对测试活跃值和对比活跃值进行比较,在测试活跃值大于对比活跃值,且测试汇月子与对比活跃值之差大于预设的测试阈值时,确定目标活跃因子验证通过。
其中,预设的测试阈值可依据实际情况进行合理选择,此处不作具体限制,优选地,在本实施例中,预设的测试阈值为3。
在本实施例中,通过获取任一预设群体,按照预设群体中的用户的业务中是否包含目标活跃因子,将预设群体中的用户分为测试用户和对比用户,并将测试用户归类于测试群体,将对比用户归类于对比群体,进而计算测试群体的活跃值,得到测试活跃值,并计算对比群体的活跃值,得到对比活跃值,在测试活跃值大于对比活跃值,且测试活跃值与对比活跃值之差大于预设的测试阈值时,确定目标活跃因子验证通过,通过该验证,进一步确保获取到的目标活跃因子的准确性。
在图1对应的实施例的基础之上,下面通过一个具体的实施例来对步骤S20中所提及的对每个用户的每种业务对应的基础业务参数进行归一化处理,得到每个用户的每种业务对应的分值的具体实现方法进行详细说明,详述如下:
S21:使用如下归一化公式,计算用户的每种业务对应的分值:
其中,y为用户的业务对应的分值,x为用户的业务的基础业务参数,a为业务的系数因子,b为业务的指数因子,0<a≤1,0<b≤1。
应用上述公式,对每个基础业务参数进行归一化时,可保证每个基础业务参数的分值均属于预设数值范围[0,100],且基础业务参数越大,计算出的分值越大。
值得说明的是,对于不同维度下的基础业务参数,在进行归一化时所应用的系数因子a不同,指数因子b也不同。对于每个维度来说该服务端可以对该维度下的大量的样本基础业务参数进行统计,对统计得到的统计值进行大数据分析和实验,从而得到该维度对应的系数因子和指数因子。该统计值可以为大量样本活动参数值的最大值、平均值或方差等,本实施例对系数因子和指数因子的确定方式不做具体限定。
在本实施例中,通过使用归一化公式,计算出用户的每种业务对应的分值,有利于后续通过该分值确定群体活跃度。
在图1对应的实施例的基础之上,下面通过一个具体的实施例来对步骤S50中所提及的根据每个预设群体中每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值,详述如下:
S51:使用如下活跃度评估公式计算每个预设群体的活跃值:
其中,Pm用于表示第m个预设群体的活跃值,n用于表示第m个预设群体中包含的业务的数量,scorei用于表示第m个预设群体中第i个业务对应的目标分值,Ki用于表示第m个预设群体中第i个业务对应的修正系数,i、m、n均为正整数,且i≤n。
值得说明的是,本实施例根据业务的不同,设置不同的修正系数,使得群体活跃值的计算更为合理。
在本实施例中,通过使用活跃度评估公式,计算每个预设群体的活跃值,有利于后续通过群体的活跃值确定活跃程度最高的目标群体。
在一实施例中,在步骤S70之后,该活跃因子的确定方法还包括获取影响活跃程度的次要活跃因子。
请参阅图3,图3示出了本发明实施例提供的获取影响活跃程度的次要活跃因子的具体实现流程,详述如下:
S91:将目标活跃因子对应的目标分值重置为0。
具体地,在进行确定次要活跃因子之前,需先排除目标活跃因子的干扰,针对业务中包含目标活跃因子的用户,将该用户的目标活跃因子对应的目标分值重置为0,以使后续重新计算预设群体的活跃值时,不受目标活跃因子的影响。
S92:返回根据预设群体中的每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值的步骤继续执行,并将得到的最大目标分值对应的业务,作为次要活跃因子。
具体地,在排除掉目标活跃因子的干扰之后,返回到步骤S50,按照步骤S50至步骤S70的方法,计算此时最大目标分值对应的业务,作为次要活跃因子。
值得说明的是,可按照该方式,依次计算出对活跃程度影响第三的第三活跃因子,对活跃程度影响第四的第四活跃因子等,为避免重复,此处不再赘述。
在本实施例中,通过将目标活跃因子对应的目标分值重置为0,进而返回根据预设群体中的每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值的步骤继续执行,并将得到的最大目标分值对应的业务,作为次要活跃因子,使得可以按照这种方式,获取对用户活跃程度有影响的一个或多个次要活跃因子,有利于找出对业务扩展有利的多个活跃因子。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图4示出与上述实施例活跃因子的确定方法一一对应的活跃因子的确定装置的原理框图。如图4所示,该活跃因子的确定装置包括参数确定模块10、归一处理模块20、群体获取模块30、分值确定模块40、活跃确定模块50、活跃比较模块60和目标确定模块70。各功能模块详细说明如下:
参数确定模块10,用于针对预设数据库中的每个用户,从预设数据库中查询用户的每种业务的当前状态,并根据每种业务的当前状态,确定用户的每种业务对应的基础业务参数;
归一处理模块20,用于对每个用户的每种业务对应的基础业务参数进行归一化处理,得到每个用户的每种业务对应的分值;
群体获取模块30,用于获取每个用户对应的预设群体;
分值确定模块40,用于针对每个预设群体中的每种业务,根据该预设群体中用户的业务对应的分值,确定该预设群体中业务对应的目标分值,得到每个预设群体中每种业务对应的目标分值;
活跃确定模块50,用于根据每个预设群体中每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值;
活跃比较模块60,用于对每个预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体;
目标确定模块70,用于获取目标群体中最大目标分值对应的业务,作为目标活跃因子。
进一步地,该活跃因子的确定装置还包括:
群体划分模块81,用于获取任一预设群体,按照预设群体中的用户的业务中是否包含目标活跃因子,将预设群体中的用户分为测试用户和对比用户,并将测试用户归类于测试群体,将对比用户归类于对比群体,其中,测试用户的业务中包含目标活跃因子,对比用户的业务中不包含目标活跃因子;
活跃计算模块82,用于计算测试群体的活跃值,得到测试活跃值,并计算对比群体的活跃值,得到对比活跃值;
目标验证模块83,用于若测试活跃值大于对比活跃值,且测试活跃值与对比活跃值之差大于预设的测试阈值,则确定目标活跃因子验证通过。
进一步地,归一处理模块20,包括:
归一计算单元21,用于使用如下归一化公式,计算用户的每种业务对应的分值:
其中,y为用户的业务对应的分值,x为用户的业务的基础业务参数,a为业务的系数因子,b为业务的指数因子,0<a≤1,0<b≤1。
进一步地,活跃确定模块50包括:
活跃计算单元51,用于使用如下活跃度评估公式计算每个预设群体的活跃值:
其中,Pm用于表示第m个预设群体的活跃值,n用于表示第m个预设群体中包含的业务的数量,scorei用于表示第m个预设群体中第i个业务对应的目标分值,Ki用于表示第m个预设群体中第i个业务对应的修正系数,i、m、n均为正整数,且i≤n。
进一步地,该活跃因子的确定方法还包括:
分值重置模块91,用于将目标活跃因子对应的目标分值重置为0;
重新评估模块92,用于返回根据预设群体中的每种业务对应的目标分值,对每个预设群体进行活跃度评估,确定每个预设群体的活跃值的步骤继续执行,并将得到的最大目标分值对应的业务,作为次要活跃因子。
关于活跃因子的确定装置的具体限定可以参见上文中对于活跃因子的确定方法的限定,在此不再赘述。上述活跃因子的确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图5是本发明一实施例提供的计算机设备的示意图。该计算机设备可以是服务端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储每个用户的每种业务的状态和预设群体。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种活跃因子的确定方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例活跃因子的确定方法的步骤,例如图1所示的步骤S10至步骤S70。或者,处理器执行计算机程序时实现上述实施例活跃因子的确定装置的各模块/单元的功能,例如图4所示的模块10至模块70的功能。为避免重复,这里不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
在一实施例中,提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例活跃因子的确定方法的步骤,或者,该计算机程序被处理器执行时实现上述实施例活跃因子的确定装置中各模块/单元的功能。为避免重复,这里不再赘述。
可以理解地,所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号和电信信号等。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种活跃因子的确定方法,其特征在于,所述活跃因子的确定方法包括:
针对预设数据库中的每个用户,从所述预设数据库中查询所述用户的每种业务的当前状态,并根据每种所述业务的当前状态,确定所述用户的每种所述业务对应的基础业务参数;
对每个所述用户的每种所述业务对应的所述基础业务参数进行归一化处理,得到每个所述用户的每种所述业务对应的分值;
获取每个所述用户对应的预设群体;
针对每个所述预设群体中的每种所述业务,根据该预设群体中用户的所述业务对应的分值,确定该预设群体中所述业务对应的目标分值,得到每个所述预设群体中每种所述业务对应的目标分值;
根据每个所述预设群体中每种所述业务对应的目标分值,对每个所述预设群体进行活跃度评估,确定每个所述预设群体的活跃值;
对每个所述预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体;
获取所述目标群体中最大目标分值对应的所述业务,作为目标活跃因子;
所述对每个所述用户的每种所述业务对应的所述基础业务参数进行归一化处理,得到每个所述用户的每种所述业务对应的分值包括:
使用如下归一化公式,计算所述用户的每种所述业务对应的分值:
其中,y为所述用户的所述业务对应的分值,x为所述用户的所述业务的基础业务参数,a为所述业务的系数因子,b为所述业务的指数因子,0<a≤1,0<b≤1;
所述根据每个所述预设群体中每种所述业务对应的目标分值,对每个所述预设群体进行活跃度评估,确定每个所述预设群体的活跃值包括:
使用如下活跃度评估公式计算每个所述预设群体的活跃值:
其中,Pm用于表示第m个所述预设群体的活跃值,n用于表示第m个所述预设群体中包含的所述业务的数量,scorei用于表示第m个所述预设群体中第i个所述业务对应的目标分值,Ki用于表示第m个所述预设群体中第i个所述业务对应的修正系数,i、m、n均为正整数,且i≤n。
2.如权利要求1所述的活跃因子的确定方法,其特征在于,在所述获取所述目标群体的所述目标分值数值最大的所述业务,作为目标活跃因子之后,所述活跃因子的确定方法还包括:
获取任一所述预设群体,按照所述预设群体中的用户的业务中是否包含所述目标活跃因子,将所述预设群体中的用户分为测试用户和对比用户,并将所述测试用户归类于测试群体,将所述对比用户归类于对比群体,其中,所述测试用户的业务中包含所述目标活跃因子,所述对比用户的业务中不包含所述目标活跃因子;
计算所述测试群体的活跃值,得到测试活跃值,并计算所述对比群体的活跃值,得到对比活跃值;
若所述测试活跃值大于所述对比活跃值,且所述测试活跃值与所述对比活跃值之差大于预设的测试阈值,则确定所述目标活跃因子验证通过。
3.如权利要求1或2所述的活跃因子的确定方法,其特征在于,在所述获取所述目标群体的所述目标分值数值最大的所述业务,作为目标活跃因子之后,所述活跃因子的确定方法还包括:
将所述目标活跃因子对应的目标分值重置为0;
返回所述根据所述预设群体中的每种所述业务对应的目标分值,对每个所述预设群体进行活跃度评估,确定每个所述预设群体的活跃值的步骤继续执行,并将得到的最大目标分值对应的所述业务,作为次要活跃因子。
4.一种活跃因子的确定装置,其特征在于,所述活跃因子的确定装置包括:
参数确定模块,用于针对预设数据库中的每个用户,从所述预设数据库中查询所述用户的每种业务的当前状态,并根据每种所述业务的当前状态,确定所述用户的每种所述业务对应的基础业务参数;
归一处理模块,用于对每个所述用户的每种所述业务对应的所述基础业务参数进行归一化处理,得到每个所述用户的每种所述业务对应的分值;
群体获取模块,用于获取每个所述用户对应的预设群体;
分值确定模块,用于针对每个所述预设群体中的每种所述业务,根据该预设群体中用户的所述业务对应的分值,确定该预设群体中所述业务对应的目标分值,得到每个所述预设群体中每种所述业务对应的目标分值;
活跃确定模块,用于根据每个所述预设群体中每种所述业务对应的目标分值,对每个所述预设群体进行活跃度评估,确定每个所述预设群体的活跃值;
活跃比较模块,用于对每个所述预设群体的活跃值的大小进行比较,并将活跃值最大的预设群体作为目标群体;
目标确定模块,用于获取所述目标群体中最大目标分值对应的所述业务,作为目标活跃因子;
所述归一处理模块,包括:
归一计算单元,用于使用如下归一化公式,计算所述用户的每种所述业务对应的分值:
其中,y为所述用户的所述业务对应的分值,x为所述用户的所述业务的基础业务参数,a为所述业务的系数因子,b为所述业务的指数因子,0<a≤1,0<b≤1;
所述活跃确定模块包括:
活跃计算单元,用于使用如下活跃度评估公式计算每个预设群体的活跃值:
其中,Pm用于表示第m个预设群体的活跃值,n用于表示第m个预设群体中包含的业务的数量,scorei用于表示第m个预设群体中第i个业务对应的目标分值,Ki用于表示第m个预设群体中第i个业务对应的修正系数,i、m、n均为正整数,且i≤n。
5.如权利要求4所述的活跃因子的确定装置,其特征在于,所述活跃因子的确定装置还包括:
群体划分模块,用于获取任一所述预设群体,按照所述预设群体中的用户的业务中是否包含所述目标活跃因子,将所述预设群体中的用户分为测试用户和对比用户,并将所述测试用户归类于测试群体,将所述对比用户归类于对比群体,其中,所述测试用户的业务中包含所述目标活跃因子,所述对比用户的业务中不包含所述目标活跃因子;
活跃计算模块,用于计算所述测试群体的活跃值,得到测试活跃值,并计算所述对比群体的活跃值,得到对比活跃值;
目标验证模块,用于若所述测试活跃值大于所述对比活跃值,且所述测试活跃值与所述对比活跃值之差大于预设的测试阈值,则确定所述目标活跃因子验证通过。
6.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的活跃因子的确定方法。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的活跃因子的确定方法。
CN201910301197.5A 2019-04-15 2019-04-15 活跃因子的确定方法、装置、计算机设备及存储介质 Active CN110147493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910301197.5A CN110147493B (zh) 2019-04-15 2019-04-15 活跃因子的确定方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910301197.5A CN110147493B (zh) 2019-04-15 2019-04-15 活跃因子的确定方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110147493A CN110147493A (zh) 2019-08-20
CN110147493B true CN110147493B (zh) 2023-07-21

Family

ID=67588538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910301197.5A Active CN110147493B (zh) 2019-04-15 2019-04-15 活跃因子的确定方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110147493B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112381411B (zh) * 2020-11-16 2024-01-26 国网上海市电力公司 一种群体生产活力的评估方法、电子设备及存储介质
CN112633573B (zh) * 2020-12-21 2022-04-01 北京达佳互联信息技术有限公司 活跃状态的预测方法以及活跃度阈值的确定方法
CN114296826A (zh) * 2021-12-29 2022-04-08 中国电信股份有限公司 数据加载方法、装置、电子设备及非易失性存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012099970A1 (en) * 2011-01-18 2012-07-26 Organic, Inc. Brand index evaluation apparatuses, methods and systems
CN106156123A (zh) * 2015-04-08 2016-11-23 腾讯科技(深圳)有限公司 活跃值计算方法及装置
CN107092678A (zh) * 2017-04-20 2017-08-25 腾讯科技(深圳)有限公司 一种获取应用活跃程度的方法、装置及设备
CN107370614A (zh) * 2016-05-13 2017-11-21 北京京东尚科信息技术有限公司 网络用户活跃度评估方法和预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012099970A1 (en) * 2011-01-18 2012-07-26 Organic, Inc. Brand index evaluation apparatuses, methods and systems
CN106156123A (zh) * 2015-04-08 2016-11-23 腾讯科技(深圳)有限公司 活跃值计算方法及装置
CN107370614A (zh) * 2016-05-13 2017-11-21 北京京东尚科信息技术有限公司 网络用户活跃度评估方法和预测方法
CN107092678A (zh) * 2017-04-20 2017-08-25 腾讯科技(深圳)有限公司 一种获取应用活跃程度的方法、装置及设备

Also Published As

Publication number Publication date
CN110147493A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN110147493B (zh) 活跃因子的确定方法、装置、计算机设备及存储介质
WO2019214248A1 (zh) 一种风险评估方法、装置、终端设备及存储介质
CN112258093A (zh) 风险等级的数据处理方法及装置、存储介质、电子设备
CN111507470A (zh) 一种异常账户的识别方法及装置
CN112464409B (zh) 车辆性能参数设定方法及装置
CN110348717B (zh) 基于栅格粒度的基站价值评分方法和装置
CN116610821B (zh) 一种基于知识图谱的企业风险分析方法、系统和存储介质
CN110737650A (zh) 数据质量检测方法及装置
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN112001756B (zh) 异常电信业务场景的确定方法、装置、计算机设备
CN112199388A (zh) 陌电识别方法、装置、电子设备及存储介质
CN112632000A (zh) 日志文件聚类方法、装置、电子设备和可读存储介质
CN109508350B (zh) 一种对数据进行采样的方法和装置
CN111783883A (zh) 一种异常数据的检测方法及装置
CN110866831A (zh) 资产活跃度等级的确定方法、装置及服务器
CN111311276A (zh) 一种异常用户团体的识别方法、识别装置及可读存储介质
CN115694975A (zh) 一种网络安全态势评估方法、电子设备及存储介质
CN111899092B (zh) 基于二道模型的业务数据筛选方法及装置
CN111258788B (zh) 磁盘故障预测方法、装置及计算机可读存储介质
CN114626436A (zh) 一种用户分类方法、装置、电子设备及存储介质
CN110246026B (zh) 一种数据转移的输出组合设定方法、装置及终端设备
CN113448955B (zh) 数据集质量评估方法、装置、计算机设备及存储介质
CN113905400B (zh) 网络优化处理方法、装置、电子设备及存储介质
CN116187299B (zh) 一种科技项目文本数据检定评价方法、系统及介质
CN115248847B (zh) 搜索数据集的构建方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant