CN112215386A - 一种人员活跃度预测方法、装置和计算机可读存储介质 - Google Patents
一种人员活跃度预测方法、装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN112215386A CN112215386A CN202010392591.7A CN202010392591A CN112215386A CN 112215386 A CN112215386 A CN 112215386A CN 202010392591 A CN202010392591 A CN 202010392591A CN 112215386 A CN112215386 A CN 112215386A
- Authority
- CN
- China
- Prior art keywords
- communication
- preset
- target
- personnel
- activity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000694 effects Effects 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004891 communication Methods 0.000 claims abstract description 182
- 239000011159 matrix material Substances 0.000 claims abstract description 43
- 230000002159 abnormal effect Effects 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 abstract description 3
- 238000005065 mining Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例提供了一种人员活跃度预测方法、装置和计算机可读存储介质,该方法包括:获取一个或多个目标人员的一种或多种通讯方式对应的通讯数据,并对通讯数据进行预处理;一种或多种通讯方式与一个或多个目标人员的身份标识相对应;根据预处理后的通讯数据构建目标人员的鲜活度特征矩阵;采用预设算法对每个目标人员对应的鲜活度特征矩阵进行异常分值计算;根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度。通过该实施例方案,实现了充分利用公安已存在的海量数据,基于该海量数据进行挖掘分析,可以准确地给出嫌疑人员的活跃状态,便于公安人员有针对性的关注重点嫌疑人员,有效地辅助案件侦破,减少警力资源投入。
Description
技术领域
本文涉及信息处理技术,尤指一种人员活跃度预测方法、装置和计算机可读存储介质。
背景技术
某些特定行为是一个非常严峻的社会问题,事关人民的身心健康和社会的文明和谐发展。基于社会环境的多元化和开放式的发展,这些行为呈现出“低龄化”、“多元化”、“多样化”发展的特点,手段也更为现代化。随着科技的发展,手段更为方便,利用手机、互联网等进行线上交易,通过视频和音频的现代化技术了解特定物品的成色、数量、交易价格以及商定交易地点等,甚至一些组织团伙还利用互联网开设快递业务,实现网络购物。
目前对于特定人员活跃度的判定基本是基于人工调查,通过专家多年的经验积累进行分析和识别,通过线人等情报信息反馈等,对当前特定人员的近期状态进行调查,最终判别特定人员是否近期十分活跃,有较大的特定行为活动倾向。
因此,目前特定人员的推理研判只能依靠专家的人工智慧,这种方法在目前案件频发,信息海量的背景影响下实际效果不太乐观,耗时耗力,仅仅依靠有限的人力资源难以实现对特定人员及时准确的进行研判推理。
发明内容
本申请实施例提供了一种人员活跃度预测方法、装置和计算机可读存储介质,能够准确地对人员的活跃状态进行分析,便于有针对性的关注重点特定人员,从而有效地辅助案件侦破,减少人力资源的投入。
本申请实施例提供了一种人员活跃度预测方法,所述方法可以包括:
获取一个或多个目标人员的一种或多种通讯方式对应的通讯数据,并对所述通讯数据进行预处理;其中,所述一种或多种通讯方式与所述一个或多个目标人员的身份标识相对应;
根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵;
采用预设算法对每个目标人员对应的鲜活度特征矩阵进行异常分值计算;
根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度。
在本申请的示例性实施例中,所述对所述通讯数据进行预处理可以包括:
对所述通讯数据进行缺失值处理,并对不符合预设规则的通讯数据进行删除;
将进行缺失值处理后的通讯数据转化为预设格式;所述预设格式为包含一个或多个目标人物的一种或多种通讯特征的特征矩阵。
在本申请的示例性实施例中,所述对所述通讯数据进行缺失值处理可以包括:将包含缺失值的数据删除或者对包含缺失值的数据进行插补;
所述预设规则可以包括:通讯号码编码规则;
所述通讯特征包括以下任意一种或多种:主动通讯号码、被动通讯号码、通讯时段以及通讯时长。
在本申请的示例性实施例中,所述根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵可以包括:
根据所述特征矩阵中的信息获取预设时长内每个目标人员分别与预设人员进行通讯时的鲜活度通讯特征;
将每个目标人员对应的一个或多个所述鲜活度通讯特征采用向量来表示,构成每个目标人员的鲜活度特征向量;
将多个目标人物对应的鲜活度特征向量组合成鲜活度特征矩阵。
在本申请的示例性实施例中,所述鲜活度通讯特征可以包括以下任意一种或多种:
最近一次与所述预设人员的通讯时段;
最近一次与所述预设人员的通讯时长;
最近一次与所述预设人员通讯距离当前时刻的总时长;
最近的一预设时段内与所述预设人员的通讯频次;
最近的一预设时段内与所述预设人员的通讯总时长;
多个预设时段内与所述预设人员的通讯总频次;以及,
多个预设时段内与所述预设人员的通讯总时长。
在本申请的示例性实施例中,所述根据所述特征矩阵中的信息获取预设时长内每个目标人员分别与预设人员进行通讯时的鲜活度通讯特征可以包括:
根据所述矩阵特征中的所述主动通讯号码与所述被动通讯号码之间的通讯时段和通讯时长,统计出一种或多种所述鲜活度通讯特征;
所述将每个目标人员对应的一个或多个所述鲜活度通讯特征采用向量来表示可以包括:
按照预设顺序以向量的形式罗列出每一种所述活跃度通讯特征中相应的时段、时长或频次。
在本申请的示例性实施例中,所述预设算法可以包括:机器学习的孤立森林算法;
所述采用预设算法对每个目标人员对应的鲜活度特征矩阵进行异常分值计算可以包括:
将所述每个目标人员对应的鲜活度特征向量作为所述孤立森林算法的输入,经过所述孤立森林算法的计算,输出每个目标人员对应的异常分值。
在本申请的示例性实施例中,所述根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度可以包括:
将每个目标人员对应的异常分值进行排序,并根据排序结果获取异常分值最高的一个或多个目标人员;
将所述异常分值最高的一个或多个目标人员确定为活跃度最高的人员。
本申请实施例还提供了一种人员活跃度预测装置,可以包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任意一项所述的人员活跃度预测方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的人员活跃度预测方法。
与相关技术相比,本申请实施例包括:获取一个或多个目标人员的一种或多种通讯方式对应的通讯数据,并对所述通讯数据进行预处理;其中,所述一种或多种通讯方式与所述一个或多个目标人员的身份标识相对应;根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵;采用预设算法对每个目标人员对应的鲜活度特征矩阵进行异常分值计算;根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度。通过该实施例方案,实现了充分利用公安已存在的海量数据,基于该海量数据进行挖掘分析,可以准确地给出特定人员的活跃状态,便于有针对性的关注重点特定人员,从而有效地辅助案件侦破,减少人力资源的投入。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实施例的人员活跃度预测方法流程图;
图2为本申请实施例的根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵的方法流程图;
图3为本申请实施例的鲜活度特征矩阵进行数据预处理的方法示意图;
图4为本申请实施例的人员活跃度预测装置组成框图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
本申请实施例提供了一种人员活跃度预测方法,如图1所示,所述方法可以包括步骤S101-S104:
S101、获取一个或多个目标人员的一种或多种通讯方式对应的通讯数据,并对所述通讯数据进行预处理;其中,所述一种或多种通讯方式与所述一个或多个目标人员的身份标识相对应。
在本申请的示例性实施例中,针对目前特定人员的推理研判只能依靠专家的人工智慧,耗费人力资源较大,追踪研判效率较低的情况,本申请实施例方案提供一种高效的信息处理方法,能够准确的对相关人员进行鲜活度分数的计算,该分数可以有效的刻画相关人员的近期活跃状态,辅助判别该人员是否可能近期有危险活动或与人员近期的往来密切程度以及近期特定行为倾向,从而有效的辅助查找相关人员,减少人力资源的投入。
在本申请的示例性实施例中,鲜活度是对目标人员,例如特定人员近期活跃程度的一个衡量标准,可以基于一种或多种通讯方式(例如,通话、短信、QQ、微信、邮箱等)的通讯信息(或称通讯数据)对特定人员在近期(例如,两月内、两周内)与预设人员(例如种子人员)通讯活跃度的一个评价。对于一个具体的特定人员来说,最近与种子人员通讯越频繁,分数越高,而且通讯时间越近,分数越高。
在本申请的示例性实施例中,可以充分利用已存在的海量数据,基于该海量数据进行挖掘分析,对目标人员的活跃度情况进行分析。
在本申请的示例性实施例中,首先可以从海量数据中获取一个或多个目标人员的一种或多种通讯方式对应的通讯数据,例如,通话、短信、QQ聊天和微信等数据,然后对这些通讯数据进行预处理。
在本申请的示例性实施例中,所述对所述通讯数据进行预处理可以包括:
对所述通讯数据进行缺失值处理,并对不符合预设规则的通讯数据进行删除;
将进行缺失值处理后的通讯数据转化为预设格式;所述预设格式为包含一个或多个目标人物的一种或多种通讯特征的特征矩阵。
在本申请的示例性实施例中,所述对所述通讯数据进行缺失值处理可以包括:将包含缺失值的数据删除或者对包含缺失值的数据进行插补;
所述预设规则可以包括:通讯号码编码规则和/或身份标识编码规则;
所述通讯特征包括以下任意一种或多种:主动通讯号码(发起通讯的号码,如主叫号码)、被动通讯号码(被发起通讯的号码,如被叫号码)、通讯时段以及通讯时长。
在本申请的示例性实施例中,对包含缺失值的数据进行缺失值处理具体可以包括:检测每个数据的缺失数量是否超过预设值,当超过预设值时,删除该数据,当未超过该预设值时,利用预设的数据均值、中位数或0补齐数据中的缺失值。
在本申请的示例性实施例中,可以对通讯数据进行缺失值的处理,将不符合通讯号码编码规则和身份标识编码规则(例如,电话号码规则和身份证号码规则)的通讯数据进行过滤,将剩余的通讯数据转化为预设格式,例如: (主叫号码被叫号码通话时间通话时长)的多元组格式,方便后续计算的进行。
在本申请的示例性实施例中,通过身份证号码和手机号码的对应关系,可以将手机号码、QQ账号、微信账号、邮箱地址等对应到具体的身份证号码上,一个身份证号可能使用过多个手机号码、QQ账号、微信账号、邮箱地址等,因此,一个身份账号可以对应多种通信方式,并且可以对应每种通讯方式的多个号码。
S102、根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵。
在本申请的示例性实施例中,如图2所示,所述根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵可以包括步骤S201-S203:
S201、根据所述特征矩阵中的信息获取预设时长内每个目标人员分别与预设人员进行通讯时的鲜活度通讯特征。
在本申请的示例性实施例中,所述鲜活度通讯特征可以包括以下任意一种或多种:
最近一次与所述预设人员的通讯时段;
最近一次与所述预设人员的通讯时长;
最近一次与所述预设人员通讯距离当前时刻的总时长;
最近的一预设时段内与所述预设人员的通讯频次;
最近的一预设时段内与所述预设人员的通讯总时长;
多个预设时段内与所述预设人员的通讯总频次;以及,
多个预设时段内与所述预设人员的通讯总时长。
在本申请的示例性实施例中,例如,具体可以包括以下任意一种或多种:最近一次与特定人员的通话时间(例如,通话时间点或时间段,通话时长,如通话几小时、几分钟、几秒等),最近一周与特定人员通话总频次(例如,一周之内通话总次数、每天的通话频率、一周之内通话的天数等),最近两周与特定人员通话总频次,最近一月与特定人员通话总频次,最近一次与特定人员短信时间(例如,发短信的时间点或时间段,发短信时长等),最近一周与特定人员短信总频次,最近两周与特定人员短信总频次,最近一月与特定人员短信总频次,最近一次通话时长,最近一月通话总时长等。
在本申请的示例性实施例中,基于真实场景的应用需求,鲜活度应当满足以下条件:
1、鲜活是基于近期的通讯关系的描述,因此最近的通讯数据一定占主导地位。
2、如果没有最近的通讯数据(例如,当前时刻之前的两周、两月内的通讯数据),也就是说当前系统中存储的通讯数据最早的时间是截至到两周或两个月以前的,这些鲜活的数据也不应当是0,可以随着时间(例如,距离今天的时间)长度去衰减,距离今天的时长越长,衰减越多,距离今天的时长越短,衰减越少,因此最近一次的通讯时间可以作为辅助衰减的指标。
在本申请的示例性实施例中,所述根据所述特征矩阵中的信息获取预设时长内每个目标人员分别与预设人员进行通讯时的鲜活度通讯特征可以包括:
根据所述矩阵特征中的所述主动通讯号码与所述被动通讯号码之间的通讯时段和通讯时长,统计出一种或多种所述鲜活度通讯特征。
在本申请的示例性实施例中,具体地,可以针对所述矩阵特征中的所述主动通讯号码与所述被动通讯号码之间的通讯时段和通讯时长进行统计计算,计算出最近一次与所述预设人员的通讯时段、最近一次与所述预设人员的通讯时长、最近一次与所述预设人员通讯距离当前时刻的总时长、最近的一预设时段内与所述预设人员的通讯频次、最近的一预设时段内与所述预设人员的通讯总时长、多个预设时段内与所述预设人员的通讯总频次,以及多个预设时段内与所述预设人员的通讯总时长等鲜活度通讯特征。
S202、将每个目标人员对应的一个或多个所述鲜活度通讯特征采用向量来表示,构成每个目标人员的鲜活度特征向量。
在本申请的示例性实施例中,所述将每个目标人员对应的一个或多个所述鲜活度通讯特征采用向量来表示可以包括:
按照预设顺序以向量的形式罗列出每一种所述活跃度通讯特征中相应的时段、时长或频次。
在本申请的示例性实施例中,构建人员的鲜活度特征向量,可以用向量v 来表示,其中v=[x1,x2,...,xn]。xi代表第i个维度的鲜活度通讯特征对应的取值。
在本申请的示例性实施例中,例如,如果鲜活度通讯特征包括以下几项:
最近一次与特定人员的通讯时长为5分21秒;
最近一次与特定人员通讯距离当前时刻的总时长为1天;
最近的一预设时段(一周)内与特定人员的通讯频次为8次;
最近的一预设时段(一周)内与特定人员的通讯总时长为1小时15分;
多个预设时段(4周)内与特定人员的通讯总频次为25次;
多个预设时段(4周)内与特定人员的通讯总时长为5小时。
当鲜活度特征向量中各个鲜活度通讯特征依次按照:最近一次与特定人员的通讯时长、最近一次与特定人员通讯距离当前时刻的总时长、最近的一预设时段(一周)内与特定人员的通讯频次、最近的一预设时段(一周)内与特定人员的通讯总时长、4周内与特定人员的通讯总频次、4周内与特定人员的通讯总时长这一顺序进行排列时,则相应的鲜活度特征向量v= [5分21秒、1天、8次、1小时15分、25次、5小时]。在具体实施时,鲜活度特征向量v中的每一项可以仅为数值,不包含单位,可以预先对每一种鲜活度通讯特征的单位进行默认设置,如,天、秒、分钟、小时、次、次/天、次/周、次/两周、次/4周等。
S203、将多个目标人物对应的鲜活度特征向量组合成鲜活度特征矩阵。
在本申请的示例性实施例中,在获取每一个目标人员的鲜活度特征向量之后,可以将多个目标人员的鲜活度特征向量进行组合,构成鲜活度特征矩阵。例如,可以将矩阵的每一列对应一种鲜活度通讯特征,将矩阵的每一行对应一个目标人员。在其他实施例中,还可以将矩阵的每一行对应一种鲜活度通讯特征,将矩阵的每一列对应一个目标人员。
在本申请的示例性实施例中,在获取该鲜活度特征矩阵之后,还可以进一步对该鲜活度特征矩阵进行数据预处理,如图3所示。
在本申请的示例性实施例中,当鲜活度特征矩阵中的每一列对应一种鲜活度通讯特征,每一行对应一个目标人员时,对该鲜活度特征矩阵进行数据预处理可以包括:检测每一列数据中的每个数据的缺失数量是否超过预设值,当超过预设值时,删除该数据,当未超过该预设值时,利用预设的数据均值、中位数或0补齐数据中的缺失值。
在本申请的示例性实施例中,在对鲜活度特征矩阵进行缺失值处理后,可以进一步将该矩阵中的不符合规范的特征数据删除,例如,电话号码、身份证号码不符合编码规则,时长、次数等过大或过小,明显不符合自然常识的数据。
S103、采用预设算法对每个目标人员对应的鲜活度特征向量进行异常分值计算。
在本申请的示例性实施例中,所述预设算法可以包括:机器学习的孤立森林算法;
所述采用预设算法对每个目标人员对应的鲜活度特征向量进行异常分值计算可以包括:
将所述每个目标人员对应的鲜活度特征向量作为所述孤立森林算法的输入,经过所述孤立森林算法的计算,输出每个目标人员对应的异常分值。
在本申请的示例性实施例中,可以采用机器学习的孤立森林(iForest)算法,对上述鲜活度特征向量中的特征数据进行异常分值计算,孤立森林算法可以有效的筛选出离群的异常值。通过孤立森林算法,可以获得每个人员的异常分值。
S104、根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度。
在本申请的示例性实施例中,所述根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度可以包括:
将每个目标人员对应的异常分值进行排序,并根据排序结果获取异常分值最高的一个或多个目标人员;
将所述异常分值最高的一个或多个目标人员确定为活跃度最高的人员。
在本申请的示例性实施例中,可以从高到低排序,或从低到高排序,可以获知异常分值(或称鲜活度分数、活跃度分数)最高的人员,将异常分值最高的人员确定为活跃度分数最大的人员,这些人员即可确定为活跃度最高的人员。
本申请实施例还提供了一种人员活跃度预测装置1,如图4所示,可以包括处理器11和计算机可读存储介质12,所述计算机可读存储介质12中存储有指令,当所述指令被所述处理器11执行时,实现上述任意一项所述的人员活跃度预测方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的人员活跃度预测方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质) 和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
Claims (10)
1.一种人员活跃度预测方法,其特征在于,所述方法包括:
获取一个或多个目标人员的一种或多种通讯方式对应的通讯数据,并对所述通讯数据进行预处理;其中,所述一种或多种通讯方式与所述一个或多个目标人员的身份标识相对应;
根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵;
采用预设算法对每个目标人员对应的鲜活度特征矩阵进行异常分值计算;
根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度。
2.根据权利要求1所述的人员活跃度预测方法,其特征在于,所述对所述通讯数据进行预处理包括:
对所述通讯数据进行缺失值处理,并对不符合预设规则的通讯数据进行删除;
将进行缺失值处理后的通讯数据转化为预设格式;所述预设格式为包含一个或多个目标人物的一种或多种通讯特征的特征矩阵。
3.根据权利要求2所述的人员活跃度预测方法,其特征在于,所述对所述通讯数据进行缺失值处理包括:将包含缺失值的数据删除或者对包含缺失值的数据进行插补;
所述预设规则包括:通讯号码编码规则;
所述通讯特征包括以下任意一种或多种:主动通讯号码、被动通讯号码、通讯时段以及通讯时长。
4.根据权利要求3所述的人员活跃度预测方法,其特征在于,所述根据预处理后的通讯数据构建所述目标人员的鲜活度特征矩阵包括:
根据所述特征矩阵中的信息获取预设时长内每个目标人员分别与预设人员进行通讯时的鲜活度通讯特征;
将每个目标人员对应的一个或多个所述鲜活度通讯特征采用向量来表示,构成每个目标人员的鲜活度特征向量;
将多个目标人物对应的鲜活度特征向量组合成鲜活度特征矩阵。
5.根据权利要求4所述的人员活跃度预测方法,其特征在于,所述鲜活度通讯特征包括以下任意一种或多种:
最近一次与所述预设人员的通讯时段;
最近一次与所述预设人员的通讯时长;
最近一次与所述预设人员通讯距离当前时刻的总时长;
最近的一预设时段内与所述预设人员的通讯频次;
最近的一预设时段内与所述预设人员的通讯总时长;
多个预设时段内与所述预设人员的通讯总频次;以及,
多个预设时段内与所述预设人员的通讯总时长。
6.根据权利要求5所述的人员活跃度预测方法,其特征在于,
所述根据所述特征矩阵中的信息获取预设时长内每个目标人员分别与预设人员进行通讯时的鲜活度通讯特征包括:
根据所述矩阵特征中的所述主动通讯号码与所述被动通讯号码之间的通讯时段和通讯时长,统计出一种或多种所述鲜活度通讯特征;
所述将每个目标人员对应的一个或多个所述鲜活度通讯特征采用向量来表示包括:
按照预设顺序以向量的形式罗列出每一种所述活跃度通讯特征中相应的时段、时长或频次。
7.根据权利要求1所述的人员活跃度预测方法,其特征在于,所述预设算法包括:机器学习的孤立森林算法;
所述采用预设算法对每个目标人员对应的鲜活度特征矩阵进行异常分值计算包括:
将所述每个目标人员对应的鲜活度特征向量作为所述孤立森林算法的输入,经过所述孤立森林算法的计算,输出每个目标人员对应的异常分值。
8.根据权利要求7所述的人员活跃度预测方法,其特征在于,所述根据不同的目标人员对应的异常分值的排序获取不同的目标人员的活跃度包括:
将每个目标人员对应的异常分值进行排序,并根据排序结果获取异常分值最高的一个或多个目标人员;
将所述异常分值最高的一个或多个目标人员确定为活跃度最高的人员。
9.一种人员活跃度预测装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1-8任意一项所述的人员活跃度预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任意一项所述的人员活跃度预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010392591.7A CN112215386A (zh) | 2020-05-11 | 2020-05-11 | 一种人员活跃度预测方法、装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010392591.7A CN112215386A (zh) | 2020-05-11 | 2020-05-11 | 一种人员活跃度预测方法、装置和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112215386A true CN112215386A (zh) | 2021-01-12 |
Family
ID=74059531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010392591.7A Pending CN112215386A (zh) | 2020-05-11 | 2020-05-11 | 一种人员活跃度预测方法、装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215386A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116881577A (zh) * | 2023-07-18 | 2023-10-13 | 南京拓界信息技术有限公司 | 一种手机取证中分析重点人物的方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819578A (zh) * | 2012-07-24 | 2012-12-12 | 武汉大千信息技术有限公司 | 视频侦查嫌疑目标分析系统及方法 |
CN103744994A (zh) * | 2014-01-22 | 2014-04-23 | 中国科学院信息工程研究所 | 一种面向通信网络的用户行为模式挖掘方法及系统 |
CN105072089A (zh) * | 2015-07-10 | 2015-11-18 | 中国科学院信息工程研究所 | 一种web恶意扫描行为异常检测方法与系统 |
CN106161824A (zh) * | 2015-03-23 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种通讯号码活跃度确定方法及装置 |
CN106874658A (zh) * | 2017-01-18 | 2017-06-20 | 天津艾登科技有限公司 | 一种基于主成分分析算法的医保欺诈识别方法 |
CN107231494A (zh) * | 2017-07-10 | 2017-10-03 | 北京亿赛通网络安全技术有限公司 | 一种用户通信特征的获取方法、存储介质及电子设备 |
CN108874911A (zh) * | 2018-05-28 | 2018-11-23 | 广西师范学院 | 基于区域环境与犯罪事件数据的疑犯位置预测方法 |
CN109308306A (zh) * | 2018-09-29 | 2019-02-05 | 重庆大学 | 一种基于孤立森林的用户用电异常行为检测方法 |
CN109522470A (zh) * | 2018-11-06 | 2019-03-26 | 汪浩 | 一种视频热度预测方法、装置、设备及存储介质 |
CN109636433A (zh) * | 2018-10-16 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 基于大数据分析的养卡识别方法、装置、设备和存储介质 |
CN109727070A (zh) * | 2018-12-28 | 2019-05-07 | 中国银行股份有限公司 | 一种潜在活跃用户的确定方法及装置 |
CN110347699A (zh) * | 2019-06-26 | 2019-10-18 | 北京明略软件系统有限公司 | 确定身份证相关实体活跃度的方法及装置 |
CN110674418A (zh) * | 2019-09-30 | 2020-01-10 | 北京明略软件系统有限公司 | 一种获取隐性涉毒人员的方法及装置 |
-
2020
- 2020-05-11 CN CN202010392591.7A patent/CN112215386A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819578A (zh) * | 2012-07-24 | 2012-12-12 | 武汉大千信息技术有限公司 | 视频侦查嫌疑目标分析系统及方法 |
CN103744994A (zh) * | 2014-01-22 | 2014-04-23 | 中国科学院信息工程研究所 | 一种面向通信网络的用户行为模式挖掘方法及系统 |
CN106161824A (zh) * | 2015-03-23 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种通讯号码活跃度确定方法及装置 |
CN105072089A (zh) * | 2015-07-10 | 2015-11-18 | 中国科学院信息工程研究所 | 一种web恶意扫描行为异常检测方法与系统 |
CN106874658A (zh) * | 2017-01-18 | 2017-06-20 | 天津艾登科技有限公司 | 一种基于主成分分析算法的医保欺诈识别方法 |
CN107231494A (zh) * | 2017-07-10 | 2017-10-03 | 北京亿赛通网络安全技术有限公司 | 一种用户通信特征的获取方法、存储介质及电子设备 |
CN108874911A (zh) * | 2018-05-28 | 2018-11-23 | 广西师范学院 | 基于区域环境与犯罪事件数据的疑犯位置预测方法 |
CN109308306A (zh) * | 2018-09-29 | 2019-02-05 | 重庆大学 | 一种基于孤立森林的用户用电异常行为检测方法 |
CN109636433A (zh) * | 2018-10-16 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 基于大数据分析的养卡识别方法、装置、设备和存储介质 |
CN109522470A (zh) * | 2018-11-06 | 2019-03-26 | 汪浩 | 一种视频热度预测方法、装置、设备及存储介质 |
CN109727070A (zh) * | 2018-12-28 | 2019-05-07 | 中国银行股份有限公司 | 一种潜在活跃用户的确定方法及装置 |
CN110347699A (zh) * | 2019-06-26 | 2019-10-18 | 北京明略软件系统有限公司 | 确定身份证相关实体活跃度的方法及装置 |
CN110674418A (zh) * | 2019-09-30 | 2020-01-10 | 北京明略软件系统有限公司 | 一种获取隐性涉毒人员的方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116881577A (zh) * | 2023-07-18 | 2023-10-13 | 南京拓界信息技术有限公司 | 一种手机取证中分析重点人物的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609708B (zh) | 一种基于手机游戏商店的用户流失预测方法及系统 | |
CA2821095C (en) | System and method for detecting fraudulent account access and transfers | |
CN107481090A (zh) | 一种用户异常行为检测方法、装置和系统 | |
CN111275546A (zh) | 金融客户欺诈风险识别方法及装置 | |
CN111932268A (zh) | 企业风险识别方法及装置 | |
CN110457601B (zh) | 社交账号的识别方法和装置、存储介质及电子装置 | |
CN110929799A (zh) | 用于检测异常用户的方法、电子设备和计算机可读介质 | |
CN110362751A (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN109978575B (zh) | 一种挖掘用户流量经营场景的方法及装置 | |
CN109450963B (zh) | 消息推送方法及终端设备 | |
CN112215386A (zh) | 一种人员活跃度预测方法、装置和计算机可读存储介质 | |
CN111476657B (zh) | 信息推送方法、装置及系统 | |
CN110796379B (zh) | 业务渠道的风险评估方法、装置、设备及存储介质 | |
US20210035235A1 (en) | System and method for detecting fraud among tax experts | |
CN110717653A (zh) | 风险识别方法及装置和电子设备 | |
CN115130577A (zh) | 一种欺诈号码识别方法、装置及电子设备 | |
CN111640502B (zh) | 配送对象的健康状态检测方法及装置 | |
CN114005550A (zh) | 基于远程问诊的行为监控方法、装置及设备 | |
CN108055661B (zh) | 基于通信网络的电话号码黑名单建立方法及装置 | |
CN114257688A (zh) | 电话诈骗识别方法及相关装置 | |
CN110399399B (zh) | 用户分析的方法、装置、电子设备和存储介质 | |
CN111626881A (zh) | 年金组合风险管理系统、方法、服务器及存储介质 | |
WO2023095337A1 (ja) | 離反行為予測装置、離反行為予測方法及びプログラム | |
CN118096191B (zh) | 一种智能用户信息保护的反欺诈系统及方法 | |
CN111967966B (zh) | 一种手机银行睡眠客户的自动唤醒方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |