CN113780804B - 基于数据分析的员工行为风险预测方法、装置及存储介质 - Google Patents
基于数据分析的员工行为风险预测方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113780804B CN113780804B CN202111055105.3A CN202111055105A CN113780804B CN 113780804 B CN113780804 B CN 113780804B CN 202111055105 A CN202111055105 A CN 202111055105A CN 113780804 B CN113780804 B CN 113780804B
- Authority
- CN
- China
- Prior art keywords
- risk
- violation
- variable
- practitioner
- violation risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000007405 data analysis Methods 0.000 title claims abstract description 33
- 238000013500 data storage Methods 0.000 title description 3
- 239000011159 matrix material Substances 0.000 claims abstract description 174
- 230000006399 behavior Effects 0.000 claims abstract description 133
- 238000012545 processing Methods 0.000 claims abstract description 96
- 238000007477 logistic regression Methods 0.000 claims abstract description 32
- 238000004364 calculation method Methods 0.000 claims description 92
- 238000010606 normalization Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 230000003542 behavioural effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 238000011156 evaluation Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Mathematics (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Algebra (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人工智能技术,揭露一种基于数据分析的员工行为风险预测方法,包括:从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据;对特定场景从业人员违规风险变量数据表进行数值标准化处理;再与特定场景的违规风险因子转置矩阵进行矩阵乘法处理;对变量违规风险值矩阵中变量违规风险值进行逻辑回归;计算特定场景的从业人员的行为违规风险概率;将风险概率大于预设行为违规风险阈值的从业人员作为预警人员。本发明还涉及区块链技术,预设全员违规风险变量总表存储于区块链中。本发明能够解决现有技术中,将从业人员已经发生的违规行为作为关键评估数据,在从业人员的违规行为发生前不能给出有效风险提醒等问题。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于数据分析的员工行为风险预测方法、装置及计算机可读存储介质。
背景技术
各行业的从业人员都会存在行为违规等风险,从业人员的行为违规不仅会给个人带来惩处,同时还会给公司带来负面影响,甚至对整个行业带来负面影响。例如金融行业的从业人员(如各银行的员工)、医疗行业的从业人员(如医护人员)、环保领域(如环保工作人员)等。
目前,对从业人员的行为违规风险的评估方法均是通过收集从业人员行为数据,对关键的风险数据设定阈值,然后通过关键风险数据以及相应的阈值对从业人员进行行为监测。当从业人员某项关键数据超过阈值时,对该从业人员进行预警。
上述的从业人员的行为违规风险的评估方法为事后的风险监测,通过将从业人员已经发生的违规行为作为关键评估数据,将关键评估数据与设定阈值进行简单比对,从而达到对违规从业人员监测的目的,虽然能够及时发现违规的从业人员,对违规人员进行查证和处罚,但是,目前的方法在从业人员的违规行为发生前不能及时智能的给出有效风险提醒,无法从根本上阻止从业人员发生违规行为,从业人员发生违规行为所造成的各方面的影响,需要及时补救,耗费人力物力。
发明内容
本发明提供一种基于数据分析的员工行为风险预测方法、装置及计算机可读存储介质,其主要目的在于能够解决现有技术中,对从业人员的事后的风险监测,无法阻止从业人员的违规行为的发生,一旦对公司造成负面影响,难以补救等问题。
第一方面,为实现上述目的,本发明提供的一种基于数据分析的员工行为风险预测方法,所述方法包括:
从预设全员违规风险变量总表中摘选所述特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表;
对所述特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表;
将所述标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;
对所述变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值;
通过预设从业人员行为违规风险概率计算公式计算出所述每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;
将所述行为违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,以完成对所述特定场景的从业人员的行为违规预测。
第二方面,为了解决上述问题,本发明还提供一种基于数据分析的员工行为风险预测装置,所述装置包括:
违规风险变量摘选模块,用于根据特定场景的从业人员行为违规预测指令,从预设全员违规风险变量总表中摘选所述特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表;
数值标准化模块,用于对所述特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表;
矩阵乘法处理模块,用于将所述标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;
逻辑回归处理模块,用于对所述变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值;
违规风险概率计算模块,用于通过预设从业人员行为违规风险概率计算公式计算出所述每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;
违规预测模块,用于将所述行为违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,以完成对所述特定场景的从业人员的行为违规预测。
第三方面,为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的基于数据分析的员工行为风险预测方法的步骤。
第四方面,为了解决上述问题,本发明还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于数据分析的员工行为风险预测方法。
本发明提出的基于数据分析的员工行为风险预测方法、装置、电子设备及存储介质,通过根据特定场景的从业人员行为违规预测指令,从预设全员违规风险变量总表中摘选数据得到特定场景从业人员违规风险变量数据表,再通过引入特定场景的违规风险因子转置矩阵、逻辑回归处理方法、预设从业人员行为违规风险概率计算公式等对特定场景的从业人员进行行为违规风险概率计算,对行为违规风险概率大于预设行为违规风险阈值的从业人员进行行为违规风险预警,在违规事件发生之前进行行为违规风险预警,及时干预,把违规行为扼杀在萌芽状态,避免由于从业人员的个人违规行为给公司带来较大的负面影响,便于公司的内部管控。
附图说明
图1为本发明一实施例提供的基于数据分析的员工行为风险预测方法的流程示意图;
图2为本发明一实施例提供的基于数据分析的员工行为风险预测装置的模块示意图;
图3为本发明一实施例提供的实现基于数据分析的员工行为风险预测方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本发明提供一种基于数据分析的员工行为风险预测方法。参照图1所示,为本发明一实施例提供的基于数据分析的员工行为风险预测方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,基于数据分析的员工行为风险预测方法包括:
步骤S110、从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表;其中,特定场景从业人员违规风险变量数据表中包括特定场景的从业人员的身份数据和与身份数据对应的违规风险变量数据。
具体的,当处理器获取到特定场景的从业人员行为违规预测指令,根据特定场景的从业人员行为违规预测指令从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据。其中,特定场景的从业人员行为违规预测指令中指明具体的特定场景,例如,对于金融领域,特定场景可为一个金融公司的销售部门、理财部门等公司部门。对于医疗领域,特定场景可为某个医院的各个部门。预设全员违规风险变量总表包括所有场景的从业人员,预设全员违规风险变量总表中包括整个以公司或者医院为单位的从业人员,以及每个从业人员对应的违规风险变量及每个违规风险变量下对应从业人员的违规风险变量数值。
作为本发明的一个可选实施例,预设全员违规风险变量总表存储于区块链中,预设全员违规风险变量总表包括:
用于记录从业人员唯一身份数据的唯一标识子表和用于记录与从业人员唯一身份数据相对应的各项违规风险变量数据的违规风险变量数据子表;其中,
唯一标识子表包括:从业人员的唯一编码、与唯一编码对应的从业人员的姓名和与唯一编码相对应的从业人员从业的特定场景;
违规风险变量数据子表包括:违规风险变量和与唯一编码相对应的违规风险变量的违规风险变量数值。
具体的,通过唯一标识子表能够确定从业人员(包括姓名和部门),从业人员存在重名时,通过唯一编码可对重名的从业人员进行区分。违规风险变量数据子表包括各项违规风险变量,例如,年龄、罚款、预警变量(如:一转多次)各种账户交易变量(如:月均交易金额等);违规风险变量数值为每个从业人员对于上述各项违规风险变量的具体数值,例如,唯一编码为XS0001号的员工,张三对应的年龄为24、罚款为2000、预警一转多次数为20,月均交易金额为8880。其中,唯一标识可通过特定场景编码和员工号组成,例如,特定场景为销售部门的编码为XS,张三的员工号为0001号,则,张三的唯一编码为XS0001。
作为本发明的一个可选实施例,从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表包括:
根据特定场景的从业人员行为违规预测指令,从唯一标识子表中摘选属于特定场景的从业人员的唯一编码和与唯一编码对应的从业人员的姓名;其中,特定场景的从业人员行为违规预测指令包括特定场景的名称;
按照预设特定场景的违规风险变量数据摘选规则,从违规风险变量数据子表中摘选与特定场景的名称相对应的违规风险变量,作为特定违规风险变量,并获取与所述唯一编码相对应的特定违规风险变量的违规风险变量数值,得到初级特定场景从业人员违规风险变量数据表;其中,预设特定场景的违规风险变量数据摘选规则包括特定场景的名称和与特定场景的名称对应的所需摘选的违规风险变量;
对初级特定场景从业人员违规风险变量数据表中的违规风险变量数值进行空值处理,得到特定场景从业人员违规风险变量数据表。
具体的,根据特定场景的从业人员行为违规预测指令中的特定场景的名称,从唯一标识子表中摘选属于特定场景的从业人员的唯一编码和与唯一编码对应的从业人员的姓名,例如,特定场景的从业人员行为违规预测指令指定的对理财销售部门的从业人员进行行为违规风险预测,则根据唯一标识子表中的从业人员从业的特定场景中摘选所有属于理财销售部门的从业人员的唯一编码以及与唯一编码对应的从业人员的姓名。
然后按照预设特定场景的违规风险变量数据摘选规则,从违规风险变量数据子表中摘选与特定场景的名称相对应的违规风险变量,作为特定违规风险变量,其中,预设特定场景的违规风险变量数据摘选规则中包括所有特定场景的名称和与特定场景的名称对应的所需摘选的违规风险变量,例如,一个公司有理财销售部门、财务部门、人事部门等三个部门,特定场景的违规风险变量数据摘选规则中包括理财销售部门、财务部门、人事部门,并且包括对每个部门的从业人员进行行为违规风险预测所需要的违规风险变量,例如,理财销售部门需要用到的违规风险变量有罚款,而人事部门不需要用到罚款这项违规风险变量,则,在摘选违规风险变量时,需要根据特定场景的名称进行摘选,完成违规风险变量摘选后,再从违规风险变量数据子表中获取与唯一编码相对应的特定违规风险变量的违规风险变量数值,例如,唯一编码号为XS0001对应的罚款金额为2000。
由于在预设全员违规风险变量总表中可能存在空值的违规风险变量数值,不利于后续的行为违规风险预测计算处理,例如,XS0001需要使用到罚款的违规风险变量数值,但是选取的结果对应的数值为0,此时,需要对该空值进行空值处理,使初级特定场景从业人员违规风险变量数据表中所有的数值变为数值型数据,得到特定场景从业人员违规风险变量数据表。
作为本发明的一个可选实施例,对初级特定场景从业人员违规风险变量数据表中的违规风险变量数值进行空值处理,得到特定场景从业人员违规风险变量数据表包括:
从初级特定场景从业人员违规风险变量数据表中获取数值为空值的违规风险变量数值,作为目标空值;
获取目标空值对应的特定违规风险变量,作为目标违规风险变量;
对目标违规风险变量对应的除去数值为空值的违规风险变量数值后剩余的违规风险变量数值进行平均化处理,得到目标违规风险变量均值;
将目标违规风险变量均值替换目标空值,得到特定场景从业人员违规风险变量数据表。
具体的,先从初级特定场景从业人员违规风险变量数据表中获取所有数值为空值的违规风险变量数值作为目标空值,然后获取目标空值对应的特定违规风险变量,作为目标违规风险变量,然后对目标违规风险变量下的所有除去数值为空值的违规风险变量值后剩余的违规风险变量数值进行平均化处理,得到目标违规风险变量均值,最后将目标违规风险变量均值替换目标空值,例如,在一个初级特定场景从业人员违规风险变量数据表中,在罚款这项特定违规风险变量下对应有一项为空值,则,获取罚款下除去该空值项其余所有的违规风险变量数值,并对其余所有的违规风险变量数值进行均值化处理,得到目标违规风险变量均值,将目标违规风险变量均值替换罚款的特定违规风险变量下的空值,得到特定场景从业人员违规风险变量数据表。确保特定场景从业人员违规风险变量数据表中的违规风险变量数值均为数值型数据。
步骤S120、对特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表;其中,违规风险变量数据包括违规风险变量和与违规风险变量对应的每个特定场景的从业人员的违规风险变量数值。
具体的,为了便于后续的数据计算处理,需要将特定场景从业人员违规风险变量数据表中的违规风险变量数值转换为标准化数值,从而得到标准化特定场景从业人员违规风险变量数据表。其中,违规风险变量数据包括违规风险变量和与违规风险变量对应的每个特定场景的从业人员的违规风险变量数值。例如,违规风险变量为罚款,则,每个特定场景的从业人员对应于罚款项的具体数值即为违规风险变量数值,例如,张三的罚款金额为2000。
作为本发明的一个可选实施例,对特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表包括:
从特定场景从业人员违规风险变量数据表中获取违规风险变量的违规风险变量数值的最大值和违规风险变量数值的最小值;
根据违规风险变量数值的最大值和违规风险变量数值的最小值,通过预设数值标准化公式对违规风险变量下的违规风险数值进行数值标准化计算处理,得到标准化特定场景从业人员违规风险变量数据表;其中,预设数值标准化公式为:
其中,
xnew为数值标准化处理后得到的标准化违规风险变量数值,xold为未标准化处理的违规风险变量数值,xold_max为违规风险变量数值的最大值,xold_min为违规风险变量数值的最小值。
具体的,从特定场景从业人员违规风险变量数据表中获取每个违规风险变量的违规风险变量数值的最大值和违规风险变量数值的最小值,即,在特定场景从业人员违规风险变量数据表中每一列违规风险变量数值的最大值和最小值,然后通过预设数值标准化公式对违规风险变量下的违规风险数值进行数值标准化计算处理,使每一列违规风险变量数值的区间均在[0,1],便于后续的数据矩阵处理。
步骤S130、将标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;其中,变量违规风险值矩阵中每行的变量违规风险值均对应于相应的特定场景的从业人员。
具体的,从标准化特定场景从业人员违规风险变量数据表中获取标准化违规风险变量数值,在获取的过程中保持标准化违规风险变量数值行和列的位置,使每个标准化违规风险变量数值在标准化特定场景从业人员违规风险变量数据表中的位置不发生变化,作为变量数值标准矩阵,由于获取标准化违规风险变量数值时保持了每个标准化违规风险变量数值的位置,因此,变量数值标准矩阵中的每一行的标准化违规风险变量数值与相应的特定场景的从业人员对应,每一列的标准化违规风险变量数值与相应的违规风险变量相对应。
将变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵,其中,预先获取的特定场景的违规风险因子转置矩阵中的特定场景的违规风险因子为预先通过大数据模型训练得到的,每个特定场景所训练得到的违规风险因子转置矩阵可不同。其中,大数据训练出来的特定场景的违规风险因子矩阵将第M行第N列位置的数值转换到第N行第M列后得到的便是特定场景的违规风险因子转置矩阵。变量违规风险值矩阵中每行变量违规风险值均对应于相应的特定场景的从业人员。
作为本发明的一个可选实施例,将标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵包括:
将标准化特定场景从业人员违规风险变量数据表中的每行标准化违规风险变量数值和每列标准化违规风险变量数值共同作为变量数值标准矩阵;其中,变量数值标准矩阵中的每行标准化违规风险变量数值均对应于相应的特定场景的从业人员;
将变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵。
具体的,将标准化特定场景从业人员违规风险变量数据表中的每行标准化违规风险变量数值和每列标准化违规风险变量数值共同作为变量数值标准矩阵,使每个标准化违规风险变量数值的位置相对保持不变,将变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵。为了更好的解释矩阵乘法,举例如下:
例如,设变量标准矩阵为A,特定场景的风险因子转置矩阵为B,变量风险值矩阵为C。则C=AB表示如下所示:
步骤S140、对变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值;其中,每行的违规风险回归值均对应于相应的特定场景的从业人员。
具体的,通过对变量违规风险值矩阵中的每行的变量违规风险值进行逻辑回归处理,得到每个特定场景的从业人员对应的违规风险回归值,通过违规风险回归值计算该从业人员的行为风险概率。
作为本发明的一个可选实施例,对变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值包括:
根据预设变量违规风险值列数提取规则,从变量违规风险值矩阵中提取前N列变量违规风险值,作为待回归值计算矩阵;其中,待回归值计算矩阵中每行变量违规风险值均对应于相应的特定场景的从业人员;
通过预设逻辑回归计算公式,分别对待回归值计算矩阵中的每行的变量违规风险值进行逻辑回归计算处理,得到每行的违规风险回归值;其中,预设逻辑回归计算公式为:
y=c+β1*Z1+β2*Z2+…+βN*ZN,其中,y为每行的违规风险回归值,Z1表示待回归值计算矩阵中的第1列的违规风险回归值,Z2表示待回归值计算矩阵中的第2列的违规风险回归值,以此类推,ZN表示待回归值计算矩阵中的第N列的违规风险回归值,c及β1,…,βN为预设常数。
具体的,为了便于逻辑回归计算,根据预设变量违规风险值列数提取规则,保留变量违规风险值矩阵中的前N列变量违规风险值即可,例如,通常保留前十列变量违规风险值,得到待回归值计算矩阵,同样,待回归值计算矩阵中的每一行变量违规风险值均对应于相应的特定场景的从业人员,便于后续筛选预警人员,将待回归值计算矩阵中的每行的变量违规风险值分别代入预设逻辑回归计算公式,分别得到每行的违规风险回归值,即每个特定场景从业人员的违规风险回归值。
步骤S150、通过预设从业人员行为违规风险概率计算公式计算出每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率。
具体的,将每行的违规风险回归值即每个特定场景的从业人员的违规风险回归值分别代入预设从业人员行为违规风险概率计算公式中,通过计算得到违规风险回归值所对应的特定场景的从业人员的行为违规风险概率。
作为本发明的一个可选实施例,所述通过预设从业人员行为违规风险概率计算公式计算出所述每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率包括:
将每行的违规风险回归值分别输入预设从业人员行为违规风险概率计算公式,计算出每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;其中,预设从业人员行为违规风险概率计算公式为:
其中,q为特定场景的从业人员的行为违规风险概率,y为特定场景的从业人员对应的违规风险回归值,e为常数。
具体的,通过将每行的违规风险回归值分别输入从业人员行为违规风险概率计算公式,从而得到与违规风险回归值对应的特定场景的从业人员的行为违规风险概率。
步骤S160、将行为违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,以完成对特定场景的从业人员的行为违规预测。
具体的,将每个特定场景的从业人员的行为违规风险概率与预设行为违规风险阈值进行比较,将违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,获取行为违规预警从业人员的姓名以及唯一编码,对该预警从业人员进行及时干预,将违规行为控制在萌芽状态。
如图2所示,是本发明一个实施例的基于数据分析的员工行为风险预测装置的功能模块图。
本发明所述基于数据分析的员工行为风险预测装置200可以安装于电子设备中。根据实现的功能,所述基于数据分析的员工行为风险预测装置可以包括违规风险变量摘选模块210、数值标准化模块220、矩阵乘法处理模块230、逻辑回归处理模块240、违规风险概率计算模块250、违规预测模块260。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
违规风险变量摘选模块210,用于从预设全员违规风险变量总表中摘选所述特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表;其中,特定场景从业人员违规风险变量数据表中包括特定场景的从业人员的身份数据和与身份数据对应的违规风险变量数据。
具体的,通过违规风险变量摘选模块210获取特定场景的从业人员行为违规预测指令,并根据特定场景的从业人员行为违规预测指令从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据。其中,特定场景的从业人员行为违规预测指令中指明具体的特定场景,例如,对于金融领域,特定场景可为一个金融公司的销售部门、理财部门等公司部门。对于医疗领域,特定场景可为某个医院的各个部门。预设全员违规风险变量总表中包括整个以公司或者医院为单位的的从业人员,以及每个从业人员对应的违规风险变量及每个违规风险变量下对应从业人员的违规风险变量数值。
作为本发明的一个可选实施例,预设全员违规风险变量总表存储于区块链中,预设全员违规风险变量总表包括:
用于记录从业人员唯一身份数据的唯一标识子表和用于记录与从业人员唯一身份数据相对应的各项违规风险变量数据的违规风险变量数据子表;其中,
唯一标识子表包括:从业人员的唯一编码、与唯一编码对应的从业人员的姓名和与唯一编码相对应的从业人员从业的特定场景;
违规风险变量数据子表包括:违规风险变量和与唯一编码相对应的违规风险变量的违规风险变量数值。
具体的,通过唯一标识子表能够确定从业人员(包括姓名和部门),从业人员存在重名时,通过唯一编码可对重名的从业人员进行区分。违规风险变量数据子表包括各项违规风险变量,例如,年龄、罚款、预警变量(如:一转多次)各种账户交易变量(如:月均交易金额等);违规风险变量数值为每个从业人员对于上述各项违规风险变量的具体数值,例如,唯一编码为XS0001号的员工,张三对应的年龄为24、罚款为2000、预警一转多次数为20,月均交易金额为8880。其中,唯一标识可通过特定场景编码和员工号组成,例如,特定场景为销售部门的编码为XS,张三的员工号为0001号,则,张三的唯一编码为XS0001。
作为本发明的一个可选实施例,违规风险变量摘选模块210进一步包括:特定场景的从业人员摘选单元、违规风险变量数据选取单元和空值处理单元(图中未示出)。其中,
特定场景的从业人员摘选单元,用于根据特定场景的从业人员行为违规预测指令,从唯一标识子表中摘选属于特定场景的从业人员的唯一编码和与唯一编码对应的从业人员的姓名;其中,特定场景的从业人员行为违规预测指令包括特定场景的名称;
违规风险变量数据选取单元,用于按照预设特定场景的违规风险变量数据摘选规则,从违规风险变量数据子表中摘选与特定场景的名称相对应的违规风险变量,作为特定违规风险变量,并获取与所述唯一编码相对应的特定违规风险变量的违规风险变量数值,得到初级特定场景从业人员违规风险变量数据表;其中,预设特定场景的违规风险变量数据摘选规则包括特定场景的名称和与特定场景的名称对应的所需摘选的违规风险变量;
空值处理单元,用于对初级特定场景从业人员违规风险变量数据表中的违规风险变量数值进行空值处理,得到特定场景从业人员违规风险变量数据表。
具体的,通过特定场景的从业人员摘选单元根据特定场景的从业人员行为违规预测指令中的特定场景的名称,从唯一标识子表中摘选属于特定场景的从业人员的唯一编码和与唯一编码对应的从业人员的姓名,例如,特定场景的从业人员行为违规预测指令指定的对理财销售部门的从业人员进行行为违规风险预测,则根据唯一标识子表中的从业人员从业的特定场景中摘选所有属于理财销售部门的从业人员的唯一编码以及与唯一编码对应的从业人员的姓名。
然后通过违规风险变量数据选取单元按照预设特定场景的违规风险变量数据摘选规则,从违规风险变量数据子表中摘选与特定场景的名称相对应的违规风险变量,作为特定违规风险变量,其中,预设特定场景的违规风险变量数据摘选规则中包括所有特定场景的名称和与特定场景的名称对应的所需摘选的违规风险变量,例如,一个公司有理财销售部门、财务部门、人事部门等三个部门,特定场景的违规风险变量数据摘选规则中包括理财销售部门、财务部门、人事部门,并且包括对每个部门的从业人员进行行为违规风险预测所需要的违规风险变量,例如,理财销售部门需要用到的违规风险变量有罚款,而人事部门不需要用到罚款这项违规风险变量,则,在摘选违规风险变量时,需要根据特定场景的名称进行摘选,完成违规风险变量摘选后,再从违规风险变量数据子表中获取与唯一编码相对应的特定违规风险变量的违规风险变量数值,例如,唯一编码号为XS0001对应的罚款金额为2000。
由于在预设全员违规风险变量总表中可能存在空值的违规风险变量数值,不利于后续的行为违规风险预测计算处理,例如,XS0001需要使用到罚款的违规风险变量数值,但是选取的结果对应的数值为0,此时,需要通过空值处理单元对该空值进行空值处理,使初级特定场景从业人员违规风险变量数据表中所有数值变为数值型数据,得到特定场景从业人员违规风险变量数据表。
作为本发明的一个可选实施例,空值处理单元进一步包括:目标空值识别子单元、目标违规风险变量获取子单元、均值处理子单元和目标空值替换子单元(图中未示出)。其中,
目标空值识别子单元,用于从初级特定场景从业人员违规风险变量数据表中获取数值为空值的违规风险变量数值,作为目标空值;
目标违规风险变量获取子单元,用于获取目标空值对应的特定违规风险变量,作为目标违规风险变量;
均值处理子单元,用于对目标违规风险变量对应的除去数值为空值的违规风险变量数值后剩余的违规风险变量数值进行平均化处理,得到目标违规风险变量均值;
目标空值替换子单元,用于将目标违规风险变量均值替换目标空值,得到特定场景从业人员违规风险变量数据表。
具体的,先从初级特定场景从业人员违规风险变量数据表中获取所有数值为空值的违规风险变量数值作为目标空值,然后获取目标空值对应的特定违规风险变量,作为目标违规风险变量,然后对目标违规风险变量下的所有除去数值为空值的违规风险变量值后剩余的违规风险变量数值进行平均化处理,得到目标违规风险变量均值,最后将目标违规风险变量均值替换目标空值,例如,在一个初级特定场景从业人员违规风险变量数据表中,在罚款这项特定违规风险变量下对应有一项为空值,则,获取罚款下除去该空值项其余所有的违规风险变量数值,并对其余所有的违规风险变量数值进行均值化处理,得到目标违规风险变量均值,将目标违规风险变量均值替换罚款的特定违规风险变量下的空值,得到特定场景从业人员违规风险变量数据表。确保特定场景从业人员违规风险变量数据表中的违规风险变量数值均为数值型数据。
数值标准化模块220,用于对特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表;其中,违规风险变量数据包括违规风险变量和与违规风险变量对应的每个特定场景的从业人员的违规风险变量数值。
具体的,为了便于后续的数据计算处理,需要通过数值标准化模块将特定场景从业人员违规风险变量数据表中的违规风险变量数值转换为标准化数值,从而得到标准化特定场景从业人员违规风险变量数据表。其中,违规风险变量数据包括违规风险变量和与违规风险变量对应的每个特定场景的从业人员的违规风险变量数值。例如,违规风险变量为罚款,则,每个特定场景的从业人员对应于罚款项的具体数值即为违规风险变量数值,例如,张三的罚款金额为2000。
作为本发明的一个可选实施例,数值标准化模块220进一步包括:最大值最小值获取单元和数值标准化处理单元(图中未示出)。其中,
最大值最小值获取单元,用于从特定场景从业人员违规风险变量数据表中获取违规风险变量的违规风险变量数值的最大值和违规风险变量数值的最小值;
数值标准化处理单元,用于根据违规风险变量数值的最大值和违规风险变量数值的最小值,通过预设数值标准化公式对违规风险变量下的违规风险数值进行数值标准化计算处理,得到标准化特定场景从业人员违规风险变量数据表;其中,预设数值标准化公式为:
其中,
xnew为数值标准化处理后得到的标准化违规风险变量数值,xold为未标准化处理的违规风险变量数值,xold_max为违规风险变量数值的最大值,xold_min为违规风险变量数值的最小值。
具体的,通过最大值最小值获取单元从特定场景从业人员违规风险变量数据表中获取每个违规风险变量的违规风险变量数值的最大值和违规风险变量数值的最小值,即,在特定场景从业人员违规风险变量数据表中每一列违规风险变量数值的最大值和最小值,然后通过数值标准化处理单元利用预设数值标准化公式对违规风险变量下的违规风险数值进行数值标准化计算处理,使每一列违规风险变量数值的区间均在[0,1],便于后续的数据矩阵处理。
矩阵乘法处理模块230,用于将标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;其中,变量违规风险值矩阵中每行的变量违规风险值均对应于相应的特定场景的从业人员。
具体的,通过矩阵乘法处理模块230从标准化特定场景从业人员违规风险变量数据表中获取标准化违规风险变量数值,在获取的过程中保持标准化违规风险变量数值行和列的位置,使每个标准化违规风险变量数值在标准化特定场景从业人员违规风险变量数据表中的位置不发生变化,作为变量数值标准矩阵,由于获取标准化违规风险变量数值时保持了每个标准化违规风险变量数值的位置,因此,变量数值标准矩阵中的每一行的标准化违规风险变量数值与相应的特定场景的从业人员对应,每一列的标准化违规风险变量数值与相应的违规风险变量相对应。
再将变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵,其中,预先获取的特定场景的违规风险因子转置矩阵中的特定场景的违规风险因子为预先通过大数据模型训练得到的,每个特定场景所训练得到的违规风险因子转置矩阵可不同。其中,大数据训练出来的特定场景的违规风险因子矩阵将第M行第N列位置的数值转换到第N行第M列后得到的便是特定场景的违规风险因子转置矩阵。变量违规风险值矩阵中每行变量违规风险值均对应于相应的特定场景的从业人员。
作为本发明的一个可选实施例,矩阵乘法处理模块230进一步包括:变量数值标准矩阵选取单元和矩阵乘法处理单元(图中未示出)。其中,
变量数值标准矩阵选取单元,用于将标准化特定场景从业人员违规风险变量数据表中的每行标准化违规风险变量数值和每列标准化违规风险变量数值共同作为变量数值标准矩阵;其中,变量数值标准矩阵中的每行标准化违规风险变量数值均对应于相应的特定场景的从业人员;
矩阵乘法处理单元,用于将变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵。
具体的,通过变量数值标准矩阵选取单元将标准化特定场景从业人员违规风险变量数据表中的每行标准化违规风险变量数值和每列标准化违规风险变量数值共同作为变量数值标准矩阵,使每个标准化违规风险变量数值的位置相对保持不变,通过矩阵乘法处理单元将变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵。为了更好的解释矩阵乘法,举例如下:
例如,设变量标准矩阵为A,特定场景的风险因子转置矩阵为B,变量风险值矩阵为C。则C=AB表示如下所示:
逻辑回归处理模块240,用于对变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值;其中,每行的违规风险回归值均对应于相应的特定场景的从业人员。
具体的,通过逻辑回归处理模块对变量违规风险值矩阵中的每行的变量违规风险值进行逻辑回归处理,得到每个特定场景的从业人员对应的违规风险回归值,通过违规风险回归值计算该从业人员的行为风险概率。
作为本发明的一个可选实施例,逻辑回归处理模块240进一步包括:待回归值计算矩阵获取单元和回归值计算单元(图中未示出)。其中,
待回归值计算矩阵获取单元,用于根据预设变量违规风险值列数提取规则,从变量违规风险值矩阵中提取前N列变量违规风险值,作为待回归值计算矩阵;其中,待回归值计算矩阵中每行变量违规风险值均对应于相应的特定场景的从业人员;
回归值计算单元,用于通过预设逻辑回归计算公式,分别对待回归值计算矩阵中的每行的变量违规风险值进行逻辑回归计算处理,得到每行的违规风险回归值;其中,预设逻辑回归计算公式为:
y=c+β1*Z1+β2*Z2+…+βN*ZN,其中,y为每行的违规风险回归值,Z1表示待回归值计算矩阵中的第1列的违规风险回归值,Z2表示待回归值计算矩阵中的第2列的违规风险回归值,以此类推,ZN表示待回归值计算矩阵中的第N列的违规风险回归值,c及β1,…,βN为预设常数。
具体的,为了便于逻辑回归计算,通过待回归值计算矩阵获取单元根据预设变量违规风险值列数提取规则,保留变量违规风险值矩阵中的前N列变量违规风险值即可,例如,通常保留前十列变量违规风险值,得到待回归值计算矩阵,同样,待回归值计算矩阵中的每一行变量违规风险值均对应于相应的特定场景的从业人员,便于后续筛选预警人员,通过回归值计算单元将待回归值计算矩阵中的每行的变量违规风险值分别代入预设逻辑回归计算公式,分别得到每行的违规风险回归值,即每个特定场景从业人员的违规风险回归值。
违规风险概率计算模块250,用于通过预设从业人员行为违规风险概率计算公式计算出每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率。
具体的,通过违规风险概率计算模块将每行的违规风险回归值即每个特定场景的从业人员的违规风险回归值分别代入预设从业人员行为违规风险概率计算公式中,通过计算得到违规风险回归值所对应的特定场景的从业人员的行为违规风险概率。
作为本发明的一个可选实施例,违规风险概率计算模块250进一步包括:违规风险概率计算单元(图中为示出)。
违规风险概率计算单元,用于将每行的违规风险回归值分别输入预设从业人员行为违规风险概率计算公式,计算出每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;其中,预设从业人员行为违规风险概率计算公式为:
其中,q为特定场景的从业人员的行为违规风险概率,y为特定场景的从业人员对应的违规风险回归值,e为常数。
具体的,通过违规风险概率计算单元将每行的违规风险回归值分别输入从业人员行为违规风险概率计算公式,从而得到与违规风险回归值对应的特定场景的从业人员的行为违规风险概率。
违规预测模块260,用于将行为违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,以完成对特定场景的从业人员的行为违规预测。
具体的,通过违规预测模块将每个特定场景的从业人员的行为违规风险概率与预设行为违规风险阈值进行比较,将违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,获取行为违规预警从业人员的姓名以及唯一编码,对该预警从业人员进行及时干预,将违规行为控制在萌芽状态。
如图3所示,是本发明一个实施例实现基于数据分析的员工行为风险预测方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于数据分析的员工行为风险预测程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于数据分析的员工行为风险预测程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于数据分析的员工行为风险预测程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于数据分析的员工行为风险预测程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表;其中,特定场景从业人员违规风险变量数据表中包括特定场景的从业人员的身份数据和与身份数据对应的违规风险变量数据;
对特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表;其中,违规风险变量数据包括违规风险变量和与违规风险变量对应的每个特定场景的从业人员的违规风险变量数值;
将标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;其中,变量违规风险值矩阵中每行的变量违规风险值均对应于相应的特定场景的从业人员;
对变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值;其中,每行的违规风险回归值均对应于相应的所述特定场景的从业人员;
通过预设从业人员行为违规风险概率计算公式计算出每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;
将行为违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,以完成对特定场景的从业人员的行为违规预测。
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。需要强调的是,为进一步保证上述所述预设全员违规风险变量总表的私密和安全性,上述预设全员违规风险变量总表还可以存储于一区块链的节点中。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (9)
1.一种基于数据分析的员工行为风险预测方法,应用于电子装置,其特征在于,所述方法包括:
从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表;
对所述特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表;
将所述标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;其中包括:将所述标准化特定场景从业人员违规风险变量数据表中的每行标准化违规风险变量数值和每列标准化违规风险变量数值共同作为变量数值标准矩阵;其中,所述变量数值标准矩阵中的每行标准化违规风险变量数值均对应于相应的特定场景的从业人员;将所述变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;
对所述变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值;
通过预设从业人员行为违规风险概率计算公式计算出所述每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;
将所述行为违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,以完成对所述特定场景的从业人员的行为违规预测;
其中,所述对所述变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值包括:
根据预设变量违规风险值列数提取规则,从所述变量违规风险值矩阵中提取前N列变量违规风险值,作为待回归值计算矩阵;其中,所述待回归值计算矩阵中每行变量违规风险值均对应于相应的特定场景的从业人员;
通过预设逻辑回归计算公式,分别对所述待回归值计算矩阵中的每行的变量违规风险值进行逻辑回归计算处理,得到每行的违规风险回归值;其中,所述预设逻辑回归计算公式为:
y=c+β1*Z1+β2*Z2+…+βN*ZN,其中,y为每行的违规风险回归值,Z1表示待回归值计算矩阵中的第1列的违规风险回归值,Z2表示待回归值计算矩阵中的第2列的违规风险回归值,以此类推,ZN表示待回归值计算矩阵中的第N列的违规风险回归值,c及β1,…,βN为预设常数。
2.根据权利要求1所述的基于数据分析的员工行为风险预测方法,其特征在于,所述预设全员违规风险变量总表存储于区块链中,所述预设全员违规风险变量总表包括:
用于记录从业人员唯一身份数据的唯一标识子表和用于记录与所述从业人员唯一身份数据相对应的各项违规风险变量数据的违规风险变量数据子表;其中,
所述唯一标识子表包括:所述从业人员的唯一编码、与所述唯一编码对应的从业人员的姓名和与所述唯一编码相对应的从业人员从业的特定场景;
所述违规风险变量数据子表包括:违规风险变量和与所述唯一编码相对应的违规风险变量的违规风险变量数值。
3.根据权利要求2所述的基于数据分析的员工行为风险预测方法,其特征在于,所述从预设全员违规风险变量总表中摘选所述特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表包括:
根据特定场景的从业人员行为违规预测指令,从所述唯一标识子表中摘选属于所述特定场景的从业人员的唯一编码和与所述唯一编码对应的从业人员的姓名;其中,所述特定场景的从业人员行为违规预测指令包括所述特定场景的名称;
按照预设特定场景的违规风险变量数据摘选规则,从所述违规风险变量数据子表中摘选与所述特定场景的名称相对应的违规风险变量,作为特定违规风险变量,并获取与所述唯一编码相对应的所述特定违规风险变量的违规风险变量数值,得到初级特定场景从业人员违规风险变量数据表;其中,所述预设特定场景的违规风险变量数据摘选规则包括特定场景的名称和与所述特定场景的名称对应的所需摘选的违规风险变量;
对所述初级特定场景从业人员违规风险变量数据表中的违规风险变量数值进行空值处理,得到特定场景从业人员违规风险变量数据表。
4.根据权利要求3所述的基于数据分析的员工行为风险预测方法,其特征在于,所述对所述初级特定场景从业人员违规风险变量数据表中的违规风险变量数值进行空值处理,得到特定场景从业人员违规风险变量数据表包括:
从所述初级特定场景从业人员违规风险变量数据表中获取数值为空值的违规风险变量数值,作为目标空值;
获取所述目标空值对应的特定违规风险变量,作为目标违规风险变量;
对所述目标违规风险变量对应的除去数值为空值的违规风险变量数值后剩余的违规风险变量数值进行平均化处理,得到目标违规风险变量均值;
将所述目标违规风险变量均值替换所述目标空值,得到特定场景从业人员违规风险变量数据表。
5.根据权利要求1所述的基于数据分析的员工行为风险预测方法,其特征在于,所述对所述特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表包括:
从所述特定场景从业人员违规风险变量数据表中获取所述违规风险变量的违规风险变量数值的最大值和违规风险变量数值的最小值;
根据所述违规风险变量数值的最大值和所述违规风险变量数值的最小值,通过预设数值标准化公式对所述违规风险变量下的违规风险数值进行数值标准化计算处理,得到标准化特定场景从业人员违规风险变量数据表;其中,所述预设数值标准化公式为:
其中,
xnew为数值标准化处理后得到的标准化违规风险变量数值,xold为未标准化处理的违规风险变量数值,xold_max为违规风险变量数值的最大值,xold_min为违规风险变量数值的最小值。
6.根据权利要求1所述的基于数据分析的员工行为风险预测方法,其特征在于,所述通过预设从业人员行为违规风险概率计算公式计算出所述每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率包括:
将每行的违规风险回归值分别输入预设从业人员行为违规风险概率计算公式,计算出每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;其中,所述预设从业人员行为违规风险概率计算公式为:
其中,q为特定场景的从业人员的行为违规风险概率,y为特定场景的从业人员对应的违规风险回归值,e为常数。
7.一种基于数据分析的员工行为风险预测装置,其特征在于,所述装置包括:
违规风险变量摘选模块,用于从预设全员违规风险变量总表中摘选特定场景的从业人员的违规风险变量数据,得到特定场景从业人员违规风险变量数据表;
数值标准化模块,用于对所述特定场景从业人员违规风险变量数据表中的违规风险变量数据的违规风险变量数值进行数值标准化处理,得到标准化特定场景从业人员违规风险变量数据表;
矩阵乘法处理模块,用于将所述标准化特定场景从业人员违规风险变量数据表中的标准化违规风险变量数值作为变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;
逻辑回归处理模块,用于对所述变量违规风险值矩阵中的每行的变量违规风险值分别进行逻辑回归处理,得到每行的违规风险回归值;
违规风险概率计算模块,用于通过预设从业人员行为违规风险概率计算公式计算出所述每行的违规风险回归值所对应的特定场景的从业人员的行为违规风险概率;
违规预测模块,用于将所述行为违规风险概率大于预设行为违规风险阈值的特定场景的从业人员作为行为违规预警从业人员,以完成对所述特定场景的从业人员的行为违规预测;
其中,所述矩阵乘法处理模块进一步包括:
变量数值标准矩阵选取单元,用于将所述标准化特定场景从业人员违规风险变量数据表中的每行标准化违规风险变量数值和每列标准化违规风险变量数值共同作为变量数值标准矩阵;其中,所述变量数值标准矩阵中的每行标准化违规风险变量数值均对应于相应的特定场景的从业人员;
矩阵乘法处理单元,用于将所述变量数值标准矩阵与预先获取的特定场景的违规风险因子转置矩阵进行矩阵乘法处理,得到变量违规风险值矩阵;
所述逻辑回归处理模块进一步包括:
待回归值计算矩阵获取单元,用于根据预设变量违规风险值列数提取规则,从所述变量违规风险值矩阵中提取前N列变量违规风险值,作为待回归值计算矩阵;其中,所述待回归值计算矩阵中每行变量违规风险值均对应于相应的特定场景的从业人员;
回归值计算单元,用于通过预设逻辑回归计算公式,分别对所述待回归值计算矩阵中的每行的变量违规风险值进行逻辑回归计算处理,得到每行的违规风险回归值;其中,所述预设逻辑回归计算公式为:
y=c+β1*Z1+β2*Z2+…+βN*ZN,其中,y为每行的违规风险回归值,Z1表示待回归值计算矩阵中的第1列的违规风险回归值,Z2表示待回归值计算矩阵中的第2列的违规风险回归值,以此类推,ZN表示待回归值计算矩阵中的第N列的违规风险回归值,c及β1,…,βN为预设常数。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6中任一所述的基于数据分析的员工行为风险预测方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一所述的基于数据分析的员工行为风险预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111055105.3A CN113780804B (zh) | 2021-09-09 | 2021-09-09 | 基于数据分析的员工行为风险预测方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111055105.3A CN113780804B (zh) | 2021-09-09 | 2021-09-09 | 基于数据分析的员工行为风险预测方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780804A CN113780804A (zh) | 2021-12-10 |
CN113780804B true CN113780804B (zh) | 2024-03-12 |
Family
ID=78842154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111055105.3A Active CN113780804B (zh) | 2021-09-09 | 2021-09-09 | 基于数据分析的员工行为风险预测方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780804B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615280A (zh) * | 2019-01-25 | 2019-04-12 | 平安科技(深圳)有限公司 | 员工数据处理方法、装置、计算机设备和存储介质 |
CN110009224A (zh) * | 2019-04-02 | 2019-07-12 | 深圳市华云中盛科技有限公司 | 嫌疑人违规概率预测方法、装置、计算机设备及存储介质 |
CN111754044A (zh) * | 2020-06-30 | 2020-10-09 | 深圳前海微众银行股份有限公司 | 员工行为审计方法、装置、设备及可读存储介质 |
-
2021
- 2021-09-09 CN CN202111055105.3A patent/CN113780804B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615280A (zh) * | 2019-01-25 | 2019-04-12 | 平安科技(深圳)有限公司 | 员工数据处理方法、装置、计算机设备和存储介质 |
CN110009224A (zh) * | 2019-04-02 | 2019-07-12 | 深圳市华云中盛科技有限公司 | 嫌疑人违规概率预测方法、装置、计算机设备及存储介质 |
CN111754044A (zh) * | 2020-06-30 | 2020-10-09 | 深圳前海微众银行股份有限公司 | 员工行为审计方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113780804A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112562836A (zh) | 医生推荐方法、装置、电子设备及存储介质 | |
CN113592019B (zh) | 基于多模型融合的故障检测方法、装置、设备及介质 | |
CN113626606B (zh) | 信息分类方法、装置、电子设备及可读存储介质 | |
CN112016905B (zh) | 基于审批流程的信息展示方法、装置、电子设备及介质 | |
WO2021151291A1 (zh) | 疾病风险的分析方法、装置、电子设备及计算机存储介质 | |
CN113707337A (zh) | 基于多源数据的疾病预警方法、装置、设备及存储介质 | |
CN115081538A (zh) | 基于机器学习的客户关系识别方法、装置、设备及介质 | |
CN117151655B (zh) | 一种用于多项目检测结果综合分析管理系统及方法 | |
CN114220541A (zh) | 疾病预测方法、装置、电子设备及存储介质 | |
CN113780804B (zh) | 基于数据分析的员工行为风险预测方法、装置及存储介质 | |
CN116843481A (zh) | 知识图谱分析方法、装置、设备及存储介质 | |
CN117193975A (zh) | 任务调度方法、装置、设备及存储介质 | |
CN113657546B (zh) | 信息分类方法、装置、电子设备及可读存储介质 | |
CN116779184A (zh) | 疫苗安全性准实时监测的方法、系统及设备和存储介质 | |
CN116313016A (zh) | 医疗物资调配方法、装置、电子设备及计算机可读存储介质 | |
CN114742412A (zh) | 一种软件技术服务系统及方法 | |
CN114996386A (zh) | 业务角色识别方法、装置、设备及存储介质 | |
CN114662095A (zh) | 基于操作数据的安全监测方法、装置、设备及存储介质 | |
CN114372892A (zh) | 支付数据监控方法、装置、设备及介质 | |
CN114240677A (zh) | 医疗数据风险识别方法、装置、电子设备及存储介质 | |
CN111651652B (zh) | 基于人工智能的情感倾向识别方法、装置、设备及介质 | |
CN113724891A (zh) | 医院疫情监测方法、装置及相关设备 | |
CN113706111A (zh) | 医疗机构流程数据的处理方法、装置、设备及介质 | |
CN112288338B (zh) | 用户活动监测方法、装置、设备及介质 | |
CN113408424B (zh) | 用品识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |