CN111105148A - 离职概率评估方法、装置及计算机可读存储介质 - Google Patents

离职概率评估方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111105148A
CN111105148A CN201911228704.3A CN201911228704A CN111105148A CN 111105148 A CN111105148 A CN 111105148A CN 201911228704 A CN201911228704 A CN 201911228704A CN 111105148 A CN111105148 A CN 111105148A
Authority
CN
China
Prior art keywords
evaluation
probability
feature data
job leaving
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911228704.3A
Other languages
English (en)
Other versions
CN111105148B (zh
Inventor
孙川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN201911228704.3A priority Critical patent/CN111105148B/zh
Publication of CN111105148A publication Critical patent/CN111105148A/zh
Application granted granted Critical
Publication of CN111105148B publication Critical patent/CN111105148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开的实施例公开了一种离职概率评估方法、装置及计算机可读存储介质。该方法包括:获取评估对象的第一静态特征数据和第一动态特征数据;将第一静态特征数据输入第一离职概率评估模型,以获得第一离职概率评估模型输出的第一评估结果;将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果;根据第二评估结果,确定评估对象的预测离职概率。与现有技术相比,在预测离职概率时,本公开的实施例能够较好地保证预测结果的准确度。

Description

离职概率评估方法、装置及计算机可读存储介质
技术领域
本公开涉及数据处理技术领域,尤其是一种离职概率评估方法、装置及计算机可读存储介质。
背景技术
对于企业而言,员工是必不可少的组成部分,预测员工的离职想法是一个具有重大研究意义的问题。目前,常用的预测方法为人为判定,例如,管理人员可以根据与员工的面谈结果,以及员工的业绩,预测员工的离职概率,这种方法的预测结果具有很强的主观性,且管理人员对员工的熟悉程度会极大地影响到预测结果,因此,这种方法的预测结果的准确度较低。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种离职概率评估方法、装置及计算机可读存储介质。
根据本公开实施例的一个方面,提供了一种离职概率评估方法,包括:
获取评估对象的第一静态特征数据和第一动态特征数据;
将所述第一静态特征数据输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的第一评估结果;
将所述第一评估结果和所述第一动态特征数据输入第二离职概率评估模型,以获得所述第二离职概率评估模型输出的第二评估结果;
根据所述第二评估结果,确定所述评估对象的预测离职概率。
在一个可选示例中,
所述获取评估对象的第一静态特征数据和第一动态特征数据,包括:
获取评估对象的,与M个日期对应的M个第一静态特征数据和M个第一动态特征数据;其中,M为大于1的自然数;
所述将所述第一静态特征数据输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的第一评估结果,包括:
将M个所述第一静态特征数据分别输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的M个第一评估结果;
所述将所述第一评估结果和所述第一动态特征数据输入第二离职概率评估模型,包括:
将按照所对应日期的先后顺序排列的M个所述第一评估结果,以及按照所对应日期的先后顺序排列的M个所述第一动态特征数据一并输入第二离职概率评估模型。
在一个可选示例中,训练得到所述第一离职概率评估模型的方式为:
以多个参考对象中的每个所述参考对象的第二静态特征数据作为输入内容,以每个所述参考对象的第一目标数据作为输出内容进行训练,从而得到所述第一离职概率评估模型;
其中,所述参考对象对应的第一目标数据用于表征:在所述参考对象的第二静态特征数据对应的日期后的第一预设时长内,所述参考对象是否离职。
在一个可选示例中,训练得到所述第二离职概率评估模型的方式为:
获取多个参考对象中的每个所述参考对象的,与M个日期对应的M个第三静态特征数据和M个第二动态特征数据;
针对每个所述参考对象,将其的M个所述第三静态特征数据分别输入所述第一离职概率评估模型,以获得所述第一离职概率评估模型输出的M个第三评估结果;
以每个所述参考对象对应的第二目标数据作为输入内容,以每个所述参考对象对应的第三目标数据作为输出内容进行训练,从而得到所述第二离职概率评估模型;
其中,所述参考对象对应的第二目标数据中包括:与所述参考对象对应的,按照所对应日期的先后顺序排列的M个所述第三评估结果,以及与所述参考对象对应的,按照所对应日期的先后顺序排列的M个所述第二动态特征数据;
所述参考对象对应的第三目标数据用于表征:在第四静态特征数据对应的日期后的第二预设时长内,所述参考对象是否离职,所述第四静态特征数据为与所述参考对象对应的M个所述第三静态特征数据中,所对应日期最晚的所述第三静态特征数据。
在一个可选示例中,
所述获取评估对象的第一静态特征数据和第一动态特征数据之后,所述方法还包括:
将所述第一静态特征数据输入第三离职概率评估模型,以获得所述第三离职概率评估模型输出的第四评估结果:
所述根据所述第二评估结果,确定所述评估对象的预测离职概率,包括:
根据所述第二评估结果和所述第四评估结果,确定所述评估对象的预测离职概率。
在一个可选示例中,所述第二评估结果为所述评估对象的第一参考离职概率,所述第四评估结果为所述评估对象的第二参考离职概率;
所述根据所述第二评估结果和所述第四评估结果,确定所述评估对象的预测离职概率,包括:
将所述第一参考离职概率和所述第二参考离职概率进行加权求和,将加权求和结果作为所述评估对象的预测离职概率。
在一个可选示例中,训练得到所述第三离职概率评估模型的方式为:
以多个参考对象中的每个所述参考对象的第四静态特征数据作为输入内容,以每个所述参考对象对应的第四目标数据作为输出内容进行训练,从而得到所述第三离职概率评估模型;
其中,所述参考对象对应的第四目标数据用于表征:在所述参考对象的第四静态特征数据对应的日期后的第三预设时长内,所述参考对象是否离职。
在一个可选示例中,所述获取评估对象的第一静态特征数据和第一动态特征数据,包括:
获取评估对象的第一原始特征数据;
对所述第一原始特征数据进行数据清洗;
从经数据清洗后的所述第一原始特征数据中,获取所述评估对象的第一静态特征数据和第一动态特征数据。
在一个可选示例中,所述对所述第一原始特征数据进行数据清洗,包括以下至少一项:
在所述第一原始特征数据的第一特征数据满足预设过滤条件的情况下,删除所述第一特征数据;
对所述第一原始特征数据中离散型的第二特征数据进行独热编码处理;
在所述第一原始特征数据中的第三特征数据和第四特征数据之间满足预设交叉条件的情况下,对所述第三特征数据和所述第四特征数据进行特征交叉处理;
在所述第一原始特征数据中具有静态属性的第五特征数据中含有缺失值的情况下,向所述第五特征数据中填充空值标识;
在所述第一原始特征数据中具有动态属性的第六特征数据中含有缺失值的情况下,向所述第六特征数据中填充默认值标识。
在一个可选示例中,
所述第一静态特征数据中包括以下至少一项:基础特征数据、业绩特征数据、积分特征数据、区域特征数据、门店特征数据、店组特征数据;
所述第一动态特征数据中包括以下至少一项:行为特征数据、排名特征数据、离职特征数据。
根据本公开实施例的一个方面,提供了一种离职概率评估装置,包括:
第一获取模块,用于获取评估对象的第一静态特征数据和第一动态特征数据;
第二获取模块,用于将所述第一静态特征数据输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的第一评估结果;
第三获取模块,用于将所述第一评估结果和所述第一动态特征数据输入第二离职概率评估模型,以获得所述第二离职概率评估模型输出的第二评估结果;
确定模块,用于根据所述第二评估结果,确定所述评估对象的预测离职概率。
在一个可选示例中,
所述第一获取模块,具体用于:
获取评估对象的,与M个日期对应的M个第一静态特征数据和M个第一动态特征数据;其中,M为大于1的自然数;
所述第二获取模块,具体用于:
将M个所述第一静态特征数据分别输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的M个第一评估结果;
所述第三获取模块,具体用于:
将按照所对应日期的先后顺序排列的M个所述第一评估结果,以及按照所对应日期的先后顺序排列的M个所述第一动态特征数据一并输入第二离职概率评估模型。
在一个可选示例中,所述第一离职概率评估模型利用第一训练模块训练得到:
所述第一训练模块,具体用于以多个参考对象中的每个所述参考对象的第二静态特征数据作为输入内容,以每个所述参考对象的第一目标数据作为输出内容进行训练,从而得到所述第一离职概率评估模型;
其中,所述参考对象对应的第一目标数据用于表征:在所述参考对象的第二静态特征数据对应的日期后的第一预设时长内,所述参考对象是否离职。
在一个可选示例中,所述第二离职概率评估模型利用第二训练模型训练得到:
所述第二训练模块,包括:
第一获取单元,用于获取多个参考对象中的每个所述参考对象的,与M个日期对应的M个第三静态特征数据和M个第二动态特征数据;
第二获取单元,用于针对每个所述参考对象,将其的M个所述第三静态特征数据分别输入所述第一离职概率评估模型,以获得所述第一离职概率评估模型输出的M个第三评估结果;
训练单元,用于以每个所述参考对象对应的第二目标数据作为输入内容,以每个所述参考对象对应的第三目标数据作为输出内容进行训练,从而得到所述第二离职概率评估模型;
其中,所述参考对象对应的第二目标数据中包括:与所述参考对象对应的,按照所对应日期的先后顺序排列的M个所述第三评估结果,以及与所述参考对象对应的,按照所对应日期的先后顺序排列的M个所述第二动态特征数据;
所述参考对象对应的第三目标数据用于表征:在第四静态特征数据对应的日期后的第二预设时长内,所述参考对象是否离职,所述第四静态特征数据为与所述参考对象对应的M个所述第三静态特征数据中,所对应日期最晚的所述第三静态特征数据。
在一个可选示例中,
所述装置还包括:
第四获取模块,用于在获取评估对象的第一静态特征数据和第一动态特征数据之后,将所述第一静态特征数据输入第三离职概率评估模型,以获得所述第三离职概率评估模型输出的第四评估结果:
所述确定模块,具体用于:
根据所述第二评估结果和所述第四评估结果,确定所述评估对象的预测离职概率。
在一个可选示例中,所述第二评估结果为所述评估对象的第一参考离职概率,所述第四评估结果为所述评估对象的第二参考离职概率;
所述确定模块,具体用于:
将所述第一参考离职概率和所述第二参考离职概率进行加权求和,将加权求和结果作为所述评估对象的预测离职概率。
在一个可选示例中,所述第三离职概率评估模型利用第三训练模块训练得到:
所述第三训练模块,具体用于以多个参考对象中的每个所述参考对象的第四静态特征数据作为输入内容,以每个所述参考对象对应的第四目标数据作为输出内容进行训练,从而得到所述第三离职概率评估模型;
其中,所述参考对象对应的第四目标数据用于表征:在所述参考对象的第四静态特征数据对应的日期后的第三预设时长内,所述参考对象是否离职。
在一个可选示例中,所述第一获取模块,包括:
第三获取单元,用于获取评估对象的第一原始特征数据;
数据清洗单元,用于对所述第一原始特征数据进行数据清洗;
第四获取单元,用于从经数据清洗后的所述第一原始特征数据中,获取所述评估对象的第一静态特征数据和第一动态特征数据。
在一个可选示例中,所述数据清洗单元,具体用于以下至少一项:
在所述第一原始特征数据的第一特征数据满足预设过滤条件的情况下,删除所述第一特征数据;
对所述第一原始特征数据中离散型的第二特征数据进行独热编码处理;
在所述第一原始特征数据中的第三特征数据和第四特征数据之间满足预设交叉条件的情况下,对所述第三特征数据和所述第四特征数据进行特征交叉处理;
在所述第一原始特征数据中具有静态属性的第五特征数据中含有缺失值的情况下,向所述第五特征数据中填充空值标识;
在所述第一原始特征数据中具有动态属性的第六特征数据中含有缺失值的情况下,向所述第六特征数据中填充默认值标识。
在一个可选示例中,
所述第一静态特征数据中包括以下至少一项:基础特征数据、业绩特征数据、积分特征数据、区域特征数据、门店特征数据、店组特征数据;
所述第一动态特征数据中包括以下至少一项:行为特征数据、排名特征数据、离职特征数据。
根据本公开实施例的再一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述离职概率评估方法。
根据本公开实施例的又一个方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述离职概率评估方法。
基于本公开上述实施例提供的离职概率评估方法、装置、计算机可读存储介质及电子设备,在获取评估对象的第一静态特征数据和第一动态特征数据后,可以将第一静态特征数据输入第一离职概率评估模型,以获得第一离职概率评估模型输出的第一评估结果。接下来,可以将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果;之后,可以根据第二评估结果,确定评估对象的预测离职概率。可见,本公开的实施例中,可以使用评估对象的第一静态特征数据和第一动态特征数据,以及第一离职概率评估模型和第二离职概率评估模型,进行离职概率的预测,第一离职概率评估模型和第二离职概率评估模型均是使用非常客观的样本数据进行训练后得到的,且第一静态特征数据和第一动态特征数据均能够对评估对象的特征进行有效地表征,因此,与现有技术相比,在预测离职概率时,本公开的实施例能够较好地保证预测结果的准确度。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1是本公开一示例性实施例提供的离职概率评估方法的流程示意图。
图2是本公开另一示例性实施例提供的离职概率评估方法的流程示意图。
图3是本公开再一示例性实施例提供的离职概率评估方法的流程示意图。
图4为本公开的实施例中的离职概率评估系统的架构图。
图5是本公开的实施例中的离职概率评估系统的工作原理图。
图6是本公开一示例性实施例提供的离职概率评估装置的结构示意图。
图7是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,不代表任何特定技术含义和必然逻辑顺序;“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本公开中字符“/”表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
示例性方法
图1是本公开一示例性实施例提供的离职概率评估方法的流程示意图。图1所示的方法包括步骤101、步骤102、步骤103和步骤104,下面对各步骤分别进行说明。
步骤101,获取评估对象的第一静态特征数据和第一动态特征数据。
这里,需要预测员工离职想法的企业可以为房企,房企下的房产经纪人能够联通房产交易的各个环节,为用户提供专业服务,但房产经纪人岗位具有入行门槛高、行业竞争大、收入难以保证、招收新人难、培养成本高、培养周期长、离职概率高等特点,有鉴于此,步骤101中的评估对象可以为房产经纪人,例如为入职超过30天的综合房产经纪人;其中,综合房产经纪人是指针对新房业务和二手房业务,均可以为用户提供专业服务的房产经纪人。为了便于理解,本公开的实施例中均以评估对象为房产经纪人的情况为例进行说明。
需要说明的是,第一静态特征数据中的每一特征数据可以均具有静态属性,第一动态特征数据中的每一特征数据可以均具有动态属性。可选地,第一静态特征数据中可以包括以下至少一项:基础特征数据、业绩特征数据、积分特征数据、区域特征数据、门店特征数据、店组特征数据;第一动态特征数据中可以包括以下至少一项:行为特征数据、排名特征数据、离职特征数据。
下面对第一静态特征数据和第一动态特征数据中可能出现的各种数据进行举例介绍。
基础特征数据包括但不限于评估对象的年龄、性别、籍贯、家庭住址、入职时长、从业时长等。
业绩特征数据包括但不限于评估对象的新房总成交量、新房月平均成交量、二手房总成交量、二手房月平均成交量等。
积分特征数据可以表征评估对象的积分多少,积分多少可以与评估对象的职位等级、业绩、考勤等挂钩,例如,积分多少可以与职位等级正相关。
区域特征数据可以包括大区特征数据和城市特征数据,大区特征数据可以表征评估对象归属于哪个大区(例如归属于华中大区、华南大区等),城市特征数据可以表征评估对象归属于哪个城市的门店。
门店特征数据可以表征评估对象具体归属于哪个门店,例如,北京可以开设有房企的100个门店(例如为门店1至门店100),门店特征数据可以表征评估对象具体归属于门店66。
店组特征数据可以表征评估对象所在小组的特征信息,例如,门店66下的所有房产经纪人划分为三个小组,评估对象位于第三小组,店组特征数据可以包括第三小组的人数及人员构成情况。
行为特征数据包括但不限于评估对象最近一段时间内(例如最近三天、最近一周内)带客户看房的总次数,评估对象最近一段时间内登录房企的应用程序(Application,APP)的总次数等。
排名特征数据包括但不限于评估对象最近一段时间内带客户看房的总次数在所在门店所有房产经纪人中的排名,评估对象最近一段内时间内登录房企的APP的总次数在所在门店所有房产经纪人中的排名等。
离职特征数据包括但不限于评估对象最近一段时间内的缺勤次数、评估对象所在门店最近一段时间内的离职总人数、评估对象所在小组最近一段时间内的离职总人数等。
步骤102,将第一静态特征数据输入第一离职概率评估模型,以获得第一离职概率评估模型输出的第一评估结果。
这里,第一离职概率评估模型可以为通过对大量的样本数据进行训练后得到的,用于预测房产经纪人的离职概率的模型,训练时使用的训练工具包括但不限于极端梯度提升(eXtreme Gradient Boosting,XGBoost)、分布式梯度提升框(Light GradientBoosting Machine,LightGBM)、随机森林(Random Forest)等。
可以理解的是,XGBoost是一种大规模并行提升树的算法工具,相比传统的梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法,XGBoost对代价函数进行了二阶泰勒展开,同时用到了一阶和二阶导数,并且在代价函数中加入了正则项,这样一方面能够控制模型的复杂度,另一方面能够提升模型效果,降低过拟合。
LightGBM是一个梯度boosting框架,由于提出了直方图(即Histogram)算法以及直方图做差加速等算法,在训练速度、内存占用以及模型效果方面,相比XGBoost都具有一定程度的提升。
Random Forest是一种集成学习的方法,为了解决单个模型或者某一组参数的模型所固有的缺陷,整合更多的决策树,取长补短,以避免局限性,并合起来用于预测最终结果。
在获取评估对象的第一静态特征数据之后,可以将第一静态特征数据提供给第一离职概率评估模型,第一离职概率评估模型可以输出第一评估结果。可选地,第一评估结果可以为第一离职概率评估模型预测的,评估对象的离职概率;或者,第一评估结果可以为第一离职概率评估模型预测的,评估对象的不离职概率。
步骤103,将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果。
这里,第二离职概率评估模型可以为通过对大量的样本数据进行训练后得到的,用于预测房产经纪人的离职概率的模型,训练时使用的训练工具包括但不限于XGBoost、LightGBM、Random Forest等。
需要指出的是,第二离职概率评估模型与第一离职概率评估模型训练时使用的样本数据是存在差异的。具体而言,第一离职概率评估模型训练时使用的样本数据中可以包括静态特征数据,第二离职概率评估模型训练时使用的样本数据中可以包括动态特征数据以及与静态特征数据相关的数据,这样,第一离职概率评估模型可以认为是静态模型,第二离职概率评估模型可以认为是动态模型。
在获得第一评估结果之后,可以将第一评估结果和第一动态特征数据均提供给第二离职概率评估模型,第二离职概率评估模型可以输出第二评估结果。可选地,第二评估结果可以为第二离职概率评估模型预测的,评估对象的离职概率(相当于下文中的第一参考离职概率);或者,第二评估结果可以为第二离职概率评估模型预测的,评估对象的不离职概率(该不离职概率与第一参考离职概率的和值为1)。
步骤104,根据第二评估结果,确定评估对象的预测离职概率。
这里,可以仅依据第二评估结果,确定评估对象的预测离职概率,或者,可以结合第二评估结果和其他信息,确定评估对象的预测离职概率,为了布局清楚,后续对具体确定方式进行举例介绍。
需要指出的是,预测离职概率可以作为本公开的实施例最终得到的,评估对象的离职概率,后续可以根据预测离职概率,采取相应的处理措施。例如,在预测离职概率大于预设概率(例如0.6、0.7、0.8等)的情况下,可以将评估对象作为高危离职人员,分析高危离职人员的离职原因,生成包括高危离职人员的高危名单,并通过邮件方式,周期性地向房企的管理人员推送高危名单。之后,管理人员可以根据高危名单,采取各种方式挽留高危人群,以减少房产经纪人的离职率,提升房产经纪人的留存率,延长房产经纪人的职业时间,减少管理人员的时间成本,减少房企的人力成本和管理成本。
本公开的实施例中,在获取评估对象的第一静态特征数据和第一动态特征数据后,可以将第一静态特征数据输入第一离职概率评估模型,以获得第一离职概率评估模型输出的第一评估结果。接下来,可以将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果;之后,可以根据第二评估结果,确定评估对象的预测离职概率。可见,本公开的实施例中,可以使用评估对象的第一静态特征数据和第一动态特征数据,以及第一离职概率评估模型和第二离职概率评估模型,进行离职概率的预测,第一离职概率评估模型和第二离职概率评估模型均是使用非常客观的样本数据进行训练后得到的,且第一静态特征数据和第一动态特征数据均能够对评估对象的特征进行有效地表征,因此,与现有技术相比,在预测离职概率时,本公开的实施例能够较好地保证预测结果的准确度。
图2是本公开另一示例性实施例提供的离职概率评估方法的流程示意图。图2所示的方法包括步骤201、步骤202、步骤203和步骤204,下面对各步骤分别进行说明。
步骤201,获取评估对象的,与M个日期对应的M个第一静态特征数据和M个第一动态特征数据;其中,M为大于1的自然数。
这里,M个日期可以对应连续M天,M的取值可以为3、4、5、7、8、10或者其他大于1的自然数,在此不再一一列举。
步骤202,将M个第一静态特征数据分别输入第一离职概率评估模型,以获得第一离职概率评估模型输出的M个第一评估结果。
这里,M个第一评估结果与M个第一静态特征数据之间可以为一一对应的关系,那么,M个第一评估结果与M个日期之间也可以为一一对应的关系。
步骤203,将按照所对应日期的先后顺序排列的M个第一评估结果,以及按照所对应日期的先后顺序排列的M个第一动态特征数据一并输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果。
这里,按照所对应日期的先后顺序排列的M个第一评估结果可以组成一评估结果序列,按照所对应日期的先后顺序排列的M个第一动态特征数据可以组成一动态特征数据序列,第二离职概率评估模型可以基于该评估结果序列和该动态特征数据序列,得到并输出第二评估结果。
步骤204,根据第二评估结果,确定评估对象的预测离职概率。
需要说明的是,步骤204的具体实施过程参照对步骤104的说明即可,在此不再赘述。
具体地,假设M为10,则可以获取评估对象最近10天对应的10个第一静态特征数据和10个第一动态特征数据;其中,10个第一静态特征数据可以按照所对应日期由早至晚的顺序排列,这时,10个第一静态特征数据可以依次表示为J10、J11、……、J19;10个第一动态特征数据可以按照所对应日期由早至晚的顺序排列,这时,10个第一动态特征数据可以依次表示为D10、D11、……、D19。
接下来,可以将J10、J11、……、J19分别输入第一离职概率评估模型,以获得第一离职概率评估模型输出的10个第一评估结果,10个第一评估结果可以依次表示为P10、P11、……、P19;其中,P10与J10对应,P11与J11对应,P19与J19对应。
之后,可以将由顺序排列的P10、P11、……、P19组成的评估结果序列,以及由顺序排列的D10、D11、……、D19组成的动态特征数据序列输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果P20。
最后,可以根据P20,确定评估对象的预测离职概率。
本公开的实施例中,在获取评估对象的,与M个日期对应的M个第一静态特征数据和M个第一动态特征数据之后,可以将M个第一静态特征数据分别输入第一离职概率评估模型,以获得第一离职概率评估模型输出的M个第一评估结果。接下来,可以将按照所对应日期的先后顺序排列的M个第一评估结果,以及按照所对应日期的先后顺序排列的M个第一动态特征数据一并输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果;之后,可以根据第二评估结果,确定评估对象的预测离职概率。可见,本公开的实施例中,可以使用评估对象的第一静态特征数据和第一动态特征数据,以及第一离职概率评估模型和第二离职概率评估模型,进行离职概率的预测,第一离职概率评估模型和第二离职概率评估模型均是使用非常客观的样本数据进行训练后得到的,且第一静态特征数据和第一动态特征数据均能够对评估对象的特征进行有效地表征,因此,与现有技术相比,在预测离职概率时,本公开的实施例能够较好地保证预测结果的准确度。
另外,在实际预测过程中,将评估结果序列和动态特征数据序列提供给了第二离职概率评估模型,这相当于为第二离职概率评估模型提供了时序特征,这样能够结合评估对象的特征波动情况进行离职概率的预测,以解决滞后性问题,且引入稳定性分析,从而提高预测能力,进一步保证预测结果的准确度。
在一个可选示例中,训练得到第一离职概率评估模型的方式为:
以多个参考对象中的每个参考对象的第二静态特征数据作为输入内容,以每个参考对象对应的第一目标数据作为输出内容进行训练,从而得到第一离职概率评估模型;
其中,参考对象对应的第一目标数据用于表征:在参考对象的第二静态特征数据对应的日期后的第一预设时长内,参考对象是否离职。
这里,多个参考对象中的“多个”可以为5000个、10000个、20000个、50000个等,第一预设时长可以为15天、20天、30天等,在此不再一一列举。
需要说明的是,第二静态特征数据中包括的数据参照上述实施例中对第一静态特征数据中包括的数据的说明即可,在此不再赘述。
具体实施时,可以先确定房企的10000个房产经纪人,这10000个房产经纪人中可以同时包括已离职的房产经纪人和未离职的房产经纪人,已离职的房产经纪人和未离职的房产经纪人的数量可以尽可能均衡,例如为1:1或者1:1.5等,以避免后续训练时出现训练样本不平衡的问题。
接下来,可以获取10000个房产经纪人中的每个房产经纪人的第二静态特征数据,以及每个房产经纪人对应的第一目标数据。每个房产经纪人对应的第一目标数据可以用于表征:在该房产经纪人的第二静态特征数据对应的日期后的30天内,该房产经纪人实际是否离职;如果是,该房产经纪人对应的第一目标数据可以用1表示,如果否,该房产经纪人对应的第一目标数据可以用0表示。
之后,可以10000个房产经纪人中的每个房产经纪人的第二静态特征数据作为输入内容,以每个房产经纪人对应的第一目标数据作为输出内容,以Random Forest作为训练算法进行训练,从而得到第一离职概率评估模型。
可选地,第一离职概率评估模型的训练过程中,可以使用到深度神经网络(DeepNeural Networks,DNN)。可以理解的是,DNN是有很多隐藏层的神经网络,且是深度学习的基础。
可见,本公开的实施例中,通过机器学习,可以非常便捷地得到第一离职概率评估模型。
在一个可选示例中,训练得到第二离职概率评估模型的方式为:
获取多个参考对象中的每个参考对象的,与M个日期对应的M个第三静态特征数据和M个第二动态特征数据;
针对每个参考对象,将其的M个第三静态特征数据分别输入第一离职概率评估模型,以获得第一离职概率评估模型输出的M个第三评估结果;
以每个参考对象对应的第二目标数据作为输入内容,以每个参考对象对应的第三目标数据作为输出内容进行训练,从而得到第二离职概率评估模型;
其中,参考对象对应的第二目标数据中包括:与参考对象对应的,按照所对应日期的先后顺序排列的M个第三评估结果,以及与参考对象对应的,按照所对应日期的先后顺序排列的M个第二动态特征数据;
参考对象对应的第三目标数据用于表征:在第四静态特征数据对应的日期后的第二预设时长内,参考对象是否离职,第四静态特征数据为与参考对象对应的M个第三静态特征数据中,所对应日期最晚的第三静态特征数据。
这里,第二预设时长可以为15天、20天、30天等,在此不再一一列举,第二预设时长与第一预设时长可以相同,也可以不同。
需要说明的是,第三静态特征数据中包括的数据参照上述实施例中对第一静态特征数据的说明即可,第二动态特征数据中包括的数据参照上述实施例中对第一动态特征数据中包括的数据的说明即可,在此不再赘述。
具体实施时,假设M为10,则可以针对100000个房产经纪人中的每个房产经纪人,获取其在某一段时间内(该段时间的时长为10天)的每天的第三静态特征数据和第二动态特征数据,以得到每个房产经纪人对应的10个第三静态特征数据和10个第二动态特征数据;其中,每个房产经纪人对应的10个第三静态特征数据可以按照所对应日期由早至晚的顺序排列,这时,10个第三静态特征数据可以依次表示为J30、J31、……、J39;每个房产经纪人对应的10个第二动态特征数据可以按照所对应日期由早至晚的顺序排列,这时,10个第二动态特征数据可以依次表示为D20、D21、……、D29。
接下来,可以针对每个房产经纪人,将其的10个第三静态特征数据分别输入第一离职概率评估模型,以获得第一离职概率评估模型输出的10个第三评估结果;其中,每个房产经纪人对应的10个第三评估结果可以按照所对应日期由早至晚的顺序排列,10个第三评估结果可以依次表示为P30、P31、……、P39。
之后,可以确定每个房产经纪人对应的第二目标对象和第三目标数据。每个房产经纪人对应的第二目标数据中可以包括:与该房产经纪人对应的,按照所对应日期的先后顺序排列的10个第三评估结果,以及该房产经纪人对应的,按照所对应日期的先后顺序排列的10个第二动态特征数据。每个房产经纪人对应的第三目标数据可以用于表征上述时长为10天的那段时间结束后的30天内,该房产经纪人实际是否离职;如果是,该房产经纪人对应的第三目标数据可以用1表示,如果否,该房产经纪人对应的第三目标数据可以用0表示。
再之后,可以以10000个房产经纪人中的每个房产经纪人对应的第二目标数据作为输入内容,以每个房产经纪人对应的第三目标数据作为输出内容,以Random Forest作为训练算法进行训练,从而得到第二离职概率评估模型。
可选地,第二离职概率评估模型的训练过程中,可以使用到循环神经网络(Recurrent Neural Network,RNN)。RNN是一种节点定向连接成环的人工神经网络,相比传统的卷积神经网络,RNN引入了定向循环,从而能够处理输入之间前后的关联,利用内部的记忆来处理任意时序的输入序列。长短期记忆(Long Short Term Memory networks,LSTM)网络是一种特殊的RNN,其可以学习长期依赖信息,且避免常规RNN的梯度消失,因此在工业界得到了广泛的应用,有鉴于此,第二离职概率评估模型的训练过程中,具体可以使用LSTM网络,这样,LSTM网络能够学习到行为特征、排名特征、离职特征等的变化情况。
可见,本公开的实施例中,通过机器学习,可以非常便捷地得到第一离职概率评估模型。
图3是本公开再一示例性实施例提供的离职概率评估方法的流程示意图。图3所示的方法包括步骤301、步骤302、步骤303、步骤304和步骤305,下面对各步骤分别进行说明。
步骤301,获取评估对象的第一静态特征数据和第一动态特征数据。
步骤302,将第一静态特征数据输入第一离职概率评估模型,以获得第一离职概率评估模型输出的第一评估结果。
步骤303,将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果。
需要说明的是,步骤301至步骤303的具体实施过程参照对步骤101至步骤103的说明即可,在此不再赘述。
步骤304,将第一静态特征数据输入第三离职概率评估模型,以获得第三离职概率评估模型输出的第四评估结果。
这里,第三离职概率评估模型可以为通过对大量的样本数据进行训练后得到的,用于预测房产经纪人的离职概率的模型。
可选地,训练得到第三离职概率评估模型的方式为:
以多个参考对象中的每个参考对象的第四静态特征数据作为输入内容,以每个参考对象对应的第四目标数据作为输出内容进行训练,从而得到第三离职概率评估模型;
其中,参考对象对应的第四目标数据用于表征:在参考对象的第四静态特征数据对应的日期后的第三预设时长内,参考对象是否离职。
这里,第三预设时长与第一预设时长可以相同,也可以不同。
需要说明的是,第四静态特征数据中包括的数据参照上述实施例中对第一静态特征数据中包括的数据的说明即可,在此不再赘述。另外,训练得到第三离职概率评估模型的方式与训练得到第一离职概率评估模型的方式是类似的,具体训练过程参照上述针对第一离职概率评估模型的训练过程的说明即可,在此不再赘述。这样,第三离职概率评估模型也可以认为是静态模型。
步骤305,根据第二评估结果和第四评估结果,确定评估对象的预测离职概率。
在一种具体实施方式中,第二评估结果为评估对象的第一参考离职概率,第四评估结果为评估对象的第二参考离职概率;
步骤305,包括:
将第一参考离职概率和第二参考离职概率进行加权求和,将加权求和结果作为评估对象的预测离职概率。
这里,可以预先针对第三离职概率评估模型和第二离职概率评估模型设置权重,第二离职概率评估模型对应的权重可以为Z1,第三离职概率评估模型对应的权重可以为Z2,Z1与Z2的和值可以为1。
假设第一参考离职概率用L1表示,第二参考离职概率用L2表示,则可以计算L1与Z1的第一乘积,以及计算L2与Z2的第二乘积,第一乘积与第二乘积的和值即为加权求和结果,之后将第一乘积与第二乘积的和值确定为评估对象的预测离职概率即可。
可见,通过加权求和处理,能够便捷可靠地计算出预测离职概率。
当然,步骤305的具体实施方式并不局限于此,例如,可以计算第一参考离职概率和第二参考离职概率的平均值,并将计算得到的平均值作为预测离职概率。
本公开的实施例中,在获取评估对象的第一静态特征数据和第一动态特征数据后,可以将第一静态特征数据输入第一离职概率评估模型,以获得第一离职概率评估模型输出的第一评估结果;还可以将第一静态特征数据输入第三离职概率评估模型,以获得第三离职概率评估模型输出的第四评估结果。接下来,可以将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果;之后,可以根据第二评估结果和第四评估结果,确定评估对象的预测离职概率。可见,本公开的实施例中,可以使用评估对象的第一静态特征数据和第一动态特征数据,以及第一离职概率评估模型、第二离职概率评估模型和第三离职概率评估模型,进行离职概率的预测,第一离职概率评估模型、第二离职概率评估模型和第三离职概率评估模型均是使用非常客观的样本数据进行训练后得到的,且第一静态特征数据和第一动态特征数据均能够对评估对象的特征进行有效地表征,因此,与现有技术相比,在预测离职概率时,本公开的实施例能够较好地保证预测结果的准确度。另外,本公开的实施例中,可以根据第二评估结果和第四评估结果,进行离职概率的预测,也即,本公开的实施例能够将静态模型的评估结果和动态模型的评估结果进行融合,这样能够进一步保证预测结果的准确度。
在一个可选示例中,获取评估对象的第一静态特征数据和第一动态特征数据,包括:
获取评估对象的第一原始特征数据;
对第一原始特征数据进行数据清洗;
从经数据清洗后的第一原始特征数据中,获取评估对象的第一静态特征数据和第一动态特征数据。
一般而言,房企可以具有数据库,数据库的数量可以为一个、两个、三个(例如图4所示的情况)或者三个以上,数据库中可以存储有房企所有员工的员工信息。那么,可以从数据库中,获取评估对象的第一原始特征数据,第一原始特征数据中可以包括评估对象的完整员工信息。接下来,可以对第一原始特征数据进行数据清洗。
可选地,对第一原始特征数据进行数据清洗,可以包括以下至少一项:
在第一原始特征数据的第一特征数据满足预设过滤条件的情况下,删除第一特征数据;
对第一原始特征数据中离散型的第二特征数据进行独热编码处理;
在第一原始特征数据中的第三特征数据和第四特征数据之间满足预设交叉条件的情况下,对第三特征数据和第四特征数据进行特征交叉处理;
在第一原始特征数据中具有静态属性的第五特征数据中含有缺失值的情况下,向第五特征数据中填充空值标识;
在第一原始特征数据中具有动态属性的第六特征数据中含有缺失值的情况下,向第六特征数据中填充默认值标识。
这里,第一原始特征数据中可以存在评估对象的年龄,可以将该年龄与预设年龄(例如70岁、80岁等)进行比较,如果该年龄大于预设年龄,可以认为该年龄为异常数据,那么,该年龄可以认为是满足预设过滤条件的第一特征数据,可以将该年龄从第一原始特征数据中删除,以保证第一原始特征数据中数据的准确性和可靠性。第一原始特征数据中还可以存在评估对象的出生年份,可以将该出生年份与预设年份(例如1940年)进行比较,如果该出生年份早于预设年份,可以认为该出生年份存在异常,那么,该出生年份可以认为是满足预设过滤条件的第一特征数据,可以将该出生年份从第一原始特征数据中删除,以保证第一原始特征数据中数据的准确性和可靠性。
这里,第一原始特征数据中可能同时存在离散型的特征数据和连续型的特征数据,对于离散型的特征数据,可以将其作为第二特征数据,并对其进行独热编码处理,以增加数据的稀疏性;其中,独热编码也可以称为one-hot编码。
这里,可以预先通过配置信息设定需要进行特征交叉的特征数据,那么,对于配置信息指示的需要进行特征交叉处理的任意两个特征数据,可以认为两者之间满足预设交叉条件;或者,可以通过信息增益比的计算,确定需要进行特征交叉的特征数据。通过特征交叉处理,能够提升后续预测离职概率时的预测准确度。
这里,第一原始特征数据中具有静态属性的特征数据一般为与基础特征、积分特征、门店特征或者店组特征等相关的数据,第五特征数据中可以包括该数据,理论上来说,无论评估对象的入职时间长还是短,数据库中均应当存在该数据。如果第五特征数据中含有缺失值,这说明该数据很可能未正常录入数据库中,那么,可以向第五特征数据中填充空值标识,以实现对存在缺失值这种情况的处理。
这里,第一原始特征数据中具有动态属性的特征数据一般为与行为特征、排名特征或者离职特征等相关的数据,第六特征数据中可以包括该数据,理论上来说,若评估对象的入职时间过短,则数据库中可能不存在该数据。如果第六特征数据中含有缺失值,这说明评估对象的入职时间过短,目前还没有业绩等,那么,可以向第六特征数据中填充默认值标识,例如填充0,以实现对存在缺失值这种情况的处理。
在第一原始特征数据的数据清洗完成后,可以根据数据属性(即静态属性和动态属性),从经数据清洗后的第一原始特征数据中,获取评估对象的第一静态特征数据和第一动态特征数据。
本公开的实施例中,第一静态特征数据和第一动态特征数据是对从数据库中直接获取的第一原始特征数据进行数据清洗后得到的,这样有利于保证进行离职概率的预测时,预测结果的准确度。
下面结合图4和图5,对本公开的实施例的具体实施过程进行详细说明。
本公开的实施例可以提供一种离职概率评估系统,如图4、图5所示,该系统可以包括:数据层、特征层、模型层、融合层和服务层。
这里,可以预先进行模型训练,以得到第一离职概率评估模型、第二离职概率评估模型和第三离职概率评估模型,得到的三个模型均可以部署在模型层;其中,第一离职概率评估模型可以基于DNN训练得到,第二离职概率评估模型可以基于LSTM网络训练得到。可选地,在进行模型训练时,如果训练样本不平衡,可以采用正样本过采样的方式,对训练样本进行平衡。
具体实施时,数据层可以从房企的数据库中,收集评估对象各个维度的特征数据,并将所收集的特征数据合成为第一原始特征数据。特征层可以利用特征工程,对第一原始特征数据进行处理,例如将第一原始特征数据分为静态特征部分和动态特征部分两大类,静态特征部分可以划分为基础特征、业绩特征、积分特征、大区特征、城市特征、门店特征、店组特征七个维度,动态特征部分可以划分为行为特征、排名特征、离职特征三个维度。
对于上述总共10个维度的特征,可以进行数据清洗。具体地,针对基础特征、积分特征、大区特征、城市特征、门店特征、店组特征这些维度的特征数据,在其含有缺失值的情况下,可以填充空值标识;针对业绩特征、行为特征、离职特征这些维度的特征数据,在其含有缺失值的情况下,填充0作为默认值;针对异常数据,比如年龄大于100岁等少量无效的数据进行规则过滤,直接去掉此类数据;针对基于信息增益比的计算,确定出的需要进行特征交叉的特征数据,进行特征交叉处理;针对离散值的特征数据,采用one-hot编码。
接下来,可以从经数据清洗后的特征数据中,获取第一静态特征数据和第一动态特征数据。在模型层,可以将第一静态特征数据输入第一离职概率评估模型,获得第一离职概率评估模型输出的第一评估结果;将第一静态特征数据输入第三离职概率评估模型,获得第三离职概率评估模型输出的第四评估结果;将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果。
之后,融合层可以对第四评估结果和第二评估结果进行加权求和,加权求和结果即可作为评估对象的预测离职概率。
最后,服务层可以根据融合层产生的预测离职概率,采取相应的处理措施,例如进行离职原因分析,通过邮件方式进行高危名单每日的自动推送等。
综上,本公开的实施例中,通过将非时序模型(即第一离职概率评估模型)的每日结果产出作为时序模型(即第二离职概率评估模型)的时序特征输入,结合每日结果波动,刻画了房产经纪人离职评分的逐日累积过程,解决了滞后性问题,引入了稳定性分析,且提高了预测能力,使得模型能够学习到离职概率的变化过程,这样能够避免在某些房产经纪人多日的预测离职概率均较高,但该房产经纪人比较稳定,没有离职想法的情况下,将该房产经纪人作为高危离职人员。本公开的实施例能够实现对房产经纪人离职风险的提前预警,且能够基于高危名单挽留高危离职人员,减少管理人员的时间成本与人力成本,提升房产经纪人的留存率,降低房企管理成本。
本公开实施例提供的任一种离职概率评估方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于终端设备和服务器等。或者,本公开实施例提供的任一种离职概率评估方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种离职概率评估方法。
示例性装置
图6是本公开一示例性实施例提供的离职概率评估装置的结构示意图。图6所示的装置包括:
第一获取模块601,用于获取评估对象的第一静态特征数据和第一动态特征数据;
第二获取模块602,用于将第一静态特征数据输入第一离职概率评估模型,以获得第一离职概率评估模型输出的第一评估结果;
第三获取模块603,用于将第一评估结果和第一动态特征数据输入第二离职概率评估模型,以获得第二离职概率评估模型输出的第二评估结果;
确定模块604,用于根据第二评估结果,确定评估对象的预测离职概率。
在一个可选示例中,
第一获取模块601,具体用于:
获取评估对象的,与M个日期对应的M个第一静态特征数据和M个第一动态特征数据;其中,M为大于1的自然数;
第二获取模块602,具体用于:
将M个第一静态特征数据分别输入第一离职概率评估模型,以获得第一离职概率评估模型输出的M个第一评估结果;
第三获取模块603,具体用于:
将按照所对应日期的先后顺序排列的M个第一评估结果,以及按照所对应日期的先后顺序排列的M个第一动态特征数据一并输入第二离职概率评估模型。
在一个可选示例中,第一离职概率评估模型利用第一训练模块训练得到:
第一训练模块,具体用于以多个参考对象中的每个参考对象的第二静态特征数据作为输入内容,以每个参考对象的第一目标数据作为输出内容进行训练,从而得到第一离职概率评估模型;
其中,参考对象对应的第一目标数据用于表征:在参考对象的第二静态特征数据对应的日期后的第一预设时长内,参考对象是否离职。
在一个可选示例中,第二离职概率评估模型利用第二训练模型训练得到:
第二训练模块,包括:
第一获取单元,用于获取多个参考对象中的每个参考对象的,与M个日期对应的M个第三静态特征数据和M个第二动态特征数据;
第二获取单元,用于针对每个参考对象,将其的M个第三静态特征数据分别输入第一离职概率评估模型,以获得第一离职概率评估模型输出的M个第三评估结果;
训练单元,用于以每个参考对象对应的第二目标数据作为输入内容,以每个参考对象对应的第三目标数据作为输出内容进行训练,从而得到第二离职概率评估模型;
其中,参考对象对应的第二目标数据中包括:与参考对象对应的,按照所对应日期的先后顺序排列的M个第三评估结果,以及与参考对象对应的,按照所对应日期的先后顺序排列的M个第二动态特征数据;
参考对象对应的第三目标数据用于表征:在第四静态特征数据对应的日期后的第二预设时长内,参考对象是否离职,第四静态特征数据为与参考对象对应的M个第三静态特征数据中,所对应日期最晚的第三静态特征数据。
在一个可选示例中,
该装置还包括:
第四获取模块,用于在获取评估对象的第一静态特征数据和第一动态特征数据之后,将第一静态特征数据输入第三离职概率评估模型,以获得第三离职概率评估模型输出的第四评估结果:
确定模块604,具体用于:
根据第二评估结果和第四评估结果,确定评估对象的预测离职概率。
在一个可选示例中,第二评估结果为评估对象的第一参考离职概率,第四评估结果为评估对象的第二参考离职概率;
确定模块604,具体用于:
将第一参考离职概率和第二参考离职概率进行加权求和,将加权求和结果作为评估对象的预测离职概率。
在一个可选示例中,第三离职概率评估模型利用第三训练模块训练得到:
第三训练模块,具体用于以多个参考对象中的每个参考对象的第四静态特征数据作为输入内容,以每个参考对象对应的第四目标数据作为输出内容进行训练,从而得到第三离职概率评估模型;
其中,参考对象对应的第四目标数据用于表征:在参考对象的第四静态特征数据对应的日期后的第三预设时长内,参考对象是否离职。
在一个可选示例中,第一获取模块,包括:
第三获取单元,用于获取评估对象的第一原始特征数据;
数据清洗单元,用于对第一原始特征数据进行数据清洗;
第四获取单元,用于从经数据清洗后的第一原始特征数据中,获取评估对象的第一静态特征数据和第一动态特征数据。
在一个可选示例中,数据清洗单元,具体用于以下至少一项:
在第一原始特征数据的第一特征数据满足预设过滤条件的情况下,删除第一特征数据;
对第一原始特征数据中离散型的第二特征数据进行独热编码处理;
在第一原始特征数据中的第三特征数据和第四特征数据之间满足预设交叉条件的情况下,对第三特征数据和第四特征数据进行特征交叉处理;
在第一原始特征数据中具有静态属性的第五特征数据中含有缺失值的情况下,向第五特征数据中填充空值标识;
在第一原始特征数据中具有动态属性的第六特征数据中含有缺失值的情况下,向第六特征数据中填充默认值标识。
在一个可选示例中,
第一静态特征数据中包括以下至少一项:基础特征数据、业绩特征数据、积分特征数据、区域特征数据、门店特征数据、店组特征数据;
第一动态特征数据中包括以下至少一项:行为特征数据、排名特征数据、离职特征数据。
示例性电子设备
下面,参考图7来描述根据本公开实施例的电子设备70。电子设备70可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
如图7所示,电子设备70包括一个或多个处理器71和存储器72。
处理器71可以是中央处理器(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,其控制电子设备70中的其他组件执行期望的功能。
存储器72可以包括一个或多个计算机程序产品,计算机程序产品可包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器71可以运行程序指令,以实现上文本公开的各个实施例的离职概率评估方法以及/或者其他期望的功能。
在一个示例中,电子设备70还可以包括:输入装置73和输出装置74,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。输入装置73可以包括键盘、鼠标等。输出装置74可以包括显示器、扬声器、远程输出装置等。
当然,为了简化,图7中仅示出了电子设备70中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备70还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,该指令在被处理器运行时使得处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的离职概率评估方法中的步骤。
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的离职概率评估方法中的步骤。
计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质可以包括电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,需要指出的是,本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为该优点、优势、效果等是本公开的各个实施例必须具备的。上述公开的具体细节仅是为了示例和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各实施例采用递进方式描述,每个实施例重点说明与其它实施例的差异,各实施例间相同或相似的部分相互参见即可。由于系统实施例与方法实施例基本对应,描述的比较简单,相关之处参见方法实施例的说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为示例性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。提供所公开的方面的以上描述以使本领域任何技术人员能够做出或者使用本公开。对这些方面的各种修改对本领域技术人员而言是显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种离职概率评估方法,其特征在于,包括:
获取评估对象的第一静态特征数据和第一动态特征数据;
将所述第一静态特征数据输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的第一评估结果;
将所述第一评估结果和所述第一动态特征数据输入第二离职概率评估模型,以获得所述第二离职概率评估模型输出的第二评估结果;
根据所述第二评估结果,确定所述评估对象的预测离职概率。
2.根据权利要求1所述的方法,其特征在于,
所述获取评估对象的第一静态特征数据和第一动态特征数据,包括:
获取评估对象的,与M个日期对应的M个第一静态特征数据和M个第一动态特征数据;其中,M为大于1的自然数;
所述将所述第一静态特征数据输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的第一评估结果,包括:
将M个所述第一静态特征数据分别输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的M个第一评估结果;
所述将所述第一评估结果和所述第一动态特征数据输入第二离职概率评估模型,包括:
将按照所对应日期的先后顺序排列的M个所述第一评估结果,以及按照所对应日期的先后顺序排列的M个所述第一动态特征数据一并输入第二离职概率评估模型。
3.根据权利要求1或2所述的方法,其特征在于,训练得到所述第一离职概率评估模型的方式为:
以多个参考对象中的每个所述参考对象的第二静态特征数据作为输入内容,以每个所述参考对象对应的第一目标数据作为输出内容进行训练,从而得到所述第一离职概率评估模型;
其中,所述参考对象对应的第一目标数据用于表征:在所述参考对象的第二静态特征数据对应的日期后的第一预设时长内,所述参考对象是否离职。
4.根据权利要求2所述的方法,其特征在于,训练得到所述第二离职概率评估模型的方式为:
获取多个参考对象中的每个所述参考对象的,与M个日期对应的M个第三静态特征数据和M个第二动态特征数据;
针对每个所述参考对象,将其的M个所述第三静态特征数据分别输入所述第一离职概率评估模型,以获得所述第一离职概率评估模型输出的M个第三评估结果;
以每个所述参考对象对应的第二目标数据作为输入内容,以每个所述参考对象对应的第三目标数据作为输出内容进行训练,从而得到所述第二离职概率评估模型;
其中,所述参考对象对应的第二目标数据中包括:与所述参考对象对应的,按照所对应日期的先后顺序排列的M个所述第三评估结果,以及与所述参考对象对应的,按照所对应日期的先后顺序排列的M个所述第二动态特征数据;
所述参考对象对应的第三目标数据用于表征:在第四静态特征数据对应的日期后的第二预设时长内,所述参考对象是否离职,所述第四静态特征数据为与所述参考对象对应的M个所述第三静态特征数据中,所对应日期最晚的所述第三静态特征数据。
5.根据权利要求1所述的方法,其特征在于,
所述获取评估对象的第一静态特征数据和第一动态特征数据之后,所述方法还包括:
将所述第一静态特征数据输入第三离职概率评估模型,以获得所述第三离职概率评估模型输出的第四评估结果:
所述根据所述第二评估结果,确定所述评估对象的预测离职概率,包括:
根据所述第二评估结果和所述第四评估结果,确定所述评估对象的预测离职概率。
6.根据权利要求5所述的方法,其特征在于,所述第二评估结果为所述评估对象的第一参考离职概率,所述第四评估结果为所述评估对象的第二参考离职概率;
所述根据所述第二评估结果和所述第四评估结果,确定所述评估对象的预测离职概率,包括:
将所述第一参考离职概率和所述第二参考离职概率进行加权求和,将加权求和结果作为所述评估对象的预测离职概率。
7.根据权利要求5所述的方法,其特征在于,训练得到所述第三离职概率评估模型的方式为:
以多个参考对象中的每个所述参考对象的第四静态特征数据作为输入内容,以每个所述参考对象对应的第四目标数据作为输出内容进行训练,从而得到所述第三离职概率评估模型;
其中,所述参考对象对应的第四目标数据用于表征:在所述参考对象的第四静态特征数据对应的日期后的第三预设时长内,所述参考对象是否离职。
8.一种离职概率评估装置,其特征在于,包括:
第一获取模块,用于获取评估对象的第一静态特征数据和第一动态特征数据;
第二获取模块,用于将所述第一静态特征数据输入第一离职概率评估模型,以获得所述第一离职概率评估模型输出的第一评估结果;
第三获取模块,用于将所述第一评估结果和所述第一动态特征数据输入第二离职概率评估模型,以获得所述第二离职概率评估模型输出的第二评估结果;
确定模块,用于根据所述第二评估结果,确定所述评估对象的预测离职概率。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7中任一所述的离职概率评估方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7中任一所述的离职概率评估方法。
CN201911228704.3A 2019-12-04 2019-12-04 离职概率评估方法、装置及计算机可读存储介质 Active CN111105148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911228704.3A CN111105148B (zh) 2019-12-04 2019-12-04 离职概率评估方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911228704.3A CN111105148B (zh) 2019-12-04 2019-12-04 离职概率评估方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111105148A true CN111105148A (zh) 2020-05-05
CN111105148B CN111105148B (zh) 2023-10-17

Family

ID=70422006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911228704.3A Active CN111105148B (zh) 2019-12-04 2019-12-04 离职概率评估方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111105148B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582589A (zh) * 2020-05-12 2020-08-25 上海新共赢信息科技有限公司 一种租车出险预测方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016207165A (ja) * 2015-04-28 2016-12-08 株式会社バランスアンドユニーク 人材リスク管理システム
CN108491956A (zh) * 2018-02-07 2018-09-04 链家网(北京)科技有限公司 一种经纪人离职预估系统及方法
CN109657855A (zh) * 2018-12-14 2019-04-19 深圳壹账通智能科技有限公司 离职概率的预测方法、装置、计算机设备和存储介质
CN109829745A (zh) * 2018-12-19 2019-05-31 平安科技(深圳)有限公司 营收数据预测方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016207165A (ja) * 2015-04-28 2016-12-08 株式会社バランスアンドユニーク 人材リスク管理システム
CN108491956A (zh) * 2018-02-07 2018-09-04 链家网(北京)科技有限公司 一种经纪人离职预估系统及方法
CN109657855A (zh) * 2018-12-14 2019-04-19 深圳壹账通智能科技有限公司 离职概率的预测方法、装置、计算机设备和存储介质
CN109829745A (zh) * 2018-12-19 2019-05-31 平安科技(深圳)有限公司 营收数据预测方法、装置、计算机设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582589A (zh) * 2020-05-12 2020-08-25 上海新共赢信息科技有限公司 一种租车出险预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111105148B (zh) 2023-10-17

Similar Documents

Publication Publication Date Title
CN110400021B (zh) 银行网点现金用量预测方法及装置
CN110969285B (zh) 预测模型训练方法、预测方法、装置、设备及介质
CN107992968B (zh) 基于集成时间序列分析技术的电能表计量误差预测方法
CN109961248B (zh) 运单投诉预测方法、装置、设备及其存储介质
CN106933956B (zh) 数据挖掘方法和装置
CN110400215B (zh) 面向企业家族的小微企业信用评估模型构建方法及系统
CN105678398A (zh) 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统
CN112464094B (zh) 信息推荐方法、装置、电子设备及存储介质
CN109615226A (zh) 一种运营指标异常监测方法
CN110765268B (zh) 一种基于客户诉求的配网精准投资策略方法
CN112614011B (zh) 电力配网物资需求预测方法和装置、存储介质及电子设备
CN110046889A (zh) 一种异常行为主体的检测方法、装置及服务器
CN112562863A (zh) 流行病监测预警方法、装置、电子设备
CN115249081A (zh) 一种对象类型的预测方法、装置、计算机设备和存储介质
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
CN114862032A (zh) 一种基于XGBoost-LSTM的电网负荷预测方法及装置
El Maghraoui et al. Smart energy management system: A comparative study of energy consumption prediction algorithms for a hotel building
CN114266602A (zh) 电力物联网多源数据融合的深度学习电价预测方法和装置
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
CN111612491A (zh) 状态分析模型构建方法、分析方法及装置
CN111105148A (zh) 离职概率评估方法、装置及计算机可读存储介质
CN116843483A (zh) 一种车险理赔方法、装置、计算机设备及存储介质
CN111882113A (zh) 一种企业手机银行用户的预测方法和装置
CN111127109A (zh) 不同城市热度值的预测方法、模型训练方法及系统
CN112288117A (zh) 目标客户的成交概率预测方法、装置与电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant