CN110472685B - 对象行为持续时长预测方法及装置 - Google Patents

对象行为持续时长预测方法及装置 Download PDF

Info

Publication number
CN110472685B
CN110472685B CN201910752251.8A CN201910752251A CN110472685B CN 110472685 B CN110472685 B CN 110472685B CN 201910752251 A CN201910752251 A CN 201910752251A CN 110472685 B CN110472685 B CN 110472685B
Authority
CN
China
Prior art keywords
predicted
behavior
executed
data
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910752251.8A
Other languages
English (en)
Other versions
CN110472685A (zh
Inventor
丁平
郭强
梁磊
陈园园
朴雪威
孔维晨
张靖
朱江波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN201910752251.8A priority Critical patent/CN110472685B/zh
Publication of CN110472685A publication Critical patent/CN110472685A/zh
Application granted granted Critical
Publication of CN110472685B publication Critical patent/CN110472685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Probability & Statistics with Applications (AREA)

Abstract

本发明提供了一种对象行为持续时长预测方法及装置,该方法包括:获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。本发明可以对对象行为持续时长进行准确、快速地预测。

Description

对象行为持续时长预测方法及装置
技术领域
本发明涉及互联网领域,尤其涉及一种对象行为持续时长预测方法装置。
背景技术
在互联网领域,如果能够预测对象的后续行为,尤其是预测对象行为的持续时长,将会对对象的数据分析、处理工作产生积极作用。然而,在现有技术中还未出现能够准确、快速地预测对象行为持续时长的有效解决方案。
发明内容
本发明实施例提出一种对象行为持续时长预测方法,可对对象行为持续时长进行准确、快速地预测,该方法包括:
获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;
将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长;
所述方法还包括:根据待预测对象的待执行行为相关的历史行为数据,获得待预测对象的图谱数据,所述图谱数据包括与待预测对象有关的对象的历史行为数据;
将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,包括:将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,包括:将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
本发明实施例提出一种对象行为持续时长预测装置,可对对象行为持续时长进行准确、快速地预测,该装置包括:
数据获得模块,用于获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;
概率预测模块,用于将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
持续时长预测模块,用于在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长;
数据获得模块还用于:根据待预测对象的待执行行为相关的历史行为数据,获得待预测对象的图谱数据,所述图谱数据包括与待预测对象有关的对象的历史行为数据;
概率预测模块具体用于:将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
持续时长预测模块具体用于:将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述对象行为持续时长预测方法。
本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述对象行为持续时长预测方法的计算机程序。
在本发明实施例中,首先获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;最后在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。由于在对待预测对象执行待执行行为的持续时长进行预测之前,首先预测了待预测对象执行待执行行为的概率,使得只对在待预测对象执行待执行行为的概率达到设定概率值时的待预测对象进行预测,减小了预测的数据量,提高了预测效率,然后,只需将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,预测过程考虑了待预测对象的属性信息和历史行为数据,采用了持续时长预测模型,预测准确率和效率高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中对象行为持续时长预测方法的流程图;
图2为本发明实施例提出的对象行为持续时长预测方法的详细流程图;
图3为银行招聘系统的示意图;
图4为本发明实施例中对象行为持续时长预测装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在互联网领域,如果能够预测对象的后续行为,尤其是预测对象行为的持续时长,将会对对象的数据分析、处理工作产生积极作用。例如,对于一个大型商业银行而言,需要经常进行招聘,而现有的银行在招聘时只是单纯从应聘者的角度分析应聘者是否合适留下,并未对应聘者在入职后可持续工作的时长进行预测,部分入职员工在入职后不久,发现工作不满足其要求,而选择离职,对公司和应聘者均造成了伤害,而如果能够根据应聘者的属性信息(例如简历)预测应聘者留在银行工作的时长,即预测对象执行待执行行为的持续时长,可节约银行大量的招聘成本和时间,提高招聘的效率和招聘合适人才的准确率。
图1为本发明实施例中对象行为持续时长预测方法的流程图,如图1所示,该方法包括:
步骤101,获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;
步骤102,将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
步骤103,在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
在本发明实施例中,首先获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;最后在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。由于在对待预测对象执行待执行行为的持续时长进行预测之前,首先预测了待预测对象执行待执行行为的概率,使得只对在待预测对象执行待执行行为的概率达到设定概率值时的待预测对象进行预测,减小了预测的数据量,提高了预测效率,然后,只需将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,预测过程考虑了待预测对象的属性信息和历史行为数据,采用了持续时长预测模型,预测准确率和效率高。
在步骤101中,待预测对象的属性信息包括多种形式,以银行招聘为例,待预测对象可以为应聘者,待执行行为可以是应聘者在银行工作,那么这里的待预测对象的属性信息可以包括应聘者的应聘数据,应聘者的应聘数据包括简历信息、应聘者浏览招聘网页的信息(例如招聘网站)、应聘者上网习惯信息等等。待预测对象的属性信息的获取方式有多种,举一例,可通过定义接收数据的格式和方式,通过大数据技术实时接收在网络上爬取的数据,再举一例,对于银行招聘来说,可针对不同的外部招聘网站,定义接收应聘者的应聘数据的格式和方式,通过大数据技术实时接收不同外部招聘网站发送和爬取的应聘数据。与待预测对象的待执行行为相关的历史行为数据也可以包括多种形式,对于银行招聘来说,待预测对象的待执行行为相关的历史行为数据可以为应聘者银行账户信息,通过应聘者的银行账户信息确定应聘者对于银行的认知能力,是否具备一定的金融常识性的内容和应聘者是否存在冻结账户或者其他不良账户(如有不良账户,需要分析不良账户的原因)等。银行账户信息还包括流水信息,主要是反应交易关系,比如对方账户可能是支付宝、微信,也有可能是诈骗账户等等,某种程度上,流水信息越多,说明应聘者交易越活跃,对金融知识相对了解更多,更符合银行要求。
在步骤102中,由于待预测对象在可能执行待执行行为,也可能不执行,因此,将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,从而将待预测对象执行待执行行为的概率达到设定概率值的待执行对象筛选出来,减小了后期预测的数据量,提高了预测效率,以银行招聘为例,即预测应聘者是否愿意留在银行工作。
在步骤103中,在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,以银行招聘为例,即应聘者愿意留在银行工作的银行概率达到设定概率值,如60%,则将应聘者的应聘信息和应聘者的银行账户信息输入至持续时长预测模型,预测应聘者留在银行工作的时长,还可以进一步预测应聘者在不同岗位上的工作时长。
在一实施例中,在获得待预测对象的待执行行为相关的历史行为数据之后,还包括:
根据待预测对象的待执行行为相关的历史行为数据,获得待预测对象的图谱数据,所述图谱数据包括与待预测对象有关的对象的历史行为数据;
将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,包括:
将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,包括:
在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
在上述实施例中,与待预测对象有关的对象是指该有关的对象可能会待预测对象的待执行行为造成影响的,可对预测待执行对象执行待执行行为的概率以及持续时长产生影响的对象。以银行招聘为例,有关的对象可以应聘者的亲戚、朋友等人,应聘者的有关对象的银行账户信息反映出的不良账户信息,可能会对应聘者造成影响,例如,应聘者也可能出现不良账户,使得该应聘者不满足银行招聘的需求,因此,需要了解应聘者有关的对象的历史行为数据,这些数据即形成了待预测对象的图谱数据,这些图谱数据可用于获得预测对象执行待执行行为的概率和待预测对象执行待执行行为的持续时长。
在一实施例中,在将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率之前,还包括:
对待预测对象的属性信息、历史行为数据以及图谱数据进行标准化处理;
将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,包括:
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,包括:
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
在上述实施例中,待预测对象的属性信息、历史行为数据以及图谱数据在格式上不能满足概率预测模型和持续时长预测模型的输入要求,因此,需要对待预测对象的属性信息、历史行为数据以及图谱数据进行标准化处理,从而提高后续后续的效率,标准化处理的方法可以有多种,例如归一化处理方法、数据融合方法等,可根据实际情况选择,相关变化例均应落入本发明的保护范围。
在一实施例中,在将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率之前,还包括:
根据标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据,筛选出符合设定筛选条件的待预测对象;
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,包括:
将符合设定筛选条件的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率。
具体实施时,将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据的数据量可能非常大,如果直接将上述数据输入至概率预测模型,会对概率预测效率有影响,而上述数据中,可能有些数据不适宜用来进行后续预测,即有些数据存在异常,这时候可以先筛选出这些异常数据,然后再进行预测,可提高预测的准确率和效率,以银行招聘为例,待预测对象的属性信息可以为应聘者的应聘数据,历史行为数据可以为应聘者的银行账户信息,待预测对象的图谱数据可以为应聘者的有关对象的银行账户信息,首先对应聘者的这些数据进行筛选,设定筛选条件可以根据实际情况制定,例如,可以剔除应聘者的应聘数据中信息造假、存在处分的应聘者,剔除银行者的银行账户信息中存在不良信用的应聘者,剔除应聘者的有关对象的银行账户信息中存在不良信用的应聘者,通过以上筛选过程,可减小待预测对象的数据量。
具体实施时,概率预测模型可以有多种,下面给出其中一个实施例。
在一实施例中,概率预测模型采用支持向量机模型。
在上述实施例中,支持向量机模型(SVM)旨在求出n维空间的最优超平面将正负类分开。这里的达到的最优是指在两类样本点距离超平面的最近距离达到最大,间隔最大使得它区别于感知机学习,SVM中还有核技巧,这样SVM就是实际上的非线性分类器函数。因此,采用支持向量机模型可确定待预测对象是否执行待执行行为,即待预测对象执行待执行行为的概率包括两种情况,100%和0,当然,可以采用其他获得待预测对象执行待执行行为的概率的方法,相关变化例均应落入本发明的保护范围。
在一实施例中,支持向量机模型采用如下方法获得:
获得已经执行过待执行行为的对象的属性信息和历史行为数据;
提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值;
利用所述特征值求解支持向量机模型的目标函数,确定支持向量机模型的参数。
在上述实施例中,以银行招聘为例,已经执行过待执行行为的对象为已经通过招聘在银行工作的员工,获得银行员工的属性信息,可以指银行员工的个人信息,银行员工的历史行为数据可以指银行员工的职业发明数据,包括应聘流程记录信息、入职时间、发展路径和离职时间等。之后,提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值,最后利用所述特征值求解支持向量机模型的目标函数,确定支持向量机模型的参数。
在支持向量机模型中,对于给定样本点,超平面关于该样本点的函数间隔采用如下公式表示:
yi(ω·xi+b),i=1,2,,m (1)
其中,(xi,yi)为给定样本点,即为已经执行过待执行行为的对象的属性信息和历史行为数据的样本点;
m为样本点的个数;
ω和b为支持向量机模型的参数。
支持向量机模型的目标函数如下:
Figure GDA0003299011100000081
求解上述目标函数,确定支持向量机模型的参数。
具体实施时,提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值的方法有多种,下面给出其中一个实施例。
在一实施例中,提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值,包括:
采用模拟退火算法提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值。
在上述实施例中,模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。模拟退火算法是通过赋予搜索过程一种时变且最终趋于零的概率突跳性,从而可有效避免陷入局部极小并最终趋于全局最优的串行结构的优化算法。
当然,可以理解的是,还可以采用其他提取特征的方法,例如遗传算法等优化算法,相关变化例均应落入本发明的保护范围。
在一实施中,持续时长预测模型采用深度学习模型。
在上述实施例中,深度学习模型包括多种,例如卷积神经网络CNN,均可以作为本发明实施例的持续时长预测模型。
具体实施时,深度学习模型的获得方法有多种,下面给出其中一个实施例。
在一实施例中,深度学习模型采用如下方法训练获得:
获得已经执行过待执行行为的对象的属性信息和历史行为数据的特征向量;
利用所述特征向量训练深度学习模型;
在训练的过程中调整深度学习模型的参数,直至深度学习模型的损失函数满足预设收敛条件,获得训练后的深度学习模型。
在上述实施例中,给出了深度学习模型的一种构造方法,为了提高深度学习模型的精度,还可以采用其他方法,例如还可以采用下面的方法获得:
将获得已经执行过待执行行为的对象的属性信息和历史行为数据分成训练数据集和测试数据集;
提取训练数据集的特征向量;
利用训练数据集的特征向量训练深度学习模型,获得训练后的深度学习模型;
利用测试数据集对训练后的深度学习模型的准确率进行验证,获得满足预设准确率的深度学习模型。
基于上述实施例,本发明提出如下一个实施例来说明对象行为持续时长预测方法的详细流程,图2为本发明实施例提出的对象行为持续时长预测方法的详细流程图,如图2所示,在一实施例中,对象行为持续时长预测方法的详细流程包括:
步骤201,获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;
步骤202,根据待预测对象的待执行行为相关的历史行为数据,获得待预测对象的图谱数据,所述图谱数据包括与待预测对象有关的对象的历史行为数据;
步骤203,对待预测对象的属性信息、历史行为数据以及图谱数据进行标准化处理;
步骤204,根据标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据,筛选出符合设定筛选条件的待预测对象;
步骤205,将符合设定筛选条件的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
步骤206,在待预测对象执行待执行行为的概率达到设定概率值时,将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
当然,可以理解的是,上述对象行为持续时长预测方法的详细流程还可以有其他变化例,相关变化例均应落入本发明的保护范围。
下面给出一具体实施时,来说明本发明提出的方法的具体应用。
在银行招聘时,待预测对象为应聘者,待预测对象的属性信息为应聘者的应聘数据,包括简历信息、应聘者浏览招聘网页的信息(例如招聘网站)和应聘者上网习惯信息,待预测对象的待执行行为相关的历史行为数据为应聘者的银行账户信息。根据本发明可实现一种银行招聘系统,如图3所示为银行招聘系统的示意图,该系统包括外部系统数据集成模块、内部系统数据集成模块、内部工作人员信息集成模块、智能分析模块、应聘者数据预测模块和人力资源展示模块。
其中,外部系统数据集成模块用于获得应聘者的应聘数据,内部系统数据集成模块用于获得应聘者的银行账户信息,内部工作人员信息集成模块用于获得银行员工的职业发展数据,智能分析模块用于确定概率预测模型和持续时长预测模型,应聘者数据预测模块用于预测应聘者是否留在银行工作的意愿和在银行不同岗位上的工作时长,人力资源展示模块用于展示预测结果等数据。结合该系统,下面进行详细介绍。
首先,外部系统数据集成模块确定接收应聘者的应聘数据的格式,通过大数据技术实时接收不同外部招聘网站发送和爬取的应聘数据。
然后,内部系统数据集成模块从银行内部系统提取出来该应聘者的银行账户信息,包括流水信息、不良信用等信息。
之后,内部系统数据集成模块采用知识图谱技术挖掘该应聘者的图谱数据,即相关人员的银行账户信息,比如该应聘者的亲属等,相关人员的银行账户信息有可能会影响应聘者的行为。
智能分析模块对上述获得的应聘者的应聘数据、银行账户信息和图谱数据进行标准化处理,这里采用数据融合的方法进行标准化处理。
智能分析模块根据标准化处理后的应聘者的应聘数据、银行账户信息和图谱数据,筛选出银行招聘要求(设定筛选条件)的应聘者,设定筛选条件可以为存在违法记录、存在不良信用等。
智能分析模块确定概率预测模型采用支持向量机模型,支持向量机模型通过以下过程获得:获得银行员工的职业发展数据,包括应聘流程记录信息、入职时间、发展路径和离职时间,银行员工的职业发展数据可以从银行内部获得,采用采用模拟退火算法提取银行员工的职业发展数据的特征值;利用所述特征值求解公式(2)表示的支持向量机模型的目标函数,确定支持向量机模型的参数,即可确定支持向量机模型。
智能分析模块确定持续时长预测模型采用深度学习模型,深度学习模型采用如下方法训练获得:获得银行员工的职业发展数据的特征向量;利用所述特征向量训练深度学习模型;在训练的过程中调整深度学习模型的参数,直至深度学习模型的损失函数满足预设收敛条件,获得训练后的深度学习模型。
应聘者数据预测模块将符合设定筛选条件的标准化处理后的应聘者的应聘数据、银行账户信息和图谱数据输入至支持向量机模型,获得应聘者是否留在银行工作的意愿。
应聘者数据预测模块在应聘者愿意留在银行工作时,将标准化处理后的银行员工的职业发展数据输入至深度学习模型,获得应聘者留在银行不同岗位的工作时长的预测值。
最后,人力资源展示模块用于展示应聘者的应聘数据、银行账户数据和预测结果,人力资源展示模块包括Web端、Ipad端和BancsLink端等。
本发明能提前预测应聘者在通过笔试、面试流程,收到工作通知后是否愿意留在银行工作,从而在简历筛选前,对于一些最终不愿意前往我行工作人员淘汰掉,从而节省人力资源部的人力成本和财务成本。根据本发明,人力资源部可以更为精确的挖掘不同岗位所需要的人才,从而精确的,更省成本的挖掘更为合适的人才。人力资源部可以根据应聘者预测工作年限,确定该人的工作岗位,从而充分利用我行人才资源,提升我行的人力资源发展的竞争力。
在本发明实施例提出的对象行为持续时长预测方法中,首先获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;最后在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。由于在对待预测对象执行待执行行为的持续时长进行预测之前,首先预测了待预测对象执行待执行行为的概率,使得只对在待预测对象执行待执行行为的概率达到设定概率值时的待预测对象进行预测,减小了预测的数据量,提高了预测效率,然后,只需将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,预测过程考虑了待预测对象的属性信息和历史行为数据,采用了持续时长预测模型,预测准确率和效率高。
基于同样的发明构思,本发明实施例还提供了一种对象行为持续时长预测装置,如下面的实施例所述。由于这些解决问题的原理与对象行为持续时长预测方法相似,因此装置的实施可以参见方法的实施,重复之处不在赘述。
图4为本发明实施例中对象行为持续时长预测装置的示意图,如图4所示,该装置包括:
数据获得模块401,用于获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;
概率预测模块402,用于将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
持续时长预测模块403,用于在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
在一实施例中,数据获得模块401还用于:
根据待预测对象的待执行行为相关的历史行为数据,获得待预测对象的图谱数据,所述图谱数据包括与待预测对象有关的对象的历史行为数据;
概率预测模块402具体用于:
将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
持续时长预测模块403具体用于:
将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
在一实施例中,对象行为持续时长预测装置还包括标准化处理模块404,用于:
对待预测对象的属性信息、历史行为数据以及图谱数据进行标准化处理;
概率预测模块402具体用于:
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
持续时长预测模块403具体用于:
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
在一实施例中,对象行为持续时长预测装置还包括筛选模块405,用于:
根据标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据,筛选出符合设定筛选条件的待预测对象;
概率预测模块402具体用于:
将符合设定筛选条件的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率。
在一实施例中,概率预测模型采用支持向量机模型。
在一实施例中,支持向量机模型采用如下方法获得:
获得已经执行过待执行行为的对象的属性信息和历史行为数据;
提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值;
利用所述特征值求解支持向量机模型的目标函数,确定支持向量机模型的参数。
在一实施例中,持续时长预测模型采用深度学习模型。
在一实施例中,深度学习模型采用如下方法训练获得:
获得已经执行过待执行行为的对象的属性信息和历史行为数据的特征向量;
利用所述特征向量训练深度学习模型;
在训练的过程中调整深度学习模型的参数,直至深度学习模型的损失函数满足预设收敛条件,获得训练后的深度学习模型。
在本发明实施例提出的对象行为持续时长预测装置中,首先获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;最后在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。由于在对待预测对象执行待执行行为的持续时长进行预测之前,首先预测了待预测对象执行待执行行为的概率,使得只对在待预测对象执行待执行行为的概率达到设定概率值时的待预测对象进行预测,减小了预测的数据量,提高了预测效率,然后,只需将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,预测过程考虑了待预测对象的属性信息和历史行为数据,采用了持续时长预测模型,预测准确率和效率高。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种对象行为持续时长预测方法,其特征在于,包括:
获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;
将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长;
所述方法还包括:根据待预测对象的待执行行为相关的历史行为数据,获得待预测对象的图谱数据,所述图谱数据包括与待预测对象有关的对象的历史行为数据;
将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,包括:将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,包括:将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
2.如权利要求1所述的对象行为持续时长预测方法,其特征在于,在将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率之前,还包括:
对待预测对象的属性信息、历史行为数据以及图谱数据进行标准化处理;
将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,包括:
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长,包括:
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
3.如权利要求2所述的对象行为持续时长预测方法,其特征在于,在将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率之前,还包括:
根据标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据,筛选出符合设定筛选条件的待预测对象;
将标准化处理后的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率,包括:
将符合设定筛选条件的待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率。
4.如权利要求1所述的对象行为持续时长预测方法,其特征在于,概率预测模型采用支持向量机模型。
5.如权利要求4所述的对象行为持续时长预测方法,其特征在于,支持向量机模型采用如下方法获得:
获得已经执行过待执行行为的对象的属性信息和历史行为数据;
提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值;
利用所述特征值求解支持向量机模型的目标函数,确定支持向量机模型的参数。
6.如权利要求5所述的对象行为持续时长预测方法,其特征在于,提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值,包括:
采用模拟退火算法提取已经执行过待执行行为的对象的属性信息和历史行为数据的特征值。
7.如权利要求1所述的对象行为持续时长预测方法,其特征在于,持续时长预测模型采用深度学习模型。
8.如权利要求1所述的对象行为持续时长预测方法,其特征在于,深度学习模型采用如下方法训练获得:
获得已经执行过待执行行为的对象的属性信息和历史行为数据的特征向量;
利用所述特征向量训练深度学习模型;
在训练的过程中调整深度学习模型的参数,直至深度学习模型的损失函数满足预设收敛条件,获得训练后的深度学习模型。
9.一种对象行为持续时长预测装置,其特征在于,包括:
数据获得模块,用于获得待预测对象的属性信息,与待预测对象的待执行行为相关的历史行为数据;
概率预测模块,用于将待预测对象的属性信息和历史行为数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
持续时长预测模块,用于在待预测对象执行待执行行为的概率达到设定概率值时,将待预测对象的属性信息和历史行为数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长;
数据获得模块还用于:根据待预测对象的待执行行为相关的历史行为数据,获得待预测对象的图谱数据,所述图谱数据包括与待预测对象有关的对象的历史行为数据;
概率预测模块具体用于:将待预测对象的属性信息、历史行为数据以及图谱数据输入至概率预测模型,获得待预测对象执行待执行行为的概率;
持续时长预测模块具体用于:将待预测对象的属性信息、历史行为数据以及图谱数据输入至持续时长预测模型,获得待预测对象执行待执行行为的持续时长。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至8任一项所述方法的计算机程序。
CN201910752251.8A 2019-08-15 2019-08-15 对象行为持续时长预测方法及装置 Active CN110472685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910752251.8A CN110472685B (zh) 2019-08-15 2019-08-15 对象行为持续时长预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910752251.8A CN110472685B (zh) 2019-08-15 2019-08-15 对象行为持续时长预测方法及装置

Publications (2)

Publication Number Publication Date
CN110472685A CN110472685A (zh) 2019-11-19
CN110472685B true CN110472685B (zh) 2022-02-08

Family

ID=68510091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910752251.8A Active CN110472685B (zh) 2019-08-15 2019-08-15 对象行为持续时长预测方法及装置

Country Status (1)

Country Link
CN (1) CN110472685B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111127189A (zh) * 2019-12-23 2020-05-08 支付宝(杭州)信息技术有限公司 流动性预测系统、方法以及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157105A (zh) * 2015-04-22 2016-11-23 阿里巴巴集团控股有限公司 获取用户状态信息的方法和装置
CN108549594A (zh) * 2018-03-30 2018-09-18 武汉斗鱼网络科技有限公司 确定用户流失原因的方法及装置
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN109657855A (zh) * 2018-12-14 2019-04-19 深圳壹账通智能科技有限公司 离职概率的预测方法、装置、计算机设备和存储介质
CN109785968A (zh) * 2018-12-27 2019-05-21 东软集团股份有限公司 一种事件预测方法、装置、设备及程序产品

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190220801A1 (en) * 2018-01-17 2019-07-18 International Business Machiness Corporation Predicting the probability of opportunities to be won from organization information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157105A (zh) * 2015-04-22 2016-11-23 阿里巴巴集团控股有限公司 获取用户状态信息的方法和装置
CN108549594A (zh) * 2018-03-30 2018-09-18 武汉斗鱼网络科技有限公司 确定用户流失原因的方法及装置
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN109657855A (zh) * 2018-12-14 2019-04-19 深圳壹账通智能科技有限公司 离职概率的预测方法、装置、计算机设备和存储介质
CN109785968A (zh) * 2018-12-27 2019-05-21 东软集团股份有限公司 一种事件预测方法、装置、设备及程序产品

Also Published As

Publication number Publication date
CN110472685A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
EP3931731B1 (en) Feature drift hardened online application origination (oao) service for fraud prevention systems
Halvaiee et al. A novel model for credit card fraud detection using Artificial Immune Systems
US20190164015A1 (en) Machine learning techniques for evaluating entities
Megdad et al. Fraudulent financial transactions detection using machine learning
US20220284490A1 (en) Preemptive transaction analysis
CN112926654B (zh) 预标注模型训练、证件预标注方法、装置、设备及介质
US11481707B2 (en) Risk prediction system and operation method thereof
US20190392295A1 (en) Information processing device, method, and program that use deep learning
WO2019200742A1 (zh) 短期盈利的预测方法、装置、计算机设备和存储介质
CN111708883A (zh) 一种基于机器学习和设备指纹的授信额度确定方法及装置
Kalaiselvi et al. Credit card fraud detection using learning to rank approach
CN110442713A (zh) 文章管理方法、装置、计算机设备和存储介质
CN110472685B (zh) 对象行为持续时长预测方法及装置
Berrada et al. A review of Artificial Intelligence approach for credit risk assessment
US10896290B2 (en) Automated pattern template generation system using bulk text messages
Liu et al. Key time steps selection for CFD data based on deep metric learning
CN116664306A (zh) 风控规则的智能推荐方法、装置、电子设备及介质
US20230359941A1 (en) System and method for efficient transformation prediction in a data analytics prediction model pipeline
CN106022915A (zh) 企业信用风险评估方法和装置
CN115438747A (zh) 异常账户识别模型训练方法、装置、设备及介质
Bhardwaj et al. Machine learning techniques based exploration of various types of crimes in India
Ling et al. Intelligent detection of fine cracks on sleepers based on improved YOLOv5 model of cascade fusion
Laimek et al. ATM fraud detection using outlier detection
CN115482084A (zh) 用于生成风控规则集的方法及装置
CN114004660A (zh) 数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant