CN110348190B - 基于用户操作行为的用户设备归属判断方法及装置 - Google Patents

基于用户操作行为的用户设备归属判断方法及装置 Download PDF

Info

Publication number
CN110348190B
CN110348190B CN201910581347.2A CN201910581347A CN110348190B CN 110348190 B CN110348190 B CN 110348190B CN 201910581347 A CN201910581347 A CN 201910581347A CN 110348190 B CN110348190 B CN 110348190B
Authority
CN
China
Prior art keywords
user
sample
user operation
judging
attribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910581347.2A
Other languages
English (en)
Other versions
CN110348190A (zh
Inventor
李尚英
郑彦
马希龙
胡晓悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qiyu Information Technology Co ltd
Original Assignee
Shanghai Qiyu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qiyu Information Technology Co ltd filed Critical Shanghai Qiyu Information Technology Co ltd
Priority to CN201910581347.2A priority Critical patent/CN110348190B/zh
Publication of CN110348190A publication Critical patent/CN110348190A/zh
Application granted granted Critical
Publication of CN110348190B publication Critical patent/CN110348190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/316User authentication by observing the pattern of computer usage, e.g. typical user behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Computer Security & Cryptography (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于用户操作行为的用户设备归属判断方法及装置,方法包括基于用户操作行为属性数据,构建用户设备归属判断模型;获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为;使用所述用户设备归属判断模型进行运算,得到用户设备归属结果。本发明的用户设备归属模型将用户关联的所有设备信息分析建模,在用户关联的所有设备中找出最有可能是用户常用设备的一个。将得到的用户设备归属结果作为变量输入到其他的反欺诈模型中,可辅助判断客户的欺诈风险。

Description

基于用户操作行为的用户设备归属判断方法及装置
技术领域
本发明涉及计算机领域,尤其设计一种基于用户操作行为的用户设备归属判断方法及装置。
背景技术
随着互联网消费金融的蓬勃发展,人们越来越多的使用线上平台进行业务申请,快捷的操作和简单的流程,使得移动手机/PAD等移动设备作为主要的申请工具成为用户与平台、用户与用户之间的重要媒介。欺诈风险是互联网金融行业面临的主要风险之一,是信贷风险管理的重要环节。
这些移动设备与用户一一对应的关系一直是反欺诈分析的难点,一些用户通过使用他人设备,减少了信息的获取,增大了欺诈风险,因此有必要对设备的归属情况进行建模分析,从而完善关系网信息,增加设备信息获取的可信度,打击欺诈行为。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
鉴于上述问题,提出了本发明说明书以便提供一种克服上述问题或者至少部分地解决上述问题。
本发明说明书公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
第一方面,本发明说明书公开了一种基于用户操作行为的用户设备归属判断方法,包括,
基于用户操作行为属性数据,构建用户设备归属判断模型;
获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为;
使用所述用户设备归属判断模型进行运算,得到用户设备归属结果。
在本公开的一种示例性实施例中,所述构建用户设备归属判断模型包括,
根据用户操作行为属性数据,采用有监督学习和半监督学习相结合的方式训练用户设备归属判断模型。
在本公开的一种示例性实施例中,所述构建用户设备归属判断模型进一步包括,
获取用户操作样本数据;
将所述用户操作样本数据分为第一有标签样本和无标签样本;
对所述第一有标签样本做有监督学习,得到基于用户操作行为的第一判断模型;
使用第一判断模型对无标签样本进行半监督学习,得到第二有标签样本;
对所述第一有标签样本和所述第二有标签样本进行有监督学习,得到基于用户操作行为的用户设备归属判断模型。
在本公开的一种示例性实施例中,所述获取用户操作样本数据进一步包括,
所述用户操作样本数据包括用户在设备上的操作行为、设备本身属性以及设备关联信息。
在本公开的一种示例性实施例中,所述将所述用户操作样本数据分为第一有标签样本和无标签样本进一步包括,
对获取的用户操作样本数据的一部分进行用户操作与设备归属判断的人工打标作为第一有标签样本,剩余部分为无标签样本。
在本公开的一种示例性实施例中,所述进行人工打标包括,
根据用户操作行为属性,人工判断设备和用户的一一归属关系并打标。
在本公开的一种示例性实施例中,所述对所述第一有标签样本做有监督学习,得到基于用户操作行为的第一判断模型进一步包括,
将基于用户操作行为属性对设备和用户的归属关系进行人工打标的所述第一有标签样本平均分为两份,其中一份用于做有监督学习,通过交叉验证建模得到基于用户操作行为的第一判断模型。
在本公开的一种示例性实施例中,所述对所述第一有标签样本和所述第二有标签样本进行有监督学习,得到基于用户操作行为的用户设备归属判断模型进一步包括,
将所述第一有标签样本剩余的一份与所述第二有标签样本进行有监督学习。
在本公开的一种示例性实施例中,所述使用第一判断模型对无标签样本进行半监督学习,得到第二有标签样本进一步包括,
使用基于用户操作行为的第一判断模型对无标签样本进行判断;
使用判断结果对无标签样本进行用户操作与设备归属的打标,得到第二有标签样本。
在本公开的一种示例性实施例中,所述使用判断结果对无标签样本进行用户操作与设备归属的打标,得到第二有标签样本进一步包括,
设定阈值;
将判断结果大于阈值的标签设为1,反之则将标签设为0。
在本公开的一种示例性实施例中,所述获取所述用户设备归属判断模型所需输入变量进一步包括,
用户在设备上的操作行为属性、设备本身属性以及设备关联信息。
在本公开的一种示例性实施例中,所述获取所述用户设备归属判断模型所需输入变量还包括,
对变量进行衍生,所述衍生包括自动变量衍生和手动变量衍生。
第二方面,本发明说明书公开了基于用户操作行为的用户设备归属判断装置,包括:
设备归属判断模型模块,基于用户操作行为属性数据,用于构建用户设备归属判断模型;
输入变量获取模块,用于获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为;
运算模块,用于使用所述用户设备归属判断模型进行运算,得到用户设备归属判断结果。
在本公开的一种示例性实施例中,所述设备归属判断模型模块包括,
学习单元,用于根据用户操作行为属性数据,采用有监督学习和半监督学习相结合的方式训练用户设备归属判断模型。
在本公开的一种示例性实施例中,所述用户设备归属判断模型模块进一步包括,
用户操作样本数据获取单元,用于获取用户操作样本数据;
分类单元,用于将所述用户操作样本数据分为第一有标签样本和无标签样本;
第一判断模型单元,用于对所述第一有标签样本做有监督学习,得到基于用户操作行为的第一判断模型;
半监督学习单元,用于使用第一判断模型对无标签样本进行半监督学习,得到第二有标签样本;
有监督学习单元,用于对所述第一有标签样本和所述第二有标签样本进行有监督学习,得到基于用户操作行为的用户设备归属判断模型。
在本公开的一种示例性实施例中,所述用户操作样本数据获取单元进一步包括,
操作行为子单元,用于获取用户在设备上的操作行为;
设备属性子单元,用于获取设备本身属性;
设备关联信息子单元,用于获取设备关联信息。
在本公开的一种示例性实施例中,所述分类单元进一步包括,
人工打标子单元,用于对获取的用户操作样本数据的一部分进行用户操作与设备归属判断的人工打标作为第一有标签样本,剩余部分为无标签样本。
在本公开的一种示例性实施例中,所述人工打标子单元包括,
根据用户操作行为属性,人工判断设备和用户的一一归属关系并打标。
在本公开的一种示例性实施例中,所述第一判断模型单元进一步包括,
标签样本均分子单元,用于将基于用户操作行为属性对设备和用户的归属关系进行人工打标的所述第一有标签样本平均分为两份,其中一份用于做有监督学习,通过交叉验证建模得到基于用户操作行为的第一判断模型。
在本公开的一种示例性实施例中,所述用户设备归属判断模型进一步包括,
将所述第一有标签样本剩余的一份与所述第二有标签样本进行有监督学习。
在本公开的一种示例性实施例中,所述半监督学习单元进一步包括,
判断子单元,用于使用基于用户操作行为的第一判断模型对无标签样本进行判断;
打标子单元,用于使用判断结果对无标签样本进行用户操作与设备归属的打标,得到第二有标签样本。
在本公开的一种示例性实施例中,所述打标子单元进一步包括,
设定阈值;
将判断结果大于阈值的标签设为1,反之则将标签设为0。
在本公开的一种示例性实施例中,所述输入变量获取模块进一步包括,
用户在设备上的操作行为属性、设备本身属性以及设备关联信息。
在本公开的一种示例性实施例中,所述输入变量获取模块还包括,
变量衍生单元,用于对变量进行衍生,所述衍生包括自动变量衍生和手动变量衍生。
第三方面,本发明说明书提供一种服务器,包括处理器和存储器:所述存储器用于存储上述任一项所述方法的程序;所述处理器被配置为用于执行所述存储器中存储的程序实现上述任一项所述方法的步骤。
第四方面,本发明说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
本发明具有积极的效果:本发明的用户设备归属模型将用户关联的所有设备信息分析建模,在用户关联的所有设备中找出最有可能是用户常用设备的一个。将得到的用户设备归属结果作为变量输入到其他的反欺诈模型中,可辅助判断客户的欺诈风险。可以将经过本发明判断的结果用于完善用户的关系网信息;或者用于当借款时用户不使用本人设备时,加强核身策略;而且在借款阶段的反欺诈模型中,输入客户是否是借款设备所有者的变量,可辅助评估用户的欺诈风险,由此应用非常广泛。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种基于用户操作行为的用户设备归属判断方法的流程图。
图2是图1所示方法中有监督学习的的示意图。
图3是图1所示方法中模型的框架。
图4是根据另一示例性实施例示出的一种基于用户操作行为的用户设备归属判断装置的框图。
图5是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
然而,下述的示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。
本发明提供了一种基于用户操作行为的用户设备归属判断方法,用于解决现有技术中设备与用户一一对应关系不易分析,增大了欺诈风险的技术问题,为了解决上述问题,本发明的总体思路如下:
一种基于用户操作行为的用户设备归属判断方法,包括,
基于用户操作行为属性数据,构建用户设备归属判断模型;
获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为;
使用所述用户设备归属判断模型进行运算,得到用户设备归属结果。
本发明的用户设备归属模型将用户关联的所有设备信息分析建模,在用户关联的所有设备中找出最有可能是用户常用设备的一个。将得到的用户设备归属结果作为变量输入到其他的反欺诈模型中,可辅助判断客户的欺诈风险。
首先需要说明书的是,在本发明各个实施例中,所涉及的术语为:
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
下面,通过几个具体的实施例对本发明的技术方案进行详细介绍和说明。
见图1,一种基于用户操作行为的用户设备归属判断方法,包括,
S101,基于用户操作行为属性数据,构建用户设备归属判断模型;
在本步中,根据用户操作行为属性数据,采用有监督学习和半监督学习相结合的方式训练用户设备归属判断模。具体来说可以采用如下的方式:
(a)获取用户操作样本数据;用户操作样本数据的选取主要根据用户操作来确定,包括用户在设备上的操作行为、设备本身属性以及设备关联信息。
用户在设备上的操作行为的差异可以反映出哪个设备是其主要使用的设备,即我们要寻找的用户归属的设备。例如用户在不同设备上的操作顺序,用户首次发生借款行为的设备更有可能是其常用设备;用户在不同设备上的操作次数也是较为重要的变量,例如用户在不同设备上登录、借款的次数,是否是操作次数最多的设备等。
设备本身属性是指:用户使用设备时可能会将设备名称设置为自己的姓名或昵称,也可作为判断设备归属的特征,设备名称与姓名的相似度越高,越有可能是归属该用户的设备。
设备关联信息可以反映出关联用户的关系,例如若两个设备的关系网关联非常相似,那么这两台设备有可能为同一用户所有。
(b)将所述用户操作样本数据分为第一有标签样本和无标签样本;具体的做法是:对获取的用户操作样本数据的一部分进行用户操作与设备归属判断的人工打标作为第一有标签样本,剩余部分为无标签样本。其中,人工打标的方式为:根据用户操作行为属性,人工判断设备和用户的一一归属关系并打标。
(c)对所述第一有标签样本做有监督学习,得到基于用户操作行为的第一判断模型;具体来说,将前面已经人工打标的所述第一有标签样本平均分为两份,其中一份用于做有监督学习,通过交叉验证建模得到基于用户操作行为的第一判断模型。
(d)使用第一判断模型对无标签样本进行半监督学习,得到第二有标签样本;具体包括:使用基于用户操作行为的第一判断模型对无标签样本进行判断;使用判断结果对无标签样本进行用户操作与设备归属的打标,打标的方法为:设定阈值;将判断结果大于阈值的标签设为1,反之则将标签设为0,从而得到第二有标签样本。
(e)将所述第一有标签样本剩余的一份与所述第二有标签样本进行有监督学习,得到基于用户操作行为的用户设备归属判断模型。
S102,获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为,具体指用户在设备上的操作行为属性、设备本身属性以及设备关联信息。除了获得这些基础变量之外,变量衍生是建模的重要环节,衍生出更多更有用的变量有助于提升模型的效果。衍生方法主要包括自动衍生方法和手动衍生方法两种。自动变量衍生方法包含独特编码,即可将一个离散型变量拆分为多个二分类变量的过程;还可利用一些自动变量衍生的工具(例如Featuretools、Polynomialfeatures等)产生交叉项相乘的新变量等。手动变量衍生的方法主要是根据业务经验发掘新的有效变量,例如设备上客户操作时间的排序变量、首次使用设备时是否注册等等。
S103,使用所述用户设备归属判断模型进行运算,得到用户设备归属结果。
在本实施例中,采用的模型算法为有监督学习与半监督学习相结合,通过几层模型的stacking迭代使得分析的准确度不断提升。
如图2所示,展示了有监督学习训练模型的过程。在本发明的构思下,用户设备归属判断模型主要采用了有监督学习和半监督学习相结合的方法,首先收集一部分人工打标的样本做监督学习,即人工判断设备和用户的一一归属关系(根据各种信息,人工判断这个设备的用户是谁)并打标作为因变量,先用这一部分的样本做监督学习。将这部分人工打标的样本分5折做交叉验证建模形成Model1,再用Model1进行预测判断,并将Model1判断的结果输入Model2,以此类推,生成有监督学习部分。
构建用户设备归属判断模型的框架如图3所示,利用一部分已经人工打标的样本A训练出有监督学习模型(称为Model I),利用已经训练好的有监督学习模型Model I预测没有人工打标的样本B,设定一个阈值(例如0.8),将预测概率大于0.8的标签设为1,反之为0,即用有监督模型为无标签样本B打标签。然后用余下的一部分样本A和样本B训练一个新的有监督学习模型(按照上述方法,称为Model II),形成最终的预测模型,即有新的用户/设备关系时,将变量输入预测模型预测即可。
本发明第二实施例还公开了基于用户操作行为的用户设备归属判断装置,包括;
设备归属判断模型模块401,基于用户操作行为属性数据,用于构建用户设备归属判断模型;设备归属判断模型模块401具体包含学习单元,用于根据用户操作行为属性数据,采用有监督学习和半监督学习相结合的方式训练用户设备归属判断模型。
此外,还包括:用户操作样本数据获取单元,用于获取用户操作样本数据;根据用户操作行为属性,用户样本数据获取单元具有包含操作行为子单元,用于获取用户在设备上的操作行为;设备属性子单元,用于获取设备本身属性;设备关联信息子单元,用于获取设备关联信息。
分类单元,用于将所述用户操作样本数据分为第一有标签样本和无标签样本;分类单元具体包括人工打标子单元,用于对获取的用户操作样本数据的一部分进行用户操作与设备归属判断的人工打标作为第一有标签样本,剩余部分为无标签样本。人工打标子单元包括,根据用户操作行为属性,人工判断设备和用户的一一归属关系并打标。
第一判断模型单元,用于对所述第一有标签样本做有监督学习,得到基于用户操作行为的第一判断模型;第一判断模型单元进一步包括,标签样本均分子单元,用于将基于用户操作行为属性对设备和用户的归属关系进行人工打标的所述第一有标签样本平均分为两份,其中一份用于做有监督学习,通过交叉验证建模得到基于用户操作行为的第一判断模型。
半监督学习单元,用于使用第一判断模型对无标签样本进行半监督学习,得到第二有标签样本;半监督学习单元进一步包括,判断子单元,用于使用基于用户操作行为的第一判断模型对无标签样本进行判断;打标子单元,用于使用判断结果对无标签样本进行用户操作与设备归属的打标(设定阈值;将判断结果大于阈值的标签设为1,反之则将标签设为0),得到第二有标签样本。
有监督学习单元,用于对所述第一有标签样本和所述第二有标签样本进行有监督学习,得到基于用户操作行为的用户设备归属判断模型。具体而言,是将所述第一有标签样本剩余的一份与所述第二有标签样本进行有监督学习。
输入变量获取模块402,用于获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为;输入变量获取模块进一步包括,用户在设备上的操作行为属性、设备本身属性以及设备关联信息。此外,输入变量获取模块还包括变量衍生单元,用于对变量进行衍生,所述衍生包括自动变量衍生和手动变量衍生
运算模块403,用于使用所述用户设备归属判断模型进行运算,得到用户设备归属判断结果。
在本实施例中,用户设备归属判断模型主要采用了有监督学习和半监督学习相结合的方法,首先收集一部分人工打标的样本做监督学习,即人工判断设备和用户的一一归属关系(根据各种信息,人工判断这个设备的用户是谁)并打标作为因变量,先用这一部分的样本做监督学习。将这部分人工打标的样本分5折做交叉验证建模形成第一判断模型,再用第一判断模型进行预测判断,并将第一判断模型单元判断的结果输入用户设备归属判断模型,以此类推,生成有监督学习部分。也就是说利用一部分已经人工打标的样本A训练出有监督学习模型(第一判断模型),利用已经训练好的第一判断模型预测没有人工打标的样本B,为无标签样本B打标签。然后用余下的一部分样本A和样本B训练一个新的有监督学习模型,形成最终的用户设备归属判断模型。
本说明书第三实施例还提供了一种服务器,包括存储器502、处理器501及存储在存储器502上并可在处理器501上运行的计算机程序,所述处理器501执行所述程序时实现前文所述方法的步骤。为了便于说明,仅示出了与本说明书实施例相关的部分,具体技术细节未揭示的,请参照本说明书实施例方法部分。该服务器,可以是包括各种电子设备形成的服务器设备,PC电脑、网络云服务器,甚至手机、平板电脑、PDA(Personal DigitalAssistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑、台式电脑等任意电子设备上设置的服务器功能。
具体地,图5示出的与本说明书实施例提供的技术方案相关的服务器组成结构框图,总线500可以包括任意数量的互联的总线和桥,其将包括由处理器501代表的一个或多个处理器和存储器502代表的存储器的各种电路链接在一起。总线500还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口503在总线500和接收器和/或发送器504之间提供接口,接收器和/或发送器504可以是分开独立的接收器或发送器也可以是同一个元件如收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器501负责管理总线500和通常的处理,而存储器502可以被用于存储处理器501在执行操作时所使用的数据。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取历史信贷数据集,所述历史信贷数据集包括用户的多维度属性信息及逾期信息;基于所述多维度属性信息对所述历史信贷数据集进行自动分档处理以生成多个子数据集;根据所述逾期信息计算所述多个子数据集中每一个子数据集对应的逾期率;以及根据子数据集及其对应的所述逾期率生成信贷风险控制规则。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
以上具体地示出和描述了本公开的示例性实施例。应可理解的是,本公开不限于这里描述的详细结构、设置方式或实现方法;相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
此外,本说明书说明书附图所示出的结构、比例、大小等,均仅用以配合说明书所公开的内容,以供本领域技术人员了解与阅读,并非用以限定本公开可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本公开所能产生的技术效果及所能实现的目的下,均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“第一”、“第二”及“一”等的用语,也仅为便于叙述的明了,而非用以限定本公开可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当也视为本公开可实施的范畴。

Claims (5)

1.一种基于用户操作行为的用户设备归属判断方法,其特征在于,包括,
获取用户操作样本数据;
对获取的用户操作样本数据的一部分进行用户操作与设备归属判断的人工打标作为第一有标签样本,剩余部分为无标签样本;
对所述第一有标签样本平均分为两份,利用其中一份做有监督学习,包括:通过交叉验证建模形成模型Model1后用模型Model1预测判断并将判断的结果输入到模型Model2,得到基于用户操作行为的第一判断模型;
使用训练好的第一判断模型对无标签样本进行半监督学习,使用判断结果对无标签样本进行用户操作与设备归属的打标,得到第二有标签样本;
将剩余的一份所述第一有标签样本与所述第二有标签样本进行有监督学习,包括:通过交叉验证建模形成模型Model1后用模型Model1预测判断并将判断的结果输入到模型Model2,得到基于用户操作行为的用户设备归属判断模型;
获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为;所述输入变量来自基础变量以及自动和手动衍生的变量;
使用所述用户设备归属判断模型进行运算,得到用户设备归属结果。
2.根据权利要求1所述的方法,其特征在于,其中,所述进行人工打标包括:根据用户操作行为属性,人工判断设备和用户的一一归属关系并打标。
3.一种基于用户操作行为的用户设备归属判断装置,其特征在于,包括:
设备归属判断模型模块,包括用户操作样本数据获取单元,用于获取用户操作样本数据;
分类单元,用于将用户操作样本分为第一有标签样本和无标签样本,具体包括:人工打标子单元,用于对获取的用户操作样本数据的一部分进行用户操作与设备归属判断的人工打标作为第一有标签样本,剩余部分为无标签样本;
第一判断模型单元,包括:标签样本均分子单元,用于对所述第一有标签样本均分为两份,利用其中一份做有监督学习:通过交叉验证模型形成模型Model1后用模型Model1预测判断、并将判断的结果输入到模型Model2,得到基于用户操作行为的第一判断模型;
半监督学习单元,用于使用训练好的第一判断模型对无标签样本进行半监督学习,使用判断结果对无标签样本进行用户操作与设备归属的打标,得到第二有标签样本;
有监督学习单元,用于将剩余的一份所述第一有标签样本与所述第二有标签样本进行有监督学习包括:通过交叉验证建模形成模型Model1后用模型Model1预测判断并将判断的结果输入到模型Model2,得到基于用户操作行为的用户设备归属判断模型;
输入变量获取模块,用于获取所述用户设备归属判断模型所需输入变量;所述输入变量包含用户操作行为;所述输入变量来自基础变量以及自动和手动衍生的变量;
运算模块,用于使用所述用户设备归属判断模型进行运算,得到用户设备归属判断结果。
4.一种服务器,其特征在于,包括处理器和存储器:所述存储器用于存储执行权利要求1或2所述方法的程序;所述处理器被配置为用于执行所述存储器中存储的程序。
5.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1或2所述方法的步骤。
CN201910581347.2A 2019-06-29 2019-06-29 基于用户操作行为的用户设备归属判断方法及装置 Active CN110348190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910581347.2A CN110348190B (zh) 2019-06-29 2019-06-29 基于用户操作行为的用户设备归属判断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910581347.2A CN110348190B (zh) 2019-06-29 2019-06-29 基于用户操作行为的用户设备归属判断方法及装置

Publications (2)

Publication Number Publication Date
CN110348190A CN110348190A (zh) 2019-10-18
CN110348190B true CN110348190B (zh) 2024-06-07

Family

ID=68177300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910581347.2A Active CN110348190B (zh) 2019-06-29 2019-06-29 基于用户操作行为的用户设备归属判断方法及装置

Country Status (1)

Country Link
CN (1) CN110348190B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362981B (zh) * 2019-06-29 2022-12-02 上海淇毓信息科技有限公司 基于可信设备指纹判断异常行为的方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548342A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种可信设备确定方法及装置
CN107153786A (zh) * 2017-05-26 2017-09-12 北京奇点数聚科技有限公司 一种人机识别方法、系统及终端设备、可读存储介质
CN108985330A (zh) * 2018-06-13 2018-12-11 华中科技大学 一种自编码网络及其训练方法、异常用电检测方法和系统
CN109509021A (zh) * 2018-10-22 2019-03-22 武汉极意网络科技有限公司 基于行为轨迹的异常识别方法、装置、服务器及存储介质
CN109544190A (zh) * 2018-11-28 2019-03-29 北京芯盾时代科技有限公司 一种欺诈识别模型训练方法、欺诈识别方法及装置
CN109934698A (zh) * 2019-01-29 2019-06-25 华融融通(北京)科技有限公司 一种基于标签传播的欺诈关联网络特征提取方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548342A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种可信设备确定方法及装置
CN107153786A (zh) * 2017-05-26 2017-09-12 北京奇点数聚科技有限公司 一种人机识别方法、系统及终端设备、可读存储介质
CN108985330A (zh) * 2018-06-13 2018-12-11 华中科技大学 一种自编码网络及其训练方法、异常用电检测方法和系统
CN109509021A (zh) * 2018-10-22 2019-03-22 武汉极意网络科技有限公司 基于行为轨迹的异常识别方法、装置、服务器及存储介质
CN109544190A (zh) * 2018-11-28 2019-03-29 北京芯盾时代科技有限公司 一种欺诈识别模型训练方法、欺诈识别方法及装置
CN109934698A (zh) * 2019-01-29 2019-06-25 华融融通(北京)科技有限公司 一种基于标签传播的欺诈关联网络特征提取方法

Also Published As

Publication number Publication date
CN110348190A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN112084383A (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
CN111210335B (zh) 用户风险识别方法、装置及电子设备
CN108885631B (zh) 用于数据市场中的合同管理的方法和系统
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
US10678821B2 (en) Evaluating theses using tree structures
US10417578B2 (en) Method and system for predicting requirements of a user for resources over a computer network
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
CN111178687A (zh) 金融风险分类方法、装置及电子设备
CN111190967B (zh) 用户多维度数据处理方法、装置及电子设备
CN115375177A (zh) 用户价值评估方法、装置、电子设备及存储介质
CN111191677B (zh) 用户特征数据生成方法、装置及电子设备
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN113051911B (zh) 提取敏感词的方法、装置、设备、介质及程序产品
CN110348190B (zh) 基于用户操作行为的用户设备归属判断方法及装置
CN111209403A (zh) 数据处理方法、装置、介质及电子设备
CN113568739B (zh) 用户资源额度分配方法、装置及电子设备
CN110362981B (zh) 基于可信设备指纹判断异常行为的方法及系统
CN112348661B (zh) 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN114493853A (zh) 信用等级评价方法、装置、电子设备及存储介质
CN112200602A (zh) 用于广告推荐的神经网络模型训练方法及装置
CN110909777A (zh) 一种多维特征图嵌入方法、装置、设备及介质
CN113868438B (zh) 信息可信度的校准方法、装置、计算机设备及存储介质
US11973832B2 (en) Resolving polarity of hosted data streams

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: Room 1118, No.4, Lane 800, Tongpu Road, Putuo District, Shanghai 200062

Applicant after: SHANGHAI QIYU INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 201500 room a1-5962, 58 Fumin Branch Road, Hengsha Township, Chongming District, Shanghai (Shanghai Hengtai Economic Development Zone)

Applicant before: SHANGHAI QIYU INFORMATION TECHNOLOGY Co.,Ltd.

Country or region before: China

CB02 Change of applicant information
GR01 Patent grant