CN111311107A - 基于用户关系的风险评估方法、装置和计算机设备 - Google Patents

基于用户关系的风险评估方法、装置和计算机设备 Download PDF

Info

Publication number
CN111311107A
CN111311107A CN202010136464.0A CN202010136464A CN111311107A CN 111311107 A CN111311107 A CN 111311107A CN 202010136464 A CN202010136464 A CN 202010136464A CN 111311107 A CN111311107 A CN 111311107A
Authority
CN
China
Prior art keywords
user
risk assessment
training
feature data
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010136464.0A
Other languages
English (en)
Other versions
CN111311107B (zh
Inventor
丁剑冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010136464.0A priority Critical patent/CN111311107B/zh
Publication of CN111311107A publication Critical patent/CN111311107A/zh
Application granted granted Critical
Publication of CN111311107B publication Critical patent/CN111311107B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Technology Law (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及一种基于用户关系的风险评估方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取待评估用户对应的属性特征数据;获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果;使用关联风险评估结果计算各个统计结果,组合各个统计结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。本申请提供的方案可以使得到的风险评估结果更加准确。

Description

基于用户关系的风险评估方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于用户关系的风险评估方法、装置、存储介质和计算机设备。
背景技术
随着人工智能技术的发展,互联网金融企业开始采用人工智能对用户进行风险评估。比如,使用机器学习模型来对用户进行风险评估,其主要流程是首先会收集一批已有金融业务表现的用户,关联更多维度的用户数据,将用户数据输入到机器学习模型中,训练得到风险评估模型。在对新用户进行风险评估时,需要获取到新用户的用户数据,将用户数据通过风险评估模型进行评估,得到风险评估结果。
然而,目前的风险评估模型在训练时通常将用户当成独立的个体,通过获取用户本身更多维度的数据来训练风险评估模型。其忽略了在金融场景下用户之间是有紧密联系的。只使用用户本身更多维度的数据来训练风险评估模型,会使风险评估模型存在风险评估准确性低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高风险评估准确性的基于用户关系的风险评估方法、装置、存储介质和计算机设备。
一种基于用户关系的风险评估方法,包括
获取待评估用户对应的属性特征数据,属性特征数据是指根据用户属性转换得到的特征数据;
获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果;
使用关联风险评估结果计算各个统计结果,组合各个统计结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;
风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。
一种基于用户关系的风险评估装置,包括:
属性获取模块,用于获取待评估用户对应的属性特征数据,属性特征数据是指根据用户属性转换得到的特征数据;
关联结果获取模块,用于获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果;
评估模块,用于使用关联风险评估结果计算各个统计结果,组合各个统计结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行程序时实现以下步骤:
获取待评估用户对应的属性特征数据,属性特征数据是指根据用户属性转换得到的特征数据;
获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果;
使用关联风险评估结果计算各个统计结果,组合各个统计结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;
风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。
一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取待评估用户对应的属性特征数据,属性特征数据是指根据用户属性转换得到的特征数据;
获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果;
使用关联风险评估结果计算各个统计结果,组合各个统计结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。
上述基于用户关系的风险评估方法、装置、存储介质和计算机设备,通过获取到用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果。然后根据关联风险评估结果得到待评估用户对应的关联特征数据,使用待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果,根据用户间关系信息得到待评估用户对应的关联用户,充分利用关联用户的风险评估结果得到关联特征数据,从而根据关联特征数据和属性特征数据使用风险评估模型进行风险评估,能够使得到的风险评估结果更加准确。
附图说明
图1为一个实施例中基于用户关系的风险评估方法的应用环境图;
图2为一个实施例中基于用户关系的风险评估方法的流程示意图;
图3为另一个实施例中基于用户关系的风险评估方法的流程示意图;
图4为又一个实施例中基于用户关系的风险评估方法的流程示意图;
图5为再一个实施例中基于用户关系的风险评估方法的流程示意图;
图6为一个具体实施例中得到用户关系图的示意图;
图7为又一个实施例中基于用户关系的风险评估的流程示意图;
图8为一个实施例中训练得到风险评估模型的流程示意图;
图9为一个具体实施例中得到模型特征的示意图;
图10为一个实施例中迭代循环得到风险评估模型的流程示意图;
图11为另一个实施例中训练得到风险评估模型的流程示意图;
图12为一个实施例中风险评估模型训练架构的示意图;
图13为一个具体实施例中训练风险评估模型的流程示意图;
图14为一个具体实施例中基于用户关系的风险评估方法的流程示意图;
图15为另一个实施例中基于用户关系的风险评估装置的结构框图;
图16为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
图1为一个实施例中基于用户关系的风险评估方法的应用环境图。参照图1,该基于用户关系的风险评估方法应用于基于用户关系的风险评估系统。该基于用户关系的风险评估系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,服务器120获取待评估用户对应的属性特征数据,属性特征数据是指根据用户属性转换得到的特征数据;服务器120获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果;服务器120使用关联风险评估结果计算各个统计结果,组合各个统计结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。服务器120可以将得到的待评估用户对应的风险评估结果发送到终端110进行展示。
如图2所示,在一个实施例中,提供了一种基于用户关系的风险评估方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该基于用户关系的风险评估方法具体包括如下步骤:
S202,获取待评估用户对应的属性特征数据,属性特征数据是指根据用户属性转换得到的特征数据。
其中,待评估用户是指需要进行业务风险评估的用户。比如,对有金融业务的用户进行信用风险的评估,对有贷款业务的用户进行逾期还款风险的评估。属性特征数据是指根据用户属性转换得到的特征数,用于表征待评估用户本身的属性信息。该属性信息通常包括年龄、性别、学历、工作、住址、经常出现的地点和阅读兴趣中的至少一种。
具体地,服务器可以获取到待评估用户本身的属性信息,将属性信息进行转换,得到属性特征数据,比如,将性别男转换为性别特征数据1,性别女转换为性别特征数据0。还可以直接将该相关属性信息作为属性特征数据,比如,待评估用户的年龄为18岁,直接将18作为年龄特征数据。
S204,获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果。
其中,用户间关系信息是指待评估用户与用户之间的关联关系,比如,待评估用户A与用户B关联,待评估用户A与用户C关联等等。关联用户是指与待评估用户存在关联关系的用户。关联风险评估结果是指关联用户对应的风险评估结果。该关联风险评估结果可以预先设置好的,也可以是预先进行风险评估得到的。风险评估结果用于反映用户的业务风险评估结果,比如,对用于金融业务信用风险进行评估得到的信用的高低,对贷款业务进行评估得到的逾期风险值。
具体地,服务器获取到待评估用户对应的用户间关系信息,可以从第三方获取,也可以是获取到预先建立好的用户间关系图中获取。该第三方是指存在用户间关联关系的第三方平台。比如,该第三方平台可以是社交平台,例如,微信平台、QQ平台等等。服务器在用户间关系信息查找到待评估用户,然后根据用户间关系信息确定待评估用户对应的关联用户。确定的关联用户可以是待评估用户对应的用户间关系信息中的所有关联用户,也可以是部分关联用户。比如,可以确定用户间关系信息中待评估用户对应的用户是否有关联风险评估结果,当存在关联风险评估结果时,确定为待评估用户对应的关联用户,当用户未存在关联风险评估结果时,确定该用户不为待评估用户对应的关联用户。当确定对应的关联用户时,服务器获取到每个关联用户对应的关联风险评估结果。
S206,使用关联风险评估结果计算各个统计结果,组合各个统计结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。
其中,关联特征数据是根据关联风险评估结果计算得到的,用于反映待评估用户对应的关联用户的风险评估结果。当关联用户的风险评估结果都是风险比较高时,则说明待评估用户风险比较高的可能性较大。当关联用户的风险评估结果都是风险比较低时,则说明待评估用户风险比较低的可能性较大。以金融信用为例,当一个用户好友的金融信用越好时,该用户的金融信用也相对越好。统计结果是对风险评估结果使用统计算法进行统计计算得到的结果。统计算法可以是计算平均、计算最大、计算最小和计算分位数等各种统计方法。
风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据使用机器学习算法进行训练得到的。其中,信用特征数据是根据训练用户对应的信用信息得到的特征数据,该信息用信息用于反映用户在业务中的信用表现,比如,训练用户的信用信息可以是贷款业务逾期未还款,该贷款业务逾期未还款对应的信用特征数据可以是0,该训练用户的信用信息还可以是贷款业务及时还款并未逾期,此时,该贷款业务及时还款对应的信用特征数据可以是1。该使用的机器学习算法可以是逻辑回归算法、决策树算法、xgboost(eXtreme Gradient Boosting,极端梯度提升)算法和深度学习网络算法等等。
具体低,服务器根据关联风险评估结果计算得到待评估用户对应的关联特征数据,然后将待评估用户对应的属性特征数据和关联特征数据进行拼接,得到拼接后的特征数据,然后将拼接后的特征数据输入到已经训练好的风险评估模型中进行计算,得到风险评估模型输出的待评估用户对应的风险评估结果。
上述基于用户关系的风险评估方法,通过获取到用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果。然后根据关联风险评估结果得到待评估用户对应的关联特征数据,使用待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果,根据用户间关系信息得到待评估用户对应的关联用户,充分利用关联用户的风险评估结果得到关联特征数据,从而根据关联特征数据和属性特征数据使用风险评估模型进行风险评估,能够使得到的风险评估结果更加准确。
在一个具体地实施例中,可以计算风险评估模型的评价指标,得到评价指标值,将该评价指标值与现有的风险评估模型的评价指标值进行比较,比较结果显示,本申请提升风险评估模型的评价指标20%以上。
在一个实施例中,步骤S202,即获取待评估用户对应的属性特征数据,包括步骤:
获取待评估用户标识,根据待评估用户标识从用户属性特征数据库中查找待评估用户对应的属性特征数据。
其中,待评估用户标识用于唯一标识需要进行风险评估的用户,该待评估用户标识可以是用户名称,用户编号、用户身份证号、用户手机号等。用户属性特征数据库是预先建立的存储用户属性特征数据的数据库,该数据库中存储有预先根据用户的相关属性信息提取得到的特征数据。
具体地,服务器可以接收到终端发送的评估指令,解析该评估指令获取到待评估用户标识,根据待评估用户标识从用户属性特征数据库中查找待评估用户对应的属性特征数据,直接从用户属性特征数据库中获取待评估用户对应的属性特征数据,能够提高得到属性特征数据的效率。
在一个实施例中,如图3所示,步骤S204,获取待评估用户对应的用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,包括步骤:
S302,获取已建立的用户关系图,在用户关系图中查找待评估用户。
其中,用户关系图是指根据用户间关系信息建立的用户标识连接关系图。
具体地,服务器获取到已建立号的用户关系图,在用户关系图中查找待评估用户,即使用待评估用户标识在用户关系图中进行匹配。
S304,当查找到待评估用户时,从用户关系图中查找待评估用户对应的关联用户。
具体地,当匹配到一致的待评估用户标识时,说明查找到了待评估用户,此时可以从用户关系图中查找待评估用户对应的关联用户,该关联用户是用户关系图中直接与待评估用户相连的用户。
在上述实施例中,通过用户关系图来确定待评估用户对应的关联用户,能够提高得到关联用户的准确性和效率。
在一个实施例中,在步骤S302之前,即在获取已建立的用户关系图之前,包括:
建立用户关系图,用户关系图用于表示用户间行为的关联信息。
具体地,服务器建立用户关系图,该用户关系图是根据用户间行为的关联信息建立的,用户间行为的关联信息是指用户的社交关系信息,用户的行为关联信息和用户的知识图谱信息等等,通过预先建立好用户关系图,方便后续直接进行使用。
在一个实施例中,如图4所示,建立用户关系图,包括步骤:
S402,获取各个用户对应的社交关系信息。
其中,社交关系信息是指用户之间的社交好友关系,比如用户的微信好友关系链、腾讯QQ好友关系链、网络平台好友关系链等等。其中,网络平台是指网络游戏平台的好友关系链、网络直播平台的好友关系链、网络视频平台的好友关系链等等。
具体地,服务器获取到要各个用户对应的社交关系信息,比如从微信服务器中获取到微信好友关系链,从腾讯QQ服务器中获取到腾讯QQ好友关系链,从网络平台服务器中获取到好友关系链。
S404,根据社交关系信息建立用户关系图。
具体地,服务器可以直接根据社交关系信息将各个用户进行连接,得到用户关系图。
在上述实施例中,通过各个用户对应的社交关系信息直接得到用户关系图,能够提高已有数据资源利用率,并提高了得到用户关系图的效率。
在一个实施例中,如图5所示,建立用户关系图,包括步骤:
S502,获取各个用户对应的行为数据。
其中,行为数据是指采集得到的用户的各种行为的数据,比如,用户连接的网络数据、用户申请金融业务时使用的设备数据、用户填写金融业务资料顺序的数据和用户完成金融业务时的交易数据等等。
具体地,服务器可以从不同的数据源获取到各个用户对应的行为数据,比如,可以从用户终端获取到用户连接的网络数据,比如,用户连接的网络是WIFI(Wireless-Fidelity,无线网络)网络、4G(the 4th generation mobile communication technology,第四代移动通信技术)网络或者5G(5th generation mobile networks,第五代移动通信技术)网络等等,并获取到与网络相关的数据,比如WIFI的网络名称等等。
S504,从行为数据中确定目标行为特征数据,将相同目标行为特征数据的用户关联,得到用户关系图。
其中,目标行为特征数据是指根据目标行为数据建立的特征数据,目标行为数据是指能够进行用户关系建立的数据,该能够进行用户关系建立的数据是指该用户与该行为数据具有强关联性。比如,用户连接同一WIFI的时间超过一定的天数,或者用户连接同一WIFI的次数超过一定次数等等。
具体地,服务器从行为数据中确定目标行为特征数据,将相同目标行为特征数据的用户关联,得到用户关系图。如图6所示,使用用户连接WIFI网络的行为建立用户关系图,其中,用户行为中用户1连接网络1,用户5连接网络1和网络2,用户2连接网络2等等,将连接相同网络的用户关联,用户1和用户5连接网络1,则将用户1和用户5相连,用户2和用户5连接网络2,则将用户2和用户5相连,得到如同5所示的部分用户关系图。
在上述实施例中,通过从行为数据中确定目标行为特征数据,将相同目标行为特征数据的用户关联,得到用户关系图,提高了得到用户关系图的准确性。
在一个实施例中,可以从行为数据中确定多个类型的目标行为特征数据,将相同目标行为特征数据的用户关联,得到多个用户关系图,从多个用户关系图中得到待评估用户对应的关联用户,进一步提高了得到的关联用户的准确性。
在一个实施例中,如图7所示,步骤S206,即根据关联风险评估结果得到待评估用户对应的关联特征数据,包括步骤:
S702,获取各个目标计算类型维度.
其中,目标计算类型维度是指各种统计方法对应的类型维度,包括平均值维度、最大值维度、最小值维度、中位数维度、分位数维度和大于预设阈值的关联用户占比维度中的至少一种。
具体地,服务器获取到各个设置好的目标计算类型维度,该目标计算类型维度是待评估用户关联特征数据的维度。
S704,根据关联用户风险评估结果计算各个目标类型维度对应的维度结果,组合维度结果得到待评估用户关联特征数据。
具体地,服务器根据各个关联用户对应的关联用户风险评估结果计算各目标类型维度对应的维度结果,将计算得到的维度结果进行组合得到待评估用户关联特征数据。在一个具体地实施例中,如图6所示,用户关系图中用户1有2个关联用户包括用户4和用户5,获取到用户4和用户5的关联用户风险评估值,计算用户4和用户5的关联用户风险评估值的平均值,将该平均值作为平均类型维度的值。还可以计算用户4和用户5的关联用户风险评估值中的最大值,将该最大值作为最大类型维度的值。还可以计算用户4和用户5的关联用户风险评估值中的最小值,将该最小值作为最小类型维度的值。还可以计算用户4和用户5的关联用户风险评估值中的分位数,将分位数作为分位类型维度的值,还可以获取到用户4和用户5的关联用户风险评估值中大于预设阈值的用户占比,将该用户占比作为比值类型维度的值。然后将平均类型维度的值、最大类型维度的值、最小类型维度的值、分位类型维度的值和比值类型维度的值进行组合得到待评估用户关联特征数据。
在上述实施例中,通过计算各个目标类型维度对应的维度结果,组合维度结果得到待评估用户关联特征数据,使得到的待评估用户关联特征数据更加的准确。
在一个实施例中,如图8所示,风险评估模型的训练步骤包括:
S802,获取标注训练用户,标注训练用户是指存在信用标注数据的训练用户。
S804,获取标注训练用户对应的属性特征数据,根据信用标注数据确定标注训练用户对应的信用特征数据。
其中,训练用户是指能够进行机器学习算法模型训练的用户,训练用户中包括有标注训练用户。信用标注数据是指训练用户对应的信用信息转换得到的标注数据,比如,贷款业务中训练用户的信用信息可以是贷款业务还款未逾期,此时得到的该训练用户的信用标注数据可以为还款未逾期,当训练用户的信用信息可以是贷款业务还款逾期,此时该训练用户的信用标注数据可以为还款逾期。
具体地,服务器在训练时,获取到所有的训练用户,并查找到存在信用标注数据的训练用户,作为标注训练用户。此时,根据标注训练用户获取对应的属性特征数据,然后根据存在的信用标注数据确定标注训练用户对应的信用特征数据。比如,根据还款逾期得到信用特征数据为0,根据还款未逾期得到的信用特征数据为1。
S806,获取标注训练用户对应的初始风险评估结果,并获取训练用户间关系信息,根据训练用户间关系信息确定标注训练用户对应的第一关联用户。
S808,获取第一关联用户对应的第一关联风险评估结果,使用第一关联风险评估结果计算各个统计结果,组合各个统计结果得到标注训练用户对应的关联特征数据。
其中,初始风险评估结果是指预设设置好各个训练用户的风险评估结果,比如,可以设置各个训练用户的风险评估结果为0。训练用户间关系信息是指训练用户之间的关联关系。第一关联用户是指标注训练用户对应的关联用户,该关联用户包括在训练用户中,则第一关联风险评估结果是指第一关联用户对应的初始风险评估结果。
具体地,服务器获取标注训练用户对应的初始风险评估结果,并获取训练用户间关系信息,根据训练用户间关系信息确定标注训练用户对应的第一关联用户。服务器将第一关联用户与训练用户进行匹配,获取匹配一致的训练用户对应的初始风险评估结果作为对应的第一关联风险评估结果,根据第一关联风险评估结果计算各个统计结果,组合各个统计结果得到标注训练用户对应的关联特征数据。
在一个具体的实施例中,如图9所示,根据训练用户关系图中的训练用户1得到训练用户1的关联特征,即训练用户4和训练用户5的风险值的平均,并获取到训练用户1的属性特征数据,包括基础属性数据、行为属性数据和兴趣属性等等,通过属性特征数据和关联特征数据得到训练用户1的模型特征数据。同理得到各个训练用户的模型特征数据。
S810,将标注训练用户对应的属性特征数据、信用特征数据和关联特征数据使用初始机器学习算法模型进行训练,得到当前风险评估模型和标注训练用户对应的当前风险评估结果。
其中,初始机器学习算法模型是指初始化模型参数的机器学习算法模型。
具体地,服务器将将标注训练用户对应的属性特征数据、信用特征数据和关联特征数据进行拼接,输入到初始机器学习算法模型进行训练,得到当前风险评估模型和标注训练用户对应的当前风险评估结果。
S812,当标注训练用户对应的初始风险评估结果和当前风险评估结果符合第一预设条件时,将当前风险评估模型作为训练得到的风险评估模型。
其中,第一预设条件是指预先设置好的训练完成的条件,可以包括训练次数达到最大的迭代次数和训练结果符合预设阈值中的至少一种。
具体地,服务器判断当当标注训练用户对应的初始风险评估结果和当前风险评估结果符合第一预设条件时,将当前风险评估模型作为训练得到的风险评估模型。
在上述实施例中,通过使用标注训练用户对应的关联特征数据作为模型输入的特征,由于关联特征数据使根据第一关联用户的第一关联风险评估结果得到的,使训练得到的风险评估模型兼顾的用户间的关联信息,提高了训练得到的风险评估模型的准确性。
在一个实施例中,如图10所示,在步骤S810之后,即在将标注训练用户对应的属性特征数据、信用特征数据和关联特征数据使用初始机器学习算法模型进行训练,得到当前风险评估模型和标注训练用户对应的当前风险评估结果之后,还包括步骤:
S1002,当标注训练用户对应的初始风险评估结果和当前风险评估结果未符合预设第一条件时,将标注训练用户对应的当前风险评估结果作为标注训练用户对应的初始风险评估结果,并将当前风险评估模型作为初始机器学习算法模型。
S1004,返回获取第一关联用户对应的第一关联风险评估结果,根据第一关联风险评估结果确定标注训练用户对应的关联特征数据的步骤执行,直到初始风险评估结果和当前风险评估结果符合预设第一条件时,将最终的当前风险评估模型作为风险评估模型。
具体地,当服务器判断标注训练用户对应的初始风险评估结果和当前风险评估结果未符合预设第一条件时,即说明训练还未完成,此时,服务器将注训练用户对应的当前风险评估结果作为标注训练用户对应的初始风险评估结果,并将当前风险评估模型作为初始机器学习算法模型。然后返回步骤S808继续进行迭代训练,直到初始风险评估结果和当前风险评估结果符合预设第一条件时,将最后一次迭代训练得到的当前风险评估模型作为最终训练完成的风险评估模型。
在上述实施例中,通过当标注训练用户对应的初始风险评估结果和当前风险评估结果未符合预设第一条件时,不断地进行循环迭代,即不断使用当前风险评估结果作为初始风险评估结果,使模型的输入特征不断进行更新,从而使训练得到的风险评估模型更加的准确。
在一个实施例中,步骤S812,即当标注训练用户对应的初始风险评估结果和当前风险评估结果符合预设第一条件时,将当前风险评估模型作为训练得到的风险评估模型,包括步骤:
将标注训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果。当比较结果小于预设阈值时,将当前风险评估模型作为训练得到的风险评估模型。
具体地,服务器将标注训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果,该比较结果是指当前风险评估结果和初始风险评估结果之间的差值,将该差值与预设阈值进行比较,当差值小于预设阈值时,将当前风险评估模型作为训练得到的风险评估模型。
在一个实施例中,如图11所示,在步骤S810之后,即在将标注训练用户对应的属性特征数据、信用特征数据和关联特征数据使用初始机器学习算法模型进行训练,得到当前风险评估模型和标注训练用户对应的当前风险评估结果之后,还包括步骤:
S1102,获取未标注训练用户,未标注训练用户是指未存在信用标注数据的训练用户。
S1104,获取未标注训练用户对应的属性特征数据,并获取未标注训练用户对应的初始风险评估结果。
具体地,未标注训练用户是指未存在信用标注数据的训练用户,此时,说明该训练用户没有存在对应的信用表现结果数据,比如,在贷款业务中,信用表现结果数据包括还款逾期和还款未逾期,此时说明该训练用户没有存在还款逾期和还款未逾期的数据。服务器在得到当前风险评估模型时,获取到训练用户中的未标注训练用户,并根据未标注训练用户获取到对应的属性特征数据和初始风险评估结果。
S1106,获取训练用户间关系信息,根据训练用户间关系信息确定未标注训练用户对应的第二关联用户。
S1108,获取第二关联用户对应的第二关联风险评估结果,使用第二关联风险评估结果计算各个统计结果,组合各个统计结果得到未标注训练用户对应的关联特征数据。
其中,第二关联用户是指训练用户中未标注训练用户对应的关联用户。第而关联风险评估结果是指第二关联用户对应的初始风险评估结果。
具体地,服务器获取到训练用户间关系信息,在训练用户间关系信息中查找未标注训练用户对应的第二关联用户,当查找到第二关联用户时,将第二关联用户与训练用户进行匹配,将匹配一致的训练用户对应的初始风险评估结果作为对应的第二关联风险评估结果。然后使用得到的第二关联风险评估结果使用各种统计方法计算未标注训练用户对应的关联特征数据,其中,统计方法包括统计平均结果、统计最大结果、统计最小结果、统计中位结果、统计分位数结果和统计占比结果中的至少一种。
S1110,将未标注训练用户对应的属性特征数据和关联特征数据输入到当前风险评估模型中计算,得到未标注训练用户对应的当前风险评估结果。
具体地,服务器此时使用训练得到的当前风险评估模型重新计算未标注训练用户对应的当前风险评估结果,即将未标注训练用户对应的属性特征数据和关联特征数据进行拼接,将拼接结果输入到当前风险评估模型中进行计算,得到模型输出的当前风险评估结果。
S1112,根据标注训练用户对应的初始风险评估结果和未标注训练用户对应的初始风险评估结果确定训练用户对应的初始风险评估结果,根据标注训练用户对应的当前风险评估结果和未标注训练用户对应的当前风险评估结果确定训练用户对应的当前风险评估结果。
S1114,当训练用户对应的当前风险评估结果和初始风险评估结果符合预设第二条件时,将当前风险评估模型作为训练得到的风险评估模型。
具体地,服务器此时得到了每个训练用户对应的初始风险评估结果和每个训练用户对应的当前风险评估结果,当训练用户对应的当前风险评估结果和初始风险评估结果符合预设第二条件时,将当前风险评估模型作为训练得到的风险评估模型。当训练用户对应的当前风险评估结果和初始风险评估结果未符合预设第二条件时,将训练用户对应的当前风险评估结果作为训练用户对应的初始风险评估结果,将当前风险评估模型作为初始机器学习算法模型。此时服务器返回步骤S808继续进行迭代训练,即不断循环执行步骤S808、S810、S1102、S1104、S1106、S1108、S1110和S1112,直到当训练用户对应的当前风险评估结果和初始风险评估结果符合预设第二条件时,将最后一次迭代训练得到的当前风险评估模型作为最终训练完成的风险评估模型。
在上述实施例中,通过计算未标注训练用户对应的当前风险评估结果,从而能确定训练用户的当前风险评估结果,然后根据训练用户的当前风险评估结果和初始风险评估结果确定训练结果,当训练用户的当前风险评估结果和初始风险评估结果符合预设第二条件时,将当前风险评估模型作为训练得到的风险评估模型,提高了得到风险评估模型的准确性。
在一个实施例中,步骤S1114,即当训练用户对应的当前风险评估结果和初始风险评估结果符合预设第二条件时,将当前风险评估模型作为训练得到的风险评估模型,包括步骤:
将训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果。当预设数量的训练用户对应的比较结果小于预设阈值时,将当前风险评估模型作为训练得到的风险评估模型。
具体地,服务器将将训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果,该比较结果是指当前风险评估结果和初始风险评估结果的差值,当该预设数量的训练用户对应的差值都小于预先设置好的阈值时,符合第二预设条件,此时,服务器将当前风险评估模型作为训练得到的风险评估模型。其中预设数量可以是所有训练用户的90%。
在一个实施例中,如图12所示,为风险评估模型训练架构示意图。具体来说:服务器从各种数据源收集训练样本,该训练样本通常来自用户在金融业务中的数据。根据训练样本得到用户属性和标注特征数据。服务器同时采集用户社交关系和用户行为数据,根据用户社交关系和用户行为数据构造各个用户关系图,然后从各个用户关系图中获取到训练样本对应的关联用户,根据关联用户对应的风险评估结果构造用户关联特征数据。然后服务器根据用户关联特征数据、用户属性和标注特征数据使用机器学习算法进行迭代训练风险评估模型,每次迭代都输出用户的当前风险评估值和当前风险评估模型,当训练完成时,得到训练样本对应的风险评估值和最终的风险评估模型。
在一个实施例中,可以使用如下迭代公式进行迭代训练风险评估模型,包括:
Figure BDA0002397494540000171
Figure BDA0002397494540000172
scorei+1(k)=fi(feat(k),co_feati(k)) 公式(3)
其中,label(k)表示训练样本中训练用户的信用特征数据。co_feati(k)表示第i轮迭代时训练用户的关联特征数据,i表示迭代轮数,为正整数。neighbors(k)表示用户关系图中训练用户对应的所有的关联用户的集合。in_degree(k)表示用户关系图中训练用户对应的所有的关联用户的总数量。scorei(k)表示第i轮迭代时输出的训练用户的风险评估值。score0(k)表示初始风险评估值。fi表示第i轮迭代训练输出的风险评估模型。feat(k)表示训练用户的属性特征数据,该在整个迭代训练过程中时不会改变的。每轮迭代,使用公式(1)计算出关联用户对应的风险评估值的平均值作为关联特征数据。再使用公式(2)训练得到风险评估模型,最后使用公式(3)计算出训练用户的风险评估值scorei+1(k)。当scorei+1(k)和scorei(k)两个值差异小于预先设置好的阈值时,迭代结束。
具体来说,如图13所示,训练风险评估模型的步骤包括:
1)初始化风险评估参数:当训练的迭代次数i=0时,将所有训练用户的初始化风险评估值,即将所有训练用户的初始风险评估值设置为0。即score0(k)=0。
2)计算训练用户的关联特征数据:根据公式(1)进行计算,对于初始迭代轮来说co_feati(k)=0。
3)训练新的风险评估模型fi:获取到训练用户的属性特征数据、关联特征数据和信用特征数据,将信用特征数据作为模型的优化目标进行训练,使用公式(2)进行训练,训练时使用的机器学习算法可以是逻辑回归、决策树、xgboost、深度学习网络等其中的任意一种。
4)预设所有训练用户的更新后的风险评估指值:使用公式(3)计算出所有用户的最新的风险评估值scorei+1(k)。
5)条件比较:比较scorei+1(k)和scorei(k)得到差值,当预设数量的训练用户对应的差值都小于预设阈值时,则认为scorei(k)的值已经稳定,模型已经收敛。此时,输出scorei(k)作为训练用户的风险评估值,fi作为风险评估值,否则,迭代轮数i加1回到步骤2重复迭代过程。
在一个具体的实施例中,如图14所示,基于用户关系的风险评估方法,具体包括步骤:
S1402,获取各个用户对应的社交关系信息。
S1404,根据社交关系信息建立用户关系图。
S1406,获取待评估用户标识,根据待评估用户标识从用户属性特征数据库中查找待评估用户对应的属性特征数据。
S1408,获取已建立的用户关系图,在用户关系图中查找待评估用户。
S1410,当查找到待评估用户时,从用户关系图中查找待评估用户对应的关联用户。
S1412,根据关联用户获取对应的关联风险评估结果。
S1414,获取各个统计计算类型维度。
S1416,根据关联用户风险评估结果计算各个统计类型维度对应的维度结果,组合维度结果得到待评估用户关联特征数据。
S1418,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果。
应该理解的是,虽然图2-图5、图7、图8、图10、图11和图14的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图5、图7、图8、图10、图11和图14中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图15所示,提供了一种基于用户关系的风险评估装置1500,包括:属性获取模块1502、关联结果获取模块1504和评估模块1506,其中:
属性获取模块1502,用于获取待评估用户对应的属性特征数据;
关联结果获取模块1504,用于获取用户间关系信息,根据用户间关系信息确定待评估用户对应的关联用户,根据关联用户获取对应的关联风险评估结果;
评估模块1506,用于根据关联风险评估结果得到待评估用户对应的关联特征数据,将待评估用户对应的属性特征数据和关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的;
在一个实施例中,属性获取模块1502还用于获取待评估用户标识,根据待评估用户标识从用户属性特征数据库中查找待评估用户对应的属性特征数据。
在一个实施例中,关联结果获取模块1504,包括:
关系图获取单元,用于获取已建立的用户关系图,在用户关系图中查找待评估用户;
关联用于查找单元,用于当查找到待评估用户时,从用户关系图中查找待评估用户对应的关联用户。
在一个实施例中,基于用户关系的风险评估装置1500,还包括:
关系图建立模块,用于建立用户关系图,用户关系图用于表示用户间行为的关联信息。
在一个实施例中,关系图建立模块还用于获取各个用户对应的社交关系信息;根据社交关系信息建立用户关系图。
在一个实施例中,关系图建立模块还用于获取各个用户对应的行为数据;从行为数据中确定目标行为特征数据,将相同目标行为特征数据的用户关联,得到用户关系图。
在一个实施例中,评估模块1506还用于获取各个目标计算类型维度;根据关联用户风险评估结果计算各个目标类型维度对应的维度结果,组合维度结果得到待评估用户关联特征数据。
在一个实施例中,基于用户关系的风险评估装置1500,还包括:
模型训练模块,用于获取标注训练用户,标注训练用户是指存在信用标注数据的训练用户;获取标注训练用户对应的属性特征数据,根据信用标注数据确定标注训练用户对应的信用特征数据;获取标注训练用户对应的初始风险评估结果,并获取训练用户间关系信息,根据训练用户间关系信息确定标注训练用户对应的第一关联用户;获取第一关联用户对应的第一关联风险评估结果,根据第一关联风险评估结果确定标注训练用户对应的关联特征数据;将标注训练用户对应的属性特征数据、信用特征数据和关联特征数据使用初始机器学习算法模型进行训练,得到当前风险评估模型和标注训练用户对应的当前风险评估结果;当标注训练用户对应的初始风险评估结果和当前风险评估结果符合第一预设条件时,将当前风险评估模型作为训练得到的风险评估模型。
在一个实施例中,模型训练模块还用于当标注训练用户对应的初始风险评估结果和当前风险评估结果未符合预设第一条件时,将标注训练用户对应的当前风险评估结果作为标注训练用户对应的初始风险评估结果,并将当前风险评估模型作为初始机器学习算法模型;返回获取第一关联用户对应的第一关联风险评估结果,根据第一关联风险评估结果确定标注训练用户对应的关联特征数据的步骤执行,直到初始风险评估结果和当前风险评估结果符合预设第一条件时,将最终的当前风险评估模型作为风险评估模型。
在一个实施例中,模型训练模块还用于将标注训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果;当比较结果小于预设阈值时,将当前风险评估模型作为训练得到的风险评估模型。
在一个实施例中,模型训练模块还用于获取未标注训练用户,未标注训练用户是指未存在信用标注数据的训练用户;获取未标注训练用户对应的属性特征数据,并获取未标注训练用户对应的初始风险评估结果;获取训练用户间关系信息,根据训练用户间关系信息确定未标注训练用户对应的第二关联用户;获取第二关联用户对应的第二关联风险评估结果,根据第二关联风险评估结果确定未标注训练用户对应的关联特征数据;将未标注训练用户对应的属性特征数据和关联特征数据输入到当前风险评估模型中计算,得到未标注训练用户对应的当前风险评估结果;根据标注训练用户对应的初始风险评估结果和未标注训练用户对应的初始风险评估结果确定训练用户对应的初始风险评估结果,根据标注训练用户对应的当前风险评估结果和未标注训练用户对应的当前风险评估结果确定训练用户对应的当前风险评估结果;当训练用户对应的当前风险评估结果和初始风险评估结果符合预设第二条件时,将当前风险评估模型作为训练得到的风险评估模型。
在一个实施例中,模型训练模块还用于将训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果;当预设数量的训练用户对应的比较结果小于预设阈值时,将当前风险评估模型作为训练得到的风险评估模型。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图16所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储属性特征数据、关联特征数据和信用特征数据数据等等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于用户关系的风险评估方法
本领域技术人员可以理解,图16中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种基于用户关系的风险评估方法,包括:
获取待评估用户对应的属性特征数据,所述属性特征数据是指根据用户属性转换得到的特征数据;
获取所述待评估用户对应的用户间关系信息,根据所述用户间关系信息确定所述待评估用户对应的关联用户,根据所述关联用户获取对应的关联风险评估结果;
使用所述关联风险评估结果计算各个统计结果,组合所述各个统计结果得到所述待评估用户对应的关联特征数据,将所述待评估用户对应的属性特征数据和所述关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;
所述风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述获取待评估用户对应的属性特征数据,包括:
获取待评估用户标识,根据所述待评估用户标识从用户属性特征数据库中查找所述待评估用户对应的属性特征数据。
3.根据权利要求1所述的方法,其特征在于,所述获取所述待评估用户对应的用户间关系信息,根据所述用户间关系信息确定所述待评估用户对应的关联用户,包括:
获取已建立的用户关系图,在所述用户关系图中查找所述待评估用户;
当查找到所述待评估用户时,从所述用户关系图中查找所述待评估用户对应的关联用户。
4.根据权利要求3所述的方法,其特征在于,在所述获取已建立的用户关系图之前,包括:
建立用户关系图,所述用户关系图用于表示用户间行为的关联信息。
5.根据权利要求4所述的方法,其特征在于,所述建立用户关系图,包括:
获取各个用户对应的社交关系信息;
根据所述社交关系信息建立用户关系图。
6.根据权利要求4所述的方法,其特征在于,所述建立用户关系图,包括:
获取各个用户对应的行为数据;
从所述行为数据中确定目标行为特征数据,将相同目标行为特征数据的用户关联,得到用户关系图。
7.根据权利要求1所述的方法,其特征在于,所述使用所述关联风险评估结果计算各个统计结果,组合各个统计结果得到所述待评估用户对应的关联特征数据,包括:
获取各个统计计算类型维度;
根据所述关联用户风险评估结果计算所述各个统计类型维度对应的维度结果,组合所述维度结果得到待评估用户关联特征数据。
8.根据权利要求1所述的方法,其特征在于,所述风险评估模型的训练步骤包括:
获取标注训练用户,所述标注训练用户是指存在信用标注数据的训练用户;
获取所述标注训练用户对应的属性特征数据,根据所述信用标注数据确定所述标注训练用户对应的信用特征数据;
获取所述标注训练用户对应的初始风险评估结果,并获取训练用户间关系信息,根据所述训练用户间关系信息确定所述标注训练用户对应的第一关联用户;
获取所述第一关联用户对应的第一关联风险评估结果,使用所述第一关联风险评估结果计算各个统计结果,组合所述各个统计结果得到所述标注训练用户对应的关联特征数据;
将所述标注训练用户对应的属性特征数据、信用特征数据和关联特征数据使用初始机器学习算法模型进行训练,得到当前风险评估模型和所述标注训练用户对应的当前风险评估结果;
当所述标注训练用户对应的初始风险评估结果和当前风险评估结果符合第一预设条件时,将所述当前风险评估模型作为训练得到的所述风险评估模型。
9.根据权利要求8所述的方法,其特征在于,在所述将所述标注训练用户对应的属性特征数据、信用特征数据和关联特征数据使用初始机器学习算法模型进行训练,得到当前风险评估模型和所述标注训练用户对应的当前风险评估结果之后,还包括:
当所述标注训练用户对应的初始风险评估结果和所述当前风险评估结果未符合预设第一条件时,将所述标注训练用户对应的当前风险评估结果作为所述标注训练用户对应的初始风险评估结果,并将当前风险评估模型作为初始机器学习算法模型;
返回获取所述第一关联用户对应的第一关联风险评估结果,根据所述第一关联风险评估结果确定所述标注训练用户对应的关联特征数据的步骤执行,直到初始风险评估结果和当前风险评估结果符合预设第一条件时,将最终的当前风险评估模型作为所述风险评估模型。
10.根据权利要求8所述的方法,其特征在于,所述当所述标注训练用户对应的初始风险评估结果和当前风险评估结果符合预设第一条件时,将所述当前风险评估模型作为训练得到的所述风险评估模型,包括:
将所述标注训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果;
当比较结果小于预设阈值时,将所述当前风险评估模型作为训练得到的所述风险评估模型。
11.根据权利要求8所述的方法,其特征在于,在所述将所述标注训练用户对应的属性特征数据、信用特征数据和关联特征数据使用初始机器学习算法模型进行训练,得到当前风险评估模型和所述标注训练用户对应的当前风险评估结果之后,还包括:
获取未标注训练用户,所述未标注训练用户是指未存在信用标注数据的训练用户;
获取所述未标注训练用户对应的属性特征数据,并获取所述未标注训练用户对应的初始风险评估结果;
获取所述训练用户间关系信息,根据所述训练用户间关系信息确定所述未标注训练用户对应的第二关联用户;
获取所述第二关联用户对应的第二关联风险评估结果,使用所述第二关联风险评估结果计算各个统计结果,组合所述各个统计结果得到所述未标注训练用户对应的关联特征数据;
将所述未标注训练用户对应的属性特征数据和关联特征数据输入到所述当前风险评估模型中计算,得到未标注训练用户对应的当前风险评估结果;
根据所述标注训练用户对应的初始风险评估结果和所述未标注训练用户对应的初始风险评估结果确定所述训练用户对应的初始风险评估结果,根据所述标注训练用户对应的当前风险评估结果和所述未标注训练用户对应的当前风险评估结果确定所述训练用户对应的当前风险评估结果;
当所述训练用户对应的当前风险评估结果和初始风险评估结果符合预设第二条件时,将所述当前风险评估模型作为训练得到的所述风险评估模型。
12.根据权利要求11所述的方法,其特征在于,所述当所述训练用户对应的当前风险评估结果和初始风险评估结果符合预设第二条件时,将所述当前风险评估模型作为训练得到的所述风险评估模型,包括:
将所述训练用户对应的当前风险评估结果和初始风险评估结果进行比较,得到比较结果;
当预设数量的训练用户对应的比较结果小于预设阈值时,将所述当前风险评估模型作为训练得到的所述风险评估模型。
13.一种基于用户关系的风险评估装置,其特征在于,所述装置包括:
属性获取模块,用于获取待评估用户对应的属性特征数据,所述属性特征数据是指根据用户属性转换得到的特征数据;
关联结果获取模块,用于获取所述待评估用户对应的用户间关系信息,根据所述用户间关系信息确定所述待评估用户对应的关联用户,根据所述关联用户获取对应的关联风险评估结果;
评估模块,用于使用所述关联风险评估结果计算各个统计结果,组合所述各个统计结果得到所述待评估用户对应的关联特征数据,将所述待评估用户对应的属性特征数据和所述关联特征数据输入到风险评估模型中计算,得到待评估用户对应的风险评估结果;所述风险评估模型是根据训练用户对应的属性特征数据、关联特征数据和信用特征数据进行训练得到的。
14.一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
CN202010136464.0A 2020-03-02 2020-03-02 基于用户关系的风险评估方法、装置和计算机设备 Active CN111311107B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010136464.0A CN111311107B (zh) 2020-03-02 2020-03-02 基于用户关系的风险评估方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010136464.0A CN111311107B (zh) 2020-03-02 2020-03-02 基于用户关系的风险评估方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111311107A true CN111311107A (zh) 2020-06-19
CN111311107B CN111311107B (zh) 2023-05-09

Family

ID=71162004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010136464.0A Active CN111311107B (zh) 2020-03-02 2020-03-02 基于用户关系的风险评估方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111311107B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967983A (zh) * 2020-09-04 2020-11-20 支付宝(杭州)信息技术有限公司 信用评估方法以及装置
CN112348661A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN113032440A (zh) * 2021-03-18 2021-06-25 上海数禾信息科技有限公司 训练风险模型的数据处理方法和装置
CN113379534A (zh) * 2021-06-11 2021-09-10 重庆农村商业银行股份有限公司 一种风险评估方法、装置、设备及存储介质
CN114880637A (zh) * 2022-07-07 2022-08-09 深圳竹云科技股份有限公司 账户风险的验证方法、装置、计算机设备和存储介质
CN115098508A (zh) * 2022-07-04 2022-09-23 成都秦川物联网科技股份有限公司 基于物联网的智慧城市核查列表生成方法、系统及装置
CN115994203A (zh) * 2023-02-20 2023-04-21 广州佰锐网络科技有限公司 一种基于ai的数据标注处理方法、系统及ai中台
US20230260019A1 (en) * 2022-02-15 2023-08-17 Capital One Services, Llc Automated risk prioritization and default detection
CN117726452A (zh) * 2023-12-18 2024-03-19 琥珀投资基金管理(武汉)有限公司 金融智能大数据分析与风险管理系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779498A (zh) * 2017-01-24 2017-05-31 国网福建省电力有限公司 评估含风光储的大用户参与日前市场电力交易风险的方法
CN109271806A (zh) * 2018-08-14 2019-01-25 同济大学 基于用户行为的隐私保护机制研究
WO2019020744A1 (fr) * 2017-07-26 2019-01-31 Securaxis Sa Procédé et systeme d'évaluation d'un risque sécuritaire relatif à une région geographique
CN109345374A (zh) * 2018-09-17 2019-02-15 平安科技(深圳)有限公司 风险控制方法、装置、计算机设备和存储介质
CN109753808A (zh) * 2018-11-19 2019-05-14 中国科学院信息工程研究所 一种隐私泄漏风险评估方法及装置
CN109886807A (zh) * 2019-03-06 2019-06-14 安徽大学 一种p2p平台上基于风险收益管理的个性化推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779498A (zh) * 2017-01-24 2017-05-31 国网福建省电力有限公司 评估含风光储的大用户参与日前市场电力交易风险的方法
WO2019020744A1 (fr) * 2017-07-26 2019-01-31 Securaxis Sa Procédé et systeme d'évaluation d'un risque sécuritaire relatif à une région geographique
CN109271806A (zh) * 2018-08-14 2019-01-25 同济大学 基于用户行为的隐私保护机制研究
CN109345374A (zh) * 2018-09-17 2019-02-15 平安科技(深圳)有限公司 风险控制方法、装置、计算机设备和存储介质
CN109753808A (zh) * 2018-11-19 2019-05-14 中国科学院信息工程研究所 一种隐私泄漏风险评估方法及装置
CN109886807A (zh) * 2019-03-06 2019-06-14 安徽大学 一种p2p平台上基于风险收益管理的个性化推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢坤: "P2P网络借贷综合信用风险评测研究" *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967983A (zh) * 2020-09-04 2020-11-20 支付宝(杭州)信息技术有限公司 信用评估方法以及装置
CN112348661A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN112348661B (zh) * 2020-10-21 2024-04-23 上海淇玥信息技术有限公司 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN113032440A (zh) * 2021-03-18 2021-06-25 上海数禾信息科技有限公司 训练风险模型的数据处理方法和装置
CN113379534A (zh) * 2021-06-11 2021-09-10 重庆农村商业银行股份有限公司 一种风险评估方法、装置、设备及存储介质
US20230260019A1 (en) * 2022-02-15 2023-08-17 Capital One Services, Llc Automated risk prioritization and default detection
CN115098508A (zh) * 2022-07-04 2022-09-23 成都秦川物联网科技股份有限公司 基于物联网的智慧城市核查列表生成方法、系统及装置
CN114880637A (zh) * 2022-07-07 2022-08-09 深圳竹云科技股份有限公司 账户风险的验证方法、装置、计算机设备和存储介质
CN115994203A (zh) * 2023-02-20 2023-04-21 广州佰锐网络科技有限公司 一种基于ai的数据标注处理方法、系统及ai中台
CN117726452A (zh) * 2023-12-18 2024-03-19 琥珀投资基金管理(武汉)有限公司 金融智能大数据分析与风险管理系统

Also Published As

Publication number Publication date
CN111311107B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN111311107B (zh) 基于用户关系的风险评估方法、装置和计算机设备
CN109446302A (zh) 基于机器学习的问答数据处理方法、装置和计算机设备
CN111444344B (zh) 实体分类方法、装置、计算机设备和存储介质
CN112084331A (zh) 文本处理、模型训练方法、装置、计算机设备和存储介质
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN113298197B (zh) 数据聚类方法、装置、设备及可读存储介质
CN111368789B (zh) 图像识别方法、装置、计算机设备和存储介质
CN110750523A (zh) 数据标注方法、系统、计算机设备和存储介质
CN111324773A (zh) 一种背景音乐构建方法、装置、电子设备和存储介质
CN113705596A (zh) 图像识别方法、装置、计算机设备和存储介质
CN114282059A (zh) 视频检索的方法、装置、设备及存储介质
CN112258250A (zh) 基于网络热点的目标用户识别方法、装置和计算机设备
CN116703682B (zh) 一种基于深度学习的政务数据平台
CN111309923B (zh) 对象向量确定、模型训练方法、装置、设备和存储介质
CN113761291A (zh) 标签分类的处理方法和装置
CN113010772B (zh) 一种数据处理方法、相关设备及计算机可读存储介质
CN111935259B (zh) 目标帐号集合的确定方法和装置、存储介质及电子设备
CN111459990B (zh) 对象处理方法、系统及计算机可读存储介质和计算机设备
CN112417260B (zh) 本地化推荐方法、装置及存储介质
CN115905605A (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN113569094A (zh) 视频推荐方法、装置、电子设备及存储介质
CN114936327B (zh) 元素识别模型的获取方法、装置、计算机设备和存储介质
CN113792163B (zh) 多媒体推荐方法、装置、电子设备及存储介质
WO2022262561A1 (zh) 多媒体资源的处理方法、装置、设备及存储介质
US20230315745A1 (en) Information pushing method, apparatus, device, storage medium, and computer program product

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024179

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant