CN112580916A - 数据评估方法、装置、计算机设备和存储介质 - Google Patents

数据评估方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112580916A
CN112580916A CN201910944720.6A CN201910944720A CN112580916A CN 112580916 A CN112580916 A CN 112580916A CN 201910944720 A CN201910944720 A CN 201910944720A CN 112580916 A CN112580916 A CN 112580916A
Authority
CN
China
Prior art keywords
evaluated
node
attribute information
evaluation
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910944720.6A
Other languages
English (en)
Other versions
CN112580916B (zh
Inventor
林建明
张祺扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Wuyu Technology Co ltd
Original Assignee
Shenzhen Wuyu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Wuyu Technology Co ltd filed Critical Shenzhen Wuyu Technology Co ltd
Priority to CN201910944720.6A priority Critical patent/CN112580916B/zh
Publication of CN112580916A publication Critical patent/CN112580916A/zh
Application granted granted Critical
Publication of CN112580916B publication Critical patent/CN112580916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种数据评估方法、装置、计算机设备和存储介质。所述方法包括:获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。通过待评估节点的本身属性信息、一度节点的属性信息和二度节点的属性信息构建待评估特征向量,通过已训练的评估模型对待评估特征向量进行评估,得到更为准确的评估结果。

Description

数据评估方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据评估方法、装置、计算机设备和存储介质。
背景技术
在信息技术掀起的网络革命浪潮下,互联网领域正从“用户以获取信息为主”的Web1.0时代向“用户既是网络信息获取者又是网站信息制造源”的Web2.0时代转变。社交网络服务(SNS)等复杂网络凭借其丰富的用户参与性和互动性成为Web2.0时代的典型应用,并在短时间内风靡全球。越来越多的用户开始在Facebook、微博等社交网络上大量地发表自己的信息和内容,用户特征信息以更直观的方式海量存在于复杂网络中。事实上,复杂网络的发展史就是将线下生活和社交的完整信息流逐渐转移到线上并进行低成本管理和维护的历史,从而使得虚拟社交的内容越来越丰富。这些信息为复杂网络中的每个信息节点赋予了完整的形象。
复杂网络中的各个节点的信息可以用于对节点进行画像,由于网络的复杂性,一般采用一度网络中的信息进行画像,但是仅用一度网络中的信息对节点画像,会导致画像不够准确。
发明内容
为了解决上述技术问题,本申请提供了一种数据评估方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种数据评估方法,包括:
获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;
根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;
将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
第二方面,本申请提供了一种数据评估装置,包括:
数据获取模块,用于获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;
向量构建模块,用于根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;
评估模块,用于将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;
根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;
将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;
根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;
将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
上述数据评估方法、装置、计算机设备和存储介质,所述方法包括:获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。通过待评估节点的本身属性信息、一度节点的属性信息和二度节点的属性信息构建待评估特征向量,通过已训练的评估模型对待评估特征向量进行评估,得到更为准确的评估结果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中数据评估方法的应用环境图;
图2为一个实施例中数据评估方法的流程示意图;
图3为一个实施例中数据评估装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为一个实施例中数据评估方法的应用环境图。参照图1,该数据评估方法应用于数据评估系统。该数据评估系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110或服务器120获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种数据评估方法。本实施例主要以该方法应用于上述图1中的终端110(或服务器120)来举例说明。参照图2,该数据评估方法具体包括如下步骤:
步骤S201,获取待评估节点的属性信息集合。
在本具体实施例中,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息。
具体地,待评估节点是需要被评估的节点,节点用于标识用户、企业、组织机构等等。属性信息包括关系属性信息和节点属性信息,其中关系属性信息是指节点之间的关联关系,如节点A与节点B的网络结构关系,如一度关联和二度关联,其中一度关联对的节点为一度节点,一度节点是指与待评估节点直接连接的节点,二度关联对的节点为二度节点,二度节点是指与待评估节点的一度节点直接连接的节点。其中各个节点之间的连接可以有方向也可以没有方向,如节点A影响节点B则表示节点之间的连接存在方向。节点属性信息是用于描述节点本身的属性数据。当节点为个人时,其中节点属性信息包括但不限于用户的年龄、性别、职业、收入、信用数据和住址等等。当节点为企业或组织机构时,节点属性信息包括组织机构类型、行业、经营范围、财产状况、负债数据和盈利数据等等。
在一个实施例中,获取多个原始节点的节点属性信息,获取各个原始节点对应的关联节点和对应的关联关系,关联关系包括一度关联和二度关联,根据各个原始节点的关联节点和对应的关联关系构建二度复杂网络,将各个原始节点之间的关联关系和节点属性信息作为各个原始节点的属性信息,从二度复杂网络中获取任意一个或多个原始节点作为待评估节点,获取各个待评估节点的属性信息集合。
具体地,原始节点是指构建二度复杂网络的各个节点。关联关系是提供社交网络、支付网络等等用存在交互行为的网络。如微信好友、QQ好友、微博粉丝和银行转账等等。获取各个原始节点的一度关联和二度关联的关联节点和节点属性。根据原始节点的节点属性信息、原始节点的关联节点和对应的节点属性信息构建二度复杂网络。各个原始节点的属性信息包括关联关系和节点属性信息。从二度复杂网络中获取任意一个或多个原始节点作为待评估节点。相对于构建一度复杂网络,二度复杂网络的数据量和难度大大增加,在增加数据量的同时,数据的处理量也大大增加,随着算力的提升能够较好的解决数据量庞大的问题,构建数据量更多的二度复杂网络可以在保证计算能力的同时,还能够提高数据评估的评估准确度。
步骤S202,根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量。
具体地,对待评估节点的属性信息集合包括待评估节点的属性信息、一度节点的属性信和二度节点的属性信息进行特征挖掘,得到对应的中间特征,对中间特征进行筛选,得到待评估向量对应的特征。待评估向量的特征参数为预先配置的特征参数。其中待评估节点可以为企业或个人,当待评估节点为个人时,特征参数包括但不限于待评估节点的年龄、职业、收入、信用数据,待评估节点的一度节点和二度节点的信用数据等等。其中一度节点和二度节点可以为个人或企业等等。
在一个实施例中,步骤S 202包括:根据待评估节点的属性信息集合中的关联关系构建第一向量,根据待评估节点的属性信息集合中的节点属性信息构建第二向量,根据待评估节点的属性信息集合中的节点属性信息和对应的关联关系构建第三向量,根据第一向量、第二向量和第三向量生成待评估特征向量。
具体地,第一向量是通过关联关系构建的特征向量,其中关联关系是指节点之间的关系,关联关系包括直接连接和间接连接,已经连接的方向。根据关联关系构建的第一向量包括单独的连接关系和包含连接方向的连接关系等等。第二向量是中根据待评估节点的节点属性信息构建的特征向量,即从待评估节点中本身包含的信息和一度节点和二度节点的属性信息中统计分析得到的特征,由统计分析得到的特征构成第二向量。第三向量是指根据待评估节点的关联关系和节点属性信息同时构建的特征向量。即在使用一度节点和二度节点的节点属性信息时需要考虑节点的连接关系和连接方向。第一向量、第二向量和第三向量中包含的特征可以根据需求进行排列,将排列后的特征向量得到待评估向量。
步骤S203,将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
具体地,已训练的评估模型是指根据携带标签的节点的属性信息集合训练得到的评估模型,通过已训练的评估模型对待评估向量进行特征提取,得到对应的特征,计算提取到的特征和已训练的评估模型中存储的特征的相似度,根据相似度确定评估向量的评估结果。其中已训练的评估模型可以为风险评估模型或交易意向评估模型等等需要进行评估的模型。已训练的评估模型具体用于做什么样的评估,根据训练数据和训练标签确定。
在一个实施例中,步骤S203包括:通过已训练的评估模型提取待评估向量中的节点特征和网络特征,得到待评估特征,通过已训练的评估模型计算待评估特征和预设特征之间的相似度,将相似度大于预设相似度的预设特征对应的分类结果作为各个待评估节点的评估结果。
具体地,节点特征是指节点本身的特征,网络特征是指节点之间的关联特征,通过已训练的评估模型中模型参数对待评估向量中的各个特征进行加权、映射等等操作,得到待评估特征。预设特征是指已训练的评估模型中保存到特征,根据已训练的评估模型计算预设特征与待评估特征之间的相似度。预设相似度是预先设置的用于判断是否相似的临界值,当预设特征与待评估特征之间的相似度大于预设相似度时,将大于预设相似度的预设特征对应的标签作为待评估节点的评估结果。
在一个实施例中,选择相似度中的最大值对应的预设特征的标签作为待评估节点的评估结果。选择相似度中的最大值表示与预设特征相似的概率最大,得到的评估结果更为准确。
在一个实施例中,获取包含多个待训练评估向量的训练集合,待训练评估向量携带标签,待训练评估向量包含多个维度的特征,输入训练集合中的各个待训练评估向量值初始评估模型,输出各个待训练评估向量的预测结果;根据各个待训练评估向量的预测结果和对应的标签判断初始评估模型是否收敛,当收敛时,得到已训练的评估模型。
具体地,待训练评估向量是指用于训练初始评估模型的训练数据。待训练评估向量包含多个维度的特征,各个维度的特征包括待训练节点的本身的节点属性信息、待训练节点的一度节点的节点属性信息、待训练节点的二度节点的节点属性信息和待训练节点的关联关系构建的特征,由构建的各个特征组成待训练评估向量。待训练评估向量携带标签,即为待训练节点的标签,待训练节点与待训练评估向量一一对应。初始评估模型是指根据需求构建的数学模型,该数学模型可以常见的机器学习模型或深度学习模型等等。输入待训练评估向量至初始评估模型,通过初始评估模型对待训练评估向量进行评估,得到待训练评估向量的预测结果,根据待训练评估向量的预测结果和对应的标签判断初始评估模型是否收敛,当初始评估模型收敛时,得到的已训练的评估模型。其中是否收敛可以通过常见的机器学习的模型收敛或深度学习模型的模型收敛条件确定。
在一个实施例中,当未收敛时,根据各个待训练评估向量的预测结果和对应的标签调整待训练评估向量的各个维度的特征,得到调整后的特征向量;根据调整后的特征向量更新初始评估模型的模型结构,得到中间评估模型;输入调整后的特征向量至中间评估模型,直至中间评估模型满足预设收敛条件,得到已训练的评估模型。
具体地,当初始模型未收敛时,根据各个待训练评估向量的预测结果和对应的标签调整待训练评估向量的各个维度的特征,对输入的待训练评估向量进行特征的删减或增加,其中可以参考初始模型的预测结果与标签之间的差异选择删减还是增加其中的特征,也可以根据定义的模型的损失函数的损失值的变化等选择删减还是增加其中的特征。通过删减或增加特征,相应的调整初始评估模型的模型参数,得到中间评估模型,采用中间评估模型对调整后的待训练评估向量进行评估,得到中间评估结果,根据中间评估结果和标签判断中间模型是否收敛,收敛则得到已训练的评估模型,反之,则根据中间评估结果和标签对调整后的待训练评估向量进行再次调整,直至中间评估模型满足预设收敛条件时,得到已训练的评估模型。
上述数据评估方法,包括:获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。通过待评估节点的本身属性信息、一度节点的属性信息和二度节点的属性信息构建待评估特征向量,通过已训练的评估模型对待评估特征向量进行评估,得到更为准确的评估结果。
在一个具体的实施例中,上述数据评估方法,包括:
构建二度复杂网络。根据存量客户(原始节点)的信息,构建二度复杂网络,其中客户为个人或组织机构等等。构建网络分类两个类型,即同类网络和非同类网路,其中同类网络包括微信好友、通讯录好友等等。非同类网路是指存在对应的链接即可建立关联关系,如微信链接、好友链接或其他社交网络链接等等。其中一度网络是指与目标客户存在直接关系的客户组成网络,二度网络是指包括与一度网络中的客户存在直接关系的客户组成的网络。
将各个客户的客户属性信息(节点属性信息)和节点之间的结构关系(关联关系)添加至各个客户的属性信息中,得到各个客户的属性信息。
获取各个客户属性信息集合,其中属性信息集合中包含对应的客户标签。对客户的属性信息集合进行数据挖掘,其中数据挖掘包括网络信息、重要性参数、关联节点的属性信息等等。其中网络信息包括但不限于度中心性、接近中心性、中介中心性、特征向量中心性、所在网络最大的度数、所在网络节点数、所在网络边数等,重要性参数包括PageRank和LeaderRank等。关联节点的属性信息等等,所连接的1度,2度节点的信息:最大,最小,注册人数。以金融产品为例1度和2度节点的信息还包括:交易人数,逾期人数,平均注册率,交易率,逾期率。1度连接是否有黑中介,有多少黑中介,2度连接是否有黑中介等等。
根据数据挖掘得到的特征作为输入特征向量对训练初始数据评估模型,当初始数据评估模型收敛时,得到已训练的数据评估模型。
当引入新的未携带标签的客户时,将新客户添加到二度复杂网络中,得到新的二度复杂网络。获取二度复杂网络中需要进行评估的客户作为待评估节点,获取待评估节点的属性信息集合。对待评估节点的属性信息集合按照已训练的数据评估模型的输入特征向量的需求进行处理,得到对应的待评估向量,将待评估向量按照已训练的数据评估模型的输入规则输入,通过已训练的数据评估模型对待评估向量进行评估,输出评估结果。
用更深的网络(二度复杂网络)去挖掘。一度信息往往和客户是关系较强的社交圈,而二度信息作为朋友的朋友,也有一定的参考价值。更深层的网络(3度及以上)就偏离比较远,所包含信息的噪声多余有用的信息,增加了数据的处理难度,对于评估的准确度提升却没有太大的帮助,故选择二度复杂网络。
对于金融类型的得产品,可以通过上述数据评估方法评估客户的交易意向和风险等等。
图2为一个实施例中数据评估方法的流程示意图。应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种数据评估装置200,包括:
数据获取模块201,用于获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息。
向量构建模块202,用于根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量。
评估模块203,用于将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
在一个实施例中,数据评估装置200,还包括:
节点属性获取模块,用于获取多个原始节点的节点属性信息。
关联关系获取模块,用于获取各个原始节点对应的关联节点和对应的关联关系,关联关系包括一度关联和二度关联。
网络构建模块,用于根据各个原始节点的关联节点和对应的关联关系构建二度复杂网络。
属性合并模块,用于将各个原始节点之间的关联关系和节点属性信息作为各个原始节点的属性信息。
数据获取模块201具体用于从二度复杂网络中获取任意一个或多个原始节点作为待评估节点,获取各个待评估节点的属性信息集合。
在一个实施例中,向量构建模块202具体用于根据待评估节点的属性信息集合中的关联关系构建第一向量;根据待评估节点的属性信息集合中的节点属性信息构建第二向量;根据待评估节点的属性信息集合中的节点属性信息和对应的关联关系构建第三向量;根据第一向量、第二向量和第三向量生成待评估特征向量。
在一个实施例中,评估模块203具体用于通过已训练的评估模型提取待评估向量中的节点特征和网络特征,得到待评估特征;通过已训练的评估模型计算待评估特征和预设特征之间的相似度;将相似度大于预设相似度的预设特征对应的分类结果作为各个待评估节点的评估结果。
在一个实施例中,上述数据评估装置200,还包括:
模型生成模块,用于生成已训练的评估模型,其中模型生成模块包括:
训练数据获取单元,用于获取包含多个待训练评估向量的训练集合,待训练评估向量携带标签,待训练评估向量包含多个维度的特征。
预测单元,用于输入训练集合中的各个待训练评估向量值初始评估模型,输出各个待训练评估向量的预测结果;
收敛判断单元,用于根据各个待训练评估向量的预测结果和对应的标签判断初始评估模型是否收敛;
模型确定单元,用于当收敛时,得到已训练的评估模型。
在一个实施例中,模型确定单元还用于当未收敛时,根据各个待训练评估向量的预测结果和对应的标签调整待训练评估向量的各个维度的特征,得到调整后的特征向量;根据调整后的特征向量更新初始评估模型的模型结构,得到中间评估模型;输入调整后的特征向量至中间评估模型,直至中间评估模型满足预设收敛条件,得到已训练的评估模型。
图4示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或服务器120)。如图4所示,该计算机设备通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现数据评估方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行数据评估方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的数据评估装置可以实现为一种计算机程序的形式,计算机程序可在如图4所示的计算机设备上运行。计算机设备的存储器中可存储组成该数据评估装置的各个程序模块,比如,图3所示的数据获取模块201、向量构建模块202和评估模块203。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的数据评估方法中的步骤。
例如,图4所示的计算机设备可以通过如图3所示的数据评估装置中的数据获取模块201执行获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息。计算机设备可以通过向量构建模块202执行根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量。计算机设备可以通过评估模块203执行将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多个原始节点的节点属性信息;获取各个原始节点对应的关联节点和对应的关联关系,关联关系包括一度关联和二度关联;根据各个原始节点的关联节点和对应的关联关系构建二度复杂网络;将各个原始节点之间的关联关系和节点属性信息作为各个原始节点的属性信息;获取待评估节点的属性信息集合,包括:从二度复杂网络中获取任意一个或多个原始节点作为待评估节点,获取各个待评估节点的属性信息集合。
在一个实施例中,根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量,包括:根据待评估节点的属性信息集合中的关联关系构建第一向量;根据待评估节点的属性信息集合中的节点属性信息构建第二向量;根据待评估节点的属性信息集合中的节点属性信息和对应的关联关系构建第三向量;根据第一向量、第二向量和第三向量生成待评估特征向量。
在一个实施例中,将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果,包括:通过已训练的评估模型提取待评估向量中的节点特征和网络特征,得到待评估特征;通过已训练的评估模型计算待评估特征和预设特征之间的相似度;将相似度大于预设相似度的预设特征对应的分类结果作为各个待评估节点的评估结果。
在一个实施例中,生成已训练的评估模型,包括:获取包含多个待训练评估向量的训练集合,待训练评估向量携带标签,待训练评估向量包含多个维度的特征;输入训练集合中的各个待训练评估向量值初始评估模型,输出各个待训练评估向量的预测结果;根据各个待训练评估向量的预测结果和对应的标签判断初始评估模型是否收敛;当收敛时,得到已训练的评估模型。
在一个实施例中,当未收敛时,处理器执行计算机程序时还实现以下步骤:根据各个待训练评估向量的预测结果和对应的标签调整待训练评估向量的各个维度的特征,得到调整后的特征向量;根据调整后的特征向量更新初始评估模型的模型结构,得到中间评估模型;输入调整后的特征向量至中间评估模型,直至中间评估模型满足预设收敛条件,得到已训练的评估模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待评估节点的属性信息集合,待评估节点的属性信息集合包括待评估节点的属性信息、待评估节点的一度节点的属性信息和待评估节点的二度节点的属性信息;根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量;将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个原始节点的节点属性信息;获取各个原始节点对应的关联节点和对应的关联关系,关联关系包括一度关联和二度关联;根据各个原始节点的关联节点和对应的关联关系构建二度复杂网络;将各个原始节点之间的关联关系和节点属性信息作为各个原始节点的属性信息;获取待评估节点的属性信息集合,包括:从二度复杂网络中获取任意一个或多个原始节点作为待评估节点,获取各个待评估节点的属性信息集合。
在一个实施例中,根据各个待评估节点的属性信息集合构建各个待评估节点对应的待评估向量,包括:根据待评估节点的属性信息集合中的关联关系构建第一向量;根据待评估节点的属性信息集合中的节点属性信息构建第二向量;根据待评估节点的属性信息集合中的节点属性信息和对应的关联关系构建第三向量;根据第一向量、第二向量和第三向量生成待评估特征向量。
在一个实施例中,将各个待评估节点的待评估向量输入已训练的评估模型,输出各个待评估节点的评估结果,包括:通过已训练的评估模型提取待评估向量中的节点特征和网络特征,得到待评估特征;通过已训练的评估模型计算待评估特征和预设特征之间的相似度;将相似度大于预设相似度的预设特征对应的分类结果作为各个待评估节点的评估结果。
在一个实施例中,生成已训练的评估模型,包括:获取包含多个待训练评估向量的训练集合,待训练评估向量携带标签,待训练评估向量包含多个维度的特征;输入训练集合中的各个待训练评估向量值初始评估模型,输出各个待训练评估向量的预测结果;根据各个待训练评估向量的预测结果和对应的标签判断初始评估模型是否收敛;当收敛时,得到已训练的评估模型。
在一个实施例中,当未收敛时,计算机程序被处理器执行时还实现以下步骤:根据各个待训练评估向量的预测结果和对应的标签调整待训练评估向量的各个维度的特征,得到调整后的特征向量;根据调整后的特征向量更新初始评估模型的模型结构,得到中间评估模型;输入调整后的特征向量至中间评估模型,直至中间评估模型满足预设收敛条件,得到已训练的评估模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种数据评估方法,其特征在于,所述方法包括:
获取待评估节点的属性信息集合,所述待评估节点的属性信息集合包括所述待评估节点的属性信息、所述待评估节点的一度节点的属性信息和所述待评估节点的二度节点的属性信息;
根据各个所述待评估节点的属性信息集合构建各个所述待评估节点对应的待评估向量;
将各个所述待评估节点的待评估向量输入所述已训练的评估模型,输出各个所述待评估节点的评估结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个原始节点的节点属性信息;
获取各个所述原始节点对应的关联节点和对应的关联关系,所述关联关系包括一度关联和二度关联;
根据各个所述原始节点的关联节点和对应的关联关系构建二度复杂网络;
将各个所述原始节点之间的关联关系和所述节点属性信息作为各个所述原始节点的属性信息;
所述获取待评估节点的属性信息集合,包括:从所述二度复杂网络中获取任意一个或多个所述原始节点作为所述待评估节点,获取各个所述待评估节点的属性信息集合。
3.根据权利要求2所述的方法,其特征在于,所述根据各个所述待评估节点的属性信息集合构建各个所述待评估节点对应的待评估向量,包括:
根据所述待评估节点的属性信息集合中的关联关系构建第一向量;
根据所述待评估节点的属性信息集合中的节点属性信息构建第二向量;
根据所述待评估节点的属性信息集合中的节点属性信息和对应的关联关系构建第三向量;
根据所述第一向量、所述第二向量和所述第三向量生成所述待评估特征向量。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述将各个所述待评估节点的待评估向量输入所述已训练的评估模型,输出各个所述待评估节点的评估结果,包括:
通过所述已训练的评估模型提取所述待评估向量中的节点特征和网络特征,得到待评估特征;
通过所述已训练的评估模型计算所述待评估特征和预设特征之间的相似度;
将所述相似度大于预设相似度的预设特征对应的分类结果作为所述各个所述待评估节点的评估结果。
5.根据权利要求1至3中任一项所述的方法,其特征在于,生成所述已训练的评估模型,包括:
获取包含多个待训练评估向量的训练集合,所述待训练评估向量携带标签,所述待训练评估向量包含多个维度的特征;
输入所述训练集合中的各个所述待训练评估向量值初始评估模型,输出各个所述待训练评估向量的预测结果;
根据各个所述待训练评估向量的预测结果和对应的标签判断所述初始评估模型是否收敛;
当收敛时,得到所述已训练的评估模型。
6.根据权利要求5所述的方法,其特征在于,当未收敛时,所述方法还包括:
根据各个所述待训练评估向量的预测结果和对应的标签调整所述待训练评估向量的各个维度的特征,得到调整后的特征向量;
根据所述调整后的特征向量更新所述初始评估模型的模型结构,得到中间评估模型;
输入所述调整后的特征向量值所述中间评估模型,直至所述中间评估模型满足预设收敛条件,得到所述已训练的评估模型。
7.一种数据评估装置,其特征在于,所述装置包括:
数据获取模块,用于获取待评估节点的属性信息集合,所述待评估节点的属性信息集合包括所述待评估节点的属性信息、所述待评估节点的一度节点的属性信息和所述待评估节点的二度节点的属性信息;
向量构建模块,用于根据各个所述待评估节点的属性信息集合构建各个所述待评估节点对应的待评估向量;
评估模块,用于将各个所述待评估节点的待评估向量输入所述已训练的评估模型,输出各个所述待评估节点的评估结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
节点属性获取模块,用于获取多个原始节点的节点属性信息;
关联关系获取模块,用于获取各个所述原始节点对应的关联节点和对应的关联关系,所述关联关系包括一度关联和二度关联;
网络构建模块,用于根据各个所述原始节点的关联节点和对应的关联关系构建二度复杂网络;
属性合并模块,用于将各个所述原始节点之间的关联关系和所述节点属性信息作为各个所述原始节点的属性信息;
所述数据获取模块具体用于从所述二度复杂网络中获取任意一个或多个所述原始节点作为所述待评估节点,获取各个所述待评估节点的属性信息集合。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201910944720.6A 2019-09-30 2019-09-30 数据评估方法、装置、计算机设备和存储介质 Active CN112580916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910944720.6A CN112580916B (zh) 2019-09-30 2019-09-30 数据评估方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910944720.6A CN112580916B (zh) 2019-09-30 2019-09-30 数据评估方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112580916A true CN112580916A (zh) 2021-03-30
CN112580916B CN112580916B (zh) 2024-05-28

Family

ID=75117299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910944720.6A Active CN112580916B (zh) 2019-09-30 2019-09-30 数据评估方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112580916B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1229922A (en) * 1985-01-17 1987-12-01 James K. Baker Speech recognition training method
CA1229925A (en) * 1985-01-17 1987-12-01 James K. Baker Speech recognition method
CA2321303A1 (en) * 1998-02-26 1999-09-02 Openeye Scientific Software, Inc. Method for determining a shape space for a set of molecules using minimal metric distances
CN102571431A (zh) * 2011-12-02 2012-07-11 北京航空航天大学 针对复杂网络的基于群思想改进的Fast-Newman聚类方法
JP2014010634A (ja) * 2012-06-29 2014-01-20 National Institute Of Information & Communication Technology 対訳表現抽出装置、対訳表現抽出方法及び対訳表現抽出のためのコンピュータプログラム
CN104613923A (zh) * 2015-03-01 2015-05-13 河南理工大学 一种变形监测安全评估系统及评估方法
CN107122878A (zh) * 2017-03-03 2017-09-01 广东南方电力通信有限公司 一种基于大数据与人为因素的电力系统风险评估方法
CN107239882A (zh) * 2017-05-10 2017-10-10 平安科技(深圳)有限公司 风险评估方法、装置、计算机设备及存储介质
CN107240029A (zh) * 2017-05-11 2017-10-10 腾讯科技(深圳)有限公司 一种数据处理方法及装置
CN107729424A (zh) * 2017-09-28 2018-02-23 华为技术有限公司 一种数据可视化方法及设备
CN109189936A (zh) * 2018-08-13 2019-01-11 天津科技大学 一种基于网络结构和语义相关性度量的标签语义学习方法
CN109360105A (zh) * 2018-09-18 2019-02-19 平安科技(深圳)有限公司 产品风险预警方法、装置、计算机设备和存储介质
CN109657918A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 关联评估对象的风险预警方法、装置和计算机设备
CN109829667A (zh) * 2017-11-23 2019-05-31 菜鸟智能物流控股有限公司 物流节点包裹量的预测方法和装置
CN110008349A (zh) * 2019-02-01 2019-07-12 阿里巴巴集团控股有限公司 计算机执行的事件风险评估的方法及装置
CN110032665A (zh) * 2019-03-25 2019-07-19 阿里巴巴集团控股有限公司 确定关系网络图中图节点向量的方法及装置
CN110232187A (zh) * 2019-05-20 2019-09-13 平安科技(深圳)有限公司 企业名称相似度识别方法、装置、计算机设备和存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1229922A (en) * 1985-01-17 1987-12-01 James K. Baker Speech recognition training method
CA1229925A (en) * 1985-01-17 1987-12-01 James K. Baker Speech recognition method
CA2321303A1 (en) * 1998-02-26 1999-09-02 Openeye Scientific Software, Inc. Method for determining a shape space for a set of molecules using minimal metric distances
CN102571431A (zh) * 2011-12-02 2012-07-11 北京航空航天大学 针对复杂网络的基于群思想改进的Fast-Newman聚类方法
JP2014010634A (ja) * 2012-06-29 2014-01-20 National Institute Of Information & Communication Technology 対訳表現抽出装置、対訳表現抽出方法及び対訳表現抽出のためのコンピュータプログラム
CN104613923A (zh) * 2015-03-01 2015-05-13 河南理工大学 一种变形监测安全评估系统及评估方法
CN107122878A (zh) * 2017-03-03 2017-09-01 广东南方电力通信有限公司 一种基于大数据与人为因素的电力系统风险评估方法
CN107239882A (zh) * 2017-05-10 2017-10-10 平安科技(深圳)有限公司 风险评估方法、装置、计算机设备及存储介质
CN107240029A (zh) * 2017-05-11 2017-10-10 腾讯科技(深圳)有限公司 一种数据处理方法及装置
CN107729424A (zh) * 2017-09-28 2018-02-23 华为技术有限公司 一种数据可视化方法及设备
CN109829667A (zh) * 2017-11-23 2019-05-31 菜鸟智能物流控股有限公司 物流节点包裹量的预测方法和装置
CN109189936A (zh) * 2018-08-13 2019-01-11 天津科技大学 一种基于网络结构和语义相关性度量的标签语义学习方法
CN109360105A (zh) * 2018-09-18 2019-02-19 平安科技(深圳)有限公司 产品风险预警方法、装置、计算机设备和存储介质
CN109657918A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 关联评估对象的风险预警方法、装置和计算机设备
CN110008349A (zh) * 2019-02-01 2019-07-12 阿里巴巴集团控股有限公司 计算机执行的事件风险评估的方法及装置
CN110032665A (zh) * 2019-03-25 2019-07-19 阿里巴巴集团控股有限公司 确定关系网络图中图节点向量的方法及装置
CN110232187A (zh) * 2019-05-20 2019-09-13 平安科技(深圳)有限公司 企业名称相似度识别方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宾晟;孙更新;: "基于多关系社交网络的协同过滤推荐算法", 计算机科学, no. 12, 31 August 2019 (2019-08-31), pages 56 - 62 *

Also Published As

Publication number Publication date
CN112580916B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
US11593894B2 (en) Interest recommendation method, computer device, and storage medium
CN108491511B (zh) 基于图数据的数据挖掘方法和装置、模型训练方法和装置
WO2021174944A1 (zh) 基于目标对象活跃度的消息推送方法及相关设备
De Cnudde et al. What does your Facebook profile reveal about your creditworthiness? Using alternative data for microfinance
US11275748B2 (en) Influence score of a social media domain
CN111784392A (zh) 基于孤立森林的异常用户群组检测方法、装置、设备
CN111553744A (zh) 联邦产品推荐方法、装置、设备及计算机存储介质
CN110135978B (zh) 用户金融风险评估方法、装置、电子设备和可读介质
CN108182633B (zh) 贷款数据处理方法、装置、计算机设备和存储介质
CN115082209A (zh) 业务数据风险预警方法、装置、计算机设备及存储介质
US20230342797A1 (en) Object processing method based on time and value factors
Saleem et al. Personalized decision-strategy based web service selection using a learning-to-rank algorithm
CN113609345A (zh) 目标对象关联方法和装置、计算设备以及存储介质
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN112163929B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN112580916B (zh) 数据评估方法、装置、计算机设备和存储介质
Sumithra et al. Mining social media content to predict peer trust level in social networks
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
US20140324523A1 (en) Missing String Compensation In Capped Customer Linkage Model
CN114529399A (zh) 用户数据处理方法、装置、计算机设备和存储介质
Wang et al. A novel collective matrix factorization model for recommendation with fine‐grained social trust prediction
Hou et al. BFRecSys: A Blockchain-based Federated Matrix Factorization for Recommendation Systems
CN112559897B (zh) 匹配关系的识别方法、装置及设备
CN113468389B (zh) 一种基于特征序列比对的用户画像建立方法和装置
CN109816187B (zh) 信息处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant