CN110659799A - 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 - Google Patents
基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110659799A CN110659799A CN201910748766.0A CN201910748766A CN110659799A CN 110659799 A CN110659799 A CN 110659799A CN 201910748766 A CN201910748766 A CN 201910748766A CN 110659799 A CN110659799 A CN 110659799A
- Authority
- CN
- China
- Prior art keywords
- nodes
- node
- attribute information
- attribute
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims description 30
- 238000003672 processing method Methods 0.000 title description 8
- 238000012545 processing Methods 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000004590 computer program Methods 0.000 claims description 11
- 230000001502 supplementing effect Effects 0.000 claims description 6
- 238000012954 risk control Methods 0.000 description 13
- 238000013507 mapping Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 9
- 239000000047 product Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012502 risk assessment Methods 0.000 description 7
- 230000009469 supplementation Effects 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 239000013589 supplement Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Animal Behavior & Ethology (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种基于关系网络的属性信息处理方法、装置、计算机设备和存储介质。该方法包括:获取关系网络图谱;关系网络图谱包括多个对象节点及每个对象节点连接的属性节点;识别每个对象节点对应属性信息是否缺失;根据识别结果将关系网络图谱中多个对象节点区分为确定对象节点和待定对象节点;在关系网络图谱中与待定对象节点存在目标关联关系的确定对象节点标记为参考对象节点;计算每个参考对象节点与待定对象节点的综合关联度;获取参考对象节点对应的属性信息值,并根据综合关联度确定属性信息值的参考权重;根据多个属性信息值及分别对应的参考权重,确定目标对象对应的属性信息值。采用本方法能够提高属性信息准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于关系网络的属性信息处理方法、装置、计算机设备和存储介质。
背景技术
对风险属性等属性信息处理在多种行业均为必须的业务环节。例如,在金融行业,需要对虚拟资源的发行主体、贷款申请人是否存在违约风险进行预测,以更好的进行风险控制,减少风险事件的发生可能性及造成的损失。风险预测是指运用多种信息渠道和分析方法,根据企业的风险战略和风险偏好确定识别指标,并以这些识别指标为出发点,及时识别潜在风险的过程。传统的风险预测方式仅是简单的指标比对,当指标不符合预设条件时即笼统的判定存在风险,使得风险预测准确性降低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高属性信息准确性的基于关系网络的属性信息处理方法、装置、计算机设备和存储介质。
一种基于关系网络的属性信息处理方法,所述方法包括:获取关系网络图谱;所述关系网络图谱包括多个对象节点及每个对象节点连接的属性节点;识别每个对象节点对应属性信息是否缺失;根据识别结果将所述关系网络图谱中多个对象节点区分为确定对象节点和待定对象节点;在所述关系网络图谱中划取每个所述待定对象节点的全连通子网络图;将所述全连通子网络图中与待定对象节点存在目标关联关系的确定对象节点标记为参考对象节点;计算每个参考对象节点与所述待定对象节点的综合关联度;获取所述参考对象节点对应的属性信息值,并根据所述综合关联度确定所述属性信息值的参考权重;根据多个属性信息值及分别对应的参考权重,确定所述目标对象对应的属性信息值,以控制终端根据所述属性信息值进行数据处理。
在一个实施例中,所述根据多个属性信息值及分别对应的参考权重,计算得到所述目标对象对应的属性信息值包括:从数据处理系统获取目标对象的身份属性信息;查询与所述数据处理系统对应的信息预测模型和关联系数权重;将所述身份属性信息输入所述信息预测模型,得到目标关联系数;根据所述目标关联系数及所述关联系数权重,计算得到第一属性参考值;根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值;根据所述第一属性参考值及所述第二属性参考值,计算得到所述目标对象的属性信息值。
在一个实施例中,所述获取关系网络图谱之前,所述方法还包括:获取多个目标对象的身份属性信息和社交网络信息;根据所述身份属性信息生成每个目标对象对应的对象节点及属性节点,采用有向边将所述属性节点连接至相应对象节点;识别不同所述对象节点是否连接有相同的属性节点;若是,对所述相同的属性节点进行合并,并将所述相同的属性节点标记为对应多个对象节点的关联节点;根据所述社交网络信息计算所述对象节点基于不同关联节点的单边关联度,将所述单边关联度添加至相应关联节点相连的有向边,得到关系网络图谱。
在一个实施例中,所述计算每个参考对象节点与所述待定对象节点的综合关联度,包括:获取所述待定对象节点对应的社交网络信息;根据所述社交网络信息计算所述待定对象节点基于不同关联节点与不同参考对象节点之间的单边关联度;对每个参考对象节点与所述待定对象节点之间多个关联节点的单边关联度进行叠加,得到所述参考对象节点与所述待定对象节点的综合关联度。
在一个实施例中,所述方法还包括:比较所述目标对象对应的属性信息值是否超过阈值;若是,确定所述目标对象所属的行业类型;获取风险数据;所述风险数据包括所述目标对象的风险数据、所述行业类型的风险数据以及所述目标对象对应产品资源的风险数据;在所述风险数据中提取风险标签;计算提取得到的风险标签与预存储的多个黑名单对象的风险标签的相似度,将所述相似度超过预设值的黑名单对象标记为相似对象;获取所述相似对象在多个时间节点的风险指标,根据所述风险指标确定所述目标对象的风险点,将所述风险点补入所述身份属性信息。
一种基于关系网络的属性信息处理装置,所述装置包括:属性信息处理模块,用于获取关系网络图谱;所述关系网络图谱包括多个对象节点及每个对象节点连接的属性节点;识别每个对象节点对应属性信息是否缺失;根据识别结果将所述关系网络图谱中多个对象节点区分为确定对象节点和待定对象节点;在所述关系网络图谱中划取每个所述待定对象节点的全连通子网络图;将所述全连通子网络图中与待定对象节点存在目标关联关系的确定对象节点标记为参考对象节点;计算每个参考对象节点与所述待定对象节点的综合关联度;获取所述参考对象节点对应的属性信息值,并根据所述综合关联度确定所述属性信息值的参考权重;属性信息值计算模块,用于根据多个属性信息值及分别对应的参考权重,确定所述目标对象对应的属性信息值,以控制终端根据所述属性信息值进行数据处理。
在一个实施例中,所述装置还包括网络图谱构建模块,用于获取多个目标对象的身份属性信息和社交网络信息;根据所述身份属性信息生成每个目标对象对应的对象节点及属性节点,采用有向边将所述属性节点连接至相应对象节点;识别不同所述对象节点是否连接有相同的属性节点;若是,对所述相同的属性节点进行合并,并将所述相同的属性节点标记为对应多个对象节点的关联节点;根据所述社交网络信息计算所述对象节点基于不同关联节点的单边关联度,将所述单边关联度添加至相应关联节点相连的有向边,得到关系网络图谱。
在一个实施例中,所述属性信息处理模块还用于获取所述待定对象节点对应的社交网络信息;根据所述社交网络信息计算所述待定对象节点基于不同关联节点与不同参考对象节点之间的单边关联度;对每个参考对象节点与所述待定对象节点之间多个关联节点的单边关联度进行叠加,得到所述参考对象节点与所述待定对象节点的综合关联度。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的基于关系网络的属性信息处理方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的基于关系网络的属性信息处理方法的步骤。
上述基于关系网络的属性信息处理方法、装置、计算机设备和存储介质,将覆盖大规模人群的关联关系集中展示在一张关系网路图谱,便于用户从全局把握客户之间的关联关系。根据缺失属性的不同,从关系网路图谱中划取对应待定对象节点的全连通子网络图,便于用户更有针对性的了解其中某个客户;基于目标对象的全连通子网路图,可以结合考虑与目标对象节点具有较强关联度的参考对象节点的身份属性信息,对待定对象节点的数值属性进行补充,综合多个维度的因素对目标对象的属性信息进行预测,不仅可以提高信息补全效率,也可以提高补全信息的准确性。
附图说明
图1为一个实施例中基于关系网络的属性信息处理方法的应用场景图;
图2为一个实施例中基于关系网络的属性信息处理方法的流程示意图;
图3为一个实施例中属性信息处理过程采用的关系网络图谱的示意图;
图4为一个实施例中基于属性信息值的风险跟踪的步骤的流程示意图;
图5为一个实施例中基于关系网络的属性信息处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于关系网络的属性信息处理方法,可以应用于如图1所示的应用环境中。其中,终端102与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。服务器104根据用户基于终端102触发的属性信息处理请求,根据属性信息处理请求携带的对象标识从数据处理系统获取相应目标对象的身份属性信息。服务器104识别身份属性信息中属性信息是否缺失。若属性信息缺失,则服务器104查询与数据处理系统对应的信息预测模型和关联系数权重,将身份属性信息输入信息预测模型,得到目标关联系数。服务器104根据目标关联系数及关联系数权重,计算得到第一属性参考值。服务器104获取目标对象的全连通子网路图。全连通子网络图包括目标对象对应的待定对象节点及与待定对象节点存在关联关系的至少一个参考对象节点。服务器104获取参考对象节点对应的属性信息值。服务器104计算每个参考对象节点与待定对象节点的综合关联度,并根据综合关联度确定属性信息值的参考权重。服务器104根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值。服务器104根据第一属性参考值与第二属性参考值,计算得到目标对象对应的属性信息值。上述属性信息处理的过程,除了基于目标对象自身的身份属性信息,还结合考虑与目标对象节点具有较强关联度的参考对象节点的身份属性信息,综合多个维度的因素对目标对象的属性信息进行预测,不仅可以提高信息补全效率,也可以提高补全信息的准确性。
在一个实施例中,如图2所示,提供了一种基于关系网络的属性信息处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取关系网络图谱;关系网络图谱包括多个对象节点及每个对象节点连接的属性节点。
目标对象可以是流失客户,也可以是已有客户,还可以是潜在客户。其中,潜在客户可以是根据流失客户或已有客户的客户数据识别得到的,例如,可以将已有客户在不同数据处理系统预留的担保人或紧急联系人作为潜在客户。身份属性信息包括对象标识。对象标识可以是身份证号、手机号或邮箱等。容易理解,若目标对象为企业,对象标识也可以是机构代码等。身份属性信息还包括姓名、性别、年龄、学历、联系方式、任职单位、保单、银行卡账号、终端设备信息、社交网络账号、兴趣、财富等级或风险水平等。
容易理解,每个目标对象的身份属性信息可以从不同的数据处理系统获取,只是有些目标对象的身份属性信息可能不完整,存在缺失属性。在另一个实施例中,潜在客户也可以是服务器对用户在目标网站浏览相关产品留下的产品查阅记录进行监测得到的,对此不作限制。
步骤204,识别每个对象节点对应属性信息是否缺失。
服务器识别身份属性信息中风险属性是否缺失。身份属性信息包括多种目标属性,如基本属性、兴趣属性、资产属性、风险属性等。服务器识别身份属性信息中目标属性是否缺失,并基于预置的关系网络图谱对缺失的目标属性进行补充。
步骤206,根据识别结果将关系网络图谱中多个对象节点区分为确定对象节点和待定对象节点。
步骤208,在关系网络图谱中划取每个待定对象节点的全连通子网络图。
全连通子网路图包括待定对象节点、多个其他对象节点以及节点之间的有向边。全连通子网路图可以是从关系网络图谱中划取得到的。关系网络图谱可以服务器根据多个目标对象的身份属性信息和社交网络信息预先构建的。关系网络图谱包括多个对象节点,每个对象节点对应的属性节点以及用于连接对象节点和属性节点的有向边。服务器识别不同对象节点是否连接有相同的属性节点。若是,服务器对相同的属性节点进行合并,并将合并得到的属性节点标记为对应多个对象节点的关联节点。
步骤210,将全连通子网络图中与待定对象节点存在目标关联关系的确定对象节点标记为参考对象节点。
服务器根据社交网络信息,在关系网络图谱中划取每个待定对象节点的全连通子网络图。具体的,服务器获取待定对象节点的社交网络信息,按照上述方式基于社交网络信息计算待定对象节点与一度关联的每个对象节点之间的综合关联度。一度关联是指与两个对象节点通过一条有向边直接相连。服务器比较综合关联度是否达到阈值,并保留综合关联度达到阈值的对象节点(记作一度关联对象节点),删除综合关联度小于阈值的对象节点。
服务器识别保留的一度关联对象节点中是否至少一个为确定对象节点。换言之,服务器判断保留的一度关联对象节点中是否至少一个为包含完整身份属性信息的对象节点。若保留的一度关联对象节点中存在确定对象节点,服务器在关系网路图谱中划取待定对象节点、保留的一度关联对象节点以及连接待定对象节点与一度关联对象节点的有向边,得到待定对象节点对应的全连通子网络图。若保留的一度关联对象节点中没有确定对象节点,则服务器按照上述方式进一步筛选与待定对象节点二度关联的一个或多个对象节点(记作二度关联对象节点)。二度关联是指与两个对象节点通过两条有向边相连。容易理解,二度关联对象节点是与一度关联对象节点直接相连的对象节点。
服务器进一步识别二度关联对象节点中是否至少一个为确定对象节点。若否,则按照上述方式进一步筛选待定对象节点的三度关联对象节点,如此重复,直至筛选得到至少一个确定对象节点。服务器按照上述方式在关系网路图谱中划取待定对象节点、筛选得到的一度关联对象节点、二度关联对象节点等,得到待定对象节点对应的全连通子网络图。
服务器根据全连通子网络图中参考对象节点的身份属性信息对相应待定对象节点的缺失属性进行补充。服务器可以对多种属性类型的缺失属性进行补充。属性类型包括基本属性、兴趣属性、资产属性、风险属性等。根据缺失属性的不同,划取的同一待定对象节点的全连通子网络图可以不同。
在另一个实施例中,由于全连通子网络图用于对待定对象节点的缺失属性进行补充,为了抱枕缺失属性补充的准确性,服务器预置了关联对象节点的筛选阈值,若达到筛选阈值的层级的关联对象节点中仍不存在确定对象节点,则停止筛选关联对象节点,并生成对应的缺失属性补充失败的提示信息。例如,关联阈值为2,若二度关联对象节点中仍不存在确定对象节点,则返回“缺失属性补充失败”的提示信息。
服务器预设了多种属性类型及对应的目标关联关系,根据缺失属性的属性类型,在对应的全连通子网络图中筛选与待定对象节点存在目标关联关系的关联对象节点作为参考对象节点。例如,当属性类型为基本属性时,可以将与待定对象存在同学关系、同事关系、朋友关系的关联对象确定为参考对象;当属性类型为兴趣属性时,可以将与待定对象存在朋友关系、附近的人关系的关联对象确定为参考对象;当属性类型为资产属性时,将与目标对象存在亲属关系、朋友关系的关联对象确定为参考对象;当属性类型为风险属性时,可以将与待定对象节点具有共同相连的其他对象节点的关联对象节点确定为参考对象节点。容易理解,也可以将全连通子网络图中的全部关联对象确定为参考对象,但根据缺失属性的不同针对不同参考对象预置不同的参考权重,对此不做限定。
图3示例性给出一种关系网络图谱。如图3所示,V1~V8分别为8个对象节点,Mij及Mijij为每个对象节点对应的属性节点“任职单位”;Nij及Nijij为每个对象节点对应的属性节点“转账ID”;Oij及Oijij为每个对象节点对应的属性节点“保单”;P ij及P ijij为每个对象节点对应的属性节点“无线网络标识”;Qij及Qijij为每个对象节点对应的属性节点“银行卡号”。其中,1≤i≤8;1≤j。有向边可以从对象节点指向属性节点。Mijij、Nijij、Oijij、P ijij及Qijij作为多个对象节点的关联节点。关联节点的节点标识可以根据被合并的多个属性节点的节点标识生成的。例如,由属性节点Q51与属性节点Q83合并得到的关联节点的节点标识可以是Q5183。
服务器还根据身份属性信息生成了每个对象节点对应的节点标签,如基本信息标签、消费兴趣标签、财富级别标签或风险评级标签等。服务器识别每个对象节点是否缺少某种节点标签,以判断对应对象节点的身份属性信息是否存在缺失属性。服务器将不存在缺失属性的对象节点标记为确定对象节点,将存在缺失属性的对象节点表标记为待定对象节点。
服务器获取待定对象的身份属性信息,并识别其中缺失的目标属性。服务器确定待定对象节点对应缺失属性的属性类型,识别属性类型对应的目标关联关系,并将全连通子网络图中一个或多个对象节点标记为参考对象节点。
步骤212,计算每个参考对象节点与所述待定对象节点的综合关联度。
服务器计算每个参考对象节点与待定对象节点的综合关联度。连接有一个或多个关联节点的两个对象节点相关联。服务器根据社交网络信息测算相关联的两个对象节点基于每个关联节点的单边关联度。对两个对象节点之间的多个关联节点的单边关联度进行叠加,可以得到两个对象节点的综合关联度。
步骤214,获取参考对象节点对应的属性信息值。
服务器获取每个参考对象节点对应的身份属性信息,在获取到的身份属性信息提取与缺失属性对应的属性信息的属性值(记作属性信息值)。容易理解,有些参考对象节点对应的身份属性信息中的属性信息的属性值可能也是缺失的。但全连通子网络图包括至少一个确定对象节点,从而至少可以提取得到一个属性信息值。
步骤216,根据综合关联度确定属性信息值的参考权重。
步骤218,根据多个属性信息值及分别对应的参考权重,确定目标对象对应的属性信息值,以控制终端根据所述属性信息值进行数据处理。
服务器对属性信息值进行预设逻辑运算,得到目标对象对应的属性信息值。预设逻辑运算可以是基于参考权重的叠加运算。参考权重可以是根据相应参考对象节点与待定对象节点的综合关联度确定的。在另一个实施例中,预设逻辑运算还可以是对多个属性信息值取中位数或者取平均等。
根据该属性信息值可以对相应目标对象进行风险控制。例如,当属性信息值高于阈值时,不予提供相关业务服务,或者进一步基于高风险条件生成附加业务的责任条款等,以此进行风险规避,保障风险控制的效果。
本实施例中,将覆盖大规模人群的关联关系集中展示在一张关系网路图谱,便于用户从全局把握客户之间的关联关系。根据缺失属性的不同,从关系网路图谱中划取对应待定对象节点的全连通子网络图,便于用户更有针对性的了解其中某个客户;基于目标对象的全连通子网路图,可以结合考虑与目标对象节点具有较强关联度的参考对象节点的身份属性信息,对待定对象节点的数值属性进行补充,综合多个维度的因素对目标对象的属性信息进行预测,不仅可以提高信息补全效率,也可以提高补全信息的准确性。
在一个实施例中,从数据处理系统获取目标对象的身份属性信息;查询与数据处理系统对应的信息预测模型和关联系数权重;将身份属性信息输入信息预测模型,得到目标关联系数;根据目标关联系数及关联系数权重,计算得到第一属性参考值;根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值;根据第一属性参考值与第二属性参考值,计算得到目标对象对应的属性信息值。
对于不同业务类型,风险评估需要侧重考虑的风险因素往往不同,服务器针对实现不同类型业务的数据处理系统,分别预置了对应的信息预测模型。信息预测模型可以是根据数据处理系统中被确定为黑名单对象的身份属性信息构建得到的,用于对该数据处理系统中其他目标对象进行风险评估。
同一目标对象的身份属性信息可能是从多个数据处理系统中提取得到的。为了对目标对象进行综合风险分析,服务器还针对每种数据处理系统预置了对应的关联系数权重。关联系数权重用于在对各数据处理系统对应的信息预测模型输出的风险评估结果进行综合处理时,为各数据处理系统不同的重要程度划分出不同的权重占比,以此得到加权后综合评估结果。换句话说,根据关系网路图谱的不同用途,可以基于关联系数权重表征各数据处理系统对风险评估的不同重要程度。例如,当关系网路图谱用于预测目标对象购买保险产品时的属性信息值,则在对目标进行综合风险控制时,对于各种保险数据处理系统的关联系数权重占比更高,而对于其他与保险业务相关性较低的数据处理系统,可以设置更低的关联系数权重,以突出各保险数据处理系统在综合风险控制时的重要性,最终得到符合保险数据处理系统综合风险控制需求的综合评估结果。关联系数权重可以根据综合风险控制的实际需求进行自定义,以满足不同的风险控制需求。
信息预测模型可以为但不限于机器学习模型,如NN模型(Neural Networks,神经网络模型)、线性分类器、SVM模型(Support Vector Machine,支持向量机模型)、朴素贝叶斯模型和K-近邻算法模型等常用学习模型。通过预设的信息预测模型进行风险控制,避免了人为因素的影响,加强了风险控制中数据处理系统的针对性,提高了风险控制的准确度。
服务器根据该目标关联系数及查询的关联系数权重,计算得到数据处理系统进行综合风险控制时,对应目标对象的第一属性参考值。第一属性参考值反映了目标对象在各个数据处理系统中的综合风险评估结果,通过按照综合风险控制需求调整关联系数权重,可以得到满足不同风险控制需求的第一属性参考值。
服务器对第一属性参考值与第二属性参考值进行基于预设权重的叠加运算,得到待定对象对应的属性信息值。预设权重可以是固定值。服务器针对缺失属性,预先训练了对应的缺失属性补全模型。服务器根据模型准确率可以给出计算得到的第二属性参考值的置信度,从而预设权重也可以是根据第二属性参考值的置信度动态确定的。
本实施例中,根据在数据处理系统获取的目标对象的身份属性信息,以及预置的数据处理系统对应的信息预测模型和关联系数权重,可以计算得到第一属性参考值;基于目标对象的全连通子网路图,可以确定目标对象的属性信息的第二属性参考值;根据第一属性参考值与第二属性参考值,可以得到目标对象对应的属性信息值。除了基于目标对象自身的身份属性信息,还结合考虑与目标对象节点具有较强关联度的参考对象节点的身份属性信息,综合多个维度的因素对目标对象的属性信息进行预测,不仅可以提高信息补全效率,也可以提高补全信息的准确性。
在一个实施例中,查询与数据处理系统对应的信息预测模型和关联系数权重之前,还包括:获取样本对象的身份属性信息及对应标注的目标关联系数;根据样本对象的身份属性信息构建输入层,根据标注的目标关联系数构建输出层,获取预设的映射参数,根据映射参数构建中间层;根据输入层、中间层及输出层构建得到待训练信息预测模型;从数据处理系统获取黑名单样本集,将黑名单样本集划分为互斥的训练样本集和测试样本集;将训练样本集输入待训练信息预测模型,根据待训练信息预测模型的输出结果调整映射参数,得到训练后信息预测模型;通过测试样本集对训练后信息预测模型进行评估测试,当测试结果达到阈值时,将训练后信息预测模型作为信息预测模型。
服务器可以将多个样本对象的身份属性信息进行编码、排序等预处理,得到输入向量,并根据输入向量构建信息预测模型的输入层。服务器按照上述方式对标注的目标关联系数进行预处理,得到输出向量,并根据输出向量构建信息预测模型的输出层。服务器设置输入向量与输出向量之间的映射参数,并根据映射参数构建信息预测模型的中间层。其中,映射参数可以是权重比例、函数式等。例如,当信息预测模型为SVM(Support VectorMachine,支持向量机)模型时,其中间层的映射参数可以是RBF((Radial Basis Function,径向基函数)核函数、线性核函数、多项式核函数、Sigmoid核函数等。若采用RBF核函数,可以通过调整RBF核函数中惩罚因子C和核参数γ,可以调整中间层,最终得到适合的信息预测模型。
服务器基于输入层、中间层和输出层构建得到待训练信息预测模型。服务器通过已知的黑名单客户数据对待训练信息预测模型进行训练。具体的,服务器从数据处理系统获取黑名单客户数据,黑名单客户数据中包括黑名单客户对应的客户特征信息,通过该客户特征信息可以对待训练信息预测模型进行有效训练。在得到黑名单客户数据后,基于留出法将其划分为互斥的训练样本集和测试样本集,并通过训练样本集对待训练信息预测模型,再由测试样本集对训练后的信息预测模型进行评估测试。
当测试结果小于预设值时,将训练样本集输入待训练信息预测模型中,根据待训练信息预测模型的输出与训练样本集中的验证数据,调整映射参数,并根据调整后的映射参数得到调整后的中间层,最后根据输入层、调整后的中间层和输出层构建得到训练后信息预测模型。在具体应用时,如对于SVM模型,可以在训练过程中不断调整惩罚因子和核参数的组合(C,γ),最终得到满足需求的训练完成的SVM模型。当测试结果满足预设值时,例如测试结果的成功率超过预设值时,停止训练,将该训练后信息预测模型作为信息预测模型,从而完成了对待训练信息预测模型的训练。
在一个实施例中,获取关系网络图谱之前,方法还包括:获取多个目标对象的身份属性信息和社交网络信息;根据身份属性信息生成每个目标对象对应的对象节点及属性节点,采用有向边将属性节点连接至相应对象节点;识别不同对象节点是否连接有相同的属性节点;若是,对相同的属性节点进行合并,并将相同的属性节点标记为对应多个对象节点的关联节点;根据社交网络信息计算对象节点基于不同关联节点的单边关联度,将单边关联度添加至相应关联节点相连的有向边,得到关系网络图谱。
服务器获取多个目标对象的身份属性信息和社交网络信息。目标对象可以是流失客户,也可以是已有客户,还可以是潜在客户。其中,潜在客户可以是根据流失客户或已有客户的客户数据识别得到的,例如,可以将已有客户预留的担保人或紧急联系人作为潜在客户。潜在客户也可以是服务器存对用户在目标网站浏览相关产品留下的产品查阅记录进行监测得到的,对此不作限制。
身份属性信息包括对象标识。对象标识可以是身份证号、手机号或邮箱等。容易理解,若目标对象为企业,对象标识也可以是机构代码等。身份属性信息还包括姓名、性别、年龄、学历、联系方式、任职单位、保单、银行卡账号、终端设备信息、社交网络账号、兴趣、财富等级或风险水平等。社交网络信息包括wifi连接信息、位置共享信息、即时通讯信息、电子转账信息或远程通话信息等。
服务器根据对象标识生成目标对象对应的对象节点,并根据其他身份属性信息生成目标对象对应的一个或多个属性节点。例如,可以以任职单位为标识生成一个属性节点,也可以是转账ID为标识生成一个属性节点。每个属性节点关联有对应的节点描述。本实施例中有向边从对象节点指向属性节点。一个对象节点可以连接有多个属性节点。
服务器识别不同对象节点是否连接有相同的属性节点。若是,服务器对相同的属性节点进行合并,并将合并得到的属性节点标记为对应多个对象节点的关联节点。同一个对象节点可以连接有多种类型的属性节点,如任职单位型、银行卡账号型、常用网络型等。通过对相同的属性节点进行合并,可以将多个对象节点关联起来。换句话说,根据身份属性信息可以识别多个目标对象之间的关联关系。例如,具有相同的“任职单位”属性节点,表示两个目标对象可能存在同事关系;具有相同的“学历”属性节点,表示两个目标对象可能存在同学关系;具有相同的“银行卡账号”或“常用网络型”属性节点,表示两个目标对象可能亲属关系等,如此对每一类关联关系进行分析。
连接有一个或多个关联节点的两个对象节点相关联。服务器根据社交网络信息测算相关联的两个对象节点基于每个关联节点的单边关联度,将单边关联度添加至相应关联节点相连的有向边,得到关系网络图谱。对两个对象节点之间的多个关联节点的单边关联度进行叠加,可以得到两个对象节点的综合关联度。
本实施例中,由于通过识别是否存在相同的属性节点,可以自动提取其中隐含的关联关系,相比传统的人工分析的方式可以大大提高关联关系获取效率。不仅基于身份属性信息识别多个目标对象之间的关联关系,还基于社交网络信息挖掘相关联的目标对象的关联强度,可以拓展信息挖掘维度并提高信息挖掘深度,进而可以提高关系网络挖掘准确性。此外,基于属性节点可以随时新增对象节点,便于关联网络的延伸扩展,进而可以逐渐增大关系网络图谱覆盖人群规模。
在一个实施例中,计算每个参考对象节点与待定对象节点的综合关联度,包括:获取待定对象节点对应的社交网络信息;根据社交网络信息计算待定对象节点基于不同关联节点与不同参考对象节点之间的单边关联度;对每个参考对象节点与待定对象节点之间多个关联节点的单边关联度进行叠加,得到参考对象节点与待定对象节点的综合关联度。
关系类型可以是亲属关系、同学关系、同事关系、朋友关系、转账关系、位置临近关系等。服务器根据身份属性信息及社交网络信息,可以识别相关联的两个对象节点之间的关系类型。例如,根据与目标对象甲与目标对象乙、丙、丁连接同一家庭wifi、企业wifi或公共wifi,可以识别其可能存在亲友、同事或附近的人等关联关系。
针对不同关系类型可以预置不同的基础关联系数。两个目标对象可能存在多种关联关系,如目标对象甲与乙可以即是同学,也是同事,还为朋友。对于这种情况,服务器也可以针对不同关系类型组合预置不同的基础关联系数。
在另一个实施例中,基于关系网路图谱的不同用途,可以预设不同的关系类型与基础关联系数的映射关系,或者不同的关系类型组合与基础关联系数的映射关系。例如,当关系网路图谱用于挖掘客户兴趣属性时,直系亲属关系设置为1,同事关系设置为0.5等;当关系网路图谱用于审核客户风险属性时,朋友关系设置为1,亲属关系设置为0.4等。根据关系网络图谱的用途,预设多种用途对应的基础关联系数,实现多种单边关联度计算方式,可以充分考虑每种关系类型对评估关联度的价值意义不同,从而提高基于关系网络图谱进行不同缺失属性补充的准确性。
服务器基于关系网络图谱确定相关联的两个对象节点之间的最短社交距离。最短社交距离是指从一个对象节点到另一个对象节点至少要经过的关联节点的数量。例如,在上述举例的图3中,对象节点V3与V5之间的最短社交距离为1,而对象节点V4与V8之间的最短社交距离为2。
服务器根据社交网络信息统计相关联的两个对象节点在统计时段发生的关联事件的事件类型和发生频次。关联事件可以是连接同一局域网、基于即时通讯平台发送社交信息或者银行卡转账等交互操作。
服务器预置了多种事件类型,每种事件类型对应的多种发生频次区间以及每种发生频次区间对应的第一调整系数。服务器还预置了多种最短社交距离对应第二调整系数。根据第一调整系数及第二调整系数对基础关联系数进行增大或缩小处理,得到目标关联系数。服务器将目标关联系数标记为相应对象节点基于对应关联节点的单边关联度。与相应对象节点相连的有向边上展示对应的单边关联度,例如,在上述举例的图3中,关联节点Q5183与相连的两个对象节点V5和V8的单边关联度为3.21,即对象节点V5与对象节点V8基于关联节点Q5183的单边关联度为3.21。关联节点M5482与相连的两个对象节点V5和V8的单边关联度为0.89。
服务器对两个对象节点之间的多个关联节点的单边关联度进行叠加,可以得到两个对象节点的综合关联度。服务器将综合关联度作为参考权重及相应参考对象节点的属性信息值进行叠加,得到第二属性参考值。
本实施例中,同时结合最短社交距离及发生关联事件的频次多个维度的影响因素,对基础关联系数进行调整,可以提高单边关联度计算准确性,进而提高兴趣属性值的准确性。
在一个实施例中,如图4所示,该方法还包括基于属性信息值的风险跟踪的步骤:
步骤402,比较目标对象对应的属性信息值是否超过阈值。
步骤404,若是,确定目标对象所属的行业类型。
步骤406,获取风险数据;风险数据包括目标对象的风险数据、行业类型的风险数据以及目标对象对应产品资源的风险数据。
步骤408,在风险数据中提取风险标签。
步骤410,计算提取得到的风险标签与预存储的多个黑名单对象的风险标签的相似度,将相似度超过预设值的黑名单对象标记为相似对象。
服务器比较属性信息值是否超过阈值。若是,表示目标对象具有较高的违约风险,服务器将该目标对象标记为风险对象。服务器根据身份属性信息确定风险对象对应的相似对象。具体的,服务器预存储了多种黑名单对象的风险画像(记作坏样本画像)。坏样本画像包括多个风险标签。风险标签用于表征黑名单对象在哪些科目出现的问题。随着时间变化,风险手段也有可能变化。为了提高相似对象匹配准确度,可以对相应坏样本画像也进行动态更新。服务器基于目标对象的身份属性信息,生成预设的多种风险指标分别对应的风险标签,利用多个风险标签生成目标对象的风险画像(记作待匹配画像)。服务器调用预设的风险线索分析模型计算待匹配画像与坏样本画像的余弦相似性,得到相似度。若相似度超过指定值,服务器将相应黑名单对象标记为风险对象的相似对象。
步骤412,获取相似对象在多个时间节点的风险指标,根据风险指标确定目标对象的风险点,将风险点补入身份属性信息。
服务器基于相似对象识别风险对象的多个风险点。具体的,每个坏样本画像关联有多个时间节点的风险指标。服务器根据相匹配的坏样本画像关联的多个时间节点的风险指标对风险对象的风险线索进行预测。在不同时间节点可能与不同黑名单对象的风险模式相似。换言之,随着时间推移当前风险对象的相似对象可能发生变化。
服务器从“与相似对象相同的风险标签”以及“相同风险标签的时间顺序”两个角度生成风险线索。具体可以判断风险对象是否存在与相似对象相同的风险指标及相同风险指标出现的时间顺序与相似案例是否一致。若存在与相似对象相同的风险指标且相同风险指标的出现时间顺序与相似对象一致,则服务器将最后一个时间节点的相同的风险指标(记作征兆指标)标记为一个风险点。比如,坏样本A具有6个异常指标,目标对象B已经出现了其中5种异常指标则预测有可能出现第6种异常指标,从而可以将第6种异常指标标记为目标对象B的一个风险点。
服务器将多个风险点串联,生成风险对象对应的风险线索。具体的,确定风险对象的监控周期。监控周期可以根据风险评分或者风险对象的行业类型等动态确定的,也可以是预设的固定值,对此不做限制。当监控周期到达时,服务器按照上述方式确定风险对象在每个监控周期的风险点,并按照时间顺序将多个风险点串联,得到风险对象对应的风险线索。服务器基于属性信息值、相似对象及风险线索,生成对应的风险分析报告,将风险分析报告关联至关系网图谱中相应待定对象节点。
本实施例中,在得到属性信息值后进一步确定目标对象的相似对象,并基于相似对象预测目标对象在未来多个时间节点可能出现的风险点,基于上述信息补充得到的身份属性信息可以方便用户全面快速的了解目标对象的风险情况,提高风险分析精准度。
应该理解的是,虽然图2和图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种基于关系网络的属性信息处理装置,包括:属性信息处理模块和属性信息值计算模块506,其中属性信息处理模块包括第一属性信息处理模块502和第二属性信息处理模块504,其中:
第二属性信息处理模块504,用于获取关系网络图谱;所述关系网络图谱包括多个对象节点及每个对象节点连接的属性节点;识别每个对象节点对应属性信息是否缺失;根据识别结果将所述关系网络图谱中多个对象节点区分为确定对象节点和待定对象节点;在所述关系网络图谱中划取每个所述待定对象节点的全连通子网络图;将所述全连通子网络图中与待定对象节点存在目标关联关系的确定对象节点标记为参考对象节点;计算每个参考对象节点与所述待定对象节点的综合关联度;获取所述参考对象节点对应的属性信息值,并根据所述综合关联度确定所述属性信息值的参考权重;根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值。
属性信息值计算模块506,用于根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值,以控制终端根据第二属性信息值进行数据处理。
在一个实施例中,第一属性信息处理模块502用于从数据处理系统获取目标对象的身份属性信息;查询与所述数据处理系统对应的信息预测模型和关联系数权重;将所述身份属性信息输入所述信息预测模型,得到目标关联系数;根据所述目标关联系数及所述关联系数权重,计算得到第一属性参考值。第二属性信息处理模块504还用于根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值。属性信息值计算模块506还用于根据所述第一属性参考值及所述第二属性参考值,计算得到所述目标对象的属性信息值。
在一个实施例中,该装置还包括网络图谱构建模块508,用于获取多个目标对象的身份属性信息和社交网络信息;根据身份属性信息生成每个目标对象对应的对象节点及属性节点,采用有向边将属性节点连接至相应对象节点;识别不同对象节点是否连接有相同的属性节点;若是,对相同的属性节点进行合并,并将相同的属性节点标记为对应多个对象节点的关联节点;根据社交网络信息计算对象节点基于不同关联节点的单边关联度,将单边关联度添加至相应关联节点相连的有向边,得到关系网络图谱。
在一个实施例中,第二属性信息处理模块504还用于获取待定对象节点对应的社交网络信息;根据社交网络信息计算待定对象节点基于不同关联节点与不同参考对象节点之间的单边关联度;对每个参考对象节点与待定对象节点之间多个关联节点的单边关联度进行叠加,得到参考对象节点与待定对象节点的综合关联度。
在一个实施例中,该装置还包括属性信息跟踪模块510,用于比较目标对象对应的属性信息值是否超过阈值;若是,确定目标对象所属的行业类型;获取风险数据;风险数据包括目标对象的风险数据、行业类型的风险数据以及目标对象对应产品资源的风险数据;在风险数据中提取风险标签;计算提取得到的风险标签与预存储的多个黑名单对象的风险标签的相似度,将相似度超过预设值的黑名单对象标记为相似对象;获取相似对象在多个时间节点的风险指标,根据风险指标确定目标对象的风险点,将风险点补入身份属性信息。
关于基于关系网络的属性信息处理装置的具体限定可以参见上文中对于基于关系网络的属性信息处理方法的限定,在此不再赘述。上述基于关系网络的属性信息处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储信息预测模型及关系网路图谱。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于关系网络的属性信息处理方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的基于关系网络的属性信息处理方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于关系网络的属性信息处理方法,所述方法包括:
获取关系网络图谱;所述关系网络图谱包括多个对象节点及每个对象节点连接的属性节点;
识别每个对象节点对应属性信息是否缺失;
根据识别结果将所述关系网络图谱中多个对象节点区分为确定对象节点和待定对象节点;
在所述关系网络图谱中划取每个所述待定对象节点的全连通子网络图;
将所述全连通子网络图中与待定对象节点存在目标关联关系的确定对象节点标记为参考对象节点;
计算每个参考对象节点与所述待定对象节点的综合关联度;
根据所述综合关联度确定所述属性信息值的参考权重;
根据多个属性信息值及分别对应的参考权重,确定所述目标对象对应的属性信息值,以控制终端根据所述属性信息值进行数据处理。
2.根据权利要求1所述的方法,其特征在于,所述获取关系网络图谱之前,所述方法还包括:
获取多个目标对象的身份属性信息和社交网络信息;
根据所述身份属性信息生成每个目标对象对应的对象节点及属性节点,采用有向边将所述属性节点连接至相应对象节点;
识别不同所述对象节点是否连接有相同的属性节点;
若是,对所述相同的属性节点进行合并,并将所述相同的属性节点标记为对应多个对象节点的关联节点;
根据所述社交网络信息计算所述对象节点基于不同关联节点的单边关联度,将所述单边关联度添加至相应关联节点相连的有向边,得到关系网络图谱。
3.根据权利要求2所述的方法,其特征在于,所述计算每个参考对象节点与所述待定对象节点的综合关联度,包括:
获取所述待定对象节点对应的社交网络信息;
根据所述社交网络信息计算所述待定对象节点基于不同关联节点与不同参考对象节点之间的单边关联度;
对每个参考对象节点与所述待定对象节点之间多个关联节点的单边关联度进行叠加,得到所述参考对象节点与所述待定对象节点的综合关联度。
4.根据权利要求1所述的方法,其特征在于,所述根据多个属性信息值及分别对应的参考权重,计算得到所述目标对象对应的属性信息值包括:
从数据处理系统获取目标对象的身份属性信息;
查询与所述数据处理系统对应的信息预测模型和关联系数权重;
将所述身份属性信息输入所述信息预测模型,得到目标关联系数;
根据所述目标关联系数及所述关联系数权重,计算得到第一属性参考值;
根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值;
根据所述第一属性参考值及所述第二属性参考值,计算得到所述目标对象的属性信息值。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
比较所述目标对象对应的属性信息值是否超过阈值;
若是,确定所述目标对象所属的行业类型;
获取风险数据;所述风险数据包括所述目标对象的风险数据、所述行业类型的风险数据以及所述目标对象对应产品资源的风险数据;
在所述风险数据中提取风险标签;
计算提取得到的风险标签与预存储的多个黑名单对象的风险标签的相似度,将所述相似度超过预设值的黑名单对象标记为相似对象;
获取所述相似对象在多个时间节点的风险指标,根据所述风险指标确定所述目标对象的风险点,将所述风险点补入所述身份属性信息。
6.一种基于关系网络的属性信息处理装置,所述装置包括:
属性信息处理模块,用于获取关系网络图谱;所述关系网络图谱包括多个对象节点及每个对象节点连接的属性节点;识别每个对象节点对应属性信息是否缺失;根据识别结果将所述关系网络图谱中多个对象节点区分为确定对象节点和待定对象节点;在所述关系网络图谱中划取每个所述待定对象节点的全连通子网络图;将所述全连通子网络图中与待定对象节点存在目标关联关系的确定对象节点标记为参考对象节点;计算每个参考对象节点与所述待定对象节点的综合关联度;获取所述参考对象节点对应的属性信息值,并根据所述综合关联度确定所述属性信息值的参考权重;
根据多个属性信息值及分别对应的参考权重,计算得到第二属性参考值;
属性信息值计算模块,用于根据所述第一属性参考值与所述第二属性参考值,确定所述目标对象对应的属性信息值,以控制终端根据所述属性信息值进行数据处理。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括网络图谱构建模块,用于获取多个目标对象的身份属性信息和社交网络信息;根据所述身份属性信息生成每个目标对象对应的对象节点及属性节点,采用有向边将所述属性节点连接至相应对象节点;识别不同所述对象节点是否连接有相同的属性节点;若是,对所述相同的属性节点进行合并,并将所述相同的属性节点标记为对应多个对象节点的关联节点;根据所述社交网络信息计算所述对象节点基于不同关联节点的单边关联度,将所述单边关联度添加至相应关联节点相连的有向边,得到关系网络图谱。
8.根据要求要求6所述的装置,其特征在于,所述属性信息处理模块还用于获取所述待定对象节点对应的社交网络信息;根据所述社交网络信息计算所述待定对象节点基于不同关联节点与不同参考对象节点之间的单边关联度;对每个参考对象节点与所述待定对象节点之间多个关联节点的单边关联度进行叠加,得到所述参考对象节点与所述待定对象节点的综合关联度。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910748766.0A CN110659799A (zh) | 2019-08-14 | 2019-08-14 | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 |
PCT/CN2020/086397 WO2021027317A1 (zh) | 2019-08-14 | 2020-04-23 | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910748766.0A CN110659799A (zh) | 2019-08-14 | 2019-08-14 | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110659799A true CN110659799A (zh) | 2020-01-07 |
Family
ID=69037389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910748766.0A Pending CN110659799A (zh) | 2019-08-14 | 2019-08-14 | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110659799A (zh) |
WO (1) | WO2021027317A1 (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274495A (zh) * | 2020-01-20 | 2020-06-12 | 平安科技(深圳)有限公司 | 用户关系强度的数据处理方法、装置、计算机设备及存储介质 |
CN111325258A (zh) * | 2020-02-14 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 特征信息获取方法、装置、设备及存储介质 |
CN111340611A (zh) * | 2020-02-20 | 2020-06-26 | 中国建设银行股份有限公司 | 一种风险预警方法和装置 |
CN111597401A (zh) * | 2020-05-20 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 基于图关系网络的数据处理方法、装置、设备及介质 |
CN111860655A (zh) * | 2020-07-23 | 2020-10-30 | 中国联合网络通信集团有限公司 | 用户的处理方法、装置和设备 |
CN112016836A (zh) * | 2020-08-31 | 2020-12-01 | 中国银联股份有限公司 | 一种对象间相似性的确定方法及装置 |
CN112270195A (zh) * | 2020-11-25 | 2021-01-26 | 上海水滴征信服务有限公司 | 确定企业关联关系、重名对象判定 |
WO2021027317A1 (zh) * | 2019-08-14 | 2021-02-18 | 深圳壹账通智能科技有限公司 | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 |
CN112667696A (zh) * | 2020-12-30 | 2021-04-16 | 深圳市华傲数据技术有限公司 | 数据处理方法、设备及存储介质 |
CN113157704A (zh) * | 2021-05-06 | 2021-07-23 | 成都卫士通信息产业股份有限公司 | 层级关系分析方法、装置、设备及计算机可读存储介质 |
WO2021159834A1 (zh) * | 2020-02-14 | 2021-08-19 | 平安科技(深圳)有限公司 | 异常信息处理节点分析方法、装置、介质及电子设备 |
CN113704363A (zh) * | 2020-05-22 | 2021-11-26 | 百度在线网络技术(北京)有限公司 | 一种权重确定方法、装置、设备及存储介质 |
CN114866437A (zh) * | 2022-04-19 | 2022-08-05 | 北京博睿宏远数据科技股份有限公司 | 一种节点检测方法、装置、设备及介质 |
CN115081589A (zh) * | 2020-01-09 | 2022-09-20 | 支付宝(杭州)信息技术有限公司 | 利用lstm神经网络模型处理交互数据的方法及装置 |
CN116931889A (zh) * | 2023-09-18 | 2023-10-24 | 浙江工企信息技术股份有限公司 | 一种基于对象树的软件建模方法及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926993B (zh) * | 2021-04-13 | 2021-12-28 | 哈尔滨哈银消费金融有限责任公司 | 基于区块链安全大数据的信息生成方法及区块链服务系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015183376A1 (en) * | 2014-05-30 | 2015-12-03 | Linkedin Corporation | Inferred identity |
CN107239882A (zh) * | 2017-05-10 | 2017-10-10 | 平安科技(深圳)有限公司 | 风险评估方法、装置、计算机设备及存储介质 |
CN108132998A (zh) * | 2017-12-21 | 2018-06-08 | 浪潮软件集团有限公司 | 一种人员关系分析方法和系统 |
CN108287864A (zh) * | 2017-12-06 | 2018-07-17 | 深圳市腾讯计算机系统有限公司 | 一种兴趣群组划分方法、装置、介质及计算设备 |
CN109272396A (zh) * | 2018-08-20 | 2019-01-25 | 平安科技(深圳)有限公司 | 客户风险预警方法、装置、计算机设备和介质 |
CN109829629A (zh) * | 2019-01-07 | 2019-05-31 | 平安科技(深圳)有限公司 | 风险分析报告的生成方法、装置、计算机设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345158A (zh) * | 2018-12-19 | 2019-02-15 | 重庆百行智能数据科技研究院有限公司 | 企业风险识别方法、装置和计算机可读存储介质 |
CN110659799A (zh) * | 2019-08-14 | 2020-01-07 | 深圳壹账通智能科技有限公司 | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 |
-
2019
- 2019-08-14 CN CN201910748766.0A patent/CN110659799A/zh active Pending
-
2020
- 2020-04-23 WO PCT/CN2020/086397 patent/WO2021027317A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015183376A1 (en) * | 2014-05-30 | 2015-12-03 | Linkedin Corporation | Inferred identity |
CN107239882A (zh) * | 2017-05-10 | 2017-10-10 | 平安科技(深圳)有限公司 | 风险评估方法、装置、计算机设备及存储介质 |
CN108287864A (zh) * | 2017-12-06 | 2018-07-17 | 深圳市腾讯计算机系统有限公司 | 一种兴趣群组划分方法、装置、介质及计算设备 |
CN108132998A (zh) * | 2017-12-21 | 2018-06-08 | 浪潮软件集团有限公司 | 一种人员关系分析方法和系统 |
CN109272396A (zh) * | 2018-08-20 | 2019-01-25 | 平安科技(深圳)有限公司 | 客户风险预警方法、装置、计算机设备和介质 |
CN109829629A (zh) * | 2019-01-07 | 2019-05-31 | 平安科技(深圳)有限公司 | 风险分析报告的生成方法、装置、计算机设备和存储介质 |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021027317A1 (zh) * | 2019-08-14 | 2021-02-18 | 深圳壹账通智能科技有限公司 | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 |
CN115081589A (zh) * | 2020-01-09 | 2022-09-20 | 支付宝(杭州)信息技术有限公司 | 利用lstm神经网络模型处理交互数据的方法及装置 |
CN111274495A (zh) * | 2020-01-20 | 2020-06-12 | 平安科技(深圳)有限公司 | 用户关系强度的数据处理方法、装置、计算机设备及存储介质 |
CN111274495B (zh) * | 2020-01-20 | 2023-08-25 | 平安科技(深圳)有限公司 | 用户关系强度的数据处理方法、装置、计算机设备及存储介质 |
WO2021159834A1 (zh) * | 2020-02-14 | 2021-08-19 | 平安科技(深圳)有限公司 | 异常信息处理节点分析方法、装置、介质及电子设备 |
CN111325258A (zh) * | 2020-02-14 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 特征信息获取方法、装置、设备及存储介质 |
CN111325258B (zh) * | 2020-02-14 | 2023-10-24 | 腾讯科技(深圳)有限公司 | 特征信息获取方法、装置、设备及存储介质 |
CN111340611A (zh) * | 2020-02-20 | 2020-06-26 | 中国建设银行股份有限公司 | 一种风险预警方法和装置 |
CN111340611B (zh) * | 2020-02-20 | 2024-03-08 | 中国建设银行股份有限公司 | 一种风险预警方法和装置 |
CN111597401A (zh) * | 2020-05-20 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 基于图关系网络的数据处理方法、装置、设备及介质 |
CN111597401B (zh) * | 2020-05-20 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 基于图关系网络的数据处理方法、装置、设备及介质 |
CN113704363A (zh) * | 2020-05-22 | 2021-11-26 | 百度在线网络技术(北京)有限公司 | 一种权重确定方法、装置、设备及存储介质 |
CN113704363B (zh) * | 2020-05-22 | 2024-04-30 | 百度在线网络技术(北京)有限公司 | 一种权重确定方法、装置、设备及存储介质 |
CN111860655B (zh) * | 2020-07-23 | 2023-05-30 | 中国联合网络通信集团有限公司 | 用户的处理方法、装置和设备 |
CN111860655A (zh) * | 2020-07-23 | 2020-10-30 | 中国联合网络通信集团有限公司 | 用户的处理方法、装置和设备 |
CN112016836B (zh) * | 2020-08-31 | 2023-11-03 | 中国银联股份有限公司 | 一种对象间相似性的确定方法及装置 |
CN112016836A (zh) * | 2020-08-31 | 2020-12-01 | 中国银联股份有限公司 | 一种对象间相似性的确定方法及装置 |
CN112270195A (zh) * | 2020-11-25 | 2021-01-26 | 上海水滴征信服务有限公司 | 确定企业关联关系、重名对象判定 |
CN112667696A (zh) * | 2020-12-30 | 2021-04-16 | 深圳市华傲数据技术有限公司 | 数据处理方法、设备及存储介质 |
CN113157704B (zh) * | 2021-05-06 | 2023-07-25 | 成都卫士通信息产业股份有限公司 | 层级关系分析方法、装置、设备及计算机可读存储介质 |
CN113157704A (zh) * | 2021-05-06 | 2021-07-23 | 成都卫士通信息产业股份有限公司 | 层级关系分析方法、装置、设备及计算机可读存储介质 |
CN114866437A (zh) * | 2022-04-19 | 2022-08-05 | 北京博睿宏远数据科技股份有限公司 | 一种节点检测方法、装置、设备及介质 |
CN114866437B (zh) * | 2022-04-19 | 2023-11-21 | 北京博睿宏远数据科技股份有限公司 | 一种节点检测方法、装置、设备及介质 |
CN116931889A (zh) * | 2023-09-18 | 2023-10-24 | 浙江工企信息技术股份有限公司 | 一种基于对象树的软件建模方法及系统 |
CN116931889B (zh) * | 2023-09-18 | 2023-12-12 | 浙江工企信息技术股份有限公司 | 一种基于对象树的软件建模方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2021027317A1 (zh) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110659799A (zh) | 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质 | |
CN110659395B (zh) | 关系网络图谱构建方法、装置、计算机设备和存储介质 | |
CN109345374B (zh) | 风险控制方法、装置、计算机设备和存储介质 | |
US11968105B2 (en) | Systems and methods for social graph data analytics to determine connectivity within a community | |
CN109272396B (zh) | 客户风险预警方法、装置、计算机设备和介质 | |
US20200285980A1 (en) | System for secure federated learning | |
CN111061859B (zh) | 基于知识图谱的数据处理方法、装置和计算机设备 | |
US10936952B2 (en) | Detecting content items in violation of an online system policy using templates based on semantic vectors representing content items | |
CN108769026B (zh) | 用户账号检测系统和方法 | |
CN109002988B (zh) | 风险旅客流量预测方法、装置、计算机设备和存储介质 | |
CN109582876B (zh) | 旅游行业用户画像构造方法、装置和计算机设备 | |
CN110659396A (zh) | 缺失属性信息补全方法、装置、计算机设备和存储介质 | |
CN111192153B (zh) | 人群关系网络构建方法、装置、计算机设备和存储介质 | |
WO2020253357A1 (zh) | 数据产品推荐方法、装置、计算机设备和存储介质 | |
CN112131277B (zh) | 基于大数据的医疗数据异常分析方法、装置和计算机设备 | |
US20190073592A1 (en) | Detecting content items in violation of an online system policy using semantic vectors | |
CN109063984B (zh) | 风险旅客方法、装置、计算机设备和存储介质 | |
CN110660078B (zh) | 对象追踪方法、装置、计算机设备和存储介质 | |
CN111192025A (zh) | 职业信息匹配方法、装置、计算机设备和存储介质 | |
CN110647676B (zh) | 基于大数据的兴趣属性挖掘方法、装置和计算机设备 | |
CN110555164A (zh) | 群体兴趣标签的生成方法、装置、计算机设备和存储介质 | |
CN111428009B (zh) | 关系查询方法、装置、计算机设备和存储介质 | |
CN110598124B (zh) | 数值属性挖掘方法、装置、计算机设备和存储介质 | |
CN108875083B (zh) | 基于社交网络寻人方法、装置、计算机设备和存储介质 | |
CN110263106B (zh) | 协同舆论欺诈检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200107 |
|
WD01 | Invention patent application deemed withdrawn after publication |