CN110335139A - 基于相似度的评估方法、装置、设备及可读存储介质 - Google Patents

基于相似度的评估方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN110335139A
CN110335139A CN201910559145.8A CN201910559145A CN110335139A CN 110335139 A CN110335139 A CN 110335139A CN 201910559145 A CN201910559145 A CN 201910559145A CN 110335139 A CN110335139 A CN 110335139A
Authority
CN
China
Prior art keywords
similarity
assessed
information data
relationship
related information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910559145.8A
Other languages
English (en)
Other versions
CN110335139B (zh
Inventor
夏鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201910559145.8A priority Critical patent/CN110335139B/zh
Publication of CN110335139A publication Critical patent/CN110335139A/zh
Application granted granted Critical
Publication of CN110335139B publication Critical patent/CN110335139B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本发明公开了一种基于相似度的评估方法,该方法包括:获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;根据所述第一信息数据、第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度、以及已评估第一对象与已评估第二对象的第二关系相似度;根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度。本发明还公开了一种基于相似度的评估装置、设备和一种可读存储介质。本发明能够基于信息数据的相似度,有效评估团伙金融欺诈,提高信贷评估的准确性。

Description

基于相似度的评估方法、装置、设备及可读存储介质
技术领域
本发明涉及信贷评估技术领域,尤其涉及基于相似度的评估方法、装置、设备及可读存储介质。
背景技术
随着社会和金融行业的快速发展,信贷业务活跃于市场。信贷机构使用的风控评估模型的评估能力也越来越强,但信贷欺诈者的信贷欺诈模式也在不断演进,基于风控评估模型的专业性,金融欺诈者越来越趋于有组织性和团伙作案;
现有的风控评估方法会根据贷款申请者提供的各种信贷信息数据,如身份信息、手机设备信息、邮箱号码、银行卡信息、居住城市等,进行单一的验真核对,这种方法往往忽略了不同贷款申请者的信贷信息数据间的关联性,而有组织性和团伙作案的金融欺诈者的信贷信息数据之间却总会具有交叉相似的特点,因此现有的风控评估方法不能有效评估团伙作案的欺诈者,从而降低了信贷评估的准确性。
发明内容
本发明的主要目的在于提出一种基于相似度的评估方法、装置、设备及可读存储介质,旨在基于信息数据的相似度,有效评估团伙金融欺诈,提高信贷评估的准确性。
为实现上述目的,本发明提供一种基于相似度的评估方法,所述方法包括如下步骤:
获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;
根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
可选地,所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并确认所述第三关系相似度是否大于预设相似度阈值;
在第三关系相似度大于预设相似度阈值时,获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。
可选地,所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到当前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。
可选地,所述获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、信息数据对应的权重值以及已评估第二对象的第三信息数据的步骤之后,所述方法还包括:
对第一信息数据、第二信息数据以及第三信息数据进行预处理;
获取预处理后的第一信息数据的第一关联信息数据、预处理后的第二信息数据的第二关联信息数据以及预处理后的第三信息数据的第三关联信息数据;
所述根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度的步骤包括:
根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
所述根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度的步骤包括:
根据第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度。
可选地,获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据的步骤之前,所述方法还包括:
获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值。
可选地,所述根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度的步骤包括:
确认第一关联信息数据与其对应的第三关联信数据是否相同,并根据确认结果获取赋予确认结果对应的结果值;
根据确认结果对应的结果值、关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
可选地,所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
获取第一关系相似度中大于预设关系相似度阈值的第一相似度、以及第二关系相似度中大于预设关系相似度阈值的第二相似度;
根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
此外,为实现上述目的,本发明还提供一种基于相似度的评估装置,所述基于相似度的评估装置包括:
第一获取模块,用于获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;
第一计算模块,用于根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
第二计算模块,用于根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;
第三计算模块,用于根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
可选地,所述第三计算模块还用于:
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并确认所述第三关系相似度是否大于预设相似度阈值;
在第三关系相似度大于预设相似度阈值时,获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。
可选地,所述第三计算模块还用于:
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到当前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。
可选地,所述基于相似度的评估装置还包括
预处理模块,用于对第一信息数据、第二信息数据以及第三信息数据进行预处理;
第二获取模块,用于获取预处理后的第一信息数据的第一关联信息数据、预处理后的第二信息数据的第二关联信息数据以及预处理后的第三信息数据的第三关联信息数据;
所述第一计算模块还用于:根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
所述第二计算模块还用于:根据第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度。
可选地,所述基于相似度的评估装置还包括:
赋值模块:用于获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值。
可选地,所述第一计算模块还用于:
确认第一关联信息数据与其对应的第三关联信数据是否相同,并根据确认结果获取赋予确认结果对应的结果值;
根据确认结果对应的结果值、关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
可选地,所述第三计算模块还用于:
获取第一关系相似度中大于预设关系相似度阈值的第一相似度、以及第二关系相似度中大于预设关系相似度阈值的第二相似度;
根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
此外,为实现上述目的,本发明还提供一种基于相似度的评估设备,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于相似度的评估程序,所述基于相似度的评估程序被所述处理器执行时实现如上所述的基于相似度的评估方法的步骤。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有基于相似度的评估程序,所述基于相似度的评估程序被处理器执行时实现如上所述的基于相似度的评估方法的步骤。
本发明获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。通过上述方式,本发明能够基于待评估对象与已评估第二对象的第一关系相似度,以及已评估第一对象与已评估第二对象的第二关系相似度,计算获得待评估对象与已评估第一对象之间的第三关系相似度,通过第三关系相似度,确认待评估对象的评估标签,通过待评估对象与已评估对象之间的关系相似度计算,实现关系和标签的扩散,有效评估团伙作案的欺诈者,提高了信贷评估的准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明基于相似度的评估方法第一实施例的流程示意图;
图3为本发明基于相似度的评估方法第二实施例的流程示意图;
图4为本发明基于相似度的评估方法第三实施例的流程示意图;
图5为本发明基于相似度的评估方法第四实施例的流程示意图;
图6为本发明基于相似度的评估方法第五实施例的流程示意图;
图7为本发明基于相似度的评估方法第六实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
现有的风控评估方法会根据贷款申请者提供的各种信贷信息数据,如身份证号码、手机号码、邮箱号码、银行卡号、居住城市等,进行单一的验真核对,这种方法往往忽略了不同贷款申请者的信贷信息数据间的关联性,而有组织性和团伙作案的金融欺诈者的信贷信息数据之间却总会具有交叉相似的特点,因此现有的风控评估方法不能有效评估团伙作案的欺诈者,从而降低了信贷评估的准确性。
本发明基于信息数据的相似度,有效评估团伙金融欺诈,提高信贷评估的准确性。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端可以是PC,也可以是智能手机、平板电脑、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面3)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
优选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于评估移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动评估相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于相似度的评估程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基于相似度的评估程序,并执行以下操作:
获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;
根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
进一步地,处理器1001可以调用存储器1005中存储的基于相似度的评估程序,还执行以下操作:所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并确认所述第三关系相似度是否大于预设相似度阈值;
在第三关系相似度大于预设相似度阈值时,获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。
进一步地,处理器1001可以调用存储器1005中存储的基于相似度的评估程序,还执行以下操作:所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到当前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。
进一步地,处理器1001可以调用存储器1005中存储的基于相似度的评估程序,还执行以下操作:所述获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、信息数据对应的权重值以及已评估第二对象的第三信息数据的步骤之后,所述方法还包括:
对第一信息数据、第二信息数据以及第三信息数据进行预处理;
获取预处理后的第一信息数据的第一关联信息数据、预处理后的第二信息数据的第二关联信息数据以及预处理后的第三信息数据的第三关联信息数据;
所述根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度的步骤包括:
根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
所述根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度的步骤包括:
根据第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度。
进一步地,处理器1001可以调用存储器1005中存储的基于相似度的评估程序,还执行以下操作:获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据的步骤之前,所述方法还包括:
获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值。
进一步地,处理器1001可以调用存储器1005中存储的基于相似度的评估程序,还执行以下操作:所述根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度的步骤包括:
确认第一关联信息数据与其对应的第三关联信数据是否相同,并根据确认结果获取赋予确认结果对应的结果值;
根据确认结果对应的结果值、关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
进一步地,处理器1001可以调用存储器1005中存储的基于相似度的评估程序,还执行以下操作:所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
获取第一关系相似度中大于预设关系相似度阈值的第一相似度、以及第二关系相似度中大于预设关系相似度阈值的第二相似度;
根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
基于上述硬件结构,提出本发明方法实施例。
参照图2,图2为本发明方法第一实施例的流程示意图,所述方法包括:
步骤S10,获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;
本发明实施例可以应用于信贷识别模型,在评估对象授权的基础上,通过信贷APP(Application,应用程序)和/或其它的业务场景识别模型获取待评估对象第一信息数据、已评估第一对象的第二信息数据,已评估第二对象的第三信息数据;所述信贷APP可以包括多个,所述第一信息数据、第二信息数据、第三信息数据均包括:身份信息、手机设备信息、邮箱号码、银行卡信息、居住地、财产信息、生活轨迹的经纬度以及涉及具体物品贷款的信息、登录IP地址等,所述身份信息包括个人身份证号、联系人姓名等,手机设备信息包括:短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号等,银行卡信息包括银行卡号、银行卡发卡地、银行卡发卡银行等,财产信息包括房产信息、车辆信息等,涉及具体物品贷款的信息,例如:在车贷识别模型中,涉及车辆贷款的信息包括:车辆品牌、车辆类型、车辆里程、车龄等。
在信贷识别模型中具有关联信息数据对应的权重值,获取关联信息数据对应的权重值;
信贷识别模型可从信贷APP中和/或其它的业务场景识别模型中、获取的评估对象的信息数据中的关联信息数据,在金融欺诈中,金融欺诈者团伙作案时,可能会使用同一个身份证号、同一个邮箱号、同一个居住地和/或同一个手机号等相同的信息数据,则获取的评估对象间的关联信息数据可以包括:身份证号、短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号、联系人姓名、银行卡号、房产信息、车辆信息等,信贷识别模型在获取到关联信息数据,并根据关联信息数据与评估对象的关联强弱程度,对关联信息数据分别赋予对应的权重值:
例如,在车贷识别模型中,从评估对象的信息数据中获取的关联信息数据可以包括有:身份证号、短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号、银行卡号、登录IP地址、居住城市、银行卡机构、车辆品牌、车辆类型等,获取的关联信息数据后,并根据关联信息数据与评估对象的关联强弱程度,如:强关联信息包括:身份证号、短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号、银行卡号,弱关联信息包括:登录IP地址、居住城市、银行卡机构、车辆品牌、车辆类型,对关联信息数据分别赋予对应的权重值得到属性向量,即权重值根据相应属性向量对于判定评估对象间的关系程度设置,其取值范围可设置为0到1。经过对属性向量赋予不同权重后,可以作为下一步余弦算法的输入。
本领域的技术人员应该可以理解,这里只是用于举例说明,不应理解为对本发明的限制。
步骤S20,根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,可以使用余弦相似度算法计算待评估对象与已评估第二对象的第一关系相似度,余弦相似度又称为余弦相似性,是通过计算两个向量的夹角余弦值评估向量间的相似度,余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。
在本发明实施例中,获取第一信息数据中的第一关联信息数据,以及获取第三信息数据中的第三关联信息数据,确认第一关联信息数据中与其对应的第三关联信息数据是否相同,信贷识别模型对确认相同的结果和确认不同的结果分别赋予对应的结果值,在确认第一关联信息数据与其对应的第三关联信息数据是否相同的结果时,获取赋予确认结果对应的结果值,根据赋予确认结果对应的结果值,关联信息对应的权重值可以使用余弦相似度算法,计算待评估对象与已评估第二对象的第一关系相似度,已评估第二对象包括多个,余弦相似度的计算公式如下公式(1):
其中,S(A,B)表示评估对象A和评估对象B的关系相似度;A={A1,A2,……,An}表示评估对象A的关联信息数据,B={B1,B2,……,Bn}表示评估对象B的关联信息数据;
其中,A·B=W1×I1+W2×I2+……+Wn×In,i=1,2,3……n
Wi表示关联信息数据的权重值,Ii表示赋予评估对象A的关联信息数据与评估对象B对应的关联信息数据是否相同的结果对应的结果值,可以赋予相同的结果的结果值为1,赋予不同的结果的结果值为0;
||A||||B||=1×I1+1×I2+……+1×In,表示非空向量之和。
例如,A=[139xxxxxxxx,202.114.2.*,Guazi,北京,………],
B=[189xxxxxxxx,202.114.2.*,Guazi,北京,………]
确认评估对象A关联信息数据与评估对象B对应的关联信息数据是否相同,得到确认结果时,获取赋予相同的结果的结果值,或者赋予不同的结果的结果值,在赋予相同的结果的结果值为1,赋予不同的结果的结果值为0时,
A·B=0×1+1×0.2+1×0.1+0×0.1……=0.3
||A||||B||=1×1+1×0.2+1×0.1+1×0.1……=1.4
本领域的技术人员应该可以理解,这里只是用于举例说明,不应理解为对本发明的限制。
步骤S30,根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;
在本发明实施例中,获取第二信息数据中的第二关联信息数据,以及获取第三信息数据中的第三关联信息数据,确认第二关联信息数据中与其对应的第三关联信息数据是否相同,信贷识别模型对确认相同的结果和确认不同的结果分别赋予对应的结果值,在确认第二关联信息数据与其对应的第三关联信息数据是否相同的结果时,获取赋予确认结果对应的结果值,根据赋予确认结果对应的结果值,关联信息对应的权重值可以使用余弦相似度算法,计算已评估第一对象与已评估第二对象的第二关系相似度,已评估第二对象包括多个,具体计算方法如上所述,在此不再赘述,可以理解地是,所述步骤30与步骤20不分先后顺序。
步骤S40,根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
SimRank是一种基于图的拓扑结构信息来衡量任意两个对象间相似程度的模型,其核心思想为:如果两个对象和被其相似的对象所引用(即它们有相似的入邻边结构),那么这两个对象也相似。
在实施例中,根据待评估对象与已评估第二对象的第一关系相似度、以及已评估第一对象与已评估第二对象的第二关系相似度,使用SimRank算法计算待评估对象与已评估第一对象的第三关系相似度,即根据待评估对象、以及已评估第一对象关系图谱计算待评估对象与已评估第一对象的第三关系相似度,可以理解地是,使用余弦相似度算法计算获得的评估对象间的关系相似度,当评估对象间的关系相似度关联性大时,其关系相似度值也大,若评估对象间的关系相似度小时,其关系相似度值也小,可以预设关系相似度阈值,剔除关系相似度小的评估对象,获取大于预设关系相似度阈值的第一关系相似度,以及大于预设关系相似度阈值的第二关系相似度,根据大于预设关系相似度阈值的第一关系相似度、以及大于预设关系相似度阈值的第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,增加第三关系相似度的计算的准确性,SimRank计算公式如下公式(2):
其中,sk+1(a,b)表示第k+1步迭代后的simrank值,计算从C开始。s0(a,b)为使用余弦相似度计算的评估对象a和评估对象b的关系相似度。
例如:Ia={c1,c2,c3},Ib={c3,c4},则a=[139xxxxxxxx,202.114.2.*,Guazi,北京,………],c1=[189xxxxxxxx,202.114.2.*,Guazi,北京,………],则:
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,即判断迭代计算是否收敛,收敛则计算结束,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。若判断不收敛,则继续进行迭代计算。例如:预设误差阈值为10的负5次方,则当前迭代与当前之前的上一次迭代差值小于10的负5次方时,迭代计算收敛,并将当前迭代计算的值作为第三关系相似度。
在计算出第三关系相似度时,确认第三关系相似度是否大于预设关系相似度阈值,在大于预设关系相似度阈值时,可以理解地是,待评估与已评估第一对象的关系强,则获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。状态标签可以为欺诈、理赔、逾期、结清和正常还款等,例如:计算第三关系相似度为0.9,预设阈值0.218,若已评估第一对象的状态标签为欺诈,则待评估对象的评估标签也是欺诈。
在本实施例中,基于待评估对象与已评估第二对象的第一关系相似度,以及已评估第一对象与已评估第二对象的第二关系相似度,计算获得待评估对象与已评估第一对象之间的第三关系相似度,通过第三关系相似度,确认待评估对象的评估标签,通过待评估对象与已评估对象之间的关系相似度计算,实现关系和标签的扩散,有效评估团伙作案的欺诈者,提高了信贷评估的准确性。
进一步地,参照图3,图3为本发明方法第二实施例的流程示意图。基于上述图2所示的实施例,步骤S40可以包括:
步骤S41,根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并确认所述第三关系相似度是否大于预设相似度阈值;
根据待评估对象与已评估第二对象的第一关系相似度、以及已评估第一对象与已评估第二对象的第二关系相似度,使用SimRank算法计算待评估对象与已评估第一对象的第三关系相似度,即根据待评估对象、以及已评估第一对象关系图谱计算待评估对象与已评估第一对象的第三关系相似度,可以理解地是,使用余弦相似度算法计算获得的评估对象间的关系相似度,当评估对象间的关系相似度关联性大时,其关系相似度值也大,若评估对象间的关系相似度小时,其关系相似度值也小,可以预设关系相似度阈值,剔除关系相似度小的评估对象,获取大于预设关系相似度阈值的第一关系相似度,以及大于预设关系相似度阈值的第二关系相似度,根据大于预设关系相似度阈值的第一关系相似度、以及大于预设关系相似度阈值的第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,增加第三关系相似度的计算的准确性。
步骤S42,在第三关系相似度大于预设相似度阈值时,获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。
在计算出第三关系相似度时,确认第三关系相似度是否大于预设关系相似度阈值,在大于预设关系相似度阈值时,可以理解地是,待评估与已评估第一对象的关系强,则获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。状态标签可以为欺诈、理赔、逾期、结清和正常还款等。
在本发明实施例中,通过待评估对象与已评估第一对象的关系图谱,计算出待评估对象与已评估第一对象的第三关系相似度。通过与已评估第一对象的相似度获得评估标签,实现关系和标签的扩散,有效评估团伙作案的欺诈者,提高了信贷评估的准确性。
进一步地,参照图4,图4为本发明基于相似度的评估方法第三实施例的流程示意图。基于上述的实施例,步骤S40可以包括:
步骤S43,将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到当前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,即判断迭代计算是否收敛,收敛则计算结束,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。若判断不收敛,则继续进行迭代计算。例如:预设误差阈值为10的负5次方,则当前迭代与当前之前的上一次迭代差值小于10的负5次方时,迭代计算收敛,并将当前迭代计算的值作为第三关系相似度。
在实施例中,可以设定预设迭代次数阈值,直至SimRank算法的迭代计算次数满足预设迭代次数阈值时,停止迭代计算,即判断迭代计算是否收敛,收敛则计算结束,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度。
本发明实施例中,通过SimRank算法的迭代计算,增加第三关系相似度的准确性,使待评估对象获得的评估标签更准确。
进一步地,参照图5,图5为本发明基于相似度的评估方法第四实施例的流程示意图。基于上述的实施例,步骤S10之后,所述方法还可以包括:
步骤S50,对第一信息数据、第二信息数据以及第三信息数据进行预处理;
通过信贷APP(Application,应用程序)和/或其它的业务场景识别模型获取待评估对象第一信息数据、已评估第一对象的第二信息数据,已评估第二对象的第三信息数据;所述信贷APP可以包括多个,所述第一信息数据、第二信息数据、第三信息数据均包括:身份信息、手机设备信息、邮箱号码、银行卡信息、居住地、财产信息、生活轨迹的经纬度以及涉及具体物品贷款的信息、登录IP地址等,所述身份信息包括个人身份证号、联系人姓名等,手机设备信息包括:短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号等,银行卡信息包括银行卡号、银行卡发卡地、银行卡发卡银行等,财产信息包括房产信息、车辆信息等,涉及具体物品贷款的信息,例如:在车贷识别模型中,涉及车辆贷款的信息包括:车辆品牌、车辆类型、车辆里程、车龄等。
获取的第一信息数据、第二信息数据、第三信息数据均包括有结构化的数据和非结构化的数据,结构化数据由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。非结构化数据是指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML,HTML、各类报表、图像和音频/视频信息等等。在获取到第一信息数据、第二信息数据、第三信息数据时,对第一信息数据、第二信息数据、第三信息数据进行预处理,将信息数据中结构化的数据直接进行存储以备使用,对非结构化的数据则进行关键字提取、缺失值填充、jason格式转换等处理后再进行存储,通过对信息数据进行预处理,增加基于相似度的评估模型的处理速度,以及模型评估准确性。
步骤S60,获取预处理后的第一信息数据的第一关联信息数据、预处理后的第二信息数据的第二关联信息数据以及预处理后的第三信息数据的第三关联信息数据;
预处理后的各信息数据中均包括有关联性的关联信息数据和无关联性的无关联信息数据,从预处理后的第一信息数据中获取第一关联信息数据、预处理后的第二信息数据中获取第二关联信息数据、预处理后的第三信息数据中获取第三关联信息数据,使用第一关联信息数据、第二关联信息数据、第三关联信息数据进行计算,提高基于相似度的评估模型的处理速度,以及模型评估准确性;
步骤S20可以包括:
步骤S21,根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
对第一信息数据、第三信息数据进行预处理后,获取到预处理后的第一信息数据中的第一关联信息数据、第三关联信息数据中的第三关联信息数据以及关联信息数据对应的权重值,确认第一关联信息数据中与其对应的第三关联信息数据是否相同,信贷识别模型对确认相同的结果和确认不同的结果分别赋予对应的结果值,在确认第一关联信息数据与其对应的第三关联信息数据是否相同的结果时,获取赋予确认结果对应的结果值,根据赋予确认结果对应的结果值,关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
步骤S30可以包括:
步骤S31,根据第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度。
对第二信息数据、第三信息数据进行预处理后,获取到预处理后的第二信息数据中的第二关联信息数据、第三关联信息数据中的第三关联信息数据以及关联信息数据对应的权重值,获取第二信息数据中的第二关联信息数据,以及获取第三信息数据中的第三关联信息数据,确认第二关联信息数据中与其对应的第三关联信息数据是否相同,信贷识别模型对确认相同的结果和确认不同的结果分别赋予对应的结果值,在确认第二关联信息数据与其对应的第三关联信息数据是否相同的结果时,获取赋予确认结果对应的结果值,根据赋予确认结果对应的结果值,关联信息对应的权重值使用余弦相似度算法,计算已评估第一对象与已评估第二对象的第二关系相似度。
在本发明实施例中通过对第一信息数据、第二信息数据、第三信息数据进行预处理,并获取预处理后的第一信息数据中的第一关联信息数据、第二信息数据中的第二关联信息数据、第三信息数据中的第三关联信息数据,根据第一关联信息数据、第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值使用余弦相似度算法计算评估对象间的关系相似度,提高基于相似度的评估模型的数据处理速度,以及模型评估准确性。
进一步地,基于上述的实施例,所述方法还可以包括:
步骤S70,获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值;
在信贷识别模型中具有关联信息数据对应的权重值,获取关联信息数据对应的权重值;
信贷识别模型可从信贷APP中和/或其它的业务场景识别模型中、获取的评估对象的信息数据中的关联信息数据,在金融欺诈中,金融欺诈者团伙作案时,可能会使用同一个身份证号、同一个邮箱号、同一个居住地和/或同一个手机号等相同的信息数据,则获取的评估对象间的关联信息数据可以包括:身份证号、短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号、联系人姓名、银行卡号、房产信息、车辆信息等,信贷识别模型在获取到关联信息数据,并根据关联信息数据与评估对象的关联强弱程度,对关联信息数据分别赋予对应的权重值:
例如,在车贷识别模型中,从评估对象的信息数据中获取的关联信息数据可以包括有:身份证号、短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号、银行卡号、登录IP地址、居住城市、银行卡机构、车辆品牌、车辆类型等,获取的关联信息数据后,并根据关联信息数据与评估对象的关联强弱程度,如:强关联信息包括:身份证号、短信验证手机号、注册手机号、公司电话号码、家庭电话号码、联系人手机号、银行卡号,弱关联信息包括:登录IP地址、居住城市、银行卡机构、车辆品牌、车辆类型,对关联信息数据分别赋予对应的权重值得到属性向量,即权重值根据相应属性向量对于判定评估对象间的关系程度设置,其取值范围可设置为0到1。经过对属性向量赋予不同权重后,可以作为下一步余弦算法的输入。如表1:
序号 属性向量 说明 分类 权重
1 id_no 身份证号 强关联 1
2 check_sms_phone 短信验证手机号 强关联 1
3 reg_phone 注册手机号 强关联 1
4 company_phone 公司电话号码 强关联 1
5 Home_phone 家庭电话号码 强关联 1
6 Contact_phone 联系人手机号 强关联 1
7 Bank_card_no 银行卡号 强关联 1
8 ip_address 登录IP地址 弱关联 0.5
9 Residence_city 居住城市 弱关联 0.2
10 Bank_card_group 银行卡机构 弱关联 0.2
11 Car_brand 车辆品牌 弱关联 0.1
12 Car_type 车辆类型 弱关联 0.1
表1:关联信息数据对应的权重值
在模型建立时,可以对评估对象间的关联信息数据是否相同的结果,赋予对应的结果值,例如:可以赋予相同的结果的结果值为1,赋予不同的结果的结果值为0,在模型应用过程中,根据评估对象间的关联信息数据以及评估对象间的关联信息数据是否相同的结果赋予对应的结果值,计算评估对象间的关系相似度。
本发明实施例中,获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值;对评估对象间的关联信息数据是否相同的结果赋予对应的结果值。通过对关联信息数据赋予对应的权重值以及评估对象间的关联信息数据是否相同的结果赋予对应的结果值,实现将抽象的信息转换成有关联的可计算的数据,并通过计算的数据评估对象间的关联性、使评估对象间的关联性具体化。
进一步地,参照图6,图6为本发明基于相似度的评估方法第五实施例的流程示意图。基于上述的实施例,步骤S20可以包括:
步骤S22,确认第一关联信息数据与其对应的第三关联信数据是否相同,并根据确认结果获取赋予确认结果对应的结果值;
确认第一关联信息数据中与其对应的第三关联信息数据是否相同,信贷识别模型对确认相同的结果和确认不同的结果分别赋予对应的结果值,在确认第一关联信息数据与其对应的第三关联信息数据是否相同的结果时,获取赋予确认结果对应的结果值;
步骤S23,根据确认结果对应的结果值、关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
将赋予确认结果对应的结果值,关联信息对应的权重值使用余弦相似度算法,计算待评估对象与已评估第二对象的第一关系相似度,例如:关联信息数据包括身份证号、注册手机号、验证手机号、登录IP地址、车辆品牌,上述关联数据依次对应的权重值为1、1、1、0.5、0.1,待评估对象A身份证号、注册手机号、车辆品牌(第一关联信息数据)与已评估的第二对象B的身份证号、注册手机号、车辆品牌(第二关联信息数据)不同,待评估对象A身验证手机号、登录IP地址(第一关联信息数据)与已评估的第二对象B的验证手机号、登录IP地址(第二关联信息数据)相同,则待评估对象A与已评估的第二对象B的第一关系相似度为:
在本发明实施例中,通过根据对关联信息数据赋予对应的权重值以及评估对象间的关联信息数据是否相同的结果赋予对应的结果值计算评估对象间的关系相似度,实现将抽象的信息转换成有关联的可计算的数据,并通过计算的数据评估对象间的关联性、使评估对象间的关联性具体化。
进一步地,参照图7,图7为本发明基于相似度的评估方法第六实施例的流程示意图。基于上述的实施例,步骤S40可以包括:
步骤S44,获取第一关系相似度中大于预设关系相似度阈值的第一相似度、以及第二关系相似度中大于预设关系相似度阈值的第二相似度;
在实施例中,根据待评估对象与已评估第二对象的第一关系相似度、以及已评估第一对象与已评估第二对象的第二关系相似度,使用SimRank算法计算待评估对象与已评估第一对象的第三关系相似度,即根据待评估对象、以及已评估第一对象关系图谱计算待评估对象与已评估第一对象的第三关系相似度,可以理解地是,使用余弦相似度算法计算获得的评估对象间的关系相似度,当评估对象间的关系相似度关联性大时,其关系相似度值也大,若评估对象间的关系相似度小时,其关系相似度值也小,可以预设关系相似度阈值,剔除关系相似度小的评估对象,获取第一关系相似度中大于预设关系相似度阈值的第一相似度,以及第二关系相似度大于预设关系相似度阈值的第二相似度,以进一步根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,增加第三关系相似度的计算的准确性。
步骤S45,根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
获取到第一相似度,以及第二相似度时,根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,增加第三关系相似度的计算的准确性。
本发明实施例中,根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,增加第三关系相似度的准确性,提高模型评估结果的准确性。
本发明还提供一种基于相似度的评估装置,所述基于相似度的评估装置包括:
第一获取模块,用于获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;
第一计算模块,用于根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
第二计算模块,用于根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;
第三计算模块,用于根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
进一步地,所述第三计算模块还用于:
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并确认所述第三关系相似度是否大于预设相似度阈值;
在第三关系相似度大于预设相似度阈值时,获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。
进一步地,所述第三计算模块还用于:
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到当前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。
进一步地,所述基于相似度的评估装置还包括
预处理模块,用于对第一信息数据、第二信息数据以及第三信息数据进行预处理;
第二获取模块,用于获取预处理后的第一信息数据的第一关联信息数据、预处理后的第二信息数据的第二关联信息数据以及预处理后的第三信息数据的第三关联信息数据;
所述第一计算模块还用于:根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
所述第二计算模块还用于:根据第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度。
进一步地,所述基于相似度的评估装置还包括:
赋值模块:用于获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值。
进一步地,所述第一计算模块还用于:
确认第一关联信息数据与其对应的第三关联信数据是否相同,并根据确认结果获取赋予确认结果对应的结果值;
根据确认结果对应的结果值、关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
进一步地,所述第三计算模块还用于:
获取第一关系相似度中大于预设关系相似度阈值的第一相似度、以及第二关系相似度大于预设关系相似度阈值的第二相似度;
根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。本发明还提供一种基于相似度的评估设备。
本发明基于相似度的评估设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于相似度的评估程序,所述基于相似度的评估程序被所述处理器执行时实现如上所述的基于相似度的评估方法的步骤。
其中,在所述处理器上运行的基于相似度的评估程序被执行时所实现的方法可参照本发明基于相似度的评估方法各个实施例,此处不再赘述。
本发明还提供一种可读存储介质。
本发明可读存储介质上存储有基于相似度的评估程序,所述基于相似度的评估程序被处理器执行时实现如上所述的基于相似度的评估方法的步骤。
其中,在所述处理器上运行的基于相似度的评估程序被执行时所实现的方法可参照本发明基于相似度的评估方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (16)

1.一种基于相似度的评估方法,其特征在于,所述方法包括如下步骤:
获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;
根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
2.如权利要求1所述的基于相似度的评估方法,其特征在于,所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并确认所述第三关系相似度是否大于预设相似度阈值;
在第三关系相似度大于预设相似度阈值时,获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。
3.如权利要求1所述的基于相似度的评估方法,其特征在于,所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到当前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。
4.如权利要求1至3中任一项所述的基于相似度的评估方法,其特征在于,所述获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、信息数据对应的权重值以及已评估第二对象的第三信息数据的步骤之后,所述方法还包括:
对第一信息数据、第二信息数据以及第三信息数据进行预处理;
获取预处理后的第一信息数据的第一关联信息数据、预处理后的第二信息数据的第二关联信息数据以及预处理后的第三信息数据的第三关联信息数据;
所述根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度的步骤包括:
根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
所述根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度的步骤包括:
根据第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度。
5.如权利要求4所述的基于相似度的评估方法,其特征在于,获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据的步骤之前,所述方法还包括:
获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值。
6.如权利要求4所述的基于相似度的评估方法,其特征在于,所述根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度的步骤包括:
确认第一关联信息数据与其对应的第三关联信数据是否相同,并根据确认结果获取赋予确认结果对应的结果值;
根据确认结果对应的结果值、关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
7.如权利要求4所述的基于相似度的评估方法,其特征在于,所述根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签的步骤包括:
获取第一关系相似度中大于预设关系相似度阈值的第一相似度、以及第二关系相似度中大于预设关系相似度阈值的第二相似度;
根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
8.一种基于相似度的评估装置,其特征在于,所述基于相似度的评估装置包括:
第一获取模块,用于获取待评估对象的第一信息数据、已评估第一对象的第二信息数据、关联信息数据对应的权重值以及已评估第二对象的第三信息数据;
第一计算模块,用于根据所述第一信息数据、第三信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
第二计算模块,用于根据第二信息数据、第三信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度;
第三计算模块,用于根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
9.如权利要求8所述的基于相似度的评估装置,其特征在于,所述第三计算模块还用于:
根据第一关系相似度、第二关系相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并确认所述第三关系相似度是否大于预设相似度阈值;
在第三关系相似度大于预设相似度阈值时,获取已评估第一对象的状态标签,并将已评估第一对象的状态标签作为待评估对象的评估标签。
10.如权利要求8所述的基于相似度的评估装置,其特征在于,所述第三计算模块还用于:
将第一关系相似度、第二关系相似度作为SimRank算法迭代计算的初值进行迭代计算,直到当前迭代的计算结果,与当前迭代之前的前一步迭代的计算结果之间的收敛误差值小于预设误差阈值时,停止迭代计算,并将当前迭代的计算结果,作为待评估对象与已评估第一对象的第三关系相似度,根据所述第三关系相似度确认待评估对象的评估标签。
11.如权利要求8-10中任一项所述的基于相似度的评估装置,其特征在于,所述基于相似度的评估装置还包括
预处理模块,用于对第一信息数据、第二信息数据以及第三信息数据进行预处理;
第二获取模块,用于获取预处理后的第一信息数据的第一关联信息数据、预处理后的第二信息数据的第二关联信息数据以及预处理后的第三信息数据的第三关联信息数据;
所述第一计算模块还用于:根据所述第一关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度;
所述第二计算模块还用于:根据第二关联信息数据、第三关联信息数据以及关联信息数据对应的权重值,计算已评估第一对象与已评估第二对象的第二关系相似度。
12.如权利要求11所述的基于相似度的评估装置,其特征在于,所述基于相似度的评估装置还包括:
赋值模块:用于获取评估的关联信息数据,并根据关联强弱程度对所述关联信息数据分别赋予对应的权重值。
13.如权利要求11所述的基于相似度的评估装置,其特征在于,所述第一计算模块还用于:
确认第一关联信息数据与其对应的第三关联信数据是否相同,并根据确认结果获取赋予确认结果对应的结果值;
根据确认结果对应的结果值、关联信息对应的权重值,计算待评估对象与已评估第二对象的第一关系相似度。
14.如权利要求11所述的基于相似度的评估装置,其特征在于,所述第三计算模块还用于:
获取第一关系相似度中大于预设关系相似度阈值的第一相似度、以及第二关系相似度中大于预设关系相似度阈值的第二相似度;
根据第一相似度、以及第二相似度使用SimRank算法,计算待评估对象与已评估第一对象的第三关系相似度,并根据所述第三关系相似度确认待评估对象的评估标签。
15.一种基于相似度的评估设备,其特征在于,所述评估设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于相似度的评估程序,所述基于相似度的评估程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于相似度的评估方法的步骤。
16.一种可读存储介质,其特征在于,所述可读存储介质上存储有基于相似度的评估程序,所述基于相似度的评估程序被处理器执行时实现如权利要求1至7中任一项所述的基于相似度的评估方法的步骤。
CN201910559145.8A 2019-06-21 2019-06-21 基于相似度的评估方法、装置、设备及可读存储介质 Active CN110335139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910559145.8A CN110335139B (zh) 2019-06-21 2019-06-21 基于相似度的评估方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910559145.8A CN110335139B (zh) 2019-06-21 2019-06-21 基于相似度的评估方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110335139A true CN110335139A (zh) 2019-10-15
CN110335139B CN110335139B (zh) 2022-10-14

Family

ID=68142746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910559145.8A Active CN110335139B (zh) 2019-06-21 2019-06-21 基于相似度的评估方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110335139B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311276A (zh) * 2020-02-07 2020-06-19 北京明略软件系统有限公司 一种异常用户团体的识别方法、识别装置及可读存储介质
CN112269937A (zh) * 2020-11-16 2021-01-26 加和(北京)信息科技有限公司 一种计算用户相似度的方法、系统及装置
CN112907869A (zh) * 2021-03-17 2021-06-04 四川通信科研规划设计有限责任公司 基于多种传感技术的入侵检测系统
CN113129126A (zh) * 2021-04-15 2021-07-16 算话智能科技有限公司 一种业务数据处理方法及装置
CN113256144A (zh) * 2021-06-07 2021-08-13 联仁健康医疗大数据科技股份有限公司 目标对象确定方法、装置、电子设备及存储介质
CN113593219A (zh) * 2021-06-30 2021-11-02 北京百度网讯科技有限公司 车流的统计方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301726A (ja) * 1993-04-09 1994-10-28 Omron Corp 類似度演算装置および類似度演算方法ならびに類似度演算用尺度の評価装置
WO2012071543A2 (en) * 2010-11-24 2012-05-31 Decide, Inc. Price and model prediction system and method
US20170374093A1 (en) * 2016-06-28 2017-12-28 Microsoft Technology Licensing, Llc Robust Matching for Identity Screening
CN107886425A (zh) * 2017-10-25 2018-04-06 上海壹账通金融科技有限公司 信贷评估方法、装置、设备及计算机可读存储介质
CN108171529A (zh) * 2017-12-04 2018-06-15 昆明理工大学 一种地址相似度评估方法
US20180336580A1 (en) * 2017-05-17 2018-11-22 Honda Motor Co., Ltd. Evaluation device, evaluation method, and storage medium
CN109816519A (zh) * 2019-01-25 2019-05-28 宜人恒业科技发展(北京)有限公司 一种欺诈团伙识别方法、装置及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301726A (ja) * 1993-04-09 1994-10-28 Omron Corp 類似度演算装置および類似度演算方法ならびに類似度演算用尺度の評価装置
WO2012071543A2 (en) * 2010-11-24 2012-05-31 Decide, Inc. Price and model prediction system and method
US20170374093A1 (en) * 2016-06-28 2017-12-28 Microsoft Technology Licensing, Llc Robust Matching for Identity Screening
US20180336580A1 (en) * 2017-05-17 2018-11-22 Honda Motor Co., Ltd. Evaluation device, evaluation method, and storage medium
CN107886425A (zh) * 2017-10-25 2018-04-06 上海壹账通金融科技有限公司 信贷评估方法、装置、设备及计算机可读存储介质
CN108171529A (zh) * 2017-12-04 2018-06-15 昆明理工大学 一种地址相似度评估方法
CN109816519A (zh) * 2019-01-25 2019-05-28 宜人恒业科技发展(北京)有限公司 一种欺诈团伙识别方法、装置及设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311276A (zh) * 2020-02-07 2020-06-19 北京明略软件系统有限公司 一种异常用户团体的识别方法、识别装置及可读存储介质
CN111311276B (zh) * 2020-02-07 2023-08-29 北京明略软件系统有限公司 一种异常用户团体的识别方法、识别装置及可读存储介质
CN112269937A (zh) * 2020-11-16 2021-01-26 加和(北京)信息科技有限公司 一种计算用户相似度的方法、系统及装置
CN112907869A (zh) * 2021-03-17 2021-06-04 四川通信科研规划设计有限责任公司 基于多种传感技术的入侵检测系统
CN112907869B (zh) * 2021-03-17 2023-03-21 四川通信科研规划设计有限责任公司 基于多种传感技术的入侵检测系统
CN113129126A (zh) * 2021-04-15 2021-07-16 算话智能科技有限公司 一种业务数据处理方法及装置
CN113256144A (zh) * 2021-06-07 2021-08-13 联仁健康医疗大数据科技股份有限公司 目标对象确定方法、装置、电子设备及存储介质
CN113593219A (zh) * 2021-06-30 2021-11-02 北京百度网讯科技有限公司 车流的统计方法、装置、电子设备及存储介质
CN113593219B (zh) * 2021-06-30 2023-02-28 北京百度网讯科技有限公司 车流的统计方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110335139B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
CN110335139A (zh) 基于相似度的评估方法、装置、设备及可读存储介质
US11276068B2 (en) Fraudulent transaction identification method and apparatus, server, and storage medium
US20200143378A1 (en) Method and device for outputting risk information and constructing risk information
CN109189867A (zh) 基于公司知识图谱的关系发现方法、装置及存储介质
CN107872772B (zh) 诈骗短信的检测方法及装置
CN103745235B (zh) 人脸识别方法、装置及终端设备
CN109920174B (zh) 图书借阅方法、装置、电子设备及存储介质
CN109947793A (zh) 伴随关系的分析方法、装置和存储介质
CN107909466A (zh) 客户关系网络展示方法、装置、设备及可读存储介质
CN110264093B (zh) 信用模型的建立方法、装置、设备及可读存储介质
CN111652087A (zh) 验车方法、装置、电子设备和存储介质
CN110222780A (zh) 物体检测方法、装置、设备和存储介质
CN110110045A (zh) 一种检索相似文本的方法、装置以及存储介质
CN110135889A (zh) 智能推荐书单的方法、服务器及存储介质
CN109194689A (zh) 异常行为识别方法、装置、服务器及存储介质
CN106803092B (zh) 一种标准问题数据的确定方法及装置
CN110059212A (zh) 图像检索方法、装置、设备及计算机可读存储介质
CN112912889B (zh) 图像模板的更新方法、设备及存储介质
CN113886721B (zh) 个性化兴趣点推荐方法、装置、计算机设备及存储介质
WO2018227171A1 (en) Method and apparatus for security verification based on biometric feature
CN109816543A (zh) 一种图像查找方法及装置
CN110197375A (zh) 一种相似用户识别方法、装置、相似用户识别设备和介质
CN111339973A (zh) 一种对象识别方法、装置、设备及存储介质
US20220374955A1 (en) Auto-generation of online listing information
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant