CN117035141A - 对象类型确定方法、装置、计算机设备和存储介质 - Google Patents
对象类型确定方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117035141A CN117035141A CN202210646046.5A CN202210646046A CN117035141A CN 117035141 A CN117035141 A CN 117035141A CN 202210646046 A CN202210646046 A CN 202210646046A CN 117035141 A CN117035141 A CN 117035141A
- Authority
- CN
- China
- Prior art keywords
- resource storage
- index
- candidate resource
- determining
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 728
- 238000000034 method Methods 0.000 title claims abstract description 81
- 230000002776 aggregation Effects 0.000 claims abstract description 232
- 238000004220 aggregation Methods 0.000 claims abstract description 232
- 238000012512 characterization method Methods 0.000 claims abstract description 172
- 238000009826 distribution Methods 0.000 claims abstract description 100
- 238000012360 testing method Methods 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000012216 screening Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 10
- 238000005516 engineering process Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 13
- 230000002159 abnormal effect Effects 0.000 description 11
- 230000005856 abnormality Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000004900 laundering Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种对象类型确定方法、装置、计算机设备和存储介质。涉及到支付金融和人工智能领域,包括:从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象;对于每个所述候选资源存储对象,确定所述候选资源存储对象对应的聚集度表征值;所述特征相近存储对象是所述参考资源存储对象中与所述候选资源存储对象的对象特征相近的参考资源存储对象;基于所述候选资源存储对象对应的聚集度表征值,从所述多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象;基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。采用本方法能够提高预测效率。
Description
技术领域
本申请涉及支付金融领域,特别是涉及一种对象类型确定方法、装置、计算机设备和存储介质。
背景技术
随着计算机和互联网技术的发展,各金融机构的业务范围也越来越广泛,支付金融领域中,不断的出现不合法的异常交易,例如为了实现洗钱的目的而进行的异常交易。
传统技术中,可以通过正常的交易数据以及异常的交易数据对神经网络模型进行训练,得到具有预测异常交易功能的神经网络模型,利用该训练好的神经网络模型预测异常交易。
然而,由于金融机构中日常的交易量是不断增长的,交易数据量较大,通过神经网络模型进行异常交易预测所需要的计算量较大,导致预测效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高预测效率的对象类型确定方法、装置、计算机设备和计算机可读存储介质。
一方面,本申请提供了一种对象类型确定方法。所述方法包括:从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象;对于每个所述候选资源存储对象,确定所述候选资源存储对象对应的聚集度表征值;所述聚集度表征值,用于表征在按照对象特征进行分布的情况下,所述候选资源存储对象与特征相近存储对象之间的分布聚集程度;所述特征相近存储对象是所述参考资源存储对象中与所述候选资源存储对象的对象特征相近的参考资源存储对象;基于所述候选资源存储对象对应的聚集度表征值,从所述多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象;基于所述满足聚集分布条件的候选资源存储对象所属的对象类型,预测所述目标资源存储对象所属的对象类型。
另一方面,本申请还提供了一种对象类型确定装置。所述装置包括:第一存储对象确定模块,用于从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象;聚集度表征值确定模块,用于对于每个所述候选资源存储对象,确定所述候选资源存储对象对应的聚集度表征值;所述聚集度表征值,用于表征在按照对象特征进行分布的情况下,所述候选资源存储对象与特征相近存储对象之间的分布聚集程度;所述特征相近存储对象是所述参考资源存储对象中与所述候选资源存储对象的对象特征相近的参考资源存储对象;第二存储对象确定模块,用于基于所述候选资源存储对象对应的聚集度表征值,从所述多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象;对象类型预测模块,用于基于所述满足聚集分布条件的候选资源存储对象所属的对象类型,预测所述目标资源存储对象所属的对象类型。
在一些实施例中,所述多个候选资源存储对象为目标数量的候选资源存储对象,所述对象类型确定装置还包括目标数量确定模块,所述目标数量确定模块,用于从所述多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象;确定所述当前数量的参考资源存储对象分别对应的聚集度表征值,从所述当前数量的参考资源存储对象中确定聚集度表征值满足聚集分布条件的参考资源存储对象;基于所述满足聚集分布条件的参考资源存储对象所属的对象类型,得到所述测试资源存储对象对应的预测对象类型;基于所述测试资源存储对象的预测对象类型确定预测准确度,在所述预测准确度符合准确度要求的情况下,将当前数量确定为目标数量。
在一些实施例中,所述对象类型确定装置,还用于在所述预测准确度不符合准确度要求的情况下,更新当前数量;返回从所述多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象的步骤,直到预测准确度符合准确度要求为止。
在一些实施例中,所述第二存储对象确定模块,还用于获取对象类型对应的聚集度表征统计值;所述对象类型对应的聚集度表征统计值,是对属于所述对象类型的参考资源存储对象的聚集度表征值进行统计得到的;从所述多个候选资源存储对象中,确定聚集度表征值小于所属的对象类型的聚集度表征统计值的候选资源存储对象,得到满足聚集分布条件的候选资源存储对象。
在一些实施例中,所述对象类型确定装置还包括聚集度表征统计值确定模块,所述聚集度表征统计值确定模块,用于获取所述多个已知对象类型的参考资源存储对象中,每个参考资源存储对象分别对应的聚集度表征值;对所述多个已知对象类型的参考资源存储对象中,同一对象类型的参考资源存储对象的聚集度表征值进行统计,得到每种对象类型分别对应的聚集度表征统计值。
在一些实施例中,所述聚集度表征值确定模块,还用于对于每个所述参考资源存储对象,确定所述候选资源存储对象与所述参考资源存储对象之间的特征差值;基于特征差值,从所述多个参考资源存储对象中确定所述候选资源存储对象的特征相近存储对象;基于所述候选资源存储对象的特征相近存储对象的对象特征,确定所述候选资源存储对象对应的聚集度表征值。
在一些实施例中,所述对象特征包括多个对象指标分别对应的指标值,所述候选资源存储对象的对象特征为第一对象特征,所述特征相近存储对象的对象特征为第二对象特征;所述聚集度表征值确定模块,还用于针对每个对象指标,对所述对象指标在第一对象特征中的指标值与在每个第二对象特征中的特征值之间的差异进行统计,得到所述对象指标对应的差异统计值;对各所述对象指标分别对应的差异统计值进行统计,得到所述候选资源存储对象对应的聚集度表征值。
在一些实施例中,所述聚集度表征值确定模块,还用于获取各所述对象指标分别对应的指标权重;所述指标权重是基于各所述参考资源存储对象的对象特征确定的;利用各所述对象指标分别对应的指标权重,对各所述对象指标分别对应的差异统计值进行加权计算,得到所述候选资源存储对象对应的聚集度表征值。
在一些实施例中,所述对象类型确定装置还包括权重确定模块,所述权重确定模块,用于确定各所述参考资源存储对象分别对应的参考对象特征;对各所述参考对象特征中所述对象指标的指标值进行统计,得到所述对象指标的指标统计值;基于所述对象指标的指标统计值得到所述对象指标的指标权重。
在一些实施例中,所述权重确定模块,还用于对各个所述对象指标分别对应的指标统计值进行统计,得到目标统计值;基于所述对象指标的指标统计值以及所述目标统计值,确定所述对象指标的指标权重。
在一些实施例中,所述第一存储对象确定模块,还用于对于每个参考资源存储对象,确定所述目标资源存储对象与所述参考资源存储对象之间的特征差值;基于各所述特征差值,从所述多个已知对象类型的参考资源存储对象中筛选得到所述多个候选资源存储对象。
另一方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述对象类型确定方法中的步骤。
另一方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述对象类型确定方法中的步骤。
另一方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述对象类型确定方法中的步骤。
上述对象类型确定方法、装置、计算机设备、存储介质和计算机程序产品,从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象,对于每个候选资源存储对象,确定候选资源存储对象对应的聚集度表征值,聚集度表征值,用于表征在按照对象特征进行分布的情况下,候选资源存储对象与特征相近存储对象之间的分布聚集程度,特征相近存储对象是参考资源存储对象中与候选资源存储对象的对象特征相近的参考资源存储对象,基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象,基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。从而通过满足聚集分布条件的候选资源存储对象可以快速的预测目标资源存储对象所属的对象类型,所需要的计算量小,提高了预测效率。
附图说明
图1为一些实施例中对象类型确定方法的应用环境图;
图2为一些实施例中对象类型确定方法的流程示意图;
图3为一些实施例中不同对象类型的资源存储对象的分布图;
图4为一些实施例中对象类型确定方法的流程示意图;
图5为一些实施例中对象类型确定模型的原理图;
图6为一些实施例中对象类型确定方法的原理图;
图7为一些实施例中对象类型确定方法的应用环境图;
图8为一些实施例中对象类型确定装置的结构框图;
图9为一些实施例中计算机设备的内部结构图;
图10为一些实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的对象类型确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。
具体地,服务器104可以从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象,对于每个候选资源存储对象,确定候选资源存储对象对应的聚集度表征值,聚集度表征值,用于表征在按照对象特征进行分布的情况下,候选资源存储对象与特征相近存储对象之间的分布聚集程度,特征相近存储对象是参考资源存储对象中与候选资源存储对象的对象特征相近的参考资源存储对象,基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象,基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。服务器104可以将预测出的目标资源存储对象所属的对象类型进行存储,还可以将预测出的目标资源存储对象所属的对象类型发送给终端102。
其中,终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备、便携式可穿戴设备、智能语音交互设备、智能家电、车载终端和飞行器,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本申请实施例提供的对象类型确定方法可以涉及区块链技术领域,例如,服务器104可以为区块链中的某个节点,服务器104可以将预测出的目标资源存储对象所属的对象类型存储到区块链中。
其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括基础服务以及智能合约等处理模块。基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能。
平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
本申请实施例提供的对象类型确定方法可以涉及人工智能领域。例如,服务器104可以利用神经网络模型,从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象。
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
在一些实施例中,如图2所示,提供了一种对象类型确定方法,该方法可以由终端或服务器执行,还可以由终端和服务器共同执行,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤202,从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象。
其中,资源是指存在于电子账户中的能够进行流通的资源,例如能够通过账户在互联网上进行流通的资源。资源包括但不限于是货币、礼品券、优惠券或电子卡券等。电子账户包括但不限于是银行账户或互联网支付账户。电子账户例如可以是对公账户,对公账户是指企业银行结算账户,是为企业法人、非企业法人、个体工商户办理结算业务的账户。当然,电子账户还可以是对公账户之外的其他类型的账户。对公账户还可以称为对公交易账户或对公支付账户,对公支付账户例如可以是对公支付商户。
资源存储对象是指用于存储资源的账号,资源存储对象中的资源可以被转出,资源也可以被转入到资源存储对象中。对象类型是指资源存储对象所属的类型,对象类型用于表征资源存储对象是否存在异常,例如是否存在风险,对象类型与异常等级一一对应,故预测对象类型可以理解为预测异常等级,已知对象类型可以理解为已知异常等级,异常等级用于表征资源存储对象的异常程度,不同的异常等级所表征的异常程度不同。对象类型可以为至少两种,包括但不限于是洗钱、疑似洗钱或排除风险中的至少两种。洗钱的异常等级高于疑似洗钱,疑似洗钱的异常等级高于排除风险。异常等级越高,则异常程度越大。异常等级可以划分为“高”、“偏高”、“中”、“偏低”和“低”。
参考资源存储对象为已知所属对象类型的资源存储对象。参考资源存储对象为多个,例如为5000千个。该多个已知对象类型的参考资源存储对象,可以用于预测未知对象类型的资源存储对象所属的对象类型。该多个已知对象类型的参考资源存储对象中,包括不同的对象类型分别对应的参考资源存储对象,例如,该多个已知对象类型的参考资源存储对象为5000个资源存储对象,其中,2500个疑似洗钱的资源存储对象,2500个排除风险的资源存储对象。目标资源存储对象是对象类型未知的资源存储对象,即需要预测所属对象类型的资源存储对象。每个资源存储对象具有对象特征,对象特征代表资源存储对象的特征。对象特征可以反映资源存储对象的拥有方的特征或资源交易的特征等。
候选资源存储对象,是指该多个参考资源存储对象中与目标资源存储对象在对象特征上相近的参考资源存储对象。两个资源存储对象的对象特征之间的差异越小,则这两个资源存储对象在对象特征上越相近。候选资源存储对象为多个,例如为10个。
具体地,服务器可以获取目标资源存储对象的对象特征,得到目标对象特征,获取参考资源存储对象的对象特征,得到参考对象特征,计算目标对象特征与参考对象特征之间的特征差值,基于特征差值从该多个参考资源存储对象中,确定候选资源存储对象。其中,特征差值表征对象特征之间的差异,特征差值越大,则表征对象特征之间的差异越大,特征差值越小,则表征对象特征之间的差异越小。
在一些实施例中,候选资源存储对象的数量为目标数量。服务器可以按照特征差值从小到大的顺序,对各参考资源存储对象进行排列,得到第一参考资源存储对象序列,将第一参考资源存储对象序列中排列在前的目标数量的参考资源存储对象,确定为该目标数量的候选资源存储对象。例如,目标数量为k,则将第一参考资源存储对象序列中前k个参考资源存储对象,确定为各候选资源存储对象。其中,参考对象特征与目标对象特征之间的特征差值越小,则参考资源存储对象在第一参考资源存储对象序列中的排序越靠前。或者,服务器可以按照特征差值从小到大的顺序,对各特征差值进行排列,得到特征差值序列,特征差值序列例如为D={d1,d2,d3,…dN},其中,N为参考资源存储对象的数量,di为第i个参考资源存储对象与目标资源存储对象之间的特征差值,1≤i≤N,服务器可以将特征差值序列中前k个特征差值所对应的参考资源存储对象,确定为各候选资源存储对象,各候选资源存储对象组成的集合D*例如为D*={D1,D2,D3,…Dk}。D1,D2,D3,…Dk代表k个候选资源存储对象。
在一些实施例中,服务器可以获取资源存储对象的相关数据,对资源存储对象的相关数据进行编码,得到资源存储对象的对象特征。其中,资源存储对象的相关数据包括但不限于是拥有方的数据、交易数据或行为数据中的至少一种,拥有方的数据例如为身份数据。交易数据包括但不限于是出款或入款的流水记录或聚合加工字段中的至少一种。行为数据可以为异常交易行为指标,包括快进快出比例、夜间交易比例、男性占比比例、跨境收款比例或高管出款比例中的至少一种,还可以根据需要自定义。资源存储对象的相关数据可以为预设时间段内的数据,预设时间段可以根据需要设置,为例为最近3个月,故资源存储对象的相关数据可以为最近3个月的数据。服务器在获取到资源存储对象的相关数据的情况下,可以对资源存储对象的相关数据进行相应的清洗与预处理工作,清洗与预处理工作包括数据的去重、剔除空值或剔除异常值中的至少一种,在清洗与预处理工作完成后,对处理后的相关数据进行编码得到对象特征。
在一些实施例中,资源存储对象的相关数据包括至少一种对象指标分别对应的数据,例如上述的拥有方的数据、交易数据或行为数据分别为至少一种的对象指标的数据。对象指标包括但不限于是客户类型、外部来源级别或异常等级中的至少一种。客户类型可以划分为“自然人”和“非自然人”,外部来源级别可以划分为“监管”、“支付清算协会”和“投诉”,异常等级可以划分为“高”、“偏高”、“中”、“偏低”和“低”。不同的对象指标所对应的数据类型可以相同也可以不同。数据类型划分为数值型和非数值型。数值型分为连续型和离散型,非数值型分为类别型和顺序型。为了提升数据的可用性,服务器还可以针对数据的类型进行预处理。服务器可以根据数据的类型对数据进行编码。若对象指标对应的数据类型为非数值型,则服务器可以采用one-hot encoding(独热编码)方法进行编码,得到对象指标的指标值。例如,对象指标“客户类型”所对应的数据为非数值型,故可以采用独热编码对“客户类型”的数据进行编码,得到对象指标“客户类型”的指标值。得到各个对象指标分别对应的指标值后,服务器可以将一个或多个对象指标的指标值组成对象特征,即对象特征中包括一个或多个对象指标的指标值,多个是指至少两个。需要说明的是,本实施例提供的确定存储对象的方法,可以用于确定本申请中的各个存储资源对象分别对应的对象特征,例如,用于确定参考资源存储对象以及目标资源存储对象等资源存储对象的对象特征。例如,若对象指标对应的数据类型为数值型,则服务器可以对该数据型该对象指标所对应的数据进行归一化处理,将归一化后的数据作为该对象指标的指标值。例如,可以通过公式(1)进行归一化。
其中,x*是归一化后的数据,xi是归一化前的数据,即,xmin为各参考资源存储对象的相关数据中对象指标(数据xi对应的对象指标)的最小值,xmax为各参考资源存储对象的相关数据中对象指标(数据xi对应的对象指标)的最大值。
在一些实施例中,对象特征包括多个对象指标分别对应的指标值,各对象指标对应的数据类型为数值型。服务器可以基于各对象指标分别对应的指标值进行差异计算,得到两个对象特征之间的特征差值,以计算目标对象特征与参考对象特征之间的特征差值为例,服务器可以利用欧式距离公式,计算目标对象特征与参考对象特征之间的特征差值。例如可以采用公式(2)中的欧式距离公式计算特征差值,故特征差值也可以称为特征距离。
其中,X代表目标对象特征,Y代表参考对象特征,i表示第i个对象指标,n表示总共有n种对象指标,xi代表目标对象特征中第i个对象指标的指标值,yi代表参考对象指标中第i个对象指标的指标值。需要说明的是,本实施例提供的计算特征差值的方法,可以用于计算任意两个对象特征之间的特征差值。
在一些实施例中,对象特征包括多个对象指标分别对应的指标值,该多个对象指标中包括数值型的对象指标以及非数值型的对象指标。服务器可以基于各对象指标分别对应的指标值进行差异计算,得到两个对象特征之间的特征差值,以计算目标对象特征与参考对象特征之间的特征差值为例,对于数值型的对象指标(记作第一对象指标),服务器可以从目标对象特征中获取第一对象指标的指标值,得到第一指标值,从参考对象特征中获取第一对象指标的指标值,得到第二指标值,计算第一指标值与第二指标值之间的差值,得到第一对象指标对应的指标差值,对于非数值型的对象指标(记作第二对象指标),服务器可以从目标对象特征中获取第二对象指标的指标值,得到第三指标值,从参考对象特征中获取第二对象指标的指标值,得到第四指标值,将第三指标值与第四指标值进行对比,若第三指标值与第四指标值相同,则确定第二对象指标的指标差值为0,若第三指标值与第四指标值不相同,则确定第二对象指标的指标差值为1。指标差值表征指标值之间的差异。在得到每种对象指标分别对应的指标差值后,服务器可以利用公式(3)计算得到目标对象特征与参考对象特征之间的特征差值。
其中,n1代表n种对象指标中的数值型的对象指标的数量,n2代表n种对象指标中的非数值型的对象指标的数量。d(xv,yv)表示n1种数值型的对象指标中的第v个数值型的对象指标的指标差值,1≤v≤n1,Du表示n2种非数值型的对象指标中第u个非数值型的对象指标的指标差值。需要说明的是,本实施例提供的计算特征差值的方法,可以用于计算任意两个对象特征之间的特征差值。
步骤204,对于每个候选资源存储对象,确定候选资源存储对象对应的聚集度表征值;聚集度表征值,用于表征在按照对象特征进行分布的情况下,候选资源存储对象与特征相近存储对象之间的分布聚集程度;特征相近存储对象是参考资源存储对象中与候选资源存储对象的对象特征相近的参考资源存储对象。
其中,每个候选资源存储对象具有预设数量的特征相近存储对象,预设数量可以根据该多个参考资源存储对象中,对象类型对应的参考资源存储对象的数量确定。例如,对象类型有2种,分别为危险型和安全型,则可以根据危险型的参考资源存储对象的占比确定预设数量,例如若该多个参考资源存储对象中,危险型的参考资源存储对象的数量与安全型的参考资源存储对象的数量之间的比值为1:3,则预设数量可以设置为3,若比值为1/10000,则预设数量可以设置为10000。
候选资源存储对象的特征相近存储对象,是指该多个参考资源存储对象中与该候选资源存储对象的对象特征相近的参考资源存储对象。两个对象特征之间的特征差值越小,则两个对象特征越相近。候选资源存储对象的特征相近存储对象,是从该多个参考资源存储对象中选取的。
候选资源存储对象对应的聚集度表征值,用于表征在按照对象特征进行分布的情况下,候选资源存储对象与其对应的特征相近存储对象之间的分布聚集程度,例如,候选资源存储对象对应的聚集度表征值,用于表征在该多个参考资源存储对象对应的分布图中,候选资源存储对象与周围的参考资源存储对象之间的分布聚集程度,其中,周围的参考资源存储对象,是指候选资源存储对象的特征相近存储对象。分布图是指,按照参考对象特征,对该多个参考资源存储对象进行分布所得到的图。两个参考对象特征之间越相近,则对应的两个参考资源存储对象在分布图中的距离越小。聚集度表征值与分布聚集程度成负相关关系,聚集度表征值越小,则分布聚集程度越大。负相关关系指的是:在其他条件不变的情况下,两个变量变动方向相反,一个变量由大到小变化时,另一个变量由小到大变化。候选资源存储对象对应的分布聚集程度越大,则表示候选资源存储对象与各特征相近存储对象在分布图中的分布越集中,候选资源存储对象对应的分布聚集程度越小,则表示候选资源存储对象与各特征相近存储对象在分布图中的分布越分散。如图3所示,展示了一种分布图。
具体地,对象特征包括多个对象指标分别对应的指标值,针对每个候选资源存储对象,服务器可以获取该候选资源存储对象的对象特征,得到第一对象特征,获取对应的特征相近存储对象的对象特征,得到第二对象特征,针对每个对象指标,将该对象指标在第一对象特征中的指标值与该对象指标在各第二对象特征中的指标值进行统计,得到该候选资源存储对象的聚集度表征值。确定聚集度表征值的过程中,并不区分对象类型,即用于确定聚集度表征值的各个特征相近存储对象可以包括属于不同对象类型的参考资源存储对象。
在一些实施例中,针对每个候选资源存储对象,服务器可以获取参考资源存储对象的对象特征,得到参考对象特征,获取候选资源存储对象的对象特征,得到第一对象特征,计算第一对象特征分别与每个参考对象特征之间的特征差值,按照特征差值从小到大的顺序,对各参考资源存储对象进行排列,得到第二参考资源存储对象序列,将第二参考资源存储对象序列中排列在前的预设数量的参考资源存储对象,确定为该候选资源存储对象的各特征相近存储对象。其中,参考对象特征与第一对象特征之间的特征差值越小,则参考资源存储对象在第二参考资源存储对象序列中的排序越靠前。
步骤206,基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象。
其中,聚集分布条件包括聚集度表征值小于聚集度表征统计值、聚集度表征值最小等中的至少一种。不同的对象类型分别对应有聚集度表征统计值。对象类型对应的聚集度表征统计值,是对属于对象类型的参考资源存储对象的聚集度表征值进行统计得到的。
具体地,服务器可以基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中,过滤掉不满足聚集分布条件的候选资源存储对象,剩余的候选资源存储对象为满足聚集分布条件的候选资源存储对象。例如,候选资源存储对象为k个,其中,存在2个候选资源存储对象不满足聚集分布条件,则将这2个不满足聚集分布条件的候选资源存储对象,从这k个候选资源存储对象种过滤掉,得到k-2满足聚集分布条件的候选资源存储对象。
在一些实施例中,服务器可以从各候选资源存储对象中,获取聚集度表征值最小的候选资源存储对象,得到满足聚集分布条件的候选资源存储对象。
步骤208,基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。
具体地,在满足聚集分布条件的候选资源存储对象的数量为一个的情况下,服务器可以将该候选资源存储对象所属的对象类型,确定为该目标资源存储对象所属的对象类型。在满足聚集分布条件的候选资源存储对象的数量多于一个的情况下,服务器可以统计各个候选资源存储对象中同一对象类型的候选资源存储对象的数量,根据统计出的不同对象类型分别对应的候选资源存储对象的数量,确定目标资源存储对象所属的对象类型,例如,将最多的数量所对应的对象类型确定为目标资源存储对象所属的对象类型。例如,候选资源存储对象为10个,其中6个为危险型,4个为正常型,由于最多的数量未6,故可以将危险型确定为目标资源存储对象所属的对象类型。
在一些实施例中,在满足聚集分布条件的候选资源存储对象的数量多于一个的情况下,服务器可以获取每个满足聚集分布条件的候选资源存储对象的对象特征,得到条件满足对象特征,获取目标资源存储对象的对象特征,得到目标对象特征,计算条件满足对象特征与目标对象特征之间的特征差值,基于特征差值确定目标资源存储对象所属的对象类型。例如,可以将最小的特征差值对应的该满足分布条件的候选资源存储对象的对象类型,确定为目标资源存储对象所属的对象类型。
在一些实施例中,满足聚集分布条件的候选资源存储对象的数量多于一个,条件满足对象特征与目标对象特征之间的特征差值为第一特征差值,服务器可以对各个第一特征差值进行归一化处理,得到归一化特征差值,基于归一化特征差值对各满足聚集分布条件的候选资源存储对象,确定各满足聚集分布条件的候选资源存储对象分别对应的分数,分数与归一化特征差值成负相关关系,将分数最大的候选资源存储对象所属的对象类型,确定为目标资源存储对象所属的对象类型。具体地,服务器可以利用公式(4)计算的得到分数。
其中,cpi为第i个满足聚集分布条件的候选资源存储对象所对应的分数,dr为第r个满足聚集分布条件的候选资源存储对象所对应的第一特征差值,di为第i个满足聚集分布条件的候选资源存储对象所对应的第一特征差值。各个cpi组成的集合为CP={cp1,cp2,cp3,…,cpk},统计Max(CP),即计算CP中的最大的分数,将Max(CP)所对应的候选资源存储对象所属的对象类型,确定为目标资源存储对象所属的对象类型。
上述对象类型确定方法中,从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象,对于每个候选资源存储对象,确定候选资源存储对象对应的聚集度表征值,聚集度表征值,用于表征在按照对象特征进行分布的情况下,候选资源存储对象与特征相近存储对象之间的分布聚集程度,特征相近存储对象是参考资源存储对象中与候选资源存储对象的对象特征相近的参考资源存储对象,基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象,基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。从而通过满足聚集分布条件的候选资源存储对象可以快速的预测目标资源存储对象所属的对象类型,所需要的计算量小,提高了预测效率。另外,基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型,可以减少不满足聚集分布条件的候选资源存储对象所属的对象类型引起的错误的预测,从而提高了预测准确度。
在一些实施例中,多个候选资源存储对象为目标数量的候选资源存储对象,确定目标数量的步骤包括:从多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象;确定当前数量的参考资源存储对象分别对应的聚集度表征值,从当前数量的参考资源存储对象中确定聚集度表征值满足聚集分布条件的参考资源存储对象;基于满足聚集分布条件的参考资源存储对象所属的对象类型,得到测试资源存储对象对应的预测对象类型;基于测试资源存储对象的预测对象类型确定预测准确度,在预测准确度符合准确度要求的情况下,将当前数量确定为目标数量。
其中,测试资源存储对象所属的对象类型是已知的。测试资源存储对象与参考资源存储对象为不同的资源存储对象。测试资源存储对象的数量为多个,例如100个。该多个测试资源存储对象中包括分别属于各种对象类型的测试资源存储对象。以对象类型为2种为例,则包括分别属于这2种对象类型的测试资源存储对象。
当前数量是循环的迭代更新的一个数值,初始的当前数量可以随机设置或根据需要设置。确定参考资源存储对象的聚集度表征值的方法参考确定候选资源存储对象的聚集度表征值的方法,确定聚集度表征值满足聚集分布条件的参考资源存储对象的方法,可以参考上述的确定满足聚集分布条件的候选资源存储对象的方法,确定测试资源存储对象对应的预测对象类型的方法,可以参考上述的确定目标资源存储对象所属的对象类型的方法,这里不再赘述。准确度要求包括预测准确度达到准确度阈值,准确度阈值可以根据需要设置。
具体地,对于某种对象类型,服务器可以获取多个属于该对象类型的资源存储对象,对获取的该多个资源存储对象进行划分,得到属于该对象类型的参考资源存储对象以及属于该对象类型的测试资源存储对象。例如,可以将该多个资源存储对象中10%的资源存储对象确定为测试资源存储对象,90%的资源存储对象确定为参考资源存储对象。通过这样的方式,可以得到分别属于每种对象类型的参考资源存储对象、以及分别属于每种对象类型的测试资源存储对象。
在一些实施例中,服务器在确定了分别属于每种对象类型的参考资源存储对象、以及分别属于每种对象类型的测试资源存储对象的情况下,即在确定了每种对象类型分别对应的参考资源存储对象、以及每种对象类型的测试资源存储对象的情况下,对于每个测试资源存储对象,服务器可以获取每个参考资源存储对象的对象特征,得到各参考对象特征,获取测试资源存储对象的对象特征,得到测试对象特征,分别计算每个参考对象特征与测试对象特征之间的特征差值,按照特征差值从小到大的顺序,对各参考资源存储对象进行排列,得到第三参考资源存储对象序列,将第三参考资源存储对象序列中排列在前的当前数量的参考资源存储对象,确定为与该测试资源存储对象的对象特征相近的当前数量的参考资源存储对象。其中,参考对象特征与测试对象特征之间的特征差值越小,则参考资源存储对象在第三参考资源存储对象序列中的排序越靠前。
在一些实施例中,对于每个测试资源存储对象,服务器可以获取测试资源存储对象的真实对象类型,将测试资源存储对象的预测对象类型与真实对象类型进行对比,根据对比结果确定预测准确度,利用可以统计各个测试资源存储对象中,预测对象类型与真实对象类型一致的测试资源存储对象的数量,得到正确预测对象数量,统计各测试资源存储对象的数量,得到测试对象数量,将正确预测对象数量与测试对象数量的比值,确定为预测准确度。
在一些实施例中,服务器得到预测准确度后,可以将预测准确度与准确度阈值进行对比,在预测准确度达到准确度阈值的情况下,将当前数量确定为目标数量。
本实施例中,在预测准确度符合准确度要求的情况下,将当前数量确定为目标数量,从而在候选资源存储对象的数量为目标数量的情况下,可以保证为目标资源存储对象预测出的对象类型的准确度。
在一些实施例中,对象类型确定方法还包括:在预测准确度不符合准确度要求的情况下,更新当前数量;返回从多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象的步骤,直到预测准确度符合准确度要求为止。
具体地,服务器得到预测准确度后,可以将预测准确度与准确度阈值进行对比,在预测准确度未达到准确度阈值的情况下,更新当前数量,例如可以朝着减小的方向更新当前数量,或者,朝着增大的方向更新当前数量。更新后,重新确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象,从而重新计算新的预测准确度,直到预测准确度达到准确度阈值为止,在预测准确度达到准确度阈值的情况下,将当前数量确定为目标数量。
本实施例中,在预测准确度不符合准确度要求的情况下,更新当前数量,返回从多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象的步骤,直到预测准确度符合准确度要求为止,从而通过不断的调整当前数量,得到了使得预测准确度满足准确度要求的目标数量,提高了确定目标数量的效率。
在一些实施例中,基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象包括:获取对象类型对应的聚集度表征统计值;对象类型对应的聚集度表征统计值,是对属于对象类型的参考资源存储对象的聚集度表征值进行统计得到的;从多个候选资源存储对象中,确定聚集度表征值小于所属的对象类型的聚集度表征统计值的候选资源存储对象,得到满足聚集分布条件的候选资源存储对象。
其中,对象类型对应的聚集度表征统计值,为该对象类型中的参考资源存储对象的聚集度表征值的平均值。
具体地,服务器可以确定每个参考资源存储对象的聚集度表征值,确定参考资源存储对象的聚集度表征值的方法,参考上述的确定候选资源存储对象对应的聚集度表征值的方法。服务器可以按照对象类型,对该多个参考资源存储对象进行划分,得到不同对象类型分别对应的参考资源存储对象集合,对于每一种对象类型,将该对象类型对应的参考资源存储对象集合中的各个参考资源存储对象的聚集度表征值进行均值计算,得到该对象类型对应的聚集度表征统计值。其中,对象类型对应的参考资源存储对象集合中的各个参考资源存储对象属于该分对象类型。例如,服务器可以利用公式(5)计算第q个对象类型的聚集度表征统计值cnq。
其中,cnq代表第q个对象类型的聚集度表征统计值,nq代表第q个对象类型对应的参考资源存储对象集合中的参考资源存储对象的数量,meant代表第q个对象类型对应的参考资源存储对象集合中的第t个参考资源存储对象,1≤t≤nq。
在一些实施例中,对于每个候选资源存储对象,服务器获取该候选资源存储对象所属的对象类型的聚集度表征统计值,将该候选资源存储对象的聚集度表征值与获取的聚集度表征统计值进行对比,在确定聚集度表征值小于聚集度表征统计值的情况下,确定候选资源存储对象满足聚集分布条件。
本实施例中,由于聚集度表征值越小,则表征聚集程度越高,故从多个候选资源存储对象中,确定聚集度表征值小于所属的对象类型的聚集度表征统计值的候选资源存储对象,得到满足聚集分布条件的候选资源存储对象,可以得到聚集程度较高的候选资源存储对象,从而利用聚集程度较高的候选资源存储对象预测目标资源存储对象的对象类型,提高了预测准确度。
在一些实施例中,确定对象类型对应的聚集度表征统计值的步骤包括:获取多个已知对象类型的参考资源存储对象中,每个参考资源存储对象分别对应的聚集度表征值;对多个已知对象类型的参考资源存储对象中同一对象类型的参考资源存储对象的聚集度表征值进行统计,得到每种对象类型分别对应的聚集度表征统计值。
具体地,服务器可以按照对象类型,对该多个参考资源存储对象进行划分,得到不同对象类型分别对应的参考资源存储对象集合,对于每一种对象类型,将该对象类型对应的参考资源存储对象集合中的各个参考资源存储对象的聚集度表征值进行均值计算,得到该对象类型对应的聚集度表征统计值
在一些实施例中,服务器中存储有待训练的对象类型确定模型,对象类型确定模型中包括各个对象指标分别对应的指标权重、各对象类型分别对应的聚集度表征统计值、初始的当前数量,利用测试资源存储对象计算预测准确度从而更新当前数量得到的过程,为训练对象类型确定模型的过程,在预测准确度达到准确度阈值的情况下,确定训练好对象类型确定模型,当前数量不再发生变化,此时的当前数量即为所需要的目标数量。从而,可以利用训练好的对象类型确定模型,预测对象类型未知的资源存储对象所属的对象类型。例如,步骤202到步骤208整个过程可以是利用训练好的对象类型确定模型,预测对象类型未知的资源存储对象所属的对象类型的过程。当然,在对对象类型确定模型进行训练时,还可以对对象特征进行优化。由于参考资源存储对象用于确定目标数量,故参考资源存储对象可以称为训练样本,由于测试资源存储对象用于检验模型的准确度,故测试资源存储对象可以称为测试样本。
本实施例中,对多个已知对象类型的参考资源存储对象中,同一对象类型的参考资源存储对象的聚集度表征值进行统计,得到每种对象类型分别对应的聚集度表征统计值,提高了聚集度表征统计值的准确度。
在一些实施例中,确定候选资源存储对象对应的聚集度表征值包括:对于每个参考资源存储对象,确定候选资源存储对象与参考资源存储对象之间的特征差值;基于特征差值,从多个参考资源存储对象中确定候选资源存储对象的特征相近存储对象;基于候选资源存储对象的特征相近存储对象的对象特征,确定候选资源存储对象对应的聚集度表征值。
具体地,对象特征包括多个对象指标分别对应的指标值,针对每个候选资源存储对象,服务器可以获取该候选资源存储对象的对象特征,得到第一对象特征,获取对应的特征相近存储对象的对象特征,得到第二对象特征,针对每个对象指标,将该对象指标在第一对象特征中的指标值与该对象指标在各第二对象特征中的指标值进行统计,得到该候选资源存储对象的聚集度表征值。
在一些实施例中,针对每个对象指标,服务器可以将该对象指标在第一对象特征中的指标值与在每个第二对象特征中的特征值之间的差异进行统计,得到该对象指标对应的差异统计值,对各对象指标分别对应的差异统计值进行统计,得到候选资源存储对象对应的聚集度表征值。
本实施例中,由于特征相近存储对象的对象特征与候选资源存储对象的对象特征越相似,则两者的对象特征的分布越聚集,故基于候选资源存储对象的特征相近存储对象的对象特征,确定候选资源存储对象对应的聚集度表征值,提高了聚集度表征值的合理性。
在一些实施例中,对象特征包括多个对象指标分别对应的指标值,候选资源存储对象的对象特征为第一对象特征,特征相近存储对象的对象特征为第二对象特征;基于候选资源存储对象的特征相近存储对象的对象特征,确定候选资源存储对象对应的聚集度表征值包括:针对每个对象指标,对对象指标在第一对象特征中的指标值与在每个第二对象特征中的特征值之间的差异进行统计,得到对象指标对应的差异统计值;对各对象指标分别对应的差异统计值进行统计,得到候选资源存储对象对应的聚集度表征值。
具体地,针对每个对象指标,服务器可以获取第一对象特征中该对象指标的指标值,得到该对象指标的第一对象指标值,从每个第二对象特征中分别获取该对象指标的指标值,得到该对象指标的各第二对象指标值,对于每个第二对象指标值,确定该第二对象指标值分别与第一对象指标值之间的指标差值,将确定出的各指标差值进行求和,将求和的结果确定为该对象指标对应的差异统计值。服务器得到各对象指标分别对应的差异统计值后,可以对各个差异统计值进行加权计算,得到候选资源存储对象对应的聚集度表征值,例如,可以将加权计算的结果与特征相近存储对象的数量的比值,确定为候选资源存储对象对应的聚集度表征值。其中,每个对象指标分别对应有指标权重,服务器可以利用每个对象指标分别对应的指标权重,对各对象指标分别对应的差异统计值进行加权计算,得到候选资源存储对象对应的聚集度表征值。
在一些实施例中,服务器可以对确定出的各指标差值进行均值计算,将计算结果确定为该对象指标对应的差异统计值。服务器得到各对象指标分别对应的差异统计值后,可以对各个差异统计值进行加权计算,将加权计算的结果确定为候选资源存储对象对应的聚集度表征值。其中,每个对象指标分别对应有指标权重,服务器可以利用每个对象指标分别对应的指标权重,对各对象指标分别对应的差异统计值进行加权计算,得到候选资源存储对象对应的聚集度表征值。例如,服务器可以利用公式(6)计算得到候选资源存储对象对应的聚集度表征值。
其中,means代表候选资源存储对象S的聚集度表征值,n代表具有共有n种对象指标,z代表特征相近存储对象的数量。ωj代表第j种对象指标的指标权重,ds,j代表第j种对象指标的差异统计值,xs,j代表候选资源存储对象S中第j种对象指标的指标值,yp,j代表第p个特征相近存储对象中第j种对象指标的指标值,1≤p≤z,D(xs,j,yp,j)代表xs,j与yp,j之间的指标差值,计算指标差值的方法可以参考上述实施例中提供的计算指标差值的方法。
本实施例中,针对每个对象指标,对对象指标在第一对象特征中的指标值与在每个第二对象特征中的特征值之间的差异进行统计,得到对象指标对应的差异统计值,对各对象指标分别对应的差异统计值进行统计,得到候选资源存储对象对应的聚集度表征值,从而确定聚集度表征值的过程中,充分考虑了各对象指标的指标值之间的差异,提高了聚集度表征值的准确度。
在一些实施例中,对各对象指标分别对应的差异统计值进行统计,得到候选资源存储对象对应的聚集度表征值包括:获取各对象指标分别对应的指标权重;指标权重是基于各参考资源存储对象的对象特征确定的;利用各对象指标分别对应的指标权重,对各对象指标分别对应的差异统计值进行加权计算,得到候选资源存储对象对应的聚集度表征值。
具体地,各对象指标分别对应的指标权重,可以是根据该多个参考资源存储对象的对象特征确定的。服务器可以获取各参考资源存储对象分别对应的对象特征,得到各参考对象特征,对各参考对象特征中各对象指标分别对应的指标值进行统计,得到各对象指标分别对应的指标权重。
在一些实施例中,服务器可以对各参考对象特征中对象指标的指标值进行统计,得到对象指标的指标统计值;基于对象指标在每个参考对象特征中的指标值与指标统计值的比值,确定对象指标的指标权重。
本实施例中,由于不同的对象指标在预测目标资源存储对象所属的对象类型中所起到的作用可能是不同的,例如,在对公支付账户疑似洗钱的情况下,法人年龄、快进快出是主要判断标准,应赋予更高的权重,而交易对手数量、开户时间不是主要判断标准,则赋予更低的权值。因此,利用各对象指标分别对应的指标权重,对各对象指标分别对应的差异统计值进行加权计算,得到候选资源存储对象对应的聚集度表征值,从而充分考虑了不同对象指标的重要程度,提高了聚集度表征值的准确度。
在一些实施例中,确定对象指标的指标权重的步骤包括:确定各参考资源存储对象分别对应的参考对象特征;对各参考对象特征中对象指标的指标值进行统计,得到对象指标的指标统计值;基于对象指标的指标统计值得到对象指标的指标权重。
具体地,对于每个对象指标,服务器可以从各参考对象特征中,获取该对象指标的指标值,组成该对象指标的指标值集合,计算该指标值集合中所有指标值进行求和计算,得到该对象指标的总指标值,对于指标值集合中每个指标值,计算该指标值与总指标值的比值,得到该指标值对应的指标占比,基于指标值集合中各指标值分别对应的指标占比,得到对象指标的指标统计值。
在一些实施例中,服务器可以统计该多个参考资源存储对象的数量,得到参考对象数量,基于参考对象数量以及指标值集合中各指标值分别对应的指标占比,得到对象指标的指标统计值。例如,服务器可以利用公式(7)和公式(8)计算得到第j种对象指标的指标统计值Hj。
其中,Hj为第j种对象指标的指标统计值,N为参考对象数量,fij为第i个参考资源存储对象的参考对象特征中第j种对象指标的指标值的指标占比,dij代表第i个参考资源存储对象的参考对象特征中第j种对象指标的指标值,i=1,2,…,N,j=1,2,…,n。n代表共有n种对象指标,即为对象指标的种类数量。
在一些实施例中,对象指标的指标权重与对象指标的指标统计值成负相关关系,例如,服务器可以将对象指标的指标统计值的相反数,确定为对象指标的指标权重,或者将预设数值减去对象指标的指标统计值所得到的差值,确定为对象指标的指标权重。预设数值可以根据需要设置,例如为1。
本实施例中,对各参考对象特征中对象指标的指标值进行统计,得到对象指标的指标统计值,基于对象指标的指标统计值得到对象指标的指标权重,提高了指标权重的合理性。
在一些实施例中,基于对象指标的指标统计值得到对象指标的指标权重包括:对各个对象指标分别对应的指标统计值进行统计,得到目标统计值;基于对象指标的指标统计值以及目标统计值,确定对象指标的指标权重。
具体地,服务器获取每个对象指标分别对应的指标统计值后,可以将各个对象指标分别对应的指标统计值进行求和,将求和的结果确定为目标统计值。
在一些实施例中,对象指标的指标权重与目标统计值成正相关关系。正相关关系指的是:在其他条件不变的情况下,两个变量变动方向相同,一个变量由大到小变化时,另一个变量也由大到小变化。
在一些实施例中,服务器还可以统计对象指标的数量,得到对象指标数量,例如共5种对象指标,则对象指标数量为5。服务器可以基于对象指标数量、对象指标的指标统计值以及目标统计值,确定对象指标的指标权重。对象指标的指标权重与对象指标数量成负相关关系。例如,服务器可以利用公式(9)计算得到第j种对象指标的指标权重ωj。
其中,0≤ωj≤1,n为对象指标数量。
本实施例中,基于对象指标的指标统计值以及目标统计值,确定对象指标的指标权重,进一步提高了指标权重的准确度。
在一些实施例中,从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象包括:对于每个参考资源存储对象,确定目标资源存储对象与参考资源存储对象之间的特征差值;基于各特征差值,从多个已知对象类型的参考资源存储对象中筛选得到多个候选资源存储对象。
具体地,候选资源存储对象的数量为目标数量。服务器可以按照特征差值从小到大的顺序,对各参考资源存储对象进行排列,得到第一参考资源存储对象序列,将第一参考资源存储对象序列中排列在前的目标数量的参考资源存储对象,确定为该目标数量的候选资源存储对象。例如,目标数量为10,则将第一参考资源存储对象序列中排列在前10的参考资源存储对象,确定为各候选资源存储对象。其中,参考对象特征与目标对象特征之间的特征差值越小,则参考资源存储对象在第一参考资源存储对象序列中的排序越靠前。
本实施例中,由于特征差值表征了对象特征之间的差异,故基于各特征差值,从多个已知对象类型的参考资源存储对象中筛选得到多个候选资源存储对象,可以准确的筛选出对象特征与目标资源存储对象的对象特征相近的候选资源存储对象。
在一些实施例中,如图4所示,提供了一种对象类型确定方法,该方法可以由终端或服务器执行,还可以由终端和服务器共同执行,以该方法应用于服务器为例进行说明,包括以下步骤:
步骤402,获取多个已知对象类型的参考资源存储对象,并确定每个参考资源存储对象的对象特征,对象特征包括多个对象指标分别对应的指标值,对各参考对象特征中各对象指标的指标值进行统计,得到各对象指标分别对应的指标权重。
步骤404,对于每个参考资源存储对象,从该多个已知对象类型的参考资源存储对象中,确定对应的特征相近存储对象。
步骤406,对于每个参考资源存储对象,针对每个对象指标,将对象指标在参考资源存储对象的对象特征中的指标值,与在每个特征相近存储对象的对象特征中的特征值进行统计,得到对象指标对应的差异统计值,利用各对象指标分别对应的指标权重,对各对象指标分别对应的差异统计值进行加权计算,得到该参考资源存储对象对应的聚集度表征值。
步骤408,对多个已知对象类型的参考资源存储对象中,同一对象类型的参考资源存储对象的聚集度表征值进行统计,得到每种对象类型分别对应的聚集度表征统计值。
步骤410,获取多个已知对象类型的测试资源存储对象,并确定每个测试资源存储对象的对象特征,从该多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象。
步骤412,确定当前数量的参考资源存储对象分别对应的聚集度表征值,从当前数量的参考资源存储对象中,确定聚集度表征值小于所属对象类型的聚集度表征统计值的参考资源存储对象,得到满足聚集分布条件的参考资源存储对象。
步骤414,基于满足聚集分布条件的参考资源存储对象所属的对象类型,得到测试资源存储对象对应的预测对象类型,基于测试资源存储对象的预测对象类型确定预测准确度,在预测准确度符合准确度要求的情况下,将当前数量确定为目标数量。
步骤416,获取对象类型未知的目标资源存储对象的对象特征,得到目标对象特征,从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的目标数量的候选资源存储对象。
步骤418,确定每个候选资源存储对象分别对应的聚集度表征值,从多个候选资源存储对象中,选取聚集度表征值小于所属对象类型的聚集度表征统计值的候选资源存储对象,得到满足聚集分布条件的候选资源存储对象。
步骤420,基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。
其中,本申请提供的对象类型确定方法可以是基于对象类型确定模型实现的,如图5所示,对象类型确定模型中可以包括指标权重、聚集度表征统计值和目标数量,可以确定满足聚集分布条件的候选资源存储对象以及预测目标资源存储对象所属的对象类型。如图6所示,将目标资源存储对象的相关数据或目标资源存储对象的对象特征输入到对象类型确定模型中,可以输出目标资源存储对象的对象类型。
本实施例中,从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的目标数量的候选资源存储对象,对于每个候选资源存储对象,确定候选资源存储对象对应的聚集度表征值,基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象,基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。从而通过满足聚集分布条件的候选资源存储对象可以快速的预测目标资源存储对象所属的对象类型,所需要的计算量小,提高了预测效率,自动识别了资源存储对象的对象类型,减少了计算量,减少人工干预来,提升了预测精度。
本申请提供的对象类型确定方法可以应用于支付金融领域中,例如金融机构(银行、支付机构、券商、保险公司等)和金融监管机构,可以利用本申请提供的对象类型确定方法,预测账户的对象类型(异常等级)。如图7所示,对于金融机构,可以将本申请提供的对象类型确定方法用于日常交易管理,如果存在风险则自动告警,提醒相关方及时尽调与处置。对于监管部门,可以将本申请提供的对象类型确定方法用于监管执法检查。通过汇总本监管部门辖区数据或全国统一数据完成对象类型确定模型的建模,利用构建完成的对象类型确定模型检验辖区金融机构产生的每一笔对公账户交易是否存在风险。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的对象类型确定方法的对象类型确定装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个对象类型确定装置实施例中的具体限定可以参见上文中对于对象类型确定方法的限定,在此不再赘述。
在一些实施例中,如图8所示,提供了一种对象类型确定装置,包括:第一存储对象确定模块802、聚集度表征值确定模块804、第二存储对象确定模块806和对象类型预测模块808,其中:
第一存储对象确定模块802,用于从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象。
聚集度表征值确定模块804,用于对于每个候选资源存储对象,确定候选资源存储对象对应的聚集度表征值;聚集度表征值,用于表征在按照对象特征进行分布的情况下,候选资源存储对象与特征相近存储对象之间的分布聚集程度;特征相近存储对象是参考资源存储对象中与候选资源存储对象的对象特征相近的参考资源存储对象。
第二存储对象确定模块806,用于基于候选资源存储对象对应的聚集度表征值,从多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象。
对象类型预测模块808,用于基于满足聚集分布条件的候选资源存储对象所属的对象类型,预测目标资源存储对象所属的对象类型。
在一些实施例中,多个候选资源存储对象为目标数量的候选资源存储对象,对象类型确定装置还包括目标数量确定模块,目标数量确定模块,用于从多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象;确定当前数量的参考资源存储对象分别对应的聚集度表征值,从当前数量的参考资源存储对象中确定聚集度表征值满足聚集分布条件的参考资源存储对象;基于满足聚集分布条件的参考资源存储对象所属的对象类型,得到测试资源存储对象对应的预测对象类型;基于测试资源存储对象的预测对象类型确定预测准确度,在预测准确度符合准确度要求的情况下,将当前数量确定为目标数量。
在一些实施例中,对象类型确定装置,还用于在预测准确度不符合准确度要求的情况下,更新当前数量;返回从多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象的步骤,直到预测准确度符合准确度要求为止。
在一些实施例中,第二存储对象确定模块,还用于获取对象类型对应的聚集度表征统计值;对象类型对应的聚集度表征统计值,是对属于对象类型的参考资源存储对象的聚集度表征值进行统计得到的;从多个候选资源存储对象中,确定聚集度表征值小于所属的对象类型的聚集度表征统计值的候选资源存储对象,得到满足聚集分布条件的候选资源存储对象。
在一些实施例中,对象类型确定装置还包括聚集度表征统计值确定模块,聚集度表征统计值确定模块,用于获取多个已知对象类型的参考资源存储对象中,每个参考资源存储对象分别对应的聚集度表征值;对多个已知对象类型的参考资源存储对象中,同一对象类型的参考资源存储对象的聚集度表征值进行统计,得到每种对象类型分别对应的聚集度表征统计值。
在一些实施例中,聚集度表征值确定模块,还用于对于每个参考资源存储对象,确定候选资源存储对象与参考资源存储对象之间的特征差值;基于特征差值,从多个参考资源存储对象中确定候选资源存储对象的特征相近存储对象;基于候选资源存储对象的特征相近存储对象的对象特征,确定候选资源存储对象对应的聚集度表征值。
在一些实施例中,对象特征包括多个对象指标分别对应的指标值,候选资源存储对象的对象特征为第一对象特征,特征相近存储对象的对象特征为第二对象特征;聚集度表征值确定模块,还用于针对每个对象指标,对对象指标在第一对象特征中的指标值与在每个第二对象特征中的特征值之间的差异进行统计,得到对象指标对应的差异统计值;对各对象指标分别对应的差异统计值进行统计,得到候选资源存储对象对应的聚集度表征值。
在一些实施例中,聚集度表征值确定模块,还用于获取各对象指标分别对应的指标权重;指标权重是基于各参考资源存储对象的对象特征确定的;利用各对象指标分别对应的指标权重,对各对象指标分别对应的差异统计值进行加权计算,得到候选资源存储对象对应的聚集度表征值。
在一些实施例中,对象类型确定装置还包括权重确定模块,权重确定模块,用于确定各参考资源存储对象分别对应的参考对象特征;对各参考对象特征中对象指标的指标值进行统计,得到对象指标的指标统计值;基于对象指标的指标统计值得到对象指标的指标权重。
在一些实施例中,权重确定模块,还用于对各个对象指标分别对应的指标统计值进行统计,得到目标统计值;基于对象指标的指标统计值以及目标统计值,确定对象指标的指标权重。
在一些实施例中,第一存储对象确定模块,还用于对于每个参考资源存储对象,确定目标资源存储对象与参考资源存储对象之间的特征差值;基于各特征差值,从多个已知对象类型的参考资源存储对象中筛选得到多个候选资源存储对象。
上述对象类型确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储对象类型确定方法中涉及到的数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对象类型确定方法。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种对象类型确定方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9和图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述对象类型确定方法中的步骤。
在一些实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述对象类型确定方法中的步骤。
在一些实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述对象类型确定方法中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (15)
1.一种对象类型确定方法,其特征在于,所述方法包括:
从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象;
对于每个所述候选资源存储对象,确定所述候选资源存储对象对应的聚集度表征值;所述聚集度表征值,用于表征在按照对象特征进行分布的情况下,所述候选资源存储对象与特征相近存储对象之间的分布聚集程度;所述特征相近存储对象是所述参考资源存储对象中与所述候选资源存储对象的对象特征相近的参考资源存储对象;
基于所述候选资源存储对象对应的聚集度表征值,从所述多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象;
基于所述满足聚集分布条件的候选资源存储对象所属的对象类型,预测所述目标资源存储对象所属的对象类型。
2.根据权利要求1所述的方法,其特征在于,所述多个候选资源存储对象为目标数量的候选资源存储对象,确定所述目标数量的步骤包括:
从所述多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象;
确定所述当前数量的参考资源存储对象分别对应的聚集度表征值,从所述当前数量的参考资源存储对象中确定聚集度表征值满足聚集分布条件的参考资源存储对象;
基于所述满足聚集分布条件的参考资源存储对象所属的对象类型,得到所述测试资源存储对象对应的预测对象类型;
基于所述测试资源存储对象的预测对象类型确定预测准确度,在所述预测准确度符合准确度要求的情况下,将当前数量确定为目标数量。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述预测准确度不符合准确度要求的情况下,更新当前数量;
返回从所述多个已知对象类型的参考资源存储对象中,确定与测试资源存储对象的对象特征相近的当前数量的参考资源存储对象的步骤,直到预测准确度符合准确度要求为止。
4.根据权利要求1所述的方法,其特征在于,所述基于所述候选资源存储对象对应的聚集度表征值,从所述多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象包括:
获取对象类型对应的聚集度表征统计值;所述对象类型对应的聚集度表征统计值,是对属于所述对象类型的参考资源存储对象的聚集度表征值进行统计得到的;
从所述多个候选资源存储对象中,确定聚集度表征值小于所属的对象类型的聚集度表征统计值的候选资源存储对象,得到满足聚集分布条件的候选资源存储对象。
5.根据权利要求4所述的方法,其特征在于,确定所述对象类型对应的聚集度表征统计值的步骤包括:
获取所述多个已知对象类型的参考资源存储对象中,每个参考资源存储对象分别对应的聚集度表征值;
对所述多个已知对象类型的参考资源存储对象中,同一对象类型的参考资源存储对象的聚集度表征值进行统计,得到每种对象类型分别对应的聚集度表征统计值。
6.根据权利要求1所述的方法,其特征在于,所述确定所述候选资源存储对象对应的聚集度表征值包括:
对于每个所述参考资源存储对象,确定所述候选资源存储对象与所述参考资源存储对象之间的特征差值;
基于特征差值,从所述多个参考资源存储对象中确定所述候选资源存储对象的特征相近存储对象;
基于所述候选资源存储对象的特征相近存储对象的对象特征,确定所述候选资源存储对象对应的聚集度表征值。
7.根据权利要求6所述的方法,其特征在于,所述对象特征包括多个对象指标分别对应的指标值,所述候选资源存储对象的对象特征为第一对象特征,所述特征相近存储对象的对象特征为第二对象特征;
所述基于所述候选资源存储对象的特征相近存储对象的对象特征,确定所述候选资源存储对象对应的聚集度表征值包括:
针对每个对象指标,对所述对象指标在第一对象特征中的指标值与在每个第二对象特征中的特征值之间的差异进行统计,得到所述对象指标对应的差异统计值;
对各所述对象指标分别对应的差异统计值进行统计,得到所述候选资源存储对象对应的聚集度表征值。
8.根据权利要求7所述的方法,其特征在于,所述对各所述对象指标分别对应的差异统计值进行统计,得到所述候选资源存储对象对应的聚集度表征值包括:
获取各所述对象指标分别对应的指标权重;所述指标权重是基于各所述参考资源存储对象的对象特征确定的;
利用各所述对象指标分别对应的指标权重,对各所述对象指标分别对应的差异统计值进行加权计算,得到所述候选资源存储对象对应的聚集度表征值。
9.根据权利要求8所述的方法,其特征在于,确定所述对象指标的指标权重的步骤包括:
确定各所述参考资源存储对象分别对应的参考对象特征;
对各所述参考对象特征中所述对象指标的指标值进行统计,得到所述对象指标的指标统计值;
基于所述对象指标的指标统计值得到所述对象指标的指标权重。
10.根据权利要求9所述的方法,其特征在于,所述基于所述对象指标的指标统计值得到所述对象指标的指标权重包括:
对各个所述对象指标分别对应的指标统计值进行统计,得到目标统计值;
基于所述对象指标的指标统计值以及所述目标统计值,确定所述对象指标的指标权重。
11.根据权利要求1所述的方法,其特征在于,所述从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象包括:
对于每个参考资源存储对象,确定所述目标资源存储对象与所述参考资源存储对象之间的特征差值;
基于各所述特征差值,从所述多个已知对象类型的参考资源存储对象中筛选得到所述多个候选资源存储对象。
12.一种对象类型确定装置,其特征在于,所述装置包括:
第一存储对象确定模块,用于从多个已知对象类型的参考资源存储对象中,确定与目标资源存储对象的对象特征相近的多个候选资源存储对象;
聚集度表征值确定模块,用于对于每个所述候选资源存储对象,确定所述候选资源存储对象对应的聚集度表征值;所述聚集度表征值,用于表征在按照对象特征进行分布的情况下,所述候选资源存储对象与特征相近存储对象之间的分布聚集程度;所述特征相近存储对象是所述参考资源存储对象中与所述候选资源存储对象的对象特征相近的参考资源存储对象;
第二存储对象确定模块,用于基于所述候选资源存储对象对应的聚集度表征值,从所述多个候选资源存储对象中确定满足聚集分布条件的候选资源存储对象;
对象类型预测模块,用于基于所述满足聚集分布条件的候选资源存储对象所属的对象类型,预测所述目标资源存储对象所属的对象类型。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210646046.5A CN117035141A (zh) | 2022-06-09 | 2022-06-09 | 对象类型确定方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210646046.5A CN117035141A (zh) | 2022-06-09 | 2022-06-09 | 对象类型确定方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117035141A true CN117035141A (zh) | 2023-11-10 |
Family
ID=88637793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210646046.5A Pending CN117035141A (zh) | 2022-06-09 | 2022-06-09 | 对象类型确定方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117035141A (zh) |
-
2022
- 2022-06-09 CN CN202210646046.5A patent/CN117035141A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109977151B (zh) | 一种数据分析方法及系统 | |
US9294497B1 (en) | Method and system for behavioral and risk prediction in networks using automatic feature generation and selection using network topolgies | |
BR112019025671A2 (pt) | sistema e método para conceder um empréstimo a um consumidor determinado como sendo um bom pagador | |
CN108648071A (zh) | 基于区块链的资源价值评估方法和装置 | |
US11538044B2 (en) | System and method for generation of case-based data for training machine learning classifiers | |
WO2020023647A1 (en) | Privacy preserving ai derived simulated world | |
Van Thiel et al. | Artificial intelligence credit risk prediction: An empirical study of analytical artificial intelligence tools for credit risk prediction in a digital era | |
Majeske et al. | The bank loan approval decision from multiple perspectives | |
WO2020261074A1 (es) | Sistema y método para la aprobación y desembolso de un crédito | |
CN110603558A (zh) | 用于管理金融交易系统中的欺诈检测的系统和方法 | |
CA2985839A1 (en) | Health lending system and method using probabilistic graph models | |
Xu et al. | A hybrid interpretable credit card users default prediction model based on RIPPER | |
Eddy et al. | Credit scoring models: Techniques and issues | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
Chen et al. | Mixed credit scoring model of logistic regression and evidence weight in the background of big data | |
US11900227B1 (en) | Apparatus for producing a financial target strategy and a method for its use | |
CN115018210B (zh) | 业务数据分类预测方法、装置、计算机设备和存储介质 | |
CN117035141A (zh) | 对象类型确定方法、装置、计算机设备和存储介质 | |
CN114170000A (zh) | 信用卡用户风险类别识别方法、装置、计算机设备和介质 | |
Bagde et al. | Analysis of fraud detection mechanism in health insurance using statistical data mining techniques | |
Pang et al. | Wt model & applications in loan platform customer default prediction based on decision tree algorithms | |
Gelindon et al. | Credit Risk Evaluation in Banking and Lending Sectors Using Neural Network Model | |
CN117350461B (zh) | 企业异常行为预警方法、系统、计算机设备及存储介质 | |
Tong et al. | User financial credit analysis for blockchain regulation | |
US11741432B1 (en) | Systems and methods for predictive scoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |