CN110851729A - 资源信息推荐方法、装置、设备及计算机存储介质 - Google Patents
资源信息推荐方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN110851729A CN110851729A CN201911145222.1A CN201911145222A CN110851729A CN 110851729 A CN110851729 A CN 110851729A CN 201911145222 A CN201911145222 A CN 201911145222A CN 110851729 A CN110851729 A CN 110851729A
- Authority
- CN
- China
- Prior art keywords
- resource information
- historical
- value
- current
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005065 mining Methods 0.000 description 4
- 238000000546 chi-square test Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及金融科技(Fintech)技术领域,公开了一种资源信息推荐方法、装置、设备和计算机存储介质,该方法包括:获取各资源信息的历史数据,基于特征选择在各历史数据中获取与用户账号具有相关性的多个历史特征值;计算用户账号的当前特征值与各历史特征值之间的相似度值,在各相似度值中获取预设数量的目标相似度值;基于各资源信息确定各目标相似度值对应的目标资源信息,获取各目标资源信息中的参数信息;基于预设推荐算法对各目标相似度值和各参数信息进行计算,以获取各资源信息对应的推荐指数,在各推荐指数中确定数值最高的目标推荐指数,对目标推荐指数对应的资源信息进行推荐。本发明提高了金融平台中推荐算法推荐的准确性。
Description
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及资源信息推荐方法、装置、设备及计算机存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,大数据中的企业贷款技术也不例外,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。例如在金融平台对各个企业推荐资源信息时,往往需要对已有的历史数据进行分析,并根据分析结果向各个企业进行推荐。但目前金融平台的推荐方式一般是基于用户的协同推荐算法或者是基于资源信息的协同推荐算法来进行推荐的,但是由于这两种推荐方式中的推荐算法并没有考虑企业经营状况和资源信息的变化程度等,往往导致推荐给企业的资源信息不准确。因此,如何提高金融平台中推荐算法推荐的准确性成为了目前亟待解决的技术问题。
发明内容
本发明的主要目的在于提出一种资源信息推荐方法、装置、设备及计算机存储介质,旨在提高金融平台中推荐算法推荐的准确性。
为实现上述目的,本发明提供一种资源信息推荐方法,所述资源信息推荐方法包括如下步骤:
获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;
计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;
基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;
基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。
可选地,所述基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数的步骤,包括:
依次遍历各所述目标相似度值,并确定当前遍历的当前目标相似度值对应的参数信息;
根据预设推荐算法对所述当前目标相似度值和所述当前目标相似度值对应的参数信息进行计算,以获取所述当前目标相似度值对应的资源信息的推荐指数,直至各所述目标相似度值遍历完成。
可选地,所述计算用户账号的当前特征值与各所述历史特征值之间的相似度值的步骤,包括:
获取所述当前特征值对应的当前标准化特征值和各所述历史特征值对应的历史标准化特征值;
根据所述当前标准化特征值和各所述历史标准化特征值确定所有相似度值。
可选地,所述获取所述当前特征值对应的当前标准化特征值和各所述历史特征值对应的历史标准化特征值的步骤,包括:
基于预设数据处理方式对所述当前特征值进行标准化,以获取所述当前特征值对应的当前标准化特征值;
基于所述预设数据处理方式对各所述历史特征值进行标准化,以获取各所述历史特征值对应的历史标准化特征值。
可选地,所述根据所述当前标准化特征值和各所述历史标准化特征值确定所有相似度值的步骤,包括:
依次遍历各所述历史标准化特征值,并计算当前遍历的历史标准化特征值和所述当前标准化特征值之间的欧式距离;
基于所述欧式距离确定当前遍历的历史标准化特征值和当前标准化特征值的相似度值,直至各所述历史标准化特征值遍历完成。
可选地,所述基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值的步骤,包括:
基于预设校验算法对各所述历史数据进行离散化,以获取各所述历史数据对应的初级特征值;
基于所述预设校验算法对各所述初级特征值进行评分,并基于评分结果获取与用户账号具有相关性的多个历史特征值。
可选地,所述计算用户账号的当前特征值与各所述历史特征值之间的相似度值的步骤之前,包括:
获取用户账号的当前数据,并对所述当前数据进行离散数据编码,以获取所述当前账号的当前特征值。
此外,为实现上述目的,本发明还提供一种资源信息推荐装置,所述资源信息推荐装置包括:
获取模块,用于获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;
计算模块,用于计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;
确定模块,用于基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;
推荐模块,用于基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。
此外,为实现上述目的,本发明还提供一种资源信息推荐设备,所述资源信息推荐设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的资源信息推荐程序,所述资源信息推荐程序被所述处理器执行时实现如上所述的资源信息推荐方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有资源信息推荐程序,所述资源信息推荐程序被处理器执行时实现如上所述的资源信息推荐方法的步骤。
本发明通过获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。通过获取各个资源信息的历史数据,并将用户账号的当前特征值和历史数据中的多个历史特征值进行比较,以确定相似度值,也就是在计算相似度值时,综合考虑了资源信息的历史数据,提高了向用户账号推荐资源信息的准确性,并且还需要在这些相似度值中确定目标相似度值,并根据参数信息确定目标推荐指数,将目标推荐指数对应的资源信息进行推荐,使得本次推荐的效果更好,更符合用户的需求,提高了金融平台中推荐算法推荐的准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明资源信息推荐方法第一实施例的流程示意图;
图3为本发明资源信息推荐装置的装置模块示意图;
图4为本发明资源信息推荐方法中申请产品的流程示意图;
图5为本发明资源信息推荐方法中的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例资源信息推荐设备可以是PC机或服务器设备,其上运行有Java虚拟机。
如图1所示,该资源信息推荐设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及资源信息推荐程序。
在图1所示的设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的资源信息推荐程序,并执行下述资源信息推荐方法中的操作。
基于上述硬件结构,提出本发明资源信息推荐方法实施例。
参照图2,图2为本发明资源信息推荐方法第一实施例的流程示意图,所述方法包括:
步骤S10,获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;
在本实施例中用户账号可以为企业在金融平台中登录的账号。目前,金融平台为企业推荐各个资源信息(如金融资源信息)的方式主要有:(1)topN:即按对金融平台上每个资源信息申请成功的企业数从多到少的排名,并按排名进行推荐;(2)基于用户的协同推荐算法:主要原理是推荐和用户相似用户曾经成功申请的资源信息,主要步骤如下,找到与目标企业U相似的企业集合:即通过计算企业U和其它每个企业间的相似度找到最相似的企业集合,常用的相似度算法为Jaccard算法和余弦相似度算法:Jaccard算法:即两个企业申请资源信息的交集除以两个企业申请资源信息的并集。
将企业U和其它企业相似度进行从大到小排序,选择前L个企业;针对这L个企业L={L1,L2,…Ln}申请成功的资源信息集合P={P1,P2,…Pn},资源信息Pi对用户的推荐指数C(Pi,U)为:
N(pi)为对申请成功过Pi的企业。对资源信息集合P根据每个Pi的推荐指数C(Pi,U)值从大到小进行排序,选取前K个资源信息,得到企业U的信息推荐列表。
(3)基于资源信息的协同推荐算法:主要原理是和用户曾经申请成功的资源信息越相似,推荐指数也越高,主要步骤同基于用户的协同推荐算法相似,具体如下:计算资源信息集合P中两两的相似度,即计算各资源信息之间的相似度Sij,相似度算法采用Jaccard算法;计算资源信息P对于用户U的推荐指数C(P,U),选取最高推荐指数的K个资源信息进行推荐,推荐指数C(P,U)算法如下:
L为和资源信息j最为相似的l个资源信息。N(u)为用户U曾经申请成功的资源信息。
但是由于大部分企业申请成功的资源信息数较少,特别是小微企业许多之前并没有申请成功过资源信息,因此计算相似度时绝大部分为0,基于用户和基于资源信息的协同推荐算法并不能获得很好的推荐效果。并且由于企业经营状况不断变化,资源信息的准入条件也在发生变化,之前的用户申请成功的资源信息及与其类型的资源信息,在经过一段时间后并不一定能申请成功,目前的算法并没有考虑到企业经营状况和产品的变化程度。而topN的算法推荐了申请成功企业最多的产品,但某个资源信息的申请成功的企业数量相比于企业的总量比例很小,并不适用于绝大部分企业,推荐效果不佳。
因此,在本实施例中,通过根据平台企业基本信息及成功申请的历史数据,并通过特征选择筛选出独立且相关性较大的特征,即基于特征选择在各个历史数据中获取与用户账号具有相关性的多个历史特征值。
并且由于金融平台会记录企业的基本信息和经营信息,以便银行进行初步筛选,市场化的金融平台会根据企业授权获得工商信息,政府化的金融平台可以通过当地征信平台或大数据局获得相关企业工商、税务数据。当企业申请资源信息时,金融平台会记录下企业申请资源信息时最新的工商、税务数据、申请结果等信息,将这些信息进行衍生特征加工可整理为如下表1。表中同一个企业会申请多个资源信息,同一个资源信息也会有多个企业申请,同一个企业也会申请同一个资源信息多次。
表1
其中资源信息一般会对企业所处行业进行判断,由于行业代码公分4层,1380个小类,不易区分,因此只取第1层的代码,既每个企业的行业类型只区分到第1层的大类。申请日期为当前日期的5年内。
数据特征选择主要选择影响申请结果的主要特征,主要步骤如下:
连续数据离散化:对表1中连续型变量通过卡方检验方法进行离散化,如对上年营业收入字段离散化后为:小于等于3000万为1,大于3000万并且小于等于1亿为2,大于1亿并且小于等于10亿为3,大于10亿为4。特征选择:采用过滤法中的卡方检验法对每个特征进行评分,选取最好的特征;通过特征选择,选取M个对企业成功申请资源信息相关性最高的特征。
步骤S20,计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;
当通过特征筛选,并且只选择申请成功的记录,可得如下表2:
表2
并且在企业在平台上基于用户账号进行登录后,也就是对于登录平台的企业,会根据企业当前最新的选择特征与各申请成功的企业特征进行相似度计算,计算步骤如下:对于用户账号的数据信息进行离散数据编码,即对于像纳税人等级的有序序列{A->B->C->D}转换为有序数列如{1、2、3、4};对于行业等无序序列,采用one-hot编码,即假设有3个行业{金融业、采矿业、文化娱乐},则金融业编码为{1,0,0},采矿业编码为{0,1,0},文化娱乐编码为{0,0,1}。既会增加特征向量,也就是获取到用户账号的当前特征值。并对当前特征值和各个历史特征值进行标准化特征,且方式均相同。
计算企业当前标准化特征值与其它企业申请成功时的历史标准化特征值的相似度S,相似度采用欧式距离进行计算,距离越小,相似度越高。
其中n为标准化特征的个数;当计算出各个相似度后,选取与企业相似度最高的K(预设数量)个申请成功资源信息时的企业特征(即获取预设数量的目标相似度值),其对应的企业相似度为S(u,k),其对应的资源信息为L(L={L1,L2,L3……Ln})。
步骤S30,基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;
当获取到各个目标相似度值后,还需要获取各个资源信息的参数信息,如当资源信息为金融资源信息时,则参数信息可以包括金融资源信息的申请额度和申请时间。并在各个资源信息中确定与各个目标相似度值对应的目标资源信息,也就是目标资源信息的数量和目标相似度值的数量是相同的,并通过网络或者历史数据等方式获取各个目标资源信息中的参数信息。其中,参数信息包括资源信息的额度限制,时间限制等。
步骤S40,基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。
资源信息的推荐指数除了相似度指数外,由于企业申请到的额度越高,说明越符合资源信息的要求,因此和额度高的企业特征相似会更有机会申请成功,同时由于资源信息根据经济周期也在变化,因此时间越早,参考性也越弱,因此对企业U和上一步骤产生的L中每个资源信息的推荐指数C(U,Li)计算公式如下:
其中m为K企业特征申请的信贷额度;为L个资源信息最大贷款额度的平均值;y为K企业特征申请时的距离10年前的时间长度,以年为单位,取2位小数;S(u,k)为上一步获得的企业与K企业特征的相似度,Li为上一步获得的资源信息集合L中的资源信息;N(L)为Li资源信息对应的K个企业特征个数;计算公式主要的含义是对资源信息集合L,可能多个企业特征Ki会对用同一个资源信息Li,按公式计算资源信息Li对应的多个企业特征Ki的推荐指数并汇总,就是用户对于资源信息Li的推荐指数,最后选择推荐指数最高的D(预设数量)个资源信息进行推荐。
另外,为辅助理解本申请中的资源信息推荐方法的流程,下面进行举例说明。
例如,如图4所示,目前企业先在金融平台汇总进行申请,并通过金融平台进行数据转发(转发数据包括企业的申请信息)到金融机构,金融机构根据金融平台提供的数据对企业进行线上线下提供金融服务。单这样操作导致企业申请的成功率很低。而在本实施例中,则可以提高企业申请的成功率,如图5所示,先进行特征选择,即根据平台企业基本信息及成功申请的历史数据,通过特征选择筛选出独立且相关性较大的特征。再进行相似度计算,即使用企业当前特征信息计算企业与各资源信息成功申请时的特征的相似度,并筛选出相似度最高的K个企业申请时特征及对应的L个资源信息;再进行推荐指数计算,即根据成功申请的额度及申请时间计算这L个资源信息的推荐指数,选取推荐指数最高的信贷进行推荐;并进行效果定期评估,即跟踪推荐效果,并对特征进行定期更新,再每隔一段时间进行重新特征选取。
在本实施例中,通过获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。通过获取各个资源信息的历史数据,并将用户账号的当前特征值和历史数据中的多个历史特征值进行比较,以确定相似度值,也就是在计算相似度值时,综合考虑了资源信息的历史数据,提高了向用户账号推荐资源信息的准确性,并且还需要在这些相似度值中确定目标相似度值,并根据参数信息确定目标推荐指数,将目标推荐指数对应的资源信息进行推荐,使得本次推荐的效果更好,更符合用户的需求,提高了金融平台中推荐算法推荐的准确性。
进一步地,基于本发明资源信息推荐方法第一实施例,提出本发明资源信息推荐方法第二实施例。本实施例是本发明第一实施例的步骤S40,基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数的步骤的细化,包括:
步骤a,依次遍历各所述目标相似度值,并确定当前遍历的当前目标相似度值对应的参数信息;
在获取到各个目标相似度值和各个参数信息后,依次遍历各个目标相似度值,并在各个参数信息中确定当前遍历的当前目标相似度值对应的参数信息。
步骤b,根据预设推荐算法对所述当前目标相似度值和所述当前目标相似度值对应的参数信息进行计算,以获取所述当前目标相似度值对应的资源信息的推荐指数,直至各所述目标相似度值遍历完成。
通过预设推荐指数计算公式来对当前目标相似度值、当前目标相似度值对应的参数信息(如申请额度和申请时间)进行计算,以获取到当前目标相似度值对应的资源信息的推荐指数,并对所有目标相似度采用同样的方式进行计算,得到各个目标相似度对应的资源信息的推荐指数。其中预设推荐指数计算公式可以是:
其中m为K企业特征申请的信贷额度;为L个资源信息最大贷款额度的平均值;y为K企业特征申请时的距离10年前的时间长度,以年为单位,取2位小数;S(u,k)为上一步获得的企业与K企业特征的相似度,Li为上一步获得的资源信息集合L中的资源信息;N(L)为Li资源信息对应的K个企业特征个数;计算公式主要的含义是对资源信息集合L,可能多个企业特征Ki会对用同一个资源信息Li,按公式计算资源信息Li对应的多个企业特征Ki的推荐指数并汇总,就是用户对于资源信息Li的推荐指数,最后选择推荐指数最高的D(预设数量)个资源信息进行推荐。也就是对每个资源信息(即资源信息)均采用相同的方式进行计算得到各个推荐指数。
在本实施例中,通过根据预设推荐指数计算公式、目标相似度值、参数信息计算推荐指数,从而保障了获取到的推荐指数的准确性和有效性。
进一步地,计算用户账号的当前特征值与各所述历史特征值之间的相似度值的步骤,包括:
步骤d,获取所述当前特征值对应的当前标准化特征值和各所述历史特征值对应的历史标准化特征值;
当获取到当前特征值后,可以采用如z-score方式对当前当前特征值进行标准化,以得到当前特征值对应的当前标准化特征值,并采用同样的方式如z-score方式对各个历史特征值进行标准化,得到各个历史特征值对应的历史标准化特征值。
步骤e,根据所述当前标准化特征值和各所述历史标准化特征值确定所有相似度值。
当获取到当前标准化特征值和各个历史标准化特征值后,可以根据欧式距离来计算当前标准化特征值和各个历史标准化特征值之间的相似度值。
在本实施例中,通过获取当前标准化特征值和各个历史标准化特征值,再获取到各个相似度值,从而保障了获取到的相似度值的准确性。
具体地,获取所述当前特征值对应的当前标准化特征值和各所述历史特征值对应的历史标准化特征值的步骤,包括:
步骤f,基于预设数据处理方式对所述当前特征值进行标准化,以获取所述当前特征值对应的当前标准化特征值;
当获取到当前特征值后,采用预设数据处理方式对当前特征值进行标准化,以获取当前特征值对应的当前标准化特征值,如采用z-score方式进行。
步骤h,基于所述预设数据处理方式对各所述历史特征值进行标准化,以获取各所述历史特征值对应的历史标准化特征值。
需要说明的是,在对当前特征值进行标准化的方式和对各个历史特征值进行标准化的方式相同,也就是同样采用预设数据处理方式对各个历史特征值进行标准化,得到各个历史特征值对应的历史标准化特征值。
在本实施例中,通过根据预设数据处理方式对当前特征值进行标准化,并对各个历史特征值进行标准化,从而保障了获取到的当前标准化特征值和历史标准化特征值的准确性。
具体地,根据所述当前标准化特征值和各所述历史标准化特征值确定所有相似度值的步骤,包括:
步骤k,依次遍历各所述历史标准化特征值,并计算当前遍历的历史标准化特征值和所述当前标准化特征值之间的欧式距离;
当获取到各个历史标准化特征值后,可以依次遍历各个历史标准化特征值,并计算当前遍历的历史标准化特征值和当前标准化特征值之间的欧式距离。
步骤m,基于所述欧式距离确定当前遍历的历史标准化特征值和当前标准化特征值的相似度值,直至各所述历史标准化特征值遍历完成。
根据计算得到的欧式距离来确定当前遍历的历史标准化特征值和当前标准化特征值之间的相似度值,可以是欧式距离越小,两者之间的相似度值就越高。直至获取到所有的历史标准化特征值和当前标准化特征值的相似度值。并且对所有历史标准化特征值和打过去标准化特征值之间的相似度值计算方式相同。
在本实施例中,通过计算当前标准化特征值和历史标准化特征值之间的欧式距离,并根据欧式距离计算相似度值,从而保障了计算得到的相似度值的准确性。
进一步地,基于本发明资源信息推荐方法第一至第二任意一个实施例的基础上,提出本发明资源信息推荐方法第三实施例。本实施例是本发明第一实施例的步骤S10,基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值的步骤的细化,包括:
步骤n,基于预设校验算法对各所述历史数据进行离散化,以获取各所述历史数据对应的初级特征值;
当获取到各个历史数据后,可以通过预设校验算法(如卡方校验方法)对这些历史数据进行离散化,如对上年营业收入字段离散化后为:小于等于3000万为1,大于3000万并且小于等于1亿为2,大于1亿并且小于等于10亿为4,当对这些历史数据进行离散化后得到的各个结果就是各个历史数据对应的初级特征值。
其中,卡方检验是一种假设性检验的方法,它能够检验两个分类变量之间是否是独立无关的。它通过观察实际值和理论值的偏差来确定原假设是否成立。
步骤x,基于所述预设校验算法对各所述初级特征值进行评分,并基于评分结果获取与用户账号具有相关性的多个历史特征值。
当获取到各个初级特征值后,还可以采用过滤法中的卡方校验法(即预设校验算法)对每个初级特征值进行评分,并根据评分结果选取一定数量的评分较高的初级特征值作为与用户具有相关性的多个历史特征值。
在本实施例中,通过根据预设校验算法对各个历史数据进行离散化得到各个初级特征值,并对这些初级特征值进行评分,基于评分结果获取历史特征值,从而保障了获取到的历史特征值的准确性。
进一步地,计算用户账号的当前特征值与各所述历史特征值之间的相似度值的步骤之前,包括:
步骤y,获取用户账号的当前数据,并对所述当前数据进行离散数据编码,以获取所述当前账号的当前特征值。
当企业通过用户账号登录平台后,会自动获取用户账号的当前数据,并对这些当前数据进行离散数据编码,以得到当前账号的当前特征值。如对于像纳税人等级的有序序列{A->B->C->D}转换为有序数列如{1、2、3、4};对于行业等无序序列,采用one-hot编码,即假设有3个行业{金融业、采矿业、文化娱乐},则金融业编码为{1,0,0},采矿业编码为{0,1,0},文化娱乐编码为{0,0,1}。既会增加特征向量,得到当前账号的当前特征值。
在本实施例中,通过对当前数据进行离散数据编码,得到当前账号的当前特征值,从而保障了获取到的当前特征值的准确性。
本发明实施例还提供一种资源信息推荐装置,参照图3,所述资源信息推荐装置包括:
获取模块,用于获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;
计算模块,用于计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;
确定模块,用于基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;
推荐模块,用于基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。
可选地,所述推荐模块,还用于:
依次遍历各所述目标相似度值,并确定当前遍历的当前目标相似度值对应的参数信息;
根据预设推荐算法对所述当前目标相似度值和所述当前目标相似度值对应的参数信息进行计算,以获取所述当前目标相似度值对应的资源信息的推荐指数,直至各所述目标相似度值遍历完成。
可选地,所述计算模块,还用于:
获取所述当前特征值对应的当前标准化特征值和各所述历史特征值对应的历史标准化特征值;
根据所述当前标准化特征值和各所述历史标准化特征值确定所有相似度值。
可选地,所述计算模块,还用于:
基于预设数据处理方式对所述当前特征值进行标准化,以获取所述当前特征值对应的当前标准化特征值;
基于所述预设数据处理方式对各所述历史特征值进行标准化,以获取各所述历史特征值对应的历史标准化特征值。
可选地,所述计算模块,还用于:
依次遍历各所述历史标准化特征值,并计算当前遍历的历史标准化特征值和所述当前标准化特征值之间的欧式距离;
基于所述欧式距离确定当前遍历的历史标准化特征值和当前标准化特征值的相似度值,直至各所述历史标准化特征值遍历完成。
可选地,所述获取模块,还用于:
基于预设校验算法对各所述历史数据进行离散化,以获取各所述历史数据对应的初级特征值;
基于所述预设校验算法对各所述初级特征值进行评分,并基于评分结果获取与用户账号具有相关性的多个历史特征值。
所述资源信息推荐装置,还包括:
获取用户账号的当前数据,并对所述当前数据进行离散数据编码,以获取所述当前账号的当前特征值。
上述各程序模块所执行的方法可参照本发明资源信息推荐方法各个实施例,此处不再赘述。
本发明还提供一种计算机存储介质。
本发明计算机存储介质上存储有资源信息推荐程序,所述资源信息推荐程序被处理器执行时实现如上所述的资源信息推荐方法的步骤。
其中,在所述处理器上运行的资源信息推荐程序被执行时所实现的方法可参照本发明资源信息推荐方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种资源信息推荐方法,其特征在于,所述资源信息推荐方法包括如下步骤:
获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;
计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;
基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;
基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。
2.如权利要求1所述的资源信息推荐方法,其特征在于,所述基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数的步骤,包括:
依次遍历各所述目标相似度值,并确定当前遍历的当前目标相似度值对应的参数信息;
根据预设推荐算法对所述当前目标相似度值和所述当前目标相似度值对应的参数信息进行计算,以获取所述当前目标相似度值对应的资源信息的推荐指数,直至各所述目标相似度值遍历完成。
3.如权利要求1所述的资源信息推荐方法,其特征在于,所述计算用户账号的当前特征值与各所述历史特征值之间的相似度值的步骤,包括:
获取所述当前特征值对应的当前标准化特征值和各所述历史特征值对应的历史标准化特征值;
根据所述当前标准化特征值和各所述历史标准化特征值确定所有相似度值。
4.如权利要求3所述的资源信息推荐方法,其特征在于,所述获取所述当前特征值对应的当前标准化特征值和各所述历史特征值对应的历史标准化特征值的步骤,包括:
基于预设数据处理方式对所述当前特征值进行标准化,以获取所述当前特征值对应的当前标准化特征值;
基于所述预设数据处理方式对各所述历史特征值进行标准化,以获取各所述历史特征值对应的历史标准化特征值。
5.如权利要求3所述的资源信息推荐方法,其特征在于,所述根据所述当前标准化特征值和各所述历史标准化特征值确定所有相似度值的步骤,包括:
依次遍历各所述历史标准化特征值,并计算当前遍历的历史标准化特征值和所述当前标准化特征值之间的欧式距离;
基于所述欧式距离确定当前遍历的历史标准化特征值和当前标准化特征值的相似度值,直至各所述历史标准化特征值遍历完成。
6.如权利要求1所述的资源信息推荐方法,其特征在于,所述基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值的步骤,包括:
基于预设校验算法对各所述历史数据进行离散化,以获取各所述历史数据对应的初级特征值;
基于所述预设校验算法对各所述初级特征值进行评分,并基于评分结果获取与用户账号具有相关性的多个历史特征值。
7.如权利要求1-6任一项所述的资源信息推荐方法,其特征在于,所述计算用户账号的当前特征值与各所述历史特征值之间的相似度值的步骤之前,包括:
获取用户账号的当前数据,并对所述当前数据进行离散数据编码,以获取所述当前账号的当前特征值。
8.一种资源信息推荐装置,其特征在于,所述资源信息推荐装置包括:
获取模块,用于获取各资源信息的历史数据,并基于特征选择在各所述历史数据中获取与用户账号具有相关性的多个历史特征值;
计算模块,用于计算用户账号的当前特征值与各所述历史特征值之间的相似度值,并在各所述相似度值中获取预设数量的目标相似度值;
确定模块,用于基于各所述资源信息确定各所述目标相似度值对应的目标资源信息,并获取各所述目标资源信息中的参数信息;
推荐模块,用于基于预设推荐算法对各所述目标相似度值和各所述参数信息进行计算,以获取各所述资源信息对应的推荐指数,并在各所述推荐指数中确定数值最高的目标推荐指数,对所述目标推荐指数对应的资源信息进行推荐。
9.一种资源信息推荐设备,其特征在于,所述资源信息推荐设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的资源信息推荐程序,所述资源信息推荐程序被所述处理器执行时实现如权利要求1至7中任一项所述的资源信息推荐方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有资源信息推荐程序,所述资源信息推荐程序被处理器执行时实现如权利要求1至7中任一项所述的资源信息推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911145222.1A CN110851729A (zh) | 2019-11-19 | 2019-11-19 | 资源信息推荐方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911145222.1A CN110851729A (zh) | 2019-11-19 | 2019-11-19 | 资源信息推荐方法、装置、设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110851729A true CN110851729A (zh) | 2020-02-28 |
Family
ID=69603483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911145222.1A Pending CN110851729A (zh) | 2019-11-19 | 2019-11-19 | 资源信息推荐方法、装置、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110851729A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984864A (zh) * | 2020-08-14 | 2020-11-24 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备和存储介质 |
CN112016975A (zh) * | 2020-09-02 | 2020-12-01 | 中国平安财产保险股份有限公司 | 产品筛选方法、装置、计算机设备及可读存储介质 |
CN112100489A (zh) * | 2020-08-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 对象推荐的方法、装置和计算机存储介质 |
CN112182052A (zh) * | 2020-10-12 | 2021-01-05 | 中国铁塔股份有限公司 | 一种参数展示方法、装置、电子设备和可读存储介质 |
CN112464106A (zh) * | 2020-11-26 | 2021-03-09 | 上海哔哩哔哩科技有限公司 | 对象推荐方法及装置 |
CN112613426A (zh) * | 2020-12-26 | 2021-04-06 | 北京国腾联信科技有限公司 | 一种资源区域确定方法、装置、设备和存储介质 |
CN113836391A (zh) * | 2020-06-24 | 2021-12-24 | 北京达佳互联信息技术有限公司 | 资源推荐方法、装置、计算机设备及存储介质 |
CN116955736A (zh) * | 2023-09-15 | 2023-10-27 | 北京南天智联信息科技股份有限公司 | 数据标准中数据约束条件推荐方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992181A (zh) * | 2015-06-29 | 2015-10-21 | 昆明理工大学 | 一种根据图书馆用户习惯的实时图书推荐方法 |
CN107220852A (zh) * | 2017-05-26 | 2017-09-29 | 北京小度信息科技有限公司 | 用于确定目标推荐用户的方法、装置和服务器 |
CN108573032A (zh) * | 2018-03-27 | 2018-09-25 | 麒麟合盛网络技术股份有限公司 | 视频推荐方法及装置 |
CN109214856A (zh) * | 2018-07-27 | 2019-01-15 | 百度在线网络技术(北京)有限公司 | 用户意图的挖掘方法及装置、计算机设备及可读介质 |
CN109241415A (zh) * | 2018-08-20 | 2019-01-18 | 平安科技(深圳)有限公司 | 项目推荐方法、装置、计算机设备及存储介质 |
CN109426985A (zh) * | 2017-09-04 | 2019-03-05 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
CN109508407A (zh) * | 2019-01-14 | 2019-03-22 | 上海电机学院 | 融合时间与兴趣相似度的电视产品推荐方法 |
CN110163476A (zh) * | 2019-04-15 | 2019-08-23 | 重庆金融资产交易所有限责任公司 | 项目智能推荐方法、电子装置及存储介质 |
-
2019
- 2019-11-19 CN CN201911145222.1A patent/CN110851729A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992181A (zh) * | 2015-06-29 | 2015-10-21 | 昆明理工大学 | 一种根据图书馆用户习惯的实时图书推荐方法 |
CN107220852A (zh) * | 2017-05-26 | 2017-09-29 | 北京小度信息科技有限公司 | 用于确定目标推荐用户的方法、装置和服务器 |
CN109426985A (zh) * | 2017-09-04 | 2019-03-05 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
CN108573032A (zh) * | 2018-03-27 | 2018-09-25 | 麒麟合盛网络技术股份有限公司 | 视频推荐方法及装置 |
CN109214856A (zh) * | 2018-07-27 | 2019-01-15 | 百度在线网络技术(北京)有限公司 | 用户意图的挖掘方法及装置、计算机设备及可读介质 |
CN109241415A (zh) * | 2018-08-20 | 2019-01-18 | 平安科技(深圳)有限公司 | 项目推荐方法、装置、计算机设备及存储介质 |
CN109508407A (zh) * | 2019-01-14 | 2019-03-22 | 上海电机学院 | 融合时间与兴趣相似度的电视产品推荐方法 |
CN110163476A (zh) * | 2019-04-15 | 2019-08-23 | 重庆金融资产交易所有限责任公司 | 项目智能推荐方法、电子装置及存储介质 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113836391B (zh) * | 2020-06-24 | 2023-07-11 | 北京达佳互联信息技术有限公司 | 资源推荐方法、装置、计算机设备及存储介质 |
CN113836391A (zh) * | 2020-06-24 | 2021-12-24 | 北京达佳互联信息技术有限公司 | 资源推荐方法、装置、计算机设备及存储介质 |
CN111984864A (zh) * | 2020-08-14 | 2020-11-24 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备和存储介质 |
CN111984864B (zh) * | 2020-08-14 | 2023-12-26 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备和存储介质 |
CN112100489A (zh) * | 2020-08-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 对象推荐的方法、装置和计算机存储介质 |
CN112100489B (zh) * | 2020-08-27 | 2022-07-15 | 北京百度网讯科技有限公司 | 对象推荐的方法、装置和计算机存储介质 |
CN112016975A (zh) * | 2020-09-02 | 2020-12-01 | 中国平安财产保险股份有限公司 | 产品筛选方法、装置、计算机设备及可读存储介质 |
CN112182052A (zh) * | 2020-10-12 | 2021-01-05 | 中国铁塔股份有限公司 | 一种参数展示方法、装置、电子设备和可读存储介质 |
CN112464106A (zh) * | 2020-11-26 | 2021-03-09 | 上海哔哩哔哩科技有限公司 | 对象推荐方法及装置 |
CN112464106B (zh) * | 2020-11-26 | 2022-12-13 | 上海哔哩哔哩科技有限公司 | 对象推荐方法及装置 |
CN112613426A (zh) * | 2020-12-26 | 2021-04-06 | 北京国腾联信科技有限公司 | 一种资源区域确定方法、装置、设备和存储介质 |
CN116955736A (zh) * | 2023-09-15 | 2023-10-27 | 北京南天智联信息科技股份有限公司 | 数据标准中数据约束条件推荐方法及系统 |
CN116955736B (zh) * | 2023-09-15 | 2023-12-01 | 北京南天智联信息科技股份有限公司 | 数据标准中数据约束条件推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110851729A (zh) | 资源信息推荐方法、装置、设备及计算机存储介质 | |
CN111708949B (zh) | 医疗资源的推荐方法及装置、电子设备、存储介质 | |
CN110866181B (zh) | 资源推荐的方法、装置及存储介质 | |
US10169730B2 (en) | System and method to present a summarized task view in a case management system | |
US20150356085A1 (en) | Guided Predictive Analysis with the Use of Templates | |
CN106991175B (zh) | 一种客户信息挖掘方法、装置、设备以及存储介质 | |
US8949237B2 (en) | Detecting overlapping clusters | |
CN111178005B (zh) | 数据处理系统、方法及存储介质 | |
CN110674391A (zh) | 基于大数据的产品数据推送方法、系统和计算机设备 | |
CN111210321B (zh) | 一种基于合同管理的风险预警方法及系统 | |
CN115564486A (zh) | 一种数据推送方法、装置、设备和介质 | |
CN117216396A (zh) | 基于大数据分析的智能推荐方法、装置、设备及存储介质 | |
US11017452B2 (en) | Concerted learning and multi-instance sequential prediction tree | |
CN112487021B (zh) | 业务数据的关联分析方法、装置及设备 | |
Paulraj et al. | Improving business intelligence based on frequent itemsets using k-means clustering algorithm | |
Shyr et al. | Automated data analysis | |
CN114282976B (zh) | 供应商推荐方法、装置、电子设备及介质 | |
Wasilewski et al. | Clustering methods for adaptive e-commerce user interfaces | |
CN114925275A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN114240553A (zh) | 车辆保险产品的推荐方法、装置、设备及存储介质 | |
CN112989020B (zh) | 信息处理方法、装置和计算机可读存储介质 | |
US11494455B2 (en) | Framework for just-in-time decision support analytics | |
US9928303B2 (en) | Merging data analysis paths | |
CN112016975A (zh) | 产品筛选方法、装置、计算机设备及可读存储介质 | |
CN111506826A (zh) | 基于亲密度的用户推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200228 |