CN112785197B - 信息推荐方法、装置、计算设备、介质和程序产品 - Google Patents

信息推荐方法、装置、计算设备、介质和程序产品 Download PDF

Info

Publication number
CN112785197B
CN112785197B CN202110157828.8A CN202110157828A CN112785197B CN 112785197 B CN112785197 B CN 112785197B CN 202110157828 A CN202110157828 A CN 202110157828A CN 112785197 B CN112785197 B CN 112785197B
Authority
CN
China
Prior art keywords
target
index
user
determining
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110157828.8A
Other languages
English (en)
Other versions
CN112785197A (zh
Inventor
王栋
董武平
向阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110157828.8A priority Critical patent/CN112785197B/zh
Publication of CN112785197A publication Critical patent/CN112785197A/zh
Application granted granted Critical
Publication of CN112785197B publication Critical patent/CN112785197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种信息推荐方法,可用于金融领域或其他领域。该方法包括:获取多个第一用户的待选指标数据,其中,多个第一用户具有第一用户特征,待选指标数据包括多种待选指标的值;根据待选指标数据,确定多种待选指标中的每种待选指标与第一用户特征之间的相关系数;根据相关系数,确定多种待选指标中的目标指标;根据待选指标数据,确定目标指标的目标数值范围;获取多个第二用户的目标指标的值,并确定多个第二用户中目标指标的值处于目标数值范围内的第二用户作为目标用户,其中,第二用户具有与第一用户特征对应的第二用户特征;以及对目标用户进行信息推荐。本公开还提供了一种信息推荐装置、计算设备、存储介质以及计算机程序产品。

Description

信息推荐方法、装置、计算设备、介质和程序产品
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种信息推荐方法、装置、一种计算设备、一种计算机存储介质以及一种计算机程序产品。
背景技术
相关技术所采用的信息推荐的方案包括以下两种。一是通过运营人员或业务人员的经验圈选目标用户,比如选取活跃度较高的、存款数额较大的用户,由数据人员选出这些用户,并针对这些用户进行信息推荐;二是通过预先对用户设置标签,运营人员或业务人员根据需求,选取一个或多个标签组成标签组合,针对与标签组合中的标签对应的用户作为目标用户来进行信息推荐。
相关技术至少具有以下缺点:通过运营人员或业务人员的经验进行圈选目标用户,在对用户进行信息推荐时的精准性较差。另外根据运营人员或业务人员的经验进行标签组合的选取,缺乏数据依据,在对用户进行信息推荐时的精准性同样较差。
发明内容
本公开的一个方面提供了一种信息推荐方法,包括:获取多个第一用户的待选指标数据,其中,所述多个第一用户具有第一用户特征,所述待选指标数据包括多种待选指标的值;根据所述待选指标数据,确定所述多种待选指标中的每种待选指标与第一用户特征之间的相关系数;根据所述相关系数,确定所述多种待选指标中的目标指标;根据所述待选指标数据,确定所述目标指标的目标数值范围;获取多个第二用户的目标指标的值,并确定所述多个第二用户中目标指标的值处于所述目标数值范围内的第二用户作为目标用户,其中,所述第二用户具有与所述第一用户特征对应的第二用户特征;以及对所述目标用户进行信息推荐。
可选地,所述获取多个第一用户的待选指标数据包括:获取多个第一用户的原始指标数据,所述原始指标数据包括多个原始指标的值;针对所述多个原始指标进行共线性检验和/或异方差检验;以及确定通过线性检验和/或异方差检验的原始指标作为所述待选指标。
可选地,所述针对所述多个原始指标进行共线性检验包括:确定所述多个原始指标中每个原始指标的方差膨胀系数;以及在所述原始指标的方差膨胀系数小于方差膨胀系数阈值的情况下,确定所述原始指标通过共线性校验。
可选地,所述针对所述多个原始指标进行异方差检验包括:确定所述多个原始指标中每个原始指标的卡方值;以及在所述原始指标的卡方值大于卡方值阈值的情况下,确定所述原始指标通过异方差检验。
可选地,所述多种待选指标包括数值型的指标和/或非数值型的指标;所述根据所述待选指标数据,确定所述多种待选指标中的每种待选指标与第一用户特征之间的相关系数,包括:利用统计数据分析系统中的proc corr过程计算所述数值型的指标与第一用户特征的相关系数;以及/或者利用统计数据分析系统中的proc nlin过程计算所述非数值的型指标与第一用户特征的相关系数。
可选地,根据所述相关系数,确定所述多种待选指标中的目标指标,包括:确定所述多种待选指标中相关系数的绝对值大于系数阈值的待选指标作为目标指标。
可选地,所述根据所述待选指标数据,确定所述目标指标的目标数值范围,包括:对于每个数值型的目标指标,在与所述目标指标对应的第一用户的数量服从正态分布的情况下,确定正态分布数据;获取预设置信区间;根据所述预设置信区间和所述正态分布数据,确定与每个数值型指标对应的目标数值范围;以及/或者对于非数值型的目标指标,根据所述多个第一用户的目标指标的值,确定所述目标指标的目标数值范围。
可选地,所述第一用户特征包括通过实名认证,所述第二用户特征包括未通过实名认证。
本公开的另一个方面提供了一种信息推荐装置,包括:获取模块,用于获取多个第一用户的待选指标数据,其中,所述多个第一用户具有第一用户特征,所述待选指标数据包括多种待选指标的值;相关系数确定模块,用于根据所述待选指标数据,确定所述多种待选指标中的每种待选指标与第一用户特征之间的相关系数;目标指标确定模块,用于根据所述相关系数,确定所述多种待选指标中的目标指标;目标数值范围确定模块,用于根据所述待选指标数据,确定所述目标指标的目标数值范围;目标用户确定模块,用于获取多个第二用户的目标指标的值,并确定所述多个第二用户中目标指标的值处于所述目标数值范围内的第二用户作为目标用户,其中,所述第二用户具有与所述第一用户特征对应的第二用户特征;以及推荐模块,用于对所述目标用户进行信息推荐。
本公开的另一个方面提供了一种计算设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开实施例的又一方面,提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现根据本公开实施例的方法。
根据本公开的实施例,通过对具有第一用户特征的用户的指标进行分析,得到目标指标和目标指标的目标数值范围,然后根据目标指标的值,从具有第二用户特征的用户中选择目标指标的值处于目标数值范围内的目标用户,作为信息推荐的对象,从而可以提高对用户进行信息推荐时的精准性。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开的实施例的信息推荐方法和信息推荐装置的应用场景;
图2示意性示出了根据本公开的实施例的信息推荐方法的流程图;
图3示意性示出了根据本公开的实施例的信息推荐装置的框图;以及
图4示意性示出了根据本公开实施例的适于实现本公开实施例描述的方法的计算机系统的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
本公开的实施例提供了一种信息推荐方法以及能够应用该方法的信息推荐装置。该方法包括获取多个第一用户的待选指标数据,其中,多个第一用户具有第一用户特征,待选指标数据包括多种待选指标的值;根据待选指标数据,确定多种待选指标中的每种待选指标与第一用户特征之间的相关系数;根据相关系数,确定多种待选指标中的目标指标;根据待选指标数据,确定目标指标的目标数值范围;获取多个第二用户的目标指标的值,并确定多个第二用户中目标指标的值处于目标数值范围内的第二用户作为目标用户,其中,第二用户具有与第一用户特征对应的第二用户特征;以及对目标用户进行信息推荐。
需要说明的是,本公开实施例的信息推荐方法和装置可用于金融领域,也可用于除金融领域之外的任意领域,本公开对信息推荐方法和装置的应用领域不做限定。
图1示意性示出了根据本公开的实施例的信息推荐方法和信息推荐装置的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的信息推荐方法一般可以由服务器105执行。相应地,本公开实施例所提供的信息推荐装置一般可以设置于服务器105中。本公开实施例所提供的信息推荐方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信息推荐装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开的实施例的信息推荐方法的流程图。
如图2所示,该方法包括操作S210~S260。
在操作S210,获取多个第一用户的待选指标数据。
其中,多个第一用户具有第一用户特征,待选指标数据包括多种待选指标的值。根据本公开的实施例,第一用户特征与第二用户特征为相互对应的特征,具有第二用户特征的用户可以通过特定操作,将第二用户特征转化为第一用户特征。示例性地,本实施例中,第一用户特征例如可以包括实名特征,用于表示用户通过实名认证,第二用户特征例如可以包括非实名特征,用于表示用户未通过实名认证。第一用户可以为已通过实名认证的用户,第二用户可以为未通过实名认证的用户。具有非实名特征的用户可以通过实名认证操作,将非实名特征转化为实名特征。在本公开其他实施例中,第一用户特征和第二用户特征也可以包括其他相互对应的特征。
根据本公开的实施例,可以获取多个第一用户的原始指标数据,原始指标数据包括多个原始指标的值。然后针对多个原始指标进行共线性检验和/或异方差检验,确定通过线性检验和/或异方差检验的原始指标作为待选指标。其中,原始指标例如可以包括银行客户资产和金融属性指标,以及个人特征画像指标等,其中,银行客户资产和金融属性指标例如可以包括存款理财等资产分布特征、电子银行特征等,个人特征画像指标例如可以包括年龄、性别、地理位置等。需要说明的是,在实际应用的过程中,原始指标还可以包括其他指标,本公开对此不作具体的限定。
根据本公开的实施例,原始指标可以包括数值型指标和非数值型指标,数值型指标例如可以包括存款余额、交易笔数等,非数值型指标例如可以包括年龄、性别、地理位置等。
根据本公开的实施例,针对多个原始指标进行共线性检验例如可以包括:确定多个原始指标中每个原始指标的方差膨胀系数,在原始指标的方差膨胀系数小于方差膨胀系数阈值的情况下,确定原始指标通过共线性校验,在方差膨胀系数大于或等于方差膨胀系数阈值的情况下,确定原始指标没有通过共线性校验。
根据本公开的实施例,可以根据以下公式计算方差膨胀系数。
其中,VIF为方差膨胀系数,Ri为自变量,例如可以包括年龄、性别、地理位置、存款理财资产分布特征、电子银行特征等指标。
示例性地,本实施例中,方差膨胀系数阈值设置为10。需要说明的是,在实际应用的过程中,方差膨胀系数阈值还可以被设置为其他值,本公开对此不作具体的限定。
根据本公开的实施例,可以利用统计数据分析系统完成上述共线性校验。更具体地,可以执行统计数据分析系统(SAS)中的proc reg函数,将全部变量,即原始指标放入函数中,根据model y=x1 x2.../VIF,得出各个变量的VIF指数,将VIF系数大于10的剔除,以完成共线性检验。其中,y为第一用户特征,x1、x2...为各原始指标。
根据本公开的实施例,可以使用White检验方法进行异方差性检验。基于此,针对多个原始指标进行异方差检验例如可以包括:确定多个原始指标中每个原始指标的卡方值;以及在原始指标的卡方值大于卡方值阈值的情况下,确定原始指标通过异方差检验。示例性地,本实施例中,卡方值阈值可以为0.05。需要说明的是,在实际应用的过程中,卡方值阈值还可以被设置为其他值,本公开对此不作具体的限定。
根据本公开的实施例,可以利用统计数据分析系统完成上述异方差检验。更具体地,可以执行统计数据分析系统中的proc reg函数,在proc reg过程结束后,得到的执行结果。然后在该执行结果中的报表中读取Chi-square value(卡方值),若Chi-square value≥0.05,则确定不存在异方差,即异方差校验通过,若Chi-square value<0.05,则确定存在异方差,即异方差校验没有通过。
在操作S220,根据待选指标数据,确定多种待选指标中的每种待选指标与第一用户特征之间的相关系数。
根据本公开的实施例,可以利用统计数据分析系统中的proc corr过程计算数值型的指标与第一用户特征的相关系数。更具体地,可以执行SAS中的proc corr指令,并用var关键字将各数值型的指标列出,以计算相关系数。
根据本公开的实施例,还可以利用统计数据分析系统SAS中的proc nlin过程计算非数值的型指标与第一用户特征的相关系数,更具体地,执行SAS中的proc nlin指令,并用model y=x1 x3...将非线性变量(即非数值型的指标)列出,以计算相关系数,其中,y为因变量,x1 x3...为自变量。
在操作S230,根据相关系数,确定多种待选指标中的目标指标。
根据本公开的实施例,可以确定多种待选指标中相关系数的绝对值大于系数阈值的待选指标作为目标指标。
根据本公开的实施例,系数阈值可以根据实际需要进行设置,本公开对系数阈值的具体值不作具体的限定。
在操作S240,根据待选指标数据,确定目标指标的目标数值范围。
根据本公开的实施例,可以对于每个数值型的目标指标,进行正态分布校验。在与目标指标对应的第一用户的数量服从正态分布的情况下,确定正态分布数据。然后获取预设置信区间,根据预设置信区间和正态分布数据,确定与每个数值型指标对应的目标数值范围。
根据本公开的实施例,置信区间是指根据数据集的均值和方差,计算出来的该组数据的特征区间。示例性地,本实施例中,预设置信区间可以根据实际需要在90%~99%中选取。需要说明的是,在实际应用的过程中,预设置信区间也可以被设置为其他值,本公开对此不作具体限定。根据本公开另一些实施例,也可以动态调整置信区间直至区间中第二用户人数满足需要的人数目标。
根据本公开的实施例,对于非数值型的目标指标,可以根据多个第一用户的目标指标的值,确定目标指标的目标数值范围。例如,可以将多个第一用户的目标指标的值组成一个集合,作为目标数值范围。
在操作S250,获取多个第二用户的目标指标的值,并确定多个第二用户中目标指标的值处于目标数值范围内的第二用户作为目标用户。
在操作S260,对目标用户进行信息推荐。
根据本公开的实施例,向目标用户推荐的信息例如可以为广告宣传信息,可以通过向目标用户进行信息推荐来激励用户将第二用户特征转化为第一用户特征。
根据本公开的实施例,可以向目标用户所对应的终端设备发送相应的信息,以向目标用户进行信息推荐。
根据本公开的实施例,通过对具有第一用户特征的用户的指标进行分析,得到目标指标和目标指标的目标数值范围,然后根据目标指标的值,从具有第二用户特征的用户中选择目标指标的值处于目标数值范围内的目标用户,作为信息推荐的对象,从而可以提高对用户进行信息推荐时的精准性。
下面结合具体实施例对图2所示的方法做进一步说明。本领域技术人员可以理解,以下示例实施例仅用于理解本公开,本公开并不局限于此。
示例性地,本实施例中,第一用户特征为实名特征,用于表示用户通过实名认证,第二用户特征为非实名特征,用于表示用户未通过实名认证。第一用户为已通过实名认证的用户,即实名用户。第二用户为未通过实名认证的用户,即非实名用户。非实名用户可以通过实名认证操作转化为实名用户。第一用户的原始指标例如表1所示。
表1
将原始指标数据输入proc_reg函数,并设置model y=x1 x2...xn/VIF,其中,x1、x2、...xn为自变量,本实施例中,自变量包括各原始指标,y为因变量,本实施例中,因变量包括实名与非实名,其中实名以1表示,非实名以0表示。
在proc_reg函数输出计算结果之后,根据计算结果,进行共线性检验。根据检验结果中的Chi-square value,判断是否存在异方差。若Chi-square的值≥0.05,则确定不存在异方差。
对于不存在异方差的指标,将指标中的线性指标输入proc corr,计算该指标与实名特征之间的相关系数,将指标中的非线性指标输入proc nlin,计算该指标与实名特征之间的相关系数。
对于每个线性指标,在线性指标与实名的相关系数大于相关系数阈值的情况下,确定该线性指标所对应的实名用户人数所服从的正态分布。针对每个指标的正态分布数据,确定预设置信区间所对应的指标数据范围,根据目标数值范围,从非实名用户集中确定指标处于目标数值范围的目标用户,对目标用户进行信息推荐。根据本公开的实施例,可以动态调整置信区间直至区间中非实名人数满足需要的人数目标。
对于非线性指标,在非线性指标与实名特征的相关系数大于相关系数阈值的情况下,根据实名用户群中该非线性指标的值确定目标数值范围。根据目标数值范围,从非实名用户集中确定指标处于目标数值范围的目标用户,对目标用户进行信息推荐。
根据本公开的实施例,通过对实名用户进行特征分析,选取实名用户特征的置信区间。将实名用户特征的置信区间作为参考,对非实名用户进行圈选,圈选出的非实名用户转化为实名用户的概率较大,对这些圈选出的用户进行关于实名操作的信息推荐,效果更好,从而提高了信息推荐的准确性。
图3示意性示出了根据本公开的实施例的信息推荐装置的框图。
如图3所示,信息推荐装置300包括获取模块310、相关系数确定模块320、目标指标确定模块330、目标数值范围确定模块340、目标用户确定模块350和推荐模块360。该信息推荐装置300可以执行上面参考图2描述的方法。
具体地,获取模块310,例如可以用于获取多个第一用户的待选指标数据,其中,多个第一用户具有第一用户特征,待选指标数据包括多种待选指标的值。
根据本公开的实施例,获取模块310具体可以用于获取多个第一用户的原始指标数据,原始指标数据包括多个原始指标的值;针对多个原始指标进行共线性检验和/或异方差检验;确定通过线性检验和/或异方差检验的原始指标作为待选指标。
相关系数确定模块320,例如可以用于根据待选指标数据,确定多种待选指标中的每种待选指标与第一用户特征之间的相关系数。
根据本公开的实施例,多种待选指标包括数值型的指标和/或非数值型的指标。相关系数确定模块320具体可以用于利用统计数据分析系统中的proc corr过程计算数值型的指标与第一用户特征的相关系数;以及/或者利用统计数据分析系统中的proc nlin过程计算非数值的型指标与第一用户特征的相关系数。
目标指标确定模块330,例如可以用于根据相关系数,确定多种待选指标中的目标指标。
根据本公开的实施例,目标指标确定模块330具体可以用于确定多种待选指标中相关系数的绝对值大于系数阈值的待选指标作为目标指标。
目标数值范围确定模块340,例如可以用于根据待选指标数据,确定目标指标的目标数值范围。
根据本公开的实施例,目标数值范围确定模块340具体可以用于对于每个数值型的目标指标,在与目标指标对应的第一用户的数量服从正态分布的情况下,确定正态分布数据;获取预设置信区间;根据预设置信区间和正态分布数据,确定与每个数值型指标对应的目标数值范围;以及/或者对于非数值型的目标指标,根据多个第一用户的目标指标的值,确定目标指标的目标数值范围。
目标用户确定模块350,例如可以用于获取多个第二用户的目标指标的值,并确定多个第二用户中目标指标的值处于目标数值范围内的第二用户作为目标用户,其中,第二用户具有与第一用户特征对应的第二用户特征。
推荐模块360,例如可以用于对目标用户进行信息推荐。
根据本公开的实施例,通过对具有第一用户特征的用户的指标进行分析,得到目标指标和目标指标的目标数值范围,然后根据目标指标的值,从具有第二用户特征的用户中选择目标指标的值处于目标数值范围内的目标用户,作为信息推荐的对象,从而可以提高对用户进行信息推荐时的精准性。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块310、相关系数确定模块320、目标指标确定模块330、目标数值范围确定模块340、目标用户确定模块350和推荐模块360中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块310、相关系数确定模块320、目标指标确定模块330、目标数值范围确定模块340、目标用户确定模块350和推荐模块360中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块310、相关系数确定模块320、目标指标确定模块330、目标数值范围确定模块340、目标用户确定模块350和推荐模块360中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图4示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机系统的方框图。图4示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括处理器410以及计算机可读存储介质420。该计算机系统400可以执行根据本公开实施例的方法。
具体地,处理器410例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器410还可以包括用于缓存用途的板载存储器。处理器410可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质420,例如可以是非易失性的计算机可读存储介质,具体示例包括但不限于:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;等等。
计算机可读存储介质420可以包括计算机程序421,该计算机程序421可以包括代码/计算机可执行指令,其在由处理器410执行时使得处理器410执行根据本公开实施例的方法或其任何变形。
计算机程序421可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序421中的代码可以包括一个或多个程序模块,例如包括421A、模块421B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器410执行时,使得处理器410可以执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,获取模块310、相关系数确定模块320、目标指标确定模块330、目标数值范围确定模块340、目标用户确定模块350和推荐模块360中的至少一个可以实现为参考图4描述的计算机程序模块,其在被处理器410执行时,可以实现上面描述的相应操作。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行本公开实施例所提供的方法的程序代码,当计算机程序产品在电子设备上运行时,该程序代码用于使电子设备实现本公开实施例所提供的信息推荐方法。
在该计算机程序被处理器410执行时,执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分被下载和安装,和/或从可拆卸介质被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (11)

1.一种信息推荐方法,包括:
获取多个第一用户的待选指标数据,其中,所述多个第一用户具有第一用户特征,所述待选指标数据包括多种待选指标的值;
根据所述待选指标数据,确定所述多种待选指标中的每种待选指标与第一用户特征之间的相关系数;
根据所述相关系数,确定所述多种待选指标中的目标指标;
根据所述待选指标数据,确定所述目标指标的目标数值范围;
获取多个第二用户的目标指标的值,并确定所述多个第二用户中目标指标的值处于所述目标数值范围内的第二用户作为目标用户,其中,所述第二用户具有与所述第一用户特征对应的第二用户特征;以及
对所述目标用户进行信息推荐,
其中,所述第一用户特征包括实名特征,所述实名特征用于表示用户通过实名认证,所述第二用户特征包括非实名特征,所述非实名特征用于表示用户未通过实名认证。
2.根据权利要求1所述的方法,其中,所述获取多个第一用户的待选指标数据包括:
获取多个第一用户的原始指标数据,所述原始指标数据包括多个原始指标的值;
针对所述多个原始指标进行共线性检验和/或异方差检验;以及
确定通过线性检验和/或异方差检验的原始指标作为所述待选指标。
3.根据权利要求2所述的方法,其中,所述针对所述多个原始指标进行共线性检验包括:
确定所述多个原始指标中每个原始指标的方差膨胀系数;以及
在所述原始指标的方差膨胀系数小于方差膨胀系数阈值的情况下,确定所述原始指标通过共线性校验。
4.根据权利要求2所述的方法,其中,所述针对所述多个原始指标进行异方差检验包括:
确定所述多个原始指标中每个原始指标的卡方值;以及
在所述原始指标的卡方值大于卡方值阈值的情况下,确定所述原始指标通过异方差检验。
5.根据权利要求1所述的方法,其中,所述多种待选指标包括数值型的指标和/或非数值型的指标;所述根据所述待选指标数据,确定所述多种待选指标中的每种待选指标与第一用户特征之间的相关系数,包括:
利用统计数据分析系统中的proc corr过程计算所述数值型的指标与第一用户特征的相关系数;以及/或者
利用统计数据分析系统中的proc nlin过程计算所述非数值的型指标与第一用户特征的相关系数。
6.根据权利要求1所述的方法,其中,根据所述相关系数,确定所述多种待选指标中的目标指标,包括:
确定所述多种待选指标中相关系数的绝对值大于系数阈值的待选指标作为目标指标。
7.根据权利要求5所述的方法,其中,所述根据所述待选指标数据,确定所述目标指标的目标数值范围,包括:
对于每个数值型的目标指标,在与所述目标指标对应的第一用户的数量服从正态分布的情况下,确定正态分布数据;获取预设置信区间;根据所述预设置信区间和所述正态分布数据,确定与每个数值型指标对应的目标数值范围;以及/或者
对于非数值型的目标指标,根据所述多个第一用户的目标指标的值,确定所述目标指标的目标数值范围。
8.一种信息推荐装置,包括:
获取模块,用于获取多个第一用户的待选指标数据,其中,所述多个第一用户具有第一用户特征,所述待选指标数据包括多种待选指标的值;
相关系数确定模块,用于根据所述待选指标数据,确定所述多种待选指标中的每种待选指标与第一用户特征之间的相关系数;
目标指标确定模块,用于根据所述相关系数,确定所述多种待选指标中的目标指标;
目标数值范围确定模块,用于根据所述待选指标数据,确定所述目标指标的目标数值范围;
目标用户确定模块,用于获取多个第二用户的目标指标的值,并确定所述多个第二用户中目标指标的值处于所述目标数值范围内的第二用户作为目标用户,其中,所述第二用户具有与所述第一用户特征对应的第二用户特征,其中,所述第一用户特征包括实名特征,所述实名特征用于表示用户通过实名认证,所述第二用户特征包括非实名特征,所述非实名特征用于表示用户未通过实名认证;以及
推荐模块,用于对所述目标用户进行信息推荐。
9.一种计算设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序,
其中,当一个或多个计算机程序被一个或多个处理器执行时,使得一个或多个处理器实现权利要求1至7中任一项的方法。
10.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至7中任一项的方法。
11.一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现根据权利要求1至7中任一项所述的方法。
CN202110157828.8A 2021-02-04 2021-02-04 信息推荐方法、装置、计算设备、介质和程序产品 Active CN112785197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110157828.8A CN112785197B (zh) 2021-02-04 2021-02-04 信息推荐方法、装置、计算设备、介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110157828.8A CN112785197B (zh) 2021-02-04 2021-02-04 信息推荐方法、装置、计算设备、介质和程序产品

Publications (2)

Publication Number Publication Date
CN112785197A CN112785197A (zh) 2021-05-11
CN112785197B true CN112785197B (zh) 2024-03-29

Family

ID=75760916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110157828.8A Active CN112785197B (zh) 2021-02-04 2021-02-04 信息推荐方法、装置、计算设备、介质和程序产品

Country Status (1)

Country Link
CN (1) CN112785197B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180046266A (ko) * 2016-10-27 2018-05-08 에스케이플래닛 주식회사 신규고객 마케팅 서비스 시스템 및 방법
CN109062938A (zh) * 2018-06-15 2018-12-21 平安科技(深圳)有限公司 定向推荐用户的方法、装置及存储介质、服务器
CN111414548A (zh) * 2020-05-09 2020-07-14 中国工商银行股份有限公司 对象推荐方法、装置、电子设备和介质
CN111538907A (zh) * 2020-06-05 2020-08-14 支付宝(杭州)信息技术有限公司 一种对象推荐方法、系统及装置
KR20200145784A (ko) * 2019-06-21 2020-12-30 (주) 어라운드어스 프로젝트 업무 및 참여 경력 자동 추가에 기반한 온라인 사용자 프로필 관리 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180046266A (ko) * 2016-10-27 2018-05-08 에스케이플래닛 주식회사 신규고객 마케팅 서비스 시스템 및 방법
CN109062938A (zh) * 2018-06-15 2018-12-21 平安科技(深圳)有限公司 定向推荐用户的方法、装置及存储介质、服务器
KR20200145784A (ko) * 2019-06-21 2020-12-30 (주) 어라운드어스 프로젝트 업무 및 참여 경력 자동 추가에 기반한 온라인 사용자 프로필 관리 시스템 및 방법
CN111414548A (zh) * 2020-05-09 2020-07-14 中国工商银行股份有限公司 对象推荐方法、装置、电子设备和介质
CN111538907A (zh) * 2020-06-05 2020-08-14 支付宝(杭州)信息技术有限公司 一种对象推荐方法、系统及装置

Also Published As

Publication number Publication date
CN112785197A (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
US11068797B2 (en) Automatic correction of indirect bias in machine learning models
US20190012683A1 (en) Method for predicting purchase probability based on behavior sequence of user and apparatus for the same
US11188678B2 (en) Detection and prevention of privacy violation due to database release
WO2020150611A1 (en) Systems and methods for entity performance and risk scoring
CN111666304A (zh) 数据处理装置、数据处理方法、存储介质与电子设备
Gupta et al. Mobile Cloud Computing: A Scientometric Assessment of Global Publications Output during 2007-16.
CN109829593B (zh) 目标对象的信用度确定方法、装置、存储介质及电子装置
US10474688B2 (en) System and method to recommend a bundle of items based on item/user tagging and co-install graph
CN111275071B (zh) 预测模型训练、预测方法、装置及电子设备
CN112785197B (zh) 信息推荐方法、装置、计算设备、介质和程序产品
WO2020150597A1 (en) Systems and methods for entity performance and risk scoring
US11853948B2 (en) Methods and systems for managing risk with respect to potential customers
CN110020118B (zh) 一种计算用户之间相似度的方法及装置
CN116091249A (zh) 交易风险的评估方法、装置、电子设备和介质
KR101927273B1 (ko) 미청구공사의 위험도 평가 시스템 및 평가 장치
CN114493850A (zh) 基于人工智能的在线公证方法、系统及存储介质
CN112214387B (zh) 基于知识图谱的用户操作行为预测方法及装置
CN111125514A (zh) 用户行为分析的方法、装置、电子设备和存储介质
CN116629639B (zh) 评估信息确定方法、装置、介质与电子设备
CN112651804B (zh) 合约机的推荐方法及推荐系统
TWI657393B (zh) 行銷客群預測系統及其方法
US20220284485A1 (en) Stratified social review recommendation
CN116484097A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
US10891664B2 (en) System and method for facilitating non-parametric weighted correlation analysis
CN116304326A (zh) 访问路径的分析方法、装置、电子设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant