CN111967970B - 基于spark平台的银行产品推荐方法及装置 - Google Patents
基于spark平台的银行产品推荐方法及装置 Download PDFInfo
- Publication number
- CN111967970B CN111967970B CN202010833147.4A CN202010833147A CN111967970B CN 111967970 B CN111967970 B CN 111967970B CN 202010833147 A CN202010833147 A CN 202010833147A CN 111967970 B CN111967970 B CN 111967970B
- Authority
- CN
- China
- Prior art keywords
- product
- user
- historical
- information
- portrait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 39
- 238000004140 cleaning Methods 0.000 claims description 19
- 238000001914 filtration Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 230000006399 behavior Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于spark平台的银行产品推荐方法及装置,其中方法包括:获得待推荐银行产品的产品信息;对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;根据所述用户画像,从数据库中提取目标用户列表。本发明可以有针对性的向用户推荐银行产品,保证集群资源合理分配,提高推荐准确率及用户体验。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及基于spark平台的银行产品推荐方法及装置。
背景技术
目前,商业银行无论是金融类产品还是非金融类产品都已经达到成千上万级别,并且目前零售业务也越来越受银行和用户的青睐,银行在零售方面为用户提供个性化的产品也是获取优质用户的重要渠道。无论是在金融产品还是非金融零售产品方面,有针对性的向用户推荐产品可以有效提高用户体验,带动整体用户量的增长。
目前各大银行的产品种类繁多,不同场景的需求也是千千万万,现有的银行产品推荐方法存在推荐结果不准确,集群资源分配不均的问题,从而影响用户体验。
发明内容
本发明实施例提供一种基于spark平台的银行产品推荐方法,用以有针对性的向用户推荐银行产品,保证集群资源合理分配,提高推荐准确率及用户体验,该方法包括:
获得待推荐银行产品的产品信息;
对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;
根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;
根据所述用户画像,从数据库中提取目标用户列表,包括:根据用户画像和产品画像信息以及实际业务场景构造用户特征与产品特征以及产品之间的强关联关系,存入关系型数据库中;根据待推荐银行产品的标签,如果存在待推荐产品特征、用户特征及产品特征之间的强关联关系,将根据用户特征与产品特征以及产品之间的强关联关系生成的推荐用户列表,与协同过滤算法生成的推荐用户列表结合作为最终的推荐列表;如果该产品不存在强关联关系,将协同过滤算法生成的推荐列表作为最终的用户推荐列表;协同过滤算法利用用户画像、产品画像信息、用户的行为信息生成推荐用户列表。
本发明实施例提供一种基于spark平台的银行产品推荐装置,用以有针对性的向用户推荐银行产品,保证集群资源合理分配,提高推荐准确率及用户体验,该装置包括:
信息获得模块,用于获得待推荐银行产品的产品信息;
产品画像生成模块,用于对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;
用户画像确定模块,用于根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;
用户列表提取模块,用于根据所述用户画像,从数据库中提取目标用户列表;
用户列表提取模块,具体用于根据用户画像和产品画像信息以及实际业务场景构造用户特征与产品特征以及产品之间的强关联关系,存入关系型数据库中;根据待推荐银行产品的标签,如果存在待推荐产品特征、用户特征及产品特征之间的强关联关系,将根据用户特征与产品特征以及产品之间的强关联关系生成的推荐用户列表,与协同过滤算法生成的推荐用户列表结合作为最终的推荐列表;如果该产品不存在强关联关系,将协同过滤算法生成的推荐列表作为最终的用户推荐列表;协同过滤算法利用用户画像、产品画像信息、用户的行为信息生成推荐用户列表。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于spark平台的银行产品推荐方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述基于spark平台的银行产品推荐方法的计算机程序。
本发明实施例通过获得待推荐银行产品的产品信息;对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;根据所述用户画像,从数据库中提取目标用户列表。本发明实施例预先根据历史产品信息生成历史产品画像,根据历史用户信息生成历史用户画像,从而根据历史产品画像和历史用户画像预先建立了关联模型,得到产品画像和用户画像两个维度信息的对应关系,当获得待推荐银行产品的产品信息后先生成对应的产品画像,结合预先建立的关联模型即可找到产品画像对应的用户画像并确定目标用户列表,有效挖掘并利用了产品画像和用户画像两个维度信息之间的关联性和相似性,有针对的向用户推荐银行产品,保证了集群资源合理分配,提高了推荐准确率及用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中基于spark平台的银行产品推荐方法示意图;
图2为本发明实施例中基于spark平台的银行产品推荐装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
首先,对本申请实施例中涉及的名词进行介绍:
spark平台:Spark是一个基于内存计算的开源集群计算系统,是Apache社区最火热的项目之一,与Hadoop相比,Spark的计算速度可以提升近100倍。Spark由一组功能强大、高级别的库组成,包括SparkSql、SparkStreaming、MLlib、GraphX。Spark提供了大量的算子和丰富的数据操作接口方便对数据处理。
DataFrame:一种Spark平台上的分布式数据集,提供了由列组成的详细模式信息,就像关系型数据库中的表一样。DataFrame拥有丰富的算子,并进行了更高层次的抽象,提供了专用的API来处理分布式数据,可以方便地处理大规模结构化数据。
用户画像:用户画像(user profile)是根据用户的基本属性(年龄、性别、地域)、兴趣爱好、社会属性、生活习惯和消费行为等用户的信息抽象出的一个标签化的用户模型。构建用户画像的核心工作就是找到用户的特征标签,而用户标签是通过对用户信息分析而来的高度精炼的特征标识。
产品画像:产品画像是根据用户画像的思想模式演变而来,是根据用户的基本属性(类别、价格)以及产品的描述信息抽象出的一个标签化的产品模型。
如前所述,目前各大银行的产品种类繁多,不同场景的需求也是千千万万,现有的银行产品推荐方法存在推荐结果不准确,集群资源分配不均的问题,从而影响用户体验。具体的,系统各个模块之间缺少统一的数据交互格式,无法做到各模块之间无缝对接;没有充分结合待推荐产品和用户画像以及产品画像之间的强弱关系来生成推荐结果。
为了有针对性的向用户推荐银行产品,保证集群资源合理分配,提高推荐准确率及用户体验,本发明实施例提供一种基于spark平台的银行产品推荐方法,如图1所示,该方法可以包括:
步骤101、获得待推荐银行产品的产品信息;
步骤102、对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;
步骤103、根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;
步骤104、根据所述用户画像,从数据库中提取目标用户列表。
由图1所示可以得知,本发明实施例通过获得待推荐银行产品的产品信息;对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;根据所述用户画像,从数据库中提取目标用户列表。本发明实施例预先根据历史产品信息生成历史产品画像,根据历史用户信息生成历史用户画像,从而根据历史产品画像和历史用户画像预先建立了关联模型,得到产品画像和用户画像两个维度信息的对应关系,当获得待推荐银行产品的产品信息后先生成对应的产品画像,结合预先建立的关联模型即可找到产品画像对应的用户画像并确定目标用户列表,有效挖掘并利用了产品画像和用户画像两个维度信息之间的关联性和相似性,有针对的向用户推荐银行产品,保证了集群资源合理分配,提高了推荐准确率及用户体验。
具体实施时,获得待推荐银行产品的产品信息。
实施例中,产品信息包括:产品类型,产品数量,产品编号其中之一或任意组合,产品类型包括:理财产品类型,基金类型,大众商品类型,外币服务类型,跨境留学产品类型。
具体实施时,对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像。
实施例中,特征工程处理是现有成熟技术,包括例如:特征等频分箱、等距分箱、one-hot向量化、label encoding、woe向量化等。对产品信息中不同特征采用不同的特征工程方法,形成产品画像。
具体实施时,根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成。
实施例中,历史用户信息包括:用户属性信息,资产负债信息,产品持仓信息,用户行为信息其中之一或任意组合。用户属性信息包括:性别、年龄、职业、学历等;资产负债信息包括:月收入、车贷、房贷等;产品持仓信息包括:用户购买过的银行产品。
实施例中,按如下方式预先建立关联模型:获得历史产品信息,历史用户信息和业务场景参数;利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理;对所述历史产品信息和历史用户信息进行特征工程处理,生成历史产品信息对应的历史产品画像和历史用户信息对应的历史用户画像;根据业务场景参数,建立所述历史产品画像和历史用户画像的映射关系。
本实施例中,异常值清洗处理是数据加工、机器学习数据处理的一个重要过程,针对不同含义特征的异常值清洗方法不一样,比如:年龄字段中将大于200和小于0的值作为异常值清除,并用年龄字段的平均值填充;性别字段中将除男、女之外的值作为异常值清除,用众数填充。
本实施例中,根据用户画像与产品画像定义产品推荐强关联规则,也即映射关系,比如产品画像中描述产品特征为“起购金额20万”,则定义强关联关系,将拥有该特征的理财产品推荐给“年收入”大于100万的用户。
实施例中,获得历史产品信息和历史用户信息之后,生成所述历史产品信息和历史用户信息对应的hive表数据;利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理,包括:利用spark算子对所述历史产品信息和历史用户信息对应的hive表数据进行异常值清洗处理。
本实施例基于spark平台,对于数据的加工处理都是通过spark sql完成,并将结果数据存入hive表中。
具体实施时,根据所述用户画像,从数据库中提取目标用户列表。
实施例中,用户基本信息、资产负债信息、产品持仓信息、用户行为以及产品特征信息,产品描述信息,并通过spark sql加工成hive表数据;利用步骤1中的结果数据,通过spark算子对数据进行异常值清洗,并存入hive;利用步骤2中的结果数据,通过特征工程步骤,形成用户画像和产品,并将结果存入hive;根据用户画像和产品画像信息以及实际业务场景构造用户特征与产品特征以及产品之间的强关联关系,存入关系型数据库中(mysql)。根据待推荐产品的标签,先调用强关联关系模块,如果存在(待推荐产品特征-用户特征-产品特征)之间的强关联关系,则将强关联关系模块生成的推荐用户列表与协同过滤算法生成的推荐用户列表结合作为最终的推荐列表;如果该产品不存在强关联关系,则将协同过滤模块生成的推荐列表作为最终的用户推荐列表。协同过滤算法是产品推荐领域成熟的推荐算法,利用用户画像、产品画像信息、用户的行为信息可以通过协同过滤算法为用户生成推荐产品列表,为产品生成推荐用户列表。
基于同一发明构思,本发明实施例还提供了一种基于spark平台的银行产品推荐装置,如下面的实施例所述。由于这些解决问题的原理与基于spark平台的银行产品推荐方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
图2为本发明实施例中基于spark平台的银行产品推荐装置的结构图,如图2所示,该装置包括:
信息获得模块201,用于获得待推荐银行产品的产品信息;
产品画像生成模块202,用于对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;
用户画像确定模块203,用于根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;
用户列表提取模块204,用于根据所述用户画像,从数据库中提取目标用户列表。
一个实施例中,按如下方式预先建立关联模型:
获得历史产品信息,历史用户信息和业务场景参数;
利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理;
对所述历史产品信息和历史用户信息进行特征工程处理,生成历史产品信息对应的历史产品画像和历史用户信息对应的历史用户画像;
根据业务场景参数,建立所述历史产品画像和历史用户画像的映射关系。
一个实施例中,获得历史产品信息和历史用户信息之后,生成所述历史产品信息和历史用户信息对应的hive表数据;
利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理,包括:利用spark算子对所述历史产品信息和历史用户信息对应的hive表数据进行异常值清洗处理。
综上所述,本发明实施例通过获得待推荐银行产品的产品信息;对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;根据所述用户画像,从数据库中提取目标用户列表。本发明实施例预先根据历史产品信息生成历史产品画像,根据历史用户信息生成历史用户画像,从而根据历史产品画像和历史用户画像预先建立了关联模型,得到产品画像和用户画像两个维度信息的对应关系,当获得待推荐银行产品的产品信息后先生成对应的产品画像,结合预先建立的关联模型即可找到产品画像对应的用户画像并确定目标用户列表,有效挖掘并利用了产品画像和用户画像两个维度信息之间的关联性和相似性,有针对的向用户推荐银行产品,保证了集群资源合理分配,提高了推荐准确率及用户体验。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于spark平台的银行产品推荐方法,其特征在于,包括:
获得待推荐银行产品的产品信息;
对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;
根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;
根据所述用户画像,从数据库中提取目标用户列表,包括:根据用户画像和产品画像信息以及实际业务场景构造用户特征与产品特征以及产品之间的强关联关系,存入关系型数据库中;根据待推荐银行产品的标签,如果存在待推荐产品特征、用户特征及产品特征之间的强关联关系,将根据用户特征与产品特征以及产品之间的强关联关系生成的推荐用户列表,与协同过滤算法生成的推荐用户列表结合作为最终的推荐列表;如果该产品不存在强关联关系,将协同过滤算法生成的推荐列表作为最终的用户推荐列表;协同过滤算法利用用户画像、产品画像信息、用户的行为信息生成推荐用户列表。
2.如权利要求1所述的基于spark平台的银行产品推荐方法,其特征在于,所述产品信息包括:产品类型,产品数量,产品编号其中之一或任意组合,所述产品类型包括:理财产品类型,基金类型,大众商品类型,外币服务类型,跨境留学产品类型。
3.如权利要求1所述的基于spark平台的银行产品推荐方法,其特征在于,所述历史用户信息包括:用户属性信息,资产负债信息,产品持仓信息,用户行为信息其中之一或任意组合。
4.如权利要求1所述的基于spark平台的银行产品推荐方法,其特征在于,按如下方式预先建立关联模型:
获得历史产品信息,历史用户信息和业务场景参数;
利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理;
对所述历史产品信息和历史用户信息进行特征工程处理,生成历史产品信息对应的历史产品画像和历史用户信息对应的历史用户画像;
根据业务场景参数,建立所述历史产品画像和历史用户画像的映射关系。
5.如权利要求4所述的基于spark平台的银行产品推荐方法,其特征在于,获得历史产品信息和历史用户信息之后,生成所述历史产品信息和历史用户信息对应的hive表数据;
利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理,包括:利用spark算子对所述历史产品信息和历史用户信息对应的hive表数据进行异常值清洗处理。
6.一种基于spark平台的银行产品推荐装置,其特征在于,包括:
信息获得模块,用于获得待推荐银行产品的产品信息;
产品画像生成模块,用于对所述待推荐银行产品的产品信息进行特征工程处理,生成待推荐银行产品的产品画像;
用户画像确定模块,用于根据所述待推荐银行产品的产品画像,以及预先建立的关联模型,确定所述产品画像对应的用户画像,所述关联模型根据历史产品画像和历史用户画像预先建立,所述历史产品画像根据历史产品信息生成,所述历史用户画像根据历史用户信息生成;
用户列表提取模块,用于根据所述用户画像,从数据库中提取目标用户列表;
用户列表提取模块,具体用于根据用户画像和产品画像信息以及实际业务场景构造用户特征与产品特征以及产品之间的强关联关系,存入关系型数据库中;根据待推荐银行产品的标签,如果存在待推荐产品特征、用户特征及产品特征之间的强关联关系,将根据用户特征与产品特征以及产品之间的强关联关系生成的推荐用户列表,与协同过滤算法生成的推荐用户列表结合作为最终的推荐列表;如果该产品不存在强关联关系,将协同过滤算法生成的推荐列表作为最终的用户推荐列表;协同过滤算法利用用户画像、产品画像信息、用户的行为信息生成推荐用户列表。
7.如权利要求6所述的基于spark平台的银行产品推荐装置,其特征在于,按如下方式预先建立关联模型:
获得历史产品信息,历史用户信息和业务场景参数;
利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理;
对所述历史产品信息和历史用户信息进行特征工程处理,生成历史产品信息对应的历史产品画像和历史用户信息对应的历史用户画像;
根据业务场景参数,建立所述历史产品画像和历史用户画像的映射关系。
8.如权利要求7所述的基于spark平台的银行产品推荐装置,其特征在于,获得历史产品信息和历史用户信息之后,生成所述历史产品信息和历史用户信息对应的hive表数据;
利用spark算子对所述历史产品信息和历史用户信息进行异常值清洗处理,包括:利用spark算子对所述历史产品信息和历史用户信息对应的hive表数据进行异常值清洗处理。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至5任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010833147.4A CN111967970B (zh) | 2020-08-18 | 2020-08-18 | 基于spark平台的银行产品推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010833147.4A CN111967970B (zh) | 2020-08-18 | 2020-08-18 | 基于spark平台的银行产品推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111967970A CN111967970A (zh) | 2020-11-20 |
CN111967970B true CN111967970B (zh) | 2024-02-27 |
Family
ID=73389560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010833147.4A Active CN111967970B (zh) | 2020-08-18 | 2020-08-18 | 基于spark平台的银行产品推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111967970B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159959A (zh) * | 2021-05-20 | 2021-07-23 | 中国银行股份有限公司 | 外汇产品推荐方法及装置 |
CN113360768A (zh) * | 2021-06-29 | 2021-09-07 | 平安信托有限责任公司 | 基于用户画像的产品推荐方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106251174A (zh) * | 2016-07-26 | 2016-12-21 | 北京小米移动软件有限公司 | 信息推荐方法及装置 |
CN110431585A (zh) * | 2018-01-22 | 2019-11-08 | 华为技术有限公司 | 一种用户画像的生成方法及装置 |
CN110751533A (zh) * | 2019-09-09 | 2020-02-04 | 上海陆家嘴国际金融资产交易市场股份有限公司 | 产品画像生成方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020023051A1 (en) * | 2000-03-31 | 2002-02-21 | Kunzle Adrian E. | System and method for recommending financial products to a customer based on customer needs and preferences |
-
2020
- 2020-08-18 CN CN202010833147.4A patent/CN111967970B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106251174A (zh) * | 2016-07-26 | 2016-12-21 | 北京小米移动软件有限公司 | 信息推荐方法及装置 |
CN110431585A (zh) * | 2018-01-22 | 2019-11-08 | 华为技术有限公司 | 一种用户画像的生成方法及装置 |
CN110751533A (zh) * | 2019-09-09 | 2020-02-04 | 上海陆家嘴国际金融资产交易市场股份有限公司 | 产品画像生成方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111967970A (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11682093B2 (en) | Document term recognition and analytics | |
US20180341907A1 (en) | Crowdsourcing techniques for processing product content | |
US20190156395A1 (en) | System and Method for Analyzing and Searching for Features Associated with Objects | |
CN107944481B (zh) | 用于生成信息的方法和装置 | |
US9477973B2 (en) | Visually generated consumer product presentation | |
CN109492180A (zh) | 资源推荐方法、装置、计算机设备及计算机可读存储介质 | |
TW201905736A (zh) | 資訊推送方法及系統 | |
CN111352962A (zh) | 客户画像构建方法及装置 | |
CN111967970B (zh) | 基于spark平台的银行产品推荐方法及装置 | |
CN108305181B (zh) | 社交影响力确定、信息投放方法及装置、设备及存储介质 | |
CN108509458B (zh) | 一种业务对象识别方法及装置 | |
CN105359181A (zh) | 基于在线内容评估品牌的价值 | |
CN112037038A (zh) | 银行信贷风险预测方法及装置 | |
PH12017000225A1 (en) | Social network data processing and profiling | |
CN110910207A (zh) | 一种提升商品推荐多样性的方法及系统 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN110717095B (zh) | 服务项目的推送方法及装置 | |
CN112330373A (zh) | 用户行为分析方法、装置及计算机可读存储介质 | |
KR101764361B1 (ko) | 소셜 네트워크 서비스 기반 쇼핑몰 서비스 제공 방법 및 이를 위한 장치 | |
JP2020502710A (ja) | ウェブページメイン画像認識方法及び装置 | |
US20170249697A1 (en) | System and method for machine learning based line assignment | |
CN106909571B (zh) | 网站的访问路径的分析方法及装置 | |
Iswari et al. | User-Generated Content Extraction: A Bibliometric Analysis of the Research Literature (2007–2022) | |
CN111932310A (zh) | 一种银行产品的潜在对公客户挖掘方法及装置 | |
US10497025B1 (en) | Real-time predictive recommendation system using per-set optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |