CN113469802A - 数据匹配方法及装置 - Google Patents
数据匹配方法及装置 Download PDFInfo
- Publication number
- CN113469802A CN113469802A CN202110798930.6A CN202110798930A CN113469802A CN 113469802 A CN113469802 A CN 113469802A CN 202110798930 A CN202110798930 A CN 202110798930A CN 113469802 A CN113469802 A CN 113469802A
- Authority
- CN
- China
- Prior art keywords
- feature vector
- user
- product
- cosine similarity
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 276
- 238000012545 processing Methods 0.000 claims description 56
- 238000010606 normalization Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据匹配方法及装置,其中该方法包括:获取待推荐理财产品的第一特征向量;在既存在用户点赞或收藏的理财产品的第二特征向量又存在用户历史购买的理财产品的第三特征向量时,根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。本发明涉及金融技术领域。
Description
技术领域
本发明涉及金融技术领域,尤其涉及数据匹配方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
当前银行向用户推荐理财产品时,是根据业务需求随机向用户推荐理财产品,无法根据用户的客观条件推荐用户需要的理财产品,也无法准确地向用户推荐用户喜欢的理财产品。理财产品的推荐不够准确,为用户推荐合适的理财产品的效率低,用户体验较差。
发明内容
本发明实施例提供一种数据匹配方法,用以为用户推荐用户需要的理财产品,提高为用户推荐合适的理财产品的效率,提升用户体验度,该方法包括:
获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;
在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;
根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;
将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。
本发明实施例还提供一种数据匹配装置,用以为用户推荐用户需要的理财产品,提高为用户推荐合适的理财产品的效率,提升用户体验度,该装置包括:
第一获取模块,用于获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;
第二获取模块,用于在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;
第一处理模块,用于根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;
第二处理模块,用于将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据匹配方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述数据匹配方法的计算机程序。
本发明实施例中,获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。这样,根据待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度,可确定出用户喜欢的理财产品,另外根据待推荐理财产品与用户历史购买的理财产品的第二余弦相似度可以确定出用户需要的理财产品,因此根据第一余弦相似度、以及第二余弦相似度确定出第三余弦相似度后,根据第三余弦相似度可以向用户推荐用户喜欢、且需要的待推荐理财产品,提高了为用户推荐理财产品的准确性,并且提高为用户推荐合适的理财产品的效率,提升用户体验度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供一种数据匹配方法的流程图;
图2为本发明实施例中提供的另一种数据匹配方法的流程图;
图3为本发明实施例中提供的另一种数据匹配方法的流程图;
图4为本发明实施例中提供的又一种数据匹配方法的流程图;
图5为本发明实施例中提供的一种数据匹配装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
经研究发现,当前银行向用户推荐理财产品时,是根据业务需求随机向用户推荐理财产品,无法根据用户的客观条件推荐用户需要的理财产品,也无法准确地向用户推荐用户喜欢的理财产品。理财产品的推荐不够准确,为用户推荐合适的理财产品的效率低,用户体验较差。
针对上述研究,本发明实施例提供了一种数据匹配方法,如图1所示,包括:
S101:获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;
S102:在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;
S103:根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;
S104:将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。
本发明实施例中,获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。这样,根据待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度,可确定出用户喜欢的理财产品,另外根据待推荐理财产品与用户历史购买的理财产品的第二余弦相似度可以确定出用户需要的理财产品,因此根据第一余弦相似度、以及第二余弦相似度确定出第三余弦相似度后,根据第三余弦相似度可以向用户推荐用户喜欢、且需要的待推荐理财产品,提高了为用户推荐理财产品的准确性,并且提高为用户推荐合适的理财产品的效率,提升用户体验度。
下面对上述S101~S104加以详细介绍。
针对上述S101,参考特征例如为比对理财产品之间的相似度时的衡量因素,参考特征例如包括:理财产品类型、理财产品起购金额、理财产品七日年化率、理财产品交易时间、理财产品风险等级等至少一种;其中,理财产品类型例如包括:基金、货币、债券、股票、混合、指数等,或者按照风险等级划分理财产品类型时,理财产品类型包括:稳健类、进阶类、现金类等。
特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值。
示例性的,根据理财产品类型、理财产品起购金额、理财产品七日年化率构成一个特征向量m:{理财产品类型特征值,理财产品起购金额特征值,理财产品七日年化率特征值},则特征向量m一共包含三个元素值,第一个元素值为理财产品类型特征值,第二个元素值为理财产品起购金额特征值、第三个元素值为理财产品七日年化率特征值。
上述示例只是对特征向量的一种举例,在具体实施中,构成特征向量的参考特征以及各参考特征分别对应特征向量的哪一元素可以结合实际场景设置,本发明实施例中,构成第一特征向量、第二特征向量、第三特征向量、第四特征向量的参考特征相同,且各特征向量(第一特征向量、第二特征向量、第三特征向量、第四特征向量)的对应元素值为同一参考特征的特征值,针对不同的理财产品,同一参考特征的特征值可能不同也可能相同。
针对上述S102,用户可能之前购买过理财产品,也可能点赞或收藏过一些理财产品。获取用户的理财产品数据,根据理财产品数据确定用户是否存在历史购买的理财产品、是否存在点赞或者收藏的理财产品,在既存在用户点赞或收藏的理财产品的又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量。
针对上述S103,余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度。
示例性的,如果计算余弦相似度的两个特征向量P、特征向量Q包含三个元素值,第一个元素值为理财产品类型特征值、第二个元素值为理财产品起购金额特征值、第三个元素值为理财产品七日年化率特征值,则余弦相似度也包含三个元素值,第一个元素值为特征向量P、特征向量Q的理财产品类型相似度,第二个元素值为特征向量P、特征向量Q的理财产品起购金额的相似度,第三个元素值为特征向量P、特征向量Q的理财产品七日年化率的相似度。
用户历史购买的理财产品在一定程度上代表符合用户需求的理财产品,用户点赞的理财产品在一定程度上代表用户喜欢的理财产品,可以根据待推荐理财产品与用户历史购买的理财产品的相似度确定待推荐理财产品是否为用户需要的理财产品,并且还可以根据待推荐理财产品与用户点赞或者收藏的理财产品的相似度确定待推荐理财产品是否为用户喜爱的理财产品,因此根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度。
具体的,例如可以采用但不限于下述公式(1),根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度:
其中,sim(UP,PV)k代表待推荐理财产品所在列表中第k个理财产品和用户点赞或收藏的理财产品的第一余弦相似度,UPi表示第二特征向量中的第i个元素值;PVki表示待推荐理财产品所在列表中第k个理财产品的第一特征向量中的第i个元素值,n代表第二特征向量中包含的元素值的数量。
另外,例如还可以采用但不限于下述公式(2),根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买理财产品的第三余弦相似度:
其中,sim(LM,PV)k代表待推荐理财产品所在列表中第k个理财产品和用户历史购买的理财产品的第二余弦相似度,LMi表示第三特征向量中的第i个元素值;PVki表示待推荐理财产品所在列表中第k个理财产品的第一特征向量中的第i个元素值,n代表第三特征向量中包含的元素值的数量。
此外,因为计算第一余弦相似度、以及第二余弦相似度的公式都较为复杂,因此为了简化计算的难度,本发明另一实施例中,根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度时,例如先对第一特征向量、第二特征向量、以及第三特征向量进行归一化处理;然后根据归一化处理后的第一特征向量、以及归一化处理后的第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据归一化处理后的第一特征向量、以及归一化处理后的第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度。
此处,在利用上述公式(1)根据归一化处理后的第一特征向量、以及归一化处理后的第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度时,第一特征向量、第二特征向量中的元素值为经过归一化处理后的元素值;在利用上述(2)根据归一化处理后的第一特征向量、以及归一化处理后的第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度时,公式(2)中涉及到第一特征向量、第三特征向量中的元素值为经过归一化处理的元素值。
示例性的,例如可以采用但不限于下述公式(3)对第一特征向量、第二特征向量、第三特征向量进行归一化处理:
其中,LUMi代表特征向量的第i个元素值经过归一化处理后对应的元素值,w表示与该特征向量对应的理财产品所在列表中包含的理财产品的数量,Pji表示该特征向量对应的理财产品所在列表中第j个理财产品的特征向量中的第i个元素值,n代表特征向量中包含的元素值的数量。
针对上述S104,在得到第一余弦相似度和第二余弦相似度后,因为第一余弦相似度的各元素值与第二余弦相似度的各元素值对应的理财产品的参考特征相同,所以例如可以将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度。第一余弦相似度代表待推荐理财产品与用户点赞或者收藏的理财产品的相似度,第二余弦相似度代表待推荐理财产品与用户历史购买的理财产品的相似度,因此根据第三余弦相似度确定出既满足用户需求、又被用户喜欢的理财产品向用户推荐,例如在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。
此处,例如可以针对第三余弦相似度中的每一元素值设置一个第一预设阈值,每一元素值对应的第一预设阈值可以不同;或者为第三余弦相似度中的每一元素值设置一个共同的第一预设阈值。
示例性的,以第三余弦相似度中的每一元素值设置一个共同的第一预设阈值为例,待推荐理财产品的第三余弦相似度中包含m个元素值,超过第一预设阈值的元素值的数量为n,则n/m×100%大于第二预设阈值时,就向用户推荐该推荐理财产品。
另外,并不是所有的用户都既存在用户点赞或收藏的理财产品的第二特征向量又存在用户历史购买的理财产品的第三特征向量,因此如图2所示,为本发明实施例提供的另一种数据匹配方法的流程图,包括:
S201:在存在用户点赞或收藏的理财产品、不存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量。
S202:根据第一特征向量、第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度。
此处,计算第一余弦相似度的方法与上述S103中计算第一余弦相似度的方法类似,这里不再赘述。
S203:根据第一余弦相似度中超过第三预设阈值的元素值的数量与第一余弦相似度总元素值的数量的比例超过第四预设阈值时,向用户推荐待推荐理财产品。
如图3所示,为本发明实施例提供的另一种数据匹配方法的流程图,包括:
S301:在存在用户历史购买的理财产品、不存在用户点赞或收藏的理财产品时,获取用户历史购买的理财产品的第三特征向量。
S302:根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度。
此处,计算第二余弦相似度的方法与上述S103中计算第二余弦相似度的方法类似,这里不再赘述。
S303:根据第二余弦相似度中超过第五预设阈值的元素值的数量与第二余弦相似度总元素值的数量的比例超过第六预设阈值时,向用户推荐待推荐理财产品。
如图4所示,为本发明实施例提供的又一种数据匹配方法的流程图,包括:
S401:在既不存在用户点赞或收藏的理财产品又不存在用户历史购买的理财产品时,获取用户历史浏览的理财产品的第四特征向量。
具体的,例如获取用户历史浏览理财产品的浏览记录;从浏览记录中获取第四特征向量。
S402:根据第一特征向量、第四特征向量计算待推荐理财产品与用户历史浏览的理财产品的第四余弦相似度。
具体的,例如可以采用但不限于下述公式(4)根据第一特征向量、第四特征向量计算待推荐理财产品与用户历史浏览的理财产品的第四余弦相似度:
其中,sim(NP,PV)k代表待推荐理财产品所在列表中第k个理财产品和用户历史浏览的理财产品的第四余弦相似度,NPi表示第四特征向量中的第i个元素值;PVki表示待推荐理财产品所在列表中第k个理财产品的第一特征向量中的第i个元素值,n代表第四特征向量中包含的元素值的数量。
另外,计算第四余弦相似度时,例如也可以采用上述公式(3)对第一特征向量、以及第四特征向量进行归一化处理,利用归一化处理后的第一特征向量、归一化处理后的第四特征向量计算第四余弦相似度。
此处,利用上述公式(4)根据归一化处理后的第一特征向量、以及归一化处理后的第四特征向量计算第四余弦相似度时,第一特征向量、第四特征向量中的元素值为经过归一化处理后的元素值。
S403:根据第四余弦相似度中超过第七预设阈值的元素值的数量与第四余弦相似度总元素值的数量的比例超过第八预设阈值时,向用户推荐待推荐理财产品。
本发明实施例中所述的第一预设阈值、第三预设阈值、第五预设阈值、第七预设阈值可以相同也可以不同,具体结合应用的场景设定;本发明实施例中所述的第二预设阈值、第四预设阈值、第六预设阈值、第八预设阈值可以相同也可以不同,具体结合应用的场景设定。
本发明实施例中还提供了一种数据匹配装置,如下面的实施例所述。由于该装置解决问题的原理与数据匹配方法相似,因此该装置的实施可以参见数据匹配方法的实施,重复之处不再赘述。
如图5所示,为本发明实施例提供的一种数据匹配装置的示意图,包括:第一获取模块501、第二获取模块502、第一处理模块503、以及第二处理模块504;其中,
第一获取模块501,用于获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;
第二获取模块502,用于在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;
第一处理模块503,用于根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;
第二处理模块504,用于将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。
在一种可能的实施方式中,第二获取模块,还用于在存在用户点赞或收藏的理财产品、不存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量;第一处理模块,还用于根据第一特征向量、第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;第二处理模块,还用于根据第一余弦相似度中超过第三预设阈值的元素值的数量与第一余弦相似度总元素值的数量的比例超过第四预设阈值时,向用户推荐待推荐理财产品。
在一种可能的实施方式中,第二获取模块,还用于在存在用户历史购买的理财产品、不存在用户点赞或收藏的理财产品时,获取用户历史购买的理财产品的第三特征向量;第一处理模块,还用于根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;第二处理模块,还用于根据第二余弦相似度中超过第五预设阈值的元素值的数量与第二余弦相似度总元素值的数量的比例超过第六预设阈值时,向用户推荐待推荐理财产品。
在一种可能的实施方式中,第二获取模块,还用于在既不存在用户点赞或收藏的理财产品又不存在用户历史购买的理财产品时,获取用户历史浏览的理财产品的第四特征向量;第一处理模块,还用于根据第一特征向量、第四特征向量计算待推荐理财产品与用户历史浏览的理财产品的第四余弦相似度;第二处理模块,还用于根据第四余弦相似度中超过第七预设阈值的元素值的数量与第四余弦相似度总元素值的数量的比例超过第八预设阈值时,向用户推荐待推荐理财产品。
在一种可能的实施方式中,第一处理模块,具体用于根据第一特征向量、以及第四特征向量,采用下述公式计算待推荐理财产品与用户历史浏览的理财产品的第四余弦相似度:
其中,sim(NP,PV)k代表待推荐理财产品所在列表中第k个理财产品和用户历史浏览的理财产品的第四余弦相似度,NPi表示第四特征向量中的第i个元素值;PVki表示待推荐理财产品所在列表中第k个理财产品的第一特征向量中的第i个元素值,n代表第四特征向量中包含的元素值的数量。
在一种可能的实施方式中,参考特征包括下述至少一种:理财产品类型、理财产品起购金额、理财产品七日年化率、理财产品交易时间、理财产品风险等级。
在一种可能的实施方式中,第一处理模块,具体用于对第一特征向量、第二特征向量、以及第三特征向量进行归一化处理;根据归一化处理后的第一特征向量、以及归一化处理后的第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据归一化处理后的第一特征向量、以及归一化处理后的第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度。
在一种可能的实施方式中,第一处理模块,具体用于采用下述公式对第一特征向量、第二特征向量、第三特征向量进行归一化处理:
其中LUMi代表特征向量的第i个元素值经过归一化处理后对应的元素值,w表示与该特征向量对应的理财产品所在列表中包含的理财产品的数量,Pji表示该特征向量对应的理财产品所在列表中第j个理财产品的特征向量中的第i个元素值,n代表特征向量中包含的元素值的数量。
在一种可能的实施方式中,第一处理模块,具体用于根据第一特征向量、以及第二特征向量,采用下述公式计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度:
其中,sim(UP,PV)k代表待推荐理财产品所在列表中第k个理财产品和用户点赞或收藏的理财产品的第一余弦相似度,UPi表示第二特征向量中的第i个元素值;PVki表示待推荐理财产品所在列表中第k个理财产品的第一特征向量中的第i个元素值,n代表第二特征向量中包含的元素值的数量。
在一种可能的实施方式中,第一处理模块,具体用于根据第一特征向量、以及第三特征向量,采用下述公式计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度:
其中,sim(LM,PV)k代表待推荐理财产品所在列表中第k个理财产品和用户历史购买的理财产品的第二余弦相似度,LMi表示第三特征向量中的第i个元素值;PVki表示待推荐理财产品所在列表中第k个理财产品的第一特征向量中的第i个元素值,n代表第三特征向量中包含的元素值的数量。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据匹配方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述数据匹配方法的计算机程序。
本发明实施例中,获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。这样,根据待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度,可确定出用户喜欢的理财产品,另外根据待推荐理财产品与用户历史购买的理财产品的第二余弦相似度可以确定出用户需要的理财产品,因此根据第一余弦相似度、以及第二余弦相似度确定出第三余弦相似度后,根据第三余弦相似度可以向用户推荐用户喜欢、且需要的待推荐理财产品,提高了为用户推荐理财产品的准确性,并且提高为用户推荐合适的理财产品的效率,提升用户体验度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种数据匹配方法,其特征在于,包括:
获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;
在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;
根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;
将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。
2.如权利要求1所述的数据匹配方法,其特征在于,还包括:
在存在用户点赞或收藏的理财产品、不存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量;
根据第一特征向量、第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;
根据第一余弦相似度中超过第三预设阈值的元素值的数量与第一余弦相似度总元素值的数量的比例超过第四预设阈值时,向用户推荐待推荐理财产品。
3.如权利要求1所述的数据匹配方法,其特征在于,还包括:
在存在用户历史购买的理财产品、不存在用户点赞或收藏的理财产品时,获取用户历史购买的理财产品的第三特征向量;
根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;
根据第二余弦相似度中超过第五预设阈值的元素值的数量与第二余弦相似度总元素值的数量的比例超过第六预设阈值时,向用户推荐待推荐理财产品。
4.如权利要求1所述的数据匹配方法,其特征在于,还包括:
在既不存在用户点赞或收藏的理财产品又不存在用户历史购买的理财产品时,获取用户历史浏览的理财产品的第四特征向量;
根据第一特征向量、第四特征向量计算待推荐理财产品与用户历史浏览的理财产品的第四余弦相似度;
根据第四余弦相似度中超过第七预设阈值的元素值的数量与第四余弦相似度总元素值的数量的比例超过第八预设阈值时,向用户推荐待推荐理财产品。
6.如权利要求1所述的数据匹配方法,其特征在于,参考特征包括下述至少一种:
理财产品类型、理财产品起购金额、理财产品七日年化率、理财产品交易时间、理财产品风险等级。
7.如权利要求1所述的数据匹配方法,其特征在于,根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度,包括:
对第一特征向量、第二特征向量、以及第三特征向量进行归一化处理;
根据归一化处理后的第一特征向量、以及归一化处理后的第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;
根据归一化处理后的第一特征向量、以及归一化处理后的第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度。
11.一种数据匹配装置,其特征在于,包括:
第一获取模块,用于获取待推荐理财产品的第一特征向量;其中,特征向量为根据理财产品的多个参考特征构建的,特征向量中的每一元素值为理财产品的一个参考特征对应的特征值;参考特征为衡量理财产品相似程度的衡量因素;
第二获取模块,用于在既存在用户点赞或收藏的理财产品又存在用户历史购买的理财产品时,获取用户点赞或收藏的理财产品的第二特征向量、以及用户历史购买的理财产品的第三特征向量;
第一处理模块,用于根据第一特征向量、以及第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据第一特征向量、以及第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度;其中余弦相似度用于表征两个理财产品的相似程度,余弦相似度中的每一元素值表征两个理财产品的一个参考特征的相似度;
第二处理模块,用于将第一余弦相似度与第二余弦相似度中对应的元素值相加,得到第三余弦相似度;在第三余弦相似度中超过第一预设阈值的元素值的数量与第三余弦相似度中总元素值的数量的比例超过第二预设阈值时,向用户推荐待推荐理财产品。
12.如权利要求11所述的数据匹配装置,其特征在于,第一处理模块,具体用于对第一特征向量、第二特征向量、以及第三特征向量进行归一化处理;根据归一化处理后的第一特征向量、以及归一化处理后的第二特征向量计算待推荐理财产品与用户点赞或收藏的理财产品的第一余弦相似度;根据归一化处理后的第一特征向量、以及归一化处理后的第三特征向量计算待推荐理财产品与用户历史购买的理财产品的第二余弦相似度。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10任一所述方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至10任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110798930.6A CN113469802A (zh) | 2021-07-15 | 2021-07-15 | 数据匹配方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110798930.6A CN113469802A (zh) | 2021-07-15 | 2021-07-15 | 数据匹配方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113469802A true CN113469802A (zh) | 2021-10-01 |
Family
ID=77880482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110798930.6A Pending CN113469802A (zh) | 2021-07-15 | 2021-07-15 | 数据匹配方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469802A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113946722A (zh) * | 2021-10-22 | 2022-01-18 | 北京钢研新材科技有限公司 | 焊材智能选配的方法及装置 |
CN114782140A (zh) * | 2022-05-05 | 2022-07-22 | 上海浦东发展银行股份有限公司 | 理财产品推荐方法、系统、设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105812937A (zh) * | 2014-12-30 | 2016-07-27 | Tcl集团股份有限公司 | 一种电视节目推荐方法和电视节目推荐装置 |
CN107562818A (zh) * | 2017-08-16 | 2018-01-09 | 中国工商银行股份有限公司 | 信息推荐系统及方法 |
CN108876526A (zh) * | 2018-06-06 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 商品推荐方法、装置和计算机可读存储介质 |
CN111429293A (zh) * | 2020-04-21 | 2020-07-17 | 重庆新致金服信息技术有限公司 | 一种保险产品的推荐系统及推荐方法 |
CN111626863A (zh) * | 2020-06-02 | 2020-09-04 | 北京比财数据科技有限公司 | 一种金融产品的智能推荐方法 |
CN111681107A (zh) * | 2020-06-11 | 2020-09-18 | 黄锐 | 一种基于Embedding的实时个性化金融产品推荐算法 |
CN112329461A (zh) * | 2020-11-24 | 2021-02-05 | 汤学民 | 相似病历确定方法、计算机设备及计算机存储介质 |
-
2021
- 2021-07-15 CN CN202110798930.6A patent/CN113469802A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105812937A (zh) * | 2014-12-30 | 2016-07-27 | Tcl集团股份有限公司 | 一种电视节目推荐方法和电视节目推荐装置 |
CN107562818A (zh) * | 2017-08-16 | 2018-01-09 | 中国工商银行股份有限公司 | 信息推荐系统及方法 |
CN108876526A (zh) * | 2018-06-06 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 商品推荐方法、装置和计算机可读存储介质 |
CN111429293A (zh) * | 2020-04-21 | 2020-07-17 | 重庆新致金服信息技术有限公司 | 一种保险产品的推荐系统及推荐方法 |
CN111626863A (zh) * | 2020-06-02 | 2020-09-04 | 北京比财数据科技有限公司 | 一种金融产品的智能推荐方法 |
CN111681107A (zh) * | 2020-06-11 | 2020-09-18 | 黄锐 | 一种基于Embedding的实时个性化金融产品推荐算法 |
CN112329461A (zh) * | 2020-11-24 | 2021-02-05 | 汤学民 | 相似病历确定方法、计算机设备及计算机存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113946722A (zh) * | 2021-10-22 | 2022-01-18 | 北京钢研新材科技有限公司 | 焊材智能选配的方法及装置 |
CN114782140A (zh) * | 2022-05-05 | 2022-07-22 | 上海浦东发展银行股份有限公司 | 理财产品推荐方法、系统、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10474827B2 (en) | Application recommendation method and application recommendation apparatus | |
Fan et al. | The elements of financial econometrics | |
CN113469802A (zh) | 数据匹配方法及装置 | |
CN109035013A (zh) | 检测异常金融交易的设备和方法及计算机可读存储介质 | |
KR20170134601A (ko) | 데이터 처리 방법 및 장치 | |
CN110033324A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
Pei et al. | A worst-case risk measure by G-VaR | |
CN112148880A (zh) | 一种客服对话语料聚类方法、系统、设备及存储介质 | |
CN110458581B (zh) | 商户业务周转异常的识别方法及装置 | |
CN110009056B (zh) | 一种社交账号的分类方法及分类装置 | |
CN109472455B (zh) | 活动评估方法、装置、电子设备及存储介质 | |
CN111161063A (zh) | 基于图计算的资金账号识别方法及计算机可读存储介质 | |
CN115731054A (zh) | 待推荐对象组合的确定方法、装置及存储介质 | |
CN105447087A (zh) | 一种视频推荐方法及装置 | |
US20220101406A1 (en) | System and method for recommending repeat-purchase products using modified self-similarity | |
Chen et al. | A multidimensional Hilbert transform approach for barrier option pricing and survival probability calculation | |
CN104796478A (zh) | 一种资源推荐方法及装置 | |
CN111339434B (zh) | 信息推荐方法、装置、电子设备及计算机存储介质 | |
Callegaro et al. | American quantized calibration in stochastic volatility | |
CN111105274A (zh) | 数据处理方法、装置、介质及电子设备 | |
CN113486249B (zh) | 手机银行业务推荐方法及装置 | |
CN115526726A (zh) | 理财产品信息推荐方法及装置 | |
Hong et al. | Kolmogorov-Smirnov type testing for structural breaks: A new adjusted-range based self-normalization approach | |
CN114862594A (zh) | 基于区块链的金融产品信息跨行推荐方法及装置 | |
CN103885961A (zh) | 一种关联搜索词的推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |