CN117474636B - 一种基于大数据的平台用户推荐方法及系统 - Google Patents
一种基于大数据的平台用户推荐方法及系统 Download PDFInfo
- Publication number
- CN117474636B CN117474636B CN202311816676.3A CN202311816676A CN117474636B CN 117474636 B CN117474636 B CN 117474636B CN 202311816676 A CN202311816676 A CN 202311816676A CN 117474636 B CN117474636 B CN 117474636B
- Authority
- CN
- China
- Prior art keywords
- preset
- product
- user
- determining
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012216 screening Methods 0.000 claims abstract description 28
- 238000012544 monitoring process Methods 0.000 claims abstract description 23
- 238000013500 data storage Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 101000872083 Danio rerio Delta-like protein C Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术领域,尤其涉及一种基于大数据的平台用户推荐方法及系统,步骤包括:构建用户画像,并确定推荐策略;基于浏览页面的平均产品点击数量占比对用户特征的存储类型的数量进行确定,或,基于所述浏览页面的产品名称与用户搜索的产品名称的编辑距离对关联性推荐阈值进行确定,或,基于所述浏览页面的产品名称与用户搜索的产品名称的编辑距离和相同类型产品的浏览数量,确定产品筛选粒度;获取确定关联性推荐阈值后的单位监测周期内浏览页面的刷新次数,并基于所述单位监测周期内浏览页面的刷新次数确定用户画像的更新频率。本发明实现了推荐方法准确性的提高。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于大数据的平台用户推荐方法及系统。
背景技术
随着信息技术的迅猛发展,各种在线平台如电商、社交媒体等不断涌现,用户面临信息过载的问题。为提高用户体验,本发明旨在提供一种基于大数据的平台用户推荐方法及系统,通过分析用户行为和大规模数据,精准推荐个性化内容,提升用户满意度。
中国专利公开号:CN108921673B公开了一种基于大数据的商品推荐方法,包括以下步骤:S1:根据商品类型将所有商品划分为多个商品类;S2:提取同一个商品类中商品的特征进行SVM机器学习并生成该商品类的二元分类器;所述二元分类器的数量与商品类的数量相同,且二元分类器与商品类一一对应;S3:从大数据中提取所有用户在平台上的浏览和交易记录作为用户的特征值;S4:以用户的特征值对所有的用户进行聚类分析,生成多个用户类;由此可见,所述基于大数据的商品推荐方法存在以下问题:由于缺少对平台占比反映出的推荐有效性的判定和产品名称的编辑距离反映出的分类精准性的判定导致推荐的准确性和全面性的降低。
发明内容
为此,本发明提供一种基于大数据的平台用户推荐方法及系统,用以克服现有技术中由于缺少对平台占比反映出的推荐有效性的判定和产品名称的编辑距离反映出的分类精准性的判定导致推荐的准确性和全面性的降低的问题。
为实现上述目的,本发明提供一种基于大数据的平台用户推荐方法,包括以下步骤:获取若干用户对平台的使用特征数据,并根据所述若干用户对平台的使用特征数据生成对应的若干用户画像;根据所述若干用户画像对对应用户的平台浏览页面进行产品推荐,并获取所述平台的若干用户的浏览页面的产品点击数量和若干浏览页面的产品推荐数量;基于所述若干用户的浏览页面的平均产品点击数量占比对用户特征的存储类型的数量进行确定,或,初次判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取;若基于所述浏览页面的产品名称与用户搜索的产品名称的编辑距离二次判定产品分类的精准性低于允许范围,则对关联性推荐阈值进行确定,或,基于所述产品名称的编辑距离和相同类型产品的浏览数量对产品筛选粒度进行确定;获取确定所述关联性推荐阈值后的单位监测周期内浏览页面的刷新次数,并基于所述单位监测周期内浏览页面的刷新次数确定用户画像的更新频率。
进一步地,确定所述用户特征的存储类型的数量的步骤包括:
根据所述平台的若干用户的浏览页面的产品点击数量和若干浏览页面的产品推荐数量对浏览页面的平均产品点击数量占比进行计算;
将所述浏览页面的平均产品点击数量占比分别与预设第一占比和预设第二占比进行比对;
若所述浏览页面的平均产品点击数量占比小于所述预设第一占比,则对所述用户特征的存储类型的数量进行确定。
进一步地,所述用户特征的存储类型的数量通过所述预设第一占比与所述浏览页面的平均产品点击数量占比的差值确定。
进一步地,所述确定关联性推荐阈值的步骤包括:
若所述浏览页面的平均产品点击数量占比大于等于所述预设第一占比且小于所述预设第二占比,初步判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取;
基于所述浏览页面的产品名称和所述用户搜索的产品名称对产品名称的编辑距离进行计算;
将所述产品名称的编辑距离分别与预设第一距离和预设第二距离进行比对;
若所述产品名称的编辑距离大于所述预设第一距离且小于等于所述预设第二距离,则二次判定数据产品分类的精准性低于允许范围,并对所述关联性推荐阈值进行确定。
进一步地,基于所述产品名称的编辑距离与所述预设第一距离的差值确定所述关联性推荐阈值。
进一步地,确定所述产品筛选粒度的步骤包括:
若所述产品名称的编辑距离大于所述预设第二距离,对相同类型产品的浏览数量进行获取;
将所述相同类型产品的浏览数量与预设数量进行对比,并在相同类型产品的浏览数量大于预设数量时,对产品筛选粒度进行确定。
进一步地,所述产品筛选粒度由相同类型产品的浏览数量与预设数量的差值确定。
进一步地,所述确定用户画像的更新频率的步骤包括:
将所述单位监测周期内浏览页面的刷新次数与预设刷新次数进行比对;
若所述单位监测周期内浏览页面的刷新次数大于所述预设刷新次数,判定平台推荐全面性不足,对用户画像的更新频率进行确定。
进一步地,基于所述单位监测周期内浏览页面的刷新次数与所述预设刷新次数的差值确定用户画像的更新频率。
本发明还提供一种基于大数据的平台用户推荐系统,包括:
数据获取模块,用以对若干用户的平台的使用特征数据进行获取,并根据所述若干用户对平台的使用特征数据生成对应的若干用户画像;
数据存储模块,其与所述数据获取模块相连,用以对所述若干用户的平台的使用特征数据和所述若干用户画像进行存储;
产品推荐模块,其与所述数据获取模块相连,应以根据所述若干用户画像对对应用户的平台浏览页面进行产品推荐;
控制模块,其与所述数据获取模块、所述数据存储模块以及所述产品推荐模块分别相连,用以根据若干用户的浏览页面的平均产品点击数量占比对用户特征的存储类型的数量进行确定,或,初次判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取,
以及,根据浏览页面的产品名称与用户搜索的产品名称的编辑距离对关联性推荐阈值进行确定,或,根据所述产品名称的编辑距离和相同类型产品的浏览数量,确定产品筛选粒度,
以及,根据确定所述关联性推荐阈值后的单位监测周期内浏览页面的刷新次数确定用户画像的更新频率。
与现有技术相比,本发明的有益效果在于,基于平台用户数据和大数据对平台用户进行物品推荐时,由于平台获取用户数据较为单一,使得生成的用户画像局限性较大,表现为对浏览页面的占比降低,通过增大用户特征的存储类型的数量,提高大数据筛查用户数据在用户画像形成过程中的贡献数据量,为用户提供多元化的物品选择,提高了推荐商品的全面性,进一步提高了推荐方法的准确性。
本发明所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,形成用户画像,并基于用户画像计算物品与用户的关联性系数,并在关联性系数大于关联性推荐阈值时,对物品进行推荐,产品名称的编辑距离的增大表明推荐的个性化降低,推荐精准性低于允许范围,通过提高关联性推荐阈值,提高分类的精确性,进一步提高了推荐方法的准确性。
本发明所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,通过物品标签的比对达到物品分类的作用,通过增大产品筛选粒度即增大对物品标签的对比次数,提高分类的准确度,进一步提高了推荐方法的准确性。
本发明所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,通过提高关联性推荐阈值,提高分类的精确性,但同时伴随着推荐数量和推荐新颖性的降低,通过增大用户画像的更新频率,即用户画像的学习和调整频率,提高用户画像对用户数据的响应能力,进而提高推荐物品的覆盖范围,进一步提高了推荐方法的准确性。
附图说明
图1为本发明实施例基于大数据的平台用户推荐方法的整体流程图;
图2为本发明实施例基于大数据的平台用户推荐方法的确定用户特征的存储类型的数量的具体流程图;
图3为本发明实施例基于大数据的平台用户推荐方法的确定产品筛选粒度过程的逻辑框图;
图4为本发明实施例基于大数据的平台用户推荐系统的整体结构框图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
请参阅图1、图2、图3以及图4所示,其分别为本发明实施例基于大数据的平台用户推荐方法的整体流程图、确定用户特征的存储类型的数量的具体流程图、确定产品筛选粒度的逻辑框图以及基于大数据的平台用户推荐系统的整体结构框图。本发明一种基于大数据的平台用户推荐方法,包括以下步骤:
获取若干用户对平台的使用特征数据,并根据所述若干用户对平台的使用特征数据生成对应的若干用户画像;
根据所述若干用户画像对对应用户的平台浏览页面进行产品推荐;
获取所述平台的若干用户的浏览页面的产品点击数量和若干浏览页面的产品推荐总数量;
基于所述若干用户的浏览页面的平均产品点击数量占比对用户特征的存储类型的数量进行确定,或,初次判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取;
若基于所述浏览页面的产品名称与用户搜索的产品名称的编辑距离二次判定产品分类的精准性低于允许范围,则对关联性推荐阈值进行确定,或,基于所述产品名称的编辑距离和相同类型产品的浏览数量对产品筛选粒度进行确定;
获取确定所述关联性推荐阈值后的单位监测周期内浏览页面的刷新次数,并基于所述单位监测周期内浏览页面的刷新次数确定用户画像的更新频率。
具体而言,所述用户特征存储类型的含义为从平台外通过点击网址链接的方式进入平台的用户的画像的类型。
具体而言,用户特征存储类型包括若干种用户画像的类型。
具体而言,用户画像的更新方法包括通过对数据清洗次数的改变对用户对平台的使用特征数据的增加、删减以及修正。
具体而言,所述平台的使用特征数据包括用户订单数据、用户历史检索数据以及用户历史浏览数据。
请继续参阅图2所示,确定所述用户特征的存储类型的数量的步骤包括:
根据所述平台的若干用户的浏览页面的产品点击数量和若干浏览页面的产品推荐数量对浏览页面的平均产品点击数量占比进行计算;
将所述浏览页面的平均产品点击数量占比分别与预设第一占比和预设第二占比进行比对,并在所述浏览页面的平均产品点击数量占比小于所述预设第二占比时,判定推荐的精准性低于允许范围;
若所述浏览页面的平均产品点击数量占比小于所述预设第一占比,则对所述用户特征的存储类型的数量进行确定;
其中,所述预设第一占比小于所述预设第二占比。
具体而言,所述浏览页面的平均产品点击数量占比的计算公式为:
其中,P为浏览页面的平均产品点击数量占比,pav为第v个用户的浏览页面的产品点击数量,pbv为第v个用户的浏览页面的产品总数量,n为用户数量,n为大于等于1的自然数。
所述用户特征的存储类型的数量通过所述预设第一占比与所述浏览页面的平均产品点击数量占比的差值确定。
具体而言,预设第一占比记为P1,预设第二占比记为P2,预设第一占比与浏览页面的平均产品点击数量占比的差值记为△P,设定△P=P1-P,预设占比差值记为△P0,
若△P≤△P0,使用预设第一数据调节系数α1对用户特征的存储类型的数量B进行确定;
若△P>△P0,使用预设第二数据调节系数α2对用户特征的存储类型的数量B进行确定;
其中,0<α1<α2<1,确定后的用户特征的存储类型的数量B’=B×(1+αi),αi为预设第i占比调节系数,设定i=1,2。
本发明所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,由于平台获取用户数据较为单一,使得生成的用户画像局限性较大,表现为对浏览页面的占比降低,通过增大用户特征的存储类型的数量,提高大数据筛查用户数据在用户画像形成过程中的贡献数据量,为用户提供多元化的物品选择,提高了推荐商品的全面性,进一步提高了推荐方法的准确性。
请继续参阅图1所示,所述确定关联性推荐阈值的步骤包括:
若所述浏览页面的平均产品点击数量占比大于等于所述预设第一占比且小于所述预设第二占比,初步判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取;
基于所述浏览页面的产品名称和所述用户搜索的产品名称对产品名称的编辑距离进行计算;
将所述产品名称的编辑距离分别与预设第一距离和预设第二距离进行比对;
若所述产品名称的编辑距离大于所述预设第一距离且小于等于所述预设第二距离,则二次判定数据产品分类的精准性低于允许范围,并对所述关联性推荐阈值进行确定,
其中,所述预设第一距离小于所述预设第二距离。
具体而言,浏览页面的产品名称与用户搜索的产品名称的编辑距离为搜索框中的产品名称的字符变更为浏览页面的产品名称的字符所需要进行插入、删除或替换等操作的次数,可以理解的是,浏览页面的产品名称与用户搜索的产品名称的编辑距离为本领域技术人员的常用技术手段,在此不做赘述。
基于所述产品名称的编辑距离与所述预设第一距离的差值确定所述关联性推荐阈值。
具体而言,产品名称的编辑距离记为X,预设第一距离记为X1,预设第二距离记为X2,产品名称的编辑距离与预设第一距离的差值记为△X,设定△X=X-X1,预设距离差值记为△X0,
若△X≤△X0,使用预设第一阈值调节系数β1对关联性推荐阈值Y进行确定;
若△X>△X0,使用预设第二阈值调节系数β2对关联性推荐阈值Y进行确定;
其中,1<β1<β2,确定后的关联性推荐阈值Y’=Y×βj,βj为预设第j占比调节系数,设定j=1,2。
本发明所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,形成用户画像,并基于用户画像计算物品与用户的关联性系数,并在关联性系数大于关联性推荐阈值时,对物品进行推荐,产品名称的编辑距离的增大表明推荐的个性化降低,推荐精准性低于允许范围,通过提高关联性推荐阈值,提高分类的精确性,进一步提高了推荐方法的准确性。
请继续参阅图3所示,确定所述产品筛选粒度的步骤包括:
若所述产品名称的编辑距离大于所述预设第二距离,对相同类型产品的浏览数量进行获取;
将所述相同类型产品的浏览数量与预设数量进行比较,若相同类型产品的浏览数量大于预设数量时,对产品筛选粒度进行确定;
若相同类型产品的浏览数量小于等于预设数量时,按照预设产品筛选粒度对产品进行分类。
具体而言,产品筛选粒度为对物品进行分类的精细程度,所述产品筛选粒度可以为标签数量、品牌类别或评分范围,
其中,所述品牌类别可以为A品牌、B品牌或A和B的联名品牌。
所述产品筛选粒度由相同类型产品的浏览数量与预设数量的差值确定。
具体而言,相同类型产品的浏览数量记为C,预设数量记为C0,相同类型产品的浏览数量与预设数量的差值记为△C,设定△C=C-C0,预设数量差值记为△C0,由相同类型产品的浏览数量与预设数量的差值确定产品筛选粒度的过程为:
若△C≤△C0,将产品筛选粒度L调节为[5L/3];
若△C≤△C0,将产品筛选粒度L调节为[7L/3]。
本发明所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,通过物品标签的比对达到物品分类的作用,通过增大产品筛选粒度即增大对物品标签的对比次数,提高分类的准确度,进一步提高了推荐方法的准确性。
请继续参阅图1所示,所述确定用户画像的更新频率的步骤包括:
将所述单位监测周期内浏览页面的刷新次数与预设刷新次数进行比对;
若所述单位监测周期内浏览页面的刷新次数大于所述预设刷新次数,判定平台推荐全面性不足,对用户画像的更新频率进行确定。
基于所述单位监测周期内浏览页面的刷新次数与所述预设刷新次数的差值确定用户画像的更新频率。
具体而言,单位监测周期内浏览页面的刷新次数记为H,预设刷新次数记为H0,单位监测周期内浏览页面的刷新次数与预设刷新次数的差值记为△H,设定△H=H-H0,预设刷新次数差值记为△H0,
若△H≤△H0,使用预设第一频率调节系数ζ1对用户画像的更新频率R进行确定;
若△H>△H0,使用预设第二频率调节系数ζ2对用户画像的更新频率R进行确定;
其中,1<ζ1<ζ2,确定后的用户画像的更新频率R’=R×ζg,ζg为预设第g频率调节系数,设定g=1,2。
本发明所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,通过提高关联性推荐阈值,提高分类的精确性,但是同时伴随着推荐数量和推荐新颖性的降低,通过增大用户画像的更新频率,即用户画像的学习和调整频率,提高用户画像对用户数据的响应能力,进而提高推荐物品的覆盖范围,进一步提高了推荐方法的准确性。
请继续参阅图4所示,本发明还提供一种基于大数据的平台用户推荐系统,包括:
数据获取模块,用以对若干用户的平台的使用特征数据进行获取,并根据所述若干用户对平台的使用特征数据生成对应的若干用户画像;
数据存储模块,其与所述数据获取模块相连,用以对所述若干用户的平台的使用特征数据和所述若干用户画像进行存储;
产品推荐模块,其与所述数据获取模块相连,应以根据所述若干用户画像对对应用户的平台浏览页面进行产品推荐;
控制模块,其与所述数据获取模块、所述数据存储模块以及所述产品推荐模块分别相连,用以根据若干用户的浏览页面的平均产品点击数量占比对用户特征的存储类型的数量进行确定,或,初次判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取,
以及,根据浏览页面的产品名称与用户搜索的产品名称的编辑距离对关联性推荐阈值进行确定,或,根据所述产品名称的编辑距离和相同类型产品的浏览数量,确定产品筛选粒度,
以及,根据确定所述关联性推荐阈值后的单位监测周期内浏览页面的刷新次数确定用户画像的更新频率。
实施例1
本实施例1在某一电商平台上获取到浏览页面的产品名称与用户搜索的产品名称的编辑距离X=3次,预设第一距离X1=2次,预设第二距离X2=3次,产品名称的编辑距离与预设第一距离的差值记为△X=1次,预设距离差值△X0=2次,
在△X≤△X0条件下,对关联性阈值关联性推荐阈值进行确定;
预设第一阈值调节系数β1=1.3,预设第二阈值调节系数β2=1.5,初始关联性推荐阈值Y=0.15,
则确定后的关联性推荐阈值Y’=0.15×13=0.195。
本实施例1通过对关联性推荐阈值的调节,提高推荐产品与用户之间的相关性进而提高分类的准确性,进一步提高了推荐方法的准确性。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (2)
1.一种基于大数据的平台用户推荐方法,其特征在于,包括以下步骤:
获取若干用户对平台的使用特征数据,并根据所述若干用户对平台的使用特征数据生成对应的若干用户画像;
根据所述若干用户画像对对应用户的平台浏览页面进行产品推荐,并获取所述平台的若干用户的浏览页面的产品点击数量和若干浏览页面的产品推荐数量;
若浏览页面的平均产品点击数量占比小于预设第一占比,则对用户特征的存储类型的数量进行确定,若所述浏览页面的平均产品点击数量占比大于等于预设第一占比且小于预设第二占比,则初次判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取;
若产品名称的编辑距离大于预设第一距离且小于等于预设第二距离,则对关联性推荐阈值进行确定,若所述产品名称的编辑距离大于预设第二距离,则基于所述产品名称的编辑距离和相同类型产品的浏览数量对产品筛选粒度进行确定;
获取确定所述关联性推荐阈值后的单位监测周期内浏览页面的刷新次数,并基于所述单位监测周期内浏览页面的刷新次数确定用户画像的更新频率;
其中,所述用户画像的更新频率为对用户对平台的使用特征数据的增加、删减以及修正的频率;
若浏览页面的平均产品点击数量占比小于预设第一占比,则对用户特征的存储类型的数量进行确定的步骤包括:
根据所述平台的若干用户的浏览页面的产品点击数量和若干浏览页面的产品推荐数量对浏览页面的平均产品点击数量占比进行计算;
将所述浏览页面的平均产品点击数量占比分别与预设第一占比和预设第二占比进行比对;
若所述浏览页面的平均产品点击数量占比小于所述预设第一占比,则对所述用户特征的存储类型的数量进行确定;
所述用户特征的存储类型的数量通过所述预设第一占比与所述浏览页面的平均产品点击数量占比的差值确定;
若产品名称的编辑距离大于预设第一距离且小于等于预设第二距离,则对关联性推荐阈值进行确定的步骤包括:
若所述浏览页面的平均产品点击数量占比大于等于所述预设第一占比且小于所述预设第二占比,初步判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取;
基于所述浏览页面的产品名称和所述用户搜索的产品名称对产品名称的编辑距离进行计算;
将所述产品名称的编辑距离分别与预设第一距离和预设第二距离进行比对;
若所述产品名称的编辑距离大于所述预设第一距离且小于等于所述预设第二距离,则二次判定数据产品分类的精准性低于允许范围,并对所述关联性推荐阈值进行确定;
基于所述产品名称的编辑距离与所述预设第一距离的差值确定所述关联性推荐阈值;
若所述产品名称的编辑距离大于预设第二距离,则基于所述产品名称的编辑距离和相同类型产品的浏览数量对产品筛选粒度进行确定的步骤包括:
若所述产品名称的编辑距离大于所述预设第二距离,对相同类型产品的浏览数量进行获取;
将所述相同类型产品的浏览数量与预设数量进行对比,并在相同类型产品的浏览数量大于预设数量时,对产品筛选粒度进行确定;
所述产品筛选粒度由相同类型产品的浏览数量与预设数量的差值确定;
基于所述单位监测周期内浏览页面的刷新次数确定用户画像的更新频率的步骤包括:
将所述单位监测周期内浏览页面的刷新次数与预设刷新次数进行比对;
若所述单位监测周期内浏览页面的刷新次数大于所述预设刷新次数,判定平台推荐全面性不足,对用户画像的更新频率进行确定;
基于所述单位监测周期内浏览页面的刷新次数与所述预设刷新次数的差值确定用户画像的更新频率。
2.一种使用权利要求1所述的基于大数据的平台用户推荐方法的推荐系统,其特征在于,包括:
数据获取模块,用以对若干用户的平台的使用特征数据进行获取,并根据所述若干用户对平台的使用特征数据生成对应的若干用户画像;
数据存储模块,其与所述数据获取模块相连,用以对所述若干用户的平台的使用特征数据和所述若干用户画像进行存储;
产品推荐模块,其与所述数据获取模块相连,应以根据所述若干用户画像对对应用户的平台浏览页面进行产品推荐;
控制模块,其与所述数据获取模块、所述数据存储模块以及所述产品推荐模块分别相连,用以在浏览页面的平均产品点击数量占比小于预设第一占比时对用户特征的存储类型的数量进行确定,在所述浏览页面的平均产品点击数量占比大于等于预设第一占比且小于预设第二占比时,初次判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取,
以及,在产品名称的编辑距离大于预设第一距离且小于等于预设第二距离时,对关联性推荐阈值进行确定,
以及,在所述产品名称的编辑距离大于预设第二距离时,确定产品筛选粒度,
以及,根据确定所述关联性推荐阈值后的单位监测周期内浏览页面的刷新次数确定用户画像的更新频率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311816676.3A CN117474636B (zh) | 2023-12-27 | 2023-12-27 | 一种基于大数据的平台用户推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311816676.3A CN117474636B (zh) | 2023-12-27 | 2023-12-27 | 一种基于大数据的平台用户推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117474636A CN117474636A (zh) | 2024-01-30 |
CN117474636B true CN117474636B (zh) | 2024-04-12 |
Family
ID=89631505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311816676.3A Active CN117474636B (zh) | 2023-12-27 | 2023-12-27 | 一种基于大数据的平台用户推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117474636B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117829965B (zh) * | 2024-03-01 | 2024-06-25 | 深圳欧税通技术有限公司 | 一种用于跨境电商平台的产品推荐系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364252A (zh) * | 2021-01-12 | 2021-02-12 | 北京世纪好未来教育科技有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
CN115187331A (zh) * | 2022-06-24 | 2022-10-14 | 平安科技(深圳)有限公司 | 基于多模态数据的产品推荐方法、装置、设备及存储介质 |
CN116204688A (zh) * | 2023-05-04 | 2023-06-02 | 量子数科科技有限公司 | 一种基于键入搜索词推荐用户搜索词的方法 |
CN116823409A (zh) * | 2023-08-29 | 2023-09-29 | 南京大数据集团有限公司 | 一种基于目标搜索数据的智能筛选方法及系统 |
CN117151814A (zh) * | 2023-09-01 | 2023-12-01 | 西安创业天下网络科技有限公司 | 个性化商品推荐与实时动态调整方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160364426A1 (en) * | 2015-06-11 | 2016-12-15 | Sap Se | Maintenance of tags assigned to artifacts |
-
2023
- 2023-12-27 CN CN202311816676.3A patent/CN117474636B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364252A (zh) * | 2021-01-12 | 2021-02-12 | 北京世纪好未来教育科技有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
CN115187331A (zh) * | 2022-06-24 | 2022-10-14 | 平安科技(深圳)有限公司 | 基于多模态数据的产品推荐方法、装置、设备及存储介质 |
CN116204688A (zh) * | 2023-05-04 | 2023-06-02 | 量子数科科技有限公司 | 一种基于键入搜索词推荐用户搜索词的方法 |
CN116823409A (zh) * | 2023-08-29 | 2023-09-29 | 南京大数据集团有限公司 | 一种基于目标搜索数据的智能筛选方法及系统 |
CN117151814A (zh) * | 2023-09-01 | 2023-12-01 | 西安创业天下网络科技有限公司 | 个性化商品推荐与实时动态调整方法 |
Non-Patent Citations (1)
Title |
---|
面向电商的基于协同过滤的个性化推荐;张鹏飞等;科技广场;20160630(06);16-20 * |
Also Published As
Publication number | Publication date |
---|---|
CN117474636A (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106919619B (zh) | 一种商品聚类方法、装置及电子设备 | |
US8407104B2 (en) | Catalog based price search | |
US7885859B2 (en) | Assigning into one set of categories information that has been assigned to other sets of categories | |
Peacock | Data mining in marketing: Part 1 | |
CN117474636B (zh) | 一种基于大数据的平台用户推荐方法及系统 | |
CN110222272A (zh) | 一种潜在客户挖掘与推荐方法 | |
CN109493199A (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
US20090076927A1 (en) | Distinguishing accessories from products for ranking search results | |
CN108073667B (zh) | 产生用户浏览属性的方法、以及非暂存计算机可读介质 | |
CN107256238B (zh) | 一种多约束条件下的个性化信息推荐方法及信息推荐系统 | |
CN116431931B (zh) | 实时增量数据统计分析方法 | |
CN116452261B (zh) | 一种基于跨境电商服务平台的广告投放数据处理方法 | |
CN111899075A (zh) | 一种基于用户行为的个性化商品推荐方法及装置 | |
CN106874314A (zh) | 信息推荐的方法和装置 | |
CN107464134A (zh) | 一种多维度材料价格对比分析及可视化展现方法 | |
CN109272390A (zh) | 融合评分和标签信息的个性化推荐方法 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN113076484A (zh) | 基于深度学习的产品推荐方法、装置、设备和存储介质 | |
CN115018588A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN112131491B (zh) | 分层排序方法、计算设备和计算机可读存储介质 | |
CN113222687A (zh) | 一种基于深度学习的推荐方法及装置 | |
CN110020918B (zh) | 一种推荐信息生成方法和系统 | |
CN109408808B (zh) | 一种文艺作品的评估方法及评估系统 | |
Wu et al. | [Retracted] Using the Mathematical Model on Precision Marketing with Online Transaction Data Computing | |
CN115660756A (zh) | 一种电商商品的价格监测方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |