CN114048389B - 一种面向工程机械行业的内容推荐方法及系统 - Google Patents

一种面向工程机械行业的内容推荐方法及系统 Download PDF

Info

Publication number
CN114048389B
CN114048389B CN202210023866.9A CN202210023866A CN114048389B CN 114048389 B CN114048389 B CN 114048389B CN 202210023866 A CN202210023866 A CN 202210023866A CN 114048389 B CN114048389 B CN 114048389B
Authority
CN
China
Prior art keywords
user
target user
preference
users
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210023866.9A
Other languages
English (en)
Other versions
CN114048389A (zh
Inventor
王涛
朱春华
王艳娜
曾繁诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jerei Digital Technology Co Ltd
Original Assignee
Shandong Jerei Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jerei Digital Technology Co Ltd filed Critical Shandong Jerei Digital Technology Co Ltd
Priority to CN202210023866.9A priority Critical patent/CN114048389B/zh
Publication of CN114048389A publication Critical patent/CN114048389A/zh
Application granted granted Critical
Publication of CN114048389B publication Critical patent/CN114048389B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种面向工程机械行业的内容推荐方法及系统,属于计算机技术领域,首先判断目标用户是新用户还是老用户,然后向新用户随机推荐工程机械行业的热点和时事新闻,之后将其与老用户一同处理,收集他们在平台上的行为数据,并据此得出高频关键词集合,再将点击转化系数和访问深度系数未达到平均值的关键词删除,从而根据点击转化率和停留时长挖掘新老用户的喜好,得到用户喜好集合,最后利用皮尔逊相关系数公式找到与目标用户喜好相似度强的其他用户,将这些用户的喜好集合中的目标用户的喜好,推荐给目标用户,从而为不同的用户进行个性化推荐,解决了现有技术中无法给用户做个性化推荐的问题。

Description

一种面向工程机械行业的内容推荐方法及系统
技术领域
本发明涉及计算机技术领域,特别是涉及一种基于协同过滤算法的面向工程机械行业的内容推荐方法及系统。
背景技术
随着互联网时代的迅速发展,现在已经身处信息大爆炸的时代,人们越来越离不开网络,看时事新闻、行业热点、娱乐八卦,资讯视频图片等各式各样的内容,每天接触的信息数以万计,已经从信息匮乏时代进入到信息过载的时代,然而想要从众多信息中获取自己需要的并且感兴趣的信息偶发性太强,并且可能会错过重要信息的时效性。
因此,如何快速的为用户精准提供有价值的信息,提高站点转化率的内容推荐方法应运而生,通过分析用户的喜好和行为规律,结合工程机械行业热点和时事新闻,总结出大多数用户喜欢的内容。然而现有的内容推荐方法无法给用户做个性化推荐,无法为用户推荐他可能感兴趣的信息。
因此,本领域亟需一种为用户进行个性化推荐的技术方案。
发明内容
本发明的目的是提供一种面向工程机械行业的内容推荐方法及系统,针对新用户随机推荐工程机械行业热点和时事新闻,然后根据点击转化率和停留时长挖掘新老用户的喜好或者需求,从而为不同的用户进行个性化推荐,解决了现有技术中无法给用户做个性化推荐的问题。
为实现上述目的,本发明提供了如下方案:
一种面向工程机械行业的内容推荐方法,所述方法包括:
判断工程机械行业平台上是否已经存在目标用户的行为数据;若存在,则判定所述目标用户为老用户,若不存在,则判定所述目标用户为新用户;
向所述新用户随机推荐工程机械行业热点和时事新闻;
收集在工程机械行业平台上的所有用户的行为数据;
通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数;
通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数;
将所述目标用户高频关键词集合中点击转化系数小于所述平均点击转化系数或者访问深度系数小于平均访问深度系数的高频关键词删除,得到目标用户喜好集合;
利用皮尔逊相关系数公式在工程机械行业用户群体中找到与目标用户喜好相似度大于预设阈值的其他用户;
在所述相似度大于预设阈值的其他用户的喜好集合中,寻找目标用户的喜好,并将所述喜好推荐给目标用户。
在一些实施例中,所述收集在工程机械行业平台上的所有用户的行为数据,具体包括:
在工程机械行业平台各处增加埋点;
利用所述埋点收集在工程机械行业平台上的所有用户的行为数据;所述行为数据包括:时间、地点、用户ID、操作类型、内容以及停留时长;
在数据库中创建目标用户行为数据日志表;
将所述行为数据保存至所述行为数据日志表中。
在一些实施例中,所述通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数,具体包括:
通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合;
利用点击转化系数计算公式计算所述目标用户对每个高频关键词的点击转化系数;所述点击转化系数计算公式为:C=CN/EN,其中,C表示点击转化系数,CN表示点击次数,EN表示曝光次数;
利用访问深度系数计算公式计算所述目标用户对每个高频关键词的访问深度系数;所述访问深度系数计算公式为:V=VT/VN,其中,V表示访问深度系数,VT表示访问总时长,VN表示访问次数。
在一些实施例中,所述通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数,具体包括:
通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个用户对每个高频关键词的点击转化系数和访问深度系数;
根据每个用户对每个高频关键词的点击转化系数和访问深度系数,计算每个高频关键词的平均点击转化系数和平均访问深度系数。
在一些实施例中,所述皮尔逊相关系数公式为:
Figure 539544DEST_PATH_IMAGE001
其中,s(u,v)表示用户之间的相似度,i表示用户的喜好;I u 表示用户u对其所有喜好的评分集合;I v 表示用户v对其所有喜好的评分集合;r u,i 表示用户u对喜好i的评分;r v,i 表示用户v对喜好i的评分;
Figure 65203DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;
Figure 206334DEST_PATH_IMAGE003
表示用户v对其所有喜好的平均评分。
在一些实施例中,用户对喜好的评分的计算公式为:
Figure DEST_PATH_IMAGE004
其中,ru,i表示用户u对喜好i的评分;ECu,i表示用户u对喜好i的有效点击数,有效点击数即用户u对喜好i的总点击次数减用户u对喜好i的总点击次数中访问时长小于平均访问时长的点击次数;TCu表示用户u对其所有喜好的有效点击数的总和;N表示用户u所有喜好的数量。
在一些实施例中,所述在所述相似度大于预设阈值的其他用户的喜好集合中,寻找所述目标用户的喜好,并将所述喜好推荐给所述目标用户,具体包括:
利用喜好计算公式计算目标用户对所述相似度大于预设阈值的其他用户的每个喜好的评分Pu,i,当评分Pu,i大于预设阈值时,将所述喜好推荐给目标用户;
所述喜好计算公式为:
Figure 828946DEST_PATH_IMAGE005
P u,i 表示目标用户u对所述相似度大于预设阈值的其他用户的喜好i的评分;
Figure 459647DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;su,u’)表示用户uu’的相似度;r u’,i 表示用户u’对喜好i的评分;
Figure 207023DEST_PATH_IMAGE006
表示用户u’对其所有喜好的平均评分。
本发明还提供了一种面向工程机械行业的内容推荐系统,所述系统包括:
新老用户判断模块,用于判断平台上是否已经存在目标用户的行为数据;若存在,则判定所述目标用户为老用户,若不存在,则判定所述目标用户为新用户;
新用户推荐模块,用于向所述新用户随机推荐工程机械行业热点和时事新闻;
数据收集模块,用于收集所有用户在平台上的行为数据;
目标用户转化系数和访问深度系数计算模块,用于通过收集得到的目标用户在平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数;
平均点击转化系数和平均访问深度系数计算模块,用于通过收集得到的所有用户在平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数;
喜好集合获取模块,用于将所述目标用户高频关键词集合中点击转化系数小于所述平均点击转化系数或者访问深度系数小于平均访问深度系数的高频关键词删除,得到目标用户喜好集合;
相似用户计算模块,用于利用皮尔逊相关系数公式在工程机械行业用户群体中找到与目标用户喜好相似度强的其他用户;
推荐模块,用于在所述相似度强的其他用户的喜好集合中,寻找目标用户的喜好,并将所述喜好推荐给目标用户。
在一些实施例中,所述通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数,具体包括:
通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合;
利用点击转化系数计算公式计算所述目标用户对每个高频关键词的点击转化系数;所述点击转化系数计算公式为:C=CN/EN,其中,C表示点击转化系数,CN表示点击次数,EN表示曝光次数;
利用访问深度系数计算公式计算所述目标用户对每个高频关键词的访问深度系数;所述访问深度系数计算公式为:V=VT/VN,其中,V表示访问深度系数,VT表示访问总时长,VN表示访问次数。
在一些实施例中,所述在所述相似度大于预设阈值的其他用户的喜好集合中,寻找所述目标用户的喜好,并将所述喜好推荐给所述目标用户,具体包括:
利用喜好计算公式计算目标用户对所述相似度大于预设阈值的其他用户的每个喜好的评分Pu,i,当评分Pu,i大于预设阈值时,将所述喜好推荐给目标用户;
所述喜好计算公式为:
Figure 823949DEST_PATH_IMAGE005
P u,i 表示目标用户u对所述相似度大于预设阈值的其他用户的喜好i的评分;
Figure 973171DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;su,u’)表示用户uu’的相似度;r u’,i 表示用户u’对喜好i的评分;
Figure 509194DEST_PATH_IMAGE007
表示用户u’对其所有喜好的平均评分。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种面向工程机械行业的内容推荐方法及系统,首先判断目标用户是新用户还是老用户,然后向新用户随机推荐工程机械行业的热点和时事新闻,之后将其与老用户一同处理,收集他们在平台上的行为数据,并据此得出高频关键词集合,再将点击转化系数和访问深度系数未达到平均值的关键词删除,从而根据点击转化率和停留时长挖掘新老用户的喜好,得到用户喜好集合,最后利用皮尔逊相关系数公式找到与目标用户喜好相似度强的其他用户,将这些用户的喜好集合中的目标用户的喜好,推荐给目标用户,从而为不同的用户进行个性化推荐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的面向工程机械行业的内容推荐方法的流程图。
图2为本发明实施例二提供的面向工程机械行业的内容推荐系统的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种面向工程机械行业的内容推荐方法及系统,针对新用户随机推荐工程机械行业热点和时事新闻,根据点击转化率和停留时长挖掘新老用户的喜好或者需求,从而为不同的用户进行个性化推荐,解决了现有技术中无法给用户做个性化推荐的问题。
内容推荐方法随着网络的发展也在逐步完善中,从最开始的人为分析推荐到现在的大数据推荐系统。前者在基于用户群体数量不多的情况下是可以实施的,但是推荐的内容只能代表大部分用户的喜好或者需求,并不能解决所有人的需求,而且实施起来费时费力。后者是目前不少平台正在应用中或者在尝试应用的,现在已有的几种推荐方法中,协同过滤算法是很常用的一种算法,多用于各种电商平台。协同过滤算法的原理是通过分析用户的喜好,在用户群中找到喜好相似的用户,计算并分析,对该用户做喜好程度预测,将兴趣相投的其他用户感兴趣的东西推荐给该用户。协同过滤算法的优点是思路简单,对推荐对象没有特定的要求,能处理非结构化的复杂对象,例如艺术品、音乐、电影等,并能发现用户潜在的兴趣点。但是它也存在缺点,无法给新用户做个性化推荐,因为缺少该用户的喜好数据,根据协同过滤算法,无法找到与他喜好相似的用户,所以无法为该用户推荐他可能感兴趣的信息,即冷启动问题。
为此,本发明提供一种基于协同过滤算法的面向工程机械行业的内容推荐方法。通过协同过滤的推荐分析方法,针对老用户不断挖掘他的喜好或者需求,或者潜在的喜好或者需求,帮助用户发现对自己有价值的信息,针对新用户随机推荐工程机械行业热点和时事新闻,根据新用户的点击转化率和停留时长挖掘该用户的喜好或者需求,根据协同过滤算法,找到与该用户喜好相似的用户,为该用户推荐可能感兴趣的信息,形成良好的循环。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一:
如图1所示,本发明提供了一种面向工程机械行业的内容推荐方法,该方法包括:
S1、判断工程机械行业平台上是否已经存在目标用户的行为数据;若存在,则判定所述目标用户为老用户,若不存在,则判定所述目标用户为新用户。本实施例中的目标用户即为需要被推荐内容的用户。
S2、向所述新用户随机推荐工程机械行业热点和时事新闻。
如果目标用户的行为数据不存在,没有找到该用户的历史足迹,则说明目标用户为新用户,新用户的推荐内容不能使用协同过滤算法进行推荐,因为协同过滤算法的冷启动问题,初始新用户不存在可分析的数据,找不到与该用户喜好相似的其他用户。针对新用户采用随机推荐工程机械行业热点和时事新闻的方式进行初始化推荐,然后平台上就具有该新用户的行为数据了,后续将其与老用户一同处理即可。
S3、收集在工程机械行业平台上的所有用户的行为数据;
其具体方法为:
在数据库中创建用户行为数据日志表,在工程机械行业平台各处增加埋点,例如搜索框、信息流列表、信息详情页等位置,目标用户每次触发埋点事件,会在用户行为数据日志表中增加一条记录,记录时间、地点、用户ID、操作类型、内容、停留时长等。例如{“2022-01-01 08:30:33”,“维修信息瀑布流”,“USER01”,“点击”,“挖掘机维修”,“3min”}。收集目标用户在平台上的各种行为数据,操作日志、访问日志、交互日志、曝光日志等,这项工作是持续进行的,只要用户在平台上产生访问,就会一直收集数据,这些日志代表目标用户在平台上的历史足迹,为分析用户喜好提供了数据基础。
S4、通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数。
具体来讲,通过分析目标用户的行为数据,提取多个不重复的高频关键词集合{item1,item2,item3,……itemn},其中itemn表示第n个高频关键词。
接下来对提取的高频关键词进行分析,用户行为权重主要从两个方面来计算,点击转化系数C和访问深度系数V。点击转化系数C即高频关键词itemn曝光转化成点击的转化率,数值越大代表转化率越高关键词价值越大,根据目标用户浏览过程中的高频关键词itemn曝光次数EN及点击次数CN进行计算,计算公式:C=CN/EN,其中,C表示点击转化系数,CN表示点击次数,EN表示曝光次数。本实施例中曝光表示关键词出现的次数,或者可以理解为关键词被用户浏览到的次数。
访问深度系数V即高频关键词itemn的平均访问时长(min),数值越大代表停留时间越长关键词价值越大,根据目标用户访问高频关键词itemn次数VN及访问总时长(min)VT进行计算,计算公式为:V=VT/VN,其中,V表示访问深度系数,VT表示访问总时长,VN表示访问次数。
S5、通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数。
通过综合分析收集得到的所有用户在平台上的行为数据,重复步骤S4计算每个用户对每个高频关键词的点击转化系数和访问深度系数。
根据每个用户对每个高频关键词的点击转化系数和访问深度系数,计算每个高频关键词的平均点击转化系数和平均访问深度系数。
S6、将所述目标用户高频关键词集合中点击转化系数小于所述平均点击转化系数或者访问深度系数小于所述平均访问深度系数的高频关键词删除,得到目标用户喜好集合。
通过综合分析其他用户的喜好或需求集合,得出点击转化系数C的平均值
Figure 681550DEST_PATH_IMAGE008
和访问深度系数V的平均值
Figure 898905DEST_PATH_IMAGE009
Figure 253966DEST_PATH_IMAGE008
Figure 836257DEST_PATH_IMAGE009
作为阈值。若高频关键词itemn的点击转化系数C小于
Figure 558226DEST_PATH_IMAGE008
,则该高频关键词itemn从高频关键词集合中移除。若高频关键词itemn的访问深度系数V小于
Figure 376009DEST_PATH_IMAGE009
,则该高频关键词itemn从高频关键词集合中移除。最终得到目标用户的喜好或需求集合。本实施例中并不区分用户的喜好与需求,所以利用用户的喜好表示用户的喜好或需求。
作为一种具体的实施方式,
本实施例中点击转化系数C的平均值计算:例如,高频关键词“挖掘机”,单个用户对关键词“挖掘机”点击数据可以这么表示{'点击次数','曝光次数'},获取用户点击数据集,一共n组数据[{'4','200'},{'10','360'},{'15','520'},{'5','120'},...,{'CNn','ENn'}],根据C=CN/EN每组计算出一个点击转化系数C,点击转化系数C的平均值`C=(C1+C2+C3+...+Cn)/n,平均点击率`C即为阈值,计算出的阈值为2.7%。
访问深度系数V的平均值计算:例如高频关键词“挖掘机”,单个用户对关键词“挖掘机”访问数据可以这么表示{'访问次数','访问总时长(min)'},获取用户访问数据集,一共n组数据[{'10','3min'},{'20','10min'},{'3','2min'},{'15','5min'},...,{'VNn','VTn'}],根据V=VT/VN每组计算出一个访问深度系数V,访问深度系数V的平均值`V=(V1+V2+V3+...+Vn)/n,平均访问时长`V即为阈值,计算出阈值为0.8min。
S7、利用皮尔逊相关系数公式在工程机械行业用户群体中找到与所述目标用户喜好相似度大于预设阈值的其他用户。
具体的,首先目标用户的喜好或者需求集合,在用户群中找到与目标用户喜好或者需求相似的用户集合,本实施例是在工程机械行业平台上展开的,所以此处的用户群就是在这个工程机械行业平台上留下操作日志的人群,可以理解为这部分人都是工程机械行业相关从业人员,本实施例利用的是皮尔逊相关系数公式计算用户之间的相似度。
皮尔逊相关系数公式中用到用户对喜好的评分,用户对喜好的评分的计算公式如下:
Figure 906347DEST_PATH_IMAGE010
其中,ru,i表示用户u对喜好i的评分;ECu,i表示用户u对喜好或需求i的有效点击数,有效点击数即用户u对喜好i的总点击次数减用户u对喜好i的总点击次数中访问时长小于平均访问时长的点击次数;TCu表示用户u对其所有喜好的有效点击数的总和;N表示用户u所有喜好的数量。
皮尔逊相关系数公式为:
Figure 49753DEST_PATH_IMAGE001
其中,s(u,v)表示用户之间的相似度,i表示用户的喜好;I u 表示用户u对其所有喜好的评分集合;I v 表示用户v对其所有喜好的评分集合;r u,i 表示用户u对喜好i的评分;r v,i 表示用户v对喜好i的评分;
Figure 931121DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;
Figure 552595DEST_PATH_IMAGE003
表示用户v对其所有喜好的平均评分。得出的结果,即用户之间的相似度是一个在-1与1之间的系数,该系数用来说明两个用户间联系的强弱程度,0.8-1.0为极强相关,0.6-0.8为强相关,0.4-0.6为中等程度相关,0.2-0.4为弱相关,<0.2为极弱相关或无相关。从而找到与目标用户喜好相似度大于预设阈值的其他用户,预设阈值由人为设定。例如,本实施例中可以选取0.6作为预设阈值,即两个用户为强相关或者极强相关的时候,认为两个用户相似。
S8、在所述相似度强的其他用户的喜好集合中,寻找所述目标用户的喜好,并将所述喜好推荐给所述目标用户。
找到与目标用户相似度强的其他用户以后,利用喜好计算公式计算目标用户对相似度强的其他用户的每个喜好的评分Pu,i,当评分Pu,i大于预设阈值时,将该喜好作为目标用户的喜好,推荐给目标用户,其中预设阈值由人为设定即可。
喜好计算公式为:
Figure 203020DEST_PATH_IMAGE005
P u,i 表示目标用户u对所述相似度大于预设阈值的其他用户的喜好i的评分;
Figure 189430DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;su,u’)表示用户uu’的相似度;r u’,i 表示用户u’对喜好i的评分;
Figure DEST_PATH_IMAGE011
表示用户u’对其所有喜好的平均评分。
本发明实施例采用协同过滤算法,推荐个性化、自动化程度高、能够有效的利用其他相似用户的回馈信息、加快个性化学习的速度。利用皮尔逊相关系数公式计算用户之间的相似度,皮尔逊相关系数是线性相关关系,变量是连续变量,符合正态分布,效率比较高。本发明实施例解决了协同过滤算法冷启动的问题,完善了新用户内容推荐机制,并形成了推荐的良性循环。
实施例二:
如图2所示,本实施例提供了一种面向工程机械行业的内容推荐系统,该系统包括:
新老用户判断模块M1,用于判断工程机械行业平台上是否已经存在目标用户的行为数据;若存在,则判定所述目标用户为老用户,若不存在,则判定所述目标用户为新用户;
新用户推荐模块M2,用于向所述新用户随机推荐工程机械行业热点和时事新闻;
数据收集模块M3,用于收集在工程机械行业平台上的所有用户的行为数据;
目标用户转化系数和访问深度系数计算模块M4,用于通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数;
平均点击转化系数和平均访问深度系数计算模块M5,用于通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数;
喜好集合获取模块M6,用于将所述目标用户高频关键词集合中点击转化系数小于所述平均点击转化系数或者访问深度系数小于平均访问深度系数的高频关键词删除,得到目标用户喜好集合;
相似用户计算模块M7,用于利用皮尔逊相关系数公式在工程机械行业用户群体中找到与目标用户喜好相似度大于预设阈值的其他用户;
推荐模块M8,用于在所述相似度强的其他用户的喜好集合中,寻找目标用户的喜好,并将所述喜好推荐给目标用户。
所述通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数,具体包括:
通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合;
利用点击转化系数计算公式计算所述目标用户对每个高频关键词的点击转化系数;所述点击转化系数计算公式为:C=CN/EN,其中,C表示点击转化系数,CN表示点击次数,EN表示曝光次数;
利用访问深度系数计算公式计算所述目标用户对每个高频关键词的访问深度系数;所述访问深度系数计算公式为:V=VT/VN,其中,V表示访问深度系数,VT表示访问总时长,VN表示访问次数。
所述皮尔逊相关系数公式为:
Figure 151570DEST_PATH_IMAGE001
其中,s(u,v)表示用户之间的相似度,i表示用户的喜好;I u 表示用户u对其所有喜好的评分集合;I v 表示用户v对其所有喜好的评分集合;r u,i 表示用户u对喜好i的评分;r v,i 表示用户v对喜好i的评分;
Figure 311156DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;
Figure 347245DEST_PATH_IMAGE003
表示用户v对其所有喜好的平均评分。
所述在所述相似度大于预设阈值的其他用户的喜好集合中,寻找目标用户的喜好,并将所述喜好推荐给目标用户,具体包括:
利用喜好计算公式计算目标用户对相似度大于预设阈值的其他用户的每个喜好的评分Pu,i,当评分Pu,i大于预设阈值时,将所述喜好推荐给目标用户;
所述喜好计算公式为:
Figure 301294DEST_PATH_IMAGE005
P u,i 表示目标用户u对所述相似度大于预设阈值的其他用户的喜好i的评分;
Figure 157255DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;su,u’)表示用户uu’的相似度;r u’,i 表示用户u’对喜好i的评分;
Figure 120532DEST_PATH_IMAGE012
表示用户u’对其所有喜好的平均评分。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
本发明涉及一种面向工程机械行业的内容推荐方法及系统,属于计算机技术领域,首先判断目标用户是新用户还是老用户,然后向新用户随机推荐工程机械行业的热点和时事新闻,之后将其与老用户一同处理,收集他们在平台上的行为数据,并据此得出高频关键词集合,再将点击转化系数和访问深度系数未达到平均值的关键词删除,从而根据点击转化率和停留时长挖掘新老用户的喜好,得到用户喜好集合,最后利用皮尔逊相关系数公式找到与目标用户喜好相似度强的其他用户,将这些用户的喜好集合中的目标用户的喜好,推荐给目标用户,从而为不同的用户进行个性化推荐,解决了现有技术中无法给用户做个性化推荐的问题。

Claims (6)

1.一种面向工程机械行业的内容推荐方法,其特征在于,所述方法包括:
判断工程机械行业平台上是否已经存在目标用户的行为数据;若存在,则判定所述目标用户为老用户,若不存在,则判定所述目标用户为新用户;
向所述新用户随机推荐工程机械行业热点和时事新闻;
收集在工程机械行业平台上的所有用户的行为数据;
通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数;
通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数;
将所述目标用户高频关键词集合中点击转化系数小于所述平均点击转化系数或者访问深度系数小于平均访问深度系数的高频关键词删除,得到目标用户喜好集合;
利用皮尔逊相关系数公式在工程机械行业用户群体中找到与目标用户喜好相似度大于预设阈值的其他用户;
在所述相似度大于预设阈值的其他用户的喜好集合中,寻找目标用户的喜好,并将所述喜好推荐给目标用户;
所述通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数,具体包括:
通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合;
利用点击转化系数计算公式计算所述目标用户对每个高频关键词的点击转化系数;所述点击转化系数计算公式为:C=CN/EN,其中,C表示点击转化系数,CN表示点击次数,EN表示曝光次数;
利用访问深度系数计算公式计算所述目标用户对每个高频关键词的访问深度系数;所述访问深度系数计算公式为:V=VT/VN,其中,V表示访问深度系数,VT表示访问总时长,VN表示访问次数;
所述皮尔逊相关系数公式为:
Figure DEST_PATH_IMAGE001
其中,s(u,v)表示用户之间的相似度,i表示用户的喜好;I u 表示用户u对其所有喜好的评分集合;I v 表示用户v对其所有喜好的评分集合;r u,i 表示用户u对喜好i的评分;r v,i 表示用户v对喜好i的评分;
Figure DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;
Figure DEST_PATH_IMAGE003
表示用户v对其所有喜好的平均评分;
用户对喜好的评分的计算公式为:
Figure DEST_PATH_IMAGE005
其中,ru,i表示用户u对喜好i的评分;ECu,i表示用户u对喜好i的有效点击数,有效点击数即用户u对喜好i的总点击次数减用户u对喜好i的总点击次数中访问时长小于平均访问时长的点击次数;TCu表示用户u对其所有喜好的有效点击数的总和;N表示用户u所有喜好的数量。
2.根据权利要求1所述的面向工程机械行业的内容推荐方法,其特征在于,所述收集在工程机械行业平台上的所有用户的行为数据,具体包括:
在工程机械行业平台各处增加埋点;
利用所述埋点收集在工程机械行业平台上的所有用户的行为数据;所述行为数据包括:时间、地点、用户ID、操作类型、内容以及停留时长;
在数据库中创建目标用户行为数据日志表;
将所述行为数据保存至所述行为数据日志表中。
3.根据权利要求1所述的面向工程机械行业的内容推荐方法,其特征在于,所述通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数,具体包括:
通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个用户对每个高频关键词的点击转化系数和访问深度系数;
根据每个用户对每个高频关键词的点击转化系数和访问深度系数,计算每个高频关键词的平均点击转化系数和平均访问深度系数。
4.根据权利要求1所述的面向工程机械行业的内容推荐方法,其特征在于,所述在所述相似度大于预设阈值的其他用户的喜好集合中,寻找所述目标用户的喜好,并将所述喜好推荐给所述目标用户,具体包括:
利用喜好计算公式计算目标用户对所述相似度大于预设阈值的其他用户的每个喜好的评分Pu,i,当评分Pu,i大于预设阈值时,将所述喜好推荐给目标用户;
所述喜好计算公式为:
Figure DEST_PATH_IMAGE006
P u,i 表示目标用户u对所述相似度大于预设阈值的其他用户的喜好i的评分;
Figure 913708DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;su,u’)表示用户uu’的相似度;r u’,i 表示用户u’对喜好i的评分;
Figure DEST_PATH_IMAGE007
表示用户u’对其所有喜好的平均评分。
5.一种面向工程机械行业的内容推荐系统,其特征在于,所述系统包括:
新老用户判断模块,用于判断工程机械行业平台上是否已经存在目标用户的行为数据;若存在,则判定所述目标用户为老用户,若不存在,则判定所述目标用户为新用户;
新用户推荐模块,用于向所述新用户随机推荐工程机械行业热点和时事新闻;
数据收集模块,用于收集在工程机械行业平台上的所有用户的行为数据;
目标用户转化系数和访问深度系数计算模块,用于通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数;
平均点击转化系数和平均访问深度系数计算模块,用于通过收集得到的所有用户在工程机械行业平台上的行为数据,计算每个高频关键词的平均点击转化系数和平均访问深度系数;
喜好集合获取模块,用于将所述目标用户高频关键词集合中点击转化系数小于所述平均点击转化系数或者访问深度系数小于所述平均访问深度系数的高频关键词删除,得到目标用户喜好集合;
相似用户计算模块,用于利用皮尔逊相关系数公式在工程机械行业用户群体中找到与所述目标用户喜好相似度大于预设阈值的其他用户;
推荐模块,用于在所述相似度大于预设阈值的其他用户的喜好集合中,寻找所述目标用户的喜好,并将所述喜好推荐给所述目标用户;
所述通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合,并计算所述目标用户对每个高频关键词的点击转化系数和访问深度系数,具体包括:
通过收集得到的目标用户在工程机械行业平台上的行为数据,得出目标用户高频关键词集合;
利用点击转化系数计算公式计算所述目标用户对每个高频关键词的点击转化系数;所述点击转化系数计算公式为:C=CN/EN,其中,C表示点击转化系数,CN表示点击次数,EN表示曝光次数;
利用访问深度系数计算公式计算所述目标用户对每个高频关键词的访问深度系数;所述访问深度系数计算公式为:V=VT/VN,其中,V表示访问深度系数,VT表示访问总时长,VN表示访问次数;
所述皮尔逊相关系数公式为:
Figure DEST_PATH_IMAGE008
其中,s(u,v)表示用户之间的相似度,i表示用户的喜好;I u 表示用户u对其所有喜好的评分集合;I v 表示用户v对其所有喜好的评分集合;r u,i 表示用户u对喜好i的评分;r v,i 表示用户v对喜好i的评分;
Figure 446189DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;
Figure 924444DEST_PATH_IMAGE003
表示用户v对其所有喜好的平均评分;
用户对喜好的评分的计算公式为:
Figure DEST_PATH_IMAGE005A
其中,ru,i表示用户u对喜好i的评分;ECu,i表示用户u对喜好i的有效点击数,有效点击数即用户u对喜好i的总点击次数减用户u对喜好i的总点击次数中访问时长小于平均访问时长的点击次数;TCu表示用户u对其所有喜好的有效点击数的总和;N表示用户u所有喜好的数量。
6.根据权利要求5所述的面向工程机械行业的内容推荐系统,其特征在于,所述在所述相似度大于预设阈值的其他用户的喜好集合中,寻找所述目标用户的喜好,并将所述喜好推荐给所述目标用户,具体包括:
利用喜好计算公式计算目标用户对所述相似度大于预设阈值的其他用户的每个喜好的评分Pu,i,当评分Pu,i大于预设阈值时,将所述喜好推荐给目标用户;
所述喜好计算公式为:
Figure 644007DEST_PATH_IMAGE006
P u,i 表示目标用户u对所述相似度大于预设阈值的其他用户的喜好i的评分;
Figure 498700DEST_PATH_IMAGE002
表示用户u对其所有喜好的平均评分;su,u’)表示用户uu’的相似度;r u’,i 表示用户u’对喜好i的评分;
Figure 964316DEST_PATH_IMAGE007
表示用户u’对其所有喜好的平均评分。
CN202210023866.9A 2022-01-11 2022-01-11 一种面向工程机械行业的内容推荐方法及系统 Active CN114048389B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210023866.9A CN114048389B (zh) 2022-01-11 2022-01-11 一种面向工程机械行业的内容推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210023866.9A CN114048389B (zh) 2022-01-11 2022-01-11 一种面向工程机械行业的内容推荐方法及系统

Publications (2)

Publication Number Publication Date
CN114048389A CN114048389A (zh) 2022-02-15
CN114048389B true CN114048389B (zh) 2022-04-19

Family

ID=80213546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210023866.9A Active CN114048389B (zh) 2022-01-11 2022-01-11 一种面向工程机械行业的内容推荐方法及系统

Country Status (1)

Country Link
CN (1) CN114048389B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116805023B (zh) * 2023-08-25 2023-11-03 量子数科科技有限公司 一种基于大语言模型的外卖推荐方法
CN117011019B (zh) * 2023-09-28 2023-12-22 无锡锡商银行股份有限公司 一种基于大数据的银行架构自适应分析管理系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699603A (zh) * 2013-12-12 2014-04-02 亿赞普(北京)科技有限公司 一种基于用户行为的信息推荐方法和系统
CN103870454A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
KR101677749B1 (ko) * 2015-05-28 2016-11-21 네이버 주식회사 개인 선호 성향을 고려한 추천 서비스 방법 및 이를 위한 추천 서비스 서버
CN110399563A (zh) * 2019-08-05 2019-11-01 中国人民解放军军事科学院评估论证研究中心 一种基于用户行为分析的偏好模型及个性化信息主动推荐方法
CN111949822A (zh) * 2020-08-20 2020-11-17 山东大学 一种基于云计算和移动终端的智能教育视频服务系统及其运行方法
CN112667899A (zh) * 2020-12-30 2021-04-16 杭州智聪网络科技有限公司 基于用户兴趣迁移的冷启动推荐方法、装置及存储设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10491694B2 (en) * 2013-03-15 2019-11-26 Oath Inc. Method and system for measuring user engagement using click/skip in content stream using a probability model
CN110852852A (zh) * 2019-11-15 2020-02-28 成都航天科工大数据研究院有限公司 一种工业互联网产品推荐系统及方法
WO2021120227A1 (zh) * 2019-12-20 2021-06-24 深圳前海微众银行股份有限公司 一种信息推荐方法及装置
CN111506831A (zh) * 2020-04-13 2020-08-07 蔡梓超 一种协同过滤的推荐模块、方法、电子设备及存储介质
CN111582992B (zh) * 2020-05-13 2022-12-06 东华大学 一种改进了协同过滤推荐算法的推荐系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870454A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN103699603A (zh) * 2013-12-12 2014-04-02 亿赞普(北京)科技有限公司 一种基于用户行为的信息推荐方法和系统
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
KR101677749B1 (ko) * 2015-05-28 2016-11-21 네이버 주식회사 개인 선호 성향을 고려한 추천 서비스 방법 및 이를 위한 추천 서비스 서버
CN110399563A (zh) * 2019-08-05 2019-11-01 中国人民解放军军事科学院评估论证研究中心 一种基于用户行为分析的偏好模型及个性化信息主动推荐方法
CN111949822A (zh) * 2020-08-20 2020-11-17 山东大学 一种基于云计算和移动终端的智能教育视频服务系统及其运行方法
CN112667899A (zh) * 2020-12-30 2021-04-16 杭州智聪网络科技有限公司 基于用户兴趣迁移的冷启动推荐方法、装置及存储设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于用户浏览行为的个性化推荐研究综述》;刘华真 等;《计算机应用研究》;20210831;2268-2277页 *
Learning to Recommended With Multiple Cascading Behavior;Chen Gao 等;《IEEE》;20191210;第2588-2601页 *

Also Published As

Publication number Publication date
CN114048389A (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
Xue et al. Optimizing web search using web click-through data
US10572565B2 (en) User behavior models based on source domain
CN114048389B (zh) 一种面向工程机械行业的内容推荐方法及系统
CN106156127B (zh) 选择数据内容向终端推送的方法及装置
US8312035B2 (en) Search engine enhancement using mined implicit links
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
KR101252670B1 (ko) 연관 콘텐츠 제공 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
CN110704674A (zh) 一种视频播放完整度预测方法及装置
CN101641697A (zh) 对网页的相关搜索查询及其应用
TW201044298A (en) Hot video prediction system based on user interests social network
Lubis et al. A framework of utilizing big data of social media to find out the habits of users using keyword
Kao et al. Entropy-based link analysis for mining web informative structures
CN110196941B (zh) 一种资讯推荐方法、装置、服务器与存储介质
Singh et al. A comparative study of page ranking algorithms for information retrieval
Lee et al. An automatic topic ranking approach for event detection on microblogging messages
CN111931022A (zh) Ai热点内容智能编辑系统
CN107133274B (zh) 一种基于图知识库的分布式信息检索集合选择方法
Zaïane et al. Mining research communities in bibliographical data
Fan et al. Tuning before feedback: combining ranking discovery and blind feedback for robust retrieval
Mirhasani et al. Alleviation of cold start in movie recommendation systems using sentiment analysis of multi-modal social networks
Chaa et al. New technique to deal with verbose queries in social book search
Asim et al. Content based call for papers recommendation to researchers
Feng et al. Bibliometrics-based review of the media convergence research trend in China: 2008–2018
CN113535956A (zh) 一种基于媒介贡献度的新闻热点预测方法
CN117715049B (zh) 一种针对手机浏览器的反作弊系统以及反作弊方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant