CN113779421A - 关联推荐方法、装置、设备及计算机可读存储介质 - Google Patents
关联推荐方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113779421A CN113779421A CN202110934474.3A CN202110934474A CN113779421A CN 113779421 A CN113779421 A CN 113779421A CN 202110934474 A CN202110934474 A CN 202110934474A CN 113779421 A CN113779421 A CN 113779421A
- Authority
- CN
- China
- Prior art keywords
- recommendation
- recommended
- target
- book
- books
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012163 sequencing technique Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 30
- 238000005259 measurement Methods 0.000 claims description 12
- 230000006399 behavior Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012550 audit Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种关联推荐方法、装置、设备及计算机可读存储介质,关联推荐方法包括:确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序;计算各所述待推荐图书与所述目标图书之间的相似值,根据各所述相似值确定第二推荐顺序;对所述第一推荐顺序和所述第二推荐顺序进行交替排序,得到第三推荐顺序;根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,得到目标推荐顺序,以在推荐所述目标图书时根据所述目标推荐顺序对所述待推荐图书进行关联推荐。本发明提高了图书推荐的准确性。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种关联推荐方法、装置、设备及计算机可读存储介质。
背景技术
数字图书馆中拥有海量的数字图书资源,如何让读者对这些丰富而宝贵的数字图书资源进行利用并能有更好的使用体验就显得非常的重要。传统的基于检索的信息获取技术已经不能完全满足人们的需求,个性化推荐(如关联推荐)正逐渐成为数字图书馆不可或缺的部分。而目前并没有具体关于图书的关联推荐的相关应用描述,无法针对图书进行关联推荐。因此,如何实现图书的关联推荐,提高图书推荐的准确性成为了目前急需解决的技术问题。
发明内容
本发明的主要目的在于提供一种关联推荐方法、装置、设备及计算机可读存储介质,旨在解决如何提高图书推荐的准确性的技术问题。
为实现上述目的,本发明提供一种关联推荐方法,包括以下步骤:
确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序;
计算各所述待推荐图书与所述目标图书之间的相似值,根据各所述相似值确定第二推荐顺序;
对所述第一推荐顺序和所述第二推荐顺序进行交替排序,得到第三推荐顺序;
根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,得到目标推荐顺序,以在推荐所述目标图书时根据所述目标推荐顺序对所述待推荐图书进行关联推荐。
可选地,根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,包括:
获取各所述待推荐图书的曝光点击率,并确定获取到的曝光点击率的数值降序排列顺序,根据所述数值降序排序顺序对所述第三推荐顺序进行顺序调整。
可选地,计算各所述待推荐图书与所述目标图书之间的相似值,包括:
确定各所述待推荐图书对应的所有第一标签,并将各所述第一标签依次与所述目标图书对应的所有目标标签进行标签匹配;
若根据所述标签匹配的匹配结果确定存在标签类型相同的第一标签和目标标签,则确定所述标签类型相同的第一标签对应的第一标签权重,并确定所述标签类型相同的目标标签对应的匹配目标标签权重;
将所述第一标签权重和所述匹配目标标签权重输入至预设相似值计算公式进行计算,将计算结果作为所述待推荐图书与所述目标图书之间的相似值。
可选地,根据各所述相似值确定第二推荐顺序,包括:
根据各所述相似值的数值大小进行排序,并检测各所述相似值中是否存在数值相同的相似值;
若各所述相似值中存在数值相同的相似值,则确定所述数值相同的相似值对应的待推荐图书中付费阅读数,并根据各所述付费阅读数对所述数值相同的相似值对应的所有待推荐图书进行排序,以得到第二推荐顺序。
可选地,所述置信度包括前置信度和后置信度;
确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序的步骤,包括:
根据预设的第一置信度确定公式计算所述待推荐图书和所述目标图书之间的前置信度,并根据预设的第二置信度确定公式计算所述待推荐图书和所述目标图书之间的后置信度;
将所述前置信度和所述后置信度的比例值作为不平衡因子,将所述前置信度和所述后置信度的平均值作为度量参数,并根据所述不平衡因子和所述度量参数确定所述遍历的待推荐图书的推荐等级;
根据各所述待推荐图书对应的推荐等级确定第一推荐顺序。
可选地,根据预设的第一置信度确定公式计算所述待推荐图书和所述目标图书之间的前置信度,并根据预设的第二置信度确定公式计算所述待推荐图书和所述目标图书之间的后置信度,包括:
确定所述待推荐图书的第一阅读用户数量,并确定所述目标图书的第二阅读用户数量,统计所述第一阅读用户数量和所述第二阅读用户数量之间的相同阅读用户数量;
将所述相同阅读用户数量和所述第一阅读用户数量输入至预设的第二置信度确定公式进行计算,得到第一比例值,并将所述第一比例值作为所述待推荐图书和所述目标图书之间的后置信度;
将所述相同阅读用户数量和所述第二阅读用户数量输入至预设的第一置信度确定公式进行计算,得到第二比例值,将所述第二比例值作为所述待推荐图书和所述目标图书之间的前置信度。
可选地,根据各所述待推荐图书对应的推荐等级确定第一推荐顺序的步骤,包括:
检测各所述推荐等级中是否存在大于预设等级的目标推荐等级;
若存在,则将所述目标推荐等级对应的待推荐图书作为待推荐目标图书,若所述待推荐目标图书存在多本,则根据各所述待推荐目标图书的前置信度对各所述待推荐目标图书进行排序,得到第一推荐顺序。
此外,为实现上述目的,本发明还提供一种关联推荐装置,包括:
确定模块,用于确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序;
计算模块,用于计算各所述待推荐图书与所述目标图书之间的相似值,根据各所述相似值确定第二推荐顺序;
排序模块,用于对所述第一推荐顺序和所述第二推荐顺序进行交替排序,得到第三推荐顺序;
调整模块,用于根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,得到目标推荐顺序,以在推荐所述目标图书时根据所述目标推荐顺序对所述待推荐图书进行关联推荐。
此外,为实现上述目的,本发明还提供一种关联推荐设备,关联推荐设备包括存储器、处理器及存储在存储器上并可在处理器上运行的关联推荐程序,关联推荐程序被处理器执行时实现如上述的关联推荐方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有关联推荐程序,关联推荐程序被处理器执行时实现如上述的关联推荐方法的步骤。
本发明通过根据所有待推荐图书和目标图书之间的置信度确定第一推荐顺序,并根据各个待推荐图书和目标图书之间的相似值确定第二推荐顺序,将第一推荐顺序和第二推荐顺序进行交替排序,得到第三推荐顺序,再根据各个待推荐图书的曝光点击率对第三推荐顺序进行调整,得到目标推荐顺序,以在推荐目标图书时根据目标推荐顺序对待推荐图书进行关联推荐,从而避免了现有技术中无法进行关联推荐,导致推荐的准确性较低的现象发生,提高了图书推荐的准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端\装置结构示意图;
图2为本发明关联推荐方法第一实施例的流程示意图;
图3为本发明关联推荐装置的装置单元示意图;
图4为本发明关联推荐方法中的流程示意图。
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端为关联推荐设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在终端设备移动到耳边时,关闭显示屏和/或背光。当然,终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及关联推荐程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的关联推荐程序,并执行以下操作:
参照图2,本发明提供一种关联推荐方法,在关联推荐方法的第一实施例中,关联推荐方法包括以下步骤:
步骤S10,确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序;
由于目前进行图书推荐时,无法进行关联推荐,其推荐的准确性较低。因此在本实施例中,是通过采用多级别下的关联规则进行基于内容标签的图书推荐,并根据推荐结果的曝光表现进行调优实现了高效精准的图书推荐。而且在本实施例中,通过计算核心标签表中图书的相互推荐得分,能够避免传统方法中采用与余弦相似度或其他算法受普通标签影响而造成相似度计算不合理的情况,更好地进行关联图书的推荐。
因此,在本实施例中,需要先获取一定数量的用户的历史阅读行为数据(将每天异常用户号码与客户端异常用户号码去重,在当天的浏览/阅读/订购相关数据中剔除异常用户的所有阅读行为,剩下的即为稽核后当天正常的用户阅读行为,即历史阅读行为数据),并根据历史阅读行为数据确定所有历史图书中的待推荐图书,计算所有待推荐图书和目标图书之间的置信度,如前置信度和后置信度。其中,每一本待推荐图书和目标图书之间都存在有前置信度和后置信度。如根据用户的历史阅读行为数据确定待推荐图书B与目标图书A之间的前置信度和后置信度,并根据前置信度和后置信度计算得到的不平衡比和度量参数KULC指标确定待推荐图书B的推荐等级。因此在本实施例中,会根据所有待推荐图书对应的前置信度和后置信度确定各个待推荐图书中的待推荐图书,并根据待推荐图书的推荐等级进行降序排序,当处于同一推荐等级的待推荐图书存在多本时,根据处于同一推荐等级的待推荐图书的前置信度的大小进行降序排序,以得到第一推荐顺序。
步骤S20,计算各所述待推荐图书与所述目标图书之间的相似值,根据各所述相似值确定第二推荐顺序;
在本实施例中,会提前为所有的待推荐图书设置标签,并设置标签所对应的权重,再根据待推荐图书B与目标图书A的相同标签,以及相同标签分别在待推荐图书B与目标图书A的权重来计算待推荐图书B与目标图书A之间的相似值。并且会计算所有待推荐图书与目标图书之间的相似值。
并且,在本实施例中,可以先将所有待推荐图书划分为男生图书和女生图书,并且对男生图书会预设核心标签(其中,核心标签可以为用户编辑手动标注的标签),核心标签包括主标签和次标签,主标签能对图书的主要内容进行高度概括。次标签能对图书的内容进行辅助性描述。对每一本男生图书会采用主标签和次标签共同进行描述。其中,核心标签可以是人工提前标注,核心标签的主要字段为图书ID/分类/标签/权重。并且可以根据用户的需求自行设置主标签的权重和次标签的权重,如设置主标签的权重为0.5,次标签的权重为0.2。并且核心标签可以通过编辑对内容的深入了解,提炼出精确描述图书题材、内容的标签词。
女生图书会预设平行标签,平行标签的特点是这些标签的描述能力相同,用于从不同角度对图书内容进行描述。并且计算平行标签的权重时,是平分权重,即每个平行标签的权重都相同。
在计算每一本待推荐图书与目标图书之间的相似值时,都会根据其标签的权重进行计算,以得到该待推荐图书与目标图书之间的相似值。例如,若两本不同书名的图书具有相同的标签,则将两者对应的权重相乘,将这两本书之前所有符合的标签进行同等操作后进行加和,就得到两本书之间的核心标签相似分,即相似值。例如,如图4所示,若书A存标签1、标签3和标签5,且标签1在书A中的权重为Wa1,标签3在书A中的权重为Wa3,标签5在书A中的权重为Wa5。书B存在标签1、标签2、标签4和标签5,且标签1在书B中的权重为Wb1,标签2在书B中的权重为Wb2,标签4在书B中的权重为Wb4,标签5在书B中的权重为Wb5。则书A和书B之间的相似值Score=Wa1*Wb1+Wa5*Wb5。
并且在本实施例中,选择的待推荐图书也存在一定的限制,即选择的待推荐图书为非免费图书;属于可推荐的图书;不可出现多本同一系列作品图书。
需要说明的是,在相似值相同的情况下,会按照阅读付费用户数降序排列选取,而在排序时会先按照相似值的数值大小进行排序,再按照阅读付费阅读章节进行降序,将得到的排序结果作为第二推荐顺序。
步骤S30,对所述第一推荐顺序和所述第二推荐顺序进行交替排序,得到第三推荐顺序;
在获取到第一推荐顺序和第二推荐顺序后,会进行交替排序,并将交替排序的结果作为第三推荐顺序。即优先核心标签推荐结果与关联规则结果,交替排序,向前过滤,其中核心标签推荐结果按照相似分降序排列,关联规则结果按照第一步中推荐等级1的优先于推荐等级2的次序进行推荐,同一推荐等级内图书按照前置信度降序排列;若上述推荐结果不足预设数量如50本,则接续使用标签推荐,向前过滤(按照得分降序排列),若仍不足50本,则优先细分类下图书推荐,推荐顺序按照以下顺序补足,即编辑推荐等级降序排列;统计量(各项推荐有自己的统计量排序)降序排列。直至推荐选足50本,并将其对应的推荐顺序作为第三推荐顺序。
步骤S40,根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,得到目标推荐顺序,以在推荐所述目标图书时根据所述目标推荐顺序对所述待推荐图书进行关联推荐。
再根据各个待推荐图书的曝光点击率对第三推荐顺序进行调整,得到目标推荐顺序,并按照目标推荐顺序进行目标图书的关联推荐。即将目标推荐顺序对应的图书进行推荐。其中,对第三推荐顺序进行调整时,可以以以单本源图书为例,离线推荐结果记为A0,置顶图书记为Q,置后图书记为H。
将置顶图书Q,与离线结果A0,间隔去重排列,如q1,a01,q2,a02……,从而得到A1;A1结果去掉置后图书H为A2;若A2>=50,则输出50本推荐结果;若A2<50,则用H补足,补充顺序为曝光点击率降序排列。
在本实施例中,通过根据所有待推荐图书和目标图书之间的置信度确定第一推荐顺序,并根据各个待推荐图书和目标图书之间的相似值确定第二推荐顺序,将第一推荐顺序和第二推荐顺序进行交替排序,得到第三推荐顺序,再根据各个待推荐图书的曝光点击率对第三推荐顺序进行调整,得到目标推荐顺序,以在推荐目标图书时根据目标推荐顺序对待推荐图书进行关联推荐,从而避免了现有技术中无法进行关联推荐,导致推荐的准确性较低的现象发生,提高了图书推荐的准确性。
进一步地,基于上述本发明的第一实施例,提出本发明关联推荐方法的第二实施例,在本实施例中,上述实施例步骤S40,根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整的细化,包括:
步骤a,获取各所述待推荐图书的曝光点击率,并确定获取到的曝光点击率的数值降序排列顺序,根据所述数值降序排序顺序对所述第三推荐顺序进行顺序调整。
在本实施例中,还需要获取所有待推荐图书的曝光点击率,并对获取到的所有曝光点击率的数值进行降序排序,得到数值降序排列顺序,再根据数值降序排列顺序对第三推荐顺序进行顺序调整,并将调整后的第三推荐顺序作为目标推荐顺序。
此外在另一场景中,还可以是在得到第三推荐顺序后,需要确定第三推荐顺序对应的所有待推荐图书的数量,并将其作为推荐图书数量,检测推荐图书数量是否大于或等于预设数量,根据不同的检测结果执行不同的操作。其中,预设数量可以为用户提前设置的任意推荐图书的数量,如50本。当经过判断发现推荐图书数量小于预设数量时,可以获取各个待推荐图书的曝光点击率,并根据曝光点击率的大小进行降序排序,再根据降序排序结果对推荐图书数量进行补充调整,直至调整后的推荐图书数量大于或等于预设数量,并将调整后的推荐图书数量对应的待推荐图书的排列顺序作为目标推荐顺序。
在本实施例中,通过根据各个待推荐图书的曝光点击率的数值降序排序顺序对第三推荐顺序进行顺序调整,再进行关联推荐,从而保障了关联推荐的有效性。
进一步地,计算各所述待推荐图书与所述目标图书之间的相似值,包括:
步骤c,确定各所述待推荐图书对应的所有第一标签,并将各所述第一标签依次与所述目标图书对应的所有目标标签进行标签匹配;
步骤d,若根据所述标签匹配的匹配结果确定存在标签类型相同的第一标签和目标标签,则确定所述标签类型相同的第一标签对应的第一标签权重,并确定所述标签类型相同的目标标签对应的匹配目标标签权重;
步骤e,将所述第一标签权重和所述匹配目标标签权重输入至预设相似值计算公式进行计算,将计算结果作为所述待推荐图书与所述目标图书之间的相似值。
在本实施例中,会提前为所有的待推荐图书设置标签,及其对应的权重。因此会获取各个待推荐图书的标签,即第一标签,并获取目标图书的标签,即目标标签。
并且在遍历各个待推荐图书,获取到遍历的待推荐图书的所有第一标签后,还会遍历各个第一标签,并确定遍历的第一标签是否和目标图书中的各个目标标签相同,若各个目标标签中存在和遍历的第一标签相同的目标标签,则将其作为匹配目标标签。并确定遍历的第一标签在遍历的待推荐图书中的的权重,即第一标签权重。确定匹配目标标签在目标图书中的权重,即匹配目标标签权重。
在将获取到所有的第一标签权重和匹配目标标签权重输入至提前设置的相似值计算公式(如第一实施例中的Score=Wa1*Wb1+Wa5*Wb5)中进行计算,并将计算结果作为遍历的待推荐图书与目标图书之间的相似值。若各个目标标签中不存在和遍历的第一标签相同的目标标签。则继续遍历下一个待推荐图书。
在本实施例中,通过将各个待推荐图书的第一标签和目标图书的目标标签进行标签匹配,并在确定标签类型相同的第一标签和目标标签时,计算遍历的待推荐图书与目标图书之间的相似值,从而保障了获取到的相似值的准确性。
进一步地,根据各所述相似值确定第二推荐顺序,包括:
步骤f,根据各所述相似值的数值大小进行排序,并检测各所述相似值中是否存在数值相同的相似值;
在本实施例中,当计算到所有的相似值后,可以获取各个相似值的数值,并根据各个相似值的数值大小进行排序,并在排序的过程中检测各个相似值中是否存在数值相同的相似值,若存在,则将数值相同的相似值作为相同相似值。
步骤g,若各所述相似值中存在数值相同的相似值,则确定所述数值相同的相似值对应的待推荐图书中付费阅读数,并根据各所述付费阅读数对所述数值相同的相似值对应的所有待推荐图书进行排序,以得到第二推荐顺序。
若存在相同相似值,则需要在各个待推荐图书中确定相同相似值对应的所有待推荐图书,并确定相同相似值对应的所有待推荐图书中的付费阅读数,即阅读付费用户数。再按照各个付费阅读数对相同相似值对应的所有待推荐图书进行排序,并将此次排序结果和根据相似值的数值大小进行排序的结果进行汇总,并将汇总后的排序作为第二推荐顺序。
在本实施例中,通过根据各个相似值的数值大小进行排序,并对数值相同的相似值对应的待推荐图书按照付费阅读数进行排序,以得到第二推荐顺序,从而保障了获取到的第二推荐顺序的准确性。
进一步地,确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序的步骤,包括:
步骤h,根据预设的第一置信度确定公式计算所述待推荐图书和所述目标图书之间的前置信度,并根据预设的第二置信度确定公式计算所述待推荐图书和所述目标图书之间的后置信度;
在本实施例中,置信度包括前置信度和后置信度。会遍历所有待推荐图书,并计算遍历的待推荐图书和目标图书之间的置信度,即计算遍历的待推荐图书和目标图书之间的前置信度和后置信度。即若遍历的待推荐图书为B,目标图书为A。则前置信度可以根据第一置信度公式进行计算得到,即confidence(A->B)=P(B|A)=P(AB)/P(A)=AB共同用户数/A用户数。后置信度可以根据第二置信度确定公式进行计算得到,即confidence(B->A)=P(A|B)=P(AB)/P(B)=AB共同用户数/B用户数。
步骤k,将所述前置信度和所述后置信度的比例值作为不平衡因子,将所述前置信度和所述后置信度的平均值作为度量参数,并根据所述不平衡因子和所述度量参数确定所述遍历的待推荐图书的推荐等级;
步骤m,根据各所述待推荐图书对应的推荐等级确定第一推荐顺序。
计算前置信度和后置信度的比例值,并将其作为不平衡因子,即不平衡因子IR=P(B|A)/P(A|B)。计算前置信度和后置信度的平均值,并将其作为度量参数,即度量参数包括KULC指标。KULC=0.5*P(A|B)+0.5*P(B|A),
并且由于传统的支持度和置信度会被过流行造成的关联推荐的偏差所影响,无论图书A是否为热门图书,只要B图书是热门图书,则根据支持度和置信度都会使得B集合中的热门图书被推荐,KULC系数对两个置信度做平均处理,采用Kulc结合不平衡因子IR的评价方法。能够避免过流行造成的关联推荐的偏差。根据KULC、IR的阈值(暂定KULC>0.05,IR>0.7),满足阈值的图书类型为1;满足阈值KULC>0.02,IR>0.5的图书类型为2,其余图书记为0(即不推荐)。此处设定的图书类型1和图书类型2在后续(第四步)进行推荐时,作为推荐的优先级别予以考虑,图书类型0的则后续不进行推荐。
也就是在本实施例中,根据由前置信度及后置信度计算得到的不平衡比和KULC指标确定所述待推荐图书的推荐等级,在同一推荐等级内图书按照前置信度降序排列,以得到第一推荐顺序。
在本实施例中,通过计算前置信度和后置信度,并根据前置信度和后置信度计算不平衡因子和度量参数,以确定遍历的待推荐图书的推荐等级,再根据各个待推荐图书的推荐等级确定第一推荐顺序,从而保障了获取到的第一推荐顺序的准确性。
具体地,根据预设的第一置信度确定公式计算所述待推荐图书和所述目标图书之间的前置信度,并根据预设的第二置信度确定公式计算所述待推荐图书和所述目标图书之间的后置信度,包括:
步骤n,确定所述待推荐图书的第一阅读用户数量,并确定所述目标图书的第二阅读用户数量,统计所述第一阅读用户数量和所述第二阅读用户数量之间的相同阅读用户数量;
在本实施例中,需要在历史阅读行为数据中确定有阅读过遍历的待推荐图书的用户数量,并将其作为第一用户阅读数量。并且在历史阅读行为数据中确定有阅读过目标图书的用户数量,并将其作为第二阅读用户数量。再统计第一阅读用户数量和第二阅读用户数量之间的相同阅读用户数量。其中,相同阅读用户数量对应的用户即阅读过遍历的待推荐图书,也阅读过目标图书。
步骤x,将所述相同阅读用户数量和所述第一阅读用户数量输入至预设的第二置信度确定公式进行计算,得到第一比例值,并将所述第一比例值作为所述待推荐图书和所述目标图书之间的后置信度;
根据预设的第二置信度确定公式,计算相同阅读用户数量和第一用户阅读数量的比例值,将其作为遍历的待推荐图书和目标图书之间的后置信度。
其计算公式如上述所述。
步骤y,将所述相同阅读用户数量和所述第二阅读用户数量输入至预设的第一置信度确定公式进行计算,得到第二比例值,将所述第二比例值作为所述待推荐图书和所述目标图书之间的前置信度。
根据预设的第一置信度确定公式,计算相同阅读用户数量和第二阅读用户数量的比例值,将其作为遍历的待推荐图书和目标图书之间的前置信度。其计算公式如上述所述。
在本实施例中,通过将相同阅读用户数量和第一阅读用户数量之间的比例值作为后置信度,并将相同阅读用户数量和目标图书的第二阅读用户数量之间的比例值作为前置信度,从而保障了获取到的前置信度和后置信度的准确性。
具体地,根据各所述待推荐图书对应的推荐等级确定第一推荐顺序,包括:
步骤q,检测各所述推荐等级中是否存在大于预设等级的目标推荐等级;
步骤w,若存在,则将所述目标推荐等级对应的待推荐图书作为待推荐目标图书,若所述待推荐目标图书存在多本,则根据各所述待推荐目标图书的前置信度对各所述待推荐目标图书进行排序,得到第一推荐顺序。
在本实施例中,当计算得到各个待推荐图书对应的推荐等级后,检测各个推荐等级中是否存在大于预设等级(用户提前设置的任意等级)的目标推荐等级,若存在,可以直接将目标推荐等级对应的待推荐图书作为待推荐目标图书。若待推荐目标图书存在多本,则检测各个待推荐目标图书对应的推荐等级是否处于同一推荐等级,若处于同一推荐等级,则根据各待推荐目标图书的前置信度对各所述待推荐目标图书进行排序,得到第一推荐顺序。
在本实施例中,通过在确定各个推荐等级中存在大于预设等级的目标推荐等级时,将目标推荐对应的待推荐图书作为待推荐目标图书,并根据其前置信度进行排序,以得到第一推荐顺序,从而保障了获取到的第一推荐顺序的准确性。
此外,参照图3,本发明实施例还提供一种关联推荐装置,包括:
确定模块A10,用于确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序;
计算模块A20,用于计算各所述待推荐图书与所述目标图书之间的相似值,根据各所述相似值确定第二推荐顺序;
排序模块A30,用于对所述第一推荐顺序和所述第二推荐顺序进行交替排序,得到第三推荐顺序;
调整模块A40,用于根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,得到目标推荐顺序,以在推荐所述目标图书时根据所述目标推荐顺序对所述待推荐图书进行关联推荐。
可选地,调整模块A40,用于:
获取各所述待推荐图书的曝光点击率,并确定获取到的曝光点击率的数值降序排列顺序,根据所述数值降序排序顺序对所述第三推荐顺序进行顺序调整。
可选地,计算模块A20,用于:
确定各所述待推荐图书对应的所有第一标签,并将各所述第一标签依次与所述目标图书对应的所有目标标签进行标签匹配;
若根据所述标签匹配的匹配结果确定存在标签类型相同的第一标签和目标标签,则确定所述标签类型相同的第一标签对应的第一标签权重,并确定所述标签类型相同的目标标签对应的匹配目标标签权重;
将所述第一标签权重和所述匹配目标标签权重输入至预设相似值计算公式进行计算,将计算结果作为所述待推荐图书与所述目标图书之间的相似值。
可选地,计算模块A20,用于:
根据各所述相似值的数值大小进行排序,并检测各所述相似值中是否存在数值相同的相似值;
若各所述相似值中存在数值相同的相似值,则确定所述数值相同的相似值对应的待推荐图书中付费阅读数,并根据各所述付费阅读数对所述数值相同的相似值对应的所有待推荐图书进行排序,以得到第二推荐顺序。
可选地,所述置信度包括前置信度和后置信度;确定模块A10,用于:
根据预设的第一置信度确定公式计算所述待推荐图书和所述目标图书之间的前置信度,并根据预设的第二置信度确定公式计算所述待推荐图书和所述目标图书之间的后置信度;
将所述前置信度和所述后置信度的比例值作为不平衡因子,将所述前置信度和所述后置信度的平均值作为度量参数,并根据所述不平衡因子和所述度量参数确定所述遍历的待推荐图书的推荐等级;
根据各所述待推荐图书对应的推荐等级确定第一推荐顺序。
可选地,确定模块A10,用于:
确定所述待推荐图书的第一阅读用户数量,并确定所述目标图书的第二阅读用户数量,统计所述第一阅读用户数量和所述第二阅读用户数量之间的相同阅读用户数量;
将所述相同阅读用户数量和所述第一阅读用户数量输入至预设的第二置信度确定公式进行计算,得到第一比例值,并将所述第一比例值作为所述待推荐图书和所述目标图书之间的后置信度;
将所述相同阅读用户数量和所述第二阅读用户数量输入至预设的第一置信度确定公式进行计算,得到第二比例值,将所述第二比例值作为所述待推荐图书和所述目标图书之间的前置信度。
可选地,确定模块A10,用于:
检测各所述推荐等级中是否存在大于预设等级的目标推荐等级;
若存在,则将所述目标推荐等级对应的待推荐图书作为待推荐目标图书,若所述待推荐目标图书存在多本,则根据各所述待推荐目标图书的前置信度对各所述待推荐目标图书进行排序,得到第一推荐顺序。
其中,关联推荐装置的各个功能模块实现的步骤可参照本发明关联推荐方法的各个实施例,此处不再赘述。
此外,本发明还提供一种关联推荐设备,所述关联推荐设备包括:存储器、处理器及存储在所述存储器上的关联推荐程序;所述处理器用于执行所述关联推荐程序,以实现上述关联推荐方法各实施例的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述关联推荐方法各实施例的步骤。
本发明计算机可读存储介质具体实施方式与上述关联推荐方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种关联推荐方法,其特征在于,所述关联推荐方法包括:
确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序;
计算各所述待推荐图书与所述目标图书之间的相似值,根据各所述相似值确定第二推荐顺序;
对所述第一推荐顺序和所述第二推荐顺序进行交替排序,得到第三推荐顺序;
根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,得到目标推荐顺序,以在推荐所述目标图书时根据所述目标推荐顺序对所述待推荐图书进行关联推荐。
2.如权利要求1所述的关联推荐方法,其特征在于,所述根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,包括:
获取各所述待推荐图书的曝光点击率,并确定获取到的曝光点击率的数值降序排列顺序,根据所述数值降序排序顺序对所述第三推荐顺序进行顺序调整。
3.如权利要求1所述的关联推荐方法,其特征在于,所述计算各所述待推荐图书与所述目标图书之间的相似值,包括:
确定各所述待推荐图书对应的所有第一标签,并将各所述第一标签依次与所述目标图书对应的所有目标标签进行标签匹配;
若根据所述标签匹配的匹配结果确定存在标签类型相同的第一标签和目标标签,则确定所述标签类型相同的第一标签对应的第一标签权重,并确定所述标签类型相同的目标标签对应的匹配目标标签权重;
将所述第一标签权重和所述匹配目标标签权重输入至预设相似值计算公式进行计算,将计算结果作为所述待推荐图书与所述目标图书之间的相似值。
4.如权利要求1所述的关联推荐方法,其特征在于,所述根据各所述相似值确定第二推荐顺序,包括:
根据各所述相似值的数值大小进行排序,并检测各所述相似值中是否存在数值相同的相似值;
若各所述相似值中存在数值相同的相似值,则确定所述数值相同的相似值对应的待推荐图书中付费阅读数,并根据各所述付费阅读数对所述数值相同的相似值对应的所有待推荐图书进行排序,以得到第二推荐顺序。
5.如权利要求1-4任一项所述的关联推荐方法,其特征在于,所述置信度包括前置信度和后置信度;
所述确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序,包括:
根据预设的第一置信度确定公式计算所述待推荐图书和所述目标图书之间的前置信度,并根据预设的第二置信度确定公式计算所述待推荐图书和所述目标图书之间的后置信度;
将所述前置信度和所述后置信度的比例值作为不平衡因子,将所述前置信度和所述后置信度的平均值作为度量参数,并根据所述不平衡因子和所述度量参数确定所述遍历的待推荐图书的推荐等级;
根据各所述待推荐图书对应的推荐等级确定第一推荐顺序。
6.如权利要求5所述的关联推荐方法,其特征在于,所述根据预设的第一置信度确定公式计算所述待推荐图书和所述目标图书之间的前置信度,并根据预设的第二置信度确定公式计算所述待推荐图书和所述目标图书之间的后置信度,包括:
确定所述待推荐图书的第一阅读用户数量,并确定所述目标图书的第二阅读用户数量,统计所述第一阅读用户数量和所述第二阅读用户数量之间的相同阅读用户数量;
将所述相同阅读用户数量和所述第一阅读用户数量输入至预设的第二置信度确定公式进行计算,得到第一比例值,并将所述第一比例值作为所述待推荐图书和所述目标图书之间的后置信度;
将所述相同阅读用户数量和所述第二阅读用户数量输入至预设的第一置信度确定公式进行计算,得到第二比例值,将所述第二比例值作为所述待推荐图书和所述目标图书之间的前置信度。
7.如权利要求5所述的关联推荐方法,其特征在于,所述根据各所述待推荐图书对应的推荐等级确定第一推荐顺序,包括:
检测各所述推荐等级中是否存在大于预设等级的目标推荐等级;
若存在,则将所述目标推荐等级对应的待推荐图书作为待推荐目标图书,若所述待推荐目标图书存在多本,则根据各所述待推荐目标图书的前置信度对各所述待推荐目标图书进行排序,得到第一推荐顺序。
8.一种关联推荐装置,其特征在于,所述关联推荐装置包括:
确定模块,用于确定所有待推荐图书和目标图书之间的置信度,根据各所述置信度确定第一推荐顺序;
计算模块,用于计算各所述待推荐图书与所述目标图书之间的相似值,根据各所述相似值确定第二推荐顺序;
排序模块,用于对所述第一推荐顺序和所述第二推荐顺序进行交替排序,得到第三推荐顺序;
调整模块,用于根据各所述待推荐图书的曝光点击率对所述第三推荐顺序进行调整,得到目标推荐顺序,以在推荐所述目标图书时根据所述目标推荐顺序对所述待推荐图书进行关联推荐。
9.一种关联推荐设备,其特征在于,所述关联推荐设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的关联推荐程序,所述关联推荐程序被所述处理器执行时实现如权利要求1至7中任一项所述的关联推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有关联推荐程序,所述关联推荐程序被处理器执行时实现如权利要求1至7中任一项所述的关联推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110934474.3A CN113779421A (zh) | 2021-08-13 | 2021-08-13 | 关联推荐方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110934474.3A CN113779421A (zh) | 2021-08-13 | 2021-08-13 | 关联推荐方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113779421A true CN113779421A (zh) | 2021-12-10 |
Family
ID=78837810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110934474.3A Pending CN113779421A (zh) | 2021-08-13 | 2021-08-13 | 关联推荐方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113779421A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357294A (zh) * | 2021-12-30 | 2022-04-15 | 北京达佳互联信息技术有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
CN116340617A (zh) * | 2023-02-15 | 2023-06-27 | 荣耀终端有限公司 | 一种搜索推荐方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090163183A1 (en) * | 2007-10-04 | 2009-06-25 | O'donoghue Hugh | Recommendation generation systems, apparatus and methods |
CN108170691A (zh) * | 2016-12-07 | 2018-06-15 | 北京国双科技有限公司 | 关联文书的确定方法和装置 |
CN109062994A (zh) * | 2018-07-04 | 2018-12-21 | 平安科技(深圳)有限公司 | 推荐方法、装置、计算机设备和存储介质 |
CN110020176A (zh) * | 2017-12-29 | 2019-07-16 | 中国移动通信集团公司 | 一种资源推荐方法、电子设备以及计算机可读存储介质 |
CN110136008A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 利用大数据的产品数据推送方法、装置、设备和存储介质 |
CN111143699A (zh) * | 2020-01-03 | 2020-05-12 | 上海理工大学 | 基于相似性与置信度聚类的推荐系统 |
CN111339427A (zh) * | 2020-03-23 | 2020-06-26 | 卓尔智联(武汉)研究院有限公司 | 一种图书信息推荐方法、装置、系统及存储介质 |
-
2021
- 2021-08-13 CN CN202110934474.3A patent/CN113779421A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090163183A1 (en) * | 2007-10-04 | 2009-06-25 | O'donoghue Hugh | Recommendation generation systems, apparatus and methods |
CN108170691A (zh) * | 2016-12-07 | 2018-06-15 | 北京国双科技有限公司 | 关联文书的确定方法和装置 |
CN110020176A (zh) * | 2017-12-29 | 2019-07-16 | 中国移动通信集团公司 | 一种资源推荐方法、电子设备以及计算机可读存储介质 |
CN109062994A (zh) * | 2018-07-04 | 2018-12-21 | 平安科技(深圳)有限公司 | 推荐方法、装置、计算机设备和存储介质 |
CN110136008A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 利用大数据的产品数据推送方法、装置、设备和存储介质 |
CN111143699A (zh) * | 2020-01-03 | 2020-05-12 | 上海理工大学 | 基于相似性与置信度聚类的推荐系统 |
CN111339427A (zh) * | 2020-03-23 | 2020-06-26 | 卓尔智联(武汉)研究院有限公司 | 一种图书信息推荐方法、装置、系统及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357294A (zh) * | 2021-12-30 | 2022-04-15 | 北京达佳互联信息技术有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
CN114357294B (zh) * | 2021-12-30 | 2023-02-17 | 北京达佳互联信息技术有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
CN116340617A (zh) * | 2023-02-15 | 2023-06-27 | 荣耀终端有限公司 | 一种搜索推荐方法和装置 |
CN116340617B (zh) * | 2023-02-15 | 2023-12-12 | 荣耀终端有限公司 | 一种搜索推荐方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256568B (zh) | 一种植物种类识别方法以及装置 | |
JP6858990B2 (ja) | ウェブサイトにおける高精度検索方法 | |
CN109118336B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN109492180A (zh) | 资源推荐方法、装置、计算机设备及计算机可读存储介质 | |
US9088811B2 (en) | Information providing system, information providing method, information providing device, program, and information storage medium | |
CN109190043A (zh) | 推荐方法及装置,存储介质,电子设备及推荐系统 | |
CN109753601B (zh) | 推荐信息点击率确定方法、装置及电子设备 | |
US20110119148A1 (en) | Server apparatus, information processing apparatus, and information processing method | |
CN107153656B (zh) | 一种信息搜索方法和装置 | |
US20130110803A1 (en) | Search driven user interface for navigating content and usage analytics | |
US9218417B2 (en) | Ad-hoc queries integrating usage analytics with search results | |
CN111325609A (zh) | 一种商品推荐列表确定方法、装置、电子设备及存储介质 | |
CN106919611B (zh) | 产品信息推送方法和装置 | |
CN113779421A (zh) | 关联推荐方法、装置、设备及计算机可读存储介质 | |
CN106951527B (zh) | 一种歌曲推荐方法及装置 | |
CN106599047B (zh) | 一种信息的推送方法及装置 | |
CN113077317A (zh) | 基于用户数据的物品推荐方法、装置、设备及存储介质 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN110766486A (zh) | 确定物品类目的方法和装置 | |
US20170287041A1 (en) | Information processing apparatus, information processing method, and information processing program | |
CN111782953A (zh) | 推荐方法、装置、设备及存储介质 | |
CN114820123A (zh) | 团购商品推荐方法、装置、设备及存储介质 | |
CN113946566B (zh) | Web系统指纹库的构建方法、装置和电子设备 | |
US20190347182A1 (en) | Extensibility model for usage analytics used with a system | |
CN111488434B (zh) | 输入联想词的推荐方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211210 |
|
RJ01 | Rejection of invention patent application after publication |