CN110175291A - 基于相似度计算的手游推荐方法、存储介质、设备及系统 - Google Patents

基于相似度计算的手游推荐方法、存储介质、设备及系统 Download PDF

Info

Publication number
CN110175291A
CN110175291A CN201910442067.3A CN201910442067A CN110175291A CN 110175291 A CN110175291 A CN 110175291A CN 201910442067 A CN201910442067 A CN 201910442067A CN 110175291 A CN110175291 A CN 110175291A
Authority
CN
China
Prior art keywords
label
hand
tag set
game
live game
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910442067.3A
Other languages
English (en)
Other versions
CN110175291B (zh
Inventor
陈文娴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201910442067.3A priority Critical patent/CN110175291B/zh
Publication of CN110175291A publication Critical patent/CN110175291A/zh
Application granted granted Critical
Publication of CN110175291B publication Critical patent/CN110175291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于相似度计算的手游推荐方法、存储介质、设备及系统,涉及数据分析领域,该方法包括:对游戏直播间所直播游戏标记标签,以及各手游标记标签;基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;计算直播游戏标签集合和手游标签集合间的相似度,与当前直播游戏标签集合所对应的直播游戏进行对应;统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。本发明通过计算游戏直播间直播游戏标签和手游标签相似度的方式,分析直播观看用户的兴趣爱好,从而精准的实现对用户的手游推荐。

Description

基于相似度计算的手游推荐方法、存储介质、设备及系统
技术领域
本发明涉及数据分析领域,具体涉及一种基于相似度计算的手游推荐方法、存储介质、设备及系统。
背景技术
当前直播领域,直播与游戏联运一直是直播平台发展的重点业务,通过给直播用户推荐手游,待用户下载后直播平台获得相应分成,已成为直播平台的重要收入来源,因此直播页面上均会有一个专门的手游中心板块,用于为用户提供手游APP的下载。
目前直播平台对于直播观看用户的手游个性化推荐,主要是基于用户的历史下载行为,采用协同过滤算法挖掘用户的喜好,进而给用户推荐与用户喜好相近的手游,此种推荐方式存在的不足是,直播平台用户量大,存在很多新用户,此类用户登录直播平台仅是为了观看直播,并未进行过手游下载操作,由于此类用户不存在历史下载行为,因而很难挖掘出此类用户的喜好,故无法对此类用户准确的进行手游推荐。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于相似度计算的手游推荐方法、存储介质、设备及系统。
本发明第一方面提供一种基于相似度计算的手游推荐方法,包括以下步骤:
对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
结合第一方面,在第一种可能的实现方式中:
所述标签为描述游戏直播间所直播游戏的游戏内容相关的短语,或描述手游的游戏内容相关的短语;
所述直播游戏的标签至少为一个,每个直播游戏的所有标签构成该直播游戏的标签集合;
所述手游的标签至少为一个,每个手游的所有标签构成该手游的标签集合。
结合第一方面,在第二种可能的实现方式中,
所述直播游戏标签集合和手游标签集合均至少为一个;
所述基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度,具体步骤为:基于编辑距离,依次取出直播游戏标签集合中的单个标签,计算该标签与手游标签集合中每个标签间的编辑距离相似度。
结合第一方面,在第三种可能的实现方式中,所述基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度,所使用公式为:
其中,sim_ratioij表示直播游戏标签集合中第i个标签和手游标签集合中第j个标签间的编辑距离相似度,leni表示直播游戏标签集合中第i个标签的字符串长度,lenj表示手游标签集合中第j个标签的字符串长度,ldist表示类编辑距离,为直播游戏标签集合中第i个标签转化为手游标签集合中第j个标签所需的操作次数,删除和插入操作所对应的操作次数是1,替换操作所对应的操作次数是2。
结合第一方面的第三种可能实现方式,在第四种可能的实现方式中,所述根据计算得到的直播游戏标签集合中单个标签与手游标签集合中每个标签间的相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,所使用的公式为:
M=max(sim_ratioi1,sim_ratioi2,……,sim_ratioij)
其中,J(A,B)表示直播游戏标签集合和手游标签集合间的相似度,A-len表示直播游戏标签集合中的标签个数,B-len表示手游标签集合中的标签个数,threshold为设定相似度阈值。
结合第一方面,在第五种可能的实现方式中:每个直播游戏所对应的手游至少为一个,当直播游戏所对应的手游为多个时,按照该直播游戏标签集合与所对应手游标签集合间的相似度大小顺序,由大至小取设定个数的手游作为该直播游戏所属游戏直播间推荐给用户的手游。
结合第一方面,在第六种可能的实现方式中,所述统计用户在游戏直播间的观看时间,若观看时间大于设定时间,其中,当多个游戏直播间的直播游戏相同时,则统计用户在所有直播相同直播游戏的游戏直播间中的累计观看直播时间,作为观看时间。
本发明第二方面提供一种存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
本发明第三方面提供一种电子设备,所述电子设备包括:
标记单元,其用于对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
第一计算单元,其用于基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
第二计算单元,其用于根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
推荐单元,其用于统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
本发明第四方面提供一种基于相似度计算的手游推荐系统,包括:
标记模块,其用于对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
第一计算模块,其用于基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
第二计算模块,其用于根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
推荐模块,其用于统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
与现有技术相比,本发明的优点在于:首先基于编辑距离算法,计算直播游戏和手游间标签的编辑距离相似度,然后根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,根据用户的直播观看记录,通过计算游戏直播间直播游戏标签和手游标签相似度的方式,分析直播观看用户的兴趣爱好,从而精准的实现对用户的手游推荐。
附图说明
图1为本发明实施例中一种基于相似度计算的手游推荐方法的流程图;
图2为本发明实施例中一种电子设备的示意图。
具体实施方式
本发明实施例提供一种基于相似度计算的手游推荐方法,基于用户的直播观看记录,计算用户所在游戏直播间的直播游戏标签,和手游标签的相似度,精确的为用户提供手游推荐。本发明实施例还相应的提供了一种存储介质、设备个基于相似度计算的手游推荐系统。
参见图1所示,本发明实施例提供的一种基于相似度计算的手游推荐方法一实施例包括:
S1:对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合。
本发明实施例中,标签为描述游戏直播间所直播游戏的游戏内容相关的短语,或描述手游的游戏内容相关的短语。标签为高度概括直播游戏或手游游戏内容的词语,例如某手游为射击类手游,则其标签为“射击”、“多人对战”、“第一人称”、“联机”等,某手游为棋牌类游戏,则其标签为“棋牌”、“象棋”、“对战”等,假如某游戏直播间的直播游戏为经营类游戏,则其标签为“经营”、“模拟”等,游戏直播间的直播游戏为回合制游戏,则其标签为“策略”、“回合制”。对于直播游戏和手游的标签,可以通过爬虫等机器手段在提供游戏下载的第三方应用商店进行抓取,该类应用商店在提供的每一款游戏下载页面上,会在显眼处采用短语形式对游戏进行描述,或者采用明显区别于页面整体文字色彩的其它颜色文字短语对游戏进行描述,专门列于下载页面上的短语即为对游戏所标记的标签,通过此种抓取方式实现对直播游戏和手游打标签,提升效率。
本发明实施例中,直播游戏的标签至少为一个,每个直播游戏的所有标签构成该直播游戏的标签集合;手游的标签至少为一个,每个手游的所有标签构成该手游的标签集合。例如直播游戏A的标签为a和b,手游B的标签为c和d,则直播游戏A的标签集合包含a和b,手游B的标签集合包含c和d。
直播游戏标签集合和手游标签集合均至少为一个。由于直播平台上的游戏直播间为多个,每个游戏直播间所直播的直播游戏可能不尽相同,故直播游戏有多个,每个直播游戏对应一个标签集合。对应的,手游的种类也存在多个,每个手游对应一个标签集合。在后续的计算过程中,需要将单个直播游戏的标签集合与每个手游的标签集合进行相似度计算,得到直播间直播游戏与手游的相似度,从而分析出直播观看用户的兴趣爱好。
S2:基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度。该步骤具体为:基于编辑距离,依次取出直播游戏标签集合中的单个标签,计算该标签与手游标签集合中每个标签间的编辑距离相似度。
对于该步骤举例说明,假如存在直播游戏A和直播游戏B,手游C和手游D,直播游戏A的标签集合包括标签1和标签2,直播游戏B的标签集合包括标签3、标签4和标签5,手游C的标签集合包括标签6和标签7,手游D的标签集合包括标签8和标签9,则取出直播游戏A标签集合中的标签1,计算标签1和手游C标签集合中标签6的编辑距离相似度,计算标签1和手游C标签集合中标签7的编辑距离相似度,计算标签1和手游D标签集合中标签8的编辑距离相似度,计算标签1和手游D标签集合中标签9的编辑距离相似度,再取出直播游戏A标签集合中的标签2,以此类推,进行计算。
对于游戏直播和手游的标签而言,标签的内容文字可能存在区别,但两者的实际表达意思可能相似度极高,例如标签“回合制”和标签“回合”,标签“对人”和标签“对人对战”等,若直接通过直播游戏和手游标签相匹配的方式,例如某直播游戏标签为“回合制”和“策略”,某手游标签为“回合”和“角色扮演”,直接进行相似度计算,则该直播游戏和该手游的标签间无交集,相似度为0,但实际上“回合”和“回合制”存在高度相似,该直播游戏和该手游间存在一定的相似度,为避免这种情况的出现,本发明先进行标签和标签间的编辑距离相似度计算,计算得到的编辑距离相似度值越接近1,则表明两个标签的相似度越高。
该步骤的实现方式中,是基于直播游戏和手游的标签均为多个的考虑,由于在获取直播游戏和手游标签的过程中,标签获取渠道不同,市面上第三方应用商店较多,对于同一款游戏,不同第三方应用商店所标记标签存在差异,标签存在差异,但标签间的实际含义还是高度相似,故本发明实施例采用编辑距离算法,计算单个标签间的编辑距离相似度,以克服上述缺陷。
S3:根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应。
本发明实施例中,根据运营测试经验,设定阈值可以设定为0.7,当结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度大于或等于0.7时,则当前直播间的游戏类别与当前手游的类型高度重合,即喜欢当前手游的用户,很大程度上会喜欢当前直播间直播游戏的类型,基于此,将不同直播游戏和手游间进行关联,同一直播间至少对应一个手游。
S4:统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
本发明实施例中,设定时间可以设定为10min,若一用户在一游戏直播间所观看时间超过10min,则表明该用户对于游戏直播间所直播游戏的类型存在极大兴趣,相当于挖掘出该游戏直播间的兴趣用户,故将当前游戏直播间的直播游戏所对应手游推荐给用户,以实现手游的精确推荐。
本发明实施例的基于相似度计算的手游推荐方法,首先基于编辑距离算法,计算直播游戏和手游间标签的编辑距离相似度,然后根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,根据用户的直播观看记录,通过计算游戏直播间直播游戏标签和手游标签相似度的方式,分析直播观看用户的兴趣爱好,从而精准的实现对用户的手游推荐。
可选地,在上述图1对应实施例的基础上,本发明实施例的一种基于相似度计算的手游推荐方法的第一个可选实施例中,基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度,所使用公式为:
其中,sim_ratioij表示直播游戏标签集合中第i个标签和手游标签集合中第j个标签间的编辑距离相似度,sim_ratioij的值越接近1,表明直播游戏标签集合中第i个标签和手游标签集合中第j个标签间相似度越高,leni表示直播游戏标签集合中第i个标签的字符串长度,lenj表示手游标签集合中第j个标签的字符串长度,ldist表示类编辑距离,为直播游戏标签集合中第i个标签转化为手游标签集合中第j个标签所需的操作次数,删除和插入操作所对应的操作次数是1,替换操作所对应的操作次数是2。
本发明实施例的方案中,依次取出直播游戏标签集合中的单个标签,计算该标签与手游标签集合中每个标签间的编辑距离相似度,假如存在直播游戏A和直播游戏B,手游C和手游D,直播游戏A的标签集合包括标签1和标签2,直播游戏B的标签集合包括标签3、标签4和标签5,手游C的标签集合包括标签6和标签7,手游D的标签集合包括标签8和标签9,例如计算直播游戏A标签集合中第一个标签和手游C标签集合中第一个标签的编辑距离相似度,则sim_ratioij表示直播游戏A标签集合中第一个标签和手游C标签集合中第一个标签间的编辑距离相似度,sim_ratioij的值越接近1,表明直播游戏A标签集合中第一个标签和手游C标签集合中第一个标签间相似度越高,leni表示直播游戏A标签集合中标签1的字符串长度,lenj表示手游C标签集合中标签6的字符串长度,ldist表示类编辑距离,为标签1转化为标签6所需的操作次数。
本发明实施例中,采用编辑距离相似度计算公式,依次将直播游戏标签集合中的单个标签,计算该标签与手游标签集合中每个标签间的编辑距离相似度,该标签与手游标签集合中每个标签间的编辑距离相似度计算完成后,再取出直播游戏标签集合中的下一个标签,计算该标签与手游标签集合中每个标签间的编辑距离相似度,以此类推。采用编辑距离相似度计算,针对游戏直播和手游,标签的内容文字可能存在区别,但两者的实际表达意思可能相似度极高问题,先进行标签和标签间的编辑距离相似度计算,计算得到的编辑距离相似度值越接近1,则表明两个标签的相似度越高,进行单个标签间相似度的计算,为后续的标签集合间的相似度计算提供参考。
可选地,在上述一种基于相似度计算的手游推荐方法第一个可选实施例的基础上,本发明实施例的一种基于相似度计算的手游推荐方法的第二个可选实施例中,直播游戏和手游的标签均是使用集合表示,若是直接使用传统的杰卡德相似度计算方法计算两标签集合间的相似度,两标签集合间的相似度采用两标签集合的交集和并集的比值表示,但是此种方式只考虑两标签集合完全相等才当做交集,忽略了单个标签间所存在的相似度,从而导致最终计算出的直播游戏和手游间相似度不准确,本发明本发明实施例中,根据计算得到的直播游戏标签集合中单个标签与手游标签集合中每个标签间的相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,采用改进的杰卡德相似度计算算法,所使用的公式为:
M=max(sim_ratioi1,sim_ratioi2,……,sim_ratioij)
其中,J(A,B)表示直播游戏标签集合和手游标签集合间的相似度,A-len表示直播游戏标签集合中的标签个数,B-len表示手游标签集合中的标签个数,max表示取最大值,threshold为设定相似度阈值,根据实际的工作经验,threshold优选取值为0.7。
本发明实施例中,在计算直播游戏标签集合和手游标签集合间的相似度时,引入上述计算得到的单个标签间的相似度,考虑单个标签相似度之间的影响,且使用设定相似度阈值作为中间阈值以进行筛选,当M大于或等于设定相似度阈值时,sim_ration(i)的值为M,小于设定相似度阈值时,sim_ration(i)的值为0,采用改进的杰卡德相似度计算算法,有效解决只考虑两标签集合完全相等才当做交集,忽略了单个标签间所存在的相似度,从而导致最终计算出的直播游戏和手游间相似度不准确问题。
可选地,在上述一种基于相似度计算的手游推荐方法第二个可选实施例的基础上,本发明实施例的一种基于相似度计算的手游推荐方法的第三个可选实施例中,每个直播游戏所对应的手游至少为一个,当直播游戏所对应的手游为多个时,按照该直播游戏标签集合与所对应手游标签集合间的相似度大小顺序,由大至小取设定个数的手游作为该直播游戏所属游戏直播间推荐给用户的手游,以此来限制推荐给用户的手游个数,避免推荐手游过多,影响用户的直播观看体验,保证给游戏直播间观看用于推荐的手游数在一合适值,手游推荐可以采用弹窗方式,在游戏直播间上弹出相应手游的图标,用户点击图标即可跳转至游戏中心,然后由用户选择是否进行下载。
统计用户在游戏直播间的观看时间,若观看时间大于设定时间,其中,当多个游戏直播间的直播游戏相同时,则统计用户在所有直播相同直播游戏的游戏直播间中的累计观看直播时间,作为观看时间。设定时间优选设为10min,用户在一游戏直播间所观看时间超过10min,则表明该用户对于游戏直播间所直播游戏的类型存在极大兴趣,相当于挖掘出该游戏直播间的兴趣用户,故将当前游戏直播间的直播游戏所对应手游推荐给用户,以实现手游的精确推荐,当然,随着本发明基于相似度计算的手游推荐方法的运行,设定时间根据需求或运行经验,可动态调整。
本发明实施例中,按照该直播游戏标签集合与所对应手游标签集合间的相似度大小顺序,由大至小取设定个数的手游作为该直播游戏所属游戏直播间推荐给用户的手游,以保证当进行手游推荐时,推荐给用户的手游数量在一适合区间,保证用户的使用体验,以免推荐手游过多,使用户的直播观看体验;当多个游戏直播间的直播游戏相同时,则统计用户在所有直播相同直播游戏的游戏直播间中的累计观看直播时间,作为观看时间,用户在多个直播相同游戏的直播间进行观看,则表明用户对当前游戏类型较为感兴趣,故统计用户在所有直播相同直播游戏的游戏直播间中的累计观看直播时间,作为观看时间,进而进行手游推荐,进一步提升手游推荐精度。
本发明实施例提供的一种存储介质的一实施例包括,该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
可选地,在上述存储介质实施例的基础上,本发明实施例提供的一种存储介质的第一个可选实施例中,存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可选地,在上述存储介质的实施例及第一个可选实施例的基础上,本发明实施例提供的一种存储介质的第二个可选实施例中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可选地,在上述存储介质的实施例及第一、第二个可选实施例的基础上,本发明实施例提供的一种存储介质的第三个可选实施例中,可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
参见图2所示,本发明实施例提供的一种电子设备,包括:
标记单元,其用于对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
第一计算单元,其用于基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
第二计算单元,其用于根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
推荐单元,其用于统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
本发明实施例提供的一种基于相似度计算的手游推荐系统,包括:
标记模块,其用于对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
第一计算模块,其用于基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
第二计算模块,其用于根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
推荐模块,其用于统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
标签为描述游戏直播间所直播游戏的游戏内容相关的短语,或描述手游的游戏内容相关的短语;直播游戏的标签至少为一个,每个直播游戏的所有标签构成该直播游戏的标签集合;手游的标签至少为一个,每个手游的所有标签构成该手游的标签集合。
直播游戏标签集合和手游标签集合均至少为一个;基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度,具体步骤为:基于编辑距离,依次取出直播游戏标签集合中的单个标签,计算该标签与手游标签集合中每个标签间的编辑距离相似度。
本发明实施例的基于相似度计算的手游推荐系统,首先基于编辑距离算法,计算直播游戏和手游间标签的编辑距离相似度,然后根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,根据用户的直播观看记录,通过计算游戏直播间直播游戏标签和手游标签相似度的方式,分析直播观看用户的兴趣爱好,从而精准的实现对用户的手游推荐。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (10)

1.一种基于相似度计算的手游推荐方法,其特征在于,包括以下步骤:
对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
2.如权利要求1所述的一种基于相似度计算的手游推荐方法,其特征在于:
所述标签为描述游戏直播间所直播游戏的游戏内容相关的短语,或描述手游的游戏内容相关的短语;
所述直播游戏的标签至少为一个,每个直播游戏的所有标签构成该直播游戏的标签集合;
所述手游的标签至少为一个,每个手游的所有标签构成该手游的标签集合。
3.如权利要求1所述的一种基于相似度计算的手游推荐方法,其特征在于,
所述直播游戏标签集合和手游标签集合均至少为一个;
所述基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度,具体步骤为:基于编辑距离,依次取出直播游戏标签集合中的单个标签,计算该标签与手游标签集合中每个标签间的编辑距离相似度。
4.如权利要求1所述的一种基于相似度计算的手游推荐方法,其特征在于,所述基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度,所使用公式为:
其中,sim_ratioij表示直播游戏标签集合中第i个标签和手游标签集合中第j个标签间的编辑距离相似度,leni表示直播游戏标签集合中第i个标签的字符串长度,lenj表示手游标签集合中第j个标签的字符串长度,ldist表示类编辑距离,为直播游戏标签集合中第i个标签转化为手游标签集合中第j个标签所需的操作次数,删除和插入操作所对应的操作次数是1,替换操作所对应的操作次数是2。
5.如权利要求4所述的一种基于相似度计算的手游推荐方法,其特征在于,所述根据计算得到的直播游戏标签集合中单个标签与手游标签集合中每个标签间的相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,所使用的公式为:
M=max(sim_ratioi1,sim_ratioi2,……,sim_ratioij)
其中,J(A,B)表示直播游戏标签集合和手游标签集合间的相似度,A-len表示直播游戏标签集合中的标签个数,B-len表示手游标签集合中的标签个数,threshold为设定相似度阈值。
6.如权利要求1所述的一种基于相似度计算的手游推荐方法,其特征在于:每个直播游戏所对应的手游至少为一个,当直播游戏所对应的手游为多个时,按照该直播游戏标签集合与所对应手游标签集合间的相似度大小顺序,由大至小取设定个数的手游作为该直播游戏所属游戏直播间推荐给用户的手游。
7.如权利要求1所述的一种基于相似度计算的手游推荐方法,其特征在于:所述统计用户在游戏直播间的观看时间,若观看时间大于设定时间,其中,当多个游戏直播间的直播游戏相同时,则统计用户在所有直播相同直播游戏的游戏直播间中的累计观看直播时间,作为观看时间。
8.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现以下步骤:
对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
9.一种电子设备,其特征在于,所述电子设备包括:
标记单元,其用于对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
第一计算单元,其用于基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
第二计算单元,其用于根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
推荐单元,其用于统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
10.一种基于相似度计算的手游推荐系统,其特征在于,包括:
标记模块,其用于对游戏直播间所直播游戏标记标签,以及各手游标记标签,得到每个直播游戏的标签集合和手游的标签集合;
第一计算模块,其用于基于编辑距离,计算直播游戏标签集合中单个标签与手游标签集合中每个标签间的编辑距离相似度;
第二计算模块,其用于根据计算得到的编辑距离相似度,结合杰卡德相似度计算方法,计算直播游戏标签集合和手游标签集合间的相似度,若计算得到值不小于设定阈值,则将当前手游标签集所对应的手游,与当前直播游戏标签集合所对应的直播游戏进行对应;
推荐模块,其用于统计用户在游戏直播间的观看时间,若观看时间大于设定时间,则将当前游戏直播间的直播游戏所对应手游推荐给用户。
CN201910442067.3A 2019-05-24 2019-05-24 基于相似度计算的手游推荐方法、存储介质、设备及系统 Active CN110175291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910442067.3A CN110175291B (zh) 2019-05-24 2019-05-24 基于相似度计算的手游推荐方法、存储介质、设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910442067.3A CN110175291B (zh) 2019-05-24 2019-05-24 基于相似度计算的手游推荐方法、存储介质、设备及系统

Publications (2)

Publication Number Publication Date
CN110175291A true CN110175291A (zh) 2019-08-27
CN110175291B CN110175291B (zh) 2021-09-07

Family

ID=67695722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910442067.3A Active CN110175291B (zh) 2019-05-24 2019-05-24 基于相似度计算的手游推荐方法、存储介质、设备及系统

Country Status (1)

Country Link
CN (1) CN110175291B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110597980A (zh) * 2019-09-12 2019-12-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及计算机可读存储介质
CN111859160A (zh) * 2020-08-07 2020-10-30 成都理工大学 一种基于图神经网络会话序列推荐方法及系统
CN111859116A (zh) * 2020-06-19 2020-10-30 湖南师范大学 基于大数据和生涯规划的个性化课程推荐方法与装置
CN111935291A (zh) * 2020-08-14 2020-11-13 腾讯科技(深圳)有限公司 游戏推送方法、装置、设备及计算机可读存储介质
CN113411627A (zh) * 2021-06-17 2021-09-17 广州博冠信息科技有限公司 数据推送方法和装置、可读存储介质、电子设备
CN114095742A (zh) * 2021-11-09 2022-02-25 广州博冠信息科技有限公司 一种视频推荐方法、装置、计算机设备及存储介质
CN115168740A (zh) * 2022-09-06 2022-10-11 网娱互动科技(北京)股份有限公司 一种基于大数据分析生成营销任务的方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120323968A1 (en) * 2011-06-14 2012-12-20 Microsoft Corporation Learning Discriminative Projections for Text Similarity Measures
CN103473128A (zh) * 2013-09-12 2013-12-25 南京大学 一种用于mashup应用推荐的协同过滤方法
CN105245958A (zh) * 2015-11-11 2016-01-13 Tcl集团股份有限公司 一种直播电视节目推荐方法和装置
CN105989122A (zh) * 2015-02-12 2016-10-05 广东欧珀移动通信有限公司 一种应用推荐方法及装置
CN108170840A (zh) * 2018-01-15 2018-06-15 浙江大学 一种面向文本的领域分类关系自动学习方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120323968A1 (en) * 2011-06-14 2012-12-20 Microsoft Corporation Learning Discriminative Projections for Text Similarity Measures
CN103473128A (zh) * 2013-09-12 2013-12-25 南京大学 一种用于mashup应用推荐的协同过滤方法
CN105989122A (zh) * 2015-02-12 2016-10-05 广东欧珀移动通信有限公司 一种应用推荐方法及装置
CN105245958A (zh) * 2015-11-11 2016-01-13 Tcl集团股份有限公司 一种直播电视节目推荐方法和装置
CN108170840A (zh) * 2018-01-15 2018-06-15 浙江大学 一种面向文本的领域分类关系自动学习方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110597980A (zh) * 2019-09-12 2019-12-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及计算机可读存储介质
CN111859116A (zh) * 2020-06-19 2020-10-30 湖南师范大学 基于大数据和生涯规划的个性化课程推荐方法与装置
CN111859116B (zh) * 2020-06-19 2022-07-08 湖南师范大学 基于大数据和生涯规划的个性化课程推荐方法与装置
CN111859160A (zh) * 2020-08-07 2020-10-30 成都理工大学 一种基于图神经网络会话序列推荐方法及系统
CN111935291A (zh) * 2020-08-14 2020-11-13 腾讯科技(深圳)有限公司 游戏推送方法、装置、设备及计算机可读存储介质
CN113411627A (zh) * 2021-06-17 2021-09-17 广州博冠信息科技有限公司 数据推送方法和装置、可读存储介质、电子设备
CN114095742A (zh) * 2021-11-09 2022-02-25 广州博冠信息科技有限公司 一种视频推荐方法、装置、计算机设备及存储介质
CN115168740A (zh) * 2022-09-06 2022-10-11 网娱互动科技(北京)股份有限公司 一种基于大数据分析生成营销任务的方法和系统

Also Published As

Publication number Publication date
CN110175291B (zh) 2021-09-07

Similar Documents

Publication Publication Date Title
CN110175291A (zh) 基于相似度计算的手游推荐方法、存储介质、设备及系统
CN108197330B (zh) 基于社交平台的数据挖掘方法及装置
US10430662B2 (en) Training machine learning models to detect objects in video data
Hinch et al. Sport tourism and sustainable destinations: foundations and pathways
CN110248258A (zh) 视频片段的推荐方法、装置、存储介质和计算机设备
CN108509534A (zh) 基于深度学习的个性化音乐推荐系统及其实现方法
CN109408665A (zh) 一种信息推荐方法及装置、存储介质
CN105142028A (zh) 面向三网融合的电视节目内容搜索与推荐方法
CN104081429A (zh) 基于视频同现统计数据的视频推荐
CN109033266B (zh) 信息投放方法、装置、电子设备及计算机可读介质
CN109241242A (zh) 一种直播间话题推荐方法、装置、服务器及存储介质
CN106528851A (zh) 一种智能推荐方法及装置
CN107506296A (zh) 一种输入法测试方法、装置、电子设备及存储介质
CN108334528A (zh) 一种信息推荐方法和装置
CN109493146A (zh) 广告投放方法及装置
CN107545444A (zh) 一种业务广告数据推荐方法以及装置
CN110287375A (zh) 视频标签的确定方法、装置及服务器
Shreves Drupal search engine optimization
CN110222010B (zh) 基于区块链的论文保存方法、设备及计算机可读存储介质
CN108595599A (zh) 应用标签生成方法、装置、存储介质和计算机设备
Canter et al. Freelancing for journalists
CN114065051A (zh) 私域平台视频推荐方法、装置、电子设备和介质
CN106383857A (zh) 一种信息处理方法及电子设备
CN106991533A (zh) 预测影视作品投资风险的方法和服务器
CN115474093B (zh) 视频要素重要度的计算方法及装置、存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant