CN110223186B - 用户相似度确定方法以及信息推荐方法 - Google Patents

用户相似度确定方法以及信息推荐方法 Download PDF

Info

Publication number
CN110223186B
CN110223186B CN201810439395.3A CN201810439395A CN110223186B CN 110223186 B CN110223186 B CN 110223186B CN 201810439395 A CN201810439395 A CN 201810439395A CN 110223186 B CN110223186 B CN 110223186B
Authority
CN
China
Prior art keywords
user
identifier
interest
similarity
user identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810439395.3A
Other languages
English (en)
Other versions
CN110223186A (zh
Inventor
梁睿思
宋立鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810439395.3A priority Critical patent/CN110223186B/zh
Publication of CN110223186A publication Critical patent/CN110223186A/zh
Application granted granted Critical
Publication of CN110223186B publication Critical patent/CN110223186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种用户相似度确定方法、信息推荐方法、计算机设备,该用户相似度确定方法包括:获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像;第一用户兴趣画像、第二用户兴趣画像基于各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识确定,各用户标识包括第一用户标识和第二用户标识;获取第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息;根据第一用户兴趣画像、第二用户兴趣画像以及共有业务数据信息,确定第一用户标识与第二用户标识之间的用户相似度。基于本方法可提高用户相似度的准确性。基于用户相似度确定推荐信息,提高为第一用户标识推送的推荐信息的准确性。

Description

用户相似度确定方法以及信息推荐方法
技术领域
本申请涉及计算机信息处理技术领域,特别涉及一种用户相似度确定方法、信息推荐方法、计算机设备及存储介质。
背景技术
随着互联网技术的发展,涌现了大量的社交应用,在社交应用中,用户可与其他用户建立好友关系,互为好友的用户之间可进行一对一的交流,即社交应用为用户之间的交流提供了便利。
为便于扩展用户的交友范围,社交应用可以为用户推荐好友标识。在社交应用的好友推荐方法中,首先需要确定候选的推荐好友标识,目前,推荐好友标识可根据用户间的相似度确定,然而,现有确定相似度的过程中采用的数据较单一,容易导致相似度不准确,从而容易导致确定的推荐好友标识不准确,不能满足用户的需求。例如,目前常用的相似度确定方法基于用户的静态属性,例如地址、性别等,如此得到的相似度不准确。比如,用户为电影爱好者,希望寻找一个具有同样爱好的好友,但是,通过上述现有方法确定的与用户相似度高的用户中大多数并非是与用户具有相同爱好的用户。
发明内容
基于此,有必要针对现有用户相似度不准确性的问题,提出一种用户相似度确定方法、信息推荐方法、计算机设备及存储介质。
一种用户相似度确定方法,包括步骤:
获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像;所述第一用户兴趣画像、所述第二用户兴趣画像基于各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识确定,各所述用户标识包括所述第一用户标识和所述第二用户标识;
获取第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息;
根据所述第一用户兴趣画像、所述第二用户兴趣画像以及所述共有业务数据信息,确定所述第一用户标识与所述第二用户标识之间的用户相似度。
一种信息推荐方法,包括以下步骤:
获取第一用户标识与第二用户标识之间的用户相似度;其中,所述第一用户标识与所述第二用户标识之间的用户相似度,基于所述第一用户标识对应的第一用户兴趣画像、所述第二用户标识对应的第二用户兴趣画像以及所述第一用户标识与所述第二用户标识之间在各兴趣类型标识下的共有业务数据信息确定;
基于所述第一用户标识与所述第二用户标识之间的用户相似度,确定所述第一用户标识对应的推荐信息;
向所述第一用户标识推送所述推荐信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
上述用户相似度确定方法、信息推荐方法、计算机设备及存储介质,在确定用户相似度过程中,不但将用户的用户兴趣画像作为依据,能准确反映用户的兴趣爱好,而且结合用户之间在各兴趣类型标识下的共有业务数据信息,能正确反映用户之间的共同兴趣,如此,根据用户的用户兴趣画像以及用户之间的共有业务数据信息,能准确确定各用户之间的用户相似度,提高用户之间的用户相似度的准确性。基于准确的用户相似度确定第一用户标识对应的推荐信息,可提高为第一用户标识推送的推荐信息的准确性,即可为第一用户标识提供准确的推荐信息。
附图说明
图1为一个实施例中用户相似度确定方法的应用环境图;
图2为一个实施例的用户相似度确定方法的流程示意图;
图3为另一个实施例的用户相似度确定方法的流程示意图;
图4为一个实施例中信息推荐方法的流程示意图;
图5为一个实施例中确定用户兴趣画像的原框图;
图6为一个实施例中确定用户相似度的原理框图;
图7为用户标识A所在终端的推荐界面图;
图8为用户标识A所在终端的显示界面图;
图9为一个实施例的用户相似度确定装置的模块示意图;
图10为一个实施中信息推荐装置的模块示意图;
图11为一个实施例中计算机设备的内部结构图。
实施方式
为使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本申请,并不限定本申请的保护范围。
本申请提供的用户相似度确定方法,可应用于如图1示所示的应用环境图。如图1所示,终端10与服务器20通过网络进行通信。终端10通过网络可访问对应的服务器20,以请求相应的数据。服务器20可确定各用户标识之间的用户相似度,还可将各用户标识中用户相似度大于或等于预设相似度阈值的第二用户标识以及对应的用户相似度推送给第一用户标识,实现用户标识的推送。终端10的第一用户标识对应的用户参考服务器20推送的内容,进行后续的相关操作。例如,终端10的用户可以根据推荐的第二用户标识进行好友添加等。
该终端10可以是任何一种能够实现智能输入输出的设备,例如,台式电脑或移动终端,移动终端可以是智能手机、平板电脑、车载电脑、穿戴式智能设备等。服务器20可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,一种实施例的用户相似度确定方法,以应用于图1中的服务器20为例进行说明,包括步骤S210至步骤S240:
S210:获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像。
标识,指用于唯一表征某个对象身份的信息,用户标识,指用于表征用户身份的信息。例如,针对聊天工具,用户通过注册获得唯一表征其身份的用户标识,即聊天账号,比如为X,通过用户标识X可唯一表征该用户的身份,用户可通过该用户标识X登录并与他人进行交流。
用户画像,用户信息标签化,即通过分析用户操作,为用户打上标签以及标签的权重,可以理解,用户画像是用户的虚拟代表,是建立在用户相关数据之上的用户模型,用户画像用于描述用户信息。标签表征了内容,用户描述用户自身带有的属性特征(静态)以及兴趣特征(动态)。权重,用于区分不同标签对于该用户的重要程度,构建用户画像是为了还原用户信息。比如,针对用户A,其对应的用户画像中标签为“男,25岁,未婚,爱电影、爱音乐”,通过上述的用户画像,可描述用户A的用户信息。
用户的属性特征,指相对静态和稳定的属性,例如,性别、地址等。用户的兴趣特征则是更加动态和易变化的特征,即动态属性(不断变化的行为信息),易受到其他因素的影响,一旦这些因素发生变化,用户的兴趣容易产生变化。用户的行为多样,不同行为反映的兴趣差异较大。用户兴趣画像属于用户画像范畴,可以理解,用户兴趣画像,是基于用户产生过的行为得到的用户独特的数据,表示用户更加关注哪些方面的兴趣。比如,如前述的用户A,其用户画像的标签中“男,25岁,未婚”表征用户的静态属性,“爱电影、爱音乐”表征用户的动态属性,对应用户A的用户兴趣画像。
将用户兴趣画像作为确定用户之间的用户相似度的依据,即确定用户相似度的过程中,考虑了表征用户感兴趣的内容,可提高相似度的准确性。在本实施例中,第一用户兴趣画像、第二用户兴趣画像基于各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识确定,各用户标识包括第一用户标识和第二用户标识。具体地,第一用户兴趣画像基于第一用户标识关联的各业务标识的业务数据、以及第一用户标识关联的各业务标识对应的兴趣类型标识确定,第二用户兴趣画像基于第二用户标识关联的各业务标识的业务数据、以及第二用户标识关联的各业务标识对应的兴趣类型标识确定。
在后续推荐过程中,需要根据用户相似度从第二用户标识中进行筛选。需要说明的是,上述第二用户标识作为第一用户标识对应可能的推荐信息,并不只是特指某一个用户标识,其数量可以一个或两个以上。即上述获取第二用户标识的第二用户兴趣画像可以理解为获取各第二用户标识分别对应的第二用户兴趣画像。
各业务对应有唯一的业务标识,用于区分不同的业务。业务类型用于区别于不同类型业务,可以包括电影、游戏、音乐、新闻以及动漫等。比如,游戏业务下包括游戏A1、游戏B1和游戏C1,即游戏业务下有3个业务,这三个游戏为游戏业务下具体的游戏代表,可以理解,其对应的业务标识分别为游戏A1、游戏B1和游戏C1。
兴趣类型标识用于区别不同兴趣类型,其中,兴趣类型可以理解为业务类型,可以包括上述电影、游戏、音乐、新闻以及动漫等类型。各业务标识有其对应的兴趣类型标识,例如,上述游戏A1、游戏B1和游戏C1的业务标识对应游戏类型标识。再例如,针对音乐a、音乐b和音乐c的业务标识,其分别对应音乐类型标识。可以理解,每种兴趣类型标识对应有各业务标识,其该业务标识属于该兴趣类型标识对应的兴趣类型。
将各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识作为依据,确定第一用户兴趣画像、第二用户兴趣画像,如此,可确保第一用户兴趣画像和第二用户兴趣画像分别与对应的用户标识关联的业务数据相关,能准确反映用户的行为,提高用户兴趣画像与业务数据的关联性。
S220:获取第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息。
共有业务表示不同用户之间存在的相同业务,例如,可以表示不同用户之间喜欢的相同的事务,如同一首歌、同一个游戏、同一个漫画等。共有业务数据信息表示不同用户之间存在的相同业务的数据信息,在一个示例中,该数据信息可以为数量,即相同业务的数量。比如,在游戏类型下,用户A关联的各业务标识有游戏A1、游戏B1和游戏C1,即用户A有对这三个游戏进行过相关行为,用户B关联的各业务标识有游戏A1和游戏C1,即用户B有对这两个游戏进行过相关行为,则用户A和用户B之间存在两个共有业务,即游戏A1和游戏C1,则共有业务数据信息则为共有业务的数量,即在游戏类型下用户A和用户B之间的共有业务数据信息为2。再比如,在音乐类型下,用户A关联的各业务标识有音乐a、音乐b、音乐c和音乐d,即用户A有对这四个音乐进行过相关行为,用户B关联的各业务标识有音乐b、音乐c和音乐d,即用户B有对这三个音乐进行过相关行为,则用户A和用户B之间存在三个共有业务,即音乐b、音乐c和音乐d,即在音乐类型下用户A和用户B之间的共有业务数据信息为3。
即在不同兴趣类型标识下,第一用户标识和第二用户标识之间的共有业务数据信息不仅不同,在本实施例中,可根据各业务标识对应的兴趣类型标识,确定第一用户标识与第二用户标识之间的相同业务的数据信息,即可获取第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息,表示第一用户标识与第二用户标识之间在各兴趣类型标识下的共同兴趣的数据信息。
S230:根据第一用户兴趣画像、第二用户兴趣画像以及共有业务数据信息,确定第一用户标识与第二用户标识之间的用户相似度。
在确定第一用户兴趣画像、第二用户兴趣画像以及共有业务数据信息后,即可确定第一用户标识与第二用户标识之间的用户相似度,由于第一用户兴趣画像、第二用户兴趣画像分别能准确反映用户标识对各兴趣类型标识的兴趣爱好,且共有业务数据信息能准确反映不同用户之间共同兴趣的情况,如此,可提高用户相似度的准确性。确定第一用户标识与第二用户标识之间的用户相似度可以理解为确定第一用户标识分别与各第二用户标识之间的用户相似度。例如,第一用户标识为A(即用户A),各第二用户标识包括用户B、用户C和用户D,则确定的用户相似度包括三个用户相似度,即用户A分别与用户B、用户C和用户D之间的用户相似度。
上述用户相似度确定方法,在确定用户相似度过程中,不但将用户的用户兴趣画像作为依据,能准确反映用户的兴趣爱好,而且结合用户之间在各兴趣类型标识下的共有业务数据信息,能正确反映用户之间的共同兴趣,如此,根据用户的用户兴趣画像以及用户之间的共有业务数据信息,能准确确定各用户之间的用户相似度,提高用户之间的用户相似度的准确性。
在一个实施例中,如图3所示,在获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像之前,还包括步骤:
S201:获取各业务标识的业务数据,业务数据包括各用户标识以及关联的业务数据信息。
业务数据即为业务标识相关的数据,在本实施例中,可以包括各用户标识以及关联的业务数据信息,即业务数据信息分别与用户标识和业务标识关联。例如,针对用户A关联的游戏A1(业务标识),其对应关联的业务数据信息即为与该游戏A1关联的相关信息。在一个示例中,业务标识对应的业务数据信息可以为业务标识对应的使用时长。
S202:基于业务标识与兴趣类型标识的对应关系,确定各用户标识对应的各兴趣类型标识的业务数据信息。
业务标识与兴趣类型标识存在对应关系,通过业务标识可确定对应的兴趣类型标识。可以理解,兴趣类型对应一个类别,业务标识对应一个类别,业务标识为一个类别下的元素。在业务标识关联的业务数据信息确定后,即可根据业务标识与兴趣类型标识的对应关系,确定各用户标识对应的各兴趣类型标识的业务数据信息,即确定在每个兴趣类型标识下的业务数据信息。
比如,游戏A和游戏B分别与游戏类型标识对应,在游戏A和游戏B的业务数据信息确定后,即可根据对应关系,可确定在游戏类型标识下的业务数据信息。
S203:根据各用户标识对应的各兴趣类型标识的业务数据信息,确定各用户标识的用户兴趣画像。
兴趣类型标识的业务数据信息反映了用户在该兴趣类型标识对应的兴趣类型下的行为情况,本实施例中,针对各兴趣类型标识分别确定对应的业务数据信息,依此可准确确定各用户标识的用户兴趣画像。
在一个实施例中,根据各用户标识对应的各兴趣类型标识的业务数据信息,确定各用户标识的用户兴趣画像,包括:根据用户标识的各兴趣类型标识的业务数据信息,确定用户标识的各兴趣类型标识的兴趣点参数值;确定该用户标识的各兴趣类型标识的兴趣点参数值占比;基于该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
兴趣类型标识的兴趣点参数值可以理解为对该兴趣类型标识的兴趣程度,值越大,表示用户对该兴趣类型标识对应的业务标识的兴趣程度越高。在确定兴趣点参数值后,可依此确定用户标识的各兴趣类型标识的兴趣点参数值占比。该兴趣点参数值占比为该用户标识的该兴趣类型标识的兴趣点参数值与总兴趣点参数值的占比,总兴趣点参数值为该用户标识的各兴趣类型标识的兴趣点参数值之和。
在一个示例中,兴趣类型标识的兴趣点参数值为与兴趣类型标识的业务数据信息正相关的值。例如,在兴趣类型标识的业务数据信息为兴趣类型标识的使用时长时,兴趣类型标识的兴趣点参数值即可以为使用时长。
在一个示例中,用户标识的用户兴趣画像可以为用户标识的各兴趣类型标识的兴趣点参数值占比。
在一个实施例中,各兴趣类型标识的业务数据信息,为各兴趣类型标识对应的使用时长。
在本实施例中,兴趣类型标识对应的使用时长为该兴趣类型标识对应的各业务标识的使用时长之和。例如,以时长单位为分钟为例,针对游戏类型标识,用户标识A关联的各业务标识,包括游戏A1、游戏B1和游戏C1,其分别对应的使用时长为10分钟、15分钟和10分钟,则在游戏类型标识对应的使用时长为游戏A1对应的使用时长10分钟、游戏B1对应的使用时长15分钟和游戏C1对应的使用时长10分钟之和,即35分钟。
在一个实施例中,基于该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像,包括:根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比;基于更新后的该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
为了能准确描述用户最新的行为,需要根据业务数据信息的业务时间,对兴趣点参数值占比进行更新,可以理解为对兴趣点参数值进行降权或加权处理,即降低或增加兴趣点参数占比在确定用户兴趣画像过程中的重要程度,如此,可确保确定的用户兴趣画像的实时性和准确性。
其中,兴趣类型标识的业务数据信息的业务时间可以是该兴趣类型标识对应的各业务标识中任意一个业务标识的业务数据的业务时间,业务时间可以理解为用户标识进行相关行为对应的行为时间,例如,用户标识A对游戏A1的使用时间即为业务时间,比如,用户标识A在2018年3月15日9点进行了游戏A1的使用,则用户标识A对游戏A1的业务时间为2018年3月15日9点。针对游戏类型标识,其中,用户标识A对游戏A1的使用时长为10分钟,但使用时间即业务时间在两周以前,业务时间较早,则可将游戏类型标识对应的兴趣点参数占比更新。
在一个实施例中,根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比,包括下述各项中的至少一项:
在该用户标识的任意一个兴趣类型标识的业务数据信息的最近业务时间与当前时间的时间差大于第一预设时长时,降低该兴趣类型标识的兴趣点参数值占比;
在该用户标识的任意一个兴趣类型标识的业务数据信息的最早业务时间与当前时间的时间差小于或等于第二预设时长时,增大该兴趣类型标识的兴趣点参数值占比。
兴趣类型标识的业务数据信息的最近业务时间指该兴趣类型标识下各业务标识的业务数据对应的业务时间中距离当前时间最近的业务时间。比如,游戏业务标识下包括游戏A1和游戏B1,其分别对应的业务时间为2018年3月15日9点和2018年3月15日12点,则游戏B1的业务时间是离当前时间最近的,可将游戏B1的业务时间作为游戏类型标识的业务数据信息的最近业务时间。
在该用户标识的任意一个兴趣类型标识的业务数据信息的最近业务时间与当前时间的时间差大于第一预设时长时,表示用户标识对该兴趣类型标识下的各业务标识最近一次的行为离当前时间太久,即该用户标识在该兴趣类型标识下的行为已过了太久,一定程度上不能表示该用户标识最新的行为,为确保后续确定的用户兴趣画像的实时性和准确性,可将降低该兴趣类型标识的兴趣点参数值占比,以降低对确定用户兴趣画像所起的作用程度。
在一个示例中,可通过最近业务时间确定占比降低量,最近业务时间越早,其占比降低量越大,即最近业务时间与占比降低量正相关,根据占比降低量,降低对该兴趣类型标识的兴趣点参数值占比。无论兴趣点参数值占比如何更新,其各兴趣类型标识的兴趣点参数值占比的和为1。
另外,兴趣类型标识的业务数据信息的最早业务时间指该兴趣类型标识下各业务标识的业务数据对应的业务时间中距离当前时间最远的业务时间。比如,游戏业务标识下包括游戏A1和游戏B1,其分别对应的业务时间为2018年3月15日9点和2018年3月15日12点,则游戏A1的业务时间是离当前时间最远的,可将游戏A1的业务时间作为游戏类型标识的业务数据信息的最早业务时间。
在该用户标识的任意一个兴趣类型标识的业务数据信息的最早业务时间与当前时间的时间差小于或等于第二预设时长时,表示用户标识对该兴趣类型标识下的各业务标识最早一次的行为离当前时间很近,即该用户标识在该兴趣类型标识下的行为都是最新的,为确保后续确定的用户兴趣画像的实时性和准确性,可将降增加该兴趣类型标识的兴趣点参数值占比,以增加对确定用户兴趣画像所起的作用程度。
在一个示例中,可通过最早业务时间确定占比增加量,最早业务时间越近,其占比增加量越大,即最早业务时间与占比增加量反相关,根据占比增加量,增加对该兴趣类型标识的兴趣点参数值占比。无论兴趣点参数值占比如何更新,其各兴趣类型标识的兴趣点参数值占比的和为1。
在一个实施例中,根据第一用户兴趣画像、第二用户兴趣画像以及共有业务数据信息,确定第一用户标识与第二用户标识之间的用户相似度,包括:基于第一用户兴趣画像以及共有业务数据信息,确定第一用户标识相对于第二用户标识的第一相似度;基于第二用户兴趣画像以及共有业务数据信息,确定第二用户标识相对于第一用户标识的第二相似度;根据第一相似度和第二相似度,确定第一用户标识与第二用户标识之间的用户相似度。
由于不同用户对业务的行为不同,则不同用户标识关联的各业务标识的业务数据不同,进而后续确定的第一用户标识对应的第一用户兴趣画像和第二用户标识对应的第二用户兴趣画像不同,采用不同用户的用户兴趣画像确定的相似度不同。即基于第一用户兴趣画像和共有业务数据信息,确定第一用户标识相对于第二用户标识的第一相似度,即为以第一用户标识视角,第一用户标识与第二用户标识的相似度,基于第二用户兴趣画像以及共有业务数据信息,确定第二用户标识相对于第一用户标识的第二相似度,即为以第二用户标识视角,第一用户标识和第二用户标识的相似度。然而,不管是第一相似度还是第二相似度,均是标识第一用户标识和第二用户标识之间的相似度,只是为不同视角下两者之间的相似度,为提高用户相似度的准确性,根据一相似度和第二相似度,确定第一用户标识与第二用户标识之间的用户相似度。
在一个实施例中,还包括步骤:将第一用户兴趣画像表示为第一用户画像向量,将第二用户兴趣画像表示为第二用户画像向量,将共有业务数据信息表示为共用向量。
其中,第一相似度为第一用户画像向量的转置矩阵与共用向量的乘积,第二相似度为第二用户画像向量的转置矩阵与共用向量的乘积。
由于第一用户兴趣画像是根据各兴趣类型标识的业务数据信息确定,即包括了由各兴趣类型标识的业务数据信息确定的数据,第一用户兴趣画像中包括多个数据,数据的数量与各兴趣类型标识的数量相同。针对每个兴趣类型标识,对应有共有业务数据信息,则针对各兴趣类型标识,对应有各共有业务数据信息。在本实施例中,将第一用户兴趣画像表示为第一用户画像向量,将第二用户兴趣画像表示为第二用户画像向量,将共有业务数据信息表示为共用向量(共用向量中元素的个数即为各兴趣类型标识的数量)。
在本实施例中,第一用户画像向量、第二用户画像向量和共用向量分别为列向量。如此,在确定第一相似度和第二相似度的过程中,将第一用户画像向量的转置矩阵与共用向量的乘积(乘积结果即为一个值)作为第一相似度,将第二用户画像向量的转置矩阵与共用向量的乘积作为第二相似度。
在一个实施例中,根据第一相似度和第二相似度,确定第一用户标识与第二用户标识之间的用户相似度,包括:
基于第一相似度的第一加权系数以及第二相似度的第二加权系数,对第一相似度和第二相似度进行加权求和,获得第一用户标识与第二用户标识之间的用户相似度。
由于第一用户兴趣画像和第二用户兴趣画像不同,需要进行再不同视角下的相似度计算,即得到第一相似度和第二相似度,由于在实际应用中,不同视角下的相似度的重要程度不同,对确定相似度起到的作用程度不同。从而,需要给定第一相似度和第二相似度对应的加权系数,加权系数表示对应的相似度对确定用户相似度的重要程度,基于第一相似度的第一加权系数以及第二相似度的第二加权系数,对第一相似度和第二相似度进行加权求和,获得第一用户标识与第二用户标识之间的用户相似度,表示第一用户标识和第二用户标识在整体上的相似度。如此,确定的用户相似度不但考虑了在第一用户标识视角下的第一相似度和在第二用户视角下的第二相似度,而且还考虑了第一相似度和第二相似度的重要程度,提高用户相似度的准确性。
在一个实施例中,第一加权系数与第二加权系数的值可以相同,均为0.5。表示第一相似度和第二相似度在确定用户相似度的过程中所起作用程度相同。在实际应用中,可以根据实际情况调整加权系数。例如,第一加权系数可调整为0.8,第二加权系数可调整为0.2。
在一个实施例中,在第一用户标识为目标推荐用户标识、第二用户标识为待推荐用户标识时,第一加权系数大于第二加权系数。
目标推荐用户标识表示接收推荐的用户标识,待推荐用户标识表示等待推荐给目标推荐用户标识的用户标识。在第一用户标识为目标推荐用户标识、第二用户标识为待推荐用户标识的情况下,可以认为在第一用户标识的视角下的第一相似度更为重要,可将对应的第一加权系数设置为大于第二相似度的第二加权系数,即将主观方向的加权系数增加。在本实施例中,无论第一加权系数和第二加权系数如何调整,第一加权系数和第二加权系数之和为1。
在一个实施例中,各业务标识的业务数据,为业务时间在预设最近时间范围内的各业务标识的业务数据。
业务时间越早,表示对应的各业务标识的业务数据是越久以前的数据,然而,在确定用户兴趣画像并依此确定用户相似度时,业务时间越近的各业务标识的业务数据越能表示用户标识越新的行为,越能表示用户标识最新的兴趣爱好,即用户兴趣画像越准确。从而,在本实施例中,上述各业务标识的业务数据为业务时间在预设最近时间范围内的各业务标识的业务数据,例如,可以为业务时间在最近一个月的时间范围内的各业务标识的业务数据。
在一个实施例中,上述方法还包括步骤:获取第一用户标识当前所处的地理位置。其中,第二用户标识包括在该地理位置的预设范围内的用户标识。
可以理解,只是对在第一用户标识附近用户标识的用户兴趣画像以及用户相似度计算,可向第一用户标识推荐其附近的并与其用户相似度较高的第二用户标识。在该地理位置的预设范围内的用户标识为与第一用户标识不存在关联关系的用户标识。另外,第二用户标识还包括与第一用户标识存在关联的用户标识,比如,与第一用户标识好友关联的用户标识,也可向其推荐用户相似度以及第二用户标识,使用户了解第一用户标识与第二用户标识之间的相似度。
在一个实施例中,如图4所示,还提供一种信息推荐方法,包括以下步骤:
S410:获取第一用户标识与第二用户标识之间的用户相似度。
第一用户标识与第二用户标识之间的用户相似度,基于第一用户标识对应的第一用户兴趣画像、第二用户标识对应的第二用户兴趣画像以及第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息确定。第一用户兴趣画像、第二用户兴趣画像基于各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识确定,各用户标识包括第一用户标识和第二用户标识。用户兴趣画像能准确反映用户的兴趣爱好,共有业务数据信息能准确反映用户之间的共同兴趣,如此,可确保用户相似度的准确性。
S420:基于第一用户标识与第二用户标识之间的用户相似度,确定第一用户标识对应的推荐信息。
S430:向第一用户标识推送推荐信息。
用户相似度确定后,可根据用户相似度确定第一用户标识对应的推荐信息。第二用户标识在行为过程中,记录有对应的业务标识的业务数据,例如,第二用户标识有玩过游戏A1,业务标识指示的业务为游戏A1,即记录有游戏A1的业务数据。第一用户标识与第二用户标识的用户相似度确定,在本实施例中,可基于用户相似度,从第二用户标识中筛选满足要求的推荐用户标识,并可将该推荐用户标识对应的业务标识对应的业务作为推荐信息,推送给第一用户标识。比如,待推荐用户标识包括B和C,可将用户B玩过的游戏A1以及用户C观看过的动漫M1作为推荐信息推荐给第一用户标识。也可以将第二用户标识中筛选的满足要求的推荐用户标识以及该推荐用户标识与第一用户标识之间的用户相似度作为推送信息,推送给第一用户标识,即为第一用户标识实现用户推荐。
如此,第一用户标识在接收到推荐信息后,可根据推荐信息执行相关的操作。比如,推荐信息中包括游戏A1和动漫M1,可对游戏A1进行开启操作,以开始游戏,也可对动漫M1进行播放操作,以播放动漫M1。又比如,推荐信息中包括用户标识C、用户标识C与第一用户标识之间的用户相似度、用户标识D和用户标识D与第一用户标识之间的用户相似度,若用户标识C和用户标识D分别与第一用户标识未关联,即为第一用户标识实现好友推荐,可进行好友添加操作,实现第一用户标识分别与用户标识C和用户标识D的好友关联。
上述信息推荐方法,上述第一用户标识与第二用户标识之间的用户相似度,基于用户的用户兴趣画像和用户之间在各兴趣类型标识下的共有业务数据信息确定,用户兴趣画像能准确反映用户的兴趣爱好,共有业务数据信息能准确反映用户之间的共同兴趣,如此,根据用户的用户兴趣画像以及用户之间的共有业务数据信息,能准确确定各用户之间的用户相似度,提高用户之间的用户相似度的准确性。基于准确的用户相似度确定第一用户标识对应的推荐信息,可提高为第一用户标识推送的推荐信息的准确性,即可为第一用户标识提供准确的推荐信息。
在一个实施例中,上述第一用户标识与第二用户标识之间的用户相似度可以通过上述任意一个实施例中的用户相似度的确定方法确定。如此,可确保用户相似度的准确性,根据确定的准确的用户相似度,可获得准确的推荐信息,将其推送给第一用户标识。
在一个实施例中,推荐信息包括与第一用户标识之间的用户相似度满足预设相似度条件的第二用户标识,以及该第二用户标识与第一用户标识之间的用户相似度。
在用户相似度确定后,将第二用户标识中不满足预设相似度条件的用户标识过滤,从各第二用户标识中筛选满足预设相似度条件(对应上述要求)的用户标识推荐给第一用户标识,实现精确的用户推荐。
在一个实施例中,预设相似度条件包括:用户相似度大于或者等于预设相似度阈值。
在本实施例中以用户相似度的大小进行推荐,只要大于或者等于预设相似度阈值,即可将其以及对应的第二用户标识推荐给第一用户标识。用户相似度越低,表示用户之间存在的共同兴趣的数量越少,若将相似度较低的第二用户标识推荐给第一用户标识,则表示推荐了与第一用户标识之间存在的共同兴趣的数量很少的第二用户标识,这并不是第一用户标识所需要的。为避免将用户相似度较低的第二用户标识推荐给第一用户标识,给第一用户标识造成困扰,可对用户相似度与预设相似度阈值进行比较,在用户相似度大于或者等于预设相似度阈值时,表示该第二用户标识与第一用户标识之间存在的共同兴趣的数量越多,用户相似度已达到推荐要求,此时,可向第一用户标识推送该用户相似度以及该用户相似度对应的第二用户标识。此后,终端的用户可对向第一用户标识推荐的第二用户标识进行好友添加等操作。
在一个实施例中,上述推荐信息还可以包括与第一用户标识之间的用户相似度满足预设相似度条件的第二用户标识与第一用户标识之间的共有业务即共同兴趣。例如,共同看过的电影D1、共同使用过的游戏A1、共同听过的音乐a1、共同看过的新闻X1和动漫M1等。
在另一个实施例中,预设相似度条件包括:用户相似度属于预设数目个最大的用户相似度。
预设数目个最大的用户相似度即为第一用户标识分别与各第二用户标识之间的用户相似度中预设数目个最大的用户相似度。即在本实施例中,以数目为依据进行推荐,例如,预设数目为5,则在确定第一用户分别与各第二用户标识之间的用户相似度之后,从各第二用户标识中选择用户相似度最大的5个第二用户标识以及对应的用户相似度推送给第一用户标识即可。
在一个实施例中,向第一用户标识推送推荐信息之前,还包括步骤:根据预设排序规则,对第一用户标识与第二用户标识之间的用户相似度进行排序。
预设排序规则可以为相似度从大到小的规则。进行排序后,可根据排序后的用户相似度,进行推荐。如此,在与预设相似度阈值进行比较过程中,可依据有序的用户相似度进行比较,不再混乱,而且在比较过程中,一旦发现有小于预设相似度阈值的相似度即可停止,越往后用户相似度越小,所以无需再往后进行比较,减少工作量。另一方面,根据排序后的用户相似度,可直接从排序后的用户相似度中选择预设数目个用户相似度即可,无需从各用户相似度中再进行比较找出预设数目个最大的。
根据第一用户标识和第二用户标识产生的行为,确定用户相似度,并根据用户相似度进行好友推荐,即进行基于共有兴趣的好友推荐,将用户相似度高的第二用户标识推荐给第一用户标识,能够给第一该用户标识带来兴趣话题,提升用户的添加好友动力,即能够更精准的帮助用户评估被推荐的第二用户标识与自己的相似程度,提升添加好友的动力。对于构建更加活跃,更加健康的好友关系有重要作用。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
下面以一具体实施例对上述用户相似度确定方法以及信息推荐方法的过程加以具体说明。
首先,以共同兴趣(即共同业务)角度出发,基于各业务标识的业务数据(可以理解为用户对各业务标识的行为数据)进行分析,为第一用户标识(例如,用户标识A)确定第一用户兴趣画像以及第二用户标识(例如,用户标识B)确定第二用户兴趣画像。如图5所示,为确定用户兴趣画像的原框图,以兴趣类型包括游戏类型、音乐类型、新闻类型和动漫类型为例进行说明,具体流程如下:
(1)用户标识关联的各业务标识的业务数据预先存储与分布式数据仓库中,可从分布式数据仓库中获取用户标识关联的各业务标识的业务数据。
例如,获取用户标识A关联的游戏A1(业务标识)的业务数据格式为:{标题:游戏A1,使用时长:10分钟},其中,游戏A1即表示用户标识A在游戏类型下的业务标识,使用时长标识用户标识A在游戏类型下该游戏A1的业务数据信息。
(2)由于用户标识A在一个兴趣类型标识下可能关联有多个业务标识的业务数据,此时,该兴趣类型标识对应的业务数据信息则为该兴趣类型标识对应的各业务标识对应的业务数据信息之和,在业务标识对应的业务数据信息为业务标识对应的使用时长时,兴趣类型标识对应的业务数据信息则为该兴趣类型标识对应的各业务标识对应的使用时长之和。
(3)在确定各兴趣类型标识的业务数据信息后,确定用户标识的各兴趣类型标识的兴趣点参数值。具体地,是根据各兴趣类型标识的使用时长,确定各兴趣类型标识的兴趣点参数值。以上述游戏A1为例,游戏类型标识下只有这一个业务标识,使用时长为10分钟,确定的在游戏类型标识的兴趣点参数值(Point)为10。且根据业务标识即游戏A1,可确定其对应的兴趣类型标识,即为游戏类型标识(Game)。即上述用户标识A的业务数据可以表示为:{Name:游戏A1,Point:10,Type:Game}。
(4)根据用户标识A在业务上的行为,对用户形成整体的兴趣画像。用户标识A在各兴趣类型下的兴趣点参数值和比例如表1所示。
其中,Point值以在该兴趣类型下各业务标识的使用时长的总和。例如,针对游戏类型,其对应的各业务标识有游戏A1、游戏B1和游戏C1,分别对应的使用时长为20分钟、40分钟和40分钟,总使用时长为100分钟,则Point值为100。其中,针对上述游戏类型、音乐类型、新闻类型和动漫类型,对应的Point总值为380,比例即为该兴趣类型的Point值在Point总值中的占比,总占比为1(100%)。
表1 用户标识A在各兴趣类型下的兴趣点参数值和比例
Figure SMS_1
如此,可得到用户标识A对应的第一兴趣画像为:游戏:26%(游戏类别标识对应的兴趣点参数值占比),音乐:53%,新闻:8%,动漫:13%。其兴趣点参数值占比可以理解为上述用户画像中标签(对应兴趣类型)的权重。
(5)根据上述过程,同样可确定用户标识B对应的第二用户画像:游戏:10%,音乐:20%,新闻:50%,动漫:20%。
如图6所示,为确定用户相似度(即Match分数)的原理框图。
在通过上述过程确定用户标识A对应的第一用户兴趣画像和用户标识B对应的第二用户兴趣画像后,还需要确定用户标识A和用户标识B的在各兴趣类型标识对应的共同兴趣点数量(即共有业务数据信息),即表示用户表示A和用户表示B在各兴趣类型标识对应的存在的相同业务(相同兴趣)数量。
例如,可将上述第一用户兴趣画像表示为第一用户兴趣画像向量VA:
Figure SMS_2
,其中,第一用户兴趣画像向量中的元素为第一用户兴趣画像中对应的兴趣点参数值占比的分子(此处的占比为百分占比)。可将上述第二用户兴趣画像表示为第二用户兴趣画像向量VB:
Figure SMS_3
。用户标识A和用户标识B在游戏类型下的共有业务数据信息为3(即在游戏类型下,用户标识A和用户标识B有3个共同业务,例如,均玩过游戏A1、游戏B1和游戏C1),用户标识A和用户标识B在音乐类型下的共有业务数据信息为10,用户标识A和用户标识B在新闻类型下的共有业务数据信息为4,用户标识A和用户标识B在漫画类型下的共有业务数据信息为6。则用户标识A和用户标识B在各兴趣类型标识下的共有业务数据信息可表示为共用向量I:
Figure SMS_4
计算用户标识A对用户标识B的第一相似度(即MatchAB)和用户标识B对用户标识A的第二相似度(即Match BA)。具体计算公式如下:
Figure SMS_5
Figure SMS_6
然后,根据第一相似度和第二相似度确定用户相似度(Match),第一加权系数为0.5,第二加权系数为0.5,具体公式如下:
Figure SMS_7
由于用户标识A和用户标识B的兴趣画像不仅相同,所以需要针对用户标识A对于用户标识B和用户标识B对于用户标识A反向分别计算相似度,然后再给予两个相似度不同的比例(加权系数)得到最终的用户相似度。目前给予的比例是 50%。在实际应用中,可以根据实际效果调整比例,比如将主观方向的比例设置为 80% (即MatchAB对应的比例),以提高用户标识A用户视角下对用户标识B的好感度。在实际应用中,可以针对比例参数上述第一加权系数和第二加权系数进行AB测试,得到更加合理的加权系数。
可通过上述过程确定用户标识A分别与各第二用户标识之间的用户相似度,基于用户标识A分别与第二用户标识之间的用户相似度为用户标识A确定推荐信息。可对用户相似度从大到小进行排序,将用户相似度大于或等于预设相似度阈值的第二用户标识以及对应的用户相似度推荐各用户标识A。如图7所示,为用户标识A所在终端的推荐界面图。其中,图7中的用户标识1、用户标识2、用户标识3和用户标识4为第二用户标识中推荐给用户标识A的用户标识。用户标识A和用户标识1的用户相似度为314,用户标识A和用户标识2的用户相似度为127,用户标识A和用户标识3的用户相似度为66,用户标识A和用户标识4的用户相似度为27。且还向用户标识A推荐了用户标识1、用户标识2、用户标识3和用户标识4分别与用户标识A的共同兴趣。例如,用户标识1和用户标识A之间有17个共同兴趣,用户标识2和用户标识A都喜欢《命运石之门》,用户标识3和用户标识A都喜欢音乐Aahes in the Snow,用户标识4和用户标识A都喜欢《命运石之门》。用户可根据界面上显示的内容,进行好友添加。
另外,针对第二用户标识中与第一用户标识关联的用户标识,也可将与第一用户标识对应的用户相似度、与第一用户标识关联的用户标识以及两者之间的共同兴趣推荐给第一用户标识。如图8所示,在第一用户标识(用户标识A)对应的终端界面上,可显示推荐的与其为好友关联的用户标识5以及对应的用户相似度(为66),用户标识5与用户标识A之间共同兴趣有:电影《美丽人生》,后摇音乐《Moonlight》,动漫《钢之炼金术师》。如此,用户可了解与其关联的用户标识对应的共同兴趣,以提高用户之间的活跃度。
图9示出了一个实施例中的用户相似度确定装置,包括:
兴趣画像获取模块910,用于获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像;第一用户兴趣画像、第二用户兴趣画像基于各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识确定,各用户标识包括第一用户标识和第二用户标识;
共有数据获取模块920,用于获取第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息;
用户相似度确定模块930,用于根据第一用户兴趣画像、第二用户兴趣画像以及共有业务数据信息,确定第一用户标识与第二用户标识之间的用户相似度。
在一个实施例中,上述装置,还包括:
业务数据获取模块,用于获取各业务标识的业务数据,业务数据包括各用户标识以及关联的业务数据信息;
数据信息确定模块,用于基于业务标识与兴趣类型标识的对应关系,确定各用户标识对应的各兴趣类型标识的业务数据信息;
兴趣画像确定模块,用于根据各用户标识对应的各兴趣类型标识的业务数据信息,确定各用户标识的用户兴趣画像。
在一个实施例中,兴趣画像确定模块,包括:
参数值确定模块,用于根据用户标识的各兴趣类型标识的业务数据信息,确定用户标识的各兴趣类型标识的兴趣点参数值;
占比确定模块,用于确定该用户标识的各兴趣类型标识的兴趣点参数值占比;
用户兴趣画像确定模块,用于基于该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
在一个实施例中,各兴趣类型标识的业务数据信息,为各兴趣类型标识对应的使用时长。
在一个实施例中,用户兴趣画像确定模块,包括:
占比更新模块,用于根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比;
用户兴趣画像更新模块,用于基于更新后的该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
在一个实施例中,占比更新模块,根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比,包括下述各项中的至少一项:
在该用户标识的任意一个兴趣类型标识的业务数据信息的最近业务时间与当前时间的时间差大于第一预设时长时,降低该兴趣类型标识的兴趣点参数值占比;
在该用户标识的任意一个兴趣类型标识的业务数据信息的最早业务时间与当前时间的时间差小于或等于第二预设时长时,增大该兴趣类型标识的兴趣点参数值占比。
在一个实施例中,用户相似度确定模块,包括:
第一相似度获取模块,用于基于第一用户兴趣画像以及共有业务数据信息,确定第一用户标识相对于第二用户标识的第一相似度;
第二相似度获取模块,用于基于第二用户兴趣画像以及共有业务数据信息,确定第二用户标识相对于第一用户标识的第二相似度;
用户相似度获取模块,用于根据第一相似度和第二相似度,确定第一用户标识与第二用户标识之间的用户相似度。
在一个实施例中,上述装置还包括:向量化模块,用于将第一用户兴趣画像表示为第一用户画像向量,将第二用户兴趣画像表示为第二用户画像向量,将共有业务数据信息表示为共用向量;
第一相似度为第一用户画像向量的转置矩阵与共用向量的乘积;
第二相似度为第二用户画像向量的转置矩阵与共用向量的乘积。
在一个实施例中,用户相似度获取模块,用于基于第一相似度的第一加权系数以及第二相似度的第二加权系数,对第一相似度和第二相似度进行加权求和,获得第一用户标识与第二用户标识之间的用户相似度。
在一个实施例中,在第一用户标识为目标推荐用户标识、第二用户标识为待推荐用户标识时,第一加权系数大于第二加权系数。
在一个实施例中,各业务标识的业务数据,为业务时间在预设最近时间范围内的各业务标识的业务数据。
关于用户相似度确定装置的具体限定可以参见上文中对于用户相似度确定方法的限定,在此不再赘述。上述用户相似度确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,如图10所示,提供一种信息推荐装置,包括:
相似度获取模块110,用于获取第一用户标识与第二用户标识之间的用户相似度;其中,第一用户标识与第二用户标识之间的用户相似度,基于第一用户标识对应的第一用户兴趣画像、第二用户标识对应的第二用户兴趣画像以及第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息确定。
推荐信息确定模块120,用于基于第一用户标识与第二用户标识之间的用户相似度,确定第一用户标识对应的推荐信息。
推送模块130,用于向第一用户标识推送推荐信息。
在一个实施例中,推荐信息包括与第一用户标识之间的用户相似度满足预设相似度条件的第二用户标识,以及该第二用户标识与第一用户标识之间的用户相似度。
在一个实施例中,预设相似度条件包括:用户相似度大于或者等于预设相似度阈值。
在一个实施例中,用户相似度属于预设数目个最大的用户相似度。
在一个实施例中,上述信息推荐装置,还包括:
排序模块,用于根据预设排序规则,对第一用户标识与第二用户标识之间的用户相似度进行排序。
关于信息推荐装置的具体限定可以参见上文中对于信息推荐方法的限定,在此不再赘述。上述信息推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述用户相似度确定方法和上述信息推荐方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (26)

1.一种用户相似度确定方法,其特征在于,包括步骤:
获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像;所述第一用户兴趣画像、所述第二用户兴趣画像基于各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识确定,各所述用户标识包括所述第一用户标识和所述第二用户标识;
获取第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息;
基于所述第一用户兴趣画像以及所述共有业务数据信息,确定所述第一用户标识相对于所述第二用户标识的第一相似度;
基于所述第二用户兴趣画像以及所述共有业务数据信息,确定所述第二用户标识相对于所述第一用户标识的第二相似度;
基于所述第一相似度的第一加权系数以及所述第二相似度的第二加权系数,对所述第一相似度和所述第二相似度进行加权求和,获得所述第一用户标识与所述第二用户标识之间的用户相似度。
2.根据权利要求1所述的方法,其特征在于,在获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像之前,还包括步骤:
获取各业务标识的业务数据,业务数据包括各用户标识以及关联的业务数据信息;
基于业务标识与兴趣类型标识的对应关系,确定各用户标识对应的各兴趣类型标识的业务数据信息;
根据各用户标识对应的各兴趣类型标识的业务数据信息,确定各用户标识的用户兴趣画像。
3.根据权利要求2所述的方法,其特征在于,根据各用户标识对应的各兴趣类型标识的业务数据信息,确定各用户标识的用户兴趣画像,包括:
根据用户标识的各兴趣类型标识的业务数据信息,确定用户标识的各兴趣类型标识的兴趣点参数值;
确定该用户标识的各兴趣类型标识的兴趣点参数值占比;
基于该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
4.根据权利要求3所述的方法,其特征在于,所述各兴趣类型标识的业务数据信息,为各兴趣类型标识对应的使用时长。
5.根据权利要求3所述的方法,其特征在于,基于该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像,包括:
根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比;
基于更新后的该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
6.根据权利要求5所述的方法,其特征在于,根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比,包括下述各项中的至少一项:
在该用户标识的任意一个兴趣类型标识的业务数据信息的最近业务时间与当前时间的时间差大于第一预设时长时,降低该兴趣类型标识的兴趣点参数值占比;
在该用户标识的任意一个兴趣类型标识的业务数据信息的最早业务时间与当前时间的时间差小于或等于第二预设时长时,增大该兴趣类型标识的兴趣点参数值占比。
7.根据权利要求1所述的方法,其特征在于:
还包括步骤:将所述第一用户兴趣画像表示为第一用户画像向量,将所述第二用户兴趣画像表示为第二用户画像向量,将所述共有业务数据信息表示为共用向量;
所述第一相似度为所述第一用户画像向量的转置矩阵与所述共用向量的乘积;
所述第二相似度为所述第二用户画像向量的转置矩阵与所述共用向量的乘积。
8.根据权利要求1所述的方法,其特征在于,在所述第一用户标识为目标推荐用户标识、所述第二用户标识为待推荐用户标识时,所述第一加权系数大于所述第二加权系数。
9.一种信息推荐方法,其特征在于,包括以下步骤:
基于第一用户标识对应的第一用户兴趣画像以及所述第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息,确定所述第一用户标识相对于所述第二用户标识的第一相似度;
基于所述第二用户标识对应的第二用户兴趣画像以及所述共有业务数据信息,确定所述第二用户标识相对于所述第一用户标识的第二相似度;
基于所述第一相似度的第一加权系数以及所述第二相似度的第二加权系数,对所述第一相似度和所述第二相似度进行加权求和,获得所述第一用户标识与所述第二用户标识之间的用户相似度;
基于所述第一用户标识与所述第二用户标识之间的用户相似度,确定所述第一用户标识对应的推荐信息;
向所述第一用户标识推送所述推荐信息。
10.根据权利要求9所述的方法,其特征在于,所述推荐信息包括与所述第一用户标识之间的用户相似度满足预设相似度条件的第二用户标识,以及该第二用户标识与所述第一用户标识之间的用户相似度。
11.根据权利要求10所述的方法,其特征在于,所述预设相似度条件包括:用户相似度大于或者等于预设相似度阈值。
12.根据权利要求9所述的方法,其特征在于,所述向所述第一用户标识推送所述推荐信息之前,还包括步骤:
根据预设排序规则,对第一用户标识与第二用户标识之间的用户相似度进行排序。
13.一种用户相似度确定装置,其特征在于,所述用户相似度确定装置包括:
兴趣画像获取模块,用于获取第一用户标识的第一用户兴趣画像、以及第二用户标识的第二用户兴趣画像;所述第一用户兴趣画像、所述第二用户兴趣画像基于各用户标识关联的各业务标识的业务数据、以及各业务标识对应的兴趣类型标识确定,各所述用户标识包括所述第一用户标识和所述第二用户标识;
共有数据获取模块,用于获取第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息;
用户相似度确定模块,用于基于所述第一用户兴趣画像以及所述共有业务数据信息,确定所述第一用户标识相对于所述第二用户标识的第一相似度,基于所述第二用户兴趣画像以及所述共有业务数据信息,确定所述第二用户标识相对于所述第一用户标识的第二相似度,基于所述第一相似度的第一加权系数以及所述第二相似度的第二加权系数,对所述第一相似度和所述第二相似度进行加权求和,获得所述第一用户标识与所述第二用户标识之间的用户相似度。
14.根据权利要求13所述的用户相似度确定装置,其特征在于,所述用户相似度确定装置还包括:
业务数据获取模块,用于获取各业务标识的业务数据,业务数据包括各用户标识以及关联的业务数据信息;
数据信息确定模块,用于基于业务标识与兴趣类型标识的对应关系,确定各用户标识对应的各兴趣类型标识的业务数据信息;
兴趣画像确定模块,用于根据各用户标识对应的各兴趣类型标识的业务数据信息,确定各用户标识的用户兴趣画像。
15.根据权利要求14所述的用户相似度确定装置,其特征在于,所述兴趣画像确定模块,包括:
参数值确定模块,用于根据用户标识的各兴趣类型标识的业务数据信息,确定用户标识的各兴趣类型标识的兴趣点参数值;
占比确定模块,用于确定该用户标识的各兴趣类型标识的兴趣点参数值占比;
用户兴趣画像确定模块,用于基于该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
16.根据权利要求15所述的用户相似度确定装置,其特征在于,各兴趣类型标识的业务数据信息,为各兴趣类型标识对应的使用时长。
17.根据权利要求15所述的用户相似度确定装置,其特征在于,所述用户兴趣画像确定模块,包括:
占比更新模块,用于根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比;
用户兴趣画像更新模块,用于基于更新后的该用户标识的各兴趣类型标识的兴趣点参数值占比,确定该用户标识的用户兴趣画像。
18.根据权利要求17所述的用户相似度确定装置,其特征在于,占比更新模块,根据该用户标识的各兴趣类型标识的业务数据信息的业务时间,更新该用户标识的各兴趣类型标识的兴趣点参数值占比,包括下述各项中的至少一项:
在该用户标识的任意一个兴趣类型标识的业务数据信息的最近业务时间与当前时间的时间差大于第一预设时长时,降低该兴趣类型标识的兴趣点参数值占比;
在该用户标识的任意一个兴趣类型标识的业务数据信息的最早业务时间与当前时间的时间差小于或等于第二预设时长时,增大该兴趣类型标识的兴趣点参数值占比。
19.根据权利要求13所述的用户相似度确定装置,其特征在于,所述用户相似度确定装置还包括:
向量化模块,用于将第一用户兴趣画像表示为第一用户画像向量,将第二用户兴趣画像表示为第二用户画像向量,将共有业务数据信息表示为共用向量;
第一相似度为第一用户画像向量的转置矩阵与共用向量的乘积;
第二相似度为第二用户画像向量的转置矩阵与共用向量的乘积。
20.根据权利要求13所述的用户相似度确定装置,其特征在于,在第一用户标识为目标推荐用户标识、第二用户标识为待推荐用户标识时,第一加权系数大于第二加权系数。
21.一种信息推荐装置,其特征在于,所述信息推荐装置包括:
相似度获取模块,用于基于第一用户标识对应的第一用户兴趣画像以及所述第一用户标识与第二用户标识之间在各兴趣类型标识下的共有业务数据信息,确定所述第一用户标识相对于所述第二用户标识的第一相似度,基于所述第二用户标识对应的第二用户兴趣画像以及所述共有业务数据信息,确定所述第二用户标识相对于所述第一用户标识的第二相似度,基于所述第一相似度的第一加权系数以及所述第二相似度的第二加权系数,对所述第一相似度和所述第二相似度进行加权求和,获得所述第一用户标识与所述第二用户标识之间的用户相似度;
推荐信息确定模块,用于基于所述第一用户标识与所述第二用户标识之间的用户相似度,确定所述第一用户标识对应的推荐信息;
推送模块,用于向所述第一用户标识推送所述推荐信息。
22.根据权利要求21所述的信息推荐装置,其特征在于,所述推荐信息包括与所述第一用户标识之间的用户相似度满足预设相似度条件的第二用户标识,以及该第二用户标识与所述第一用户标识之间的用户相似度。
23.根据权利要求22所述的信息推荐装置,其特征在于,所述预设相似度条件包括:用户相似度大于或者等于预设相似度阈值。
24.根据权利要求21所述的信息推荐装置,其特征在于,所述信息推荐装置还包括:
排序模块,用于根据预设排序规则,对第一用户标识与第二用户标识之间的用户相似度进行排序。
25.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述方法的步骤。
26.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
CN201810439395.3A 2018-05-09 2018-05-09 用户相似度确定方法以及信息推荐方法 Active CN110223186B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810439395.3A CN110223186B (zh) 2018-05-09 2018-05-09 用户相似度确定方法以及信息推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810439395.3A CN110223186B (zh) 2018-05-09 2018-05-09 用户相似度确定方法以及信息推荐方法

Publications (2)

Publication Number Publication Date
CN110223186A CN110223186A (zh) 2019-09-10
CN110223186B true CN110223186B (zh) 2023-06-13

Family

ID=67822144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810439395.3A Active CN110223186B (zh) 2018-05-09 2018-05-09 用户相似度确定方法以及信息推荐方法

Country Status (1)

Country Link
CN (1) CN110223186B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111768260A (zh) * 2019-09-11 2020-10-13 北京京东尚科信息技术有限公司 推荐同兴趣用户的方法、装置及设备
CN111026957B (zh) * 2019-11-21 2023-05-05 北京网聘咨询有限公司 基于多维相似度的推荐系统及其方法
CN111026975A (zh) * 2019-12-12 2020-04-17 深圳向量之美科技有限公司 基于视觉信息识别的信息检索方法及装置
CN112309390A (zh) * 2020-03-05 2021-02-02 北京字节跳动网络技术有限公司 信息交互方法和装置
CN115023697A (zh) * 2020-04-08 2022-09-06 深圳市欢太科技有限公司 数据查询方法、装置及服务器
CN112464106B (zh) * 2020-11-26 2022-12-13 上海哔哩哔哩科技有限公司 对象推荐方法及装置
CN112632405B (zh) * 2020-12-31 2024-05-10 数字广东网络建设有限公司 一种推荐方法、装置、设备及存储介质
CN113672703A (zh) * 2021-08-26 2021-11-19 国家电网有限公司大数据中心 一种用户信息的更新方法、装置、设备及存储介质
CN115186664B (zh) * 2022-09-13 2023-01-13 深圳市爱聊科技有限公司 基于多维度的主体间相合度测算方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置
CN106227786A (zh) * 2016-07-19 2016-12-14 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN106484764A (zh) * 2016-08-30 2017-03-08 江苏名通信息科技有限公司 基于人群画像技术的用户相似度计算方法
US20170169341A1 (en) * 2015-12-14 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method for intelligent recommendation
CN107038213A (zh) * 2017-02-28 2017-08-11 华为技术有限公司 一种视频推荐的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169341A1 (en) * 2015-12-14 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method for intelligent recommendation
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置
CN106227786A (zh) * 2016-07-19 2016-12-14 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN106484764A (zh) * 2016-08-30 2017-03-08 江苏名通信息科技有限公司 基于人群画像技术的用户相似度计算方法
CN107038213A (zh) * 2017-02-28 2017-08-11 华为技术有限公司 一种视频推荐的方法及装置

Also Published As

Publication number Publication date
CN110223186A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
CN110223186B (zh) 用户相似度确定方法以及信息推荐方法
US8572169B2 (en) System, apparatus and method for discovery of music within a social network
US10162891B2 (en) Determining demographics based on user interaction
TW202007178A (zh) 用戶特徵的生成方法、裝置、設備及儲存介質
US9710555B2 (en) User profile stitching
US8027931B2 (en) Automated friend finder
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
WO2018192496A1 (zh) 热度信息的生成方法和装置、存储介质以及电子装置
CN109872242B (zh) 信息推送方法和装置
US20080270038A1 (en) System, apparatus and method for determining compatibility between members of a social network
CN110008397B (zh) 一种推荐模型训练方法及装置
CN109688479B (zh) 一种弹幕显示方法、弹幕显示装置和弹幕显示服务器
CN110413867B (zh) 用于内容推荐的方法及系统
JP2019514084A (ja) ビデオ検索に対する視聴時間クラスタリング
KR20130100915A (ko) 소셜 네트워킹 엔진의 사용자들에게 콘텐츠를 다이렉팅하는 시스템 및 방법
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN111858969B (zh) 多媒体数据推荐方法、装置、计算机设备和存储介质
CN112685676B (zh) 一种信息推荐方法、装置和电子设备
WO2022007626A1 (zh) 视频内容推荐方法、装置及计算机设备
CN112507218A (zh) 业务对象推荐方法、装置、电子设备及存储介质
CN113873330A (zh) 视频推荐方法、装置、计算机设备和存储介质
US20150278907A1 (en) User Inactivity Aware Recommendation System
CN111125507A (zh) 一种群组活动推荐方法、装置、服务器及计算机存储介质
CN116680480A (zh) 产品推荐方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant