CN114756758B - 一种混合推荐方法和系统 - Google Patents
一种混合推荐方法和系统 Download PDFInfo
- Publication number
- CN114756758B CN114756758B CN202210467104.8A CN202210467104A CN114756758B CN 114756758 B CN114756758 B CN 114756758B CN 202210467104 A CN202210467104 A CN 202210467104A CN 114756758 B CN114756758 B CN 114756758B
- Authority
- CN
- China
- Prior art keywords
- historical
- user
- candidate
- group
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供一种混合推荐方法,该方法包括获取目标用户的目标用户特征以及目标用户所属的目标群;基于目标用户特征和目标群,与参考群对应的参考推荐方案进行匹配,从参考推荐方案中确定候选推荐方案,其中,参考推荐方案包括参考用户特征和参考内容之间的对应关系以及对应关系的置信度,参考推荐方案基于参考群中的多个历史第一用户的历史用户特征和历史行为特征确定;基于候选推荐方案,确定目标推荐内容。
Description
技术领域
本说明书涉及信息推荐技术领域,特别涉及一种混合推荐方法和系统。
背景技术
推荐系统通过收集和分析用户信息来学习用户的兴趣和行为,从而实现向用户进行内容推荐的目的。在这一过程中,通常会围绕用户的偏好进行建模,更多的是引导用户在其感兴趣的场景内发现更多内容,对用户实际需求考虑较少,往往会向用户推荐较多的同质化内容,使得推荐的内容对用户的价值十分有限。
因此,希望提供一种推荐方法能够向用户提供其感兴趣且有价值的内容。
发明内容
本说明书实施例之一提供一种混合推荐方法。该方法包括:获取目标用户的目标用户特征以及目标用户所属的目标群;基于目标用户特征和目标群,与参考群对应的参考推荐方案进行匹配,从参考推荐方案中确定候选推荐方案,其中,参考推荐方案包括参考用户特征和参考内容之间的对应关系以及对应关系的置信度,参考推荐方案基于参考群中的多个历史第一用户的历史用户特征和历史行为特征确定;基于候选推荐方案,确定目标推荐内容。
本说明书实施例之一提供一种混合推荐系统。该系统包括:获取模块,用于获取目标用户的目标用户特征以及目标用户所属的目标群;确定模块,用于基于目标用户特征和目标群,与参考群对应的参考推荐方案进行匹配,从参考推荐方案中确定候选推荐方案,其中,参考推荐方案包括参考用户特征和参考内容之间的对应关系以及对应关系的置信度,参考推荐方案基于参考群中的多个历史第一用户的历史用户特征和历史行为特征确定;推荐模块,用于基于候选推荐方案,确定目标推荐内容。
本说明书实施例之一提供一种混合推荐装置,包括处理器,所述处理器用于执行上述混合推荐方法。
本说明书实施例之一提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行上述混合推荐方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的混合推荐系统的应用场景示意图;
图2是根据本说明书一些实施例所示的混合推荐方法的示例性流程图;
图3是根据本说明书一些实施例所示的确定参考群的方法的示例性流程图;
图4是根据本说明书一些实施例所示的确定参考推荐方案的方法的示例性流程图;
图5是根据本说明书一些实施例所示的混合推荐系统的示例性模块图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是根据本说明书一些实施例所示的混合推荐系统的应用场景示意图。如图1所示,应用场景100至少可以包括服务器110、处理设备112、网络120、终端设备130以及存储设备140。
本说明书一些实施例中所涉及的混合推荐系统可以用于内容推荐的多种场景。例如,混合推荐系统可以基于金融类应用的用户的行为特征信息,自动推荐用户感兴趣的内容(如资讯、文章、金融产品等)。又例如,混合推荐系统还可以基于购物类应用的用户特征信息,自动推荐商品。
应当理解的是,本说明书中一些实施例,以金融类内容推荐为例说明混合推荐系统所执行的混合推荐方法,实际上了解该方法的原理后,还可以将该方法应用于其他推荐场景。
在一些实施例中,服务器110可以用于处理与内容推荐相关的信息和/或数据。在一些实施例中,服务器110可以是单个服务器或服务器组。服务器组可以是经由接入点连接到网络120的集中式服务器组,或者经由一个或一个以上的接入点分别连接到网络120的分布式服务器组。在一些实施例中,服务器110可以本地连接到网络120或者与网络120远程连接。例如,服务器110可以经由网络120访问存储在终端设备130和/或存储设备140中的信息和/或数据(例如,文本、图片或音乐)。又例如,存储设备140可以用作服务器110的后端存储器。在一些实施例中,服务器110可以在云平台上实现。仅作为示例,云平台可以包括私有云、公共云、混合云、社区云、分布式云、中间云、多重云等,或其任意组合。
在一些实施例中,服务器110可以包括处理设备112。处理设备112可以处理与执行本说申请中描述的一个或一个以上的功能有关的信息和/或数据。例如,处理设备112可以从终端设备130和/或存储设备140中确定目标用户的目标用户特征,以及目标用户所属的目标群。又例如,处理设备112可以基于目标用户特征和目标群,与参考群对应的参考推荐方案进行匹配,从参考推荐方案中确定候选推荐方案。再例如,处理设备112可以基于候选推荐方案,确定目标推荐内容。在一些实施例中,处理设备112可以包括一个或一个以上的处理单元(例如,单核处理引擎或多核处理引擎)。
在一些实施例中,处理设备112还可以作为应用场景100中的一个独立组成部分。仅作为示例,处理设备112可以包括中央处理单元(CPU)、专用集成电路(ASIC)、专用指令集处理器(ASIP)、图形处理单元(GPU)、物理处理单元(PPU)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等,或其任意组合。
网络120可以促进信息和/或数据的交换。在一些实施例中,应用场景100中的一个或一个以上的组成部分(例如,服务器110、终端设备130、存储设备140)可以通过网络120向混合推荐系统中的其他组成部分发送信息和/或数据。例如,服务器110可以经由网络120从存储设备140访问和/或获得目标用户的目标用户特征、历史用户的历史用户特征等。在一些实施例中,网络120可以是任何类型的有线或无线网络或其组合。在一些实施例中,网络120可以包括一个或一个以上的网络接入点。例如,网络120可以包括有线或无线网络接入点,例如基站和/或互联网交换点120-1、120-2等。应用场景100的一个或一个以上的组成部分可以通过网络接入点连接到网络120以交换数据和/或信息。
终端设备130可以使用户与混合推荐系统进行用户交互。例如,用户可以通过终端设备130发送推荐请求。服务器110可以基于该推荐请求通过本说明书实施例所示的混合推荐方法确定目标推荐内容,并将目标推荐内容在终端设备130上展示给用户。在一些实施例中,终端设备130可以包括移动设备130-1、平板电脑130-2、膝上型计算机130-3、台式机130-4等或其任意组合。例如,移动设备可以包括移动电话、个人数字助理(PDA)等或其任意组合。在一些实施例中,终端设备130可以包括输入设备、输出设备等。输入设备可以包括字母数字和其他键。输入设备可以选用键盘输入、触摸屏(例如,具有触觉或触觉反馈)输入、语音输入或任何其他类似的输入机制。通过输入设备接收的输入信息可以通过如总线传输到处理设备112,以进行进一步处理。其他类型的输入设备可以包括光标控制装置,例如鼠标、轨迹球或光标方向键等。输出设备可以包括显示器、扬声器等或其任意组合。在一些实施例中,终端设备130可以是处理设备112的一部分。
存储设备140可以存储数据和/或指令。在一些实施例中,存储设备140可以存储服务器110可以执行的数据和/或指令,以提供本说明书一些实施例中描述的方法或步骤。在一些实施例中,存储设备140可以存储与目标用户和历史用户相关的信息(例如,用户特征等)。在一些实施例中,存储设备140可以存储用户点击或浏览内容的行为信息。在一些实施例中,应用场景100中的一个或一个以上的组成部分可以经由网络120访问存储在存储设备140中的数据或指令。在一些实施例中,存储设备140可以作为后端存储器直接连接到服务器110。
在一些实施例中,存储设备140可以包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等,或其任意组合。示例性大容量存储器可以包括磁盘、光盘、固态驱动器等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性易失性读写存储器可以包括随机存取存储器(RAM)。在一些实施例中,存储设备140可以在云平台上实现。在一些实施例中,存储设备140可以是处理设备112的一部分。
图2是根据本说明书一些实施例所示的混合推荐方法的示例性流程图。如图2所示,流程200包括下述步骤。在一些实施例中,流程200可以由处理设备112执行。
步骤210,获取目标用户特征以及目标用户所属的目标群。
目标用户通常可以包括混合推荐系统进行推荐的对象。目标用户特征可以包括该推荐对象的基本信息特征,如性别、职业、年龄、学历等;还可以包括用户的投资信息特征,如投资目标、风险承受、止损偏好等。
在一些实施例中,获取目标用户特征的方式可以有多种。例如,获取模块510可以从系统内部或外部的存储设备中获取目标用户特征;又例如,可以通过用户输入获取目标用户特征等。在一些情况下,获取模块510还可以通过其他方式获取目标用户特征,具体可结合实际需求确定。
目标群通常可以指具有相同或相似用户特征的推荐对象用户群体。
在一些实施例中,可以根据目标用户特征通过预设规则对用户进行分群。例如,可以按照用户的年龄段、性别等,将用户分成不同的目标群,如,按照年龄可以见目标用户分为按照年龄分成20岁以下、20~30岁、30~40岁、40~50岁、50~60岁和60岁以上用户群,按照性别分成男性和女性用户群等,按照投资风险承受能力可以将目标用户分为低风险、中风险、高风险等。同一用户可以属于至少一个目标群。例如,目标用户A可以属于20~30岁目标群、男性目标群或中风险目标群。
步骤220,基于目标用户特征和目标群,与参考群对应的参考推荐方案进行匹配,从参考推荐方案中确定候选推荐方案。其中,参考推荐方案包括参考用户特征和参考内容之间的对应关系以及对应关系的置信度,参考推荐方案基于参考群中的多个历史第一用户的历史用户特征和历史行为特征确定。
参考群通常指在相同和相似的用户特征下,历史第一用户和历史第二用户行为特征具有较大差异的历史用户群体。在一些实施例中,可以通过参考群中历史第一用户的历史用户特征与历史行为特征确定参考推荐方案。
有关确定参考推荐方案的详细内容可参见图3及其相关描述。有关确定参考群的详细内容可参见图4及其相关描述。
在一些实施例中,可以根据目标用户的目标用户特征以及目标用户所在目标群的特征,从与参考群对应的参考推荐方案中确定候选推荐方案。例如,可以根据目标群的特征确定与目标群特征相匹配的候选参考群,根据目标用户特征,从候选参考群中筛选与目标用户特征匹配的历史用户特征,根据该历史用户特征确定与之对应的至少一个参考推荐方案,并将与该历史用户特征对应的至少一个参考推荐方案作为候选推荐方案。
步骤230,基于候选推荐方案,确定目标推荐内容。
目标推荐内容可以包括推送给用户的内容,例如,文章、资讯、商品信息等。
在一些实施例中,可以基于候选推荐方案中的置信度对初始推荐分数进行修正,确定目标推荐分数,基于目标推荐分数确定目标推荐方案,并将目标推荐方案中的内容作为目标推荐内容。其中,初始推荐分数指按照现有召回逻辑,推荐用户感兴趣的内容时确定的物品推荐分数,初始推荐分数可以用来表示根据用户喜好进行推荐时,用户点击或浏览相应内容的可能性。
在一些实施例中,基于候选推荐方案中的置信度对初始推荐分数进行修正确定目标推荐分数可以包括,根据初始推荐分数和候选推荐方案中的置信度进行加权计算。例如,可以使目标推荐分数=a*推荐方案中的置信度+b*初始推荐分数,其中,a、b为权重,该权重可以根据实际需求进行设置。关于确定候选推荐方案置信度的详细内容可参见图3及其相关描述。
本说明书一些实施例中,将现有召回逻辑与基于参考推荐方案进行推荐结合,在为目标用户推荐内容时,综合考虑了用户是否感兴趣以及推荐内容对用户是否有价值两方面的因素,实现了向用户推荐其感兴趣且有用的内容,优化了推荐的逻辑,从而达到更好的推荐效果。
图3是根据本说明书一些实施例所示的确定参考推荐方案的方法的示例性流程图。如图3所示,流程300可以包括下述步骤。在一些实施例中,流程300可以由处理设备112执行。
步骤310,基于参考群中多个历史第一用户的历史用户特征和历史行为特征,确定参考群中历史用户特征与历史内容之间的历史对应关系。
在一些实施例中,根据多个历史第一用户的历史行为特征,可以确定每一个历史第一用户感兴趣的历史内容,例如,根据历史第一用户点击或浏览过的内容确定历史第一用户感兴趣的历史内容。其中历史第一用户感兴趣的历史内容可以包括用户浏览过的文章、资讯、视频、商品等内容。
在一些实施例中,基于多个历史第一用户的历史行为特征确定用户感兴趣的历史内容后,可以结合历史第一用户的历史行为特征确定上述历史内容和历史第一用户的历史用户特征之间的多个历史对应关系。
步骤320,基于参考群中历史用户特征与历史内容之间的历史对应关系,确定参考群对应的参考推荐方案。
在一些实施例中,确定模块520可以基于参考群中的历史对应关系确定参考群中至少一个候选对应关系及其置信度,其中,每个候选对应关系为候选参考用户特征与候选参考内容之间的关系。
在一些实施例中,确定模块520可以基于参考群中的历史对应关系确定至少一个候选对应关系,基于参考群中的历史用户特征,确定候选对应关系中候选参考用户特征出现的次数,基于每个候选对应关系出现的次数确定每个候选对应关系的置信度。
在一些实施例中,当历史对应关系出现的次数满足第一预设条件时,确定模块530可以将该历史对应关系作为一个候选对应关系,基于此,可以从参考群中的对应关系中确定至少一个候选对应关系。在一些实施例中,一个候选对应关系可以包括候选参考用户特征和候选参考内容。
在一些实施例中,第一预设条件可以是确定对应关系Lfr为频繁项集。其中,频繁项集指出现次数大于阈值的集合。
在一些实施例中,判断频繁项集时的阈值可以根据实际情况人为设定,也可以根据参考群的分群得分进行设置。参考群得分越高,其阈值设置可以相对更低一些,从而能够使参考群中历史第一用户和历史第二用户行为差异区分度更明显时,获得相对更多的参考方案。
在一些实施例中,可以通过增加LabelMark字段用于区分历史用户特征和历史内容特征,LabelMark为F时为用户特征,LabelMark为R时为内容特征,如“Lf=T1(F),T2(F),T3(F)”可以表示一个包含T1(F)、T2(F)、T3(F)三个用户特征的用户特征集合,又如“Lr=T4(R)”可以表示一个包含T4(R)一个内容特征的内容特征集合。
在一些实施例中,可以通过包含历史用户特征和历史内容特征的特征集合建立FPlist,用来表示历史用户特征与历史内容之间的历史对应关系,其中,FPlist中的每一条数据都代表一个用户的真实点击行为,或是一个真实的行为数据。例如,“Lfr=T1(F),T2(F),T3(F),T4(R)”可以表示一个历史用户特征为T1(F)、T2(F)、T3(F)的用户,点击过内容特征为T4(R)内容。
在一些实施例中,可以基于FPtree算法对参考群中的历史对应关系进行处理,确定至少一个候选对应关系。例如,根据FPtree算法建立FPtree,该FPtree包括只有历史用户特征的FPlist(记为Lf),以及同时包括历史用户特征和历史内容特征的FPlist(记为Lfr),根据上述FPtree计算得到Lfr的频繁项集。
在一些实施例中,确定模块520可以基于参考群中的历史用户特征,确定候选参考用户特征出现的次数。
在一些实施例中,确定模块520可以基于每个候选对应关系出现的次数和候选参考用户特征出现的次数,确定每个候选对应关系的置信度。该置信度可以表示具有特定历史用户特征的用户点击或浏览某一类型内容的概率。
在一些实施例中,置信度还可以用于表示候选参考内容的推荐得分。
在一些实施例中,确定模块520可以判断候选参考用户特征出现的次数是否满足第二预设条件,若满足,则基于每个候选对应关系出现的次数和候选参考用户特征出现的次数,确定每个候选对应关系的置信度。例如,可以通过候选对应关系出现的次数和候选参考用户特征出现次数的比值来表示每个候选对应关系的置信度。
在一些实施例中,第二预设条件可以为确定历史用户特征Lf为频繁项集。
在一些实施例中,确定模块520可以基于FPtree算法对参考群中的历史用户特征进行处理,将满足第二预设条件的历史用户特征作为目标历史用户特征。例如,根据FPtree算法建立FPtree,该FPtree包括只有历史用户特征的FPlist(记为Lf),以及同时包括历史用户特征和历史内容特征的FPlist(记为Lfr),根据上述FPtree计算得到Lf的频繁项集,并将Lf的频繁项集对应的历史用户特征作为目标历史用户特征。
在一些实施例中,确定模块520可以判断目标历史用户特征是否包含候选参考用户特征,若是,则基于每个候选对应关系出现的次数和候选参考用户特征出现的次数,确定每个候选对应关系的置信度。
在一些实施例中,可以通过以下公式来确定每个候选对应关系的置信度:
confidence=count(Lfr的频繁项集)/count(Lf的频繁项集)
其中,“confidence”表示至少一个候选关系的置信度,“count(Lfr的频繁项集)”表示Lfr的频繁项集的数量,“count(Lf的频繁项集)”表示Lf频繁项集的数量。
在一些实施例中,确定频繁项集时还可以是其他挖掘算法,例如Apriori算法等,具体可视实际需求确定。
在一些实施例中,基于候选对应关系的置信度,以及上述至少一个候选对应关系,可以确定参考群对应的参考推荐方案。例如,当候选对应关系的置信度大于预设的最小置信度时,根据该候选对应关系及其置信度确定一个一个方案,并将其作为参考推荐方案之一,若置信度不大于预设的最小置信度时,则不保留方案,最终可以获取每个参考群对应的参考推荐方案。
在一些实施例中,确定上述预设最小置信度时,可以根据参考群的分群得分调整最小置信度。例如,分群得分越大,该参考群的最小置信度可以减小,从而保留历史第一用户和历史第二用户行为差异比较大的参考群中的方案。关于分群得分与行为差异的更多描述可参见图4步骤420及其相关描述。
在一些实施例中,参考推荐方案可以包括至少一个可供选规则的方案,每个方案中可以包括历史用户特征集合、历史内容特征集合和置信度。例如,“方案1-T1(F),T2(F),T3(F),T4(R),0.8”,表示特征为(T1,T2,T3)的用户,点击浏览特征为T4的内容的概率为0.8。
本说明书一些实施例中,通过获取历史第一用户感兴趣的历史内容,并结合置信度确定大多数历史第一用户常看的历史内容,进而确定参考推荐方案,可以将收益较高的“高手”用户的逻辑复制给收益相对较低的用户,通过这一推荐逻辑实现为用户推荐有价值的内容的目的,有助于用户根据推荐内容在一定程度上优化个人习惯,从推荐内容中获得帮助。
图4是根据本说明书一些实施例所示的确定参考群的方法的示例性流程图。如图4所示,流程400可以包括下述内容。在一些实施例中,流程400可以由处理设备112执行。
步骤410,基于多个历史用户的历史用户特征确定候选群;基于候选群中多个候选历史用户的历史行为特征,确定候选群中的历史第一用户和历史第二用户。
候选群可以包括历史数据中具有相同或相似特征的历史用户群体。
在一些实施例中,可以根据历史用户特征将具有相同或相似历史用户特征的历史用户划分为同一候选群。其中,历史用户特征可以包括历史用户的基本信息特征,如性别、职业、年龄、学历等,还可以包括历史用户的投资信息特征,如投资目标、风险承受、止损偏好等。
在一些实施例中,历史第一用户可以包括候选群中实际收益率大于预设阈值(例如,收益率前20%)的“高手”用户,历史第二用户可以包括候选群中实际收益率小于上述阈值的“新手”用户。
在一些实施例中,历史用户特征还可以包括历史第一用户和/或历史第二用户的历史行为特征,例如,用户点击、观看、购买等特征。
步骤420,基于候选群中历史第一用户的历史用户特征和历史第二用户的历史用户特征,确定候选群中历史第一用户和历史第二用户的行为差异是否满足第三预设条件,响应于满足,则将该候选群确定为参考群。
在一些实施例中,行为差异可以包括用户历史数据中包含的行为特征的差异,例如点击、购买、观看等行为的差异。
在一些情况下,同一参考群中历史第一用户和历史第二用户的行为差异要足够大时,历史第一用户所对应的历史内容才有更高的参考价值,若历史第一用户和历史第二用户行为差异很小,即二者浏览的历史内容相似,那么获取历史第一用户的历史内容给历史第二用户参考则不能为历史第二用户提供有价值的信息。因此,在一些实施例中,第三预设条件可以包括历史第一用户和历史第二用户的行为差异是否大于预设阈值,当某一候选群中历史第一用户和历史第二用户之间行为差异大于预设阈值时,可以将该候选群确定为参考群。
在一些实施例中,还可以通过假设检验的方法判断上述行为差异是否满足第三预设条件。例如,根据历史第一用户的历史用户特征和历史第二用户的历史用户特征,确定用户历史点击行为(如点击、购买、观看等),基于用户历史点击行为和历史第一用户和历史第二用户的用户特征,判断具有相同或相似特征的用户点历史点击行为的差异是否满足第三预设条件。
在一些实施例中,可以通过列联表检验的方式判断候选群中历史第一用户和历史第二用户的行为差异是否满足第三预设条件。例如,可以获取历史第一用户和历史第二用户的历史点击行为,确定用户行为历史特征,基于用户行为历史特征建立列联表,如,列联表中行表示用户行为历史特征,列表示用户特征(如历史第一用户、历史第二用户等),通过缺失值检验、连续值检验、离散值检验和解释归纳,确定历史第一用户和历史第二用户的行为差异是否满足第三预设条件。
在一些实施例中,还可以通过其他方式判断历史第一用户和历史第二用户的行为差异是否满足第三预设条件,具体可视实际情况确定。
在一些实施例中,上述第三预设条件可以包括候选群的分群得分是否大于预设阈值,若大于预设阈值,则可以将该候选群确定为参考群。
在一些实施例中,可以对每个候选群设置分群得分,分群中历史第一用户和历史第二用户的行为差异越大,该分群得分就越高。在一些实施例中,可以将历史第一用户和历史第二用户的行为差异度作为分群得分。
在一些实施例中,可以根据历史第一用户的第一历史行为特征确定第一历史行为特征向量,根据历史第二用户的第二历史行为特征确定第二历史行为特征向量,基于第一历史行为特征向量和第二历史行为特征向量之间的距离确定行为差异度。
本说明书一些实施例中,通过判断候选群中历史第一用户和历史第二用户行为差异的大小,将“高手”用户和“新手”用户行为差异区分更为明显的候选群确定为参考群,可以基于参考群中“高手”用户的历史行为特征确定其经常浏览的历史内容,从而为向“新手”用户推荐符合其特征且有价值的内容奠定基础。
应当注意的是,上述有关流程200、流程300、流程400的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对以上流程进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
图5是根据本说明书一些实施例所示的混合推荐系统的示例性模块图。如图5所示,混合推荐系统500至少可以包括获取模块510、确定模块520、推荐模块530。
在一些实施例中,获取模块510可以用于获取目标用户的目标用户特征,以及目标用户所属的目标群。
有关获取目标用户特征,以及确定目标用户所属目标群的更多内容可参见图1中的相关描述。
在一些实施例中,确定模块520可以用于基于目标用户特征和目标群,于参考群对应的参考推荐方案进行匹配,从参考推荐方案中确定候选推荐方案。其中,参考推荐方案包括参考用户特征和参考内容之间的额对应关系,以及对应关系的置信度。该参考推荐方案基于参考群中的多个历史第一用户的历史用户特征和历史行为特征确定。
在一些实施例中,确定模块520可以基于参考群中所述历史第一用户的历史用户特征和历史行为特征,确定参考群中历史用户特征与历史内容之间的历史对应关系;基于参考群中历史用户特征与历史内容之间的历史对应关系,确定参考群对应的参考推荐方案。
在一些实施例中,确定模块520可以基于参考群的中历史对应关系,确定参考群中至少一个候选对应关系及其置信度,每个候选对应关系为候选参考用户特征与候选参考内容之间的关系;基于候选对应关系的置信度,确定参考群对应的候选参考推荐方案。
在一些实施例中,确定模块520可以基于参考群中的历史对应关系,确定至少一个候选对应关系,其中,每个候选对应关系出现的次数满足第一预设条件;基于参考群中的历史用户特征,确定候选参考用户特征出现的次数;基于每个候选对应关系出现的次数和候选参考用户特征出现的次数,确定每个候选对应关系的置信度。
在一些实施例中,确定模块520可以基于FPtree算法对参考群中的历史对应关系进行处理,确定至少一个候选对应关系。
有关确定参考推荐方案的更多内容可参见图3及其相关描述。
在一些实施例中,推荐模块530可以用于基于上述候选推荐方案确定目标推荐内容。
在一些实施例中,推荐模块530可以获取候选推荐方案中候选内容的初始推荐分数;基于候选推荐方案中的置信度对初始推荐分数进行修正,确定目标推荐分数;基于目标推荐分数确定目标推荐方案,将目标推荐方案中的内容作为目标推荐内容。
有关基于候选推荐方案确定目标推荐内容的更多内容可参见图2步骤230的相关描述。
需要注意的是,以上对于混合推荐系统及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。在一些实施例中,图5中披露的获取模块、确定模块、推荐模块可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本说明书的保护范围之内。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (9)
1.一种混合推荐方法,其特征在于,包括:
获取目标用户的目标用户特征以及所述目标用户所属的目标群;
基于所述目标用户特征和所述目标群,与参考群对应的参考推荐方案进行匹配,从所述参考推荐方案中确定候选推荐方案,包括:
基于所述目标用户特征和目标群特征,从与所述参考群对应的所述参考推荐方案中确定所述候选推荐方案,具体为:
基于所述目标群特征确定与所述目标群特征相匹配的候选参考群;
根据所述目标用户特征,从所述候选参考群中筛选与所述目标用户特征相匹配的历史用户特征;
根据所述历史用户特征确定所述参考推荐方案,并将与所述历史用户特征对应的所述参考推荐方案作为所述候选推荐方案;
其中,
所述参考群是在相同和相似的历史用户特征下,历史第一用户和历史第二用户的历史行为特征满足第三预设条件的历史用户群体;
所述参考推荐方案包括参考用户特征和参考内容之间的对应关系以及所述对应关系的置信度;
所述参考推荐方案基于所述参考群中的多个历史第一用户的所述历史用户特征和所述历史行为特征确定,所述历史行为特征包括对历史内容的点击和/或浏览行为;
基于所述候选推荐方案,确定目标推荐内容;
其中,确定所述参考群,包括:
基于多个历史用户的所述历史用户特征确定候选群;
基于所述候选群中多个候选历史用户的历史行为特征,确定所述候选群中的所述历史第一用户和所述历史第二用户;
基于所述候选群中的所述历史第一用户的历史用户特征和所述历史第二用户的历史用户特征,确定所述候选群中历史第一用户和历史第二用户的用户行为差异是否满足所述第三预设条件;
响应于满足,则将所述候选群确定为参考群。
2.如权利要求1所述的混合推荐方法,其特征在于,所述参考推荐方案基于所述参考群中的多个历史第一用户的历史用户特征和历史行为特征确定,包括:
基于所述参考群中所述历史第一用户的所述历史用户特征和所述历史行为特征,确定所述参考群中所述历史用户特征与所述历史内容之间的历史对应关系;
基于所述参考群中所述历史用户特征与所述历史内容之间的所述历史对应关系,确定所述参考群对应的所述参考推荐方案。
3.如权利要求2所述的混合推荐方法,其特征在于,所述基于所述参考群中所述历史用户特征与所述历史内容之间的所述历史对应关系,确定所述参考群对应的所述参考推荐方案,包括:
基于所述参考群的中所述历史对应关系,确定所述参考群中至少一个候选对应关系及其置信度,每个候选对应关系为候选参考用户特征与候选参考内容之间的关系;
基于所述候选对应关系的所述置信度,确定所述参考群对应的所述参考推荐方案。
4.如权利要求3所述的混合推荐方法,其特征在于,所述基于所述参考群的中所述历史对应关系,确定所述参考群中至少一个候选对应关系及其置信度,包括:
基于所述参考群中的所述历史对应关系,确定所述至少一个候选对应关系,其中,每个候选对应关系出现的次数满足第一预设条件;
基于所述参考群中的所述历史用户特征,确定所述候选参考用户特征出现的次数;
基于所述每个候选对应关系出现的次数和所述候选参考用户特征出现的次数,确定每个候选对应关系的置信度。
5.如权利要求4所述的混合推荐方法,其特征在于,所述基于所述参考群中的所述历史对应关系,确定所述至少一个候选对应关系,包括:
基于FPtree算法对所述参考群中的所述历史对应关系进行处理,确定所述至少一个候选对应关系。
6.如权利要求1所述的混合推荐方法,其特征在于,所述基于所述候选推荐方案,确定目标推荐内容,包括:
获取所述候选推荐方案中候选内容的初始推荐分数;
基于所述候选推荐方案中的所述置信度对所述初始推荐分数进行修正,确定目标推荐分数;
基于所述目标推荐分数确定目标推荐方案,将所述目标推荐方案中的内容作为目标推荐内容。
7.一种混合推荐系统,其特征在于,包括:
获取模块,用于获取目标用户的目标用户特征以及所述目标用户所属的目标群;
确定模块,用于基于所述目标用户特征和所述目标群,与参考群对应的参考推荐方案进行匹配,从所述参考推荐方案中确定候选推荐方案,其中,为确定所述候选推荐方案,所述确定模块进一步用于:
基于所述目标用户特征和目标群特征,从与所述参考群对应的所述参考推荐方案中确定所述候选推荐方案,具体为:
基于所述目标群特征确定与所述目标群特征相匹配的候选参考群;
根据所述目标用户特征,从所述候选参考群中筛选与所述目标用户特征相匹配的历史用户特征;
根据所述历史用户特征确定所述参考推荐方案,并将与所述历史用户特征对应的所述参考推荐方案作为所述候选推荐方案;其中,
所述参考群是在相同和相似的历史用户特征下,历史第一用户和历史第二用户的历史行为特征满足第三预设条件的历史用户群体;
所述参考推荐方案包括参考用户特征和参考内容之间的对应关系以及所述对应关系的置信度;
所述参考推荐方案基于所述参考群中的多个历史第一用户的所述历史用户特征和所述历史行为特征确定,所述历史行为特征包括对历史内容的点击和/或浏览行为;
推荐模块,用于基于所述候选推荐方案,确定目标推荐内容;
其中,为确定所述参考群,所述确定模块进一步用于:
基于多个历史用户的所述历史用户特征确定候选群;
基于所述候选群中多个候选历史用户的历史行为特征,确定所述候选群中的所述历史第一用户和所述历史第二用户;
基于所述候选群中的所述历史第一用户的历史用户特征和所述历史第二用户的历史用户特征,确定所述候选群中历史第一用户和历史第二用户的用户行为差异是否满足所述第三预设条件;
响应于满足,则将所述候选群确定为参考群。
8.一种混合推荐装置,包括处理器,所述处理器用于执行权利要求1~6中任一项所述的混合推荐方法。
9.一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如权利要求1~6任一项所述的混合推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210467104.8A CN114756758B (zh) | 2022-04-29 | 2022-04-29 | 一种混合推荐方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210467104.8A CN114756758B (zh) | 2022-04-29 | 2022-04-29 | 一种混合推荐方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114756758A CN114756758A (zh) | 2022-07-15 |
CN114756758B true CN114756758B (zh) | 2023-04-07 |
Family
ID=82333963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210467104.8A Active CN114756758B (zh) | 2022-04-29 | 2022-04-29 | 一种混合推荐方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114756758B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974331A (zh) * | 2024-03-28 | 2024-05-03 | 探保网络科技(广州)有限公司 | 一种基于电子商务平台的保险推荐方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111973996A (zh) * | 2020-08-20 | 2020-11-24 | 腾讯科技(上海)有限公司 | 一种游戏资源投放方法和装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8214264B2 (en) * | 2005-05-02 | 2012-07-03 | Cbs Interactive, Inc. | System and method for an electronic product advisor |
US8086480B2 (en) * | 2008-09-25 | 2011-12-27 | Ebay Inc. | Methods and systems for activity-based recommendations |
CN106991609A (zh) * | 2016-01-21 | 2017-07-28 | 阿里巴巴集团控股有限公司 | 投资产品的推荐方法和装置 |
US20170357901A1 (en) * | 2016-06-12 | 2017-12-14 | The HintBox!, Inc. | Proactive data gathering and user profile generation using deep analysis for a rapid onboarding process |
CN107507016A (zh) * | 2017-06-29 | 2017-12-22 | 北京三快在线科技有限公司 | 一种消息推送方法和系统 |
CN107358530A (zh) * | 2017-08-17 | 2017-11-17 | 杭州铜板街互联网金融信息服务有限公司 | 理财产品推荐方法 |
CN113672797A (zh) * | 2020-05-13 | 2021-11-19 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法及装置 |
CN112052387B (zh) * | 2020-08-17 | 2024-03-26 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法、装置和计算机可读存储介质 |
CN112818226B (zh) * | 2021-01-28 | 2023-02-28 | 和美(深圳)信息技术股份有限公司 | 数据处理方法、推荐方法、装置、电子设备及存储介质 |
CN113052666A (zh) * | 2021-04-30 | 2021-06-29 | 中国银行股份有限公司 | 理财产品推荐方法及装置 |
CN113792220A (zh) * | 2021-08-13 | 2021-12-14 | 唯品会(广州)软件有限公司 | 一种目标对象推荐方法、装置、计算机设备及存储介质 |
-
2022
- 2022-04-29 CN CN202210467104.8A patent/CN114756758B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111973996A (zh) * | 2020-08-20 | 2020-11-24 | 腾讯科技(上海)有限公司 | 一种游戏资源投放方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114756758A (zh) | 2022-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11823218B2 (en) | Customer clustering using integer programming | |
US20120035978A1 (en) | System for and Method of Determining Relative Value of a Product | |
JP6261547B2 (ja) | 判定装置、判定方法及び判定プログラム | |
US20150066586A1 (en) | Evaluation calculating device, evaluation calculating method, and recording medium | |
CN110175895B (zh) | 一种物品推荐方法及装置 | |
CN108648058B (zh) | 产品排序方法及装置,电子设备、存储介质 | |
CN110197404B (zh) | 可降低流行度偏差的个性化长尾商品推荐方法和系统 | |
CN111709810A (zh) | 基于推荐模型的对象推荐方法及装置 | |
CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
CN104517216A (zh) | 增强推荐系统和方法 | |
CN106874503B (zh) | 获取推荐数据的方法和装置 | |
US20200098031A1 (en) | Product recommending apparatus and non-transitory computer readable medium | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN114756758B (zh) | 一种混合推荐方法和系统 | |
JP2017201535A (ja) | 判定装置、学習装置、判定方法及び判定プログラム | |
CN111161009B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN111475720A (zh) | 推荐方法、装置、服务器及存储介质 | |
CN112766995A (zh) | 物品推荐方法、装置、终端设备及存储介质 | |
US20210303649A1 (en) | Book recommendation method utilizing similarity between books | |
CN110020918A (zh) | 一种推荐信息生成方法和系统 | |
CN114780865A (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN110825967B (zh) | 一种提高推荐系统多样性的推荐列表重排名方法 | |
CN111666481B (zh) | 数据挖掘方法、装置、计算机可读介质及电子设备 | |
KR102323424B1 (ko) | 관측평점과 유사도 그래프를 활용한 추천 알고리즘의 평점 예측 방법 | |
JP6805340B2 (ja) | 情報処理システム、情報処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |