CN112995248B - 信息推送方法、装置及设备 - Google Patents

信息推送方法、装置及设备 Download PDF

Info

Publication number
CN112995248B
CN112995248B CN201911275329.8A CN201911275329A CN112995248B CN 112995248 B CN112995248 B CN 112995248B CN 201911275329 A CN201911275329 A CN 201911275329A CN 112995248 B CN112995248 B CN 112995248B
Authority
CN
China
Prior art keywords
information
diversity
matrix
candidate
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911275329.8A
Other languages
English (en)
Other versions
CN112995248A (zh
Inventor
杨贵军
王杰雄
梁祥辉
叶锦汝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201911275329.8A priority Critical patent/CN112995248B/zh
Publication of CN112995248A publication Critical patent/CN112995248A/zh
Application granted granted Critical
Publication of CN112995248B publication Critical patent/CN112995248B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种信息推送方法、装置及设备。方法包括:获取信息推送请求;根据信息推送请求确定多个待推送的候选信息;确定与每个候选信息相对应的多样性信息;根据与每个候选信息相对应的多样性信息,在多个候选信息中确定预设数量的目标信息,并对目标信息进行推送。本实施例提供的技术方案,在获取信息推送请求、确定多个待推送的候选信息之后,通过确定与每个候选信息相对应的多样性信息,而后根据多样性信息在多个候选信息中确定预设数量的目标信息,并对目标信息进行推送,有效地实现了基于多样性信息确定待推送的目标信息,从而有效地保证了目标信息的多样性,进一步提高了信息推送的质量,保证了用户的良好体验。

Description

信息推送方法、装置及设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种信息推送方法、装置及设备。
背景技术
随着信息推送的实时响应能力的快速提升、以及个性化推荐技术的快速发展,信息推荐的精准度大幅提升,从而可以实现召回和推荐大量用户感兴趣的信息内容,短期来看,推送信息会获得下发效率上的收益,如内容点击、商品购买等。但也会带来推荐内容的同质化明显,甚至出现霸屏现象,长期来看,会出现用户兴趣窄化,推荐内容集中出现“一直推荐同样的内容”、“点什么狂推什么”的现象,这样容易使得用户产生信息“审美”疲劳,减少刷新频次甚至流失。
发明内容
本发明实施例提供了一种信息推送方法、装置及设备,能够保证推送信息的多样性,从而提高信息推送的质量,保证了用户的良好体验。
第一方面,本发明实施例提供了一种信息推送方法,包括:
获取信息推送请求;
根据所述信息推送请求确定多个待推送的候选信息;
确定与每个所述候选信息相对应的多样性信息;
根据与每个所述候选信息相对应的多样性信息,在多个所述候选信息中确定预设数量的目标信息,并对所述目标信息进行推送。
第二方面,本发明实施例提供了一种信息推送装置,包括:
获取模块,用于获取信息推送请求;
确定模块,用于根据所述信息推送请求确定多个待推送的候选信息;
所述确定模块,还用于确定与每个所述候选信息相对应的多样性信息;
推送模块,用于根据与每个所述候选信息相对应的多样性信息,在多个所述候选信息中确定预设数量的目标信息,并对所述目标信息进行推送。
第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的信息推送方法。
第四方面,本发明实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第一方面中的信息推送方法。
本实施例提供的信息推送方法、装置及设备,在获取信息推送请求、确定多个待推送的候选信息之后,通过确定与每个候选信息相对应的多样性信息,而后根据与每个候选信息相对应的多样性信息,在多个候选信息中确定预设数量的目标信息,并对目标信息进行推送,有效地实现了对候选信息的多样性进行准确、有效地评估,并且还可以基于多样性信息确定待推送的目标信息,有效地保证了推送信息的多样性,进一步提高了信息推送的质量,保证了用户的良好体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信息推送方法的流程图;
图2为本发明实施例提供的确定与每个所述候选信息相对应的多样性信息的流程图;
图3为本发明实施例提供的根据所述多样性分值和关联信息确定与每个所述候选信息相对应的多样性信息的流程图;
图4为本发明实施例提供的获取与每个所述候选信息相对应的多样性分值的流程图:
图5为本发明实施例提供的获取与每个所述候选信息相对应的标签多样性分和类目多样性分的流程图;
图6为本发明实施例提供的根据所述标签多样性矩阵确定与每个所述候选信息相对应的标签多样性分的流程图;
图7为本发明实施例提供的根据所述类目多样性矩阵确定与每个所述候选信息相对应的类目多样性分的流程图;
图8为本发明实施例提供的获取与每个所述候选信息相对应的标签多样性矩阵的流程图;
图9为本发明实施例提供的获取与每个所述候选信息相对应的类目多样性矩阵的流程图;
图10为本发明实施例提供的获取与所述用户信息相对应的用户画像矩阵的流程图;
图11为本发明实施例提供的获取与所述用户信息相对应的画像矩阵的流程图一;
图12为本发明实施例提供的获取与所述用户信息相对应的画像矩阵的流程图二;
图13为本发明实施例提供的确定与所述画像矩阵相对应的偏置矩阵的流程图一:
图14为本发明实施例提供的基于所有用户的画像信息生成偏置矩阵的流程图;
图15为本发明实施例提供的根据所有用户的画像信息,计算预设标签信息/预设类目信息对当前用户的重要程度的流程图;
图16为本发明实施例提供的确定与所述画像矩阵相对应的偏置矩阵的流程图二;
图17为本发明实施例提供的获取与所述候选信息相对应的多样性参数矩阵的流程图;
图18为本发明实施例提供的获取已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次的流程图;
图19为本发明实施例提供的根据所述标签信息/类目信息的权重信息、第一频次和第二频次确定与所述候选信息相对应的多样性参数矩阵的流程图;
图20为本发明实施例提供的获取与所述候选信息相对应的标签信息矩阵/类目信息矩阵的流程图;
图21为本发明实施例提供的另一种信息推送方法的流程图;
图22为本发明实施例提供的获取已推送的所述目标信息的信息熵的流程图;
图23为本发明实施例提供的获取与所述目标信息相对应的预设元素的实际下发比例的流程图;
图24为本发明应用实施例提供的一种信息推送方法的场景示意图;
图25为本发明应用实施例提供的一种信息推送方法的示意图;
图26为本发明实施例提供的一种信息推送装置的结构示意图;
图27为与图26所示实施例提供的信息推送装置对应的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
为了便于理解本申请的技术方案,下面对现有技术进行简要说明:
在推送信息的过程中,多样性控制是一个重要的下发策略,多样性是进行推送信息优化操作的核心指标之一,它维持着推送信息的下发效率与用户体验性之间的平衡。目前,对推送信息的多样性评估尚没有公认的指标,一般采用推荐内容的类目个数、标签tag个数、实体个数等指标进行评估。这些指标在一定程度上能衡量推送信息的多样性程度,但并不完备。
例如:假设某次推荐信息的下发条数为8条,推荐方式一:推荐信息的类目信息为ABCDABCD,其中,A、B、C、D分别代表4种不同的信息类目。推荐方式二:推荐信息的类目信息为AAAABBCD,同样的,A、B、C、D分别代表4种不同的信息类目。然而,对于上述两种推荐方式而言,单次下发信息的类目数均是4个,但推荐方式一中的内容多样性和丰富度相对于推荐方式二中的内容多样性和丰富度的效果更优。
在常见的推荐信息过程中,为了能够考虑用户在内容多样性上的体验,在推荐信息的过程中会设定人工打散策略,来保证下发内容的多样性。例如:单次推荐同一类目/同一标签tag的下发数不超过k条、相同类目的内容不连续下发、单次下发的类目数不小于m个等等策略。然而,此类策略错综复杂、逻辑生硬、迁移性较差,很难迭代优化,同时也不能很好的兼顾到推荐信息的下发效率。
此外,现有技术中还提出了另一种比较优雅的多样性控制方法,该方法主要包括以下步骤:
(1)引入内容多样性因子;具体的,通过候选信息与已选信息来计算累计距离,获得内容多样性因子,而后将多样性因子加入到排序得分中,以满足多样性目标。具体的,信息的下发过程可以基于最大边缘相关算法(Maximal Marginal Relevance,简称MMR)的排序机制,每次在候选集合中选取当前状态下排序得分最高的候选信息加入到选定集合,直至选定集合中信息数量等于下发数或者候选集合为空。
(2)采用协同过滤算法计算信息类目之间的相似度,例如:可以利用信息的叶子类目的相似度来描述信息之间的相似度,其中,类目相同的信息之间的相似度为1。而后,还可以将归一化后的信息之间的相似度的相反数确定为信息之间的距离。
(3)将内容多样性因子的计算过程加入当前待选信息与选定集合中各信息之间的累计距离,即累计距离越近,与选定集合中的信息越相关,多样性越差;反之多样性越好。
(4)对已推送的信息进行评估,评估指标可以包括:人均一级类目/叶子类目下发个数、人均一级类目/叶子类目的点击个数。
然而,该方法具有以下缺点:
(1)在内容多样性因子的计算过程中,没有考虑用户对类目的个性化偏好,也没考虑到信息与类目之间的匹配程度。
(2)选定集合只考虑了当次已选信息,没有考虑最近历史下发和点击信息的内容分布信息;在累计距离的计算中,没有考虑类目下的信息下发的位置信息。
(3)评价指标在一定程度上,能衡量推送信息的多样性,但并不完备。例如:不能有效衡量ABCDABCD与AAAABBCD之间的多样性差异,其中,A、B、C、D分别代表4种不同的信息类目。
下面结合附图,对本发明的一些实施方式作详细说明。在各实施例之间不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
图1为本发明实施例提供的一种信息推送方法的流程图;参考附图1所示,为了解决上述技术问题,本实施例提供了一种信息推送方法,该方法可以准确地评估推荐信息的多样性,具体应用时,该信息推送方法的执行主体是信息推送装置,可以理解的是,该信息推送装置可以实现为软件、或者软件和硬件的组合;具体的,该信息推送方法可以包括:
S101:获取信息推送请求。
其中,信息推送请求用于向信息推送装置请求推送信息,具体应用时,该信息推送请求可以是根据用户的执行操作生成的,例如:在信息推送装置的预设应用程序中,获取到用户输入的滑动操作,则可以根据该滑动操作生成信息推送请求。或者,该信息推送请求也可以是其他装置发送的,例如:客户端可以基于用户的执行操作生成信息推送请求,并向信息推送装置发送信息推送请求,从而使得信息推送装置可以获取到客户端发送的信息推送请求,并可以根据信息推送请求向客户端进行推送信息操作。
S102:根据信息推送请求确定多个待推送的候选信息。
在获取到信息推送请求之后,可以对信息推送请求进行分析处理,从而可以根据分析处理结果来确定多个待推送的候选信息。具体的,本实施例对于确定多个待推送的候选信息的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,例如:在信息推送请求包括关键字时,可以先识别与信息推送请求相对应的请求关键字,根据请求关键字在预设的若干个信息中确定多个待推送的候选信息。在信息推送请求不包括关键字时,根据信息推送请求和历史推送信息获取用户的偏好信息,根据偏好信息确定多个待推送的候选信息。当然的,本领域技术人员也可以采用其他的方式来确定多个待推送的候选信息,只要能够保证对多个待推送的候选信息进行确定的准确可靠性即可,在此不再赘述。
S103:确定与每个候选信息相对应的多样性信息。
其中,本实施例中的多样性信息可以包括与每个候选信息相对应的多样性属性,该多样性属性可以保证相同类型的候选信息中可以至少包括一种内容不同的敏感属性。或者,在另一种应用场景下,多样性信息还可以包括候选信息与用户信息之间的关联程度和与每个候选信息相对应的多样性属性,在多样性信息包括关联程度和多样性属性时,不仅可以保证相同类型的候选信息中可以至少包括一种内容不同的敏感属性,并且还可以保证候选信息与用户的匹配程度,从而能够保证候选信息的下发质量和下发效率。
另外,本实施例中对于确定与每个候选信息相对应的多样性信息的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,例如:在多样性信息包括与每个候选信息相对应的多样性属性时,可以通过预设的机器学习算法对候选信息进行分析识别,从而可以获得与每个候选信息相对应的多样性属性;在多样性信息包括候选信息与用户信息之间的关联程度和与每个候选信息相对应的多样性属性时,可以利用词频-逆用户频率指数算法(term frequency-inverse user frequency,简称tf-iuf)获取候选信息与用户信息之间的关联程度,而后利用机器学习算法对候选信息进行分析识别,从而可以获得与每个候选信息相对应的多样性属性。其中,tf-iuf算法与词频-逆文件指数算法(term frequency-inverse document frequency)相类似,是一种统计方法,该词频-逆用户频率指数算法用于评估一字词对于一个用户的重要程度。
可以想到的是,与每个候选信息相对应的多样性信息还可以包括其他信息和内容,本领域技术人员可以根据具体的应用场景和设计需求来配置多样性信息的具体含义,并且,本领域技术人员还可以采用其他的方式来获取多样性信息,在此不再赘述。
S104:根据与每个候选信息相对应的多样性信息,在多个候选信息中确定预设数量的目标信息,并对目标信息进行推送。
在获取到与每个候选信息相对应的多样性信息之后,可以根据与每个候选信息相对应的多样性信息,在多个候选信息中确定预设数量的目标信息,具体的,可以基于与每个候选信息相对应的多样性信息由高到低对多个候选信息进行排序,而后在排序后的多个候选信息中确定预设数量的目标信息,而后可以对所确定的目标信息进行推送,从而有效地保证了推送信息的多样性。
本实施例提供的信息推送方法,在获取信息推送请求、确定多个待推送的候选信息之后,通过确定与每个候选信息相对应的多样性信息,而后根据与每个候选信息相对应的多样性信息,在多个候选信息中确定预设数量的目标信息,并对目标信息进行推送,有效地实现了对候选信息的多样性进行准确、有效地评估,并且还可以基于多样性信息确定待推送的目标信息,有效地保证了推送信息的多样性,进一步提高了信息推送的质量,保证了用户的良好体验。
图2为本发明实施例提供的确定与每个候选信息相对应的多样性信息的流程图;在上述实施例的基础上,继续参考附图2所示,在多样性信息包括候选信息与用户信息之间的关联程度和与每个候选信息相对应的多样性属性时,本实施例对于确定与每个候选信息相对应的多样性信息的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,在信息推送请求包括用户信息时,本实施例中的确定与每个候选信息相对应的多样性信息可以包括:
S201:获取与每个候选信息相对应的多样性分值、以及每个候选信息与用户信息之间的关联信息。
S202:根据多样性分值和关联信息确定与每个候选信息相对应的多样性信息。
其中,在获取到候选信息之后,可以对候选信息进行分析处理,从而可以获取与每个候选信息相对应的多样性分值、以及每个候选信息与用户信息之间的关联信息;在获取到多样性分值和关联信息之后,可以根据多样性分值和关联信息确定与每个候选信息相对应的多样性信息。具体的,参考附图3所示,根据多样性分值和关联信息确定与每个候选信息相对应的多样性信息可以包括:
S301:获取与多样性分值相对应的第一系数和与关联信息相对应的第二系数。
S302:根据第一系数、多样性分值、关联信息和第二系数确定与每个候选信息相对应的多样性信息。
在获取与每个候选信息相对应的多样性分值、以及每个候选信息与用户信息之间的关联信息之后,由于多样性分值和关联信息对多样性信息的影响程度在不同的应用场景中可以有所不同,因此,可以获取与多样性分值相对应的第一系数和与关联信息相对应的第二系数,在获取到第一系数和第二系数之后,可以结合多样性分值和关联信息来确定与每个候选信息相对应的多样性信息。具体的,本实施例中的根据第一系数、多样性分值、关联信息和第二系数确定与每个候选信息相对应的多样性信息可以包括:
S3021:根据第一系数、多样性分值、关联信息和第二系数,利用以下公式确定与每个候选信息相对应的多样性信息:
Figure BDA0002315406420000101
其中,srank为与候选信息相对应的多样性信息,a1为第一系数,a2为第二系数,sdiversity为与候选信息相对应的多样性分值,smodel为候选信息与用户信息之间的关联信息。
本实施例中,通过获取与每个候选信息相对应的多样性分值、以及每个候选信息与用户信息之间的关联信息,而后根据第一系数、多样性分值、关联信息和第二系数确定与每个候选信息相对应的多样性信息,不仅保证了对与每个候选信息相对应的多样性信息进行确定的准确可靠性,并且由于多样性信息综合考虑了关联信息和多样性分值,从而实现了能够更好地兼顾推送信息的效率和多样性,进一步提高了该方法的实用性。
图4为本发明实施例提供的获取与每个候选信息相对应的多样性分值的流程图;在上述实施例的基础上,继续参考附图4所示,本实施例中获取与每个候选信息相对应的多样性分值的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,本实施例中的获取与每个候选信息相对应的多样性分值可以包括:
S401:获取与每个候选信息相对应的标签多样性分和类目多样性分。
S402:对标签多样性分和类目多样性分进行加权求和,获得与每个候选信息相对应的多样性分值。
其中,对于一个候选信息而言,其可以对应有标签属性和类目属性,标签属性可以包括候选信息的关键词,例如:标签属性可以包括以下至少之一:人名信息、时间信息、地点信息等等。而类目属性用于标识候选信息的类别,例如:类目属性可以包括以下至少之一:社会信息、非社会信息、娱乐信息、生物信息、科技信息等等。
具体的,在获取候选信息之后,可以对候选信息进行分析识别,以获取与每个候选信息相对应的标签多样性分和类目多样性分,其中,标签多样性分与候选信息中的标签信息相对应,类目多样性分与候选信息中的类目信息相对应。在获取到标签多样性分和类目多样性分之后,可以对标签多样性分和类目多样性分进行加权求和,从而可以获得与每个候选信息相对应的多样性分值。举例来说,标签多样性分对应第一权重系数,类目多样性分对应第二权重系数,而后可以利用以下公式来获取与每个候选信息相对应的多样性分值:
sdiversity=w1*stag+w2*scate
其中,sdiversity为与候选信息相对应的多样性信息,w1为第一权重系数,stag为标签多样性信息,W2为第二权重系数,scate为类目多样性信息,w1+w2=1,w1*w2≥0。
本实施例中,通过对标签多样性分和类目多样性分进行加权求和,获得与每个候选信息相对应的多样性分值,在不同的应用场景中,标签多样性分和类目多样性分可以对多样性分值带来不同的影响程度;从而实现了综合标签维度和类目维度来获得候选信息的多样性分值,有效地保证了多样性分值获取的准确可靠性,进一步保证了推送信息的多样性程度。
图5为本发明实施例提供的获取与每个候选信息相对应的标签多样性分和类目多样性分的流程图;在上述实施例的基础上,继续参考附图5所示,本实施例对于获取与每个候选信息相对应的标签多样性分和类目多样性分的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,本实施例中的获取与每个候选信息相对应的标签多样性分和类目多样性分可以包括:
S501:获取与每个候选信息相对应的标签多样性矩阵和类目多样性矩阵。
S502:根据标签多样性矩阵确定与每个候选信息相对应的标签多样性分。
S503:根据类目多样性矩阵确定与每个候选信息相对应的类目多样性分。
具体的,在获取到候选信息之后,可以对候选信息进行分析识别,从而可以获取到与候选信息相对应的标签多样性矩阵和类目多样性矩阵,其中,标签多样性矩阵和类目多样性矩阵可以均为对角阵,其中,标签多样性矩阵的主对角线上的对角元素可以为与标签信息相对应的多样性分值;类目多样性矩阵的主对角线上的对角元素可以为与类目信息相对应的多样性分值。
在获取到标签多样性矩阵之后,可以对标签多样性矩阵进行分析处理,根据分析处理结果来确定与每个候选信息相对应的标签多样性分。具体的,参考附图6所示,本实施例中的根据标签多样性矩阵确定与每个候选信息相对应的标签多样性分可以包括:
S601:获取位于标签多样性矩阵中主对角线上的对角元素。
S602:将对角元素进行求和处理,获得与每个候选信息相对应的标签多样性分。
具体的,在获取到与每个候选信息相对应的标签多样性矩阵之后,可以识别位于标签多样性矩阵中主对角线上的对角元素,该对角元素即为与候选信息中各个标签信息相对应的多样性分值,而后将对角元素进行求和处理,从而可以获得与每个候选信息相对应的标签多样性分。举例来说:与每个候选信息相对应的标签多样性分为Stag,标签多样性矩阵中的对角元素为Stag_diversity,此时,Stag=∑diag(Stag_diversity),即与每个候选信息相对应的标签多样性分为标签多样性矩阵中主对角线上的所有对角元素之和。
相类似的,在获取到类目多样性矩阵之后,可以对类目多样性矩阵进行分析处理,根据分析处理结果来确定与每个候选信息相对应的类目多样性分。具体的,参考附图7所示,本实施例中的根据类目多样性矩阵确定与每个候选信息相对应的类目多样性分可以包括:
S701:获取位于类目多样性矩阵中主对角线上的对角元素。
S702:将对角元素进行求和处理,获得与每个候选信息相对应的类目多样性分。
具体的,在获取到与每个候选信息相对应的类目多样性矩阵之后,可以识别位于类目多样性矩阵中主对角线上的对角元素,该对角元素即为与候选信息中各个类目信息相对应的多样性分值,而后将对角元素进行求和处理,从而可以获得与每个候选信息相对应的类目多样性分。举例来说:与每个候选信息相对应的类目多样性分为scate,类目多样性矩阵中的对角元素为Scate_diversity,此时,scate=∑diag(Scate_diversity),即与每个候选信息相对应的类目多样性分为类目多样性矩阵中主对角线上的所有对角元素之和。
本实施例中,通过获取与每个候选信息相对应的标签多样性矩阵和类目多样性矩阵,而后根据标签多样性矩阵确定与每个候选信息相对应的标签多样性分;并可以根据类目多样性矩阵确定与每个候选信息相对应的类目多样性分,从而有效地保证了对标签多样性分和类目多样性分进行获取的准确可靠性,进而提高了推送信息的质量和效率。
图8为本发明实施例提供的获取与每个候选信息相对应的标签多样性矩阵的流程图;在上述实施例的基础上,继续参考附图8所示,在获取与每个候选信息相对应的标签多样性分时,需要获取与每个候选信息相对应的标签多样性矩阵,具体的,本实施例对于获取与每个候选信息相对应的标签多样性矩阵的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,本实施例中的获取与每个候选信息相对应的标签多样性矩阵可以包括:
S801:获取与用户信息相对应的用户画像矩阵、与候选信息相对应的多样性参数矩阵和标签信息矩阵,其中,用户画像矩阵包括标签信息和与标签信息相对应的权重信息,多样性参数矩阵的对角线元素包括与标签信息相对应的多样性信息,标签信息矩阵的对角线元素包括与候选信息相对应的标签信息。
S802:对用户画像矩阵、多样性参数矩阵和标签信息矩阵进行整合,获得与每个候选信息相对应的标签多样性矩阵。
其中,在获取到信息推送请求之后,可以基于信息推送请求中包括的用户信息获取到与用户信息相对应的用户画像矩阵,该用户画像矩阵中包括与用户信息相对应的标签信息和标签信息相对应的权重信息;另外,在确定多个候选信息之后,可以对候选信息进行分析识别,从而可以获取到与候选信息相对应的多样性参数矩阵和标签信息矩阵,此时,多样性参数矩阵的对角线元素包括与标签信息相对应的多样性信息,标签信息矩阵的对角线元素包括与候选信息相对应的标签信息。
在获取到用户画像矩阵、多样性参数矩阵和标签信息矩阵之后,可以对用户画像矩阵、多样性参数矩阵和标签信息矩阵进行整合,从而可以获得与每个候选信息相对应的标签多样性矩阵,此时的标签多样性矩阵中综合了用户画像信息、多样性参数和标签信息。举例来说,用户画像矩阵为Utag,多样性参数矩阵为Ttag,标签信息矩阵为Itag,而后可以根据以下公式获得标签多样性矩阵Stag_diversity,其中,Stag_diversity=Utag Ttag Itag
本实施例中,通过对用户画像矩阵、多样性参数矩阵和标签信息矩阵进行整合,获得与每个候选信息相对应的标签多样性矩阵,有效地保证了标签多样性矩阵获取的质量和效率,进一步提高了该方法使用的稳定可靠性。
图9为本发明实施例提供的获取与每个候选信息相对应的类目多样性矩阵的流程图;在上述实施例的基础上,继续参考附图9所示,在获取与每个候选信息相对应的类目多样性分时,需要获取与每个候选信息相对应的类目多样性矩阵,具体的,本实施例对于获取与每个候选信息相对应的类目多样性矩阵的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,本实施例中的获取与每个候选信息相对应的类目多样性矩阵可以包括:
S901:获取与用户信息相对应的用户画像矩阵、与候选信息相对应的多样性参数矩阵和类目信息矩阵,其中,用户画像矩阵包括类目信息和与类目信息相对应的权重信息,多样性参数矩阵的对角线元素包括与类目信息相对应的多样性信息,类目信息矩阵的对角线元素包括与候选信息相对应的类目信息。
S902:对用户画像矩阵、多样性参数矩阵和类目信息矩阵进行整合,获得与每个候选信息相对应的类目多样性矩阵。
其中,在获取到信息推送请求之后,可以基于信息推送请求中包括的用户信息获取到与用户信息相对应的用户画像矩阵,该用户画像矩阵中包括与用户信息相对应的类目信息和类目信息相对应的权重信息;另外,在确定多个候选信息之后,可以对候选信息进行分析识别,从而可以获取到与候选信息相对应的多样性参数矩阵和类目信息矩阵,此时,多样性参数矩阵的对角线元素包括与类目信息相对应的多样性信息,类目信息矩阵的对角线元素包括与候选信息相对应的类目信息。
在获取到用户画像矩阵、多样性参数矩阵和类目信息矩阵之后,可以对用户画像矩阵、多样性参数矩阵和类目信息矩阵进行整合,从而可以获得与每个候选信息相对应的类目多样性矩阵,此时的类目多样性矩阵中综合了用户画像信息、多样性参数和类目信息。举例来说,用户画像矩阵为Ucate,多样性参数矩阵为Tcate,类目信息矩阵为Icate,而后可以根据以下公式获得类目多样性矩阵Scate_diversity,具体的,Scate_diversity=Ucate Tcate Icate
本实施例中,通过对用户画像矩阵、多样性参数矩阵和类目信息矩阵进行整合,获得与每个候选信息相对应的类目多样性矩阵,有效地保证了类目多样性矩阵获取的质量和效率,进一步提高了该方法使用的稳定可靠性。
图10为本发明实施例提供的获取与用户信息相对应的用户画像矩阵的流程图;在上述实施例的基础上,继续参考附图10所示,本实施例对于获取与用户信息相对应的用户画像矩阵的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,本实施例中的获取与用户信息相对应的用户画像矩阵可以包括:
S1001:获取与用户信息相对应的画像矩阵。
S1002:确定与画像矩阵相对应的偏置矩阵。
S1003:根据偏置矩阵和画像矩阵确定与用户信息相对应的用户画像矩阵。
其中,在获取到用户信息之后,可以获取与用户信息相对应的画像矩阵,该画像矩阵即为与用户信息相对应的原始画像矩阵,另外,由于用户信息可以包括标签信息和类目信息,因此,在获取与用户信息相对应的画像矩阵时,可以获得与标签信息相对应的用户画像信息和与类目信息相对应的用户画像信息。具体的,参考附图11所示,一种可实现获取与用户信息相对应的画像矩阵的方式可以包括:
S1101:获取与用户信息相对应的标签信息和标签信息的权重信息。
S1102:基于标签信息和权重信息构建与用户信息相对应的画像矩阵。
具体的,在获取到用户信息之后,可以获取与用户信息相对应的标签信息和标签信息的权重信息,可以理解的是,一个用户信息可以对应有多个标签信息,而不同的标签信息可以对应有相同或者不同的权重信息;在获取到标签信息和权重信息之后,可以基于标签信息和权重信息构建与用户信息相对应的画像矩阵,从而获取到了用户在标签信息维度上的画像矩阵。
相类似的,参考附图12所示,另一种可实现获取与用户信息相对应的画像矩阵的方式可以包括:
S1201:获取与用户信息相对应的类目信息和类目信息的权重信息;
S1202:基于类目信息和权重信息构建与用户信息相对应的画像矩阵。
具体的,在获取到用户信息之后,可以获取与用户信息相对应的类目信息和类目信息的权重信息,可以理解的是,一个用户信息可以对应有多个类目信息,而不同的类目信息可以对应有相同或者不同的权重信息;在获取到类目信息和权重信息之后,可以基于类目信息和权重信息构建与用户信息相对应的画像矩阵,从而获取到了用户在类目信息维度上的画像矩阵。
当然的,本领域技术人员也可以采用其他的方式来获取与用户信息相对应的画像矩阵,只要能够保证对与用户信息相对应的画像矩阵进行获取的准确可靠性即可,在此不再赘述。
在获取到与用户信息相对应的画像矩阵之后,可以确定与画像矩阵相对应的偏置矩阵,而后可以根据偏置矩阵对画像矩阵进行偏置处理,从而可以获得与用户信息相对应的用户画像矩阵,此时,用户画像矩阵是经过偏置处理后的画像矩阵。具体的,本实施例对于根据偏置矩阵和画像矩阵确定与用户信息相对应的用户画像矩阵的具体实现过程不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置。示例性的,一种可实现根据偏置矩阵和画像矩阵确定与用户信息相对应的用户画像矩阵的方式可以包括:
S10031:根据偏置矩阵和画像矩阵,利用以下公式确定与用户信息相对应的用户画像矩阵:
Utag=BtagU′tag
其中,Utag为经过消偏处理后的用户画像矩阵,Btag为偏置矩阵,U′tag为与用户信息相对应的画像矩阵。
具体的,本实施例中的偏置矩阵可以是通过tf-iuf算法获得的,从而实现了利用tf-iuf算法对画像矩阵进行消偏处理,有效地保证了不同领域的信息之间可以进行横向对比,例如:可以使得娱乐信息和经济信息之间进行对比,或者,使得娱乐信息和科技信息之间进行对比等等,进一步保证了推送信息的多样性。
示例性的,另一种可实现根据偏置矩阵和画像矩阵确定与用户信息相对应的用户画像矩阵的方式可以包括:
S10032:根据偏置矩阵和画像矩阵,利用以下公式确定与用户信息相对应的用户画像矩阵:
Utag=U′tag--Btag
其中,Utag为经过消偏处理后的用户画像矩阵,Btag为偏置矩阵,Utag为与用户信息相对应的画像矩阵。
具体的,本实施例中的偏置矩阵可以是通过均值权重算法获得的,从而实现了利用均值权重算法对画像矩阵进行消偏处理,有效地保证了不同领域的信息可以进行横向对比,进一步保证了推送信息的多样性。
在具体应用时,本领域技术人员可以采用上述任意一种或者两种偏置方式对画像矩阵进行消偏处理,或者,本领域技术人员也可以采用其他的偏置方式对画像矩阵进行消偏处理,只要能够实现能够获得经过消偏处理后的与用户信息相对应的用户画像矩阵即可,在此不再赘述。
本实施例中,通过获取与用户信息相对应的画像矩阵,确定与画像矩阵相对应的偏置矩阵,而后根据偏置矩阵对画像矩阵进行消偏处理,获得与用户信息相对应的用户画像矩阵,有效地保证了用户画像矩阵获取的准确可靠性,并且实现了在不同维度或者不同领域的推送信息之间可以进行横向对比,进一步保证了推送信息的多样性,提高了该方法使用的稳定可靠性。
图13为本发明实施例提供的确定与画像矩阵相对应的偏置矩阵的流程图一;在上述实施例的基础上,继续参考附图13所示,由上述陈述内容可知,与画像矩阵相对应的偏置矩阵可以有两种获取方式,一种获取方式可以通过tf-iuf算法来确定与画像矩阵相对应的偏置矩阵,另一种获取方式可以通过均值权重算法来确定与画像矩阵相对应的偏置矩阵。具体的,在通过tf-iuf算法来确定与画像矩阵相对应的偏置矩阵时,本实施例中的确定与画像矩阵相对应的偏置矩阵可以包括:
S1301:获取所有用户的画像信息。
S1302:基于所有用户的画像信息生成偏置矩阵。
其中,可以统计所有用户的画像信息,而后可以对所有用户的画像信息进行分析处理,以确定偏置矩阵。具体的,参考附图14所示,基于所有用户的画像信息生成偏置矩阵可以包括:
S1401:根据所有用户的画像信息,计算预设标签信息/预设类目信息对当前用户的重要程度。
S1402:根据重要程度生成偏置矩阵。
其中,预设标签信息和/或预设类目信息的个数可以为一个或多个,并且,一个或多个预设标签信息和/或预设类目信息可以是预先设置的标签信息和/或类目信息,该标签信息和/或类目信息可以基于众群体的广泛程度和兴趣权重来进行配置的。具体的,在获取到所有用户的画像信息之后,可以对所有用户的画像信息进行分析处理,从而可以计算预设标签信息或者预设类目信息对当前用户的重要程度。具体的,参考附图15所示,本实施例中的根据所有用户的画像信息,计算预设标签信息/预设类目信息对当前用户的重要程度可以包括:
S1501:获取当前用户画像信息中包括预设标签信息/预设类目信息的第一数量、所有用户画像信息的用户总数、所有用户画像信息中包括预设标签信息/预设类目信息的用户数量。
S1502:根据第一数量、所有用户画像信息的用户总数和用户数量计算预设标签信息/预设类目信息对当前用户的重要程度。
在获取到预设标签信息/预设类目信息之后,可以获取当前用户画像中包括预设标签信息/预设类目信息的第一数量,该第一数量可以为当前用户画像中包括的预设标签信息的数量,或者,该第一数量也可以为当前用户画像中包括预设类目信息的数量。具体的,在获取当前用户画像信息中包括预设标签信息/预设类目信息的第一数量时,可以识别预设标签信息/预设类目信息中是否存在重复的信息,若预设标签信息中包括有两个相同的标签信息时,则可以对相同的标签信息进行去重处理;或者,在预设类目信息中包括有两个相同的类目信息时,则可以对相同的类目信息进行去重处理,从而可以保证对第一数量进行获取的准确可靠性。
相类似的,在获取到预设标签信息/预设类目信息之后,可以获取所有用户画像信息中包括预设标签信息/预设类目信息的用户数量。另外,还可以统计所有用户画像信息的用户总数。在获取到用户总数、第一数量和用户数量之后,可以对用户总数、第一数量和用户数量进行分析处理,从而可以获得预设标签信息/预设类目信息对当前用户的重要程度。具体的,在获取预设标签信息对当前用户的重要程度时,本实施例中的根据第一数量、所有用户画像信息的用户总数和用户数量计算预设标签信息对当前用户的重要程度,包括:
S15021:利用以下公式计算预设标签信息对当前用户的重要程度:
Figure BDA0002315406420000201
其中,tf_iufi为预设标签信息对当前用户的重要程度,|dtag|为当前用户画像信息中包括预设标签信息的第一数量,|U|为所有用户画像信息的用户总数,|{j:i∈dj}|为所有用户画像信息中包括预设标签信息的用户数量,i为预设标签信息,i∈dj为用户画像信息中包括预设标签信息,j为所有用户画像信息中包括预设标签信息的用户数量。
另外,在获取预设类目信息对当前用户的重要程度时,本实施例中的根据第一数量、所有用户画像信息的用户总数和用户数量计算预设类目信息对当前用户的重要程度,包括:
S15022:利用以下公式计算预设类目信息对当前用户的重要程度:
Figure BDA0002315406420000202
其中,tf_iufi为预设类目信息对当前用户的重要程度,|dcate|为当前用户画像信息中包括预设类目信息的总个数,|U|为所有用户画像信息的用户总数,|{j:i∈dj}|为所有用户画像信息中包括预设类目信息的用户数量,i为预设类目信息,i∈dj为用户画像信息中包括预设类目信息,j为所有用户画像信息中包括预设类目信息的用户数量。
本实施例中,通过以上公式来计算预设标签信息/预设类目信息对当前用户的重要程度,有效地保证了对预设标签信息/预设类目信息对当前用户的重要程度进行计算的准确可靠性,进一步提高了该方法使用的稳定可靠程度。
在获取到预设标签信息/预设类目信息对当前用户的重要程度之后,可以基于重要程度生成偏置矩阵,具体的,假定偏置矩阵为Btag,预设标签信息/预设类目信息对当前用户的重要程度为tf_iuf,此时,偏置矩阵与重要程度之间存在以下关系:
Btag=diag(tf_iuf1,tf_iuf2,…,tf_iufn)
其中,n为去重之后的预设标签信息/预设类目信息的总个数,diag为对角阵标识信息。
本实施例中,有效地实现了通过tf-iuf算法来确定与画像矩阵相对应的偏置矩阵,不仅保证了与画像矩阵相对应的偏置矩阵获取的准确可靠性,并且便于通过所获取的偏置矩阵来实现对用户画像的偏置处理操作,从而可以使得不同兴趣点的权重之间具有可比性,有效地减少了各个标签之间或者各个类目之间的天然差异,进一步保证了偏置处理的效果,提高了该方法使用的准确可靠性。
图16为本发明实施例提供的确定与画像矩阵相对应的偏置矩阵的流程图二;在上述实施例的基础上,继续参考附图16所示,在通过均值权重算法来确定与画像矩阵相对应的偏置矩阵时,本实施例中的确定与画像矩阵相对应的偏置矩阵可以包括:
S1601:获取所有用户的画像信息。
S1602:在所有用户画像信息中,获取包括预设标签信息/预设类目信息的第一画像信息,并统计第一画像信息的数量信息。
S1603:基于所有的预设标签信息/预设类目信息对第一画像信息的权重信息进行累加,获得权重累加值。
S1604:将权重累加值与数量信息的比值确定为预设标签信息/预设类目信息对用户的平均重要程度。
S1605:根据平均重要程度生成偏置矩阵。
具体的,先获取所有用户的画像信息,在所有用户画像信息中确定包括有预设标签信息/预设类目信息的第一画像信息,并统计第一画像信息的数量信息;对于确定的所有第一画像信息,统计预设标签信息/预设类目信息在所有的第一画像信息中的所有权重信息,而后将所有的权重信息进行累加,获得权重累加值,最后,将权重累加值与数量信息的比值确定为预设标签信息/预设类目信息对用户的平均重要程度;在获取到平均重要程度之后,根据平均重要程度生成偏置矩阵。具体的,假定偏置矩阵为Btag,预设标签信息/预设类目信息对用户的平均重要程度为
Figure BDA0002315406420000221
此时,偏置矩阵与重要程度之间存在以下关系:
Figure BDA0002315406420000222
其中,n为去重之后的预设标签信息/预设类目信息的总个数,diag为对角阵标识信息。
本实施例中,有效地实现了均值权重算法来确定与画像矩阵相对应的偏置矩阵,不仅保证了与画像矩阵相对应的偏置矩阵获取的准确可靠性,并且实现过程简单,便于通过所获取的偏置矩阵来实现对用户画像的偏置处理操作,从而可以使得不同兴趣点的权重之间具有可比性,有效地减少了各个标签之间或者各个类目之间的天然差异,进一步保证了偏置处理的效果,提高了该方法使用的准确可靠性。
图17为本发明实施例提供的获取与候选信息相对应的多样性参数矩阵的流程图;在上述实施例的基础上,继续参考附图17所示,通过上述陈述内容可知,在获取与每个候选信息相对应的标签多样性矩阵时,需要获取与每个候选信息相对应的多样性参数矩阵,本实施例对于与候选信息相对应的多样性参数矩阵具体获取方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,本实施例中的获取与候选信息相对应的多样性参数矩阵可以包括:
S1701:针对候选信息,提取出候选信息中包括的标签信息/类目信息的权重信息。
S1702:获取已经下发的信息中包括候选信息中标签信息/类目信息的第一频次、用户已经点击的信息中包括候选信息中标签信息/类目信息的第二频次。
S1703:根据标签信息/类目信息的权重信息、第一频次和第二频次确定与候选信息相对应的多样性参数矩阵。
具体的,在获取到多个候选信息之后,可以针对每个候选信息,提取出候选信息中包括有标签信息/类目信息的权重信息,该权重信息可以为标签信息与候选信息中包括的所有标签信息的比值,或者,该权重信息可以为类目信息与候选信息中包括的所有类目信息的比值。而后针对已经下发的信息,可以获取已经下发的信息中包括候选信息中标签信息/类目信息的第一频次,具体的,参考附图18所示,本实施例中的获取已经下发的信息中包括候选信息中标签信息/类目信息的第一频次可以包括:
S1801:获取已下发的信息和包括有标签信息/类目信息的候选信息的信息总数。
S1802:在预设的信息下发序列中,确定包括有标签信息/类目信息的候选信息的下发位置与当前位置的距离信息。
S1803:根据信息总数和距离信息确定已经下发的信息中包括候选信息中标签信息/类目信息的第一频次。
具体的,假定已经下发的信息数量为数量a,包括有标签信息/类目信息的候选信息的候选信息数量为数量b,那么,则可以获得信息总数为a+b。而后,在预设的信息下发序列中,可以确定包括有标签信息/类目信息的候选信息的下发位置与当前位置的距离信息,其中,预设的信息下发序列包括已下发的信息和待下发的候选信息。举例来说,信息下发序列为:信息a、信息b、信息c、信息d和信息f,其中,信息a和信息b为已经下发的信息,信息c、信息d和信息f为待下发的候选信息,当前位置即为信息b的位置,在包括有标签信息/类目信息的候选信息为信息f时,则可以计算信息f的下发位置与信息b之间的距离信息,以相邻信息之间的距离信息为1为例,那么信息f与信息b之间的距离则为3。
在获取到信息总数和距离信息之后,可以对信息总数和距离信息进行分析处理,从而可以确定已经下发的信息中包括候选信息中标签信息/类目信息的第一频次,具体的,本实施例中的根据信息总数和距离信息确定已经下发的信息中包括候选信息中标签信息/类目信息的第一频次可以包括:
S18031:利用以下公式确定已经下发的信息中包括候选信息中标签信息/类目信息的第一频次:
Figure BDA0002315406420000241
其中,mi为已经下发的信息中包括候选信息中标签信息/类目信息的第一频次,s为已下发的信息和包括有标签信息/类目信息的候选信息的信息总数,a为超参数,dj为第j个包括有标签信息/类目信息的候选信息的下发位置与当前位置的距离信息。
在获取到已经下发的信息中包括候选信息中标签信息/类目信息的第一频次之后,可以获取用户已经点击的信息中包括候选信息中标签信息/类目信息的第二频次,具体的,可以先获取用户已经点击的信息集合,在信息集合中,统计信息中包括候选信息中标签信息/类目信息的第二频次;在获取到标签信息/类目信息的权重信息、第一频次和第二频次之后,可以对标签信息/类目信息的权重信息、第一频次和第二频次进行分析处理,从而可以确定与候选信息相对应的多样性参数矩阵。具体的,参考附图19所示,本实施例中的根据标签信息/类目信息的权重信息、第一频次和第二频次确定与候选信息相对应的多样性参数矩阵可以包括:
S1901:根据标签信息/类目信息的权重信息、第一频次和第二频次确定虚拟展现次数。
S1902:根据虚拟展现次数确定与候选信息相对应的多样性参数矩阵。
具体的,可以先对标签信息/类目信息的权重信息、第一频次和第二频次进行分析处理,从而可以获得虚拟展现次数,具体的,根据标签信息/类目信息的权重信息、第一频次和第二频次确定虚拟展现次数可以包括:
利用以下公式确定虚拟展现次数:
Figure BDA0002315406420000251
其中,ci为虚拟展现次数,mi为已经下发的信息中包括候选信息中标签信息/类目信息的第一频次,ni为用户已经点击的信息中包括候选信息中标签信息/类目信息的第二频次,
Figure BDA0002315406420000252
为提取出候选信息中包括的标签信息/类目信息的权重信息,b为超参数。
在获取到虚拟展现次数之后,可以对虚拟展现次数进行分析处理,以确定与候选信息相对应的多样性参数矩阵,具体的,根据虚拟展现次数确定与候选信息相对应的多样性参数矩阵可以包括:
S19021:根据虚拟展现次数,利用公式ti=exp(-k*ci)确定与候选信息相对应的对角线的元素,其中,ti为对角线的元素,k为超参数,ci为虚拟展现次数;exp为指数函数。
S19022:根据对角线的元素ti确定与候选信息相对应的多样性参数矩阵。
其中,多样性参数矩阵为对角阵,假设多样性参数矩阵为Ttag,对角线的元素为ti表示为预设标签tagi的多样性参数,该多样性参数可以用于标识包括有tagi语义的候选信息在此刻状态的多样性信息,由于多样性参数矩阵Ttag中的对角线元素ti可以通过虚拟展现次数来确定,因此,可以准确有效地确定与候选信息相对应的多样性参数矩阵。
图20为本发明实施例提供的获取与候选信息相对应的标签信息矩阵/类目信息矩阵的流程图;在上述实施例的基础上,继续参考附图20所示,通过上述陈述内容可知,在获取与每个候选信息相对应的标签多样性矩阵时,需要获取与候选信息相对应的标签信息矩阵/类目信息矩阵,本实施例对于获取与候选信息相对应的标签信息矩阵/类目信息矩阵的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景和设计需求进行设置,较为优选的,本实施例中的获取与候选信息相对应的标签信息矩阵/类目信息矩阵可以包括:
S2001:提取候选信息中包括的标签信息/类目信息。
S2002:确定与标签信息/类目信息相对应的权重信息。
S2003:根据标签信息和标签信息相对应的权重信息构建标签信息矩阵。
S2004:根据类目信息和类目信息相对应的权重信息构建类目信息矩阵。
具体的,在获取与候选信息相对应的标签信息矩阵时,由于标签信息矩阵中包括有标签信息和与标签信息相对应的权重信息,因此,在获取到候选信息之后,可以对候选信息进行分析识别,以提取候选信息中包括的标签信息,而后利用预设算法对标签信息进行分析处理,确定与标签信息相对应的权重信息,在获取到标签信息以及标签信息相对应的权重信息之后,即可以根据标签信息和标签信息相对应的权重信息来构建标签信息矩阵。
相类似的,在获取与候选信息相对应的类目信息矩阵时,由于类目信息矩阵中包括有类目信息和与类目信息相对应的权重信息,因此,在获取到候选信息之后,可以对候选信息进行分析识别,以提取候选信息中包括的类目信息,而后利用预设算法对类目信息进行分析处理,确定与类目信息相对应的权重信息,在获取到类目信息以及类目信息相对应的权重信息之后,即可以根据类目信息和类目信息相对应的权重信息来构建类目信息矩阵。
本实施例中,通过对候选信息进行分析处理,获取标签信息/类目信息以及所对应的权重信息,而后可以基于标签信息/类目信息以及所对应的权重信息来构建标签信息矩阵/类目信息矩阵,有效地保证了标签信息矩阵/类目信息矩阵进行建立的质量和效率,进一步提高了该方法使用的准确可靠性。
在上述任意一个实施例的基础上,继续参考附图1所示,本实施例提供了一种可实现对所述目标信息进行推送的方式,具体包括:
S1041:获取目标对象的用户画像。
S1042:基于所述用户画像确定所述目标信息的显示方式,并以所确定的显示方式将所述目标信息推送至所述目标对象。
其中,目标对象是待接收推送信息的用户,目标对象的用户画像中可以包括与目标对象相对应的各个标签信息,标签信息可以包括:喜好、兴趣、语言类型、购物、消费、投资等等。在获取到目标对象的用户画像之后,可以基于用户画像确定目标信息的显示方式,而后以所确定的显示方式将目标信息推送至目标对象,有效地实现了可以以不同的显示方式、将相同的目标信息推送至不同的目标对象,满足了不同用户的个性化需求。
举例来说,现有目标对象一、目标对象二和目标对象三,目标对象一的喜好为鲜亮颜色,目标对象二的喜好为暗黑颜色、目标对象三的喜好则为普通版本,此时,在获取到同一个目标信息之后,可以基于目标对象一的喜好将目标信息的显示方式确定为鲜亮颜色的显示方式,而后将鲜亮颜色的显示方式的目标信息发送至目标对象一;同理的,还可以基于目标对象二的喜好将目标信息的显示方式确定为暗黑颜色的显示方式,而后将暗黑颜色的显示方式的目标信息发送至目标对象二;还可以基于目标对象三的喜好将目标信息的显示方式确定为普通显示方式(可以对目标信息不进行任何调整),而后将普通显示方式的目标信息发送至目标对象三。从而有效地实现了就同一个目标信息而言,可以以不同的版本、不同的显示方式推送至不同的关注人群,进一步提高了该方法使用的灵活可靠性。
进一步的,在所述画像信息中包括语言类型信息时,本实施例中的基于所述画像信息确定所述目标信息的显示方式,并以所确定的显示方式将所述目标信息推送至所述目标对象可以包括:
S10421:基于所述画像信息中包括的语言类型信息,将所述目标信息转换为目标显示信息,所述目标显示信息的信息语言类型与所述画像信息中包括的语言类型信息相同。
S10422:将所述目标显示信息发送至所述目标对象。
其中,语言类型信息可以是指目标对象经常使用或者掌握的语言类型,例如:东北话、英语、四川话、北京话、普通话等等。在用户画像信息中包括有语言类型信息时,为了使得目标信息可以满足目标对象的日常使用习惯,则可以基于所述画像信息中包括的语言类型信息,将所述目标信息转换为目标显示信息,所述目标显示信息的信息语言类型与所述画像信息中包括的语言类型信息相同,而后将目标显示信息发送至目标对象,从而使得目标对象可以接收到与日常所使用的语言类型相同的目标信息,进而保证了用户的良好体验。
举例来说,现有目标对象一、目标对象二和目标对象三,目标对象一的画像信息中包括的语言类型信息为东北话,目标对象二的画像信息中包括的语言类型信息为英语、目标对象三的画像信息中包括的语言类型信息为湖南话,此时,在获取到同一个目标信息(例如:你在干什么呢?)之后,可以基于目标对象一的画像信息中包括的语言类型信息将上述的目标信息转换为目标显示信息,该目标显示信息的内容可以为“你干啥呢?”,从而使得该目标显示信息的信息语言类型与所述画像信息中包括的语言类型信息相同;而后可以将目标显示信息发送至目标对象一。
同理的,还可以基于目标对象二的画像信息中包括的语言类型信息将上述的目标信息转换为目标显示信息,该目标显示信息的内容可以为“what are you doing?”,从而使得该目标显示信息的信息语言类型与所述画像信息中包括的语言类型信息相同;而后可以将目标显示信息发送至目标对象二。还可以基于目标对象三的画像信息中包括的语言类型信息将上述的目标信息转换为目标显示信息,该目标显示信息的内容可以为“你搞么子咯?”,从而使得该目标显示信息的信息语言类型与所述画像信息中包括的语言类型信息相同;而后可以将目标显示信息发送至目标对象三。从而有效地实现了可以将目标信息以不同的语言版本或者方言版本发送至目标对象,使得目标对象可以接收到满足符合各自所使用的语言类型的目标信息,进一步保证了用户的良好体验。
图21为本发明实施例提供的另一种信息推送方法的流程图;在上述任意一个实施例的基础上,参考附图21所示,在对目标信息进行推送之后,本实施例中的方法还可以包括:
S2101:获取已推送的目标信息的信息熵。
S2102:根据信息熵识别目标信息的多样性。
在对目标信息进行推送之后,为了能够检测已推送的目标信息的多样性水平,可以获取已推送的目标信息的信息熵,具体的,参考附图22所示,本实施例中的获取已推送的目标信息的信息熵可以包括:
S2201:获取与目标信息相对应的预设元素的实际下发比例。
S2202:根据实际下发比例确定信息熵。
其中,与目标信息相对应的预设元素包括以下至少之一:实体标签、语义标签、一级类目、二级类目等等,在已经下发的目标信息中,可以获取与目标信息相对应的预设元素,而后统计预设元素的实际下发比例,具体的,参考附图23所示,获取与目标信息相对应的预设元素的实际下发比例可以包括:
S2301:获取已推送的所有目标信息的信息总数。
S2302:在已推送的目标信息中,获取包括预设元素的目标信息的信息数量。
S2303:将信息数量与信息总数的比值确定为实际下发比例。
具体的,为了能够获取与目标信息相对应的预设元素的实际下发比例,可以先统计已经推送的所有目标信息的信息总数,而后,针对已推送的所有目标信息,获取包括预设元素的目标信息的信息数量,而后将信息数量与信息总数的比值确定为实际下发比例。举例来说:已推送的所有目标信息的信息总数为2000条,在已推送的所与目标信息中,包括预设元素的目标信息的信息数量为540条,那么,与目标信息相对应的预设元素的实际下发比例即为540/2000=27%。
当然的,本领域技术人员也可以采用其他的方式来获取与目标信息相对应的预设元素的实际下发比例,只要能够保证对与目标信息相对应的预设元素的实际下发比例进行获取的准确可靠性即可在,在此不再赘述。
在获取到实际下发比例之后,可以对实际下发比例进行分析处理,从而可以确定已推送的目标信息的信息熵,具体的,根据实际下发比例确定信息熵,包括:利用以下公式确定信息熵:
Ex=∑(-1*pi*log(pi))
其中,x为预设的观测维度,观测维度包括以下至少之一:标签维度和类目维度;Ex为信息熵,pi为与目标信息相对应的预设元素i的实际下发比例。
在获取到与目标信息的信息熵之后,可以根据信息熵识别目标信息的多样性,具体的,目标信息的多样性与信息熵的数值呈正相关,也即,在信息熵的数值越大时,则目标信息的多样性越好,内容下发越均匀;在信息上的数值越小时,则目标信息的多样性越差,内容下发越不均匀。
本实施例中,通过获取已推送的目标信息的信息熵,并根据信息熵识别目标信息的多样性,有效地对目标信息的多样性程度进行识别,从而便于对推送信息的策略进行优化和调整,进一步提高了该方法的实用性。
具体应用时,参考附图附图24-25所示,本应用实施例提供了一种信息推送方法,该信息推送方法的执行主体包括客户端和信息推送装置,客户端与信息推送装置可以通信连接,以实现信息推送的过程,具体的,在实现信息推送的过程中,该方法综合考虑了用户下发集合、点击集合、当前选定集合以及候选集合中各个信息条目的语义信息,计算当前状态下候选集合中的各个候选信息条目的多样性分值和关联信息,基于多样性分值和关联信息可以获得与候选信息相对应的多样性信息。依据多样性信息,基于最大边缘相关(Maximal Marginal Relevance,简称MMR)算法的排序机制,生成当次要进行推送的多个目标信息的下发列表。
其中,上述的下发集合中包括已经下发的信息条目,点击集合中包括用户执行点击操作的信息条目,当前选定集合中包括有即将要进行推送下发的信息条目,一般情况下,当前选定集合会对应一预设数量信息,在满足这个预设数量信息之后,则可以对当前选定集合中的所有信息条目进行推送;候选集合中包括有待下发的信息条目。
具体的,该方法可以包括如下步骤:
step1:客户端向信息推送装置发送信息推送请求;
step2:信息推送装置基于信息推送请求确定待推送的目标信息,具体的,目标信息的确定过程包括如下步骤:
step2a:获取原始画像矩阵;
具体的,从当前用户的画像中获取用户的标签信息tag、类目信息cate以及相应的权重信息,根据标签信息以及标签信息所对应的权重信息生成与标签信息相对应的原始画像矩阵U′tag,根据类目信息以及类目信息所对应的权重信息生成与标签信息相对应的原始画像矩阵U′cate。以获取与标签信息相对应的原始画像矩阵U′tag为例,可以在当前用户画像中获取标签信息以及标签信息所对应的权重信息wi,而后基于标签信息和标签信息所对应的权重信息wi来构建与类目信息相对应的用户画像矩阵U′tag,具体的,U′tag=diag(wi,w2,…,wn);而当前用户画像无标签信息时,则该标签信息相对应的权重信息wi=0。
step2b:确定与原始画像矩阵相对应的偏置矩阵Btag
其中,由于每个标签信息或类目信息存在天然受众差异,如娱乐比科技的标签信息受众面广、兴趣权重高,为让不同兴趣点的权重有可比性,应尽量减少天然差异。本应用实施例中的方法可以获取全部用户的画像信息,并基于全部用户的画像信息,计算与标签信息和类目信息相对应的偏置矩阵,分别记为Btag、Bcate。所生成的偏置矩阵可以对标签信息和类目信息的权重进行消偏处理。具体的,以确定与标签信息相对应的偏置矩阵为例进行说明,本应用实施例提供两种实现方式。
方式一:利用tf-iuf算法获得偏置矩阵Btag
其中,参考信息检索与数据挖掘领域中tf-idf的计算方式,计算预设标签信息对当前用户的tf-iuf值,具体的,
Figure BDA0002315406420000311
其中,tf_iufi为预设标签信息对当前用户的重要程度值,|dtag|为当前用户画像信息中包括预设标签信息的总个数,|u|为全部用户的用户总数,|{j:i∈dj}|为全部用户画像信息中包括预设标签信息的用户总数;其中,tf-iuf的数值越大,表示预设标签信息对当前用户越重要。
在获取到tf_iufi之后,可以基于tf_iufi获取Btag,具体的,
Btag=diag(tf_iuf1,tf_iuf2,…,tf_iufn)
其中,Btag为偏置矩阵,n为经过去重处理后的预设标签信息的总个数,diag为对角阵标识信息,tf_iufn为预设标签信息对当前用户的重要程度值;并且,同行号表示预设标签信息相同。
方式二:利用均值权重算法获得偏置矩阵Btag
获取所有用户的画像信息,统计全部用户的画像信息中,所有含预设标签信息的用户画像信息,对所有预设标签信息的权重信息进行累加,获得权重累加值,而后,确定包括预设标签信息的哟用户画像信息的用户总数,将权重累加值与用户总数的比值确定为与预设标签信息相对应的平均重要程度
Figure BDA0002315406420000321
在获取到平均重要程度
Figure BDA0002315406420000322
之后,可以基于
Figure BDA0002315406420000323
获取Btag,具体的,
Figure BDA0002315406420000324
其中,Btag为偏置矩阵,n为经过去重处理后的预设标签信息的总个数,diag为对角阵标识信息,
Figure BDA0002315406420000325
为预设标签信息对当前用户的平均重要程度;并且,同行号表示预设标签信息相同。
step2c:基于偏置矩阵Btag对原始画像矩阵中的权重信息进行消偏处理,获得经过消偏处理后的用户画像矩阵。
具体的,经过消偏处理后的用户画像矩阵包括与标签信息相对应的用户画像矩阵Utag和与类目信息相对应的用户画像矩阵Ucate。下面以户画像矩阵Utag为例对消偏处理的过程进行说明:
方式一:利用tf-iuf算法对原始画像矩阵中的权重信息进行消偏,具体的,利用如下公式获得经过消偏处理后的用户画像矩阵;
Utag=BtagU′tag
其中,Utag为经过消偏处理后与标签信息相对应的用户画像矩阵,Btag为偏置矩阵,U′tag为与标签信息相对应的原始画像矩阵。
方式二:利用均值权重算法对原始画像矩阵中的权重信息进行消偏,具体的,利用如下公式获得经过消偏处理后的用户画像矩阵;
Utag=U′tag-Btag
其中,Utag为经过消偏处理后与标签信息相对应的用户画像矩阵,Btag为偏置矩阵,U′tag为与标签信息相对应的原始画像矩阵。
step2d:统计用户最近k次下发集合中各个信息条目中各个标签信息和类目信息的下发频次,分别记为Mtag、Mcate;而后,针对k次下发集合中的各个信息条目中,统计点击集合中各个信息条目中各个标签信息和类目信息的点击频次,分别记为Ntag、Ncate
step2e:统计当前选定集合中各个信息条目中包括标签信息、类目信息的频次,分别记为Rtag、Rcate
step2f:遍历候选集合中多个待推送的候选信息,基于上述步骤step2c、step2d和step2e中获取的信息,获取用于识别下发信息的多样性程度的多样性分值sdiversity,而后获取候选信息与用户信息之间的关联信息smodel,通过关联信息和多样性分值来获取与每个候选信息相对应的多样性信息srank
具体的,在获取多样性分值时,需要获取与每个候选信息中标签信息相对应的多样性分值stag和与每个候选信息中类目信息相对应的多样性分值scate。下面分别对获取stag的具体实现过程进行说明:
1)获取与标签信息相对应的多样性参数矩阵Ttag
具体的,对角阵Ttag为多样性参数矩阵,矩阵中对角线的元素ti表示预设标签信息tagi的多样性参数,用于反映含有tagi语义的各个候选信息在此刻状态的多样性信息。其中,矩阵中对角线的元素ti的计算如下:
ti=exp(-k*ci)
ci=mi-b*ni+wtagi)
wtagi=nlp(item,tagi)
其中,mi为已下发与选定集合中的各个信息条目item中含预设标签信息tagi的频次信息;ni为点击集合中的各个信息条item含tagi的频次;
Figure BDA0002315406420000331
为当前信息条目item中提取出tagi的权重信息,其中,若当前信息条目中不含tagi时,则
Figure BDA0002315406420000332
k,b为超参数;ci为虚拟展现次数。
另外,为了更好地降低相同标签信息连续或近距离下发的概率,mi的计算方式可以引入距离偏置信息,而点击频次ni的计算中可以不考虑位置偏置。具体的,mi的计算过程如下:
Figure BDA0002315406420000341
其中,s为历史已下发和当前选定集合中含预设标签信息tagi的信息条目总数;dj为已下发和待下发集合中的信息条目,按下发顺序构成的序列中,第j个含有tagi的信息条目的下发位置与当前位置之间的距离,当下发位置与当前位置相邻时,距离为1;a为超参数,用于体现对连续或近距离下发的容忍度。
2)获取信息条目中的标签信息矩阵Itag
运用自然语言处理(Natural Language Processing,简称NLP)算法提取信息条目的标签信息,构与标签信息相对应的对角标签信息矩阵Itag,对角线的元素ik表示信息条目中提取出标签信息tagk的权重wk,若信息条目中不含tagk时,则wk=0,具体的,标签信息矩阵Itag中的元素ik表示为
Figure BDA0002315406420000342
3)当前候选信息条目item的tag多样性分stag
计算当前候选信息条目item在当前状态下的标签信息的多样性分矩阵,然后将其主对角线上元素求和,得到当前候选信息条目item的tag多样性分stag,具体的,
Figure BDA0002315406420000343
其中,Stag_diversity为候选信息条目item在当前状态下的标签信息的多样性分矩阵,Utag为经过消偏处理后与标签信息相对应的用户画像矩阵,Ttag为多样性参数矩阵,Itag为标签信息矩阵,stag候选信息条目item的tag多样性分值。
相类似的,可以获取到与候选信息条目item中类目信息相对应的多样性分值scate,具体的,
Figure BDA0002315406420000351
其中,Scate_diversity为候选信息条目item在当前状态下的类目信息的多样性分矩阵,Ucate为经过消偏处理后与类目信息相对应的用户画像矩阵,Tcate为多样性参数矩阵,Icate为类目信息矩阵,scate候选信息条目item的cate多样性分值。
在获取到与每个候选信息中标签信息相对应的多样性分值stag和与每个候选信息中类目信息相对应的多样性分值scate之后,可以获取到与候选信息条目相对应的综合多样性分值sdiversity,具体的,对stag和scate进行加权求和,获得综合多样性分值,即:
Figure BDA0002315406420000352
其中,stag为与每个候选信息中标签信息相对应的多样性分值,w1为与stag相对应的权重信息,scate为与每个候选信息中类目信息相对应的多样性分值,w2为与scate相对应的权重信息,其中,w1+w2=1,w1*w2≥0。
进一步的,在获取到多样性分值sdiversity之后,可以获取与每个候选信息相对应的多样性信息srank,具体的,多样性信息srank中融合了候选信息的关联信息smodel和多样性分值sdiversity,即
Figure BDA0002315406420000353
其中,srank为多样性信息,sdiversity为多样性分值,smodel为关联信息,a1,a2分别为调权系数,根据产品的应用需求需要调整,维持下发效率与内容多样性的平衡。
step2g:确定待推送的当前选定集合
具体的,根据多样性信息srank对候选集合中的多个候选信息进行倒排,将倒排的多个候选信息依序经过筛选处理(例如:高度相似去重处理、类目上限限制等),选取符合下发要求且srank最大的候选信息进入当前选定集合。其中,下发要求可以包括数量要求和合法性要求,以数量要求作为下发要求为例,判断当前选定集合中信息条目的数量是否满足数量的下发要求,具体的,如满足,则退出信息筛选流程,依选择顺序生成下发列表;如不满足,重复继续对信息进行筛选,直至当前选定集合中能够的信息条目的数量满足数量的下发要求为止。
另外,在当前选定集合中各个信息条目中包括标签信息、类目信息的频次Rtag、Rcate更新时,可以利用更新的Rtag和Rcate对当前选定集合中的信息进行更新。
step3:检测下发信息的多样性程度
其中,可以利用信息熵的评价方式来衡量下发内容的多样性,具体的,利用以下公式获取已下发信息的信息熵,
Ex=∑(-1*pi*log(pi))
其中,x为已下发信息的观测维度,如:实体标签、语义标签、一级类目、二级类目等,pi为观测维度x中的特定元素i的实际下发比例,其具体表示为:
Figure BDA0002315406420000361
其中,mi为实际下发信息中含有元素i的信息总数,则∑mj为所有下发信息的信息总数。举例来说,在x为一级类目维度时,pi表示一级类目i的下发比例,则Ex表示一级类目信息熵,此时,Ex可以衡量下发信息在一级类目维度的多样性。需要注意的是,观测维度的信息熵数值越大,内容下发越均匀,多样性越好。
本应用实施例提供的信息推送方法,综合考虑用户历史下发和点击、已选定集合的内容多样性,并结合用户画像、标签权重,从类目、标签等多角度去控制下发内容的多样性,方法能很好的兼顾下发信息的效率和多样性;另外,该方法还可以利用信息熵用于评估推送信息的多样性,能很好地符合应用场景和多样性评估需求;具体的,在不降低信息推送效率的情况下,一级类目信息熵累计提升+8.78%,单次下发(8条item)中仅含3-4个类目数的下发次数占比绝对值降低8.5%以上,含5-6个类目数的下发次数占比绝对值提升+7.5%,较大的增加了下发内容的多样性和丰富度,进一步提高了该方法的实用性,有利于市场的推广与应用。
图26为本发明实施例提供的一种信息推送装置的结构示意图;参考附图26所示,本实施例提供了一种信息推送装置,该信息推送装置可以执行上述图1的信息推送方法,具体的,该信息推送装置可以包括:
获取模块11,用于获取信息推送请求;
确定模块12,用于根据信息推送请求确定多个待推送的候选信息;
确定模块12,还用于确定与每个候选信息相对应的多样性信息;
推送模块13,用于根据与每个候选信息相对应的多样性信息,在多个候选信息中确定预设数量的目标信息,并对目标信息进行推送。
可选地,信息推送请求包括用户信息;在确定模块12确定与每个候选信息相对应的多样性信息时,该确定模块12可以执行:获取与每个候选信息相对应的多样性分值、以及每个候选信息与用户信息之间的关联信息;根据多样性分值和关联信息确定与每个候选信息相对应的多样性信息。
可选地,在确定模块12根据多样性分值和关联信息确定与每个候选信息相对应的多样性信息时,该确定模块12可以执行:获取与多样性分值相对应的第一系数和与关联信息相对应的第二系数;根据第一系数、多样性分值、关联信息和第二系数确定与每个候选信息相对应的多样性信息。
可选地,在确定模块12根据第一系数、多样性分值、关联信息和第二系数确定与每个候选信息相对应的多样性信息时,该确定模块12可以执行:根据第一系数、多样性分值、关联信息和第二系数,利用以下公式确定与每个候选信息相对应的多样性信息:
Figure BDA0002315406420000371
其中,srank为与候选信息相对应的多样性信息,a1为第一系数,a2为第二系数,sdiversity为与候选信息相对应的多样性分值,smodel为候选信息与用户信息之间的关联信息。
可选地,在确定模块12获取与每个候选信息相对应的多样性分值时,该确定模块12可以执行:获取与每个候选信息相对应的标签多样性分和类目多样性分;对标签多样性分和类目多样性分进行加权求和,获得与每个候选信息相对应的多样性分值。
可选地,在确定模块12获取与每个候选信息相对应的标签多样性分和类目多样性分时,该确定模块12可以执行:获取与每个候选信息相对应的标签多样性矩阵和类目多样性矩阵;根据标签多样性矩阵确定与每个候选信息相对应的标签多样性分;根据类目多样性矩阵确定与每个候选信息相对应的类目多样性分。
可选地,在确定模块12根据标签多样性矩阵确定与每个候选信息相对应的标签多样性分时,该确定模块12可以执行:获取位于标签多样性矩阵中主对角线上的对角元素;将对角元素进行求和处理,获得与每个候选信息相对应的标签多样性分。
可选地,在确定模块12根据类目多样性矩阵确定与每个候选信息相对应的类目多样性分时,该确定模块12可以执行:获取位于类目多样性矩阵中主对角线上的对角元素;将对角元素进行求和处理,获得与每个候选信息相对应的类目多样性分。
可选地,在确定模块12获取与每个候选信息相对应的标签多样性矩阵时,该确定模块12可以执行:获取与用户信息相对应的用户画像矩阵、与候选信息相对应的多样性参数矩阵和标签信息矩阵,其中,用户画像矩阵包括标签信息和与标签信息相对应的权重信息,多样性参数矩阵的对角线元素包括与标签信息相对应的多样性信息,标签信息矩阵的对角线元素包括与候选信息相对应的标签信息;对用户画像矩阵、多样性参数矩阵和标签信息矩阵进行整合,获得与每个候选信息相对应的标签多样性矩阵。
可选地,在确定模块12获取与每个候选信息相对应的类目多样性矩阵时,该确定模块12可以执行:获取与用户信息相对应的用户画像矩阵、与候选信息相对应的多样性参数矩阵和类目信息矩阵,其中,用户画像矩阵包括类目信息和与类目信息相对应的权重信息,多样性参数矩阵的对角线元素包括与类目信息相对应的多样性信息,类目信息矩阵的对角线元素包括与候选信息相对应的类目信息;对用户画像矩阵、多样性参数矩阵和类目信息矩阵进行整合,获得与每个候选信息相对应的类目多样性矩阵。
可选地,在确定模块12获取与用户信息相对应的用户画像矩阵时,该确定模块12可以执行:获取与用户信息相对应的画像矩阵;确定与画像矩阵相对应的偏置矩阵;根据偏置矩阵和画像矩阵确定与用户信息相对应的用户画像矩阵。
可选地,在确定模块12根据偏置矩阵和画像矩阵确定与用户信息相对应的用户画像矩阵时,该确定模块12可以执行:根据偏置矩阵和画像矩阵,利用以下公式确定与用户信息相对应的用户画像矩阵:Utag=BtagU′tag;其中,Utag为经过消偏处理后的用户画像矩阵,Btag为偏置矩阵,U′tag为与用户信息相对应的画像矩阵。
可选地,在确定模块12根据偏置矩阵和画像矩阵确定与用户信息相对应的用户画像矩阵时,该确定模块12可以执行:根据偏置矩阵和画像矩阵,利用以下公式确定与用户信息相对应的用户画像矩阵:
Utag=U′tag-Btag
其中,Utag为经过消偏处理后的用户画像矩阵,Btag为偏置矩阵,U′tag为与用户信息相对应的画像矩阵。
可选地,在确定模块12获取与用户信息相对应的画像矩阵时,该确定模块12可以用于执行:获取与用户信息相对应的标签信息和标签信息的权重信息;基于标签信息和权重信息构建与用户信息相对应的画像矩阵。
可选地,在确定模块12获取与用户信息相对应的画像矩阵时,该确定模块12可以用于执行:获取与用户信息相对应的类目信息和类目信息的权重信息;基于类目信息和权重信息构建与用户信息相对应的画像矩阵。
可选地,在确定模块12确定与画像矩阵相对应的偏置矩阵时,该确定模块12可以用于执行:获取所有用户的画像信息;基于所有用户的画像信息生成偏置矩阵。
可选地,在确定模块12基于所有用户的画像信息生成偏置矩阵时,该确定模块12可以用于执行:根据所有用户的画像信息,计算预设标签信息/预设类目信息对当前用户的重要程度;根据重要程度生成偏置矩阵。
可选地,在确定模块12根据所有用户的画像信息,计算预设标签信息/预设类目信息对当前用户的重要程度时,该确定模块12可以用于执行:获取当前用户画像信息中包括预设标签信息/预设类目信息的第一数量、所有用户画像信息的用户总数、所有用户画像信息中包括预设标签信息/预设类目信息的用户数量;根据第一数量、所有用户画像信息的用户总数和用户数量计算预设标签信息/预设类目信息对当前用户的重要程度。
可选地,在确定模块12根据第一数量、所有用户画像信息的用户总数和用户数量计算预设标签信息对当前用户的重要程度时,该确定模块12可以用于执行:
利用以下公式计算预设标签信息对当前用户的重要程度:
Figure BDA0002315406420000401
其中,tf_iufi为预设标签信息对当前用户的重要程度,|dtag|为当前用户画像信息中包括预设标签信息的第一数量,|U|为所有用户画像信息的用户总数,|{j:i∈dj}|为所有用户画像信息中包括预设标签信息的用户数量。
可选地,在确定模块12根据第一数量、所有用户画像信息的用户总数和用户数量计算预设类目信息对当前用户的重要程度时,该确定模块12可以用于执行:利用以下公式计算预设类目信息对当前用户的重要程度:
Figure BDA0002315406420000402
其中,tf_iufi为预设类目信息对当前用户的重要程度,|dcate|为当前用户画像信息中包括预设类目信息的第一数量,|U|为所有用户画像信息的用户总数,|{j:i∈dj}|为所有用户画像信息中包括预设类目信息的用户数量。
可选地,在确定模块12确定与画像矩阵相对应的偏置矩阵时,该确定模块12可以用于执行:获取所有用户的画像信息;在所有用户画像信息中,获取包括预设标签信息/预设类目信息的第一画像信息,并统计第一画像信息的数量信息;基于所有的预设标签信息/预设类目信息对第一画像信息的权重信息进行累加,获得权重累加值;将权重累加值与数量信息的比值确定为预设标签信息/预设类目信息对用户的平均重要程度;根据平均重要程度生成偏置矩阵。
可选地,在确定模块12获取与候选信息相对应的多样性参数矩阵时,该确定模块12可以用于执行:针对候选信息,提取出候选信息中包括的标签信息/类目信息的权重信息;获取已经下发的信息中包括候选信息中标签信息/类目信息的第一频次、用户已经点击的信息中包括候选信息中标签信息/类目信息的第二频次;根据标签信息/类目信息的权重信息、第一频次和第二频次确定与候选信息相对应的多样性参数矩阵。
可选地,获取已经下发的信息中包括候选信息中标签信息/类目信息的第一频次,包括:获取已下发的信息和包括有标签信息/类目信息的候选信息的信息总数;在预设的信息下发序列中,确定包括有标签信息/类目信息的候选信息的下发位置与当前位置的距离信息;根据信息总数和距离信息确定已经下发的信息中包括候选信息中标签信息/类目信息的第一频次。
可选地,预设的信息下发序列包括已下发的信息和待下发的候选信息。
可选地,在确定模块12根据信息总数和距离信息确定已经下发的信息中包括候选信息中标签信息/类目信息的第一频次时,该确定模块12可以用于执行:
利用以下公式确定已经下发的信息中包括候选信息中标签信息/类目信息的第一频次:
Figure BDA0002315406420000411
其中,mi为已经下发的信息中包括候选信息中标签信息/类目信息的第一频次,s为已下发的信息和包括有标签信息/类目信息的候选信息的信息总数,a为超参数,dj为第j个包括有标签信息/类目信息的候选信息的下发位置与当前位置的距离信息。
可选地,在确定模块12根据标签信息/类目信息的权重信息、第一频次和第二频次确定与候选信息相对应的多样性参数矩阵时,该确定模块12可以用于执行:根据标签信息/类目信息的权重信息、第一频次和第二频次确定虚拟展现次数;根据虚拟展现次数确定与候选信息相对应的多样性参数矩阵。
可选地,在确定模块12根据标签信息/类目信息的权重信息、第一频次和第二频次确定虚拟展现次数时,该确定模块12可以用于执行:
利用以下公式确定虚拟展现次数:
Figure BDA0002315406420000421
其中,ci为虚拟展现次数,mi为已经下发的信息中包括候选信息中标签信息/类目信息的第一频次,ni为用户已经点击的信息中包括候选信息中标签信息/类目信息的第二频次,
Figure BDA0002315406420000422
为提取出候选信息中包括的标签信息/类目信息的权重信息,b为超参数。
可选地,在确定模块12根据虚拟展现次数确定与候选信息相对应的多样性参数矩阵时,该确定模块12可以用于执行:根据虚拟展现次数,利用公式ti=exp(-k*ci)确定与候选信息相对应的对角线的元素,其中,ti为对角线的元素,k为超参数,ci为虚拟展现次数;exp为指数函数;根据对角线的元素ti确定与候选信息相对应的多样性参数矩阵。
可选地,在确定模块12获取与候选信息相对应的标签信息矩阵/类目信息矩阵时,该确定模块12可以用于执行:提取候选信息中包括的标签信息/类目信息;确定与标签信息/类目信息相对应的权重信息;根据标签信息和标签信息相对应的权重信息构建标签信息矩阵;根据类目信息和类目信息相对应的权重信息构建类目信息矩阵。
可选地,在推送模块13对所述目标信息进行推送时,该推送模块13可以用于执行:获取目标对象的用户画像;基于所述用户画像确定所述目标信息的显示方式,并以所确定的显示方式将所述目标信息推送至所述目标对象。
可选地,在所述用户画像中包括语言类型信息时,在推送模块13基于所述用户画像确定所述目标信息的显示方式,并以所确定的显示方式将所述目标信息推送至所述目标对象时,该推送模块13可以用于执行:基于所述用户画像中包括的语言类型信息,将所述目标信息转换为目标显示信息,所述目标显示信息的信息语言类型与所述画像信息中包括的语言类型信息相同;将所述目标显示信息发送至所述目标对象。
可选地,在对目标信息进行推送之后,本实施例中的获取模块11和确定模块12还可以用于执行以下步骤:
获取模块11,用于获取已推送的目标信息的信息熵;
确定模块12,用于根据信息熵识别目标信息的多样性。
可选地,在获取模块11获取已推送的目标信息的信息熵时,该获取模块11可以用于执行:获取与目标信息相对应的预设元素的实际下发比例;根据实际下发比例确定信息熵。
可选地,与目标信息相对应的预设元素包括以下至少之一:实体标签、语义标签、一级类目、二级类目。
可选地,在获取模块11获取与目标信息相对应的预设元素的实际下发比例时,该获取模块11可以用于执行:获取已推送的所有目标信息的信息总数;在已推送的目标信息中,获取包括预设元素的目标信息的信息数量;将信息数量与信息总数的比值确定为实际下发比例。
可选地,在获取模块11根据实际下发比例确定信息熵时,该获取模块11可以用于执行:利用以下公式确定信息熵:
Ex=∑(-1*pi*log(pi))
其中,x为预设的观测维度,观测维度包括以下至少之一:标签维度和类目维度;Ex为信息熵,pi为与目标信息相对应的预设元素i的实际下发比例。
可选地,目标信息的多样性与信息熵的数值呈正相关。
图26所示装置可以执行图1-图25所示实施例的方法,本实施例未详细描述的部分,可参考对图1-图25所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1-图25所示实施例中的描述,在此不再赘述。
在一个可能的设计中,图26所示信息推送装置的结构可实现为一电子设备,该电子设备可以是手机、平板电脑、服务器等各种设备。如图27所示,该电子设备可以包括:处理器21和存储器22。其中,存储器22用于存储相对应电子设备执行上述图1一图25所示实施例中提供的信息推送方法的程序,处理器21被配置为用于执行存储器22中存储的程序。
程序包括一条或多条计算机指令,其中,一条或多条计算机指令被处理器21执行时能够实现如下步骤:
获取信息推送请求;
根据信息推送请求确定多个待推送的候选信息;
确定与每个候选信息相对应的多样性信息;
根据与每个候选信息相对应的多样性信息,在多个候选信息中确定预设数量的目标信息,并对目标信息进行推送。
进一步的,处理器21还用于执行前述图1-图25所示实施例中的全部或部分步骤。
其中,电子设备的结构中还可以包括通信接口23,用于电子设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存电子设备所用的计算机软件指令,其包含用于执行上述图1-图25所示方法实施例中信息推送方法所涉及的程序。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (35)

1.一种信息推送方法,其特征在于,包括:
获取信息推送请求;
根据所述信息推送请求确定多个待推送的候选信息;
确定与每个所述候选信息相对应的多样性信息;
根据与每个所述候选信息相对应的多样性信息,在多个所述候选信息中确定预设数量的目标信息,并对所述目标信息进行推送;
所述信息推送请求包括用户信息;确定与每个所述候选信息相对应的多样性信息,包括:
获取与每个所述候选信息相对应的多样性分值、以及每个所述候选信息与所述用户信息之间的关联信息;
根据所述多样性分值和关联信息确定与每个所述候选信息相对应的多样性信息;
获取与每个所述候选信息相对应的多样性分值,包括:
获取与每个所述候选信息相对应的标签多样性矩阵和类目多样性矩阵;
根据所述标签多样性矩阵确定与每个所述候选信息相对应的标签多样性分;
根据所述类目多样性矩阵确定与每个所述候选信息相对应的类目多样性分;
对所述标签多样性分和所述类目多样性分进行加权求和,获得与每个所述候选信息相对应的多样性分值;
其中,获取与每个所述候选信息相对应的标签多样性矩阵,包括:
获取与所述用户信息相对应的用户画像矩阵、与所述候选信息相对应的多样性参数矩阵和标签信息矩阵,其中,所述用户画像矩阵包括标签信息和与所述标签信息相对应的权重信息,所述多样性参数矩阵的对角线元素包括与标签信息相对应的多样性信息,所述标签信息矩阵的对角线元素包括与所述候选信息相对应的标签信息;
对所述用户画像矩阵、多样性参数矩阵和标签信息矩阵进行整合,获得与每个所述候选信息相对应的标签多样性矩阵。
2.根据权利要求1所述的方法,其特征在于,根据所述多样性分值和关联信息确定与每个所述候选信息相对应的多样性信息,包括:
获取与所述多样性分值相对应的第一系数和与所述关联信息相对应的第二系数;
根据所述第一系数、多样性分值、关联信息和所述第二系数确定与每个所述候选信息相对应的多样性信息。
3.根据权利要求2所述的方法,其特征在于,根据所述第一系数、多样性分值、关联信息和所述第二系数确定与每个所述候选信息相对应的多样性信息,包括:
根据所述第一系数、多样性分值、关联信息和所述第二系数,利用以下公式确定与每个所述候选信息相对应的多样性信息:
其中,srank为与所述候选信息相对应的多样性信息,a1为第一系数,a2为第二系数,sdiversity为与候选信息相对应的多样性分值,smodel为所述候选信息与所述用户信息之间的关联信息。
4.根据权利要求1所述的方法,其特征在于,根据所述标签多样性矩阵确定与每个所述候选信息相对应的标签多样性分,包括:
获取位于所述标签多样性矩阵中主对角线上的对角元素;
将所述对角元素进行求和处理,获得与每个所述候选信息相对应的标签多样性分。
5.根据权利要求1所述的方法,其特征在于,根据所述类目多样性矩阵确定与每个所述候选信息相对应的类目多样性分,包括:
获取位于所述类目多样性矩阵中主对角线上的对角元素;
将所述对角元素进行求和处理,获得与每个所述候选信息相对应的类目多样性分。
6.根据权利要求1所述的方法,其特征在于,获取与每个所述候选信息相对应的类目多样性矩阵,包括:
获取与所述用户信息相对应的用户画像矩阵、与所述候选信息相对应的多样性参数矩阵和类目信息矩阵,其中,所述用户画像矩阵包括类目信息和与所述类目信息相对应的权重信息,所述多样性参数矩阵的对角线元素包括与类目信息相对应的多样性信息,所述类目信息矩阵的对角线元素包括与所述候选信息相对应的类目信息;
对所述用户画像矩阵、多样性参数矩阵和类目信息矩阵进行整合,获得与每个所述候选信息相对应的类目多样性矩阵。
7.根据权利要求5或6所述的方法,其特征在于,获取与所述用户信息相对应的用户画像矩阵,包括:
获取与所述用户信息相对应的画像矩阵;
确定与所述画像矩阵相对应的偏置矩阵;
根据所述偏置矩阵和所述画像矩阵确定与所述用户信息相对应的用户画像矩阵。
8.根据权利要求7所述的方法,其特征在于,根据所述偏置矩阵和所述画像矩阵确定与所述用户信息相对应的用户画像矩阵,包括:
根据所述偏置矩阵和所述画像矩阵,利用以下公式确定与所述用户信息相对应的用户画像矩阵:
Utag=BtagUtag
其中,Utag为经过消偏处理后的用户画像矩阵,Btag为偏置矩阵,Utag为与所述用户信息相对应的画像矩阵。
9.根据权利要求7所述的方法,其特征在于,根据所述偏置矩阵和所述画像矩阵确定与所述用户信息相对应的用户画像矩阵,包括:
根据所述偏置矩阵和所述画像矩阵,利用以下公式确定与所述用户信息相对应的用户画像矩阵:
Utag=Utag-Btag
其中,Utag为经过消偏处理后的用户画像矩阵,Btag为偏置矩阵,Utag为与所述用户信息相对应的画像矩阵。
10.根据权利要求7所述的方法,其特征在于,获取与所述用户信息相对应的画像矩阵,包括:
获取与所述用户信息相对应的标签信息和所述标签信息的权重信息;
基于所述标签信息和权重信息构建与所述用户信息相对应的画像矩阵。
11.根据权利要求7所述的方法,其特征在于,获取与所述用户信息相对应的画像矩阵,包括:
获取与所述用户信息相对应的类目信息和所述类目信息的权重信息;
基于所述类目信息和权重信息构建与所述用户信息相对应的画像矩阵。
12.根据权利要求8所述的方法,其特征在于,确定与所述画像矩阵相对应的偏置矩阵,包括:
获取所有用户的画像信息;
基于所有用户的画像信息生成偏置矩阵。
13.根据权利要求12所述的方法,其特征在于,基于所有用户的画像信息生成偏置矩阵,包括:
根据所有用户的画像信息,计算预设标签信息/预设类目信息对当前用户的重要程度;
根据所述重要程度生成所述偏置矩阵。
14.根据权利要求13所述的方法,其特征在于,根据所有用户的画像信息,计算预设标签信息/预设类目信息对当前用户的重要程度,包括:
获取当前用户画像信息中包括预设标签信息/预设类目信息的第一数量、所有用户画像信息的用户总数、所有用户画像信息中包括预设标签信息/预设类目信息的用户数量;
根据所述第一数量、所有用户画像信息的用户总数和所述用户数量计算预设标签信息/预设类目信息对当前用户的重要程度。
15.根据权利要求14所述的方法,其特征在于,根据所述第一数量、所有用户画像信息的用户总数和所述用户数量计算预设标签信息对当前用户的重要程度,包括:
利用以下公式计算预设标签信息对当前用户的重要程度:
其中,tf_iufi为预设标签信息对当前用户的重要程度,|dtag|为当前用户画像信息中包括预设标签信息的第一数量,|U|为所有用户画像信息的用户总数,|{j:i∈dj}|为所有用户画像信息中包括预设标签信息的用户数量,i为预设标签信息,i∈dj为用户画像信息中包括预设标签信息,j为所有用户画像信息中包括预设标签信息的用户数量。
16.根据权利要求14所述的方法,其特征在于,根据所述第一数量、所有用户画像信息的用户总数和所述用户数量计算预设类目信息对当前用户的重要程度,包括:
利用以下公式计算预设类目信息对当前用户的重要程度:
其中,tf_iufi为预设类目信息对当前用户的重要程度,|dcate|为当前用户画像信息中包括预设类目信息的第一数量,|U|为所有用户画像信息的用户总数,|{j:i∈dj}|为所有用户画像信息中包括预设类目信息的用户数量,i为预设类目信息,i∈dj为用户画像信息中包括预设类目信息,j为所有用户画像信息中包括预设类目信息的用户数量。
17.根据权利要求9所述的方法,其特征在于,确定与所述画像矩阵相对应的偏置矩阵,包括:
获取所有用户的画像信息;
在所有用户画像信息中,获取包括预设标签信息/预设类目信息的第一画像信息,并统计所述第一画像信息的数量信息;
基于所有的所述预设标签信息/预设类目信息对所述第一画像信息的权重信息进行累加,获得权重累加值;
将所述权重累加值与所述数量信息的比值确定为预设标签信息/预设类目信息对用户的平均重要程度;
根据所述平均重要程度生成所述偏置矩阵。
18.根据权利要求1或6所述的方法,其特征在于,获取与所述候选信息相对应的多样性参数矩阵,包括:
针对所述候选信息,提取出所述候选信息中包括的标签信息/类目信息的权重信息;
获取已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次、用户已经点击的信息中包括所述候选信息中标签信息/类目信息的第二频次;
根据所述标签信息/类目信息的权重信息、第一频次和第二频次确定与所述候选信息相对应的多样性参数矩阵。
19.根据权利要求18所述的方法,其特征在于,获取已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次,包括:
获取已下发的信息和包括有所述标签信息/类目信息的候选信息的信息总数;
在预设的信息下发序列中,确定包括有所述标签信息/类目信息的候选信息的下发位置与当前位置的距离信息;
根据所述信息总数和距离信息确定已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次。
20.根据权利要求19所述的方法,其特征在于,预设的所述信息下发序列包括已下发的信息和待下发的候选信息。
21.根据权利要求19所述的方法,其特征在于,根据所述信息总数和距离信息确定已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次,包括:
利用以下公式确定已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次:
其中,mi为已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次,s为已下发的信息和包括有所述标签信息/类目信息的候选信息的信息总数,a为超参数,dj为第j个包括有所述标签信息/类目信息的候选信息的下发位置与当前位置的距离信息。
22.根据权利要求18所述的方法,其特征在于,根据所述标签信息/类目信息的权重信息、第一频次和第二频次确定与所述候选信息相对应的多样性参数矩阵,包括:
根据所述标签信息/类目信息的权重信息、第一频次和第二频次确定虚拟展现次数;
根据所述虚拟展现次数确定与所述候选信息相对应的多样性参数矩阵。
23.根据权利要求22所述的方法,其特征在于,根据所述标签信息/类目信息的权重信息、第一频次和第二频次确定虚拟展现次数,包括:
利用以下公式确定虚拟展现次数:
其中,ci为虚拟展现次数,mi为已经下发的信息中包括所述候选信息中标签信息/类目信息的第一频次,ni为用户已经点击的信息中包括所述候选信息中标签信息/类目信息的第二频次,为提取出所述候选信息中包括的标签信息/类目信息的权重信息,b为超参数。
24.根据权利要求22所述的方法,其特征在于,根据所述虚拟展现次数确定与所述候选信息相对应的多样性参数矩阵,包括:
根据所述虚拟展现次数,利用公式ti=exp(-k*ci)确定与所述候选信息相对应的对角线的元素,其中,ti为对角线的元素,k为超参数,ci为虚拟展现次数;exp为指数函数;
根据所述对角线的元素ti确定与所述候选信息相对应的多样性参数矩阵。
25.根据权利要求1或6所述的方法,其特征在于,获取与所述候选信息相对应的标签信息矩阵/类目信息矩阵,包括:
提取所述候选信息中包括的标签信息/类目信息;
确定与所述标签信息/类目信息相对应的权重信息;
根据所述标签信息和所述标签信息相对应的权重信息构建所述标签信息矩阵;
根据所述类目信息和所述类目信息相对应的权重信息构建所述类目信息矩阵。
26.根据权利要求1-6中任意一项所述的方法,其特征在于,对所述目标信息进行推送,包括:
获取目标对象的用户画像;
基于所述用户画像确定所述目标信息的显示方式,并以所确定的显示方式将所述目标信息推送至所述目标对象。
27.根据权利要求26所述的方法,其特征在于,在所述用户画像中包括语言类型信息时,基于所述用户画像确定所述目标信息的显示方式,并以所确定的显示方式将所述目标信息推送至所述目标对象,包括:
基于所述用户画像中包括的语言类型信息,将所述目标信息转换为目标显示信息,所述目标显示信息的信息语言类型与所述画像信息中包括的语言类型信息相同;
将所述目标显示信息发送至所述目标对象。
28.根据权利要求1-6中任意一项所述的方法,其特征在于,在对所述目标信息进行推送之后,所述方法还包括:
获取已推送的所述目标信息的信息熵;
根据所述信息熵识别所述目标信息的多样性。
29.根据权利要求28所述的方法,其特征在于,获取已推送的所述目标信息的信息熵,包括:
获取与所述目标信息相对应的预设元素的实际下发比例;
根据所述实际下发比例确定所述信息熵。
30.根据权利要求29所述的方法,其特征在于,与所述目标信息相对应的预设元素包括以下至少之一:实体标签、语义标签、一级类目、二级类目。
31.根据权利要求29所述的方法,其特征在于,获取与所述目标信息相对应的预设元素的实际下发比例,包括:
获取已推送的所有目标信息的信息总数;
在已推送的所述目标信息中,获取包括预设元素的所述目标信息的信息数量;
将所述信息数量与所述信息总数的比值确定为所述实际下发比例。
32.根据权利要求29所述的方法,其特征在于,根据所述实际下发比例确定所述信息熵,包括:
利用以下公式确定所述信息熵:
Ex=∑(-1*pi*log(pi))
其中,x为预设的观测维度,所述观测维度包括以下至少之一:标签维度和类目维度;Ex为信息熵,pi为与所述目标信息相对应的预设元素i的实际下发比例。
33.根据权利要求28所述的方法,其特征在于,所述目标信息的多样性与所述信息熵的数值呈正相关。
34.一种信息推送装置,其特征在于,包括:
获取模块,用于获取信息推送请求;
确定模块,用于根据所述信息推送请求确定多个待推送的候选信息;
所述确定模块,还用于确定与每个所述候选信息相对应的多样性信息;
推送模块,用于根据与每个所述候选信息相对应的多样性信息,在多个所述候选信息中确定预设数量的目标信息,并对所述目标信息进行推送;
所述信息推送请求包括用户信息;所述确定模块,还用于获取与每个所述候选信息相对应的多样性分值、以及每个所述候选信息与所述用户信息之间的关联信息;根据所述多样性分值和关联信息确定与每个所述候选信息相对应的多样性信息;
所述确定模块,还用于获取与每个所述候选信息相对应的标签多样性矩阵和类目多样性矩阵;根据所述标签多样性矩阵确定与每个所述候选信息相对应的标签多样性分;根据所述类目多样性矩阵确定与每个所述候选信息相对应的类目多样性分;对所述标签多样性分和所述类目多样性分进行加权求和,获得与每个所述候选信息相对应的多样性分值;
其中,所述确定模块,还用于获取与所述用户信息相对应的用户画像矩阵、与所述候选信息相对应的多样性参数矩阵和标签信息矩阵,其中,所述用户画像矩阵包括标签信息和与所述标签信息相对应的权重信息,所述多样性参数矩阵的对角线元素包括与标签信息相对应的多样性信息,所述标签信息矩阵的对角线元素包括与所述候选信息相对应的标签信息;对所述用户画像矩阵、多样性参数矩阵和标签信息矩阵进行整合,获得与每个所述候选信息相对应的标签多样性矩阵。
35.一种电子设备,其特征在于,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求1-33中任意一项所述的信息推送方法。
CN201911275329.8A 2019-12-12 2019-12-12 信息推送方法、装置及设备 Active CN112995248B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911275329.8A CN112995248B (zh) 2019-12-12 2019-12-12 信息推送方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911275329.8A CN112995248B (zh) 2019-12-12 2019-12-12 信息推送方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112995248A CN112995248A (zh) 2021-06-18
CN112995248B true CN112995248B (zh) 2023-04-07

Family

ID=76331644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911275329.8A Active CN112995248B (zh) 2019-12-12 2019-12-12 信息推送方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112995248B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590936B (zh) * 2021-07-02 2023-11-14 支付宝(杭州)信息技术有限公司 信息推送的方法及装置
CN116684481B (zh) * 2023-08-01 2023-11-21 国家计算机网络与信息安全管理中心 推送信息同质化的处理方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507016A (zh) * 2017-06-29 2017-12-22 北京三快在线科技有限公司 一种消息推送方法和系统
CN109785045A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 一种基于用户行为数据的推送方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103973461A (zh) * 2013-02-06 2014-08-06 阿里巴巴集团控股有限公司 一种通知消息的推送方法及消息服务器
CN106228386B (zh) * 2016-07-12 2018-09-25 腾讯科技(深圳)有限公司 一种信息推送方法及装置
CN109086439B (zh) * 2018-08-15 2022-02-25 腾讯科技(深圳)有限公司 信息推荐方法及装置
CN109190024B (zh) * 2018-08-20 2023-04-07 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN110489644B (zh) * 2019-08-13 2024-06-25 腾讯科技(北京)有限公司 信息推送方法、装置、计算机可读存储介质和计算机设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507016A (zh) * 2017-06-29 2017-12-22 北京三快在线科技有限公司 一种消息推送方法和系统
CN109785045A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 一种基于用户行为数据的推送方法和装置

Also Published As

Publication number Publication date
CN112995248A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
US9753962B2 (en) Systems, methods, and apparatuses for populating a table having null values using a predictive query interface
Lahdelma et al. Prospect theory and stochastic multicriteria acceptability analysis (SMAA)
CN106855876A (zh) 基于媒体内容的推荐的属性加权
Fang et al. Topics in tweets: A user study of topic coherence metrics for Twitter data
KR101725510B1 (ko) 사용자 성향을 고려한 소셜 이벤트 추천 방법 및 장치
CN112995248B (zh) 信息推送方法、装置及设备
JP2017054214A (ja) 判定装置、学習装置、情報配信装置、判定方法及び判定プログラム
US11157657B2 (en) Mixed data fingerprinting with principal components analysis
Borges et al. On measuring popularity bias in collaborative filtering data
CN114119136A (zh) 一种产品推荐方法、装置、电子设备和介质
CN117390289B (zh) 基于用户画像的房屋建造方案推荐方法、装置、设备
Patoulia et al. A comparative study of collaborative filtering in product recommendation
De Waal et al. Quality measures for multisource statistics
Natarajan et al. Optimized fuzzy-based group recommendation with parallel computation
CN110766488A (zh) 一种自动确定主题场景的方法和装置
Kushwaha et al. Inclusion of semantic and time-variant information using matrix factorization approach for implicit rating of last. fm dataset
Baxla Comparative study of similarity measures for item based top n recommendation
CN116523024B (zh) 召回模型的训练方法、装置、设备及存储介质
Yu et al. Venuenet: Fine-grained venue discovery by deep correlation learning
Luu et al. Do your friends make you buy this brand? Modeling social recommendation with topics and brands
US20230177581A1 (en) Product metadata suggestion using embeddings
Ren et al. Aunet: An unsupervised method for answer reliability evaluation in community QA systems
Anderst-Kotsis et al. Evaluating Customer Satisfaction: Using Behavioral Analytics of Data-Intensive Software Systems
Mohit YOUTUBE DATA CLASSIFICATION BASED ON SENTIMENT ANALYSIS
CN113934872A (zh) 一种搜索结果的排序方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant