CN115563317A - 多媒体内容的推送方法、装置、设备及存储介质 - Google Patents

多媒体内容的推送方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115563317A
CN115563317A CN202110749793.7A CN202110749793A CN115563317A CN 115563317 A CN115563317 A CN 115563317A CN 202110749793 A CN202110749793 A CN 202110749793A CN 115563317 A CN115563317 A CN 115563317A
Authority
CN
China
Prior art keywords
multimedia content
service
content
account
user account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110749793.7A
Other languages
English (en)
Inventor
张思远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110749793.7A priority Critical patent/CN115563317A/zh
Publication of CN115563317A publication Critical patent/CN115563317A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/487Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种多媒体内容的推送方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:获取多媒体内容关联的服务位置信息和服务内容信息;将服务位置信息和服务内容信息输入至人群定向联合模型,得到多媒体内容的服务地理特征和服务偏好特征;将服务地理特征和服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到各个用户帐号针对多媒体内容的转化倾向参数;根据转化倾向参数推送多媒体内容。本申请实施例提供的技术方案,通过排序一致性条件来训练人群定向联合模型,并且仅需服务位置和服务内容便可确定出多媒体内容的的转化倾向参数并进行人群定向和内容推送,提升人群定向质量,提升多媒体内容推送效率。

Description

多媒体内容的推送方法、装置、设备及存储介质
技术领域
本申请涉及人工智能技术领域,特别涉及一种多媒体内容的推送方法、装置、设备及存储介质。
背景技术
多媒体内容发布者在投放多媒体内容之前,需要在投放端圈定定向人群作为定向条件,人群定向是投放多媒体内容的首要步骤。
相关技术中,对于需要投放多媒体内容的新发布者,例如本地餐饮商家或者本地商超商家,因为多媒体内容的新发布者缺乏历史行为人群,只能提取历史到访所在城市的人群作为人群定向。
相关技术中,人群定向的质量较低,多媒体内容推送效率较低。
发明内容
本申请实施例提供了一种多媒体内容的推送方法、装置、设备及存储介质,能够提升人群定向质量,降低对历史数据的依赖,提升多媒体内容推送效率。
根据本申请实施例的一个方面,提供了一种多媒体内容的推送方法,所述方法包括:
获取多媒体内容关联的服务位置信息和服务内容信息;
将所述服务位置信息和所述服务内容信息输入至人群定向联合模型,得到所述多媒体内容的服务地理特征和服务偏好特征;
将所述服务地理特征和所述服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到所述各个用户帐号针对所述多媒体内容的转化倾向参数;
根据所述转化倾向参数推送所述多媒体内容;
其中,所述人群定向联合模型基于排序一致性约束条件训练得到,所述排序一致性约束条件是指用户帐号对于目标多媒体内容的转化数据与所述用户帐号针对所述目标多媒体内容的目标转化倾向参数呈正相关。
根据本申请实施例的一个方面,提供了一种多媒体内容的推送装置,所述装置包括:
服务信息获取模块,用于获取多媒体内容关联的服务位置信息和服务内容信息;
服务特征确定模块,用于将所述服务位置信息和所述服务内容信息输入至人群定向联合模型,得到所述多媒体内容的服务地理特征和服务偏好特征;
转化参数预测模块,用于将所述服务地理特征和所述服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到所述各个用户帐号针对所述多媒体内容的转化倾向参数;
内容推送模块,用于根据所述转化倾向参数推送所述多媒体内容;
其中,所述人群定向联合模型基于排序一致性约束条件训练得到,所述排序一致性约束条件是指用户帐号对于目标多媒体内容的转化数据与所述用户帐号针对所述目标多媒体内容的目标转化倾向参数呈正相关。
根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述多媒体内容的推送方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述多媒体内容的推送方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述多媒体内容的推送方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过设置用户帐号对于同一多媒体内容的转化数据与转化倾向参数呈正相关的排序一致性约束条件,来训练人群定向联合模型,使得人群定向联合模型仅需要多媒体内容的服务位置和服务内容便可确定出多媒体内容的服务地理特征和服务偏好特征,并能够结合上述服务地理特征、服务偏好特征和帐号特征,预测出衡量用户对多媒体内容进行转化的参数,进而可以根据参数进行人群定向并推送多媒体内容。通过上述排序一致性约束条件,能够使得新用户在没有历史数据或者历史数据较为稀疏的情况下,仍可为新发布的多媒体内容进行较为准确的人群定向,提升人群定向质量,降低对历史数据的依赖,从而提升多媒体内容推送效率,避免对计算资源造成浪费,减轻设备运行压力。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的应用程序运行环境的示意图;
图2是本申请一个实施例提供的多媒体内容的推送方法的流程图;
图3是本申请一个实施例提供的多媒体内容的推送方法的流程图;
图4示例性示出了一种人群定向联合模型的训练流程图;
图5是本申请另一个实施例提供的多媒体内容的推送方法的流程图;
图6示例性示出了一种推送多媒体内容的流程示意图;
图7是本申请一个实施例提供的多媒体内容的推送装置的框图;
图8是本申请一个实施例提供的计算机设备的结构框图。
具体实施方式
本申请实施例提供的多媒体内容的推送方法涉及人工智能技术以及云技术,下面对此进行简要说明,以便于本领域技术人员理解。
云计算(Cloud Computing)指IT(Internet Technology,互联网技术)基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。云计算是网格计算(Grid Computing)、分布式计算(DistributedComputing)、并行计算(Parallel Computing)、效用计算(UtilityComputing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。
随着互联网、实时数据流、连接设备多样化的发展,以及搜索服务、社会网络、移动商务和开放协作等需求的推动,云计算迅速发展起来。不同于以往的并行分布式计算,云计算的产生从理念上将推动整个互联网模式、企业管理模式发生革命性的变革。在本申请实施例提供的多媒体内容的推送方法中,可通过云端服务器来进行人群定向并推送多媒体内容。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的多媒体内容的推送方法涉及上述人工智能的自然语言处理、机器学习等技术,具体通过如下实施例进行说明。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,其示出了本申请一个实施例提供的应用程序运行环境的示意图。该应用程序运行环境可以包括:终端10和服务器20。
终端10可以是诸如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备、PC(Personal Computer,个人计算机)等电子设备。终端10中可以安装应用程序的客户端。
在本申请实施例中,上述应用程序可以是任何能够推送多媒体内容的应用程序。典型地,该应用程序为信息流内容服务应用程序。当然,除了信息流内容服务应用程序之外,其它类型的应用程序中也可以提供推送多媒体内容的服务。例如,新闻类应用程序、社交类应用程序、互动娱乐类应用程序、浏览器应用程序、购物类应用程序、内容分享类应用程序、虚拟现实(Virtual Reality,VR)类应用程序、增强现实(Augmented Reality,AR)类应用程序等,本申请实施例对此不作限定。另外,对于不同的应用程序来说,其推送的多媒体内容也会有所不同,且相应的功能也会有所不同,这都可以根据实际需求预先进行配置,本申请实施例对此不作限定。可选地,终端10中运行有上述应用程序的客户端。
服务器20用于为终端10中的应用程序的客户端提供后台服务。例如,服务器20可以是上述应用程序的后台服务器。服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content DeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,服务器20同时为多个终端10中的应用程序提供后台服务。
可选地,终端10和服务器20之间可通过网络30进行互相通信。终端10以及服务器20可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
请参考图2,其示出了本申请一个实施例提供的多媒体内容的推送方法的流程图。该方法可应用于计算机设备中,所述计算机设备是指具备数据计算和处理能力的电子设备,如各步骤的执行主体可以是图1所示的应用程序运行环境中的服务器20。该方法可以包括以下几个步骤(210~240)。
步骤210,获取多媒体内容关联的服务位置信息和服务内容信息。
上述多媒体内容关联的服务位置也可以是多媒体内容的发布者的地理位置。上述服务位置信息包括位置的经纬度坐标。上述服务内容信息可以是多媒体内容中的文本信息,也可以是对多媒体内容进行特征提取得到标签信息。例如,多媒体内容包括图像,可对图像进行语义识别,得到图像对应的分类标签作为服务内容信息。
在一种可能的实施方式中,上述多媒体内容为本地生活服务广告,上述多媒体内容关联的服务位置信息可以是本地生活服务广告对应的服务地址的经纬度数据,上述服务内容信息可以是本地生活服务广告的广告文案,或者是本地生活服务广告对应的行业标签,又或者是广告主自行根据生活服务内容添加的标签。
步骤220,将服务位置信息和服务内容信息输入至人群定向联合模型,得到多媒体内容的服务地理特征和服务偏好特征。
其中,人群定向联合模型基于排序一致性约束条件训练得到,排序一致性约束条件是指用户帐号对于目标多媒体内容的转化数据与用户帐号针对目标多媒体内容的目标转化倾向参数呈正相关。
上述服务地理特征用于衡量多媒体内容对城市中不同服务区域之间的影响力。上述服务偏好特征用于衡量不同多媒体内容之间的转化行为的相似性。
上述转化倾向参数可通过步骤230确定,即转化倾向参数是根据服务地理特征和服务偏好特征确定。
例如,用户a对多媒体内容b的转化次数大于用户c对多媒体内容b的转化次数,那么用户a对多媒体内容b的转化倾向参数值也应该大于用户c对多媒体内容b的转化倾向参数值。
在一种可能的实施方式中,上述服务地理特征为多媒体内容在目标地理特征空间的向量表示,即多媒体内容的地理特征向量。
在一种可能的实施方式中,上述服务偏好特征为多媒体内容在目标偏好特征空间的向量表示,即多媒体内容的偏好特征向量。
在示例性实施例中,如图3所示,图3示出了本申请一个实施例提供的多媒体内容的推送方法的流程图。上述步骤220包括如下子步骤(221-223)。
步骤221,将服务位置信息与各个服务区域的区域位置信息进行对比,得到服务地理特征。
上述区域位置信息包括区域中心位置,例如区域中心对应的经纬度坐标。将服务位置与区域中心位置进行对比,得到多媒体内容的地理特征向量。
在一种可能的实施方式中,获取各个服务区域的区域中心位置;基于服务位置与各个服务区域的区域中心位置,确定多媒体内容的地理特征向量,地理特征向量包括用户从第k个区域中心移动至服务位置的概率。
可选地,上述多媒体内容的地理特征向量的确定方法可以参见下文实施例中多媒体内容的地理特征向量gj的方法,这里不再赘述。
步骤222,基于服务位置信息和服务内容信息对至少一种多媒体内容语义图进行更新,得到更新后的多媒体内容语义图。
至少一种多媒体内容语义图用于表征各个多媒体内容与不同语义节点集合之间的关联程度。
可选地,至少一种多媒体内容语义图包括下文实施例中内容与内容语义图GLL、内容与转化时间语义图GLT、内容与标签语义图GLW、内容与区域语义图GLR、内容与邻近用户语义图GLU中至少一种。
相应的,上述语义节点集合可以是下文实施例中的所有多媒体内容集合L、转化时间集合T、所有语义标签的集合W、区域集合R、目标时段内对指定多媒体内容的服务位置200米范围内对多媒体内容有转化行为的用户帐号集合U。
在一种可能的实施方式中,上述多媒体内容是新发布的多媒体内容,可将多媒体内容的服务位置信息和服务内容信息添加至多媒体内容语义图中,更新多媒体内容语义图的图结构数据。
步骤223,基于更新后的多媒体内容语义图对应的图结构数据,确定多媒体内容的服务偏好特征。
在一种可能的实施方式中,通过图表示学习方法,对多媒体内容语义图对应的图结构数据进行特征提取,确定多媒体内容的偏好特征向量。可选地,多媒体内容的偏好特征向量可以是下文实施例中的vj
在示例性实施例中,如图4所示,图4示例性示出了一种人群定向联合模型的训练流程图。上述人群定向联合模型的训练过程包括如下步骤(410-430)。
步骤410,获取样本数据日志。
样本数据日志包括样本用户帐号针对样本多媒体内容的行为数据记录,行为数据记录包括样本多媒体内容的标签信息,标签信息为样本用户帐号对样本多媒体内容的转化数据。
在一些实施例中,上述样本数据日志包括第一日志记录和第二日志记录。上述第一日志记录的记录格式可以是(样本用户帐号,样本多媒体内容标识号,曝光次数,点击次数,转化次数)。上述第二日志记录的记录格式可以是(样本用户帐号,样本多媒体内容标识号,转化时间)。
步骤420,根据样本数据日志,确定样本多媒体内容的服务信息、样本用户帐号的用户画像数据以及至少一种多媒体内容样本语义图。
在一种可能的实施方式中,上述样本多媒体内容的服务信息可以直接从样本数据日志中提取得到,上述样本用户帐号的用户画像数据可以通过对样本用户帐号的历史转化数据确定,上述多媒体内容样本语义图的构建方法可以参考内容与内容语义图GLL、内容与转化时间语义图GLT、内容与标签语义图GLW、内容与区域语义图GLR、内容与邻近用户语义图GLU的构建方法。
步骤430,基于样本多媒体内容的服务信息、样本用户帐号的用户画像数据以及至少一种多媒体内容样本语义图,并按照联合约束条件训练人群定向联合模型,直至人群定向联合模型的输出结果满足联合约束条件。
其中,联合约束条件包括排序一致性约束条件和语义图损失条件。
在一种可能的实施方式中,上述联合约束条件可以通过下文实施例中的数学表达式(18)表达,上述联合约束条件为最终的损失函数
Figure BDA0003145662060000081
满足损失条件。
在一种可能的实施方式中,上述排序一致性约束条件可以通过下文实施例中的数学表达式(12)表达。
在一种可能的实施方式中,上述语义图损失条件可以通过下文实施例中的数学表达式(17)表达。
步骤230,将服务地理特征和服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到各个用户帐号针对多媒体内容的转化倾向参数。
在一种可能的实施方式中,上述转化倾向参数为一个值,用于表征各个用户帐号在多媒体内容上发生转化行为的概率。
上述融合可以是计算特征距离,也可是特征向量之前的向量内积,本申请实施例对此不作限定。
在示例性实施例中,如图3所示,上述方法还包括如下步骤(250-270)。
步骤250,获取数据日志。
数据日志包括各个用户帐号针对各个多媒体内容的行为数据记录。
在一些实施例中,上述数据日志包括第一日志记录和第二日志记录。上述第一日志记录和第二日志记录均是各个用户帐号针对各个多媒体内容的行为数据记录,记录数据可以不同。上述第一日志记录的记录格式可以是(用户帐号,多媒体内容标识号,曝光次数,点击次数,转化次数)。上述第二日志记录的记录格式可以是(用户帐号,多媒体内容标识号,转化时间)。
步骤260,根据行为数据记录,生成至少一种多媒体内容语义图。
其中,至少一种多媒体内容语义图包括内容与内容语义图、内容与转化时间语义图、内容与标签语义图、内容与区域语义图、内容与邻近用户语义图中至少一种。
可选地,上述步骤260的具体实施过程可以参见下述内容与内容语义图GLL、内容与转化时间语义图GLT、内容与标签语义图GLW、内容与区域语义图GLR、内容与邻近用户语义图GLU的构建方法。
步骤270,基于数据日志和至少一种多媒体内容语义图,确定各个用户帐号的帐号特征。
在示例性实施例中,如图5所示,图5是本申请一个实施例提供的多媒体内容的推送方法的流程图。上述帐号特征包括帐号地理特征和帐号偏好特征,上述步骤270包括如下子步骤(271-272)。
步骤271,将各个用户帐号的用户画像数据输入至人群定向联合模型进行特征提取处理,得到各个用户帐号的帐号偏好特征。
上述用户画像数据基于数据日志生成。上述帐号偏好特征用于衡量不同用户帐号之间的转化行为的相似性。可选地,上述帐号偏好特征可以是下文实施例中用户的偏好特征向量vi
在一种可能的实施方式中,将各个用户帐号的用户画像数据分别输入至预先训练好的神经网络模型进行特征提取,得到用户的偏好特征向量,上述预先训练好的神经网络模型可以是由一个3层的神经网络构成,而神经网络模型的参数为训练参数由模型学习得到,并且上述神经网络模型受上述联合约束条件约束。
步骤272,将至少一种多媒体内容语义图对应的图结构数据输入至人群定向联合模型,得到各个用户帐号的帐号地理特征。
上述帐号地理特征用于衡量用户帐号对城市中不同服务区域之间的影响力。在一种可能的实施方式中,上述帐号地理特征可以是用户帐号的地理特征向量。可选地,上述帐号地理特征可以是用户的地理特征向量gj,包括用户帐号在每个服务区域对多媒体内容的期望转化次数。
相应的,如图5所示,上述步骤230包括如下子步骤(231-233)。
步骤231,对于每一用户帐号,基于服务地理特征与用户帐号的帐号地理特征,确定地理特征参数。
在一种可能的实施方式中,上述地理特征参数可以是多媒体内容的地理特征向量与用户帐号的地理特征向量的向量内积,通过多媒体内容的地理特征向量与用户帐号的地理特征向量进行点乘得到。
步骤232,基于服务偏好特征与用户帐号的帐号偏好特征,确定偏好特征参数。
在一种可能的实施方式中,上述偏好特征参数可以是多媒体内容的偏好特征向量与用户帐号的偏好特征向量的向量内积,通过多媒体内容的偏好特征向量与用户帐号的偏好特征向量进行点乘得到。
步骤233,根据地理特征参数与偏好特征参数,确定用户帐号针对多媒体内容的转化倾向参数。
在一种可能的实施方式中,上述转化倾向参数是上述多媒体内容的地理特征向量与用户帐号的地理特征向量的向量内积,与多媒体内容的偏好特征向量与用户帐号的偏好特征向量的向量内积的和,即上述两种向量内积的和。
可选地,转化倾向参数可以是下文实施例中的转化倾向得分yij
最终生成各个用户帐号针对多媒体内容的转化倾向参数。
步骤240,根据转化倾向参数推送多媒体内容。
在示例性实施例中,如图3所示,上述步骤240包括如下子步骤(241-242)。
步骤241,确定符合转化倾向参数条件的目标转化倾向参数对应的目标用户帐号。
在一种可能的实施方式中,上述转化倾向参数条件为阈值条件,比如转化倾向参数的参数值大于预设参数阈值。相应的,上述目标转化倾向参数为参数值大于预设参数阈值的转化倾向参数。
上述目标用户帐号为目标转化倾向参数对应的用户帐号。上述目标用户帐号对应的用户可构成一个用户群体,即人群定向的结果
步骤242,向目标用户帐号推送多媒体内容。
在目标用户帐号接入目标流量域的情况下,向目标用户帐号推送多媒体内容。
上述目标流量域可以是投放多媒体内容的流量域,例如某一社交应用的流量域。
在示例性实施例中,如图5所示,上述方法还包括如下步骤(280-310)。
步骤280,获取多媒体内容对应的转化用户帐号。
在一些实施例中,新的多媒体内容在投放或者推送之后,可能会有转化行为发生,因此可以获取多媒体内容对应的转化用户帐号。上述转化用户帐号是指对在多媒体内容上发生转化行为的用户帐号。
步骤290,对转化用户帐号的帐号特征进行平均化处理,得到转化用户帐号的平均帐号特征。
在一种可能的实施方式中,转化用户帐号的偏好特征向量进行平均池化操作,得到用户侧的平均偏好特征向量。
步骤300,基于平均帐号特征和服务偏好特征,确定多媒体内容的实时服务偏好特征。
在一种可能的实施方式中,将上述平均偏好特征向量与多媒体内容的偏好特征向量进行相加,得到多媒体内容实时的偏好特征向量
步骤310,根据实时服务偏好特征更新转化倾向参数。
在一种可能的实施方式中,根据多媒体内容实时的偏好特征向量,重新计算上述转化倾向参数,以更新目标用户帐号对应的用户群体,使得人群定向质量更高,进而得到更好的多媒体内容投放效果。
综上所述,本申请实施例提供的技术方案,通过设置用户帐号对于同一多媒体内容的转化数据与转化倾向参数呈正相关的排序一致性约束条件,来训练人群定向联合模型,使得人群定向联合模型仅需要多媒体内容的服务位置和服务内容便可确定出多媒体内容的服务地理特征和服务偏好特征,并能够结合上述服务地理特征、服务偏好特征和帐号特征,预测出衡量用户对多媒体内容进行转化的参数,进而可以根据参数进行人群定向并推送多媒体内容。通过上述排序一致性约束条件,能够使得新用户在没有历史数据或者历史数据较为稀疏的情况下,仍可为新发布的多媒体内容进行较为准确的人群定向,提升人群定向质量,降低对历史数据的依赖,从而提升多媒体内容推送效率,避免对计算资源造成浪费,减轻设备运行压力。
在一个示例中,如图6所示,其示例性示出了一种推送多媒体内容的流程示意图。线下流程(步骤1到步骤4)作用是每日生成用户和多媒体内容相关的特征向量并写入数据引擎用于快速检索。线上流程(步骤5)作用是:1)在多媒体内容发布这第一次创建本地生活服务广告时生成人群定向;2)自动更新时给正在投放中的多媒体内容发布者生成新的人群定向条件。
步骤1:获取多媒体内容的数据日志。
在一种可能的实施方式中,上述数据日志包括用户帐号与历史多媒体内容之间的交互数据,所述交互数据包括所述历史多媒体内容的曝光数据、点击数据和转化数据。上述曝光数据可以是能够观看到多媒体内容的用户帐号数量。上述点击数据可以是多媒体内容被用户操作的次数,例如点击、拖拽等。上述转化数据可以是用户的转化行为产生的数据,例如用户在点击了广告后,发生购买、打电话、咨询、下载、表单提交等行为。
在一种可能的实施方式中,提取历史多媒体内容在目标时段内的数据日志。可选地,目标时段为最近一个月。
数据日志包括第一日志记录和第二日志记录。上述第一日志记录的记录格式可以是(用户帐号,多媒体内容标识号,曝光次数,点击次数,转化次数)。上述第二日志记录的记录格式可以是(用户帐号,多媒体内容标识号,转化时间)。
在一些实施例中,上述多媒体内容为本地生活服务广告。本地生活服务广告主,即本地生活服务提供者,可在广告投放类应用程序中发布本地生活服务广告。在此情况下,可以从广告投放类应用程序的日志中提取最近一个月和本地生活服务广告主相关的记录,并以用户帐号(用户ID)和广告标识号(广告ID)为键(Key)字段,对记录数据进行聚合,得到第一日志记录。上述第一日志记录的记录格式可以是(用户ID,广告ID,曝光次数,点击次数,转化次数)。上述曝光次数、点击次数、转化次数可以作为键字段对应的值字段。
同时,还可抽取一份历史广告的转化流水记录(即第二日志记录),上述转化流水记录的格式可以是(用户ID,广告ID,转化时间)。
步骤2:生成用户帐号的帐号地理特征和多媒体内容的服务地理特征。
上述地理特征用于衡量用户帐号和多媒体内容在空间上的相近程度。用户帐号的帐号地理特征可以是用户帐号的地理特征向量,多媒体内容的服务地理特征可以是多媒体内容的地理特征向量。
对于一个多媒体内容lj,它的地理特征向量gj是一个K维的向量。可选地,上述gj的数学表达式(1)如下:
gj=[f(d(ωj,ω1)),...,f(d(ωj,ωK))]T (1)
其中,K表示区域个数,例如可以把一个城市分成K个区域,即服务区域。在一些实施例中,K默认取值是50;ωj表示多媒体内容lj的服务位置,比如ωj是由该位置的经度和纬度组成的2维坐标;ω1表示第1个区域的几何中心坐标,第K个区域内所有的多媒体内容的服务位置坐标的几何中心坐标为ωK
在一种可能的实施方式中,给定一个城市最近一年投放的所有多媒体内容集合,使用K-means算法并以多媒体内容的服务位置坐标为聚类特征,对多媒体内容进行聚类,得到K个多媒体内容子集合,每个子集合定义为一个区域,第K个区域内所有的多媒体内容的服务位置坐标的几何中心坐标为ωK
d(*,*)表示欧式距离,比如多媒体内容的服务位置坐标到区域的几何中心坐标之间的欧氏距离。gj向量的第k个值表示的是用户从第k个区域中心移动到多媒体内容lj的服务位置坐标的概率,概率值由函数f(*)计算得到。上述概率可以是用户对上述多媒体内容的访问概率,用于表征用户访问多媒体内容的可能性。
上述f(*)可以是任何能产生概率值的函数。在一种可能的实施方式中,使用Pareto(帕累托)分布来对访问概率和坐标距离之间的关系建模。具体来说,媒体内容的地理特征向量gj的数学表达式(2)为:
gj=[(1+d(ωj,ω1)),...,(1+d(ωj,ωK))]T (2)
其中,α是Pareto分布的形状参数,可以利用用户在不同多媒体内容的转化序列并基于极大似然估计方法(Maximum Likelihood Estimate,MLE)获得。
对于用户ui的地理特征向量gi,gi的数学表达式(3)为:
gi=[γi,1,γi,2,...,γi,K]T (3)
其中,γi,K为表示用户在第K个区域对多媒体内容的期望转化次数,上述用户对应的地理特征向量可由模型训练得到。
步骤3:建立多媒体内容语义图。
构建多媒体内容语义图:为了提升多媒体内容在特征空间的表达能力,以及能够准确地为新创建的多媒体内容生成对应的偏好特征向量,需要构建多媒体内容语义图表达多媒体内容的语义近似性,然后利用语义的近似性为新创建的多媒体内容生成对应的偏好特征向量。每个多媒体内容语义图都是一个带权值的二分图。
在一种可能的实施方式中,需要构建五种类型的多媒体内容语义图,分别是内容与内容语义图、内容与转化时间语义图、内容与标签语义图、内容与区域语义图、内容与邻近用户语义图。
1、构建内容与内容语义图。在一种可能的实施方式中,上述内容与内容语义图GLL的数学表达式(4)如下:
GLL=(L,L,ELL,WLL) (4)
这个二分图的两侧节点集合都是L,L表示所有多媒体内容的集合。边集合是ELL。利用上文中抽取的转化流水记录,如果存在一个用户在一周之内依次在两个多媒体内容上存在转化行为,那么就在这两个多媒体内容节点之间建立一条边,边的权重为这两个多媒体内容被一周之内同一用户连续访问的次数,边的权重集合为WLL。内容与内容语义图用于表征多媒体内容之间的顺序访问关系。
2、构建内容与转化时间语义图。在一种可能的实施方式中,上述内容与转化时间语义图GLT的数学表达式(5)如下:
GLT=(L,T,ELT,WLT) (5)
这个二分图的一侧是多媒体内容集合L,另一侧是精确到小时的转化时间集合T。可选地,T中共24个节点,分别代表24小时。边集合ELT表示多媒体内容在某个小时的时间段内有转化记录,边的权重WLT表示一个多媒体内容在某个小时的时间段的转化次数。
3、构建内容与标签语义图,在一种可能的实施方式中,上述内容与标签语义图GLW的数学表达式(6)如下:
GLW=(L,W,ELw,WLW) (6)
这个二分图的一侧是多媒体内容集合L,另一侧是所有语义标签的集合W。可选地,一个语义标签可以是多媒体内容关联的服务文本中文案素材包含的字词,也可以是多媒体内容的发布帐号所在的一级行业标签和二级行业标签,例如一级行业标签为本地生活服务,相应的,二级行业标签是一级行业下的细分品类标签,例如餐饮,理发,宠物。边的权重表示的是字词出现的次数。
4、构建内容与区域语义图,在一种可能的实施方式中,上述内容与区域语义图GLR的数学表达式(7)如下:
GLR=(L,R,ELR,WLR)(7)
这个二分图的一侧是多媒体内容集合L,另一侧是区域集合R,ELR是边集合,边表示一个多媒体内容对应的位置信息属于某个区域节点,WLR是权重集合,权重均为1。
5、构建内容与邻近用户语义图,在一种可能的实施方式中,上述内容与邻近用户语义图GLU的数学表达式(8)如下:
GLU=(L,U,ELU,WLU) (8)
这个二分图的一侧是多媒体内容集合L,另一侧是目标时段内(比如最近一个月)对指定多媒体内容的服务位置200米范围内对多媒体内容有转化行为的用户帐号集合U。边的权重WLU表示转化的次数。
步骤4:训练人群定向联合模型
首先需要对用户和多媒体内容在特征空间进行建模,本方案使用向量
Figure BDA0003145662060000151
表示用户ui的偏好特征向量。
在一种可能的实施方式中,可利用应用程序中存储的用户画像作为用户特征,把用户特征输入预先训练好的神经网络模型进行特征提取,得到用户的偏好特征向量,上述预先训练好的神经网络模型可以是由一个3层的神经网络构成,而神经网络模型的参数为训练参数由模型学习得到。
多媒体内容的偏好特征向量vj则完全由模型学习得到。然后定义用户对多媒体内容的转化倾向得分为yij,上述转化倾向得分yij的数学表达式(9)如下:
yij=vi·vj+gi·gj (9)
这种计算方式能够同时结合用户和多媒体内容各自对应的地理特征向量和偏好特征向量,并自动学习偏好特征空间和地理特征空间相似性在决定用户转化行为中的重要性。
排序一致性约束条件:对于一个多媒体内容,转化次数较多的用户比转化次数较少的用户转化倾向得分更高,用公式(10)表示:
Figure BDA0003145662060000161
其中
Figure BDA0003145662060000162
表示一个多媒体内容转化用户ui的集合,
Figure BDA0003145662060000167
表示对多媒体内容lj转化次数Ci′j小于用户ui的转化次数Cij的用户ui′的集合,Θ={vi,vj,gi|ui∈U,lj∈L}表示训练参数的集合。
P((yij-yi′j)>0|Θ)表示用户ui的转化倾向得分比用户ui′的转化倾向得分高的概率。
在一种可能的实施方式中,上述概率可通过公式(11)计算,公式(11)如下:
Figure BDA0003145662060000163
并定义
Figure BDA0003145662060000164
为所有多媒体内容集合L对应的损失函数,数学表达式(12)如下:
Figure BDA0003145662060000165
其中λ||Θ||2为用于正则化的高斯先验参数。因为本实施例使用的损失函数
Figure BDA0003145662060000166
是根据不同的用户之间的转化倾向得分进行比较来定义的,相比只能使用转化用户为正样本,未转化用户为负样本的分类模型,能够获得更多的训练样本,缓解训练样本不足带来的模型预测能力下降的问题。
图表示学习中的语义图损失条件:为了方便表达,本实施例中使用公式(13)表示上述过程中构建多种多媒体内容语义图中的某一种多媒体内容语义图。可选地,公式(13)如下:
GLS=(L,S,ELS,WLs) (13)
然后使用LINE(Large-scale Information Network Embedding,大规模网络编码)模型最小化经验预测概率和模型预测概率的KL散度(Kullback-LeiblerDivergence,相对熵)。
具体来说,定义语义节点sk可以被多媒体内容lj表示的概率为
Figure BDA0003145662060000171
可选地,
Figure BDA0003145662060000172
的数学表达式(14)如下:
Figure BDA0003145662060000173
其中wjk是边的权重。同时,使用模型利用多媒体内容和语义节点表示偏好特征向量的概率为p(sk|lj)。可选地,p(sk|lj)的数学表达式(15)如下:
Figure BDA0003145662060000174
对KL散度公式进行简化之后可以得到表示一个多媒体内容语义图的损失函数
Figure BDA0003145662060000175
可选地,上述
Figure BDA0003145662060000176
的数学表达式(16)如下:
Figure BDA0003145662060000177
本实施例因为要使用5种多媒体内容语义图进行表示学习,所以图表示学习部分使用的目标函数(即损失函数)为
Figure BDA0003145662060000178
可选地,
Figure BDA0003145662060000179
的数学表达式(17)如下:
Figure BDA00031456620600001710
其中
Figure BDA00031456620600001711
是五种语义节点集合。
基于排序一致性约束条件和语义图损失条件联合训练人群定向联合模型:图表示学习里面的多媒体内容可以是已投放的多媒体内容,也可以是新创建的多媒体内容。新创建的多媒体内容有文本素材,区域和邻近用户,因此新创建的多媒体内容可以有偏向特征空间上的表示,即偏好特征向量。同时,新创建的多媒体内容带有服务位置信息,例如经纬度坐标,可以生成新创建的多媒体内容在地理特征空间上的表示,即地理特征向量。
本实施例能够使多媒体内容语义图的损失函数和排序一致性损失函数共享了多媒体内容的在偏好空间上的嵌入特征,实现联合训练的目的,最终的损失函数为
Figure BDA0003145662060000181
可选地,
Figure BDA0003145662060000182
的数学表达式(18)如下:
Figure BDA0003145662060000183
其中,β为系数。
在一种可能的实施方式中,可使用随机梯度下降的方法迭代优化上述模型的参数。
步骤5:模型预测和上线召回多媒体内容。
上述过程中生成的用户的和多媒体内容各自对应的偏好特征向量和地理特征向量可以每天定时写入数据引擎,当多媒体内容发布者需要进行人群定向的时候,可以先从数据引擎检索出对应多媒体内容的地理特征向量和偏好特征向量,然后使用最近邻检索技术从数据引擎查找转化倾向得分最高的用户组成多媒体内容发布者指定大小的人群定向,再为多媒体内容添加相关的标签并写入多媒体内容召回系统。当人群定向中的某个用户访问腾讯流量的时候,召回系统可以检索到用户被相关的标签命中,然后把标签关联的多媒体内容提取出来作为曝光多媒体内容的候选集,完成召回步骤。
在一些应用场景中,本实施例提供的方案可以应用与多媒体内容投放应用中,例如广告投放应用。可选地,在多媒体内容投放应用中创建多媒体内容指定人群定向模块,该模块可以执行本实施例提供的方案。以广告投放应用为例,广告主只要指定要推广的本地生活服务广告对应的位置信息和本地生活服务广告的广告类目信息,可以是广告文案或者关键词,则可以在广告管理平台(Data Management Platform,DMP)上提取用于获取新客户的人群定向进行广告投放。在一些实施例中,上述广告管理平台可给广告主提供不同的人群提取方式,例如基础属性交并差组合或者历史广告行为人群提取方式,主要用于人群定向。广告主在DMP获取人群定向之后,可以在投放端给不同的广告绑定不同的人群定向进行广告投放。
如果多媒体内容发布者需要实现小时级的多媒体内容的偏好特征向量更新,可以先使用针对多媒体内容的人群提取功能把最近24小时内的转化用户提取出来,再检索出这些用户的偏好特征向量并做平均池化操作,得到一个平均的用户偏好特征向量。然后把这个平均用户偏好向量和多媒体内容的偏好向量相加得到一个实时的多媒体内容偏好向量,再用这个向量去数据引擎检索得到定向用户即可。
在一些应用场景中,本实施例提供的方案也可以用于给本地生活服务的广告主提供自动更新的功能。已经进行广告投放的本地生活服务的广告主可以利用广告投放应用的自动更新功能,按时修改广告绑定的人群定向,提升投放的效果。
在一些应用场景中,使用本实施例提供的方案为本地生活服务广告进行人群定向,进而得到本地生活服务广告拟投放的目标用户群体。相比于其他方案,新广告主投放广告无法起量的比例降低20%,本地生活服务广告的整体服务消耗提升10%。
本实施例提出的人群定向联合模型,通过结合排序一致性和图表示学习的方法,可为本地生活服务广告主提供人群定向。广告主只要指定要推广的本地生活服务对应的位置信息和本地生活服务的广告类目信息,可以是广告文案或者关键词,则可以在广告管理平台上提取用于获取新客户的人群定向进行广告投放。在本应用场景下,排序一致性约束条件指的是一条本地服务广告的转化人群会比这条广告的未转化人群更有再次转化的可能。这种排序一致性约束条件可以带来更多的模型训练样本,缓解本地生活服务类广告训练样本稀疏的问题。为了衡量用户和本地生活服务广告之间的转化倾向强弱,本方案使用地理特征向量和偏好特征向量去压缩表示用户和本地生活服务广告。地理特征向量衡量的是用户和本地生活广告对城市中不同服务区域之间的影响力。偏好特征向量衡量的是不同用户之间以及不同本地生活服务广告之间转化行为的相似性。为了学习新本地生活服务广告的偏好特征向量,本实施例提出构建不同的带权二分图表示广告的不同语义信息,然后使用联合训练的方法把广告的语义信息融入广告的偏好特征向量表示学习。
相比于一些相关技术的人群定向方案,本实施例能够同时提升新广告主和已有广告主的本地生活服务广告投放效果,不仅能够提高已有投放记录的本地生活服务广告主的投放效果,而且能够新广告主生成本地生活服务广告的人群定向,提升新广告主广告起量速度,实现快速起量的目的,从而增加广告主在广告投放平台上的投放消耗。
下述为本申请装置实施例,可用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图7,其示出了本申请一个实施例提供的多媒体内容的推送装置的框图。该装置具有实现上述多媒体内容的推送方法的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是计算机设备,也可以设置在计算机设备中。该装置700可以包括:服务信息获取模块710、服务特征确定模块720、转化参数预测模块730以及内容推送模块740。
服务信息获取模块710,用于获取多媒体内容关联的服务位置信息和服务内容信息。
服务特征确定模块720,用于将所述服务位置信息和所述服务内容信息输入至人群定向联合模型,得到所述多媒体内容的服务地理特征和服务偏好特征。
转化参数预测模块730,用于将所述服务地理特征和所述服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到所述各个用户帐号针对所述多媒体内容的转化倾向参数。
内容推送模块740,用于根据所述转化倾向参数推送所述多媒体内容。
其中,所述人群定向联合模型基于排序一致性约束条件训练得到,所述排序一致性约束条件是指用户帐号对于目标多媒体内容的转化数据与所述用户帐号针对所述目标多媒体内容的目标转化倾向参数呈正相关。
在示例性实施例中,所述服务特征确定模块720,包括:服务地理特征确定单元、语义图更新单元和服务偏好特征确定单元。
服务地理特征确定单元,用于将所述服务位置信息与各个服务区域的区域位置信息进行对比,得到所述服务地理特征。
语义图更新单元,用于基于所述服务位置信息和所述服务内容信息对至少一种多媒体内容语义图进行更新,得到更新后的多媒体内容语义图,所述至少一种多媒体内容语义图用于表征各个多媒体内容与不同语义节点集合之间的关联程度。
服务偏好特征确定单元,用于基于所述更新后的多媒体内容语义图对应的图结构数据,确定所述多媒体内容的服务偏好特征。
在示例性实施例中,所述人群定向联合模型的训练过程包括:
获取样本数据日志,所述样本数据日志包括样本用户帐号针对样本多媒体内容的行为数据记录,所述行为数据记录包括所述样本多媒体内容的标签信息,所述标签信息为所述样本用户帐号对所述样本多媒体内容的转化数据;
根据所述样本数据日志,确定所述样本多媒体内容的服务信息、所述样本用户帐号的用户画像数据以及至少一种多媒体内容样本语义图;
基于所述样本多媒体内容的服务信息、所述样本用户帐号的用户画像数据以及所述至少一种多媒体内容样本语义图,并按照联合约束条件训练所述人群定向联合模型,直至所述人群定向联合模型的输出结果满足所述联合约束条件;
其中,所述联合约束条件包括所述排序一致性约束条件和语义图损失条件。
在示例性实施例中,所述装置700还包括:日志获取模块语义图生成模块和帐号特征确定模块。
日志获取模块,用于获取数据日志,所述数据日志包括各个用户帐号针对所述各个多媒体内容的行为数据记录。
语义图生成模块,用于根据所述行为数据记录,生成所述至少一种多媒体内容语义图。
帐号特征确定模块,用于基于所述数据日志和所述至少一种多媒体内容语义图,确定所述各个用户帐号的帐号特征。
其中,所述至少一种多媒体内容语义图包括内容与内容语义图、内容与转化时间语义图、内容与标签语义图、内容与区域语义图、内容与邻近用户语义图中至少一种。
在示例性实施例中,所述帐号特征包括帐号地理特征和帐号偏好特征,所述帐号特征确定模块,包括:帐号偏好特征确定单元和帐号地理特征确定单元。
帐号偏好特征确定单元,用于将所述各个用户帐号的用户画像数据输入至所述人群定向联合模型进行特征提取处理,得到所述各个用户帐号的帐号偏好特征,所述用户画像数据基于所述数据日志生成。
帐号地理特征确定单元,用于将所述至少一种多媒体内容语义图对应的图结构数据输入至所述人群定向联合模型,得到所述各个用户帐号的帐号地理特征。
在示例性实施例中,所述转化参数预测模块730,包括:地理特征参数确定单元、偏好特征参数确定单元和转化倾向参数确定单元。
地理特征参数确定单元,用于对于每一用户帐号,基于所述服务地理特征与所述用户帐号的帐号地理特征,确定地理特征参数。
偏好特征参数确定单元,用于基于所述服务偏好特征与所述用户帐号的帐号偏好特征,确定偏好特征参数。
转化倾向参数确定单元,用于根据所述地理特征参数与所述偏好特征参数,确定所述用户帐号针对所述多媒体内容的转化倾向参数。
在示例性实施例中,所述装置700还包括:转化帐号获取模块、平均帐号特征确定模块、服务偏好特征更新模块和转化倾向参数更新模块。
转化帐号获取模块,用于获取所述多媒体内容对应的转化用户帐号;
平均帐号特征确定模块,用于对所述转化用户帐号的帐号特征进行平均化处理,得到所述转化用户帐号的平均帐号特征;
服务偏好特征更新模块,用于基于所述平均帐号特征和所述服务偏好特征,确定所述多媒体内容的实时服务偏好特征;
转化倾向参数更新模块,用于根据所述实时服务偏好特征更新所述转化倾向参数。
综上所述,本申请实施例提供的技术方案,通过设置用户帐号对于同一多媒体内容的转化数据与转化倾向参数呈正相关的排序一致性约束条件,来训练人群定向联合模型,使得人群定向联合模型仅需要多媒体内容的服务位置和服务内容便可确定出多媒体内容的服务地理特征和服务偏好特征,并能够结合上述服务地理特征、服务偏好特征和帐号特征,预测出衡量用户对多媒体内容进行转化的参数,进而可以根据参数进行人群定向并推送多媒体内容。通过上述排序一致性约束条件,能够使得新用户在没有历史数据或者历史数据较为稀疏的情况下,仍可为新发布的多媒体内容进行较为准确的人群定向,提升人群定向质量,降低对历史数据的依赖,从而提升多媒体内容推送效率,避免对计算资源造成浪费,减轻设备运行压力。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图8,其示出了本申请一个实施例提供的计算机设备的结构框图。该计算机设备可以是服务器,以用于执行上述多媒体内容的推送方法。具体来讲:
计算机设备800包括中央处理单元(Central Processing Unit,CPU)801、包括随机存取存储器(Random Access Memory,RAM)802和只读存储器(Read Only Memory,ROM)803的系统存储器804,以及连接系统存储器804和中央处理单元801的系统总线805。计算机设备800还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O(Input/Output)系统)806,和用于存储操作系统813、应用程序814和其他程序模块815的大容量存储设备807。
基本输入/输出系统806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中显示器808和输入设备809都通过连接到系统总线805的输入输出控制器810连接到中央处理单元801。基本输入/输出系统806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备807通过连接到系统总线805的大容量存储控制器(未示出)连接到中央处理单元801。大容量存储设备807及其相关联的计算机可读介质为计算机设备800提供非易失性存储。也就是说,大容量存储设备807可以包括诸如硬盘或者CD-ROM(CompactDisc Read-Only Memory,只读光盘)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read Only Memory,可擦除可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read Only Memory,电可擦可编程只读存储器)、闪存或其他固态存储其技术,CD-ROM、DVD(Digital Video Disc,高密度数字视频光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器804和大容量存储设备807可以统称为存储器。
根据本申请的各种实施例,计算机设备800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备800可以通过连接在系统总线805上的网络接口单元811连接到网络812,或者说,也可以使用网络接口单元811来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括计算机程序,该计算机程序存储于存储器中,且经配置以由一个或者一个以上处理器执行,以实现上述多媒体内容的推送方法。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被处理器执行时以实现上述多媒体内容的推送方法。
可选地,该计算机可读存储介质可以包括:ROM(Read Only Memory,只读存储器)、RAM(Random Access Memory,随机存取记忆体)、SSD(Solid State Drives,固态硬盘)或光盘等。其中,随机存取记忆体可以包括ReRAM(Resistance Random Access Memory,电阻式随机存取记忆体)和DRAM(Dynamic Random Access Memory,动态随机存取存储器)。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述多媒体内容的推送方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外,本文中描述的步骤编号,仅示例性示出了步骤间的一种可能的执行先后顺序,在一些其它实施例中,上述步骤也可以不按照编号顺序来执行,如两个不同编号的步骤同时执行,或者两个不同编号的步骤按照与图示相反的顺序执行,本申请实施例对此不作限定。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种多媒体内容的推送方法,其特征在于,所述方法包括:
获取多媒体内容关联的服务位置信息和服务内容信息;
将所述服务位置信息和所述服务内容信息输入至人群定向联合模型,得到所述多媒体内容的服务地理特征和服务偏好特征;
将所述服务地理特征和所述服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到所述各个用户帐号针对所述多媒体内容的转化倾向参数;
根据所述转化倾向参数推送所述多媒体内容;
其中,所述人群定向联合模型基于排序一致性约束条件训练得到,所述排序一致性约束条件是指用户帐号对于目标多媒体内容的转化数据与所述用户帐号针对所述目标多媒体内容的目标转化倾向参数呈正相关。
2.根据权利要求1所述的方法,其特征在于,所述将所述服务位置信息和所述服务内容信息输入至人群定向联合模型,得到所述多媒体内容的服务地理特征和服务偏好特征,包括:
将所述服务位置信息与各个服务区域的区域位置信息进行对比,得到所述服务地理特征;
基于所述服务位置信息和所述服务内容信息对至少一种多媒体内容语义图进行更新,得到更新后的多媒体内容语义图,所述至少一种多媒体内容语义图用于表征各个多媒体内容与不同语义节点集合之间的关联程度;
基于所述更新后的多媒体内容语义图对应的图结构数据,确定所述多媒体内容的服务偏好特征。
3.根据权利要求2所述的方法,其特征在于,所述人群定向联合模型的训练过程包括:
获取样本数据日志,所述样本数据日志包括样本用户帐号针对样本多媒体内容的行为数据记录,所述行为数据记录包括所述样本多媒体内容的标签信息,所述标签信息为所述样本用户帐号对所述样本多媒体内容的转化数据;
根据所述样本数据日志,确定所述样本多媒体内容的服务信息、所述样本用户帐号的用户画像数据以及至少一种多媒体内容样本语义图;
基于所述样本多媒体内容的服务信息、所述样本用户帐号的用户画像数据以及所述至少一种多媒体内容样本语义图,并按照联合约束条件训练所述人群定向联合模型,直至所述人群定向联合模型的输出结果满足所述联合约束条件;
其中,所述联合约束条件包括所述排序一致性约束条件和语义图损失条件。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取数据日志,所述数据日志包括各个用户帐号针对所述各个多媒体内容的行为数据记录;
根据所述行为数据记录,生成所述至少一种多媒体内容语义图;
基于所述数据日志和所述至少一种多媒体内容语义图,确定所述各个用户帐号的帐号特征;
其中,所述至少一种多媒体内容语义图包括内容与内容语义图、内容与转化时间语义图、内容与标签语义图、内容与区域语义图、内容与邻近用户语义图中至少一种。
5.根据权利要求4所述的方法,其特征在于,所述帐号特征包括帐号地理特征和帐号偏好特征,所述基于所述数据日志和所述至少一种多媒体内容语义图,确定所述各个用户帐号的帐号特征,包括:
将所述各个用户帐号的用户画像数据输入至所述人群定向联合模型进行特征提取处理,得到所述各个用户帐号的帐号偏好特征,所述用户画像数据基于所述数据日志生成;
将所述至少一种多媒体内容语义图对应的图结构数据输入至所述人群定向联合模型,得到所述各个用户帐号的帐号地理特征。
6.根据权利要求5所述的方法,其特征在于,所述将所述服务地理特征和所述服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到所述各个用户帐号针对所述多媒体内容的转化倾向参数,包括:
对于每一用户帐号,基于所述服务地理特征与所述用户帐号的帐号地理特征,确定地理特征参数;
基于所述服务偏好特征与所述用户帐号的帐号偏好特征,确定偏好特征参数;
根据所述地理特征参数与所述偏好特征参数,确定所述用户帐号针对所述多媒体内容的转化倾向参数。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
获取所述多媒体内容对应的转化用户帐号;
对所述转化用户帐号的帐号特征进行平均化处理,得到所述转化用户帐号的平均帐号特征;
基于所述平均帐号特征和所述服务偏好特征,确定所述多媒体内容的实时服务偏好特征;
根据所述实时服务偏好特征更新所述转化倾向参数。
8.一种多媒体内容的推送装置,其特征在于,所述装置包括:
服务信息获取模块,用于获取多媒体内容关联的服务位置信息和服务内容信息;
服务特征确定模块,用于将所述服务位置信息和所述服务内容信息输入至人群定向联合模型,得到所述多媒体内容的服务地理特征和服务偏好特征;
转化参数预测模块,用于将所述服务地理特征和所述服务偏好特征分别与各个用户帐号的帐号特征进行融合,得到所述各个用户帐号针对所述多媒体内容的转化倾向参数;
内容推送模块,用于根据所述转化倾向参数推送所述多媒体内容;
其中,所述人群定向联合模型基于排序一致性约束条件训练得到,所述排序一致性约束条件是指用户帐号对于目标多媒体内容的转化数据与所述用户帐号针对所述目标多媒体内容的目标转化倾向参数呈正相关。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一项所述的多媒体内容的推送方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一项所述的多媒体内容的推送方法。
CN202110749793.7A 2021-07-02 2021-07-02 多媒体内容的推送方法、装置、设备及存储介质 Pending CN115563317A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110749793.7A CN115563317A (zh) 2021-07-02 2021-07-02 多媒体内容的推送方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110749793.7A CN115563317A (zh) 2021-07-02 2021-07-02 多媒体内容的推送方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115563317A true CN115563317A (zh) 2023-01-03

Family

ID=84737166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110749793.7A Pending CN115563317A (zh) 2021-07-02 2021-07-02 多媒体内容的推送方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115563317A (zh)

Similar Documents

Publication Publication Date Title
US10846617B2 (en) Context-aware recommendation system for analysts
Mao et al. Multiobjective e-commerce recommendations based on hypergraph ranking
US20180096219A1 (en) Neural network combined image and text evaluator and classifier
WO2020147595A1 (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
CN110377587B (zh) 基于机器学习的迁移数据确定方法、装置、设备及介质
CN111259263A (zh) 一种物品推荐方法、装置、计算机设备及存储介质
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN114579584B (zh) 数据表处理方法、装置、计算机设备和存储介质
CN113424207B (zh) 高效地训练可理解模型的系统和方法
CN114298122A (zh) 数据分类方法、装置、设备、存储介质及计算机程序产品
CN113706211A (zh) 基于神经网络的广告点击率预测方法及系统
CN111340522A (zh) 资源推荐方法、装置、服务器及存储介质
US20180239790A1 (en) Provision device, provision method and non-transitory computer readable storage medium
CN115131052A (zh) 一种数据处理方法、计算机设备和存储介质
WO2023284516A1 (zh) 基于知识图谱的信息推荐方法、装置、设备、介质及产品
Zhu et al. Deep neural model for point-of-interest recommendation fused with graph embedding representation
US11068802B2 (en) High-capacity machine learning system
CN115563317A (zh) 多媒体内容的推送方法、装置、设备及存储介质
CN115169637A (zh) 社交关系预测方法、装置、设备和介质
JP2022178650A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Haifeng et al. Image tag recommendation based on friendships
CN113469752A (zh) 内容推荐方法、装置、存储介质及电子设备
CN113392294A (zh) 样本标注方法及装置
Li Analysis of e-commerce customers' shopping behavior based on data mining and machine learning
Huang et al. C-3PO: C lick-sequence-aware dee P neural network (DNN)-based P op-u P s rec O mmendation: I know you’ll click

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40079110

Country of ref document: HK