CN112202849A - 内容分发方法、装置、电子设备和计算机可读存储介质 - Google Patents

内容分发方法、装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN112202849A
CN112202849A CN202010968355.5A CN202010968355A CN112202849A CN 112202849 A CN112202849 A CN 112202849A CN 202010968355 A CN202010968355 A CN 202010968355A CN 112202849 A CN112202849 A CN 112202849A
Authority
CN
China
Prior art keywords
content
distributed
distribution
information
feedback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010968355.5A
Other languages
English (en)
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010968355.5A priority Critical patent/CN112202849A/zh
Publication of CN112202849A publication Critical patent/CN112202849A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种内容分发方法、装置、电子设备和计算机可读存储介质;本发明实施例在获取待分发内容、以及待分发内容的历史分发记录后,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发;该方案可以大大提升内容分发的准确率。

Description

内容分发方法、装置、电子设备和计算机可读存储介质
技术领域
本发明涉及通信技术领域,具体涉及一种内容分发方法、装置、电子设备和计算机可读存储介质。
背景技术
近年来,随着社交网络和自媒体的发展,互联网中的内容也变得越来越多样化。为了提升内容质量,将内容更加精准的分发至其他用户,需要对上传的内容进行审核。现有的审核方法主要采用机器算法和人工审核相结合,对内容进行审核,基于审核结果对内容进行标注。
在对现有技术的研究和实践过程中,本发明的发明人发现现有技术针对专业化和个性化内容的理解和审核存在困难,使得内容审核的准确性不足,因此,导致内容分发的准确率大大降低。
发明内容
本发明实施例提供一种内容分发方法、装置、电子设备和计算机可读存储介质,可以提高内容分发的准确率。
一种内容分发方法,包括:
获取待分发内容、以及所述待分发内容的历史分发记录,所述历史分发记录为预设时间段内的所述待分发内容的分发信息;
根据所述历史分发记录确定历史用户、所述历史用户对应的用户群、以及所述历史用户针对所述待分发内容的互动行为信息;
对所述互动行为信息进行解析,得到所述用户群对所述待分发内容的反馈参数;
获取所述待分发内容分发至所述用户群的分发权重,并根据所述反馈参数对所述分发权重进行调整;
基于调整后的分发权重对所述待分发内容进行分发。
相应的,本发明实施例提供一种内容分发装置,包括:
获取单元,用于获取待分发内容、以及所述待分发内容的历史分发记录,所述历史分发记录为预设时间段内的所述待分发内容的分发信息;
确定单元,用于根据所述历史分发记录确定历史用户、所述历史用户对应的用户群、以及所述历史用户针对所述待分发内容的互动行为信息;
解析单元,用于对所述互动行为信息进行解析,得到所述用户群对所述待分发内容的反馈参数;
调整单元,用于获取所述待分发内容分发至所述用户群的分发权重,并根据所述反馈参数对所述分发权重进行调整;
分发单元,用于基于调整后的分发权重对所述待分发内容进行分发。
此外,本发明实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序实现本发明实施例提供的内容分发方法。
另外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种内容分发方法中的步骤。
本发明实施例在获取待分发内容、以及待分发内容的历史分发记录后,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发;由于该方案可以通过获取待分发内容的历史分发记录,从而确定历史用户对待分发内容的互动行为信息,并对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,基于反馈参数对待分发内容的分发权重进行调整,使得用户与待分发内容的交互行为可以与内容分发的质量控制相结合,因此,可以大大提升内容分发的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的内容分发方法的场景示意图;
图2是本发明实施例提供的内容分发方法的流程示意图;
图3是本发明实施例提供的待分发内容分发至历史用户的流程示意图;
图4是本发明实施例提供的对互动行为信息进行解析的示意图;
图5是本发明实施例提供的内容分发方法的另一流程示意图;
图6是本发明实施例提供的内容分发装置的结构示意图;
图7是本发明实施例提供的内容分发装置的解析单元的结构示意图;
图8是本发明实施例提供的内容分发装置的另一结构示意图;
图9是本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种内容分发方法、装置和计算机可读存储介质。其中,该内容分发装置可以集成在电子设备中,该电子设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
例如,参见图1,以内容分发装置集成在电子设备中为例,电子设备在获取待分发内容、以及待分发内容的历史分发记录后,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发。
其中,待分发内容可以包括多种类型的可传播的内容,比如,可以为图像、视频、音频或文本,待分发内容的分发可以通过对用户画面之后,将待分发内容或待分发内容对应的链接分发至推荐的用户对应的终端。
以下分别进行详细说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从内容分发装置的角度进行描述,该内容分发装置具体可以集成在电子设备中,该电子设备可以是服务器,也可以是终端等设备;其中,该终端可以包括平板电脑、笔记本电脑、以及个人计算机(PC,Personal Computer)、可穿戴设备、虚拟现实设备或其他可以内容分发的智能设备等设备。
一种内容分发方法,包括:
获取待分发内容、以及待分发内容的历史分发记录,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发。
如图2所示,该内容分发方法的具体流程如下:
101、获取待分发内容、以及待分发内容的历史分发记录。
其中,历史分发记录可以为预设时间段的待分发内容的分发信息,待分发内容的类型不同,预设时间段也可以不相同。比如,当待分发内容为图片时,该预设时间段就可以为7天,则历史分发记录就可以为该图片在当前时间之前的7天内的所有分发信息;当待分发内容为视频时,该预设时间段就可以为15天,也就是说历史分发记录就可以为该视频在当前时间之前的15天内所有的分发信息,该分发信息可以包括历史分发的用户的标识和分发时间等信息。
例如,可以在内容分发数据库中提取当前需要分发的待分发内容,并获取待分发内容在预设时间段的历史分发记录,比如,获取待分发内容的元信息,根据待分发内容的元信息,在调度中心的服务器中读取待分发内容在预设时间段内的历史分发记录,譬如,以待分发内容为图片为例,在根据图片的标题、发布时间、账号作者以及审核后的特征信息等元信息,在调度中心服务器中读取到该元信息在当前时间之前的7天内的分发信息,该分发信息可以为历史用户的标识和分发时间等,将这些分发信息作为待分发内容的历史分发记录。
可选的,在获取待分发内容、以及待分发内容的历史分发记录之前,还需要将待分发内容分发至历史用户,从而才可以获取待分发内容的历史分发记录,因此,在步骤“获取待分发内容、以及所述待分发内容的历史分发记录”之前,内容分发方法,还可以包括:
获取用户上传的待分发内容,提取待分发内容的特征信息,根据特征信息,对待分发内容进行审核,当待分发内容通过审核时,在待分发用户集合中筛选出该待分发内容需要分发的历史用户,将待分发内容分发至历史用户。
以上步骤可以理解为待分发内容分发至历史用户的分发过程,如图3所示,具体可以如下:
S1、获取用户上传的待分发内容。
例如,用户可以在网络上获取各类内容信息,将内容信息作为待分发内容直接通过终端发送至内容分发装置,还可以通过终端对获取到的各类内容信息进行编辑,得到待分发内容,比如,可以对获取的视频进行截取,添加表情、文字或动画等,还可以对获取到的图像、文本进行编辑等操作,就可以得到待分发内容。用户还可以通过终端自带的内容采集设备采集到待分发内容,并将待分发内容发送至内容分发装置,比如,可以通过摄像头拍摄一些短视频或图像,可以直接将短视频或图像作为待分发内容发送至内容分发装置,还可以对短视频进行编辑后作为待分发内容发送至内容分发装置,比如,可以对拍摄的短视频进行剪辑,选择搭配的音乐、滤镜模板,如果拍摄的是图像,还可以对图像进行美化,并添加文本信息等编辑动作,将编辑好的短视频或者图文作为待分发内容上传至内容分发装置,内容分发装置可以将待分发内容存储至内容数据库,在存储至内容数据库之前,还可以对待分发内容进行排重服务,比如,图文和图集及视频进行向量化,然后建立向量的索引,然后通过比较向量之间的距离来确定相似程度。主要包括标题去重,封面图的图片去重,内容正文去重及视频指纹和音频指纹去重,通常是将图文内容标题和正文向量化,采用simhash(一种文本去重算法)及BERT(Bidirectional Encoder Representations fromTransformers,来自Transformer的双向编码器表征)处理的文本向量和图像向量进行去重,对于视频内容抽取视频指纹和音频指纹构建向量,然后计算向量之间的距离比如欧式距离来确定是否重复,将排重之后的待分发内容存至内容数据库。
S2、提取待分发内容的特征信息。
其中,特征信息可以为待分发内容的元信息和特征向量等信息。
所谓元信息可以为图文信息的元信息频文件大小、封面图链接、视频码率、文件格式、标题、发布时间、作者等信息。特征向量可以为对图文内容进行特征提取,对提取的特征进行向量化而得到的向量,具体向量化的方法可以采用BERT根据提取的特征,生成特征对应的向量。
例如,可以根据待分发内容的类型不同,采用不同的特征提取方法进行特征提取,比如,针对待分发内容中的图文信息,可以提取元信息频文件大小、封面图链接、视频码率、文件格式、标题、发布时间、作者等信息。还可以对原始内容中的特征进行BERT向量化,从而得到图文信息对应的特征向量。针对原始内容中的视频内容,还可以对视频内容进行标准的转码操作,转码完成后异步返回元信息主要是文件大小,码率、规格和截取封面图等信息。将这些信息也作为特征信息。
S3、根据特征信息,对待分发内容进行审核。
其中,对待分发内容进行审核可以包括通过人工初步检测待分发内容是否涉及色情、赌博和政治敏感等,在初步检测的基础上,对待分发内容进行二次审核,主要采用识别模型和人工审核相结合对待分发内容进行分类和标签的标注或确定,分类和确认完成即表示审核通过。
例如,可以根据特征信息,对待分发内容进行预处理,比如,以对视频文件进行预处理为例,可以对视频文件中不同码率、不同清晰度、不同尺寸、部分黑屏,添加的滤镜、视频标志(logo)、插入的广告内容和片头片尾无关内容都可以进行裁剪处理,保证进入人工审核的待分发内容符合处理流程的需要,还可以根据特征信息,在待分发内容中将已经审核过的重复内容过滤掉,比如,根据同一个图像下载地址对应的同一张图像,已经通过审核了,当第二次被发送至内容分发装置时,可以将该图像进行过滤,便于节省人工审核的时间。将过滤后的待分发内容发送至审核服务器,人工在审核服务器对过滤后的待分发内容进行审核,主要审核的方面为过滤后内容是否涉及色情、赌博和政治敏感等,通过人工初步审核的过滤后内容被发送给识别模型进行识别,主要识别过滤后内容的内容本身和类型,一般识别模型可以采用图像识别模型、文本识别模型、视频或音频识别模型等。识别模型对过滤后内容进行识别,得出识别结果,可以根据识别结果对过滤后内容贴标签,也可以不贴。人工根据识别模型得到的识别结果和标签,对过滤后内容进行二次审核,主要根据识别结果,对过滤后内容进行分类和对标签的标注或确认。过滤后内容通过确认之后,表示该过滤后的内容对应的待分发内容通过了审核。
S4、当待分发内容通过审核时,在待分发用户集合中筛选出该待分发内容需要分发的历史用户。
例如,当待分发内容通过审核时,对待分发用户集合中的用户进行用户画像,在根据用户画像和推荐算法,在待分发用户集合中筛选出历史用户,比如,可以通过推荐算法和用户画像来读取待分发内容,然后,再通过各种推荐算法,譬如协同过滤,矩阵分解,监督学习算法Logistic Regression模型,基于深度学习的模型,因子分解模型(FactorizationMachine,FM)和梯度提升决策树(Gradient Boosting Decision Tree,GBDT)等与待分发用户集合中每个用户的用户画像进行结合,得到待分发内容需要分发的历史用户。
S5、将待分发内容分发至历史用户。
例如,根据历史用户的标识,确定历史用户对应的用户群,比如,可以根据历史用户的性别、年龄和地域等条件将用户划分为多个用户群,然后,根据历史用户的性别、年龄和地域等信息,可以确定历史用户对应的用户群。对于每一待分发内容,都会预设每个用户群对应的分发权重。根据分发权重,将待分发内容分发至历史用户,分发完成之后,还可以根据分发结果形成分发记录,比如,记录在预设时间段内将待分发内容分发至历史用户的标识和分发时间等信息。
其中,用户群可以根据用户的性别、年龄和地域等条件进行划分,比如,可以划分为男性、女性、多个年龄段(譬如,可以包括6岁以下,7-12岁,13-15岁,16-18岁,18-22岁,23-25岁,26-28岁,29-30岁,30-35岁,36-40岁,41-50,51-60岁,61岁以上)和多个地域(譬如,一线城市、二线城市、三线城市或四线城市,南方或北方等)。以一个用户的标识为男性、26岁和深圳等为例,则该用户对应的用户群的群标识就可以为男性-(26-28岁)-一线城市。用户群也可以进一步根据消费层级、婚姻状况、职业类型或教育程度等条件进行划分。
102、根据历史分发记录确定历史用户、历史用户对应的用户群以及历史用户针对待分发内容的互动行为信息。
其中,互动行为信息可以为历史用户对待分发内容进行互动行为的信息,比如,历史用户对待分发内容进行点赞、分享、收藏、举报或其他负反馈的互动行为等信息。
例如,可以在历史分发记录中识别出接收待分发内容的历史用户和该历史用户的标识,比如,读取历史分发记录,在历史分发记录中识别出在预设时间段内接收待分发内容的至少一个历史用户,在历史分发记录中提取出该历史用户对应的标识。根据历史用户的标识,确定历史用户对应的用户群,比如,在用户的标识中识别出历史用户的性别、年龄和地域等属性信息,根据这些属性信息,从而可以确定出该历史用户对应的用户群。在预设互动行为数据库中筛选出预设时间段内的历史用户标识对应的互动行为信息,比如,将历史用户的标识作为筛选条件,可以在预设互动行为数据库中筛选出当前时间之前的7天或者其他时间段内的该历史用户标识对应的互动行为信息。
可选的,在预设互动行为数据库中筛选出历史用户标识对应的互动行为信息之前,还需要将用户针对待分发内容的原始互动行为信息存储至预设互动行为数据库中,因此,在步骤“在预设互动行为数据库中筛选出所述预设时间段内的所述历史用户的标识对应的互动行为信息”之前,内容分发方法,还可以包括:
接收终端发送的用户针对待分发内容的互动信息,该互动信息包括原始互动行为信息,在互动信息中识别出用户的标识和互动时间,根据用户的标识和互动时间,将原始互动行为信息存储至预设互动行为数据库。
例如,用户获取待分发内容的索引信息之后,将待分发内容下载至终端,此时,待分发内容的一次分发完成,当用户通过终端对待分发内容进行互动时,比如,用户通过终端对待分发内容进行点赞、分享、转发、举报或者其他负反馈互动时,终端将互动产生的互动信息发送至内容分发装置,内容分发装置在接收到用户针对待分发内容的互动信息之后,在互动信息中识别出用户的标识和互动时间,将用户的标识和互动时间作为原始互动行为信息的索引,从而将原始互动行为信息存储至预设互动行为数据库。
103、对互动行为信息进行解析,得到用户群对待分发内容的反馈参数。
其中,反馈参数可以理解为预设的用户群对待分发内容的接受程度,反馈参数越高,则可以说明待分发内容越不适合给该用户群进行分发,该用户群对待分发内容质量的负反馈越高,因此,对于这一类用户群就需要进行降权分发或者停止分发。
例如,可以在互动行为信息中筛选出用户群对应的互动行为信息,得到群互动行为信息,在群互动行为信息中识别出用户群对待分发内容的互动行为类型,基于互动行为类型,对群互动行为信息进行解析,得到用户群对待分发内容的反馈参数。如图4所示,具体可以如下:
C1、在互动行为信息中筛选出用户群对应的互动行为信息,得到群互动行为信息。
例如,根据每个历史用户对应的用户群,将互动行为信息中筛选出用户群对应的互动行为信息,比如,将属于同一个用户群的历史用户的互动行为信息进行融合,就可以得到每个用户群的群互动行为信息。
C2、在群互动行为信息中识别出用户群对待分发内容的互动行为类型。
例如,在群互动行为信息中提取出该用户群中每一个历史用户对待分发内容的互动行为信息,在该互动行为信息中识别出每一个历史用户互动行为的互动行为类型,就可以得到用户群对待分发内容的互动行为类型。互动行为类型可以包括点赞、分享、转发、举报或其他负反馈互动等。
C3、基于互动行为类型,对群互动行为信息进行解析,得到用户群对待分发内容的反馈参数。
例如,可以在群互动信息中统计出互动行为类型的互动数量,根据历史分发记录,确定待分发内容在用户群内的曝光总量,将互动数量和曝光总量进行融合,得到用户群对待分发内容的反馈信息,根据反馈信息,确定用户群对待分发内容的反馈参数,具体可以如下:
(1)在群互动信息中统计出互动行为类型的互动数量。
例如,可以在群互动信息中统计出互动行为类型的互动数量,比如,在群互动行为信息中读取每一个互动行为类型的互动行为的互动次数,将这个互动次数作为每一个互动行为类型的互动数量,譬如,以互动行为类型为点赞为例,在群互动行为信息中读取用户群中的每一个历史用户对待分发内容进行点赞的次数,将这个次数就可以为点赞的互动数量。
(2)根据历史分发记录,确定待分发内容在用户群内的曝光总量,并将互动数量和曝光总量作为所述用户群对待分发内容的反馈信息。
其中,曝光总量可以为将待分发内容分发至用户群中的历史用户的分发总量,也可以理解为分发总次数,比如,将待分发内容分发至某一个用户群中的10个历史用户,则待分发内容在该用户群内的曝光总量就可以为10次。
例如,在历史分发记录中筛选出将待分发内容分发至用户群的目标历史分发记录,比如,根据每一个历史用户对应的用户群的信息,在历史分发记录中筛选出将待分发内容分发至同一个用户群的历史用户的分发信息,得到目标历史分发记录。在目标历史分发记录中统计出将待分发内容分发至用户群的分发次数,将分发次数作为待分发内容在用户群内的曝光总量。将每种互动类型对应的互动数量和曝光总量作为用户群对待分发内容的反馈信息。
(3)根据反馈信息,确定用户群对待分发内容的反馈参数。
例如,可以采用训练后行为挖掘模型对反馈信息进行多尺度的特征提取,得到每个尺度对应的局部反馈特征信息,比如,可以根据互动行为类型的不同,分别计算不同互动行为类型的互动数量与曝光总量和平滑参数的比值,从而可以得到每个尺度对应的局部反馈特征信息。根据互动行为类型,将局部反馈特征信息分为正反馈特征信息和负反馈特征信息,比如,根据互动行为类型,将点赞、转发和分享等互动行为对应的局部反馈信息分为正反馈特征信息,将局部或其他负反馈互动行为对应的局部反馈信息分为负反馈特征信息。分别将正反馈特征信息和负反馈特征信息进行融合,得到全局正反馈特征信息和全局负反馈特征信息,比如,采用平滑参数和控制参数,对全部的正反馈特征信息进行融合,得到全局正反馈特征信息,采用平滑参数和控制参数,对全部的负反馈特征信息进行融合,得到全局负反馈特征信息。计算全局负反馈特征信息与全局负反馈特征信息的比值,就可以得到用户群对待分发内容的反馈参数,具体的计算公式可以如下公式(1)所示:
Figure BDA0002683166860000111
其中,η,δ为平滑作用的平滑参数,通过对行为挖掘模型训练后其取值可以为η=0.004%,δ=5000.0,α,β为控制参数,通过对行为挖掘模型训练后其取值可以为α=1.0,β=0.1,ffki,u为举报或其他负反馈的互动数量,expi,u为待分发内容在用户群内的曝光总量,zani,u为点赞的互动数量,sharei,u为分享的互动数量,Collecti,u为收藏的互动数量。i为待分发内容的内容标识,用来计算和统计数据的唯一ID,通常是一个包含的时间戳,随机数,来源编号等构成字符串,u表示细分的用户群。
可选的,该训练后行为挖掘模型可以根据实际应用的需求进行设置,另外,需要说明的是,该训练后行为挖掘模型可以由维护人员预先进行设置,也可以由该内容分发装置自行进行训练,即步骤“采用训练后行为挖掘模型对所述反馈信息进行多尺度的特征提取”之前,该内容分发方法,还可以包括:
采集多个反馈信息样本,该反馈信息样本包括标注反馈参数的反馈信息,采用预设行为挖掘模型对反馈信息样本的反馈参数进行预测,得到预测反馈参数,根据预测反馈参数和标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。具体可以如下:
(1)采集多个反馈信息样本。
其中,反馈信息样本包括标注反馈参数的反馈信息。
例如,具体可以采用属于同一用户群的多个用户针对待分发内容的反馈信息作为原始数据集,对原始数据集中的反馈信息进行标注,标注对应的反馈参数,得到多个反馈信息样本。
(2)采用预设行为挖掘模型对反馈信息样本的反馈参数进行预测,得到预测反馈参数。
例如,采用预设行为挖掘模型对反馈信息样本进行多尺度的特征提取,得到每个尺度对应的局部反馈特征信息,根据互动行为类型,将局部反馈特征信息分为正反馈特征信息和负反馈特征信息,分别将正反馈特征信息和负反馈特征信息进行融合,得到全局正反馈特征信息和负反馈特征信息,计算全局负反馈特征信息与全局负反馈特征信息的比值,得到反馈信息样本对应的预测反馈参数。
(3)根据预测反馈参数和标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。
例如,在本申请实施例中,可以通过插值函数,根据预测反馈参数与标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。譬如,具体可以如下:
采用Dice函数(一种损失函数),根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,以及通过插值损失函数,根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,得到训练后行为挖掘模型。
可选的,为了提高反馈信息计算反馈参数的精确性,除了采用Dice函数之外,还可以采用其他的损失函数如交叉熵损失函数来进行收敛,具体可以如下:
采用交叉熵损失函数,根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,以及通过插值损失函数,根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,得到训练后行为挖掘模型。
104、获取待分发内容分发至用户群的分发权重,并根据反馈参数,对分发权重进行调整。
例如,可以获取待分发内容分发至用户群的分发权重,比如,可以将待分发内容在预设时间段内的每一个用户群的曝光总量进行对比,从而获取到当前时间下的待分发内容在预设时间段内分发至每一个用户群的分发权重。根据反馈参数,确定针对分发权重的调整信息,基于调整信息,对分发权重进行调整,比如,可以将反馈参数与第一预设参数阈值进行对比,当反馈参数超过第一预设参数阈值时,确定针对分发权重的调整信息为降权为零,在这种情况下,就说明待分发内容对该用户群不适合进行分发,此时,就需要将分发权重降为零,使得待分发内容不再对该用户群中的待分发用户进行分发,这种情况下,就可以在待分发内容进行继续分发时,将该用户群中的待分发用户进行过滤。比如,还可以将反馈参数与第二预设参数阈值进行对比,第二预设参数阈值小于第一预设参数阈值,当反馈参数超过第二预设参数阈值,且没有超过第一预设参数阈值时,就说明该用户群对待分发内容的接受程度较低,但是还是可以接受的,此时,就需要对分发权重进行降权。计算反馈参数与第二预设参数阈值的差值,根据这个差值,确定针对分发权重的降权参数,比如,可以预设多个降权参数,降权参数可以为对分发权重进行降权的值,每一个降权参数对应一个差值区间,确定反馈参数与第二预设参数阈值的差值对应的差值区间,在预设降权参数中筛选出该差值区间的降权参数,将这个降权参数作为调整信息。又比如,还可以将这个差值输入调整模型,通过调整模型输出降权参数,将这个降权参数作为调整信息。基于降权参数,对分发权重进行降权处理,比如,可以直接将分发权重与降权参数相减,就可以得到调整后的分发权重。当反馈参数小于第二预设参数阈值时,说明用户对待分发内容的接受程度较高,此时,对于该用户群的分发权重就不需要进行调整。
其中,需要说明的是,调整后的分发权重包含了调整后的全部用户群的分发权重,比如,以用户群有5个,只有2个用户群的反馈参数超过了第二参数阈值且未超过第一参数阈值为例,此时,就只需要对这个两个用户群的分发权重进行降权,而对剩下的三个用户群的分发权重保持不变,此时就可以将降权后的两个分发权重和未调整的分发权重共同来作为调整后的分发权重。待分发内容在每个用户群的分发权重是可以通过预设时间段内的反馈参数来动态调整,比如,以图文为例,通过获取7天内的历史用户对应的用户群对待分发内容的反馈参数作为后验的用户视角数据,对分发权重进行调整,当7天之后,每个用户群的调整后的分发权重又可以为下一个预设时间段内的原始的分发权重再次进行调整。
105、基于调整后的分发权重对待分发内容进行分发。
例如,获取待分发内容的待分发信息,该待分发信息包括多个待分发用户的标识,比如,由于内容分发的范围时逐步扩大的,当待分发用户分发至历史用户之后,随着新的用户的分发请求,此时就需要将待分发内容分发至新的待分发用户,就可以在接收到的内容分发请求中获取到的待分发内容的待分发信息,该待分发信息中就可以包括多个待分发用户的标识。根据待分发用户的标识,确定待分发用户对应的目标用户群,比如,在待分发用户的标识中识别出待分发用户的性别、年龄或地域等属性信息,在预设用户群中筛选出属性信息对应的用户群,得到目标用户群。基于调整后的分发权重和目标用户群,将待分发内容分发至待分发用户,比如,在调整后的分发权重中筛选出目标用户群对应的目标分发权重,基于这么目标分发权重,将待分发内容分发至待分发用户,这样就可以针对不同的用户群,实现待分发内容的个性化的定向分发。
其中,将待分发内容分发至待分发用户之后,还可以接收预设时间段内的待分发用户针对待分发内容的互动行为信息,根据待分发用户的互动行为信息和对应的目标用户群,就可以确定目标用户群对待分发内容的反馈参数,根据反馈参数,确定针对目标用户群的目标分发权重的调整信息,然后,再基于调整参数,对目标分发权重进行调整。因此,可以发现,每一个用户群对应的分发权重都是动态调整的。这种方法就充分利用后验的用户视角数据来判断内容的质量和用户对内容的接受程度,不再对内容启用与否进行一刀切,满足准入条件的可以进入推荐池;不同的人群用户由于对内容接受程度和感知不一样,所以定向分发以后,能够有效降低阅读到自己反感内容的机会,用户与内容的交互行为能够与内容分发的质量控制相结合,还能够有效降低用户对内容的负反馈和举报行为,增加平台对用户的粘性,用户能够获得更好的阅读体验,同时降权分发不是简单打压过滤,能够确保内容推荐池内容本身的丰富性。
由以上可知,本申请实施例在获取待分发内容、以及待分发内容的历史分发记录后,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发;由于该方案可以通过获取待分发内容的历史分发记录,从而确定历史用户对待分发内容的互动行为信息,并对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,基于反馈参数对待分发内容的分发权重进行调整,使得用户与待分发内容的交互行为可以与内容分发的质量控制相结合,因此,可以大大提升内容分发的准确率。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该内容分发装置具体集成在电子设备,电子设备为服务器为例进行说明。
如图5所示,一种内容分发方法,具体流程如下:
201、服务器获取用户上传的待分发内容。
例如,用户作为内容生产端将从网络上获取的各类内容信息作为待分发内容上传至服务器,用户在上传服务器之前还可以通过内容生成端的终端对内容信息进行编辑,比如,对获取的视频进行截取,添加表情、文字或动画等,还可以对获取到的图像、文本进行编辑等操作,就可以得到待分发内容。用户还可以通过终端自带的摄像头拍摄一些短视频或图像,可以直接将短视频或图像作为待分发内容发送至服务器,还可以对拍摄的短视频进行剪辑,选择搭配的音乐、滤镜模板,如果拍摄的是图像,还可以对图像进行美化,并添加文本信息等编辑动作,将编辑好的短视频或者图文作为待分发内容上传至服务器。服务器接收到待分发内容之后,对图文和图集通过simhash和BERT进行向量化,得到文本向量和图像向量,对于视频内容抽取视频指纹和音频指纹构建向量,然后建立向量的索引,然后通过比较向量之间的距离来确定相似程度,对待分发内容进行去重,去重之后存储至内容数据库。
202、服务器提取待分发内容的特征信息。
例如,服务器针对待分发内容中的图文信息,可以提取元信息频文件大小、封面图链接、视频码率、文件格式、标题、发布时间、作者等信息。还可以对原始内容中的特征进行BERT向量化,从而得到图文信息对应的特征向量。针对原始内容中的视频内容,还可以对视频内容进行标准的转码操作,转码完成后异步返回元信息主要是文件大小,码率、规格和截取封面图等信息。将这些信息也作为特征信息。
203、服务器根据特征信息,对待分发内容进行审核。
例如,以待分发内容为视频为例,服务器可以对视频文件中不同码率、不同清晰度、不同尺寸、部分黑屏,添加的滤镜、视频标志(logo)、插入的广告内容和片头片尾无关内容都可以进行裁剪处理,保证进入人工审核的待分发内容符合处理流程的需要。还可以根据特征信息,将待分发内容中已经审核过的重复内容过滤掉,将过滤后的待分发内容发送至审核服务器,人工在审核服务器审核过滤后的内容是否涉及色情、赌博和政治敏感等,通过人工初步审核的过滤后内容被发送给识别模型进行识别,主要是识别内容的本身和内容的类型等,人工再次根据识别结果对过滤后内容进行分类和对标签的标注或确认,当确认通过时,就说明待分发内容已经通过审核,此时就可以通过调度中心进行推荐分发。
204、当待分发内容通过审核时,服务器在待分发用户集合中筛选出该待分发内容需要分发的历史用户,并将待分发内容分发至历史用户。
例如,当待分发内容通过审核时,服务器对待分发用户集合中的用户进行用户画像,再集合各种推荐算法,比如,协同过滤,矩阵分解,监督学习算法Logistic Regression模型,基于深度学习的模型、FM模型以及GBDT模型等,在待分发用户集合中筛选出需要分发的历史用户。据历史用户的性别、年龄和地域等信息,可以确定历史用户对应的用户群,根据每个用户群对应的分发权重,将待分发内容分发至历史用户,并记录在预设时间段内将待分发内容分发至历史用户的标识和分发时间等信息,得到历史分发目录。
205、服务器获取待分发内容、以及待分发内容的历史分发记录。
例如,服务器可以在内容分发数据库中提取当前需要分发的待分发内容,并获取待分发内容的元信息,根据待分发内容的元信息,在调度中心的服务器中读取待分发内容在预设时间段内的分发信息,将这些分发信息作为待分发内容的历史分发记录。
206、服务器根据历史分发记录确定历史用户、历史用户对应的用户群以及历史用户针对待分发内容的互动行为信息。
例如,服务器读取历史分发记录,在历史分发记录中识别出在预设时间段内接收待分发内容的至少一个历史用户,在历史分发记录中提取出该历史用户对应的标识。在用户的标识中识别出历史用户的性别、年龄和地域等属性信息,根据这些属性信息,从而可以确定出该历史用户对应的用户群。将历史用户的标识作为筛选条件,可以在预设互动行为数据库中筛选出当前时间之前的7天或者其他时间段内的该历史用户标识对应的互动行为信息。
可选的,在预设互动行为数据库中筛选出当前时间之前的7天或者其他时间段内的该历史用户标识对应的互动行为信息之前,还需要将用户针对待分发内容的原始互动行为信息存储至预设互动行为数据库中,比如,用户获取待分发内容的索引信息之后,将待分发内容下载至终端,当用户通过终端对待分发内容进行点赞、分享、转发、举报或者其他负反馈互动时,终端将互动产生的互动信息发送至服务器,服务器在互动信息中识别出用户的标识和互动时间,将用户的标识和互动时间作为原始互动行为信息的索引,从而将原始互动行为信息存储至预设互动行为数据库。
207、服务器在互动行为信息中筛选出用户群对应的互动行为信息,得到群互动行为信息。
例如,服务器将属于同一个用户群的历史用户的互动行为信息进行融合,就可以得到每个用户群的群互动行为信息。
208、服务器在群互动行为信息中识别出用户群对待分发内容的互动行为类型。
例如,服务器在群互动行为信息中提取出该用户群中每一个历史用户对待分发内容的互动行为信息,在该互动行为信息中识别出每一个历史用户互动行为的互动行为类型,就可以得到用户群对待分发内容的互动行为类型。
209、服务器基于互动行为类型,对群互动行为信息进行解析,得到用户群对待分发内容的反馈参数。
例如,服务器可以在群互动信息中统计出互动行为类型的互动数量,根据历史分发记录,确定待分发内容在用户群内的曝光总量,将互动数量和曝光总量进行融合,得到用户群对待分发内容的反馈信息,根据反馈信息,确定用户群对待分发内容的反馈参数,具体可以如下:
(1)服务器在群互动信息中统计出互动行为类型的互动数量。
例如,在群互动行为信息中读取每一个互动行为类型的互动行为的互动次数,将这个互动次数作为每一个互动行为类型的互动数量。
(2)服务器根据历史分发记录,确定待分发内容在用户群内的曝光总量,并将互动数量和曝光总量作为所述用户群对待分发内容的反馈信息。
例如,服务器根据每一个历史用户对应的用户群的信息,在历史分发记录中筛选出将待分发内容分发至同一个用户群的历史用户的分发信息,得到目标历史分发记录。在目标历史分发记录中统计出将待分发内容分发至用户群的分发次数,将分发次数作为待分发内容在用户群内的曝光总量。将每种互动类型对应的互动数量和曝光总量作为用户群对待分发内容的反馈信息。
(3)服务器根据反馈信息,确定用户群对待分发内容的反馈参数。
例如,服务器根据互动行为类型的不同,采用训练后行为挖掘模型分别计算不同互动行为类型的互动数量与曝光总量和平滑参数的比值,从而可以得到每个尺度对应的局部反馈特征信息。将点赞、转发和分享等互动行为对应的局部反馈信息分为正反馈特征信息,将局部或其他负反馈互动行为对应的局部反馈信息分为负反馈特征信息。采用平滑参数和控制参数,对全部的正反馈特征信息进行融合,得到全局正反馈特征信息,采用平滑参数和控制参数,对全部的负反馈特征信息进行融合,得到全局负反馈特征信息。计算全局负反馈特征信息与全局负反馈特征信息的比值,就可以得到用户群对待分发内容的反馈参数,具体的计算公式可以为公式(1)。
可选的,该训练后行为挖掘模型可以根据实际应用的需求进行设置,另外,需要说明的是,该训练后行为挖掘模型可以由维护人员预先进行设置,也可以由该内容分发装置自行进行训练,即步骤“采用训练后行为挖掘模型分别计算不同互动行为类型的互动数量与曝光总量和平滑参数的比值”之前,可以采集多个反馈信息样本,该反馈信息样本包括标注反馈参数的反馈信息,采用预设行为挖掘模型对反馈信息样本的反馈参数进行预测,得到预测反馈参数,根据预测反馈参数和标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。具体可以如下:
(1)服务器采集多个反馈信息样本。
例如,服务器可以采用属于同一用户群的多个用户针对待分发内容的反馈信息作为原始数据集,对原始数据集中的反馈信息进行标注,标注对应的反馈参数,得到多个反馈信息样本。
(2)服务器采用预设行为挖掘模型对反馈信息样本的反馈参数进行预测,得到预测反馈参数。
例如,服务器采用预设行为挖掘模型对反馈信息样本进行多尺度的特征提取,得到每个尺度对应的局部反馈特征信息,根据互动行为类型,将局部反馈特征信息分为正反馈特征信息和负反馈特征信息,分别将正反馈特征信息和负反馈特征信息进行融合,得到全局正反馈特征信息和负反馈特征信息,计算全局负反馈特征信息与全局负反馈特征信息的比值,得到反馈信息样本对应的预测反馈参数。
(3)服务器根据预测反馈参数和标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。
例如,在本申请实施例中,可以通过插值函数,根据预测反馈参数与标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。譬如,具体可以如下:
采用Dice函数,根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,以及通过插值损失函数,根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,得到训练后行为挖掘模型。
可选的,为了提高反馈信息计算反馈参数的精确性,除了采用Dice函数之外,还可以采用其他的损失函数如交叉熵损失函数来进行收敛,具体可以如下:
采用交叉熵损失函数,根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,以及通过插值损失函数,根据反馈信息样本的预测反馈参数与标注反馈参数对行为挖掘模型中用于计算反馈信息的反馈参数的平滑参数和控制参数进行调整,得到训练后行为挖掘模型。
210、服务器获取待分发内容分发至用户群的分发权重,并根据反馈参数,对分发权重进行调整。
例如,可以将待分发内容在预设时间段内的每一个用户群的曝光总量进行对比,从而获取到当前时间下的待分发内容在预设时间段内分发至每一个用户群的分发权重。将反馈参数与第一预设参数阈值进行对比,当反馈参数超过第一预设参数阈值时,确定针对分发权重的调整信息为降权为零,将分发权重降为零,使得待分发内容不再对该用户群中的待分发用户进行分发。还可以将反馈参数与第二预设参数阈值进行对比,第二预设参数阈值小于第一预设参数阈值,当反馈参数超过第二预设参数阈值,且没有超过第一预设参数阈值时,计算反馈参数与第二预设参数阈值的差值。确定反馈参数与第二预设参数阈值的差值对应的差值区间,在预设降权参数中筛选出该差值区间的降权参数,将这个降权参数作为调整信息。直接将分发权重与降权参数相减,就可以得到调整后的分发权重。当反馈参数小于第二预设参数阈值时,该用户群的分发权重就不需要进行调整。
211、服务器基于调整后的分发权重对待分发内容进行分发。
例如,服务器在接收到的内容分发请求中获取到的待分发内容的待分发信息,该待分发信息中就可以包括多个待分发用户的标识。在待分发用户的标识中识别出待分发用户的性别、年龄或地域等属性信息,在预设用户群中筛选出属性信息对应的用户群,得到目标用户群。在调整后的分发权重中筛选出目标用户群对应的目标分发权重,基于这么目标分发权重,将待分发内容分发至待分发用户。
由以上可知,本实施例电子设备在获取待分发内容、以及待分发内容的历史分发记录后,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发;由于该方案可以通过获取待分发内容的历史分发记录,从而确定历史用户对待分发内容的互动行为信息,并对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,基于反馈参数对待分发内容的分发权重进行调整,使得用户与待分发内容的交互行为可以与内容分发的质量控制相结合,因此,可以大大提升内容分发的准确率。
为了更好地实施以上方法,本发明实施例还提供一种内容分发装置,该内容分发装置可以集成在电子设备,比如服务器或终端等设备中,该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。
例如,如图6所示,该内容分发装置可以包括获取单元301、确定单元302、解析单元303、调整单元304和分发单元305,如下:
(1)获取单元301;
获取单元301,用于获取待分发内容、以及待分发内容的历史分发记录,该历史分发记录为预设时间段内的待分发内容的分发信息。
例如,获取单元301,具体可以用于在内容分发数据库中提取当前需要分发的待分发内容,并获取待分发内容的元信息,根据待分发内容的元信息,在调度中心的服务器中读取待分发内容在预设时间段内的历史分发记录。
(2)确定单元302;
确定单元302,用于根据历史分发记录确定历史用户、历史用户对应的用户群、已经历史用户针对待分发内容的互动行为信息。
例如,确定单元302,具体可以用于在历史分发记录中识别出接收待分发内容的历史用户和历史用户的标识,根据历史用户的标识,确定历史用户对应的用户群,在预设互动行为数据库中筛选出预设时间段内的历史用户的标识对应的互动行为信息。
(3)解析单元303;
解析单元303,用于对互动行为信息进行解析,得到用户群对待分发内容的反馈参数;
其中,解析单元303还可以包括筛选子单元3031、识别子单元3032和解析子单元3033,如图7所示,具体可以如下:
筛选子单元3031,用于在互动行为信息中筛选出用户群对应的互动行为信息,得到群互动行为信息;
识别子单元3032,用于在群互动行为信息中识别出用户群对待分发内容的互动行为类型;
解析子单元3033,用于基于互动行为类型,对群互动行为信息进行解析,得到用户群对所述待分发内容的反馈参数。
例如,筛选子单元3031在互动行为信息中筛选出用户群对应的互动行为信息,得到群互动行为信息,识别子单元3032在群互动行为信息中识别出用户群对待分发内容的互动行为类型,解析子单元3033基于互动行为类型,对群互动行为信息进行解析,得到用户群对所述待分发内容的反馈参数。
(4)调整单元304;
调整单元304,用于获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整。
例如,调整单元304,具体可以用于根据反馈参数,确定针对分发权重的调整信息,基于调整信息,对分发权重进行调整。
(5)分发子单元305;
分发子单元305,用于基于调整后的分发权重对待分发内容进行分发。
例如,分发子单元305,具体可以用于获取待分发内容的待分发用户信息,该待分发信息包括多个待分发用户的标识,根据待分发用户的标识,确定待分发用户对应的目标用户群,基于调整后的分发权重,将待分发内容分发至待分发用户。
可选的,内容分发装置还可以包括采集单元306和训练单元307,如图8所示,具体如下:
采集单元306,用于采集多个反馈信息样本,该反馈信息样本包括标注反馈参数的反馈信息;
训练单元307,用于采用预设行为挖掘模型对反馈信息样本的反馈信息进行预测,根据预测反馈参数和标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。
例如,采集单元306采集多个反馈信息样本,该反馈信息样本包括标注反馈参数的反馈信息,训练单元307采用预设行为挖掘模型对反馈信息样本的反馈信息进行预测,根据预测反馈参数和标注反馈参数对预设行为挖掘模型进行收敛,得到训练后行为挖掘模型。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由以上可知,本实施例在获取单元301获取待分发内容、以及待分发内容的历史分发记录后,该历史分发记录为预设时间段内的待分发内容的分发信息,确定单元302根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,解析单元303对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,调整单元304获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,分发单元305基于调整后的分发权重对待分发内容进行分发;由于该方案可以通过获取待分发内容的历史分发记录,从而确定历史用户对待分发内容的互动行为信息,并对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,基于反馈参数对待分发内容的分发权重进行调整,使得用户与待分发内容的交互行为可以与内容分发的质量控制相结合,因此,可以大大提升内容分发的准确率。
本发明实施例还提供一种电子设备,如图9所示,其示出了本发明实施例所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图9中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取待分发内容、以及待分发内容的历史分发记录,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发。
例如,电子设备在内容分发数据库中提取当前需要分发的待分发内容,并获取待分发内容的元信息,根据待分发内容的元信息,在调度中心的服务器中读取待分发内容在预设时间段内的历史分发记录。在历史分发记录中识别出接收待分发内容的历史用户和历史用户的标识,根据历史用户的标识,确定历史用户对应的用户群,在预设互动行为数据库中筛选出预设时间段内的历史用户的标识对应的互动行为信息。在互动行为信息中筛选出用户群对应的互动行为信息,得到群互动行为信息,群互动行为信息中识别出用户群对待分发内容的互动行为类型,基于互动行为类型,对群互动行为信息进行解析,得到用户群对所述待分发内容的反馈参数。根据反馈参数,确定针对分发权重的调整信息,基于调整信息,对分发权重进行调整。获取待分发内容的待分发用户信息,该待分发信息包括多个待分发用户的标识,根据待分发用户的标识,确定待分发用户对应的目标用户群,基于调整后的分发权重,将待分发内容分发至待分发用户。
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
由以上可知,本发明实施例在获取待分发内容、以及待分发内容的历史分发记录后,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发;由于该方案可以通过获取待分发内容的历史分发记录,从而确定历史用户对待分发内容的互动行为信息,并对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,基于反馈参数对待分发内容的分发权重进行调整,使得用户与待分发内容的交互行为可以与内容分发的质量控制相结合,因此,可以大大提升内容分发的准确率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种内容分发方法中的步骤。例如,该指令可以执行如下步骤:
获取待分发内容、以及待分发内容的历史分发记录,该历史分发记录为预设时间段内的待分发内容的分发信息,根据历史分发记录确定历史用户、历史用户对应的用户群、以及历史用户针对待分发内容的互动行为信息,对互动行为信息进行解析,得到用户群对待分发内容的反馈参数,获取待分发内容分发至用户群的分发权重,并根据反馈参数对分发权重进行调整,基于调整后的分发权重对待分发内容进行分发。
例如,电子设备在内容分发数据库中提取当前需要分发的待分发内容,并获取待分发内容的元信息,根据待分发内容的元信息,在调度中心的服务器中读取待分发内容在预设时间段内的历史分发记录。在历史分发记录中识别出接收待分发内容的历史用户和历史用户的标识,根据历史用户的标识,确定历史用户对应的用户群,在预设互动行为数据库中筛选出预设时间段内的历史用户的标识对应的互动行为信息。在互动行为信息中筛选出用户群对应的互动行为信息,得到群互动行为信息,群互动行为信息中识别出用户群对待分发内容的互动行为类型,基于互动行为类型,对群互动行为信息进行解析,得到用户群对所述待分发内容的反馈参数。根据反馈参数,确定针对分发权重的调整信息,基于调整信息,对分发权重进行调整。获取待分发内容的待分发用户信息,该待分发信息包括多个待分发用户的标识,根据待分发用户的标识,确定待分发用户对应的目标用户群,基于调整后的分发权重,将待分发内容分发至待分发用户。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本发明实施例所提供的任一种内容分发方法中的步骤,因此,可以实现本发明实施例所提供的任一种内容分发方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述内容分发方面的各种可选实现方式中提供的方法。
以上对本发明实施例所提供的一种内容分发方法、装置和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种内容分发方法,其特征在于,包括:
获取待分发内容、以及所述待分发内容的历史分发记录,所述历史分发记录为预设时间段内的所述待分发内容的分发信息;
根据所述历史分发记录确定历史用户、所述历史用户对应的用户群、以及所述历史用户针对所述待分发内容的互动行为信息;
对所述互动行为信息进行解析,得到所述用户群对所述待分发内容的反馈参数;
获取所述待分发内容分发至所述用户群的分发权重,并根据所述反馈参数对所述分发权重进行调整;
基于调整后的分发权重对所述待分发内容进行分发。
2.根据权利要求1所述的内容分发方法,其特征在于,所述根据所述反馈参数对所述分发权重进行调整,包括:
根据所述反馈参数,确定针对所述分发权重的调整信息;
基于所述调整信息,对所述分发权重进行调整。
3.根据权利要求2所述的内容分发方法,其特征在于,所述根据所述反馈参数,确定针对所述分发权重的调整信息,包括:
将所述反馈参数与第一预设参数阈值进行对比;
当所述反馈参数超过第一预设参数阈值时,确定针对所述分发权重的调整信息为降权为零;
所述基于所述调整信息,对所述分发权重进行调整,包括:将所述分发权重降权为零。
4.根据权利要求2所述的内容分发方法,其特征在于,所述根据所述反馈参数,确定针对所述分发权重的调整信息,包括:
将所述反馈参数与第二预设参数阈值进行对比,所述第二预设参数阈值小于所述第一预设参数阈值;
当所述反馈参数超过所述第二预设参数阈值,且所述反馈参数未超过所述第一预设参数阈值时,计算所述反馈参数与所述第二预设参数阈值的差值;
根据所述差值,确定针对所述分发权重的降权参数,将所述降权参数作为所述调整信息;
所述基于所述调整信息,对所述分发权重进行调整,包括:基于所述降权参数,对所述分发权重进行降权处理。
5.根据权利要求1至4任一项所述的内容分发方法,其特征在于,所述对所述互动行为信息进行解析,得到所述用户群对所述待分发内容的反馈参数,包括:
在所述互动行为信息中筛选出所述用户群对应的互动行为信息,得到群互动行为信息;
在所述群互动行为信息中识别出所述用户群对所述待分发内容的互动行为类型;
基于所述互动行为类型,对所述群互动行为信息进行解析,得到所述用户群对所述待分发内容的反馈参数。
6.根据权利要求5所述的内容分发方法,其特征在于,所述基于所述互动行为类型,对所述群互动行为信息进行解析,得到所述用户群对所述待分发内容的反馈参数,包括:
在所述群互动信息中统计出所述互动行为类型的互动数量;
根据所述历史分发记录,确定所述待分发内容在所述用户群内的曝光总量,并将互动数量和曝光总量作为所述用户群对所述待分发内容的反馈信息;
根据所述反馈信息,确定所述用户群对所述待分发内容的反馈参数。
7.根据权利要求6所述的内容分发方法,其特征在于,所述根据所述历史分发记录,确定所述待分发内容在所述用户群内的曝光总量,包括:
在所述历史分发记录中筛选出将所述待分发内容分发至所述用户群的目标历史分发记录;
在所述目标历史分发记录中统计出将所述待分发内容分发至所述用户群的分发次数,将所述分发次数作为所述待分发内容在所述用户群内的曝光总量。
8.根据权利要求6所述的内容分发方法,其特征在于,所述根据所述反馈信息,确定所述用户群对所述待分发内容的反馈参数,包括:
采用训练后行为挖掘模型对所述反馈信息进行多尺度的特征提取,得到每个尺度对应的局部反馈特征信息;
根据所述互动行为类型,将局部反馈特征信息分为正反馈特征信息和负反馈特征信息;
分别将正反馈特征信息和负反馈特征信息进行融合,得到全局正反馈特征信息和全局负反馈特征信息;
计算所述全局负反馈特征信息与全局负反馈特征信息的比值,得到所述用户群对所述待分发内容的反馈参数。
9.根据权利要求8所述的内容分发方法,其特征在于,所述采用训练后行为挖掘模型对所述反馈信息进行多尺度的特征提取之前,还包括:
采集多个反馈信息样本,所述反馈信息样本包括标注反馈参数的反馈信息;
采用预设行为挖掘模型对所述反馈信息样本的反馈参数进行预测,得到预测反馈参数;
根据所述预测反馈参数和标注反馈参数对所述预设行为挖掘模型进行收敛,得到所述训练后行为挖掘模型。
10.根据权利要求1所述的内容分发方法,其特征在于,所述基于调整后的分发权重对所述待分发内容进行分发,包括:
获取所述待分发内容的待分发用户信息,所述待分发信息包括多个待分发用户的标识;
根据所述待分发用户的标识,确定所述待分发用户对应的目标用户群;
在所述调整后的分发权重中筛选出所述目标用户群对应的分发权重,得到目标分发权重;
根据所述目标分发权重,将所述待分发内容分发至所述待分发用户。
11.根据权利要求1所述的内容分发方法,其特征在于,所述根据所述历史分发记录确定历史用户、所述历史用户对应的用户群、以及所述历史用户针对所述待分发内容的互动行为信息,包括:
在所述历史分发记录中识别出接收所述待分发内容的历史用户和所述历史用户的标识;
根据所述历史用户的标识,确定所述历史用户对应的用户群;
在预设互动行为数据库中筛选出所述预设时间段内的所述历史用户的标识对应的互动行为信息。
12.根据权利要求11所述的内容分发方法,其特征在于,所述在预设互动行为数据库中筛选出所述预设时间段内的所述历史用户的标识对应的互动行为信息之前,还包括:
接收终端发送的用户针对所述待分发内容的互动信息,所述互动信息包括原始互动行为信息;
在所述互动信息中识别出所述用户的标识和互动时间;
根据所述用户的标识和互动时间,将所述原始互动行为信息存储至所述预设互动行为数据库。
13.一种内容分发装置,其特征在于,包括:
获取单元,用于获取待分发内容、以及所述待分发内容的历史分发记录,所述历史分发记录为预设时间段内的所述待分发内容的分发信息;
确定单元,用于根据所述历史分发记录确定历史用户、所述历史用户对应的用户群、以及所述历史用户针对所述待分发内容的互动行为信息;
解析单元,用于对所述互动行为信息进行解析,得到所述用户群对所述待分发内容的反馈参数;
调整单元,用于获取所述待分发内容分发至所述用户群的分发权重,并根据所述反馈参数对所述分发权重进行调整;
分发单元,用于基于调整后的分发权重对所述待分发内容进行分发。
14.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行所述权利要求1至12任一项所述的内容分发方法中的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至12任一项所述的内容分发方法中的步骤。
CN202010968355.5A 2020-09-15 2020-09-15 内容分发方法、装置、电子设备和计算机可读存储介质 Pending CN112202849A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010968355.5A CN112202849A (zh) 2020-09-15 2020-09-15 内容分发方法、装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010968355.5A CN112202849A (zh) 2020-09-15 2020-09-15 内容分发方法、装置、电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112202849A true CN112202849A (zh) 2021-01-08

Family

ID=74015134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010968355.5A Pending CN112202849A (zh) 2020-09-15 2020-09-15 内容分发方法、装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112202849A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111405325A (zh) * 2020-03-25 2020-07-10 北京达佳互联信息技术有限公司 一种视频内容分发方法和装置及电子设备
CN115730111A (zh) * 2021-09-01 2023-03-03 腾讯科技(深圳)有限公司 内容分发方法、装置、设备及计算机可读存储介质
CN116723339A (zh) * 2023-08-11 2023-09-08 腾讯科技(深圳)有限公司 内容数据的分发方法和装置、存储介质及电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111405325A (zh) * 2020-03-25 2020-07-10 北京达佳互联信息技术有限公司 一种视频内容分发方法和装置及电子设备
CN111405325B (zh) * 2020-03-25 2022-03-25 北京达佳互联信息技术有限公司 一种视频内容分发方法和装置及电子设备
CN115730111A (zh) * 2021-09-01 2023-03-03 腾讯科技(深圳)有限公司 内容分发方法、装置、设备及计算机可读存储介质
CN115730111B (zh) * 2021-09-01 2024-02-06 腾讯科技(深圳)有限公司 内容分发方法、装置、设备及计算机可读存储介质
CN116723339A (zh) * 2023-08-11 2023-09-08 腾讯科技(深圳)有限公司 内容数据的分发方法和装置、存储介质及电子设备
CN116723339B (zh) * 2023-08-11 2023-11-14 腾讯科技(深圳)有限公司 内容数据的分发方法和装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN110225373B (zh) 一种视频审核方法、装置及电子设备
CN109547814B (zh) 视频推荐方法、装置、服务器及存储介质
CN108021929B (zh) 基于大数据的移动端电商用户画像建立与分析方法及系统
CN108874832B (zh) 目标评论确定方法及装置
CN111798879B (zh) 用于生成视频的方法和装置
CN110909205B (zh) 一种视频封面确定方法、装置、电子设备及可读存储介质
CN111090813B (zh) 一种内容处理方法、装置和计算机可读存储介质
CN112153426B (zh) 一种内容账号管理方法、装置、计算机设备及存储介质
CN111538860B (zh) 视频推荐方法及装置、存储介质及电子设备
CN109033408B (zh) 信息推送方法及装置、计算机可读存储介质、电子设备
CN112202849A (zh) 内容分发方法、装置、电子设备和计算机可读存储介质
CN112749608A (zh) 视频审核方法、装置、计算机设备和存储介质
CN111885399B (zh) 内容分发方法、装置、电子设备以及存储介质
WO2022105129A1 (zh) 内容数据推荐方法、装置、计算机设备及存储介质
CN112231563B (zh) 一种内容推荐方法、装置及存储介质
CN111310041B (zh) 图文发布的方法、模型的训练方法、装置及存储介质
CN111444357A (zh) 内容信息确定方法、装置、计算机设备及存储介质
CN111522724B (zh) 异常账号的确定方法、装置、服务器及存储介质
CN111125429A (zh) 一种视频推送方法、装置和计算机可读存储介质
CN111368141B (zh) 视频标签的扩展方法、装置、计算机设备和存储介质
CN111597443A (zh) 内容推荐方法、装置、电子设备及存储介质
CN112231497A (zh) 信息分类方法、装置、存储介质及电子设备
CN111597361B (zh) 多媒体数据处理方法、装置、存储介质及设备
CN111444364B (zh) 一种图像检测方法和装置
CN110210884B (zh) 确定用户特征数据的方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40037829

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210108

WD01 Invention patent application deemed withdrawn after publication