CN114374857A - 一种内容分发方法、装置、服务器及存储介质 - Google Patents
一种内容分发方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN114374857A CN114374857A CN202210007965.8A CN202210007965A CN114374857A CN 114374857 A CN114374857 A CN 114374857A CN 202210007965 A CN202210007965 A CN 202210007965A CN 114374857 A CN114374857 A CN 114374857A
- Authority
- CN
- China
- Prior art keywords
- content
- target content
- manual review
- distribution
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 177
- 238000000034 method Methods 0.000 title claims abstract description 111
- 238000003860 storage Methods 0.000 title claims abstract description 28
- 238000012552 review Methods 0.000 claims abstract description 182
- 230000008569 process Effects 0.000 claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000012795 verification Methods 0.000 claims abstract description 13
- 238000001514 detection method Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012550 audit Methods 0.000 description 51
- 238000010586 diagram Methods 0.000 description 22
- 230000007246 mechanism Effects 0.000 description 18
- 230000006399 behavior Effects 0.000 description 15
- 238000001914 filtration Methods 0.000 description 12
- 230000003993 interaction Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000002452 interceptive effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000010223 real-time analysis Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2407—Monitoring of transmitted content, e.g. distribution time, number of downloads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例涉及互联网技术领域,以及提供一种内容分发方法、装置、服务器及存储介质,包括:对获取到的目标内容进行机器审核;若机器审核通过,则对所述目标内容进行分发;检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;根据所述人工审核结果对所述目标内容的分发进行处理。本申请实施例能够提高内容分发的及时性以及节省人力成本。
Description
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种内容分发方法、装置、服务器及存储介质。
背景技术
在互联网快速发展的时代,随着内容生产的门槛降低,视频的上传量以指数级的速度增长,为了保证视频分发的安全性,需要在短时间内完成视频的审核。例如对视频是否涉及敏感信息、内容质量和安全性进行识别和处理。
现有技术中提供了一种内容分发方法,主要是:通过机器审核方式对用户上传的视频做审核处理、如过滤明显违反法律的视频内容。然后和人工审核方式结合,做二次过滤审核。最后人工审核通过后对其进行分发。
但是这种方式在大量视频等待审核的情况下,一方面容易造成时效或高质量视频的积压,内容分发不及时,另一方面需要耗费大量的人力成本。由此,现有技术存在内容分发不及时、人力成本高的问题。
发明内容
本申请实施例提供了一种内容分发方法、装置、服务器及存储介质,能够提高内容分发的及时性以及节省人力成本。
第一方面中,本申请实施例提供一种内容分发方法,包括:
对获取到的目标内容进行机器审核;
若机器审核通过,则对所述目标内容进行分发;
检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;
若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;
根据所述人工审核结果对所述目标内容的分发进行处理。
可选地,在本申请一些可能的实现方式中,所述检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据,包括:
检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的正向指标数据和负向指标数据。
可选地,在本申请一些可能的实现方式中,所述若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果,包括:
若所述正向指标数据大于第一正向指标阈值,则通过所述预设人工审核通道获取所述目标内容的人工审核结果;或
若所述负向指标数据大于第一负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
可选地,在本申请一些可能的实现方式中,若所述正向指标数据包括第一正向指标数据和第二正向指标数据,所述负向指标数据包括第一负向指标数据和第二负向指标数据,所述若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果,包括:
通过第一预设加权因子对所述第一正向指标数据和所述第二正向指标数据进行加权,得到第一加权结果;若所述第一加权结果大于第二正向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果;或
通过第二预设加权因子对所述第一负向指标数据和所述第二负向指标数据进行加权,得到第二加权结果;若所述第二加权结果大于第二负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
可选地,在本申请一些可能的实现方式中,所述根据所述人工审核结果对所述目标内容的分发进行处理,之前还包括:
若所述正向指标数据满足所述预设人工审核条件,且所述负向指标数据不满足所述预设人工审核条件,则继续分发所述目标内容;或
若所述负向指标数据满足所述预设人工审核条件,则暂停分发所述目标内容。
可选地,在本申请一些可能的实现方式中,所述对所述目标内容进行分发,包括:
根据所述目标内容的特征信息为所述目标内容分配第一终端集合;
将所述目标内容发送至所述第一终端集合中的各个终端。
可选地,在本申请一些可能的实现方式中,所述根据所述人工审核结果对所述目标内容的分发进行处理,包括:
若所述人工审核结果为通过,则将所述目标内容发送至第二终端集合中的各个终端;所述第二终端集合中的终端数量大于所述第一终端集合中的终端数量;
若所述人工审核结果为不通过,则停止分发所述目标内容。
第二方面中,本申请实施例提供一种内容分发装置,具有实现对应于上述第一方面提供的内容分发方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的单元,所述单元可以是软件和/或硬件。
一种可能的设计中,所述内容分发装置包括:
审核单元,用于对获取到的目标内容进行机器审核;
分发单元,用于若机器审核通过,则对所述目标内容进行分发;
检测单元,用于检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;
获取单元,用于若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;
处理单元,用于根据所述人工审核结果对所述目标内容的分发进行处理。
本申请实施例又一方面提供了一种服务器,其包括至少一个连接的处理器、存储器和收发器,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述存储器中的计算机程序来执行上述第一方面所述的方法。
本申请实施例又一方面提供了一种计算机可读存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面、第一方面中的各种实现方式中提供的方法。
相较于现有技术,本申请实施例提供的方案中,首先在对目标内容进行机器审核后,若审核通过,则当前无需进行人工审核,就可以进行分发,从而提升了内容分发的及时性;其次在操作数据满足预设人工审核条件下,才会对目标内容进行人工审核,从而节省了人力成本。可见,本申请实施例提升了内容分发的及时性以及节省了人力成本。
附图说明
图1为本申请实施例提供的一种内容分发装置运行的网络架构图;
图2为本申请实施例提供的一种分发系统结构示意图;
图3为本申请实施例提供的一种反馈系统结构示意图;
图4为本申请实施例提供的一种内容分发方法的流程图;
图5为本申请实施例提供的一种内容状态变化示意图;
图6为本申请实施例提供的一种内容分发方法整体流程图;
图7为本申请实施例提供的一种视频上传过程流程示意图;
图8为本申请实施例提供的一种机器审核过程流程示意图;
图9为本申请实施例提供的一种人工审核过程流程示意图;
图10为本申请实施例提供的一种视频分发过程流程示意图;
图11为本申请实施例提供的一种实时分发统计上报过程流程示意图;
图12为本申请实施例提供的一种反馈回捞过程流程示意图;
图13为本申请实施例提供的一种基本回捞过程流程示意图;
图14为本申请实施例提供的一种内容分发装置的结构示意图;
图15为本申请实施例提供的一种服务器结构示意图。
具体实施方式
本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请实施例中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请实施例中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请实施例方案的目的。
在互联网快速发展的时代,随着内容生产的门槛降低,视频上传量以指数级的速度增长。这些视频包括各种内容创造机构,比如自媒体和机构的专业生产内容(Professional Generated Content,PGC)、用户原创内容(User Generated Content,UGC)等。为了保证视频分发的安全性,需要在短时间内完成视频内容的审核。例如对视频是否涉及敏感信息、内容质量和安全性进行识别和处理。
现有技术中提供了一种内容分发方法,主要是:通过机器审核方式对用户上传的视频做审核处理、如过滤明显违反法律的视频内容。然后和人工审核方式结合,做二次过滤审核。最后人工审核通过后对其进行分发。
但是这种方式在大量视频等待审核的情况下,一方面容易造成时效或高质量视频的积压,内容分发不及时,另一方面需要耗费大量的人力成本。由此,现有技术存在内容分发不及时、人力成本高的问题。
因此,针对上述问题,本申请实施例中提供了一种内容分发方法,首先在对目标内容进行机器审核后,若审核通过,则当前无需进行人工审核,就可以进行分发,从而提升了内容分发的及时性;其次在操作数据满足预设人工审核条件下,才会对目标内容进行人工审核,从而节省了人力成本。可见,本申请实施例提升了内容分发的及时性以及节省了人力成本。
本申请实施例提供的内容分发方法可用于视频上传、文本上传、语音上传、短视频播放、直播、弹幕、评论等场景,通过服务器来执行内容分发方法,或者通过服务器上运行的内容分发装置来执行内容分发方法。本申请实施例涉及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。本申请实施例涉及的终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
本申请实施例提供的内容分发方法可以通过服务器上运行的内容分发装置来执行,具体地,内容分发装置可以运行于图1所示的网络架构,如图1所示,是内容分发装置运行的网络架构图,如图可知,内容生成端上传发布内容,机器审核服务对内容生成端上传的内容进行审核,如过滤明显违反法律的内容,若内容满足“先审后发”机制,则通过人工审核服务进行人工审核,若内容满足“先发后审”机制,则直接通过分发服务分发至内容消费端。其中,“先审后发”指的是经过机器审核后,再进行人工审核,人工审核通过后,再进行分发内容,“先审后发”机制对内容的时效性要求不高,但是对内容的质量要求较高,适用于在社区、论坛、新闻平台等场景下发表文章、观点、讨论等,此时对于平台方来说需要对内容负责,并构建权威性,因此通常要审核后才能发表;“先发后审”指的是经过机器审核后,直接分发内容,分发后再按照审核规则进行审核,“先发后审”机制对内容的时效性要求比较高。适用于对发表内容时效性要求较高的场景,如阅读、听歌等场景下的用户评论、此时用户发表评论更多出于即兴,因此从用户的角度考虑,希望自己发表的评论能够马上看到成功、有效。在分发服务分发内容的过程中,启用回捞检测机制,例如对基于内容触发的对象行为与内容之间的交互指标的交互数值进行检测,如内容的浏览量(Page View,PV)和访客访问次数(Visit View,VV)。当交互数值达到回捞阈值时,则启用人工审核服务,对分发服务中的内容进行人工审核,人工审核通过后,通过分发服务进行分发,若人工审核未通过,则停止分发或禁用分发等。应理解,图中的内容生成端可以为终端,在实际应用场景下,内容生成端的个数可以根据实际场景进行调整,此处不做限定。同理,图中的内容消费端也可以为终端,在实际应用场景下,内容消费端的个数也可以根据实际场景进行调整。
上述PV指的是浏览量,如页面浏览的次数,用以衡量网站用户访问的网页数量。
上述VV指的是访客访问次数,用以记录所有访客一天内访问多少次网站。
图1所示的网络架构图主要包括两个部分,具体可以分为分发系统和反馈系统。具体地,如图2和图3所示,图2为本申请实施例提供的一种分发系统结构示意图,图3为本申请实施例提供的一种反馈系统结构示意图。如图2所示,内容生成端上传需要发布的内容,上下行内容接口服务器将内容中的元信息写入内容数据库,调度中心服务调用机器审核系统进行审核,并同步人工审核系统,人工审核结果回传至内容数据库,内容数据库更新元信息,推荐分发与内容分发出口服务启用内容,开始分发至内容消费端。如图3所示,内容消费端从上下行内容接口服务器获取索引信息,并根据索引信息向实时分发统计上报接口服务上报内容消费数据,实时分发统计上报接口服务将内容消费数据中的举报反馈数据同步至负面评价/反馈举报服务器,以及将内容消费数据写入至互动内容数据库。基本回捞检测服务获取实时分发统计上报接口服务推送的实时分析数据,若根据实时分析数据确定进行人工审核,则通过复核队列服务发送至人工审核系统。若反馈回捞服务及策略配置服务根据举报反馈数据确定进行人工审核,则通过复核队列服务发送至人工审核系统。应理解,人工审核系统和上下行内容接口服务器为分发系统和反馈系统共有的组成部分,依据人工审核系统和上下行内容接口服务器可以将分发系统和反馈系统进行连接,得到图1所示的网络架构的具体组成架构图。
下面对图2和图3中涉及到的各个服务模块的主要功能进行如下说明:
内容生产端和内容消费端:1)专业生产内容(Professional Generated Content,PGC)或者用户原创内容(User Generated Content,UGC)、多通道网络(Multi-ChannelNetwork,MCN)或者专业用户生产内容(Professional User Generated Content,PUGC)的内容生产者,通过移动端或者后端应用程序接口(Application Programming interface,API)系统,提供本地或者全球广域网(World Wide Web,web)发布系统提供的图文内容或者上传视频内容包括短视频和小视频,这些都是分发内容的主要内容来源;2)通过和上下行内容接口服务器的通讯,先获取上传服务器接口地址,然后再发布内容;3)作为消费者,和上下行内容接口服务器通讯,获取访问内容的索引信息,然后和上下行内容接口服务器和内容出口服务通讯直接消费内容,消费的前提通过消息来源(Feeds)推荐分发获得内容的索引;4)Feeds及对象点击行为和环境上报,具体为收集对象当前网络环境、对象对Feeds中间信息的点击操作行为和Feeds内容的曝光数据,上报给实时分发统计上报接口服务;5)如果是视频内容,则上报视频的播放时长,缓存时间及内容的各种互动行为,比如正面评论、转发、分享、收藏、点赞、负面评论、举报、踩等。其中,PGC是互联网术语,指专业生产内容(视频网站)或专家生产内容(微博),用来泛指内容个性化、视角多元化或社会关系虚拟化。UGC指用户原创内容,是伴随着以提倡个性化为主要特点的web2.0概念而兴起的。它并不是某一种具体地业务,而是一种用户使用互联网的新方式,即由原来的以下载为主变为下载和上传并重。MCN是一种多频道网络的产品形态,将PGC内容联合起来,在资本的有力支持下,保障内容的持续输出,从而最终实现商业的稳定变现。PUGC是以UGC形式,产出的相对接近PGC的专业音频内容。Feeds是消息来源,又译为源料、馈送、资讯提供、供稿、摘要、源、新闻订阅、网源,是一种资料格式,网站透过它将最新资讯传播给用户,通过以时间轴方式排列,时间线(Timeline)是Feed最原始最直觉也最基本的展示形式。用户能够订阅网站的先决条件是网站提供了消息来源。将Feed汇流于一处称为聚合(aggregation),而用于聚合的软体称为聚合器(aggregator)。对最终用户而言,聚合器是专门用来订阅网站的软件,一般亦称为新闻阅读器等。
上下行内容接口服务器和推荐分发与内容分发出口服务:1)和内容生产端直接通讯,从前端提交的内容,通常是内容的标题,发布者,摘要,封面图,发布时间,将内容存储数据库;2)将推荐分发的结果下发到内容消费端,展示在用户的Feeds列表当中;3)内容分发出口服务通常是一组地域上就近部署在用户附近的接入服务;4)在内容入库入口依据发布者的账号来源,通过运营的配置设定账号的初审账号等级,这里可以标记一部分优质账号,这个主要是和运营策略密切相关的;5)同时给实时分发统计上报接口服务上报每个账号的发文流水信息,包括发文时间,内容类型,同时也把自媒体提供内容标记信息比如分类,标签,选择的封面图,标题作为扩展信息保存在内容数据库当中。
内容数据库:1)内容的核心数据库,所有生产者发布内容的元信息都保存在这个业务数据库当中,重点是内容本身的元信息,比如大小,封面图链接,标题,发布时间,账号作者,来源渠道,入库时间,还包括人工审核过程中对内容的分类(包括一,二,三级别分类和标签信息,比如一篇讲解国内X手机的文章,一级分科是科技,二级分类是智能手机,三级分类是国内手机,标签信息是X);2)人工审核过程当中会读取内容数据库当中的信息,同时人工审核的结果和状态也会回传进入内容数据库当中保存;3)整个业务流程当中内容处理主要包括机器处理和人工审核处理,依据不同的内容标记将内容数据库分为不同的内容池。需要说明的是,推荐分发与内容分发出口服务、排重服务、内容特征建模服务等都需要从内容数据库当中获取内容,比如排重服务会依据业务需求加载过去一段时间(如一周)已经入库启用的内容,对于重复重新入库的内容将加上过滤标记不再提供给推荐分发与内容分发出口服务输出到用户。
调度中心:1)负责内容流转的整个调度过程,通过上下行内容接口服务器接收入库的内容,然后从内容数据库中获取内容的元信息;2)调度机器审核模块,包括触犯法律底线的内容过滤及内容重复的处理;3)对于不满足先发后审筛选条件的内容,比如安全问题需要人工审核的,调用人工审核系统进行人工审核的处理,也就是先审后发机制。
人工审核服务:1)需要读取内容数据库中视频内容本身的原始信息,通常是一个业务复杂的基于web数据库开发的系统,主要是确保推送的内容符合当地法律和政策允许的访问;2)接受复核队列服务推送的需要人工复核的内容,包括来自基本检测回捞服务和负反馈回捞服务召回的需要复核的内容;3)人工审核的结果最后通过调度中心,写入内容数据库当中。
复核队列服务:1)和人工审核服务通讯同步推送上述方法回捞的需要人工复核的内容;2)同时汇总和统计进入各类回捞内容的量级及类型和回捞时间。
负面评价/反馈举报服务:1)按照上面描述的基于用户负反馈和举报及互动负面评论-标题党,负面评论-低俗,负面评论-错别字,负面评论-抄袭,负面评论-广告,负面评论-谣言,构建有监督学习的情感分析模型,然后模型服务化,单独召回内容;2)用户主动负反馈和内容举报结果的聚合,通常是在按照策略配置统计一个时间窗口类负反馈的次数;3)接受实时分发统计上报接口服务的举报和反馈数据同步。
基本回捞检测服务:1)和实时分发统计上报接口服务通讯,使用消费端实时上报的消费数据来进行,通常设置为VV,PV在过去24H超过100进行检测回捞,实时更新,满足条件即触发基本服务检测回捞;2)基本回捞的结果同步给复核队列服务。
反馈回捞服务及策略配置服务:1)具体实现反馈回捞策略,和负面评论/反馈举报服务通讯,获取后者回捞的结果;2)和复核队列服务通讯,同步负反馈回捞结合和实现灵活的策略配置参数的调整。
实时分发统计上报接口服务:1)接收内容消费端对象当前网络环境及对象对Feeds中间信息的点击操作行为和Feeds文章的曝光数据的上报;2)将上报的统计数据结果写入统计数据库;3)和内容消费端通讯,接收上报上来的内容评论UGC短文本,点赞,转发,收藏等互动信息,并且写入互动内容数据库;4)接收内容消费端的消费流水的上报,将评论具体内容写入互动数据库;5)对上报的流水进行统计挖掘和分析,实时统计数据包括:曝光、PV/VV、正面评论、负面评论、举报、负反馈数,为后续的基本回捞服务提供数据服务。
结合上述网络架构,下面将对本申请中内容分发方法进行介绍,请参阅图4,图4为本申请实施例提供的一种内容分发方法的流程图,本申请实施例至少包括以下步骤:
401、对获取到的目标内容进行机器审核;
本实施例中,内容生成端向内容分发装置上传内容,内容分发装置在对内容进行分发前,为了确定内容安全性,需要对内容进行审核,即机器审核。机器审核主要是在主要链路上调用各种机器能力,包括触犯法律底线的内容过滤,同时还有明确的广告营销内容、格式不规范内容过滤、标题中带有医疗名词、黑词库等配置内容过滤规则。
以内容为视频为例,通常视频是由图片和音频组成的以帧为单位的画面,因此在初步审核时,可以对画面内容中的图片、音频和文字进行审核。
例如,对于音频可能存在一些不良声音,可以通过提取各关键帧的画面内容中的音频,对该音频进行识别,与被禁止音频条件进行比较,若符合被禁止音频条件,则过滤该待审核视频。
又例如,对于画面内容中图片或文字的识别和审核,主要是基于图像识别技术,提取的图像特征与被禁止内容条件进行比较,其中,被禁止内容条件,可以根据实际情况进行设置,这样在进行审核时,可以通过人脸识别技术,判断是否存在一些明星人物,也可以通过识别画面图片的裸露状态,可以分为正常、性感等不同维度。另外,对于图片中的文字的识别可以采用文字识别(optical character recognition,OCR)技术等,本申请实施例中并不进行限制。
应理解,内容分发装置通过初步审核可以过滤掉一部分内容,减少后续再次审核的工作量,提高了审核效率。
402、若机器审核通过,则对所述目标内容进行分发;
本实施例中,在对获取到的目标内容进行审核后,若审核通过,则对目标内容进行分发,即按照“先发后审”机制进行分发。应理解,若审核不通过,则直接过滤该目标内容,若审核未确定,即机器无法确认是否通过该目标内容的审核,则对其进行人工审核,即按照“先审后发”机制进行分发。
另外,由于“先发后审”机制事先不经过人工审核,只经过机器审核,为了确保内容的安全性,在本申请的一些实施例中,采用“先发后审”的内容需要满足预设内容选取策略,例如满足如下条件:1)安全性:分品类、上游有保证,从优质概率高的品类入手,比如来自优质账号和媒体的财经、社会新闻内容;2)当前内容池内C侧流量:低曝光或者无曝光内容优先处理;3)由于人工审核阶段除了质量审核还有分类标签和标注,分类标签和标注通常是机器生成,然后人工参考,因为分类标签和标注的准确率会影响内容的冷启动,所以是否影响选取纳入考虑:分类标签和标注的准确率大于90%。需要说明的是,上述选取策略满足的条件可以根据机器审核能力进行动态调整,以使得大部分内容符合“先发后审”机制,从而提升整体效率。另外也能够避免审核处理的内容没有曝光和分发造成的审核资源的浪费,让优质创作者的内容能够在更短的时延内启用。
需要说明的是,在审核未确定,即机器无法确认是否通过该目标内容的审核时,说明目标内容需要进行人工审核,即“先审后发”机制。在本申请的一些实施方式中,在对目标内容进行审核,且未过滤该目标内容的条件下,若目标内容的特征信息与预设特征信息匹配,则执行人工审核,其中目标内容的特征信息主要指目标内容本身的元信息、标签、和类别等,如标题、作者、电子产品、娱乐新闻、食品等,预设特征信息为与人工审核相关联的特征信息,主要指的是涉及到要闻、科学发现、研发成果等词汇,如“最新研究”、“中央下发”、“成功研发”、“论文发表”等。针对这类内容,若包含有预设特征信息的内容,为了确保内容的真实性,需要在分发前进行人工审核。可以理解的是,若目标内容的特征信息与预设特征信息不匹配,则对目标内容进行分发。
403、检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;
本实施例中,在目标内容进行分发的过程中,内容分发装置会对目标内容进行检测,主要是检测用户对目标内容进行操作时产生的操作数据,如检测用户对目标内容进行转发操作时产生的转发量,又或者检测用户对目标内容进行评论时产生的评论量等。在本申请的一些实施例中,内容分发装置可以对基于目标内容的对象行为与目标内容之间的交互指标进行检测,交互指标可以为曝光、点击、转发、收藏、点赞、评论、举报、关注等,其中,评论可以为正面评论,也可以为负面评论,此处不做限定。
内容分发装置可以在预设历史时长内对基于目标内容的对象行为与目标内容之间的交互指标进行检测,例如内容分发装置对过去24小时内对象行为与目标内容之间的交互指标进行检测。内容分发装置可以实时检测,也可以按照预设间隔进行检测,此处不做限定。
由于对象行为可以为正面行为,也可以为负面行为,所以在本申请的一些实施例中,执行步骤403中的检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据,可以包括:
检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的正向指标数据和负向指标数据。
例如,内容分发装置可以采用上述反馈回捞服务及策略配置服务获取目标内容的分发过程中对象的负面行为与目标内容之间的负向指标数据,以及采用上述基本回捞检测服务获取目标内容的分发过程中对象的正面行为与目标内容之间的正向指标数据。
应理解,负向指标数据可以为1个或者多个负向指标的数据,正向指标数据也可以为1个或者多个正向指标的数据,此处不做限定。
404、若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;
本实施例中,在获取操作数据后,判断操作数据是否满足预设人工审核条件,若是,则启用人工审核通道,获取目标内容的人工审核结果。
例如,若操作数据为多个不同操作的数据,则每个操作的数据都会对应一个阈值,例如,若操作数据为评论数,则阈值可以为20,若操作数据为举报数,则阈值可以为10。可以理解,若评论数大于20,则启用人工审核通道,若举报数大于10,则启动人工审核通道。
在上述步骤403中的检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的正向指标数据和负向指标数据之后,步骤404中的若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果,具体为:
若所述正向指标数据大于第一正向指标阈值,则通过所述预设人工审核通道获取所述目标内容的人工审核结果;或
若所述负向指标数据大于第一负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
具体地,正向指标数据和负向指标数据中只要存在至少一个指标数据大于对应的指标阈值,则启动人工审核通道,通过人工审核通道获取目标内容的人工审核结果。本申请实施例提供了一种通过预设人工审核通道获取目标内容的人工审核结果的实现方式,例如:
通过所述预设人工审核通道向终端发送所述目标内容的审核请求;
通过所述预设人工审核通道接收所述终端根据所述申请请求发送的人工审核结果。
具体地,内容分发装置可以开启人工审核通道,通过人工审核通道向终端发送目标内容的审核请求;终端接收到目标内容的审核请求后,审核人员对该目标内容进行人工审核,终端将人工审核结果通过人工审核通道发送给内容分发装置。在实际场景中,内容分发装置可以通过人工审核通道向当前空闲审核终端发送目标内容的审核请求,以加快目标内容的审核进度,提升整体效率。当然,内容分发装置也可以通过人工审核通道向当前待审核任务量少的审核终端发送目标内容的审核请求,又或者内容分发装置通过人工审核通道向人工审核系统发送目标内容的审核请求,人工审核系统根据当前各审核终端的审核任务量为该审核请求选择审核终端。
考虑到实际应用场景中正向指标数据可能不止一个,负向指标数据也可能不止一个,针对这种应用场景,本申请实施例提供了一种获取人工审核结果的实现方式,例如,若所述正向指标数据包括第一正向指标数据和第二正向指标数据,所述负向指标数据包括第一负向指标数据和第二负向指标数据,所述若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果,包括:
通过第一预设加权因子对所述第一正向指标数据和所述第二正向指标数据进行加权,得到第一加权结果;若所述第一加权结果大于第二正向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果;或
通过第二预设加权因子对所述第一负向指标数据和所述第二负向指标数据进行加权,得到第二加权结果;若所述第二加权结果大于第二负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
具体地,若正向指标为正面评论和点赞,负向指标为举报和拉黑,假设第一正向指标数据为正面评论数20,第二正向指标数据为点赞数100,第一负向指标数据为举报数5,第二负向指标数据为拉黑数5,第一预设加权因子中正面评论的加权系数为0.6,点赞的加权系数为0.4,第二预设加权因子中举报的加权系数为0.5,拉黑的加权系数为0.5,则上述第一加权结果为:20×0.6+100×0.4=52,上述第二加权结果为:5×0.5+5×0.5=5。另外,第二正向指标阈值和第二负向指标阈值可以根据实际场景动态调整。
另外,在本申请的一些实施例中,在上述检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的正向指标数据和负向指标数据的条件下,在根据所述人工审核结果对所述目标内容的分发进行处理之前,针对目标内容的分发状态进行了说明,例如:
若所述正向指标数据满足所述预设人工审核条件,且所述负向指标数据不满足所述预设人工审核条件,则继续分发所述目标内容;或
若所述负向指标数据满足所述预设人工审核条件,则暂停分发所述目标内容。
具体地,无论正向指标数据的数据结果是多少,在根据所述人工审核结果对所述目标内容的分发进行处理之前,目标内容的分发状态仅与负向指标数据相关。以图5为例,图5为本申请实施例提供的一种内容状态变化示意图,图中目标内容对应“先发后审”机制,正向指标为PV,对应的指标阈值为PV阈值,负向指标对应的指标阈值为负向指标阈值,当第二数值达到PV阈值,即触发基本回捞检测服务后,目标内容默认仍为启用状态,即继续分发目标内容,但只要负向指标数据达到负向指标阈值(负反馈阈值)时,目标内容自动由启用状态变为禁用状态,由人审(人工审核)决定目标内容最终状态。
405、根据所述人工审核结果对所述目标内容的分发进行处理。
本实施例中,在通过预设人工审核通道获取目标内容的人工审核结果后,根据人工审核结果对目标内容的分发进行处理,如下架目标内容或继续分发目标内容。
在一些实施例中,内容分发装置会为每一个已经被审核通过的内容,分配一定数量的流量池,而后再根据流量池里面的用户表现,决定要不要把内容推送给更多的人。以视频为例,内容分发装置会根据用户发布视频所在区域的人口密度、地区活跃度和周边地区活跃度来判定给用户分配多少流量。比如视频发布地是上海,则分配300个流量,视频发布地是加拿大,因为加拿大的普通城市人口密度远低于上海人口密度,则分配50个流量。由此,在步骤402中的对所述目标内容进行分发,包括:
根据所述目标内容的特征信息为所述目标内容分配第一终端集合;
将所述目标内容发送至所述第一终端集合中的各个终端。
例如,若目标内容为篮球视频,用户通过手机在某视频网站上传该篮球视频后,内容分发装置可以将该篮球视频推送给标签为篮球的多个流量对应的终端。
又例如,若目标内容为娱乐新闻,用户通过手机在某新闻网站上传该娱乐新闻后,内容分发装置可以将该娱乐新闻推送给标签为娱乐的多个流量对应的终端。
需要说明的是,每个流量对应的标签可以为1个,也可以为多个,此处不做限定。
在实际场景中,若目标内容产生了一定了影响,比如点赞量超过点赞指标阈值,或者转发量超过转发指标阈值,则内容分发装置可以为该目标内容推送更多的流量,具体地,在本申请的一些实施例中,步骤405可以为:
若所述人工审核结果为通过,则将所述目标内容发送至第二终端集合中的各个终端;所述第二终端集合中的终端数量大于所述第一终端集合中的终端数量;
若所述人工审核结果为不通过,则停止分发所述目标内容。
具体地,若人工审核结果为通过,则内容分发装置会判定该目标内容为一个优质的内容,会给该目标内容推送更多的流量,让更多的用户看到该内容。若人工审核结果为不通过,则说明该目标内容判定可能存在安全性问题,说明该目标内容的安全性隐患在机器审核阶段未被识别,内容分发装置可以选择停止分发该目标内容,又或者下架该目标内容,从而提高了内容审核的准确率。
本申请实施例提供的方案中,首先在对目标内容进行机器审核后,若审核通过,则当前无需进行人工审核,就可以进行分发,从而提升了内容分发的及时性;其次在操作数据满足预设人工审核条件下,才会对目标内容进行人工审核,从而节省了人力成本。可见,本申请实施例提升了内容分发的及时性以及节省了人力成本。
其次,结合操作数据(后验数据)进行二次回捞审核处理,提高了内容审核的准确率。
最后,能够避免审核处理的内容没有曝光和分发造成的审核资源的浪费,让优质创作者的内容能够在更短的时延内启用。
参见图6,图6为本申请实施例提供的一种内容分发方法整体流程图,本申请实施例至少包括以下步骤:
601、内容选取;
由于事先不经过人工审核,只经过机器审核,为了确保内容的安全性,采用“先发后审”的内容需要满足预设内容选取策略,例如满足如下条件:1)安全性:分品类、上游有保证,从优质概率高的品类入手,比如来自优质账号和媒体的财经、社会新闻内容;2)当前内容池内C侧流量:低曝光或者无曝光内容优先处理;3)由于人工审核阶段除了质量审核还有分类标签和标注,分类标签和标注通常是机器生成,然后人工参考,因为分类标签和标注的准确率会影响内容的冷启动,分类标签和标注的准确率越高,对内容的冷启动影响越小,所以将分类标签和标注的准确率纳入考虑:分类标签和标注的准确率大于90%,即选取分类标签和标注的准确率大于90%的内容。需要说明的是,上述选取策略满足的条件可以根据机器审核能力进行动态调整,以使得大部分内容符合“先发后审”机制,从而提升整体效率。另外也能够避免审核处理的内容没有曝光和分发造成的审核资源的浪费,让优质创作者的内容能够在更短的时延内启用。
602、机器审核;
机器审核主要是在主要链路上调用各种机器能力,包括触犯法律底线的内容过滤,同时还有明确的广告营销内容、格式不规范内容过滤、标题中带有医疗名词、黑词库等配置内容过滤规则。
603、人工审核;
如果机器审核通过,则对目标内容进行分发,如果分发过程中检测到的用户对目标内容进行操作产生的操作数据满足预设人工审核条件,则说明需要进行人工复核,具体地,在进行人工审核前,可以由基本回捞检测服务、反馈回捞服务及策略配置服务触发人工复核,其中基本回捞检测服务指的是使用内容消费端实时上报的消费数据来进行,通常触发条件设置为VV、PV在过去24小时超过100,则进行检测回捞,实时更新,满足触发条件即触发人工审核。反馈回捞服务及策略配置服务主要包括负反馈、举报、负面评价(如标题党、低俗、错别字、抄袭、广告、谣言)等主要类型。这里各种负面评论检测资讯的挖掘分析模型,主要从互动内容数据库读取评论,然后通过文本分类深度学习,构建有监督学习的模型,构建情感分析模型和服务。在实际应用场景中,可以设置不同的触发条件,例如,触发条件1:总负面评论项数≧1,总评论数﹤20;触发条件2:评论数﹥3,负面评论率大于0.3;触发条件3:举报数≧1,VV和PV的总数﹤800;触发条件3:负反馈数≧1,VV和PV的总数﹤1000。
604、数据检测。
数据检测主要包括链路指标和C侧指标,其中链路指标包括:节省的人力,即机审通过量-回捞审核量,以及回捞审核耗时检测,即审核结束时间-回捞时间,以及首次启用耗时对比,即启用时间-调度开始时间。C侧指标包括:平均内容曝光量、平均PV、主Feed CTR、平均负反馈。
本实施例提供的内容分发方法涉及机器审核审核和人工审核,按照内容审核机制划分为两类,第一类为“先审后发”机制,指的是内容分发装置获取到内容后,对内容进行机器审核,如果机器无法确认是否通过该目标内容的审核,则再对内容进行人工审核,人工审核通过后,再进行目标内容的分发,即“先审后发”机制;第二类为“先发后审”机制,指的是内容分发装置获取到内容后,对内容进行机器审核,如果机器审核通过,则对内容进行分发,分发过程中对正在内容池分发的内容进行基本回捞检测(PV和VV检测)和反馈回捞检测,如果检测结果满足人工审核条件,则进行人工审核,根据人工审核结果确定对内容下架还是继续分发,即“先发后审”机制。需要说明的是,如果内容池中存在大量等待人工审核的内容,内容的有效期到期后就会自动将其从内容池中删除,无需继续等待人工审核,即该内容不需要再进行人工审核,从而保证按需投入人工审核资源,节省了人工审核成本。
基于上述实施例,以视频为例,下面分别对图2,图3所示的内容分发中各个过程进行说明,具体如下:
一、视频上传过程:
参见图7所示,为本申请实施例中视频上传过程流程示意图,主要涉及内容生成端、上下行内容接口服务器、内容数据库,具体包括:
701、视频内容生成端向上下行内容接口服务器上传发布视频;
702、上下行内容接口服务器向内容数据库中存储视频并写入视频的元信息。
其中,内容数据库按照不同的内容标记分为不同的内容池,排重服务会依据业务需求加载过去一段时间(如一周)已经入库启用的内容,对于重复重新入库的内容将加上过滤标签不再提供给推荐分发与内容分发出口服务输出到用户,推荐分发与内容分发出口服务将接收到的推荐内容分发出去,内容特征建模服务可以按照内容特征对内容进行分类,以便于分类存储。
这样,即实现了用户从视频内容生成端上传视频的过程,上传后包括视频文件和相应的元信息会进行存储,便于后续对视频的调用。
二、机器审核过程:
参见图8所示,为本申请实施例中机器审核过程流程示意图,主要涉及上下行内容接口服务器、调度中心服务、机器审核系统,具体包括:
801、上下行内容接口服务器将视频发送给调度中心服务;
802、调度中心服务调用机器审核系统;
803、机器审核系统对视频进行审核。
这样,即实现了机器审核过程,上传的视频会进行机器审核。
三、人工审核过程:
参见图9所示,为本申请实施例中人工审核过程流程示意图,主要涉及内容数据库、人工审核系统、调度中心服务,具体包括:
901、人工审核系统将人工审核结果发送给调度中心服务;
复核队列服务向人工审核系统推送人工复核的消息,即需要对视频进行人工复核,人工审核系统将视频的人工审核结果发送给调度中心服务。
902、人工审核系统读取内容数据库中的信息,并将人工审核结果和状态回传至内容数据库;
903、内容数据库基于人工审核结果和状态更新元信息。
这样,即实现了人工复核过程,上传的视频在通过机器审核后,若存在安全问题,即需要进行人工复核。另外也能及时对内容数据库中该视频的元信息进行更新。
四、视频分发过程:
参见图10所示,为本申请实施例中视频分发过程流程示意图,主要涉及内容数据库、推荐分发与内容分发出口服务、内容消费端,具体包括:
1001、推荐分发与内容分发出口服务从内容数据库中获取视频;
1002、推荐分发与内容分发出口服务将获取的视频分发给内容消费端。
这样,即实现了视频分发过程,上传的视频若满足分发条件,则可以完成视频分发。
五、实时分发统计上报过程:
参见图11所示,为本申请实施例中实时分发统计上报过程流程示意图,主要涉及上下行内容接口服务器、内容消费端、实时分发统计上报接口服务、负面评价/反馈举报服务、互动内容数据库,具体包括:
1101、视频内容消费端获取上下行内容接口服务器发送的视频的索引信息;
1102、视频内容消费端实时向实时分发统计上报接口服务上报视频的消费数据;
视频的消费数据包括对象当前网络环境、对象对Feeds中间信息的点击操作行为和Feeds内容的曝光数据。
1103、负面评论/反馈举报服务从实时分发统计上报接口服务中获取举报反馈数据;
1104、实时分发统计上报接口服务将消费数据写入至互动内容数据库。
这样,即实现了实时分发统计上报过程,视频内容消费端可以实时上报消费数据。
六、反馈回捞过程:
参见图12所示,为本申请实施例中反馈回捞过程流程示意图,主要涉及负面评论/反馈举报服务、反馈回捞服务及策略配置服务、互动内容数据库、复核队列服务、人工审核系统,具体包括:
1201、反馈回捞服务及策略配置服务获取负面评论/反馈举报服务的调度数据回捞结果;
1202、负面评论/反馈举报服务根据互动内容数据库中的视频构建评论模型和服务;
1203、反馈回捞服务及策略配置服务基于调度数据回捞结果向复核队列服务请求复核;
1204、复核队列服务向人工审核系统请求人工复核;
1205、人工审核系统启用人工审核。
这样,即实现了反馈回捞过程,便于后续的人工审核。
七、基本回捞过程:
参见图13所示,为本申请实施例中基本回捞过程流程示意图,主要涉及实时分发统计上报接口服务、基本回捞检测服务、复核队列服务、人工审核系统,具体包括:
1301、基本回捞检测服务获取实时分发统计上报接口服务发送的实时分析数据;
1302、基本回捞检测服务向复核队列服务请求复核;
1303、复核队列服务向人工审核系统请求人工复核;
1304、人工审核系统启用人工审核。
这样,即实现了基本回捞过程,便于后续的人工审核。
为了更好地实施本申请实施例的上述方案,下面还提供用于实施上述方案的相关装置,请参阅图14,图14为本申请实施例提供的一种内容分发装置的结构示意图,内容分发装置包括:
审核单元1401,用于对获取到的目标内容进行机器审核;
分发单元1402,用于若机器审核通过,且所述目标内容的特征信息与预设特征信息不匹配,则对所述目标内容进行分发;所述预设特征信息为与预设人工审核通道关联的特征信息;
检测单元1403,用于检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;
获取单元1404,用于若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;
处理单元1405,用于根据所述人工审核结果对所述目标内容的分发进行处理。
可选地,在本申请一些可能的实施方式中,所述检测单元1403,具体用于检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的正向指标数据和负向指标数据。
可选地,在本申请一些可能的实施方式中,所述获取单元1404,具体用于若所述正向指标数据大于第一正向指标阈值,则通过所述预设人工审核通道获取所述目标内容的人工审核结果;或
若所述负向指标数据大于第一负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
可选地,在本申请一些可能的实施方式中,若所述正向指标数据包括第一正向指标数据和第二正向指标数据,所述负向指标数据包括第一负向指标数据和第二负向指标数据,所述获取单元1404,具体用于通过第一预设加权因子对所述第一正向指标数据和所述第二正向指标数据进行加权,得到第一加权结果;若所述第一加权结果大于第二正向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果;或
通过第二预设加权因子对所述第一负向指标数据和所述第二负向指标数据进行加权,得到第二加权结果;若所述第二加权结果大于第二负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
可选地,在本申请一些可能的实施方式中,在处理单元1405根据所述人工审核结果对所述目标内容的分发进行处理,处理单元1405,还用于若所述正向指标数据满足所述预设人工审核条件,且所述负向指标数据不满足所述预设人工审核条件,则继续分发所述目标内容;或
若所述负向指标数据满足所述预设人工审核条件,则暂停分发所述目标内容。
可选地,在本申请一些可能的实施方式中,所述获取单元1404,还具体用于通过所述预设人工审核通道向终端发送所述目标内容的审核请求;
通过所述预设人工审核通道接收所述终端根据所述申请请求发送的人工审核结果。
可选地,在本申请一些可能的实施方式中,所述分发单元1402,具体用于根据所述目标内容的特征信息为所述目标内容分配第一终端集合;
将所述目标内容发送至所述第一终端集合中的各个终端。
可选地,在本申请一些可能的实施方式中,所述处理单元1405,具体用于若所述人工审核结果为通过,则将所述目标内容发送至第二终端集合中的各个终端;所述第二终端集合中的终端数量大于所述第一终端集合中的终端数量;
若所述人工审核结果为不通过,则停止分发所述目标内容。
本申请实施例中,首先在对目标内容进行机器审核后,若审核通过,则当前无需进行人工审核,就可以进行分发,从而提升了内容分发的及时性;其次在操作数据满足预设人工审核条件下,才会对目标内容进行人工审核,从而节省了人力成本。可见,本申请实施例提升了内容分发的及时性以及节省了人力成本。
图15是本申请实施例提供的一种服务器结构示意图,该服务器1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(英文全称:centralprocessing units,英文简称:CPU)1501(例如,一个或一个以上处理器)和存储器1502,一个或一个以上存储应用程序1503或数据1504的存储介质1505(例如一个或一个以上海量存储设备)。其中,存储器1502和存储介质1505可以是短暂存储或持久存储。存储在存储介质1505的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1501可以设置为与存储介质1505通信,在服务器1500上执行存储介质1505中的一系列指令操作。
服务器1500还可以包括一个或一个以上电源1506,一个或一个以上有线或无线网络接口1507,一个或一个以上输入输出接口1508,和/或,一个或一个以上操作系统1509,例如Windows Server,Mac OS X,Unix,Linux,FreeBSD等等。
上述实施例中由服务器所执行的步骤可以基于该图15所示的服务器1500的结构。例如上述实施例中由图14所示的装置所执行的步骤可以基于该图15所示的服务器结构。例如,所述处理器1501通过调用存储器1502中的指令,执行以下操作:
对获取到的目标内容进行机器审核;
若机器审核通过,则对所述目标内容进行分发;
检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;
若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;
根据所述人工审核结果对所述目标内容的分发进行处理。
另一方面,本申请实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的内容分发方法,例如包括:对获取到的目标内容进行机器审核;若机器审核通过,则对所述目标内容进行分发;检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;根据所述人工审核结果对所述目标内容的分发进行处理。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
在本申请的具体实施方式中,涉及到用户信息、用户行为、用户操作等与用户相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
以上对本申请实施例所提供的技术方案进行了详细介绍,本申请实施例中应用了具体个例对本申请实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请实施例的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请实施例的限制。
Claims (10)
1.一种内容分发方法,其特征在于,所述方法包括:
对获取到的目标内容进行机器审核;
若机器审核通过,则对所述目标内容进行分发;
检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;
若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;
根据所述人工审核结果对所述目标内容的分发进行处理。
2.根据权利要求1所述的方法,其特征在于,所述检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据,包括:
检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的正向指标数据和负向指标数据。
3.根据权利要求2所述的方法,其特征在于,所述若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果,包括:
若所述正向指标数据大于第一正向指标阈值,则通过所述预设人工审核通道获取所述目标内容的人工审核结果;或
若所述负向指标数据大于第一负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
4.根据权利要求2所述的方法,其特征在于,若所述正向指标数据包括第一正向指标数据和第二正向指标数据,所述负向指标数据包括第一负向指标数据和第二负向指标数据,所述若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果,包括:
通过第一预设加权因子对所述第一正向指标数据和所述第二正向指标数据进行加权,得到第一加权结果;若所述第一加权结果大于第二正向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果;或
通过第二预设加权因子对所述第一负向指标数据和所述第二负向指标数据进行加权,得到第二加权结果;若所述第二加权结果大于第二负向指标阈值,则通过预设人工审核通道获取所述目标内容的人工审核结果。
5.根据权利要求2所述的方法,其特征在于,所述根据所述人工审核结果对所述目标内容的分发进行处理,之前还包括:
若所述正向指标数据满足所述预设人工审核条件,且所述负向指标数据不满足所述预设人工审核条件,则继续分发所述目标内容;或
若所述负向指标数据满足所述预设人工审核条件,则暂停分发所述目标内容。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述对所述目标内容进行分发,包括:
根据所述目标内容的特征信息为所述目标内容分配第一终端集合;
将所述目标内容发送至所述第一终端集合中的各个终端。
7.根据权利要求6所述的方法,其特征在于,所述根据所述人工审核结果对所述目标内容的分发进行处理,包括:
若所述人工审核结果为通过,则将所述目标内容发送至第二终端集合中的各个终端;所述第二终端集合中的终端数量大于所述第一终端集合中的终端数量;
若所述人工审核结果为不通过,则停止分发所述目标内容。
8.一种内容分发装置,其特征在于,所述内容分发装置包括:
审核单元,用于对获取到的目标内容进行机器审核;
分发单元,用于若机器审核通过,则对所述目标内容进行分发;
检测单元,用于检测所述目标内容的分发过程中用户对所述目标内容进行操作时产生的操作数据;
获取单元,用于若所述操作数据满足预设人工审核条件,则获取所述目标内容的人工审核结果;
处理单元,用于根据所述人工审核结果对所述目标内容的分发进行处理。
9.一种服务器,其特征在于,所述服务器包括:
至少一个处理器、存储器和收发器;
其中,所述存储器用于存储计算机程序,所述处理器用于调用所述存储器中存储的计算机程序来执行如权利要求1-7中任一项由服务器执行的方法。
10.一种计算机可读存储介质,其特征在于,其包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-7中任一项由服务器执行的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210007965.8A CN114374857B (zh) | 2020-10-15 | 2020-10-15 | 一种内容分发方法、装置、服务器及存储介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011100970.0 | 2020-10-15 | ||
CN202210007965.8A CN114374857B (zh) | 2020-10-15 | 2020-10-15 | 一种内容分发方法、装置、服务器及存储介质 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011100970.0 Division | 2020-10-15 | 2020-10-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114374857A true CN114374857A (zh) | 2022-04-19 |
CN114374857B CN114374857B (zh) | 2024-07-23 |
Family
ID=81175192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210007965.8A Active CN114374857B (zh) | 2020-10-15 | 2020-10-15 | 一种内容分发方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114374857B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114884951A (zh) * | 2022-05-23 | 2022-08-09 | 西安明赋云计算有限公司 | 一种基于云计算的内容分发方法 |
CN118351346A (zh) * | 2024-02-26 | 2024-07-16 | 南京锦悦嘉文化传媒有限公司 | 基于数字媒体的内容管理系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017128920A1 (zh) * | 2016-01-29 | 2017-08-03 | 深圳市艾特大师网络科技有限公司 | 一种消息处理方法、装置及终端 |
CN110225373A (zh) * | 2019-06-13 | 2019-09-10 | 腾讯科技(深圳)有限公司 | 一种视频审核方法、装置及电子设备 |
CN110413842A (zh) * | 2019-07-29 | 2019-11-05 | 北京小川在线网络技术有限公司 | 基于舆情态势感知的内容审核方法系统电子设备及介质 |
CN111090813A (zh) * | 2019-12-20 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 一种内容处理方法、装置和计算机可读存储介质 |
CN111639291A (zh) * | 2020-05-29 | 2020-09-08 | 腾讯科技(武汉)有限公司 | 内容分发方法、装置、电子设备以及存储介质 |
-
2020
- 2020-10-15 CN CN202210007965.8A patent/CN114374857B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017128920A1 (zh) * | 2016-01-29 | 2017-08-03 | 深圳市艾特大师网络科技有限公司 | 一种消息处理方法、装置及终端 |
CN110225373A (zh) * | 2019-06-13 | 2019-09-10 | 腾讯科技(深圳)有限公司 | 一种视频审核方法、装置及电子设备 |
CN110413842A (zh) * | 2019-07-29 | 2019-11-05 | 北京小川在线网络技术有限公司 | 基于舆情态势感知的内容审核方法系统电子设备及介质 |
CN111090813A (zh) * | 2019-12-20 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 一种内容处理方法、装置和计算机可读存储介质 |
CN111639291A (zh) * | 2020-05-29 | 2020-09-08 | 腾讯科技(武汉)有限公司 | 内容分发方法、装置、电子设备以及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114884951A (zh) * | 2022-05-23 | 2022-08-09 | 西安明赋云计算有限公司 | 一种基于云计算的内容分发方法 |
CN118351346A (zh) * | 2024-02-26 | 2024-07-16 | 南京锦悦嘉文化传媒有限公司 | 基于数字媒体的内容管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114374857B (zh) | 2024-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11907237B2 (en) | Gathering and contributing content across diverse sources | |
US20220360825A1 (en) | Livestreaming processing method and apparatus, electronic device, and computer-readable storage medium | |
US9256674B2 (en) | Action clustering for news feeds | |
US8914452B2 (en) | Automatically generating a personalized digest of meetings | |
US9043471B2 (en) | Predictive scaling for clusters | |
CN104838413A (zh) | 基于用户提交来调整内容递送 | |
CN112231563B (zh) | 一种内容推荐方法、装置及存储介质 | |
US9582583B2 (en) | Optimize follower and search relevancy ratio | |
CN114374857B (zh) | 一种内容分发方法、装置、服务器及存储介质 | |
CN108228906A (zh) | 用于生成信息的方法和装置 | |
CN113609374A (zh) | 基于内容推送的数据处理方法、装置、设备及存储介质 | |
CN112328905B (zh) | 线上营销内容推送方法、装置、计算机设备及存储介质 | |
KR101816205B1 (ko) | 인터넷 콘텐츠 제공 서버 및 그 방법이 구현된 컴퓨터로 판독 가능한 기록매체 | |
CN113362095A (zh) | 一种信息投放的方法和装置 | |
CN113010795A (zh) | 用户动态画像生成方法、系统、存储介质及电子设备 | |
CN114996486A (zh) | 一种数据推荐方法、装置、服务器以及存储介质 | |
CN114357280A (zh) | 一种信息推送方法、装置、电子设备及计算机可读介质 | |
CN114625699A (zh) | 对先前呈现的材料的识别和重构 | |
CN112000823B (zh) | 功能入口显示方法、电子设备及计算机可读存储介质 | |
CN106663112A (zh) | 呈现与实体相关联的事件的信息卡 | |
CN107920100B (zh) | 信息推送方法和装置 | |
KR20200047990A (ko) | 뉴스 작성 지침 및 방송 보도 지침 기반의 인스턴트 메시지의 구문 분석을 통한 가짜 뉴스 알림 서비스 제공 방법 및 장치 | |
KR20220022065A (ko) | 사용자가 검색한 이미지의 군집화 및 공유 방법과 구현 시스템 | |
US9251125B2 (en) | Managing text in documents based on a log of research corresponding to the text | |
US20200034369A1 (en) | Active listening to manage adaptive content items |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |