CN113207013B - 多媒体数据发布管理方法、装置、设备及存储介质 - Google Patents

多媒体数据发布管理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113207013B
CN113207013B CN202010079237.9A CN202010079237A CN113207013B CN 113207013 B CN113207013 B CN 113207013B CN 202010079237 A CN202010079237 A CN 202010079237A CN 113207013 B CN113207013 B CN 113207013B
Authority
CN
China
Prior art keywords
quality
low
multimedia data
target account
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010079237.9A
Other languages
English (en)
Other versions
CN113207013A (zh
Inventor
陈曙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010079237.9A priority Critical patent/CN113207013B/zh
Publication of CN113207013A publication Critical patent/CN113207013A/zh
Application granted granted Critical
Publication of CN113207013B publication Critical patent/CN113207013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25875Management of end-user data involving end-user authentication

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种多媒体数据发布管理方法、装置、设备及存储介质,属于互联网技术领域。所述方法包括:获取目标账户在预设历史时长内发布的多媒体数据的质量参考信息;将所述预设历史时长内发布的多媒体数据的质量参考信息,输入预先训练的低质内容账户排名模型,得到所述目标账户的排名值,基于所述目标账户的排名值,确定所述目标账户的低质判别信息;如果所述目标账户的低质判别信息满足预设的低质条件,则拒绝所述目标账户后续发送的多媒体数据发布请求。采用本申请能够提高审核模型或人工审核对多媒体数据审核的效率。

Description

多媒体数据发布管理方法、装置、设备及存储介质
技术领域
本申请涉及互联网技术领域,特别涉及一种多媒体数据发布管理方法、装置、设备及存储介质。
背景技术
随着互联网经济的发展和自媒体的盛行,用户可以在各种网络平台上发布各种内容的多媒体数据与网络平台上的其他用户分享,例如,文章、音乐、视频等。为了提高用户发布多媒体数据的质量,一般网络平台会设置有审核环节,对用户发布的多媒体数据进行审核。
在现有技术中,审核环节包括机器审核和人工审核。机器审核就是将用户发布的多媒体数据输入到预先训练好的审核模型中,根据审核模型来识别多媒体数据是否存在低质内容;人工审核就是将多媒体数据发送给终端,由审核人员去判断多媒体数据中是否存在低质内容。例如,多媒体数据为文章,则可以将用户发布文章的文字内容、插图等输入到预先训练好的审核模型中,识别文章是否存在低质内容,又例如,将文章的文字内容、插图等发送给审核人员,由审核人员去判断文章是否存在低质内容。
在实现本申请的过程中,发明人发现现有技术至少存在以下问题:
由于现在网络平台中的发布多媒体数据的账户越来越多,账户发布的多媒体数据也越来越多,导致审核环节中无论是机器审核还是人工审核的审核任务量都变的特别大,整体的审核工作量过于庞大。
发明内容
本申请实施例提供了一种多媒体数据发布管理方法、装置、设备及存储介质,能够减少审核模型或人工审核的审核工作量。所述技术方案如下:
一方面,提供了一种多媒体数据发布管理方法,所述方法包括:
获取目标账户在预设历史时长内发布的多媒体数据的质量参考信息;
将所述预设历史时长内发布的多媒体数据的质量参考信息,输入预先训练的低质内容账户排名模型,得到所述目标账户的排名值,基于所述目标账户的排名值,确定所述目标账户的低质判别信息;
如果所述目标账户的低质判别信息满足预设的低质条件,则拒绝所述目标账户后续发送的多媒体数据发布请求。
可选的,所述质量参考信息包括审核结果信息和用户操作信息;
将所述预设历史时长内发布的多媒体数据的质量参考信息,输入经过训练的低质内容账户排名模型,得到所述目标账户的排名值,基于所述目标账户的排名值,确定所述目标账户的低质判别信息,包括:
将所述预设历史时长内发布的多媒体数据的审核结果信息输入经过训练的第一低质内容账户排名模型,得到所述目标账户的第一排名值,将所述预设历史时长内发布的多媒体数据的用户操作信息输入经过训练的第二低质内容账户排名模型,得到所述目标账户的第二排名值;
基于所述目标账户的第一排名值和第二排名值,确定所述目标账户的低质判别信息。
可选的,所述基于所述目标账户的第一排名值和第二排名值,确定所述目标账户的低质判别信息,包括:
基于预设的所述第一排名值的权值和所述第二排名值的权值,对所述目标账户的第一排名值和第二排名值进行加权求和,得到加权和值,作为所述目标账户的低质判别信息。
可选的,所述预设的低质条件,包括:所述低质判别信息小于第一预设阈值。
可选的,所述方法还包括:
如果所述目标账户的低质判别信息大于或等于第一预设阈值且小于第二预设阈值,则将所述目标账户发布的多媒体数据分别输入经过训练的低质判别模型,得到每个多媒体数据对应的判别结果,基于所述每个多媒体数据对应的判别结果确定所述目标账户发布的低质多媒体数据,对所述低质多媒体数据进行召回处理。
可选的,所述方法还包括:
如果所述目标账户的低质判别信息不满足预设的低质条件,则在接收到所述目标账户发送的多媒体数据发布请求时,获取所述多媒体数据发布请求对应的多媒体数据,将所述多媒体数据输入经过训练的低质判别模型,得到判别结果,如果判别结果为人工继续审核,则将所述多媒体数据和所述目标账户的低质判别信息发送给审核终端。
另一方面,提供了一种多媒体数据发布管理装置,所述装置包括:
获取模块,被配置为获取目标账户在预设历史时长内发布的多媒体数据的质量参考信息;
确定模块,被配置为将所述预设历史时长内发布的多媒体数据的质量参考信息,输入预先训练的低质内容账户排名模型,得到所述目标账户的排名值,基于所述目标账户的排名值,确定所述目标账户的低质判别信息;
处理模块,被配置为如果所述目标账户的低质判别信息满足预设的低质条件,则拒绝所述目标账户后续发送的多媒体数据发布请求。
可选的,所述质量参考信息包括审核结果信息和用户操作信息;
所述确定模块,被配置为:
将所述预设历史时长内发布的多媒体数据的审核结果信息输入经过训练的第一低质内容账户排名模型,得到所述目标账户的第一排名值,将所述预设历史时长内发布的多媒体数据的用户操作信息输入经过训练的第二低质内容账户排名模型,得到所述目标账户的第二排名值;
基于所述目标账户的第一排名值和第二排名值,确定所述目标账户的低质判别信息。
可选的,所述确定模块,被配置为:
基于预设的所述第一排名值的权值和所述第二排名值的权值,对所述目标账户的第一排名值和第二排名值进行加权求和,得到加权和值,作为所述目标账户的低质判别信息。
可选的,所述装置还包括召回模块,被配置为:
如果所述目标账户的低质判别信息大于或等于第一预设阈值且小于第二预设阈值,则将所述目标账户发布的多媒体数据分别输入经过训练的低质判别模型,得到每个多媒体数据对应的判别结果,基于所述每个多媒体数据对应的判别结果确定所述目标账户发布的低质多媒体数据,对所述低质多媒体数据进行召回处理。
可选的,所述装置还包括发送模块,被配置为:
如果所述目标账户的低质判别信息不满足预设的低质条件,则在接收到所述目标账户发送的多媒体数据发布请求时,获取所述多媒体数据发布请求对应的多媒体数据,将所述多媒体数据输入经过训练的低质判别模型,得到判别结果,如果判别结果为人工继续审核,则将所述多媒体数据和所述目标账户的低质判别信息发送给审核终端。
再一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上所述的多媒体数据发布管理的方法所执行的操作。
再一方面,提供了一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上所述的多媒体数据发布管理的方法所执行的操作。
本申请实施例提供的技术方案带来的有益效果是:
通过获取账户发布多媒体数据对应的质量参考信息,得到账户发布多媒体数据质量的排名值,根据账户的排名值确定低质判别信息,拒绝低质判别信息满足预设低质条件的目标账户发送的多媒体数据发布请求。可见,本申请通过拒绝满足预设低质条件的目标账户发布多媒体数据,能够减少审核模型或人工审核的审核工作量。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的多媒体数据发布管理的方法流程图;
图2是本申请实施例提供的多媒体数据发布管理的方法示意图;
图3是本申请实施例提供的多媒体数据发布管理的界面示意图;
图4是本申请实施例提供的多媒体数据发布管理的装置结构示意图;
图5是本申请实施例提供的服务器结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请提供的多媒体数据发布管理方法可以由服务器实现。该服务器可以是任一发布多媒体数据的网络平台的后台服务器,具有通信功能,能与网络平台对应的终端进行通信。该服务器可以是一个单独的服务器也可以是一个服务器组,如果是单独的服务器,该服务器可以负责下述方案中的所有处理,如果是服务器组,服务器组中的不同服务器分别可以负责下述方案中的不同处理,具体的处理分配情况可以由技术人员根据实际需求任意设置,此处不再赘述。
用户可以在可发布多媒体数据的网络平台中申请账户,在网路平台发布各种多媒体数据,例如,文章、图片、视频等,供网络平台中其他用户进行浏览、评论、转发等。其中,网络平台可以是各种资讯网站、门户网站、公众号等。在本申请实施例中以用户发布的多媒体数据是文章为例,对方案进行详细说明,其他情况与之类似,不再赘述。
用户可以通过在终端账户在网络平台对应的应用程序中登录账号,然后选择相应的功能将自己要发表的文章上传到网络平台对应的服务器。网络平台对应的服务器接收到用户发表的文章之后,可以由不同的机器模型对文章的各个部分内容进行识别,例如,可以通过文字审核模型对文章的标题、文章的文字内容进行审核,还可以通过图像审核模型对文章的封面附图和文章中的插图进行识别。若识别出的内容为低质内容,即低质量的内容,例如,文章中存在暴力、血腥、淫秽等词汇,或是存在三观不正的文章内容等。则可以禁止该文章发布到网络平台中。另外,若机器模型没有识别出用户上传的文章存在低质内容,则可以将文章发送给相应的审核人员,由审核人员进一步审核文章中是否存在低质内容。本申请实施例提供的文章发表管理方法,可以根据各账户发表文章的内容是否为低质内容,对各账户进行排名,其中,发表低质内容的文章越多的账户的排名越靠前。然后可以根据账户的排名值作为辅助信息对账户发表的文章进行审核。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
图1是本申请实施例提供的一种多媒体数据发布管理方法的流程图。参见图1,该实施例包括:
步骤101、获取目标账户在预设历史时长内发表的多媒体数据的质量参考信息。
用户向网络平台中发表文章时,可以先将自己的账户登录在终端,并操纵终端的将要发表的文章上传到网络平台的服务器中。在服务器中可以设置有审核环节,当用户发表的文章通过审核环节之后,服务器便可将文章发布在网络平台中,供其他用户浏览、转发、评论等。其中,审核环节中可以包括机审环节和人审环节。当文章被上传至服务器时,可以先经过机审环节,在机审环节中设置有多个预先训练好的审核模型,可以分别对文章中标题、内容、插图等进行审核。若在机审环节中确定文章中的内容为正常内容,则服务器可将文章发布到网络平台中,若在机审环节中确定文章中的内容为低质内容,则服务器可以拒绝该文章发布到网络平台中,若在机审环节中没有确定文章是否为低质内容或正常内容,则该文章可进入人审环节,即将该文章发送到对应的审核终端,让审核人员对文章进行人工审核。在人工审核中,审核人员可对文章的质量进行标记,例如,当文章中的内容为正常内容时,可以标记为正常,然后将文章发布到网络平台中,当文章中的内容为低质内容时,可以标记为低质,然后拒绝该文章发布到网络平台中。另外,审核人员还可以根据文章中的内容的质量对文章进行打分,然后用文章的分数对文章进行标记。当文章被发布到网络平台中之后,用户可以对文章进行浏览、评论、点赞、转发、举报等操作。
在实施中,可以根据各账户发表文章的内容是否为低质内容,对各账户进行排名。排名靠前的账户为低质账户,在对其中一个目标账户进行排名时,可以通过目标账户在预设历史时长内发表的文章的质量参考信息进行排名。质量参考信息包括审核结果信息、用户操作信息以及文章的内容,审核结果信息可以为审核人员对文章的标记信息,例如标记的文章分数、正常标记、低质标记等。用户操作信息可以是用户对文章进行的操作信息,例如浏览时长、浏览完成度、点赞数、举报数等等。预设历史时长可以为一个月或一星期,此处不对预设时长进行限定,在本实施例中预设历史时长可为一个月,之后不再赘述。
步骤102、将预设历史时长内发布的多媒体数据的质量参考信息,输入预先训练的低质内容账户排名模型,得到目标账户的排名值,基于目标账户的排名值,确定目标账户的低质判别信息。
在实施中,可以将获取目标账户在一个月内发表的文章的质量参考信息,即获取目标账户在最近一个月内发表的所有文章对应的审核结果信息和用户操作信息,输入到预先训练的低质内容账户排名模型中得到目标账户的排名值。可以将目标账户的排名值作为目标账户的低质判别信息。例如,可以将排名值在1000名之前的账户作为低质账户。
可选的,可以将预设历史时长内发布的多媒体数据的审核结果信息和用户操作信息分别输入到不同的低质内容账户排名模型中,得到两个排名值,相应的处理可以如下:将预设历史时长内发布的多媒体数据的审核结果信息输入经过训练的第一低质内容账户排名模型,得到目标账户的第一排名值,将预设历史时长内发布的多媒体数据的用户操作信息输入经过训练的第二低质内容账户排名模型,得到目标账户的第二排名值;基于目标账户的第一排名值和第二排名值,确定目标账户的低质判别信息。
在实施中,预先训练的低质内容账户排名模型可以包括第一低质内容账户排名模型和第二低质内容账户排名模型。可以将目标账户在一个月之内发表的文章对应的审核结果信息输入经过训练的第一低质内容账户排名模型中,得到目标账户根据文章的审核结果信息进行排名的第一排名值。可以目标账户在一个月之内发表的文章对应的用户操作信息输入经过训练的第一低质内容账户排名模型中,得到目标账户根据文章的用户操作信息进行排名的第二排名值。然后,可以将目标账户的第一排名值和第二排名值作为目标账户的低质判别信息,例如,当第一排名值和第二排名值都超出预设的排名值时,可以认定该目标账户为低质账户。
可选的,基于预设的第一排名值的权值和第二排名值的权值,对目标账户的第一排名值和第二排名值进行加权求和,得到加权和值,作为目标账户的低质判别信息。
在实施中,可以根据不同的应用场景中设置不同的第一排名值的权值和第二排名值的权值,在不同应用场景中根据预设的第一排名值的权值和第二排名值的权值,对目标账户的第一排名值和第二排名值进行加权求和,将得到加权求和值作为第三排名值作为目标账户的低质判别信息。其中,不同的应用场景包括机审场景、人审场景和召回场景,此处先不对以上场景进行说明。
在使用第一低质内容账户排名模型和第二低质内容账户排名模型之前,可以对第一低质内容账户排名模型和第二低质内容账户排名模型进行训练。
其中,第一低质内容账户排名模型的训练过程可如下:
可以获取多个样本账户在一个月内发表的文章对应的审核结果信息,根据审核结果信息确定账户的第一基准排名值。然后根据多个样本账户的审核结果信息,以及每个账户的第一基准排名值,对初始的第一低质内容账户排名模型进行训练,在经过大量的训练之后,可得到训练之后的第一低质内容账户排名模型。
可选的,基于样本账户发表的预设历史时长内发表的文章的审核结果信息和发表时间戳、以及当前时间戳,确定样本账户的第一基准排名值。
在实施中,可以在训练第一低质内容账户排名模型之前,可以根据审核结果信息和发表时间戳、以及当前时间戳,计算出样本账户的第一基准排名值,相应的计算公式如下:
其中,Sp为第一基准排名值,Oc表示审核人员对内容c的质量表示,tc和t0分别表示内容c的入库时间戳和当前时间戳,η,δ,分别表示不同的系数。
其中,第二低质内容账户排名模型的训练过程可如下:
可以获取多个样本账户在一个月内发表的文章对应的用户操作信息,根据用户操作信息确定账户的第二基准排名值。然后根据多个样本账户的用户操作信息,以及每个账户的第二基准排名值,对初始的第二低质内容账户排名模型进行训练,在经过大量的训练之后,可得到训练之后的第二低质内容账户排名模型。
可选的,基于样本账户发表的每篇文章的用户操作信息,确定每篇文章对应的各正向操作及对应的操作时间戳和各负向操作及对应的操作时间戳,基于每篇文章对应的各正向操作的操作时间戳和各负向操作的操作时间戳,确定样本账户的第二基准排名值。
其中,正向操作包括点赞操作、转发操作中的至少一种操作,负向操作包括差评操作、不感兴趣操作、举报操作中的至少一种操作;
在实施中,可以在训练第二低质内容账户排名模型之前,可以根据样本账户发表的每篇文章的用户操作信息,确定每篇文章对应的各正向操作及对应的操作时间戳和各负向操作及对应的操作时间戳,基于每篇文章对应的各正向操作的操作时间戳和各负向操作的操作时间戳,计算样本账户的第二基准排名值,相应的计算公式如下:
其中,Sp为第一基准排名值,Cp表示账号p最近一个月送审的内容集合,Uc表示内容c的曝光用户集合,ua,c表示对内容c产生操作行为a的用户结合,A+和A-分别表示产生正向和负向操作行为的用户集合,和t0分别表示用户u对内容c产生操作行为a的时间戳和当前时间戳。η,δ,α,β分别表示不同的系数。
步骤103、如果目标账户的低质判别信息满足预设的低质条件,则拒绝目标账户后续发送的多媒体数据发布请求。
其中,预设的低质条件可以为低质判别信息小于第一预设阈值。第一预设阈值可以通过技术人员通过实验得到并进行设置,此处不做限定。
在实施中,当用户在终端登录目标账户,通过终端将要发表的文章上传至服务器之后,服务器可以先获取该目标账户的排名值,若目标账户的排名信息满足预设的低质条件,则可以拒绝对应的文章发送的发表请求,即拒绝该文章发布到网络平台中。
可选的,低质判别信息可以不同场景存在差异,在本实施例流程中,场景可以包括但不限于以下三种:机审场景、人审场景、以及召回场景。
其中,机审场景即为文章被上传至服务器后,在经过机审环节之前,可以根据低质判别信息对发表文章的账户筛选。在机审场景中,预设的第一排名值的权值可以大于第二排名值的权值,然后基于第一排名值的权值和第二排名值的权值,对目标账户的第一排名值和第二排名值进行加权求和,得第四排名值,作为目标账户的低质判别信息。
在实施中,当用户在终端登录目标账户,通过终端将要发表的文章上传至服务器之后可以获取目标账户对应的第四排名值,若第四排名值小于预先设定的低质排名值,则可以拒绝该账户将文章发布到网络平台中。
其中,人审场景即为文章经过机审环节之后,没有确定该文章的内容是否属于低质内容时,并将文章发送到人审环节时的场景,在人审场景中,预设的第一排名值的权值可以与第二排名值的权值相等,或差距在预设差距范围之内。然后基于第一排名值的权值和第二排名值的权值,对目标账户的第一排名值和第二排名值进行加权求和,得到第五排名值,作为目标账户的低质判别信息。相应的处理如下:如果目标账户的低质判别信息不满足预设的低质条件,则在接收到目标账户发送的多媒体数据发布请求时,获取多媒体数据发布请求对应的多媒体数据,将多媒体数据输入经过训练的低质判别模型,得到判别结果,如果判别结果为人工继续审核,则将多媒体数据和目标账户的低质判别信息发送给审核终端。
在实施中,如果目标账户的第四排名值大于预先设定的低质排名值,则服务器在接收到目标账户发送的文章发表请求时,可以获取文章发表请求对应的文章的内容数据,将内容数据输入经过训练的低质判别模型,得到判别结果,其中判别结果可以为低质内容、非低质内容或无法确定。当判别结果为低质内容时,则可以拒绝对应的文章发送的发表请求,即拒绝该文章发布到网络平台中。当判别结果为非低质内容时,则可以将该文章发布到网络平台中。当判别结果为无法确定时,即人工继续审核,则可以将内容数据和目标账户的低质判别信息发送给审核终端,可如图2所示。其中,发送的低质判别信息为目标账户基于第一排名值的权值和第二排名值的权值,进行加权求和得到的第五排名值。该排名值可以辅助审核人员对文章的内容数据的审核。审核终端界面可如图3所示,在审核终端界面可显示有文章的内容、插图等信息,还可以显示有文章对应账户的基本信息,以及对应账户的排名信息等。
其中,召回场景即为对排名值靠前的账户已经发表出去的文章通过低质文章判别模型进行再次识别,即再次通过机审环节,在召回场景中,预设的第一排名值的权值小于第二排名值的权值,然后基于第一排名值的权值和第二排名值的权值,对目标账户的第一排名值和第二排名值进行加权求和,得到第六排名值,作为目标账户的低质判别信息。在召回场景中:如果目标账户的低质判别信息大于或等于第一预设阈值且小于第二预设阈值,则将目标账户发表的多媒体数据分别输入经过训练的低质判别模型,得到每个多媒体数据对应的判别结果,基于每个多媒体数据对应的判别结果确定目标账户发表的低质多媒体数据,对低质多媒体数据进行召回处理。
在实施中,根据账户的第三排名值,将排名值小于预设的召回排名值的目标账户,已将发表出去的文章进行再次识别,获取目标账户发表的文章的内容数据分别输入经过训练的低质文章判别模型,得到每篇文章对应的判别结果,其中判别结果可以包括,严重低质、中度低质、轻度低质和无低质。当判别结果为严重低质时,则可以将对应的文章进行删除,当判别结果为中度低质时,则可以将对应的文章从推荐池中撤回,即不再向用户推荐该文章,当判别结果为轻度低质时,则可以减少对该文章的推荐,当判别结果为无低质时,则不做任何处理。
本申请实施例通过获取账户发表文章对应的质量参考信息,得到账户发表文章质量的排名值,根据账户的排名值确定低质判别信息,拒绝低质判别信息满足预设低质条件的目标账户发送的文章发表请求。可见,本申请通过拒绝满足预设低质条件的目标账户发表文章,能够减少审核模型或人工审核的审核工作量。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图4是本申请实施例提供的一种多媒体数据发布管理装置结构示意图,该装置可以是上述实施例中的服务器,如图4所示,该装置包括:
获取模块410,被配置为获取目标账户在预设历史时长内发布的多媒体数据的质量参考信息;
确定模块420,被配置为将所述预设历史时长内发布的多媒体数据的质量参考信息,输入预先训练的低质内容账户排名模型,得到所述目标账户的排名值,基于所述目标账户的排名值,确定所述目标账户的低质判别信息;
处理模块430,被配置为如果所述目标账户的低质判别信息满足预设的低质条件,则拒绝所述目标账户后续发送的多媒体数据发布请求。
可选的,所述质量参考信息包括审核结果信息和用户操作信息;
所述确定模块420,被配置为:
将所述预设历史时长内发布的多媒体数据的审核结果信息输入经过训练的第一低质内容账户排名模型,得到所述目标账户的第一排名值,将所述预设历史时长内发布的多媒体数据的用户操作信息输入经过训练的第二低质内容账户排名模型,得到所述目标账户的第二排名值;
基于所述目标账户的第一排名值和第二排名值,确定所述目标账户的低质判别信息。
可选的,所述确定模块420,被配置为:
基于预设的所述第一排名值的权值和所述第二排名值的权值,对所述目标账户的第一排名值和第二排名值进行加权求和,得到加权和值,作为所述目标账户的低质判别信息。
可选的,所述装置还包括召回模块,被配置为:
如果所述目标账户的低质判别信息大于或等于第一预设阈值且小于第二预设阈值,则将所述目标账户发布的多媒体数据分别输入经过训练的低质判别模型,得到每个多媒体数据对应的判别结果,基于所述每个多媒体数据对应的判别结果确定所述目标账户发布的低质多媒体数据,对所述低质多媒体数据进行召回处理。
可选的,所述装置还包括发送模块,被配置为:
如果所述目标账户的低质判别信息不满足预设的低质条件,则在接收到所述目标账户发送的多媒体数据发布请求时,获取所述多媒体数据发布请求对应的多媒体数据,将所述多媒体数据输入经过训练的低质判别模型,得到判别结果,如果判别结果为人工继续审核,则将所述多媒体数据和所述目标账户的低质判别信息发送给审核终端。
需要说明的是:上述实施例提供的多媒体数据发布管理的装置在多媒体数据发布管理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的多媒体数据发布管理的装置与多媒体数据发布管理的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5是本申请实施例提供的一种服务器的结构示意图,该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central processingunits,CPU)501和一个或一个以上的存储器502,其中,所述存储器502中存储有至少一条指令,所述至少一条指令由所述处理器501加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中多媒体数据发布管理的方法。该计算机可读存储介质可以是非暂态的。例如,所述计算机可读存储介质可以是ROM(Read-OnlyMemory,只读存储器,)、RAM(Random Access Memory,随机存取存储器)、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (12)

1.一种多媒体数据发布管理方法,其特征在于,所述方法包括:
获取目标账户在预设历史时长内发布的多媒体数据的质量参考信息,所述质量参考信息包括审核结果信息和用户操作信息,所述审核结果信息为审核人员对所述多媒体数据的标记信息;
将所述预设历史时长内发布的多媒体数据的审核结果信息输入经过训练的第一低质内容账户排名模型,得到所述目标账户的第一排名值,将所述预设历史时长内发布的多媒体数据的用户操作信息输入经过训练的第二低质内容账户排名模型,得到所述目标账户的第二排名值;
基于所述目标账户的第一排名值和第二排名值,确定所述目标账户的低质判别信息;
如果所述目标账户的低质判别信息满足预设的低质条件,则拒绝所述目标账户后续发送的多媒体数据发布请求。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标账户的第一排名值和第二排名值,确定所述目标账户的低质判别信息,包括:
基于预设的所述第一排名值的权值和所述第二排名值的权值,对所述目标账户的第一排名值和第二排名值进行加权求和,得到加权和值,作为所述目标账户的低质判别信息。
3.根据权利要求1所述的方法,其特征在于,所述预设的低质条件,包括:所述低质判别信息小于第一预设阈值。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述目标账户的低质判别信息大于或等于第一预设阈值且小于第二预设阈值,则将所述目标账户发布的多媒体数据分别输入经过训练的低质判别模型,得到每个多媒体数据对应的判别结果,基于所述每个多媒体数据对应的判别结果确定所述目标账户发布的低质多媒体数据,对所述低质多媒体数据进行召回处理。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述目标账户的低质判别信息不满足预设的低质条件,则在接收到所述目标账户发送的多媒体数据发布请求时,获取所述多媒体数据发布请求对应的多媒体数据,将所述多媒体数据输入经过训练的低质判别模型,得到判别结果,如果判别结果为人工继续审核,则将所述多媒体数据和所述目标账户的低质判别信息发送给审核终端。
6.一种多媒体数据发布管理装置,其特征在于,所述装置包括:
获取模块,被配置为获取目标账户在预设历史时长内发布的多媒体数据的质量参考信息,所述质量参考信息包括审核结果信息和用户操作信息,所述审核结果信息为审核人员对所述多媒体数据的标记信息;
确定模块,被配置为将所述预设历史时长内发布的多媒体数据的审核结果信息输入经过训练的第一低质内容账户排名模型,得到所述目标账户的第一排名值,将所述预设历史时长内发布的多媒体数据的用户操作信息输入经过训练的第二低质内容账户排名模型,得到所述目标账户的第二排名值;基于所述目标账户的第一排名值和第二排名值,确定所述目标账户的低质判别信息;
处理模块,被配置为如果所述目标账户的低质判别信息满足预设的低质条件,则拒绝所述目标账户后续发送的多媒体数据发布请求。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,被配置为:
基于预设的所述第一排名值的权值和所述第二排名值的权值,对所述目标账户的第一排名值和第二排名值进行加权求和,得到加权和值,作为所述目标账户的低质判别信息。
8.根据权利要求6所述的装置,其特征在于,所述预设的低质条件,包括:所述低质判别信息小于第一预设阈值。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
召回模块,被配置为如果所述目标账户的低质判别信息大于或等于第一预设阈值且小于第二预设阈值,则将所述目标账户发布的多媒体数据分别输入经过训练的低质判别模型,得到每个多媒体数据对应的判别结果,基于所述每个多媒体数据对应的判别结果确定所述目标账户发布的低质多媒体数据,对所述低质多媒体数据进行召回处理。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
发送模块,被配置为如果所述目标账户的低质判别信息不满足预设的低质条件,则在接收到所述目标账户发送的多媒体数据发布请求时,获取所述多媒体数据发布请求对应的多媒体数据,将所述多媒体数据输入经过训练的低质判别模型,得到判别结果,如果判别结果为人工继续审核,则将所述多媒体数据和所述目标账户的低质判别信息发送给审核终端。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至权利要求5任一项所述的多媒体数据发布管理的方法所执行的操作。
12.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求5任一项所述的多媒体数据发布管理的方法所执行的操作。
CN202010079237.9A 2020-02-03 2020-02-03 多媒体数据发布管理方法、装置、设备及存储介质 Active CN113207013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010079237.9A CN113207013B (zh) 2020-02-03 2020-02-03 多媒体数据发布管理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010079237.9A CN113207013B (zh) 2020-02-03 2020-02-03 多媒体数据发布管理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113207013A CN113207013A (zh) 2021-08-03
CN113207013B true CN113207013B (zh) 2023-11-17

Family

ID=77024894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010079237.9A Active CN113207013B (zh) 2020-02-03 2020-02-03 多媒体数据发布管理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113207013B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003081483A1 (en) * 2002-03-18 2003-10-02 Daniel Rex Greening Community directory
CN103701826A (zh) * 2013-12-31 2014-04-02 广州华多网络科技有限公司 流媒体信息监控方法和系统
WO2018090793A1 (zh) * 2016-11-18 2018-05-24 腾讯科技(深圳)有限公司 多媒体推荐方法和装置
CN110120912A (zh) * 2019-05-10 2019-08-13 腾讯科技(深圳)有限公司 富媒体内容处理方法、装置、可读存储介质和计算机设备
CN110135801A (zh) * 2019-04-26 2019-08-16 深圳市元征科技股份有限公司 一种项目信息处理方法及装置
CN110225373A (zh) * 2019-06-13 2019-09-10 腾讯科技(深圳)有限公司 一种视频审核方法、装置及电子设备
CN110532331A (zh) * 2019-09-05 2019-12-03 腾讯科技(深圳)有限公司 一种对象类型确定的方法以及相关装置
CN110598157A (zh) * 2019-09-20 2019-12-20 北京字节跳动网络技术有限公司 目标信息识别方法、装置、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10679389B2 (en) * 2016-02-26 2020-06-09 Snap Inc. Methods and systems for generation, curation, and presentation of media collections
CN107808295B (zh) * 2016-09-09 2021-06-11 腾讯科技(深圳)有限公司 多媒体数据投放方法及装置
US10949896B2 (en) * 2018-07-30 2021-03-16 Facebook, Inc. Distribution of embedded content items by an online system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003081483A1 (en) * 2002-03-18 2003-10-02 Daniel Rex Greening Community directory
CN103701826A (zh) * 2013-12-31 2014-04-02 广州华多网络科技有限公司 流媒体信息监控方法和系统
WO2018090793A1 (zh) * 2016-11-18 2018-05-24 腾讯科技(深圳)有限公司 多媒体推荐方法和装置
CN110135801A (zh) * 2019-04-26 2019-08-16 深圳市元征科技股份有限公司 一种项目信息处理方法及装置
CN110120912A (zh) * 2019-05-10 2019-08-13 腾讯科技(深圳)有限公司 富媒体内容处理方法、装置、可读存储介质和计算机设备
CN110225373A (zh) * 2019-06-13 2019-09-10 腾讯科技(深圳)有限公司 一种视频审核方法、装置及电子设备
CN110532331A (zh) * 2019-09-05 2019-12-03 腾讯科技(深圳)有限公司 一种对象类型确定的方法以及相关装置
CN110598157A (zh) * 2019-09-20 2019-12-20 北京字节跳动网络技术有限公司 目标信息识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113207013A (zh) 2021-08-03

Similar Documents

Publication Publication Date Title
CN108536681A (zh) 基于情感分析的智能问答方法、装置、设备及存储介质
CN112153426B (zh) 一种内容账号管理方法、装置、计算机设备及存储介质
CN105023165A (zh) 社交网络平台中投放任务的控制方法、装置及系统
CN106844530A (zh) 一种问答对分类模型的训练方法和装置
CN113014566B (zh) 恶意注册的检测方法、装置、计算机可读介质及电子设备
CN110598982B (zh) 基于智能交互的主动风控方法和系统
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN111639291A (zh) 内容分发方法、装置、电子设备以及存储介质
CN111917878A (zh) 消息处理方法、装置、设备及存储介质
CN113392331A (zh) 文本处理方法及设备
CN112165639B (zh) 内容分发方法、装置、电子设备以及存储介质
CN111522724A (zh) 异常账号的确定方法、装置、服务器及存储介质
CN116485475A (zh) 基于边缘计算的物联网广告系统、方法及装置
CN106294406A (zh) 一种用于处理应用访问数据的方法与设备
CN117035312A (zh) 用于众包的方法和装置
CN113207013B (zh) 多媒体数据发布管理方法、装置、设备及存储介质
CN115131052A (zh) 一种数据处理方法、计算机设备和存储介质
CN111443973B (zh) 备注信息的填入方法、装置、设备及存储介质
CN116340625A (zh) 结合学习状态适合度和课程搭配度的课程推荐方法及装置
CN107704535A (zh) 基于主题相似度的网页信息获取方法、装置及系统
CN116150470A (zh) 内容推荐方法、装置、设备、存储介质及程序产品
CN114676705A (zh) 一种对话关系处理方法、计算机及可读存储介质
CN110163043B (zh) 面部检测方法、装置、存储介质及电子装置
CN112579864A (zh) 反诈骗处理方法和装置
CN112330305A (zh) 一种基于区块链的电子政务系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant