CN112148898A - 一种媒体内容审核的数据处理方法及装置 - Google Patents

一种媒体内容审核的数据处理方法及装置 Download PDF

Info

Publication number
CN112148898A
CN112148898A CN202010988224.3A CN202010988224A CN112148898A CN 112148898 A CN112148898 A CN 112148898A CN 202010988224 A CN202010988224 A CN 202010988224A CN 112148898 A CN112148898 A CN 112148898A
Authority
CN
China
Prior art keywords
auditing
audited
media data
information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010988224.3A
Other languages
English (en)
Other versions
CN112148898B (zh
Inventor
刘威畅
高翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Original Assignee
JD Digital Technology Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JD Digital Technology Holdings Co Ltd filed Critical JD Digital Technology Holdings Co Ltd
Priority to CN202010988224.3A priority Critical patent/CN112148898B/zh
Publication of CN112148898A publication Critical patent/CN112148898A/zh
Application granted granted Critical
Publication of CN112148898B publication Critical patent/CN112148898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种媒体内容审核的数据处理方法及装置,包括:获取待审核媒体数据对应的投放信息;根据所述投放信息确定所述待审核媒体数据对应的审核模型;根据所述审核模型对所述待审核媒体数据进行审核,得到与所述待审核媒体数据对应的审核结果;根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准;在所述审核结果满足所述目标审核标准时,按照所述投放信息对所述待审核媒体数据进行投放。本申请可以根据投放信息得到待审核多媒体数据所需投放的具体的线下场景,并且采用该场景对应的审核标准对待审核多媒体数据进行审核,使审核标准具备对线下场景的针对性,进而能够最终提升审核的灵活度。

Description

一种媒体内容审核的数据处理方法及装置
技术领域
本申请涉及智能处理技术领域,尤其涉及一种媒体内容审核的数据处理方法及装置。
背景技术
随着线下广告的发展,越来越多的视频内容出现在大众视野中。而随着线下广告的规范化和线下广告的公开性,视频内容的审核就变得极其重要。在线下内容进行发布之前一般都需要通过审核人员执行三审的方式进行涉黄、涉暴等非法内容的审核,耗费较大人力,且效率低下。此外,随之视频长度以及数量的增长,会需要越来越多的审核人员,因此会严重影响政府管控的成本控制以及线下广告的数字化的发展。
1、目前线下数字化屏幕只能够人工进行内容审核、效率低下、且费时费力、无法应对大量的待审核视频。
2、无法应对线下的多地区场景的不同目标审核标准的控制情况。
3、无法应对一些突发事件,例如在特殊时期,线下内容目标审核标准会进行提升。
针对相关技术中存在的诸多技术问题,目前尚未提供有效的解决方案。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种媒体内容审核的数据处理方法及装置。
第一方面,本申请实施例提供了一种媒体内容审核的数据处理方法,包括:
获取待审核媒体数据对应的投放信息;
根据所述投放信息确定所述待审核媒体数据对应的审核模型;
根据所述审核模型对所述待审核媒体数据进行审核,得到与所述待审核媒体数据对应的审核结果;
根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准;
在所述审核结果满足所述目标审核标准时,按照所述投放信息对所述待审核媒体数据进行投放。
可选的,如前述的数据处理方法,所述根据所述投放信息确定所述待审核媒体数据对应的审核模型,包括:
根据所述投放信息确定所述待审核媒体数据对应的播放内容管控策略;
确定与所述播放内容管控策略对应的至少一个审核类别;
根据每个所述审核类别对应的审核模型得到所述待审核媒体数据对应的审核模型。
可选的,如前述的数据处理方法,所述根据所述审核模型对所述待审核媒体数据进行审核,得到与所述待审核媒体数据对应的审核结果,包括:
分别根据各个所述审核模型对所述待审核媒体数据进行审核,得到与每个所述审核类别对应的子审核结果;
根据所有所述子审核结果得到与所述待审核媒体数据对应的审核结果。
可选的,如前述的数据处理方法,所述根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准,包括:
根据所述投放信息确定用于播放所述待审核媒体数据的播放终端对应的位置信息以及播放时间信息;
根据所述位置信息查询得到所述播放终端对应的周边环境信息;
根据所述周边环境信息得到与所述播放时间信息对应的人群信息;
根据所述人群信息确定与所述待审核媒体数据对应的所述目标审核标准。
可选的,如前述的数据处理方法,根据所述审核模型对所述待审核媒体数据进行审核,包括:
根据所述周边环境信息以及播放时间确定与所述待审核媒体数据对应的权重信息;
将所述待审核媒体数据对应的权重信息与各个待审核媒体数据对应的权重信息进行比较,得到所述待审核媒体数据对应的审核优先级;
按照所述审核优先级,对所述待审核媒体数据进行审核。
可选的,如前述的数据处理方法,所述根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准,包括:
根据所述投放信息确定与所述待审核媒体数据对应的候选审核标准;
获取所述待审核媒体数据对应的媒体属性信息;
根据所述媒体属性信息确定对所述候选审核标准的影响权重;
根据所述影响权重对所述候选审核标准进行调整,得到所述目标审核标准。
可选的,如前述的数据处理方法,还包括:
按照预设的训练数据获取策略获取与所述审核模型对应的历史记录信息;所述历史记录信息未用于训练得到所述审核模型;
对所述历史记录信息进行随机划分,得到训练集补充数据和验证集补充数据;
通过训练集补充数据对所述审核模型进行训练,在通过验证集补充数据对训练后的所述审核模型进行验证,并满足预设的性能要求时,得到更新后审核模型。
可选的,如前述的数据处理方法,所述根据所述审核模型对所述待审核媒体数据进行审核,包括:
在所述待审核媒体数据为视频数据时,按照预设的图像帧获取策略获取所述待审核媒体数据对应的图像信息;
根据所述审核模型对所述图像信息进行审核。
可选的,如前述的数据处理方法,还包括:
在所述审核结果不满足所述目标审核标准时,获取所述待审核媒体数据对应的播放终端的当前播放的实时媒体数据对应的第一特征信息;
获取所述待审核媒体数据的第二特征信息;
在所述第一特征信息与所述第二特征信息一致时,生成与所述播放终端对应的管控指令。
第二方面,本申请实施例提供了一种媒体内容审核的数据处理装置,包括:
获取模块,用于获取待审核媒体数据对应的投放信息;
模型确定模块,用于根据所述投放信息确定所述待审核媒体数据对应的审核模型;
结果获取模块,用于根据所述审核模型对所述待审核媒体数据进行审核,得到与所述待审核媒体数据对应的审核结果;
标准确定模块,用于根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准;
投放模块,用于在所述审核结果满足所述目标审核标准时,按照所述投放信息对所述待审核媒体数据进行投放。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,所述处理器、通信接口和存储器通过通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述计算机程序时,实现如前述任一项所述的处理方法。
第四方面,本申请实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行如前任一项所述的方法步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请实施例提供的该方法,可以根据投放信息得到待审核多媒体数据所需投放的具体的线下场景,并且采用该场景对应的的审核标准对待审核多媒体数据进行审核,使审核标准具备对线下场景的针对性,进而能够最终提升审核的灵活度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种媒体内容审核的数据处理方法的流程示意图;
图2为本申请另一实施例提供的一种媒体内容审核的数据处理方法的流程示意图;
图3为本申请另一实施例提供的一种媒体内容审核的数据处理方法的流程示意图;
图4为本申请另一实施例提供的一种媒体内容审核的数据处理方法的流程示意图;
图5为本申请另一实施例提供的一种媒体内容审核的数据处理方法的流程示意图;
图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种媒体内容审核的数据处理方法,包括如下所述步骤S1至S5:
步骤S1.获取待审核媒体数据对应的投放信息。
具体的,投放信息可以包括投放的位置以及投放的时间。进一步的,当待审核媒体数据需要投放至不同位置或者在不同时间进行投放时,则可以多个投放信息,每个投放信息中包括相互对应的投放位置与播放时间;或者同一个投放信息中包括多组对应设置的投放位置与播放时间。
待审核媒体数据是未在终端进行播放,需要事先进行审核的媒体数据。
其中,媒体数据的数据类型可以包括:音频数据、图片数据、视频数据以及文本数据等等。
步骤S2.根据投放信息确定待审核媒体数据对应的审核模型。
具体的,审核模型可以是用于自动实现审核的AI审核方法;为了实现对待审核媒体数据进行多方面的识别,还可以设置多个审核模型,以对待审核媒体数据进行审核。
步骤S3.根据审核模型对待审核媒体数据进行审核,得到与待审核媒体数据对应的审核结果。
具体的,审核结果可以是识别得到待审核媒体数据中不合法内容的数量,也可以是得到与待审核媒体数据对应的审核分数,并且通过该审核分数可以得到待审核媒体数据涉及不合法的概率信息。
步骤S4.根据投放信息确定与待审核媒体数据对应的目标审核标准。
具体的,目标审核标准可以是预先设置的用于限定媒体数据可在指定位置及时间可进行播放的最低的审核分数。
步骤S5.在审核结果满足目标审核标准时,按照投放信息对待审核媒体数据进行投放。
具体的,审核结果满足目标审核标准即意味着待审核媒体数据可以在投放信息对应的投放地点,并在对应的投放时间进行播放。
其中,可选的,在进行投放前,可以根据投放信息中的投放地点查询得到投放地点对应的播放端的地址信息,以在进行投放时,可以根据该地址信息将待审核媒体数据准确投放至对应的播放端。
同时,在投放时,还将与播放时间对应的时间戳一同发送至播放端,以使播放端按照预设的时间对待审核媒体数据进行播放。
通过本实施例中的方法,可以根据投放信息得到待审核多媒体数据所需投放的具体的线下场景,并且采用该场景对应的审核标准对待审核多媒体数据进行审核,使审核标准具备对线下场景的针对性,进而能够最终提升审核的灵活度。
如图2所示,在一些实施例中,如前述的数据处理方法,所述步骤S2根据投放信息确定待审核媒体数据对应的审核模型,包括如下所述步骤S21至S23:
步骤S21.根据投放信息确定待审核媒体数据对应的播放内容管控策略。
具体的,播放内容管控策略可以是用于对特定位置在特定时间能够进行播放的多媒体数据的进行具体管控的策略。
步骤S22.确定与播放内容管控策略对应的至少一个审核类别。
也就是说,每个播放内容管控策略对应有一个或多个审核类别;其中审核类别可以是例如:涉黄、涉暴、涉赌等影响公序良俗的非法信息。
步骤S23.根据每个审核类别对应的审核模型得到待审核媒体数据对应的审核模型。
具体的,由于对应于不同审核类别,需要进行识别的关键信息都各不相同;举例来说,当需要对涉暴进行识别时,需要识别的信息可以是:血迹、肢体冲撞等图像或文字信息;当对涉赌进行识别时,需要识别的信息可以是:纸牌、骰子、金钱等图像或文字信息;由此可知,对于不同的审核类别所需识别的信息各不相同,因此,需要得到每个审核类别对应的审核模型;并且模型用于对待审核媒体数据的审核。
其中一种可选的实现方案可以是:根据不同的地点及时间设定不同的审核级别,每个审核级别中包含需要智能审核的审核类别,每种审核类别使用的AI审核方法(即:审核模型)以及素材违规的分数阈值(即:目标审核标准);进一步的,可以由此共同组成与审核级别对应的决策树,以提高直观性,便于查询以及后期修改。
在一些实施例中,如前述的数据处理方法,步骤S3根据审核模型对待审核媒体数据进行审核,得到与待审核媒体数据对应的审核结果,包括如下所述步骤S31和S32:
步骤S31.分别根据各个审核模型对待审核媒体数据进行审核,得到与每个审核类别对应的子审核结果。
步骤S32.根据所有子审核结果得到与待审核媒体数据对应的审核结果。
具体的,子审核结果是通过各个审核模型分别对待审核媒体数据进行审核得到的结果;且每个子审核结果可以是该待审核媒体数据在对应的审核类别下,素材违规的评分信息。
其中,审核结果可以是:综合各个子审核结果得到的数据集;也可以是由各个子审核结果进行加权得到。
通过本实施例中的方法,可以得到有各个审核模型进行审核得到最终的审核结果。
如图3所示,在一些实施例中,如前述的数据处理方法,所述步骤S4根据投放信息确定与待审核媒体数据对应的目标审核标准,包括如下所述步骤S411至S414:
步骤S411.根据投放信息确定用于播放待审核媒体数据的播放终端对应的位置信息以及播放时间信息;
步骤S412.根据位置信息查询得到播放终端对应的周边环境信息;
步骤S413.根据周边环境信息得到与播放时间信息对应的人群信息;
步骤S414.根据人群信息确定与待审核媒体数据对应的目标审核标准。
具体的,投放信息中包括用于播放待审核媒体数据的播放终端对应的位置信息以及播放时间信息。
在得到位置信息之后,可以在地图中查询周边环境信息,其中周边环境信息可以通过预设的距离范围,并以位置信息为中心,得到周边环境信息。
可选的,周边环境信息可以包括:周边的学校、办公楼以及商店信息;然后确定播放时间信息对应的时间点,该周边环境信息对应的人群信息;其中,人群信息可以包括:各年龄段的人员的占比信息。
在得到人群信息之后,可以通过各年龄段的人员的占比信息,得到待审核媒体数据对应的目标审核标准;举例的:当未成年人达到一定占比时,对应的目标审核标准则需要对审核标准更高。
通过本实施例中的方法,可以通过进行位置分析,可以根据每个地点每个时间段进行智能化的标准调整,使审核灵活度进一步提高。
在一些实施例中,如前述的数据处理方法,所述步骤S3根据审核模型对待审核媒体数据进行审核,包括如下所述步骤S311至S313:
步骤S311.根据周边环境信息以及播放时间确定与待审核媒体数据对应的权重信息;
步骤S312.将待审核媒体数据对应的权重信息与各个待审核媒体数据对应的权重信息进行比较,得到待审核媒体数据对应的审核优先级;
步骤S313.按照审核优先级,对待审核媒体数据进行审核。
也就是说,对于不同的时间和地点,进行审核的重要性以及紧急程度是各不相同的;举例的:A地点相对于B地点以及C地点更为重要,因此A地点对应的权重信息(例如:重要度评分)更高,需要进行优先审核;此外,当播放时间I是1小时之后,而播放时间II是一天之后,明显播放时间II对应的待审核媒体数据在审核时间上更加宽裕,因此播放时间I对应的待审核媒体数据的权重信息(例如:紧急度评分)更高;审核优先级即可按照不同的待审核媒体数据对应的权重信息进行排序得到,并且将排序在前的待审核媒体数据优先进行审核。
进一步的,待审核媒体数据可以由线下广告运营方提交,提交后在可以在对应的数据库中写入一条待审核记录,待审核记录进入事务流,可以通过事务流处理各个待审核媒体数据的审核优先级以及审核时间,并按照一定的顺序处理待审核事务。
如图4所示,在一些实施例中,如前述的数据处理方法,所述步骤S4根据投放信息确定与待审核媒体数据对应的目标审核标准,包括如下所述步骤S421至S424:
步骤S421.根据投放信息确定与待审核媒体数据对应的候选审核标准;
步骤S422.获取待审核媒体数据对应的媒体属性信息;
步骤S423.根据媒体属性信息确定对候选审核标准的影响权重;
步骤S424.根据影响权重对候选审核标准进行调整,得到目标审核标准。
具体的,候选审核标准是根据投放信息得到的审核标准。
其中,媒体属性信息可以包括但不限于:待审核媒体数据的所属行业、素材类型以及素材尺寸等信息。
影响权重可以是用于对候选审核标准进行调整的权重,可选的,候选审核标准可以在影响权重的叠加下,标准更加严格或者标准更加宽松。举例来说:当媒体属性信息包括内衣时;审核标中的涉黄部分则需要通过影响权重进行调整,以使最终得到的目标审核标准相比于候选审核标准的更加宽松,即降低审核标准。当媒体属性中包括:未成年人时,则审核标中的涉黄、涉暴的管控需要更加严格,需要通过影响权重提高涉黄/涉暴类别的审核标准。
在一些实施例中,如前述的数据处理方法,还包括如下所述步骤S6至S8:
步骤S6.按照预设的训练数据获取策略获取与审核模型对应的历史记录信息;历史记录信息未用于训练得到审核模型。
具体的,训练数据获取策略是用于获取未在此之前用于对审核模型进行训练的历史记录信息;且为了与前述实施例中的历史记录信息进行区分,记为第三历史记录信息。
训练数据获取策略可以是:确定审核模型上一次的训练时间,获取在训练时间之后获取的第三历史记录信息;也可以是,每次训练都间隔预设时间段进行,然后获取时间上最近的一个预设时间段中的第三历史记录信息;此外,还可以是其它获取方式,在此不一一列举。
步骤S7.对历史记录信息进行随机划分,得到训练集补充数据和验证集补充数据;
也就是说,将历史记录信息进行划分,分为训练集补充数据和验证集补充数据。
步骤S8.通过训练集补充数据对审核模型进行训练,在通过验证集补充数据对训练后的审核模型进行验证,并满足预设的性能要求时,得到更新后审核模型。
具体的,在通过训练集补充数据对审核模型进行训练之后,再通过验证集补充数据对训练后预测模型进行验证并满足性能要求时,即可得到更新后审核模型;其中,更新后审核模型是通过实时最新训练数据训练后的预测模型。
因此,采用本实施例中的方法可以对审核模型自动优化,在预测的同时,可以保证AI审核的结果能随着使用程度的加深而不断完善,进而可以持续提升审核准确度。
在一些实施例中,如前述的数据处理方法,步骤S3根据审核模型对待审核媒体数据进行识别,包括如下所述步骤S321和S322:
步骤S321.在待审核媒体数据为视频数据时,按照预设的图像帧获取策略获取待审核媒体数据对应的图像信息。
具体的,图像帧获取策略可以是对视频数据进行视频帧提取的策略。
步骤S322.根据审核模型对图像信息进行识别。
具体的,由于在线下广告场景中,视频数据类素材的使用也比较普遍,视频文件一般比较大,不适宜直接在AI模型中训练,针对该类的待审核媒体数据,可以采用采用抽取固定帧以及随机帧的方式转化为图像信息,其中固定帧用来保证审核效果,随机帧提升审核精准度。在实际审核场景中,不同的审核级别可以通过抽取不同的图片数来适应审核标准的变化。
在得到图像信息之后,即可通过审核模型对其进行识别,以得到审核结果。
在一些实施例中,如前述的数据处理方法,还包括如下所述步骤P1至P3:
步骤P1.在审核结果不满足目标审核标准时,获取与待审核媒体数据对应的播放终端的当前播放的实时媒体数据对应的第一特征信息;
步骤P2.获取待审核媒体数据的第二特征信息;
步骤P3.在第一特征信息与第二特征信息一致时,生成与播放终端对应的管控指令。
具体的,因为广告业务的实时性要求,可能会允许广告运营方先对素材进行投放,然后再提交到播控系统中进行审核。
在本实施例中,播放终端可以是广告运营方指定待审核媒体数据进行播放的终端;实时媒体数据可以是广告运营方当前投放的素材;其中,第一特征信息以及第二特征信息可以分别是实时媒体数据和待审核媒体数据的哈希值、完整数据内容或者部分数据内容;因此,在确定待审核媒体数据的审核结果不满足目标审核要求时,并且,通过对第一特征信息与第二特征信息进行比对,确定两者一致时,说明实时媒体数据也不满足播放的要求,因此生成与播放终端对应的管控指令,其中管控指令可以用于对播放终端进行关机或者使播放终端按照管控指令对实时媒体数据进行下播等相关操作。
进一步的,还可以通过邮件通知相应负责人,以对违规播放的行为及时进行处理。
如图5所示,根据本申请的另一方面,还提供了一种媒体内容审核的数据处理装置,包括:
获取模块1,用于获取待审核媒体数据对应的投放信息;
模型确定模块2,用于根据投放信息确定待审核媒体数据对应的审核模型;
结果获取模块3,用于根据审核模型对待审核媒体数据进行审核,得到与待审核媒体数据对应的审核结果;
标准确定模块4,用于根据投放信息确定与待审核媒体数据对应的目标审核标准;
投放模块5,用于在审核结果满足目标审核标准时,按照投放信息对待审核媒体数据进行投放。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
根据本申请的另一个实施例,还提供一种电子设备,包括:如图6所示,电子设备可以包括:处理器1501、通信接口1502、存储器1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。
存储器1503,用于存放计算机程序;
处理器1501,用于执行存储器1503上所存放的程序时,实现上述方法实施例的步骤。
上述电子设备提到的总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DigitalSignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本申请实施例还提供一种存储介质,存储介质包括存储的程序,其中,程序运行时执行上述方法实施例的方法步骤。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种媒体内容审核的数据处理方法,其特征在于,包括:
获取待审核媒体数据对应的投放信息;
根据所述投放信息确定所述待审核媒体数据对应的审核模型;
根据所述审核模型对所述待审核媒体数据进行审核,得到与所述待审核媒体数据对应的审核结果;
根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准;
在所述审核结果满足所述目标审核标准时,按照所述投放信息对所述待审核媒体数据进行投放。
2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述投放信息确定所述待审核媒体数据对应的审核模型,包括:
根据所述投放信息确定所述待审核媒体数据对应的播放内容管控策略;
确定与所述播放内容管控策略对应的至少一个审核类别;
根据每个所述审核类别对应的审核模型得到所述待审核媒体数据对应的审核模型。
3.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述审核模型对所述待审核媒体数据进行审核,得到与所述待审核媒体数据对应的审核结果,包括:
分别根据各个所述审核模型对所述待审核媒体数据进行审核,得到与每个所述审核类别对应的子审核结果;
根据所有所述子审核结果得到与所述待审核媒体数据对应的审核结果。
4.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准,包括:
根据所述投放信息确定用于播放所述待审核媒体数据的播放终端对应的位置信息以及播放时间信息;
根据所述位置信息查询得到所述播放终端对应的周边环境信息;
根据所述周边环境信息得到与所述播放时间信息对应的人群信息;
根据所述人群信息确定与所述待审核媒体数据对应的所述目标审核标准。
5.根据权利要求4所述的数据处理方法,其特征在于,根据所述审核模型对所述待审核媒体数据进行审核,包括:
根据所述周边环境信息以及播放时间确定与所述待审核媒体数据对应的权重信息;
将所述待审核媒体数据对应的权重信息与各个待审核媒体数据对应的权重信息进行比较,得到所述待审核媒体数据对应的审核优先级;
按照所述审核优先级,对所述待审核媒体数据进行审核。
6.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准,包括:
根据所述投放信息确定与所述待审核媒体数据对应的候选审核标准;
获取所述待审核媒体数据对应的媒体属性信息;
根据所述媒体属性信息确定对所述候选审核标准的影响权重;
根据所述影响权重对所述候选审核标准进行调整,得到所述目标审核标准。
7.根据权利要求1所述的数据处理方法,其特征在于,还包括:
按照预设的训练数据获取策略获取与所述审核模型对应的历史记录信息;所述历史记录信息未用于训练得到所述审核模型;
对所述历史记录信息进行随机划分,得到训练集补充数据和验证集补充数据;
通过训练集补充数据对所述审核模型进行训练,在通过验证集补充数据对训练后的所述审核模型进行验证,并满足预设的性能要求时,得到更新后审核模型。
8.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述审核模型对所述待审核媒体数据进行审核,包括:
在所述待审核媒体数据为视频数据时,按照预设的图像帧获取策略获取所述待审核媒体数据对应的图像信息;
根据所述审核模型对所述图像信息进行审核。
9.一种媒体内容审核的数据处理装置,其特征在于,包括:
获取模块,用于获取待审核媒体数据对应的投放信息;
模型确定模块,用于根据所述投放信息确定所述待审核媒体数据对应的审核模型;
结果获取模块,用于根据所述审核模型对所述待审核媒体数据进行审核,得到与所述待审核媒体数据对应的审核结果;
标准确定模块,用于根据所述投放信息确定与所述待审核媒体数据对应的目标审核标准;
投放模块,用于在所述审核结果满足所述目标审核标准时,按照所述投放信息对所述待审核媒体数据进行投放。
10.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,所述处理器、通信接口和存储器通过通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述计算机程序时,实现权利要求1至8任一项所述的方法步骤。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至8中任一项所述的方法步骤。
CN202010988224.3A 2020-09-18 2020-09-18 一种媒体内容审核的数据处理方法及装置 Active CN112148898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010988224.3A CN112148898B (zh) 2020-09-18 2020-09-18 一种媒体内容审核的数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010988224.3A CN112148898B (zh) 2020-09-18 2020-09-18 一种媒体内容审核的数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN112148898A true CN112148898A (zh) 2020-12-29
CN112148898B CN112148898B (zh) 2024-04-05

Family

ID=73892419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010988224.3A Active CN112148898B (zh) 2020-09-18 2020-09-18 一种媒体内容审核的数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN112148898B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516208A (zh) * 2021-09-14 2021-10-19 北京远鉴信息技术有限公司 一种数据的审核方法、装置、电子设备及存储介质
CN114710692A (zh) * 2022-03-22 2022-07-05 上海哔哩哔哩科技有限公司 多媒体文件处理方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017045589A1 (zh) * 2015-09-15 2017-03-23 北京合盒互动科技有限公司 公共场所的屏幕广告交易方法
CN107578267A (zh) * 2017-07-31 2018-01-12 上海与德科技有限公司 一种共享广告牌投放内容的审核方法及服务器
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质
CN107688960A (zh) * 2017-07-31 2018-02-13 上海与德科技有限公司 共享广告牌投放内容的审核系统及服务器
CN108124191A (zh) * 2017-12-22 2018-06-05 北京百度网讯科技有限公司 一种视频审核方法、装置及服务器
US20190087856A1 (en) * 2016-09-09 2019-03-21 Tencent Technology (Shenzhen) Company Limited Method and apparatus for publishing multimedia data, server and storage medium
CN110473263A (zh) * 2018-05-09 2019-11-19 北京京东尚科信息技术有限公司 图片的审核方法、装置和系统
CN110796098A (zh) * 2019-10-31 2020-02-14 广州市网星信息技术有限公司 内容审核模型的训练及审核方法、装置、设备和存储介质
CN111225234A (zh) * 2019-12-23 2020-06-02 广州市百果园信息技术有限公司 视频审核方法、视频审核装置、设备和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017045589A1 (zh) * 2015-09-15 2017-03-23 北京合盒互动科技有限公司 公共场所的屏幕广告交易方法
US20190087856A1 (en) * 2016-09-09 2019-03-21 Tencent Technology (Shenzhen) Company Limited Method and apparatus for publishing multimedia data, server and storage medium
CN107578267A (zh) * 2017-07-31 2018-01-12 上海与德科技有限公司 一种共享广告牌投放内容的审核方法及服务器
CN107688960A (zh) * 2017-07-31 2018-02-13 上海与德科技有限公司 共享广告牌投放内容的审核系统及服务器
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质
CN108124191A (zh) * 2017-12-22 2018-06-05 北京百度网讯科技有限公司 一种视频审核方法、装置及服务器
CN110473263A (zh) * 2018-05-09 2019-11-19 北京京东尚科信息技术有限公司 图片的审核方法、装置和系统
CN110796098A (zh) * 2019-10-31 2020-02-14 广州市网星信息技术有限公司 内容审核模型的训练及审核方法、装置、设备和存储介质
CN111225234A (zh) * 2019-12-23 2020-06-02 广州市百果园信息技术有限公司 视频审核方法、视频审核装置、设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516208A (zh) * 2021-09-14 2021-10-19 北京远鉴信息技术有限公司 一种数据的审核方法、装置、电子设备及存储介质
CN114710692A (zh) * 2022-03-22 2022-07-05 上海哔哩哔哩科技有限公司 多媒体文件处理方法和装置
CN114710692B (zh) * 2022-03-22 2024-03-01 上海哔哩哔哩科技有限公司 多媒体文件处理方法和装置

Also Published As

Publication number Publication date
CN112148898B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
US10929879B2 (en) Method and apparatus for identification of fraudulent click activity
CN110737859B (zh) 一种up主匹配方法及装置
CN111225234B (zh) 视频审核方法、视频审核装置、设备和存储介质
CN112148898A (zh) 一种媒体内容审核的数据处理方法及装置
CN109086422B (zh) 一种机器弹幕用户的识别方法、装置、服务器和存储介质
CN112148896A (zh) 一种用于终端媒体监播的数据处理方法及装置
CN114357287A (zh) 互联网信息的智能化审核方法及装置
CN106611321B (zh) 虚假手机号码的识别方法和装置
CN109840676B (zh) 基于大数据的风控方法、装置、计算机设备及存储介质
CN111914645A (zh) 识别虚假信息的方法、装置、电子设备及存储介质
CN109670963A (zh) 资产信息筛选方法、装置、设备及存储介质
CN109993450B (zh) 电影评分方法、装置、设备及存储介质
CN108537664B (zh) 基于区块链技术发布股票市场分析信息的方法和服务器
CN107977367B (zh) 一种文本展示方法及服务器
CN112381574A (zh) 一种公交车辆的广告投放方法及装置
CN109831696A (zh) 处理违规视频内容的方法、装置、电子设备及存储介质
CN113378619B (zh) 保险业务数据处理方法、装置、电子设备和存储介质
US20230199230A1 (en) Information processing device, information processing method, and information processing system
CN111026911B (zh) 直播间搜索引擎自适应调整方法、装置及可读存储介质
CN115311022A (zh) 一种广告流量识别方法、装置及计算机可读存储介质
CN111488491B (zh) 一种识别目标主播的方法及系统、介质、设备
CN114978474A (zh) 一种用户聊天风险等级自动处置方法及系统
Fombad The protection of freedom of expression in the public service media in southern Africa: A Botswana perspective
CN107818483B (zh) 网络卡券推荐方法及系统
CN113032426A (zh) 识别结果的智能校对方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant before: Jingdong Digital Technology Holding Co.,Ltd.

GR01 Patent grant
GR01 Patent grant