CN111382605A - 视频内容审核方法、装置、存储介质和计算机设备 - Google Patents

视频内容审核方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN111382605A
CN111382605A CN201811620533.4A CN201811620533A CN111382605A CN 111382605 A CN111382605 A CN 111382605A CN 201811620533 A CN201811620533 A CN 201811620533A CN 111382605 A CN111382605 A CN 111382605A
Authority
CN
China
Prior art keywords
video
violation
scores
classifier
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811620533.4A
Other languages
English (en)
Other versions
CN111382605B (zh
Inventor
杨轩
刘振强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Baiguoyuan Information Technology Co Ltd
Original Assignee
Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baiguoyuan Information Technology Co Ltd filed Critical Guangzhou Baiguoyuan Information Technology Co Ltd
Priority to CN201811620533.4A priority Critical patent/CN111382605B/zh
Publication of CN111382605A publication Critical patent/CN111382605A/zh
Application granted granted Critical
Publication of CN111382605B publication Critical patent/CN111382605B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种视频内容审核方法、装置、存储介质和计算机设备,所述的方法包括:获取待检测视频的每帧图片的违规分数;确定违规分数最高的前N帧图片;N大于1;将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数;根据所述待检测视频的分数判断所述待检测视频是否违规。本申请实施例提高了违规视频的召回率。

Description

视频内容审核方法、装置、存储介质和计算机设备
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种视频内容审核方法、装置、存储介质和计算机设备。
背景技术
随着多媒体技术的发展,视频已成为用户发布信息和娱乐的主流方式。不可避免的,总是会有一些不法分子由于利益等原因发布违规视频,例如,色情低俗视频、造谣传谣视频、版权侵犯视频和侵犯未成年人权益视频等等。因此,为了为用户提供积极、美好、绿色和健康的网络环境,视频审核变得尤为重要。
目前一般基于深度学习图像分类模型对视频进行审核,具体过程为:通过深度学习图像分类模型获取视频的每帧图片的违规分数,取最大违规分数代表视频的评分,然后将评分大于一定阈值的视频推送给人工审核,从而在很大程度上降低人工审核工作量,并提高了视频违规检测的效率。但是该种方式存在违规视频的召回率较低的缺陷,其中,召回率指的是推送给人工审核的视频中真正属于违规视频所占比例。
发明内容
本申请针对现有方式的缺点,提出一种视频内容审核方法、装置、存储介质和计算机设备,以提高违规视频的召回率。
本申请的实施例根据第一个方面,提供了一种视频内容审核方法,包括:
获取待检测视频的每帧图片的违规分数;
确定违规分数最高的前N帧图片;N大于1;
将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数;
根据所述待检测视频的分数判断所述待检测视频是否违规。
在一个实施例中,所述分类器为xgboost分类器。
在一个实施例中,所述获取待检测视频的每帧图片的违规分数,包括:
获取待检测视频的每帧图片在各个违规类别下的违规分数。
在一个实施例中,所述确定违规分数最高的前N帧图片,包括:
分别确定各个违规类别下分数最高的前N帧图片。
在一个实施例中,所述将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数,包括:
将各个违规类别下的前N帧图片的违规分数输入训练后的分类器中,由所述分类器对各个违规类别下的前N帧图片的违规分数进行拟合,获得所述待检测视频的分数。
在一个实施例中,所述将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数,包括:
将前N帧图片的违规分数以及其它特征输入训练后的分类器中,由所述分类器对前N帧图片的违规分数以及其它特征进行拟合,获得所述待检测视频的分数。
在一个实施例中,所述分类器通过以下方式训练获得:
获取样本视频,以及用于表征所述样本视频是否违规的视频标签;
计算所述样本视频的每帧图片的违规分数;
根据所述样本视频的每帧图片的违规分数和所述视频标签,对分类器进行训练,获得训练后的分类器。
本申请的实施例根据第二个方面,还提供了一种视频内容审核装置,包括:
违规分数获取模块,用于获取待检测视频的每帧图片的违规分数;
筛选模块,用于确定违规分数最高的前N帧图片;N大于1;
视频分数获得模块,用于将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数;
视频检测模块,用于根据所述待检测视频的分数判断所述待检测视频是否违规。
本申请的实施例根据第三个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的视频内容审核方法。
本申请的实施例根据第四个方面,还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的视频内容审核方法。
上述的视频内容审核方法、装置、存储介质和计算机设备,在得到每帧图片的违规分数后,进一步通过分类器对违规分数最高的前N帧图片的违规分数进行拟合,将拟合得到的分数作为视频的分数,相较于直接取图片最大违规分数作为视频分数的方法,本申请充分利用最大分数图片的信息和非最大分数图片的信息,拟合出更准确的视频分数,因此可以在推送给人工审核的视频数量不变的情况下提高违规视频的召回率。另外,对于不同业务的审核需求,只要提取出相应的特征,采用本申请的方案均可在一定程度上提高其审核准确率,应用范围广。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例的视频内容审核方法的示意图;
图2为本申请另一个实施例的视频内容审核方法的示意图;
图3为本申请另一个实施例的视频内容审核方法的示意图;
图4为本申请一个实施例的二分类下视频内容审核方法的示意图;
图5为本申请一个实施例的多分类下视频内容审核方法的示意图;
图6为本申请一个实施例的分类器获得方法的示意图;
图7为本申请一个具体实施例的分类器训练过程的示意图;
图8为本申请一个实施例的视频内容审核装置的示意图;
图9为本申请一个实施例的计算机设备的示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
有必要先对本申请的应用场景以及应用产品进行如下的先导性说明。
本申请提供的方案可以作为独立模块接入到现有图片特征提取模型(即后续提到的审核模型)后,对图片特征提取模型输出的图片特征进行进一步的拟合,得到更为准确的评分,进一步提高审核的准确率。本申请提供的方案可应用于短视频类APP(ApplicatioN,应用程序)的内容审核(如like、bigovlog等等),以及长视频类APP的内容审核。
下面结合附图,对本申请的具体实施方式进行详细介绍。
如图1所示,在一个实施例中,一种视频内容审核方法,包括:
S110、获取待检测视频的每帧图片的违规分数。
待检测视频可以是任何需要审核的短视频或者长视频等等。违规分数用于表征图片违规的程度。将要检测的视频根据不同的采样频率需要提取多帧图片,可选的,对多帧图片进行相应的预处理后,将每帧图片输入现有的审核模型中提取违规分数的特征。审核模型包括深度学习图像分类模型或者其它可以对图片违规程度打分的模型。审核模型对于输入的每帧图片,输出其对应单个或多个违规类别的概率值,选取最大的概率值作为该图片的违规分数。
S120、确定违规分数最高的前N帧图片;N大于1。
一个视频中提取的所有图片经过审核模型得到违规分数后,将全部图片的违规分数进行排序,取其中违规分数最高的前N帧图片,将前N帧图片的违规分数作为分类器的输入特征,其中,N可以根据实际情况选定。
进一步的,为了更为准确地确定视频的分数,还可以将审核模型内部提取的前N帧图片的其他特征与提取的违规分数的特征一起,构成更复杂的图片综合特征,作为分类器的输入特征。在提取违规分数特征(或对应图片综合特征)时,可以任意指定特征维度和特征类型,灵活性高。例如,指定的其他的特征包括图片的空间信息等等。
S130、将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数。
本申请所采用的分类器为具有分数拟合功能的分类器,如线性分类器、SVM(Support Vector MachiNe,支持向量机)等等。为了进一步提高分数拟合的效果,本申请的申请人对各个分类器的效果进行一一实验,最终确定出效果更好的分类器-xgboost(eXtremeGradieNtBoostiNg,极端梯度提升)分类器,采用该分类器进行违规分数的拟合。xgboost是基于传统boostiNg算法GBDT(gradieNtboostiNgdecisioN tree,梯度提升决策树)改进而来,因此GBDT也可以实现对分数特征的拟合功能,但由于GBDT算法上的缺陷,会导致其拟合效果不如xgboost,如:1)xgboost目标函数多了正则项,因此泛化能力更强,减弱了过拟合现象;2)xgboost求目标函数进行泰勒展开采用泰勒展开二阶导数,相比于GBDT采用泰勒展开一阶导数,更方便优化。相比于其他分类器模型,如线性分类器,SVM等,xgboost分类器模型较小,空间及时间成本较低,支持列抽样,并行处理等,降低计算量和预测时间,拟合效果好,并且适合根据实际数据经常迭代更新。
将视频的前N个违规分数输入分类器后,由该分类器拟合计算输出一个分数,作为该视频的分数。相比于直接取图片最大分数等方法,使用分类器学习的方式,可以使视频中每帧图片的信息得到更好的利用,拟合出更准确的视频分数。并且对于有缺失特征的数据,分类器也可以自行学习出拟合的方向,灵活性高。
S140、根据所述待检测视频的分数判断所述待检测视频是否违规。
根据实际需求,选定视频违规阈值,根据确定的视频分数是否大于该违规阈值判断视频是否违规。如果视频分数大于违规阈值,则视频违规,如果视频分数小于等于违规阈值,则视频不违规。
上述视频内容审核方法,充分利用最大分数图片的信息和非最大分数图片的信息,拟合出更准确的视频分数,因此可以在推送给人工审核的视频数量不变的情况下提高违规视频的召回率。另外,对于不同业务的审核需求,只要提取出相应的特征,采用本申请的方案均可在一定程度上提高其审核准确率,应用范围广。
如上所述,审核模型对于输入的每帧图片,可以输出其对应多个违规类别的概率值。针对该种多个违规类别的情况,为了进一步提高审核的准确率,如图2所示,在另一个实施例中,一种视频内容审核方法,包括:
S210、获取待检测视频的每帧图片在各个违规类别下的违规分数。
违规类别包括色情低俗类别、版权侵犯类别、造谣传谣类别等等。提取待检测视频的多帧图片,将每帧图片输入审核模型后,对应每个违规类别都会得到一个违规分数。
S220、分别确定各个违规类别下分数最高的前N帧图片;N大于1。
针对每一个违规类别,将视频的全部图片的违规分数从大到小排序,取其中排序靠前的N帧图片的违规分数,作为该违规类别下分类器的输入特征,每个违规类别下提取的违规分数的个数可以相同,也可以不相同。
另外,当有需要时,可同时将审核模型内部提取N帧图片的其他特征与该类别下的违规分数一起,构成更复杂的图片综合特征,作为分类器的输入特征。
S230、将各个违规类别下的前N帧图片的违规分数输入训练后的分类器中,由所述分类器对各个违规类别下的前N帧图片的违规分数进行拟合,获得所述待检测视频的分数。
由于输入特征包括各个违规类别下分数最高的前N帧图片的违规分数(或者图片综合特征),因此,需要将各个违规类别下的前N帧图片的违规分数输入训练后的分类器中,由所述分类器对各个违规类别下的前N帧图片的违规分数进行拟合,获得所述待检测视频的分数。
S240、根据所述待检测视频的分数判断所述待检测视频是否违规。
根据实际需求,选定视频违规阈值,根据确定的视频分数是否大于该违规阈值判断视频是否违规。
上述视频内容审核方法,考虑到多种违规类别的情况,充分利用每一种违规类别下最大分数图片的信息和非最大分数图片的信息,能够拟合出更准确的视频分数,因此可以在推送给人工审核的视频数量不变的情况下进一步提高违规视频的召回率。
如果分类器的输入特征为前N帧图片的图片综合特征,在一个实施例中,如图3所示,所述将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数,包括S1301:将前N帧图片的违规分数以及其它特征输入训练后的分类器中,由所述分类器对前N帧图片的违规分数以及其它特征进行拟合,获得所述待检测视频的分数。将审核模型内部提取的前N帧图片的其他特征与提取的违规分数的特征一起,作为分类器的输入特征,由分类器进行拟合,可以获得更为准确的待检测视频的分数。
本申请方案除了适用于图2所示的多分类审核方案,还适用于二分类审核方案。二分类为全部视频分为违规和不违规两种类别;多分类为将二分类中的违规类别进行进一步细分类,分为不同种类的违规。可以根据实际审核需求而采取不同分类方式。
为了更好的理解本申请,下面结合二分类和多分类两种情形,对本申请视频内容审核方法进行详细介绍。
如图4所示,为一具体实施例的二分类下视频内容审核方法的示意图。该视频内容审核方法包括:
S410、视频帧提取:将输入视频根据不同的采样频率需要提取多帧图片,进行相应的预处理后,将每帧图片输入审核模型提取特征。
S420、由审核模型计算每帧图片的违规分数:审核模型对于输入的每帧图片,计算每帧图片的违规分数。
S430、提取分类器的输入特征:将一个视频的全部图片的违规分数从大到小排序,取其中排序靠前的N帧图片的违规分数,作为分类器的输入特征。当有需要时,可同时将审核模型内部提取N帧图片的其他特征与违规分数一起,构成更复杂的图片综合特征,作为分类器的输入特征。
S440、由分类器对输入特征进行拟合,输出视频的分数:将视频的前N个违规分数(或图片综合特征)输入分类器后,由分类器拟合计算输出一个分数,作为该视频的分数。
S450、选定视频违规阈值,根据视频分数是否大于该违规阈值判断视频是否违规。
多分类与二分类流程相似,只是比二分类增加了不同违规类别的违规分数特征。
如图5所示,为一具体实施例的多分类下视频内容审核方法的示意图。该视频内容审核方法包括:
S510、视频帧提取:将输入视频根据不同的采样频率需要提取多帧图片,进行相应的预处理后,将每帧图片输入审核模型中,提取每帧图片分别在m个违规类别下的特征,m大于1。
S520、由审核模型计算每帧图片在m个违规类别下的违规分数:通过审核模型,分别计算每帧图片在违规类别1下的违规分数,每帧图片在违规类别2下的违规分数,……,每帧图片在违规类别m下的违规分数。
S530、提取分类器的输入特征:对于m个违规类别,对于单个视频的各帧图片,其在每个违规类别下各自排序后取前N个违规分数,将m个违规类别下共m*N个违规分数的特征(或同时合并了其他图片特征的图片综合特征)作为分类器的输入特征。
S540、由分类器对输入特征进行拟合,输出视频的分数:分类器输入m*N个违规分数的特征(或同时合并了其他图片特征的图片综合特征),对m*N个违规分数的特征(或同时合并了其他图片特征的图片综合特征)拟合计算输出一个分数,作为该视频的分数。
S550、选定视频违规阈值,根据视频分数是否大于该违规阈值判断视频是否违规。
为了得到准确的视频分数,需要对分类器进行训练,因此,如图6所示,在一个实施例中,所述分类器可以通过以下方式训练获得:S610、获取样本视频,以及用于表征所述样本视频是否违规的视频标签;S620、计算所述样本视频的每帧图片的违规分数;S630、根据所述样本视频的每帧图片的违规分数和所述视频标签,对分类器进行训练,获得训练后的分类器。样本视频可以是线上审核后的视频,也可以是本地存储的视频等。通过审核模型计算样本视频每帧图片的违规分数,结合视频标签,对分类器进行训练,具体过程为,从该视频所有图片的违规分数中选取最高的前N个违规分数,输入分类器得到视频的分数,根据该视频的分数判断是否是违规视频,然后比较该判断结果与视频标识是否一致,若不一致,对分类器的模型参数进行修正,然后返回输入分类器得到视频的分数的步骤,依次循环,直至满足设置的迭代停止条件,得到训练后的分类器,该训练后的分类器用于视频内容的审核。
如图7所示,为一具体实施例的xgboost分类器训练过程的示意图。该训练过程包括:定期采集线上审核后视频数据,将该视频数据输入审核模型后,得到每个视频的每帧图片的违规分数的特征,结合每个视频的视频标签(根据线上审核结果分为违规或不违规),进行xgboost分类器训练,用训练后的xgboost分类器更新线上模型,进行违规视频的审核。循环迭代,每隔一段时间更新一次xgboost分类器,以保证拟合的视频分数的准确性。
基于同一发明构思,本申请还提供一种视频内容审核装置,下面结合附图对本申请装置的具体实施方式进行详细介绍。
如图8所示,在一个实施例中,一种视频内容审核装置,包括:
违规分数获取模块810,用于获取待检测视频的每帧图片的违规分数;
筛选模块820,用于确定违规分数最高的前N帧图片;N大于1;
视频分数获得模块830,用于将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数;
视频检测模块840,用于根据所述待检测视频的分数判断所述待检测视频是否违规。
在一个实施例中,所述分类器为xgboost分类器。
在一个实施例中,违规分数获取模块810获取待检测视频的每帧图片在各个违规类别下的违规分数。
在一个实施例中,筛选模块820分别确定各个违规类别下分数最高的前N帧图片。
在一个实施例中,视频分数获得模块830将各个违规类别下的前N帧图片的违规分数输入训练后的分类器中,由所述分类器对各个违规类别下的前N帧图片的违规分数进行拟合,获得所述待检测视频的分数。
在一个实施例中,视频分数获得模块830将前N帧图片的违规分数以及其它特征输入训练后的分类器中,由所述分类器对前N帧图片的违规分数以及其它特征进行拟合,获得所述待检测视频的分数。
在一个实施例中,所述分类器通过以下方式训练获得:
获取样本视频,以及用于表征所述样本视频是否违规的视频标签;
计算所述样本视频的每帧图片的违规分数;
根据所述样本视频的每帧图片的违规分数和所述视频标签,对分类器进行训练,获得训练后的分类器。
上述视频内容审核装置的其它技术特征与上述视频内容审核方法的技术特征相同,在此不予赘述。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的视频内容审核方法。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-ONly Memory,只读存储器)、RAM(RaNdomAcceSS Memory,随即存储器)、EPROM(EraSable ProgrammableRead-ONly Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSableProgrammable Read-ONly Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。
本申请实施例还提供一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的视频内容审核方法。
图9为本申请计算机设备的结构示意图,包括处理器920、存储装置930、输入单元940以及显示单元950等器件。本领域技术人员可以理解,图9示出的结构器件并不构成对所有计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储装置930可用于存储应用程序910以及各功能模块,处理器920运行存储在存储装置930的应用程序910,从而执行设备的各种功能应用以及数据处理。存储装置930可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本申请所公开的存储装置包括但不限于这些类型的存储装置。本申请所公开的存储装置930只作为例子而非作为限定。
输入单元940用于接收信号的输入,以及接收每帧图片的违规分数。输入单元940可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元950可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元950可采用液晶显示器、有机发光二极管等形式。处理器920是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储装置930内的软件程序和/或模块,以及调用存储在存储装置内的数据,执行各种功能和处理数据。
在一实施方式中,计算机设备包括一个或多个处理器920,以及一个或多个存储装置930,一个或多个应用程序910,其中所述一个或多个应用程序910被存储在存储装置930中并被配置为由所述一个或多个处理器920执行,所述一个或多个应用程序910配置用于执行以上实施例所述的视频内容审核方法。
上述的视频内容审核方法、装置、存储介质和计算机设备,与现有技术相互比较时,具备以下优点:
1)相比于直接取图片最大分数等方法,使用分类器学习的方式,可以使视频中每帧图片的信息得到更好的利用,拟合出更准确的视频分数;
2)应用范围广,对于不同业务的审核需求,只要提取出相应的特征,采用本申请的方案均可在一定程度上提高其审核准确率;
3)相比于其他分类器模型,如线性分类器,SVM等,xgboost分类器较小,空间及时间成本较低,支持列抽样,并行处理等,降低计算量和预测时间,拟合效果好,适合根据实际数据经常迭代更新;
4)灵活性高,在提取违规分数的特征(或对应图片综合特征)时,可以任意指定特征维度和特征类型,并且对于有缺失特征的数据,xgboost分类器可以自行学习出拟合的方向。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
应该理解的是,在本申请各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种视频内容审核方法,其特征在于,包括:
获取待检测视频的每帧图片的违规分数;
确定违规分数最高的前N帧图片;N大于1;
将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数;
根据所述待检测视频的分数判断所述待检测视频是否违规。
2.根据权利要求1所述的视频内容审核方法,其特征在于,所述分类器为xgboost分类器。
3.根据权利要求1所述的视频内容审核方法,其特征在于,所述获取待检测视频的每帧图片的违规分数,包括:
获取待检测视频的每帧图片在各个违规类别下的违规分数。
4.根据权利要求3所述的视频内容审核方法,其特征在于,所述确定违规分数最高的前N帧图片,包括:
分别确定各个违规类别下分数最高的前N帧图片。
5.根据权利要求4所述的视频内容审核方法,其特征在于,所述将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数,包括:
将各个违规类别下的前N帧图片的违规分数输入训练后的分类器中,由所述分类器对各个违规类别下的前N帧图片的违规分数进行拟合,获得所述待检测视频的分数。
6.根据权利要求1所述的视频内容审核方法,其特征在于,所述将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数,包括:
将前N帧图片的违规分数以及其它特征输入训练后的分类器中,由所述分类器对前N帧图片的违规分数以及其它特征进行拟合,获得所述待检测视频的分数。
7.根据权利要求1至6任意一项所述的视频内容审核方法,其特征在于,所述分类器通过以下方式训练获得:
获取样本视频,以及用于表征所述样本视频是否违规的视频标签;
计算所述样本视频的每帧图片的违规分数;
根据所述样本视频的每帧图片的违规分数和所述视频标签,对分类器进行训练,获得训练后的分类器。
8.一种视频内容审核装置,其特征在于,包括:
违规分数获取模块,用于获取待检测视频的每帧图片的违规分数;
筛选模块,用于确定违规分数最高的前N帧图片;N大于1;
视频分数获得模块,用于将前N帧图片的违规分数输入训练后的分类器中,由所述分类器对前N帧图片的违规分数进行拟合,获得所述待检测视频的分数;
视频检测模块,用于根据所述待检测视频的分数判断所述待检测视频是否违规。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任意一项所述的视频内容审核方法。
10.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至7中任意一项所述的视频内容审核方法。
CN201811620533.4A 2018-12-28 2018-12-28 视频内容审核方法、装置、存储介质和计算机设备 Active CN111382605B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811620533.4A CN111382605B (zh) 2018-12-28 2018-12-28 视频内容审核方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811620533.4A CN111382605B (zh) 2018-12-28 2018-12-28 视频内容审核方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN111382605A true CN111382605A (zh) 2020-07-07
CN111382605B CN111382605B (zh) 2023-08-18

Family

ID=71217149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811620533.4A Active CN111382605B (zh) 2018-12-28 2018-12-28 视频内容审核方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN111382605B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016613A (zh) * 2020-08-26 2020-12-01 广州市百果园信息技术有限公司 视频内容分类模型的训练方法、装置、计算机设备及介质
CN112788356A (zh) * 2020-12-30 2021-05-11 百果园技术(新加坡)有限公司 一种直播审核的方法、装置、服务器和存储介质
CN113590944A (zh) * 2021-07-23 2021-11-02 北京达佳互联信息技术有限公司 内容查找方法及装置
CN115130139A (zh) * 2022-08-31 2022-09-30 杭州链城数字科技有限公司 数字资产审查方法、装置、系统和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901346A (zh) * 2010-05-06 2010-12-01 复旦大学 一种对彩色数字图像进行不良内容识别的方法
CN108229262A (zh) * 2016-12-22 2018-06-29 腾讯科技(深圳)有限公司 一种色情视频检测方法及装置
CN108319888A (zh) * 2017-01-17 2018-07-24 阿里巴巴集团控股有限公司 视频类型的识别方法及装置、计算机终端
CN108520285A (zh) * 2018-04-16 2018-09-11 清华大学 物品鉴别方法、系统、设备及存储介质
CN108875525A (zh) * 2018-01-04 2018-11-23 北京旷视科技有限公司 行为预测方法、装置、系统和存储介质
CN108875517A (zh) * 2017-12-15 2018-11-23 北京旷视科技有限公司 视频处理方法、装置和系统及存储介质
CN108960782A (zh) * 2018-07-10 2018-12-07 北京木瓜移动科技股份有限公司 内容审核方法以及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901346A (zh) * 2010-05-06 2010-12-01 复旦大学 一种对彩色数字图像进行不良内容识别的方法
CN108229262A (zh) * 2016-12-22 2018-06-29 腾讯科技(深圳)有限公司 一种色情视频检测方法及装置
CN108319888A (zh) * 2017-01-17 2018-07-24 阿里巴巴集团控股有限公司 视频类型的识别方法及装置、计算机终端
CN108875517A (zh) * 2017-12-15 2018-11-23 北京旷视科技有限公司 视频处理方法、装置和系统及存储介质
CN108875525A (zh) * 2018-01-04 2018-11-23 北京旷视科技有限公司 行为预测方法、装置、系统和存储介质
CN108520285A (zh) * 2018-04-16 2018-09-11 清华大学 物品鉴别方法、系统、设备及存储介质
CN108960782A (zh) * 2018-07-10 2018-12-07 北京木瓜移动科技股份有限公司 内容审核方法以及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016613A (zh) * 2020-08-26 2020-12-01 广州市百果园信息技术有限公司 视频内容分类模型的训练方法、装置、计算机设备及介质
CN112788356A (zh) * 2020-12-30 2021-05-11 百果园技术(新加坡)有限公司 一种直播审核的方法、装置、服务器和存储介质
US12010358B2 (en) 2020-12-30 2024-06-11 Bigo Technology Pte. Ltd. Live streaming moderating method and apparatus, server, and storage medium
CN113590944A (zh) * 2021-07-23 2021-11-02 北京达佳互联信息技术有限公司 内容查找方法及装置
CN113590944B (zh) * 2021-07-23 2024-01-19 北京达佳互联信息技术有限公司 内容查找方法及装置
CN115130139A (zh) * 2022-08-31 2022-09-30 杭州链城数字科技有限公司 数字资产审查方法、装置、系统和存储介质
CN115130139B (zh) * 2022-08-31 2022-12-02 杭州链城数字科技有限公司 数字资产审查方法、装置、系统和存储介质

Also Published As

Publication number Publication date
CN111382605B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
US11556743B2 (en) Learning highlights using event detection
CN107491432B (zh) 基于人工智能的低质量文章识别方法及装置、设备及介质
CN111382605A (zh) 视频内容审核方法、装置、存储介质和计算机设备
CN111340126B (zh) 物品识别方法、装置、计算机设备和存储介质
CN102549603B (zh) 基于相关性的图像选择
CN106028134A (zh) 针对移动计算设备检测体育视频精彩部分
US9373040B2 (en) Image matching using motion manifolds
CN107169106B (zh) 视频检索方法、装置、存储介质及处理器
CN111353542A (zh) 图像分类模型的训练方法、装置、计算机设备和存储介质
CN111369299B (zh) 识别的方法、装置、设备及计算机可读存储介质
CN104573706A (zh) 一种物体图像识别方法及其系统
CN108615011B (zh) 基于多尺度滑动窗口的非修剪视频行为识别预测方法
US20230066853A1 (en) Method and apparatus for training information prediction models, method and apparatus for predicting information, and storage medium and device thereof
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN108804577B (zh) 一种资讯标签兴趣度的预估方法
CN110851621B (zh) 基于知识图谱预测视频精彩级别的方法、装置及存储介质
CN111783712A (zh) 一种视频处理方法、装置、设备及介质
CN112749330B (zh) 信息推送方法、装置、计算机设备和存储介质
CN103324641A (zh) 信息记录推荐方法和装置
Yang et al. Video Analysis and System Construction of Basketball Game by Lightweight Deep Learning under the Internet of Things
CN113395584A (zh) 一种视频数据处理方法、装置、设备以及介质
JP4995770B2 (ja) 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム
CN110851708A (zh) 负样本的抽取方法、装置、计算机设备和存储介质
US10242080B1 (en) Clustering applications using visual metadata
CN115661542A (zh) 一种基于特征关系迁移的小样本目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant