CN114639056A - 直播内容的识别方法、装置、计算机设备及存储介质 - Google Patents

直播内容的识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114639056A
CN114639056A CN202210324058.6A CN202210324058A CN114639056A CN 114639056 A CN114639056 A CN 114639056A CN 202210324058 A CN202210324058 A CN 202210324058A CN 114639056 A CN114639056 A CN 114639056A
Authority
CN
China
Prior art keywords
image
target image
image type
type
violation probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210324058.6A
Other languages
English (en)
Inventor
卫淑波
杨飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuomi Private Ltd
Original Assignee
Zhuomi Private Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuomi Private Ltd filed Critical Zhuomi Private Ltd
Priority to CN202210324058.6A priority Critical patent/CN114639056A/zh
Publication of CN114639056A publication Critical patent/CN114639056A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本公开提出一种直播内容的识别方法、装置、计算机设备及存储介质,涉及计算机技术领域,尤其涉及网络直播领域。该方法包括:从直播视频中获取待识别的目标图像;将所述目标图像输入图像识别模型中,以获取所述目标图像对应的识别结果,其中,所述识别结果包括图像类型及所述图像类型对应的违规概率;根据所述图像类型及所述图像类型对应的违规概率,确定所述目标图像是否合规。本公开首先通过图像识别模型对目标图像的图像类型进行判断,进而根据图像类型对目标图像是否合规进行判断,实现了基于具体违规原因对直播内容的合规性进行判断,满足了合规性要求不同的地域的需求。

Description

直播内容的识别方法、装置、计算机设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种直播内容的识别方法、装置、计算机设备及存储介质。
背景技术
目前,网络直播行业蓬勃发展,直播内容多种多样。对于直播平台来说,为了确保直播内容是正规合法的,需要对直播内容进行审核。由于不同地域的法律法规标准不同,对直播内容的合规性的定义可能也不相同。因此,研究如何识别直播内容对于不同地域的合规性,具有重要意义。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
本公开第一方面实施例提出了一种直播内容的识别方法,包括:
从直播视频中获取待识别的目标图像;
将所述目标图像输入图像识别模型中,以获取所述目标图像对应的识别结果,其中,所述识别结果包括图像类型及所述图像类型对应的违规概率;
根据所述图像类型及所述图像类型对应的违规概率,确定所述目标图像是否合规。
本公开第二方面实施例提出了一种直播内容的识别装置,包括:
第一获取模块,用于从直播视频中获取待识别的目标图像;
第二获取模块,用于将所述目标图像输入图像识别模型中,以获取所述目标图像对应的识别结果,其中,所述识别结果包括图像类型及所述图像类型对应的违规概率;
第一确定模块,用于根据所述图像类型及所述图像类型对应的违规概率,确定所述目标图像是否合规。
本公开第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时,实现如本公开第一方面实施例提出的直播内容的识别方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,存储有计算机指令,所述计算机指令被处理器执行时实现如本公开第一方面实施例提出的直播内容的识别方法。
本公开第五方面实施例提出了一种计算机程序产品,包括计算机指令,当所述计算机程序产品中的指令被处理器执行时,执行如本公开第一方面实施例提出的直播内容的识别方法。
本公开提供的直播内容的识别方法、装置、计算机设备及存储介质,存在如下有益效果:
首先从直播视频中获取待识别的目标图像,然后将目标图像输入图像识别模型中,以获取目标图像对应的识别结果,其中,识别结果包括图像类型及图像类型对应的违规概率;最后根据图像类型及图像类型对应的违规概率,确定目标图像是否合规。本公开通过图像识别模型对目标图像的图像类型进行判断,进而根据图像类型对目标图像是否合规进行判断,实现了基于具体违规原因对直播内容的合规性进行判断,满足了合规性要求不同的地域的需求。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本公开一实施例所提供的直播内容的识别方法的流程示意图;
图2为本公开另一实施例所提供的直播内容的识别方法的流程示意图;
图3为本公开一实施例所提供的直播内容的识别装置的结构示意图;
图4示出了适于用来实现本公开实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本公开的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的直播内容的识别方法、装置、计算机设备和存储介质。
图1为本公开实施例所提供的直播内容的识别方法的流程示意图。
本公开实施例以该直播内容的识别方法被配置于直播内容的识别装置中来举例说明,该直播内容的识别装置可以应用于任一计算机设备中,以使该计算机设备可以执行直播内容的识别功能。
其中,计算机设备可以为个人电脑(Personal Computer,简称PC)、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
如图1所示,该直播内容的识别方法可以包括以下步骤:
步骤101,从直播视频中获取待识别的目标图像。
可以理解的是,当需要对直播内容的合规性进行鉴别时,可以将直播视频中的画面作为判断依据。本公开实施例中,通过从直播视频中截取图像,可以获取直播过程中的画面。
需要说明的是,随着直播的进行,直播内容可能会发生变化。因此,为了实时监控直播内容的合规性,可以持续从直播视频中截取目标图像。
在一些实施例中,可以按照设定频率从直播间的视频流中截取目标图像。比如,可以每隔5s从直播间的视频流中截取一帧图像,并将截取的每帧图像依次作为目标图像进行识别。
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中获取目标图像等的限定。
步骤102,将目标图像输入图像识别模型中,以获取目标图像对应的识别结果,其中,识别结果包括图像类型及图像类型对应的违规概率。
可以理解的是,在不同的地域,对直播内容的违规定义可能不同。比如,不同国家和地区的法律法规,对于直播视频中不能出现的物品或画面的规定可能不同。
本公开实施例中,为了满足合规性要求不同的地域的需求,图像识别模型输出的识别结果可以包括多种图像类型及每种图像类型对应的违规概率。
比如,预先设置的图像类型可以包括正常、性感、特写、露点、计生用品等等,本公开对此不做限定。
因此,根据目标图像的具体内容,图像识别模型输出的识别结果,可以包括一个以上的图像类型及每种图像类型对应的违规概率。
比如,对于某个目标图像,图像识别模型输出的识别结果可能为{露点:0.7,特写:0.2,性感:0.1}。或者,对于某个目标图像,图像识别模型输出的识别结果可能为{正常:0.1,计生用品:0.9}。
其中,图像识别模型的类型可以为任意类型的机器学习模型,比如可以为神经网络模型等,本公开对此不做限定。
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中图像类型、图像识别模型等的限定。
步骤103,根据图像类型及图像类型对应的违规概率,确定目标图像是否合规。
其中,根据图像类型及图像类型对应的违规概率,确定目标图像是否合规,可以采用多种判断方式。
比如,可以将违规概率最大的图像类型,作为目标图像的图像类型。如果目标图像的图像类型与设定的图像类型相同,则确定该图像违规,否则确定该图像合规。
举例来说,某个目标图像对应的图像类型及违规概率为{性感:0.7,特写:0.2,露点:0.1},则违规概率最大的图像类型是性感。当设定的图像类型为性感时,可以确定该图像违规,当设定的图像类型为其他时,可以确定该图像合规。
或者,可以将违规概率大于设定阈值的图像类型,作为目标图像的图像类型。如果目标图像的某个图像类型与设定的图像类型相同,则确定该图像违规,否则确定该图像合规。
举例来说,某个目标图像对应的图像类型及违规概率为{性感:0.6,特写:0.4},违规概率的设定阈值为0.3。当设定的图像类型为性感或特写时,可以确定该图像违规,当设定的图像类型为其他时,可以确定该图像合规。
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中确定目标图像是否合规的限定。
本公开实施例中,首先从直播视频中获取待识别的目标图像,然后将目标图像输入图像识别模型中,以获取目标图像对应的识别结果,其中,识别结果包括图像类型及图像类型对应的违规概率;最后根据图像类型及图像类型对应的违规概率,确定目标图像是否合规。本公开通过图像识别模型对目标图像的图像类型进行判断,进而根据图像类型对目标图像是否合规进行判断,实现了基于具体违规原因对直播内容的合规性进行判断,满足了合规性要求不同的地域的需求。
图2为本公开另一实施例所提供的直播内容的识别方法的流程示意图。如图2所示,该直播内容的识别方法可以包括以下步骤:
步骤201,获取多个训练数据对,其中,每个训练数据对中包括样本图像、样本图像对应的标注图像类型及对应的标注违规概率。
可以理解的是,训练数据是影响生成模型的准确性和可靠性的重要因素。因此,获取大量真实的样本图像对于模型的训练是十分重要的。
其中,样本图像,可以是直播场景下的任意图像。可以理解的是,为了保证训练成的模型具有识别各种不同类型的图像的能力,训练数据集中的样本图像可以包括多种类别的图像。
比如,当需要识别图像是否违规以及图像违规的类型时,可以首先确定多种图像类型,比如正常、性感、特写、露点、计生用品等等,本公开对此不做限定。
进而,可以对每种类型的图像标注图像类型以及违规概率。比如,对于正常的图像,标注图像类型可以为正常,标注违规概率可以为0.0。或者,对于性感类的图像,标注图像类型可以为性感,标注违规概率可以为1.0。或者,对于同时具备性感和特写属性的图像,标注图像类型可以为性感和特写,对应的标注违规概率分别为0.5和0.5。
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中的样本图像、标注图像类型、标注违规概率等的限定。
步骤202,将样本图像输入初始模型中,以获取初始模型输出的预测图像类型及对应的预测违规概率。
其中,初始模型,可以为任意预先构建的、未经任何训练的机器学习模型,比如神经网络模型等,本公开对此不做限定。
具体的,初始模型可以对样本图像进行特征提取、特征匹配等,以确定样本图像的图像类型和违规概率,并输出对应的预测图像类型及预测违规概率。
步骤203,根据标注图像类型与预测图像类型间的差异、及标注违规概率与预测违规概率间的差异,对初始模型进行修正,以获取图像识别模型。
其中,可以根据初始模型的误差函数,确定标注图像类型与预测图像类型间的差异,以及标注违规概率与预测违规概率间的差异。然后基于误差,对初始模型进行反向传播训练,以得到图像识别模型。
比如,可以先根据标注图像类型与预测图像类型间的差异对初始模型进行修正,然后根据标注违规概率与预测违规概率间的差异对初始模型进行修正,最终得到图像识别模型。
或者,可以先根据标注违规概率与预测违规概率间的差异对初始模型进行修正,然后根据标注图像类型与预测图像类型间的差异对初始模型进行修正,最终得到图像识别模型。
或者,可以同时根据标注图像类型与预测图像类型间的差异,以及标注违规概率与预测违规概率间的差异,对初始模型进行修正,最终得到图像识别模型。
步骤204,从直播视频中获取待识别的目标图像。
步骤205,将目标图像输入图像识别模型中,以获取目标图像对应的识别结果,其中,识别结果包括图像类型及图像类型对应的违规概率。
其中,步骤204-步骤205的具体实现方式,可以参照本公开其他实施例的详细描述,在此不再赘述。
步骤206,响应于图像类型中未包括目标图像类型,确定目标图像合规。
其中,根据不同的地域对直播内容的违规定义,可以确定不同地域的目标图像类型。
比如,对于A地区,目标图像类型可以为露点。对于B地区,目标图像类型可以为性感。
需要说明的是,图像识别模型输出的识别结果可以包括一种或多种图像类型。预先设定的目标图像类型也可以包括一种或多种图像类型。
当识别结果中没有目标图像类型时,可以确定该目标图像合规。当识别结果有一种以上属于目标图像类型时,可以进入以下步骤。
步骤207,响应于图像类型中包括目标图像类型,且目标图像类型对应的违规概率小于设定阈值,确定目标图像合规。
步骤208,响应于图像类型中包括目标图像类型,且目标图像类型对应的违规概率大于等于设定阈值,确定目标图像违规。
比如,某个目标图像对应的图像类型及违规概率为{性感:0.6,露点:0.4}。目标图像类型包括露点、特写,违规概率的设定阈值为0.3。由于目标图像对应的图像类型中包括露点,且其违规概率大于设定阈值,因此可以确定该图像违规。
或者,某个目标图像对应的图像类型及违规概率为{正常:0.6,性感:0.2,露点:0.2}。目标图像类型包括露点、特写,违规概率的设定阈值为0.3。目标图像对应的图像类型中包括露点,但其违规概率小于设定阈值,因此可以确定该图像合规。
需要说明的是,上述示例只是举例说明,不能作为对本公开实施例中的目标图像类型、违规概率等的限定。
步骤209,获取目标图像对应的参考图像类型及对应的参考违规概率。
需要说明的是,图像识别模型输出的识别结果可能包括误检、漏检等情况。比如,将违规图像识别为合规图像。或者,将合规图像识别为违规图像。
因此,为了进一步提高图像识别模型的准确度,可以人工复核图像识别模型的识别结果。当图像识别模型将违规图像识别为合规图像,或者将合规图像识别为违规图像时,可以对识别错误的目标图像重新标注参考图像类型及对应的参考违规概率。
步骤210,将目标图像输入图像识别模型中,以获取图像识别模型输出的候选图像类型及对应的候选违规概率。
其中,获取图像识别模型输出的候选图像类型及对应的候选违规概率的具体实现方式,可以参照上述获取初始模型输出的预测图像类型及对应的预测违规概率的详细描述,在此不再赘述。
步骤211,根据参考图像类型与候选图像类型间的差异、及参考违规概率与候选违规概率间的差异,对图像识别模型进行修正,以优化图像识别模型。
其中,优化图像识别模型的具体实现方式,可以参照上述获取图像识别模型的详细描述,在此不再赘述。
本公开实施例中,对图像识别模型识别错误的目标图像,重新标注参考图像类型及对应的参考违规概率,并加入训练样本中,对图像识别图像进行优化训练,改善了模型的识别效果,提高了模型识别的准确率。
为了实现上述实施例,本公开还提出一种直播内容的识别装置。
图3为本公开实施例所提供的直播内容的识别装置的结构示意图。
如图3所示,该直播内容的识别装置100可以包括:第一获取模块110、第二获取模块120、第一确定模块130。
其中,第一获取模块110,用于从直播视频中获取待识别的目标图像。
第二获取模块120,用于将目标图像输入图像识别模型中,以获取目标图像对应的识别结果,其中,识别结果包括图像类型及图像类型对应的违规概率。
第一确定模块130,用于根据图像类型及图像类型对应的违规概率,确定目标图像是否合规。
本公开实施例中的上述各模块的功能及具体实现原理,可参照上述各方法实施例,此处不再赘述。
本公开实施例的直播内容的识别装置,首先从直播视频中获取待识别的目标图像,然后将目标图像输入图像识别模型中,以获取目标图像对应的识别结果,其中,识别结果包括图像类型及图像类型对应的违规概率;最后根据图像类型及图像类型对应的违规概率,确定目标图像是否合规。本公开通过图像识别模型对目标图像的图像类型进行判断,进而根据图像类型对目标图像是否合规进行判断,实现了基于具体违规原因对直播内容的合规性进行判断,满足了合规性要求不同的地域的需求。
在一种可能的实现方式中,第一确定模块130包括:
第一确定单元,用于响应于图像类型中未包括目标图像类型,确定目标图像合规;
第二确定单元,用于响应于图像类型中包括目标图像类型,且目标图像类型对应的违规概率小于设定阈值,确定目标图像合规;
第三确定单元,用于响应于图像类型中包括目标图像类型,且目标图像类型对应的违规概率大于等于设定阈值,确定目标图像违规。
在一种可能的实现方式中,该装置还包括:
第三获取模块,用于获取多个训练数据对,其中,每个训练数据对中包括样本图像、样本图像对应的标注图像类型及对应的标注违规概率;
第四获取模块快,用于将样本图像输入初始模型中,以获取初始模型输出的预测图像类型及对应的预测违规概率;
第五获取模块,用于根据标注图像类型与预测图像类型间的差异、及标注违规概率与预测违规概率间的差异,对初始模型进行修正,以获取图像识别模型。
在一种可能的实现方式中,该装置还包括:
第六获取模块,用于获取目标图像对应的参考图像类型及对应的参考违规概率;
第七获取模块,用于将目标图像输入图像识别模型中,以获取图像识别模型输出的候选图像类型及对应的候选违规概率;
优化模块,用于根据参考图像类型与候选图像类型间的差异、及参考违规概率与候选违规概率间的差异,对图像识别模型进行修正,以优化图像识别模型。
在一种可能的实现方式中,第一获取模块110用于:
按照设定频率从直播间的视频流中截取目标图片。
本公开实施例中的上述各模块的功能及具体实现原理,可参照上述各方法实施例,此处不再赘述。
本公开实施例的直播内容的识别装置,对图像识别模型识别错误的目标图像,重新标注参考图像类型及对应的参考违规概率,并加入训练样本中,对图像识别图像进行优化训练,改善了模型的识别效果,提高了模型识别的准确率。
为了实现上述实施例,本公开还提出一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开前述实施例提出的直播内容的识别方法。
为了实现上述实施例,本公开还提出一种非临时性计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现如本公开前述实施例提出的直播内容的识别方法。
为了实现上述实施例,本公开还提出一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本公开前述实施例提出的直播内容的识别方法。
图4示出了适于用来实现本公开实施方式的示例性计算机设备的框图。图4显示的计算机设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
本公开的技术方案,首先从直播视频中获取待识别的目标图像,然后将目标图像输入图像识别模型中,以获取目标图像对应的识别结果,其中,识别结果包括图像类型及图像类型对应的违规概率;最后根据图像类型及图像类型对应的违规概率,确定目标图像是否合规。本公开通过图像识别模型对目标图像的图像类型进行判断,进而根据图像类型对目标图像是否合规进行判断,实现了基于具体违规原因对直播内容的合规性进行判断,满足了合规性要求不同的地域的需求。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种直播内容的识别方法,其特征在于,包括:
从直播视频中获取待识别的目标图像;
将所述目标图像输入图像识别模型中,以获取所述目标图像对应的识别结果,其中,所述识别结果包括图像类型及所述图像类型对应的违规概率;
根据所述图像类型及所述图像类型对应的违规概率,确定所述目标图像是否合规。
2.如权利要求1所述的方法,其特征在于,所述根据所述图像类型及所述图像类型对应的违规概率,确定所述目标图像是否合规,包括:
响应于所述图像类型中未包括目标图像类型,确定所述目标图像合规;
响应于所述图像类型中包括所述目标图像类型,且所述目标图像类型对应的违规概率小于设定阈值,确定所述目标图像合规;
响应于所述图像类型中包括所述目标图像类型,且所述目标图像类型对应的违规概率大于等于设定阈值,确定所述目标图像违规。
3.如权利要求1所述的方法,其特征在于,在所述将所述目标图像输入图像识别模型中之前,还包括:
获取多个训练数据对,其中,每个所述训练数据对中包括样本图像、所述样本图像对应的标注图像类型及对应的标注违规概率;
将所述样本图像输入初始模型中,以获取所述初始模型输出的预测图像类型及对应的预测违规概率;
根据所述标注图像类型与所述预测图像类型间的差异、及所述标注违规概率与所述预测违规概率间的差异,对所述初始模型进行修正,以获取所述图像识别模型。
4.如权利要求1所述的方法,其特征在于,在所述根据多种所述图像类型及每种所述图像类型对应的违规概率,确定所述目标图像是否合规之后,还包括:
获取所述目标图像对应的参考图像类型及对应的参考违规概率;
将所述目标图像输入所述图像识别模型中,以获取所述图像识别模型输出的候选图像类型及对应的候选违规概率;
根据所述参考图像类型与所述候选图像类型间的差异、及所述参考违规概率与所述候选违规概率间的差异,对所述图像识别模型进行修正,以优化所述图像识别模型。
5.如权利要求1-4任一项所述的方法,其特征在于,所述从直播视频中获取待识别的目标图像,包括:
按照设定频率从直播间的视频流中截取所述目标图像。
6.一种直播内容的识别装置,其特征在于,包括:
第一获取模块,用于从直播视频中获取待识别的目标图像;
第二获取模块,用于将所述目标图像输入图像识别模型中,以获取所述目标图像对应的识别结果,其中,所述识别结果包括图像类型及所述图像类型对应的违规概率;
第一确定模块,用于根据所述图像类型及所述图像类型对应的违规概率,确定所述目标图像是否合规。
7.如权利要求6所述的装置,其特征在于,所述第一确定模块包括:
第一确定单元,用于响应于所述图像类型中未包括目标图像类型,确定所述目标图像合规;
第二确定单元,用于响应于所述图像类型中包括所述目标图像类型,且所述目标图像类型对应的违规概率小于设定阈值,确定所述目标图像合规;
第三确定单元,用于响应于所述图像类型中包括所述目标图像类型,且所述目标图像类型对应的违规概率大于等于设定阈值,确定所述目标图像违规。
8.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时,实现如权利要求1-5中任一所述的直播内容的识别方法。
9.一种计算机可读存储介质,存储有计算机指令,其特征在于,所述计算机指令被处理器执行时实现如权利要求1-5中任一所述的直播内容的识别方法。
10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令在被处理器执行时实现如权利要求1-5中任一所述的直播内容的识别方法。
CN202210324058.6A 2022-03-29 2022-03-29 直播内容的识别方法、装置、计算机设备及存储介质 Pending CN114639056A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210324058.6A CN114639056A (zh) 2022-03-29 2022-03-29 直播内容的识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210324058.6A CN114639056A (zh) 2022-03-29 2022-03-29 直播内容的识别方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114639056A true CN114639056A (zh) 2022-06-17

Family

ID=81950794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210324058.6A Pending CN114639056A (zh) 2022-03-29 2022-03-29 直播内容的识别方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114639056A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116758359A (zh) * 2023-08-16 2023-09-15 腾讯科技(深圳)有限公司 图像识别方法、装置及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116758359A (zh) * 2023-08-16 2023-09-15 腾讯科技(深圳)有限公司 图像识别方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN107330023B (zh) 基于关注点的文本内容推荐方法和装置
CN108460098B (zh) 信息推荐方法、装置和计算机设备
CN108182246B (zh) 敏感词检测过滤方法、装置和计算机设备
CN109376256B (zh) 图像搜索方法及装置
CN110381368A (zh) 视频封面生成方法、装置及电子设备
CN116433559A (zh) 产品外观缺陷检测方法、电子设备及存储介质
CN112149570B (zh) 多人活体检测方法、装置、电子设备及存储介质
CN110826646A (zh) 机器人视觉测试方法、装置、存储介质及终端设备
CN114650447B (zh) 一种确定视频内容异常程度的方法、装置及计算设备
CN112559341A (zh) 一种画面测试方法、装置、设备及存储介质
CN110475139B (zh) 一种视频字幕的遮挡方法、装置、存储介质及电子设备
CN113255516A (zh) 活体检测方法、装置和电子设备
CN114639056A (zh) 直播内容的识别方法、装置、计算机设备及存储介质
US10631050B2 (en) Determining and correlating visual context on a user device with user behavior using digital content on the user device
CN110298302A (zh) 一种人体目标检测方法及相关设备
CN107071553B (zh) 一种修改视频语音的方法、装置和计算机可读存储介质
CN114359160A (zh) 一种屏幕的检测方法、装置、电子设备及存储介质
CN113780163A (zh) 一种页面加载时间的检测方法、装置、电子设备及介质
CN109558505A (zh) 视觉搜索方法、装置、计算机设备及存储介质
CN110647826B (zh) 商品训练图片的获取方法、装置、计算机设备和存储介质
CN117058421A (zh) 基于多头模型的图像检测关键点方法、系统、平台及介质
CN111832354A (zh) 目标对象年龄识别方法、装置及电子设备
CN110069997A (zh) 场景分类方法、装置及电子设备
CN114842476A (zh) 水印检测方法及装置、模型训练方法及装置
WO2021120589A1 (zh) 用于3d图像的异常图像筛查方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination