CN113807410B

CN113807410B - 图像识别方法、装置以及电子设备

Info

Publication number: CN113807410B
Application number: CN202110996488.8A
Authority: CN
Inventors: 张欢
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2023-09-05
Anticipated expiration: 2041-08-27
Also published as: CN113807410A

Abstract

本公开提供了一种图像识别方法、装置以及电子设备，涉及人工智能领域，尤其涉及图像技术领域。具体实现方案为：获取待识别的动态图像，并从待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，目标帧图像为动态图像，从而获取目标帧图像的帧图像信息，其中，帧图像信息至少包括尺寸信息以及区域占比信息，区域占比信息表征待识别的动态图像中的不同区域在待识别的动态图像中的比例，进而根据帧图像信息对待识别的动态图像进行识别，得到识别结果。本公开至少解决了现有技术中，在对动态图像进行识别时存在识别准确度低的问题。

Description

图像识别方法、装置以及电子设备

技术领域

本公开涉及人工智能领域，具体而言，涉及一种图像识别方法、装置以及电子设备。

背景技术

随着人工智能的发展，近些年来出现了一种利用动态图像进行作弊，以便绕开审核的现象，并最终在移动终端设备上展示出包含有不良信息的作弊内容。

其中，作弊所采用的动态图像的长度通常很长，因此在非移动终端设备上只能展示出部分跳动的内容并进行审核。例如，平台审核图像时审核的是最后一帧图像，当最后一帧图像是正常内容时，便会通过平台审核。而机器审核时虽然是审核第一帧图像，但是由于接口对动态图像格式不兼容，因此不会区分第一帧图像的格式，统一当成静态图像进行审核，同时由于动态图像的长度很长，作弊内容很小，从而机器审核也无法准确识别出作弊内容。

发明内容

本公开提供了一种图像识别方法、装置以及电子设备，以至少解决现有技术中，在对动态图像进行识别时存在识别准确度低的问题。

根据本公开的一方面，提供了一种图像识别方法，包括：获取待识别的动态图像，并从待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，目标帧图像为动态图像，从而获取目标帧图像的帧图像信息，其中，帧图像信息至少包括尺寸信息以及区域占比信息，区域占比信息表征待识别的动态图像中的不同区域在待识别的动态图像中的比例，进而根据帧图像信息对待识别的动态图像进行识别，得到识别结果。

进一步地，图像识别方法还包括：在从待识别的动态图像所包含的多帧图像中确定目标帧图像之前，对待识别的动态图像进行解析，得到待识别的动态图像对应的二进制数据流，并在二进制数据流中的预设字段对应的数据为预设数据时，确定待识别的动态图像的图像格式为第一预设格式，从而在二进制数据流中的预设字段对应的数据为其他数据时，确定待识别的动态图像的图像格式为第二预设格式，其中，其他数据为除预设数据之外的数据，第一预设格式不同于第二预设格式。

进一步地，图像识别方法还包括：在待识别的动态图像的图像格式为第一预设格式时，对待识别的动态图像进行拆解处理，得到多帧图像，并按照时间顺序从多帧图像中获取第一帧图像，从而确定第一帧图像为目标帧图像。

进一步地，图像识别方法还包括：在获取目标帧图像的帧图像信息之前，对目标帧图像进行图像解析，得到解析结果，并根据解析结果确定目标帧图像的图像格式，其中，目标帧图像的图像格式至少包括第一预设格式和第二预设格式。

进一步地，图像识别方法还包括：在目标帧图像的图像格式为第一预设格式时，从解析结果中获取目标帧图像的尺寸信息以及目标帧图像的区域占比信息。

进一步地，图像识别方法还包括：根据尺寸信息确定目标帧图像的宽度与高度的宽高比，并根据宽高比对待识别的动态图像进行识别，得到初始识别结果，从而基于区域占比信息对初始识别结果进行识别，得到识别结果。

进一步地，图像识别方法还包括：在宽高比大于或等于第一阈值时，确定待识别的动态图像为候选图像，并在宽高比小于第一阈值时，确定待识别的动态图像为正常图像。

进一步地，图像识别方法还包括：在待识别的动态图像为候选图像时，获取待识别的动态图像中的区域占比信息，并从区域占比信息中确定无效区域占比，从而在无效区域占比大于或等于第二阈值时，确定待识别的动态图像为异常图像，并在无效区域占比小于第二阈值时，确定待识别的动态图像为正常图像。

进一步地，图像识别方法还包括：对待识别的动态图像像进行边缘检测，得到第一检测结果，并对待识别的动态图像所包含的像素进行统计，得到第二检测结果，从而根据第一检测结果和/或第二检测结果确定待识别的动态图像中的有效区域和无效区域，进而根据有效区域在待识别的动态图像中的第一面积以及无效区域在待识别的动态图像中的第二面积，得到区域占比信息。

进一步地，图像识别方法还包括：在根据帧图像信息对待识别的动态图像进行识别，得到识别结果之后，在待识别的动态图像为异常图像时，对发送待识别的动态图像的客户端进行封禁处理，和/或，删除待识别的动态图像。

进一步地，图像识别方法还包括：在获取待识别的动态图像之后，对待识别的动态图像进行初始检测，得到初始检测结果，并在初始检测结果满足如下至少之一时，确定待识别的动态图像为异常图像：下载待识别的动态图像失败；展示待识别的动态图像的部分内容；待识别的动态图像的长度和宽度的长宽比大于或等于第三阈值。

根据本公开的一方面，还提供了一种图像识别装置，包括：第一获取模块，用于获取待识别的动态图像；确定模块，用于从待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，目标帧图像为动态图像；第二获取模块，用于获取目标帧图像的帧图像信息，其中，帧图像信息至少包括尺寸信息以及区域占比信息，区域占比信息表征待识别的动态图像中的不同区域在待识别的动态图像中的比例；识别模块，用于根据帧图像信息对待识别的动态图像进行识别，得到识别结果。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述的图像识别方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行上述的图像识别方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现上述的图像识别方法。

在本公开中，采用对动态图像进行拆帧，并识别目标帧图像格式、尺寸信息以及区域占比信息的方式，通过获取待识别的动态图像，并从待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，目标帧图像为动态图像，从而获取目标帧图像的帧图像信息，其中，帧图像信息至少包括尺寸信息以及区域占比信息，区域占比信息表征待识别的动态图像中的不同区域在待识别的动态图像中的比例，进而根据帧图像信息对待识别的动态图像进行识别，得到识别结果。

在上述过程中，由于本公开在获取到待识别的动态图像后，会对动态图像进行拆帧，从而确定多帧图像中是否存在格式为动态图像的目标帧图像，因此，当待识别的动态图像中嵌套有其他的动态图像时，本公开可以实现准确识别，避免了由于将多帧图像都视为静态图像，导致的识别不准确的问题。另外，由于本公开对目标帧图像的尺寸信息以及区域占比信息进行了进一步分析，因此，通过判断尺寸信息可确定目标帧图像是否为长度较长的图像，通过判断区域占比信息可确定目标帧图像中无效区域在待识别的动态图像中的比例，从而当目标帧图像为长度较长并且无效区域占比过大的图像时，可确定待识别的动态图像中隐藏有作弊内容，解决了现有技术中，在对动态图像进行识别时存在识别准确度低的问题。

由此可见，本公开所提供的方案达到了提高审核动态图像准确度的目的，从而解决了现有技术中，在对动态图像进行识别时存在识别准确度低的问题，进而实现了降低不良信息传播的风险的效果。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开的一种图像识别方法流程图；

图2是根据本公开的一种图像识别装置示意图；

图3是用来实现本公开实施例的图像识别方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本公开实施例，提供了一种图像识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

此外，还需要说明的是，图像识别系统可作为本公开实施例所提供方法的执行主体，其中，图像识别系统可对于图像进行识别以及审核，图像识别系统可运行在电子设备上，电子设备包括但不限于：笔记本计算机、台式计算机、服务器、智能便携式佩戴设备、智能手机以及智能平板等设备。

图1是根据本公开实施例的图像识别方法的流程图，如图1所示，该方法包括如下步骤：

步骤S102，获取待识别的动态图像。

在一种可选的实施例中，动态图像可以是GIF(Graphics Interchange Format,图形交换格式)格式的图像，其中，动态图像可以由多帧图像组成，一个动态图像中还可以嵌套有另外一个动态图像，实现多层动态图像嵌套的场景。另外，待识别的动态图像的来源包括但不限于：用户在终端设备上上传动态图像的文件，提交发送触发图像识别系统获取待识别的动态图像；用户将动态图像上传到内容平台后，由内容平台进行部分过滤后的待识别的动态图像。

步骤S104，从待识别的动态图像所包含的多帧图像中确定目标帧图像。

在一种可选的实施例中，目标帧图像为动态图像。待识别的动态图像由多帧图像组成，图像识别系统可对待识别的动态图像进行拆解处理，从而得到多帧图像，并且按照时间顺序对多帧图像进行排序，获取第一帧图像，将第一帧图像确定为目标帧图像。

需要注意到的是，在上述过程中，由于图像识别系统在获取到待识别的动态图像后，会对动态图像进行拆解处理，从而确定多帧图像中是否存在格式为动态图像的目标帧图像，因此，当待识别的动态图像中嵌套有其他的动态图像时，图像识别系统可以实现准确识别，避免了由于将多帧图像都视为静态图像，导致的识别不准确的问题。

步骤S106，获取目标帧图像的帧图像信息。

在一种可选的实施例中，帧图像信息至少包括尺寸信息以及区域占比信息，区域占比信息表征待识别的动态图像中的不同区域在待识别的动态图像中的比例。图像识别系统在得到目标帧图像后，判断目标帧图像的尺寸信息，其中，尺寸信息至少包括：目标帧图像的宽度、高度以及宽高比。另外，对于区域占比信息的获取方式，图像设备系统可对待识别的动态图像进行水平方向或者竖直方向的边缘检测，并统计待识别的动态图像的颜色像素的分布占比比例，从而得到待识别的动态图像中的不同区域在待识别的动态图像中的比例，不同区域可归类为无效区域以及有效区域，通过计算两种区域的面积，确定无效区域占比，得到区域占比信息。

需要说明的是，在上述过程中，由于图像识别系统对目标帧图像的尺寸信息以及区域占比信息进行了进一步分析，因此，通过判断尺寸信息可确定目标帧图像是否为长度较长的图像，通过判断区域占比信息可确定目标帧图像中无效区域在待识别的动态图像中的比例，从而当目标帧图像为长度较长并且无效区域占比过大的图像时，可确定待识别的动态图像中隐藏有作弊内容，解决了现有技术中，在对动态图像进行识别时存在识别准确度低的问题，实现了降低不良信息通过动态图像传播的风险的效果。

步骤S108，根据帧图像信息对待识别的动态图像进行识别，得到识别结果。

在一种可选的实施例中，图像识别系统根据帧图像信息可对待识别的动态图像进行识别，例如，图像识别系统可以判断帧图像信息中的宽高比的信息，当宽高比大于或者等于第一阈值时，则确定待识别的动态图像为长度较长的图像，存在作弊的风险，将待识别的动态图像作为候选图像进行进一步的识别，如果宽高比小于第一阈值时，则确定待识别的动态图像为正常图像。另外，在待识别的动态图像为候选图像时，图像识别系统可从区域占比信息中获取无效区域占比，当无效区域占比大于或等于第二阈值时，确定待识别的动态图像为存在作弊内容的异常图像，当无效区域占比小于第二阈值时，确定待识别的动态图像为正常图像。

可选的，上述第一阈值与第二阈值可以自定义设置，例如，根据经验将第一阈值设置为10，将第二阈值设置为90％。

在上述过程中，由于根据帧图像信息中的尺寸信息可对待识别的动态图像的长度进行判断，从而实现了筛选出长度较长的待识别的动态图像作为候选图像，并根据区域占比信息进一步对长度较长存在作弊风险的候选图像进行分析，进而将筛选出无效区域占比过大的动态图像确定为异常图像，实现了对异常图像准确识别并且拦截的效果。

基于上述步骤S102至S108所限定的方案，可以获知，在本公开实施例中，采用对动态图像进行拆帧，并识别目标帧图像格式、尺寸信息以及区域占比信息的方式，通过获取待识别的动态图像，并从待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，目标帧图像为动态图像，从而获取目标帧图像的帧图像信息，其中，帧图像信息至少包括尺寸信息以及区域占比信息，区域占比信息表征待识别的动态图像中的不同区域在待识别的动态图像中的比例，进而根据帧图像信息对待识别的动态图像进行识别，得到识别结果。

容易注意到的是，在上述过程中，由于本公开在获取到待识别的动态图像后，会对动态图像进行拆帧，从而确定多帧图像中是否存在格式为动态图像的目标帧图像，因此，当待识别的动态图像中嵌套有其他的动态图像时，本公开可以实现准确识别，避免了由于将多帧图像都视为静态图像，导致的识别不准确的问题。另外，由于本公开对目标帧图像的尺寸信息以及区域占比信息进行了进一步分析，因此，通过判断尺寸信息可确定目标帧图像是否为长度较长的图像，通过判断区域占比信息可确定目标帧图像中无效区域在待识别的动态图像中的比例，从而当目标帧图像为长度较长并且无效区域占比过大的图像时，可确定待识别的动态图像中隐藏有作弊内容，解决了现有技术中，在对动态图像进行识别时存在识别准确度低的问题。

在一种可选的实施例中，图像识别系统在从待识别的动态图像所包含的多帧图像中确定目标帧图像之前，对待识别的动态图像进行解析，得到待识别的动态图像对应的二进制数据流；在二进制数据流中的预设字段对应的数据为预设数据时，确定待识别的动态图像的图像格式为第一预设格式；在二进制数据流中的预设字段对应的数据为其他数据时，确定待识别的动态图像的图像格式为第二预设格式，其中，其他数据为除预设数据之外的数据，第一预设格式不同于第二预设格式。

可选的，在从待识别的动态图像所包含的多帧图像中确定目标帧图像之前，图像识别系统需对待识别的动态图像的格式进行判断，其中，上述预设字段可以为二进制数据流的前5个字节，预设数据可以为“GIF89a”或者“GIF87a”，第一预设格式可以为GIF格式。

可选的，图像识别系统通过解析待识别的动态图像，得到待识别的动态图像所对应的二进制数据流。图像识别系统进一步地解析二进制数据流的前5个字节，如果前5个字节信息为“GIF89a”或者“GIF87a”，分别对应的16进制信息为(47 49 46 38 39 61)或者(4749 46 38 37 61)，则可判断待识别的动态图像为GIF格式的动态图像，如果前5个字节信息不是“GIF89a”或者“GIF87a”，则可判断待识别的动态图像不是GIF格式的动态图像。

通过上述过程，图像识别系统对待识别的动态图像进行格式的判断，并筛选出GIF格式的动态图像进行下一步的识别处理，从而缩小了需要识别的动态图像的数量范围，有利于提高图像识别以及审核的效率。

在一种可选的实施例中，图像识别系统在待识别的动态图像的图像格式为第一预设格式时，对待识别的动态图像进行拆解处理，得到多帧图像，并按照时间顺序从多帧图像中获取第一帧图像，从而确定第一帧图像为目标帧图像。

可选的，当待识别的的动态图像的图像格式为GIF格式时，图像识别系统可使用图像拆解工具对待识别的动态图像进行拆解处理，从而得到多帧图像，例如，图像拆解工具可以为gifsicle工具，使用gifsicle工具将GIF动态图像拆解为多个GIF帧图像，并对每一个GIF帧图像进行分析。

进一步地，图像识别系统多帧图像按照时间顺序进行排序，从而得到第一帧图像，并且第一帧图像确定为目标帧图像，时间顺序可以是每一帧图像的生成时间的的顺序，生成时间越早的帧图像顺序越靠前，依次对多个帧图像进行排序。

需要注意到的是，由于通常情况下，一个动态图像里面的多个帧图像都是静态的图像，因此在现有技术的图像识别的过程中，在对动态图像进行拆解处理后，会默认将多帧图像保存为静态图像的格式，但是，当作弊内容以动态图像的格式隐藏在一个动态图像中，形成多层动态图像嵌套的格式时，现有技术便无法对作弊内容进行准确识别，而通过本公开实施例的上述过程，对拆解后的多帧图像进行格式的进一步分析，从而识别出多层动态图像嵌套的格式，实现了提高图像识别准确度的效果。

在一种可选的实施例中，图像识别系统在获取目标帧图像的帧图像信息之前，对目标帧图像进行图像解析，得到解析结果，并根据解析结果确定目标帧图像的图像格式，其中，目标帧图像的图像格式至少包括第一预设格式和第二预设格式。

可选的，图像识别系统对得到的目标帧图像进行图像解析，例如，图像识别系统单独对目标帧图像对应的二进制数据流的前5个字节进行解析，当前5个字节信息为“GIF89a”或者“GIF87a”时，确定目标帧图像为GIF格式，如果前5个字节信息不是“GIF89a”或者“GIF87a”时，确定目标帧图像不是GIF格式。

在上述过程中，通过确定目标帧图像的图像格式，从而识别出待识别的动态图像是否存在多层动态图像嵌套的格式，避免了由于作弊内容以GIF格式隐藏在动态图像中，而无法准确识别并且拦截的问题。

在一种可选的实施例中，图像识别系统在目标帧图像的图像格式为第一预设格式时，从解析结果中获取目标帧图像的尺寸信息以及目标帧图像的区域占比信息。

可选的，当目标帧图像为GIF格式时，图像识别系统还可从解析结果中获取目标帧图像的尺寸信息以及区域占比信息。其中，尺寸信息至少包括：目标帧图像的宽度、高度以及宽高比。区域占比信息至少包括：有效区域的面积、无效区域的面积以及无效区域占比等信息。

在上述过程中，通过获取目标帧图像的尺寸信息以及区域占比信息，可获取目标帧图像的宽高比以及无效区域占比，进而判断目标帧图像是否为长度较长的图像以及是否存在故意隐藏有效内容的风险，实现了进一步提高图像识别审核准确度的效果。

在一种可选的实施例中，图像识别系统根据尺寸信息确定目标帧图像的宽度与高度的宽高比，并根据宽高比对待识别的动态图像进行识别，得到初始识别结果，从而基于区域占比信息对初始识别结果进行识别，得到识别结果。

可选的，尺寸信息至少包括：目标帧图像的宽度信息、目标帧图像的高度信息以及目标帧图像的宽度与高度的宽高比，图像识别系统通过判断目标帧图像的宽高比是否大于预设的第一阈值，可确定待识别的动态图像是否为长度较长的图像，例如，目标帧图像的宽高比为：0 500*10000，而正常的非移动端设备(例如，笔记本电脑)的显示器的宽度和高度为4000*4000，因此，可以得知，待识别的动态图像是一个长度较长的图像，例如，一个竖条形式的图像，并且由于超过了正常非移动端设备的显示器的最大高度，所以是一种缩放显示，而在移动端设备上(例如，智能手机)上，则只会显示有效内容区域。

其中，确定目标帧图像的宽度与高度的宽高比，并根据宽高比对待识别的动态图像进行识别，得到初始识别结果的过程，可通过以下代码实现：

(base)root@sz-advbox-gru-test00://mnt/zhanghuan/tieba/width-height-exption#gifsicle–I 000001.jpg

*000001.jpg 2images

logical screen 4000*4000

global color table[256]

background 0

loop forever

+image#0 500*10000

local color table[256]

disposal background delay 0.10s

+image#1 500*10000

local color table[256]

disposal background delay 0.10s

(base)root@sz-advbox-gru-test00://mnt/zhanghuan/tieba/width-height-exption#gifsicle–e 000001.jpg

gifsicle:000001.jpg.000:warning:background color not in colormap

gifsicle:000001.jpg.001:warning:background color not in colormap

(base)root@sz-advbox-gru-test00://mnt/zhanghuan/tieba/width-height-exption#file 000001.jpg.000

000001.jpg.000:GIF image data,version 89a,4000*10000

(base)root@sz-advbox-gru-test00://mnt/zhanghuan/tieba/width-height-exption#file 000001.jpg.001

000001.jpg.001:GIF image data,version 89a,4000*10000

需要注意到的是，在上述过程中，通过判断目标帧图像的宽高比可确定待识别的动态图像是否为长度较长的图像，从而得到初始识别结果，由于当待识别的动态图像为长度较长的图像时，可能存在作弊内容，因此，将长度较长的待识别的动态图像筛选出来，以便后续进行无效区域占比的分析，缩小了待识别的动态图像的数量范围，实现了提高图像审核效率以及准确度的效果。

在一种可选的实施例中，图像识别系统在宽高比大于或等于第一阈值时，确定待识别的动态图像为候选图像，并在宽高比小于第一阈值时，确定待识别的动态图像为正常图像。

可选的，图像识别系统中可自定义设置第一阈值，例如，将第一阈值设置为10，如果图像识别系统识别到目标帧图像的宽高比为15时，说明目标帧图像为长度较长的图像，而待识别的动态图像也是长度较长的图像，由于长度较长的图像存在作弊的风险，因此将对应的待识别的动态图像确定为候选图像。如果图像识别系统识别到目标帧图像的宽高比为8时，说明待识别的动态图像不是长度较长的图像，不存在作弊的风险，因此可将对应的待识别的动态图像确定为正常图像。

在上述过程中，通过设置预设第一阈值，根据目标帧图像的宽高比对待识别的动态图像的长度进行判断，从而对长度较长的动态图像进行进一步地分析处理，避免了有作弊风险的动态图像绕开审核的问题，实现了自动进行图像审核，提高审核效率的效果。

在一种可选的实施例中，图像识别系统在待识别的动态图像为候选图像时，获取待识别的动态图像中的区域占比信息，并从区域占比信息中确定无效区域占比，从而在无效区域占比大于或等于第二阈值时，确定待识别的动态图像为异常图像，在无效区域占比小于第二阈值时，确定待识别的动态图像为正常图像。

可选的，当述待识别的动态图像为候选图像时，并不能确定动态图像一定是异常图像，因此图像识别系统会获取待识别的动态图像中的区域占比信息，并从区域占比信息中确定无效区域占比，当无效区域占比大于或等于第二阈值时，确定待识别的动态图像为异常图像，其中，第二阈值可在图像识别系统中自定义设置，例如，将第二阈值设置为90％，图像识别系统通过颜色色域的方法统计待识别的动态图像中的色彩分布，如果无效区域占比大于或等于90％，则确定待识别的动态图像存在作弊内容，为异常图像，如果无效区域占比小于90％，则确定待识别的动态图像不存在作弊内容，为正常图像。

需要注意到的是，在一个长度较长的图像中，如果无效区域占比很大，而有效区域占比较小，则说明该图像在刻意隐藏有效内容，但是通常来说，在图像中展示有效内容才是图像制作的主要目的，因此，刻意隐藏有效内容的目的是为了绕开审核过程。通过上述过程，将无效区域占比大于第二阈值的待识别的动态图像确定为异常图像，可以有效拦截含有不良信息的动态图像，实现了降低不良信息通过动态图像传播的风险的效果。

在一种可选的实施例中，图像识别系统对待识别的动态图像进行边缘检测，得到第一检测结果，并对待识别的动态图像所包含的像素进行统计，得到第二检测结果，从而根据第一检测结果和/或第二检测结果确定待识别的动态图像中的有效区域和无效区域，进而根据有效区域在待识别的动态图像中的第一面积以及无效区域在待识别的动态图像中的第二面积，得到区域占比信息。

可选的，图像识别系统可通过颜色色域的方法对待识别的动态图像进行检测，边缘检测时可通过水平方向或者竖直方向进行检测，像素统计时，可对颜色像素的分布进行统计，例如，通过边缘检测标识待识别的动态图像中亮暗变换明显的点，从而反映有效内容以及无效内容，检测过程包括：深度的不连续、表面方向的不连续、物质属性的变化以及场景照明变化。颜色像素统计可以是统计一行不同颜色的数量或者一列不同颜色的数量。

需要注意到的是，通过上述过程，利用边缘检测以及对动态图像所包含的像素进行统计，得到待识别的动态图像中的有效区域和无效区域，从而实现了提高识别动态图像中的无效区域占比的准确度的效果。

在一种可选的实施例中，图像识别系统在根据帧图像信息对待识别的动态图像进行识别，得到识别结果之后，在待识别的动态图像为异常图像时，对发送待识别的动态图像的客户端进行封禁处理，和/或，删除待识别的动态图像。

可选的，图像识别系统可将异常图像输送给审核平台，从而由审核平台对异常图像进行删除，或者封禁异常图像的上传账号，实现无缝接入现有审核流程，提高审核效率的效果。

在一种可选的实施例中，审核平台在获取待识别的动态图像之后，对待识别的动态图像进行初始检测，得到初始检测结果，在初始检测结果满足如下至少之一时，确定待识别的动态图像为异常图像：下载待识别的动态图像失败；展示待识别的动态图像的部分内容；待识别的动态图像的长度和宽度的长宽比大于或等于第三阈值。

可选的，审核平台在无法下载待识别的动态图像时，将待识别的动态图像确定为异常图像；审核平台检测到待识别的动态图像展示内容不全，只能展示部分内容时，将待识别的动态图像确定为异常图像；审核平台检测到待识别的动态图像的长宽比异常，超过正常范围时，将待识别的动态图像确定为异常图像，其中，第三阈值可根据经验进行自定义设置。另外，审核平台检测到待识别的动态图像与审核平台接口不兼容，产生报错时，可将待识别的动态图像确定为异常图像。

在上述过程中，通过审核平台预先进行初始检测，可缩小待识别的动态图像的数量范围，实现了提高识别效率的效果。

由于本公开在获取到待识别的动态图像后，会对动态图像进行拆帧，从而确定多帧图像中是否存在格式为动态图像的目标帧图像，因此，当待识别的动态图像中嵌套有其他的动态图像时，本公开可以实现准确识别，避免了由于将多帧图像都视为静态图像，导致的识别不准确的问题。另外，由于本公开对目标帧图像的尺寸信息以及区域占比信息进行了进一步分析，因此，通过判断尺寸信息可确定目标帧图像是否为长度较长的图像，通过判断区域占比信息可确定目标帧图像中无效区域在待识别的动态图像中的比例，从而当目标帧图像为长度较长并且无效区域占比过大的图像时，可确定待识别的动态图像中隐藏有作弊内容，解决了现有技术中，在对动态图像进行识别时存在识别准确度低的问题。

根据本公开实施例，还提供了一种图像识别装置实施例，其中，图2是根据本公开实施例的一种图像识别装置示意图，该装置包括：第一获取模块301，用于获取待识别的动态图像；确定模块303，用于从待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，目标帧图像为动态图像；第二获取模块305，用于获取目标帧图像的帧图像信息，其中，帧图像信息至少包括尺寸信息以及区域占比信息，区域占比信息表征待识别的动态图像中的不同区域在待识别的动态图像中的比例；识别模块307，用于根据帧图像信息对待识别的动态图像进行识别，得到识别结果。

需要说明的是，上述第一获取模块301、确定模块303、第二获取模块305以及识别模块307对应于上述实施例中的步骤S102至步骤S108，四个模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例所公开的内容。

可选的，图像识别装置还包括：解析模块、第一确定模块以及第二确定模块。其中，解析模块，用于对待识别的动态图像进行解析，得到待识别的动态图像对应的二进制数据流；第一确定模块，用于在二进制数据流中的预设字段对应的数据为预设数据时，确定待识别的动态图像的图像格式为第一预设格式；第二确定模块，用于在二进制数据流中的预设字段对应的数据为其他数据时，确定待识别的动态图像的图像格式为第二预设格式，其中，其他数据为除预设数据之外的数据，第一预设格式不同于第二预设格式。

可选的，上述确定模块还包括：拆解模块、第三获取模块以及第三确定模块。其中，拆解模块，用于在待识别的动态图像的图像格式为第一预设格式时，对待识别的动态图像进行拆解处理，得到多帧图像；第三获取模块，用于按照时间顺序从多帧图像中获取第一帧图像；第三确定模块，用于确定第一帧图像为目标帧图像。

可选的，图像识别装置还包括：第一解析模块以及第四确定模块。其中，第一解析模块，用于对目标帧图像进行图像解析，得到解析结果；第四确定模块，用于根据解析结果确定目标帧图像的图像格式，其中，目标帧图像的图像格式至少包括第一预设格式和第二预设格式。

可选的，上述第二获取模块还包括：第四获取模块，用于在目标帧图像的图像格式为第一预设格式时，从解析结果中获取目标帧图像的尺寸信息以及目标帧图像的区域占比信息。

可选的，上述识别模块还包括：第五确定模块、第一识别模块以及第五获取模块。其中，第五确定模块，用于根据尺寸信息确定目标帧图像的宽度与高度的宽高比；第一识别模块，用于根据宽高比对待识别的动态图像进行识别，得到初始识别结果；第五获取模块，用于基于区域占比信息对初始识别结果进行识别，得到识别结果。

可选的，图像识别装置还包括：第六确定模块以及第七确定模块。其中，第六确定模块，用于在宽高比大于或等于第一阈值时，确定待识别的动态图像为候选图像；第七确定模块，用于在宽高比小于第一阈值时，确定待识别的动态图像为正常图像。

可选的，图像识别装置还包括：第六获取模块、第八确定模块、第九确定模块以及第十确定模块。其中，第六获取模块，用于在待识别的动态图像为候选图像时，获取待识别的动态图像中的区域占比信息；第八确定模块，用于从区域占比信息中确定无效区域占比；第九确定模块，用于在无效区域占比大于或等于第二阈值时，确定待识别的动态图像为异常图像；第十确定模块，用于在无效区域占比小于第二阈值时，确定待识别的动态图像为正常图像。

可选的，图像识别装置还包括：第七获取模块、统计模块、第十一确定模块以及第八获取模块。其中，第七获取模块，用于对待识别的动态图像像进行边缘检测，得到第一检测结果；统计模块，用于对待识别的动态图像所包含的像素进行统计，得到第二检测结果；第十一确定模块，用于根据第一检测结果和/或第二检测结果确定待识别的动态图像中的有效区域和无效区域；第八获取模块，用于根据有效区域在待识别的动态图像中的第一面积以及无效区域在待识别的动态图像中的第二面积，得到区域占比信息。

可选的，图像识别装置还包括：处理模块，用于在待识别的动态图像为异常图像时，对发送待识别的动态图像的客户端进行封禁处理，和/或，删除待识别的动态图像。

可选的，图像识别装置还包括：检测模块、第十二确定模块。其中，检测模块，用于对待识别的动态图像进行初始检测，得到初始检测结果；第十二确定模块，用于在初始检测结果满足如下至少之一时，确定待识别的动态图像为异常图像：下载待识别的动态图像失败；展示待识别的动态图像的部分内容；待识别的动态图像的长度和宽度的长宽比大于或等于第三阈值。

根据本公开实施例的另一方面，还提供一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述实施例中的图像识别方法。

根据本公开实施例的另一方面，还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行上述实施例中的图像识别方法。

根据本公开实施例的另一方面，还提供一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现上述实施例中的图像识别方法。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

图3示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图3所示，设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如图像识别方法。例如，在一些实施例中，图像识别方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的图像识别方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像识别方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种图像识别方法，包括：

获取待识别的动态图像；

从所述待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，所述目标帧图像为动态图像；

获取所述目标帧图像的帧图像信息，其中，所述帧图像信息至少包括尺寸信息以及区域占比信息，所述区域占比信息表征所述待识别的动态图像中的不同区域在所述待识别的动态图像中的比例；

根据所述帧图像信息对所述待识别的动态图像进行识别，得到识别结果；

其中，根据所述帧图像信息对所述待识别的动态图像进行识别，得到识别结果，包括：根据所述尺寸信息确定所述目标帧图像的宽度与高度的宽高比；根据所述宽高比与所述待识别的动态图像进行识别，得到初始识别结果；基于所述区域占比信息对所述初始识别结果进行识别，得到所述识别结果，其中，所述识别结果用于表示待识别的所述动态图像为异常图像或正常图像。

2.根据权利要求1所述的方法，在从所述待识别的动态图像所包含的多帧图像中确定目标帧图像之前，所述方法还包括：

对所述待识别的动态图像进行解析，得到所述待识别的动态图像对应的二进制数据流；

在所述二进制数据流中的预设字段对应的数据为预设数据时，确定所述待识别的动态图像的图像格式为第一预设格式；

在所述二进制数据流中的预设字段对应的数据为其他数据时，确定所述待识别的动态图像的图像格式为第二预设格式，其中，所述其他数据为除所述预设数据之外的数据，所述第一预设格式不同于所述第二预设格式。

3.根据权利要求2所述的方法，其中，从所述待识别的动态图像所包含的多帧图像中确定目标帧图像，包括：

在所述待识别的动态图像的图像格式为所述第一预设格式时，对所述待识别的动态图像进行拆解处理，得到所述多帧图像；

按照时间顺序从所述多帧图像中获取第一帧图像；

确定所述第一帧图像为所述目标帧图像。

4.根据权利要求3所述的方法，在获取所述目标帧图像的帧图像信息之前，所述方法还包括：

对所述目标帧图像进行图像解析，得到解析结果；

根据所述解析结果确定所述目标帧图像的图像格式，其中，所述目标帧图像的图像格式至少包括所述第一预设格式和所述第二预设格式。

5.根据权利要求4所述的方法，其中，获取所述目标帧图像的帧图像信息，包括：

在所述目标帧图像的图像格式为所述第一预设格式时，从所述解析结果中获取所述目标帧图像的尺寸信息以及所述目标帧图像的区域占比信息。

6.根据权利要求1所述的方法，其中，根据所述宽高比对所述待识别的动态图像进行识别，得到初始识别结果，包括：

在所述宽高比大于或等于第一阈值时，确定所述待识别的动态图像为候选图像；

在所述宽高比小于所述第一阈值时，确定所述待识别的动态图像为正常图像。

7.根据权利要求6所述的方法，其中，基于所述区域占比信息对所述初始识别结果进行识别，得到所述识别结果，包括：

在所述待识别的动态图像为所述候选图像时，获取所述待识别的动态图像中的区域占比信息；

从所述区域占比信息中确定无效区域占比；

在所述无效区域占比大于或等于第二阈值时，确定所述待识别的动态图像为异常图像；

在所述无效区域占比小于所述第二阈值时，确定所述待识别的动态图像为所述正常图像。

8.根据权利要求7所述的方法，其中，获取所述待识别的动态图像中的区域占比信息，包括：

对所述待识别的动态图像进行边缘检测，得到第一检测结果；

对所述待识别的动态图像所包含的像素进行统计，得到第二检测结果；

根据所述第一检测结果和/或所述第二检测结果确定所述待识别的动态图像中的有效区域和无效区域；

根据所述有效区域在所述待识别的动态图像中的第一面积以及所述无效区域在所述待识别的动态图像中的第二面积，得到所述区域占比信息。

9.根据权利要求7所述的方法，在根据所述帧图像信息对所述待识别的动态图像进行识别，得到识别结果之后，所述方法还包括：

在所述待识别的动态图像为所述异常图像时，对发送所述待识别的动态图像的客户端进行封禁处理，和/或，删除所述待识别的动态图像。

10.根据权利要求1所述的方法，在获取待识别的动态图像之后，所述方法还包括：

对所述待识别的动态图像进行初始检测，得到初始检测结果；

在所述初始检测结果满足如下至少之一时，确定所述待识别的动态图像为异常图像：

下载所述待识别的动态图像失败；

展示所述待识别的动态图像的部分内容；

所述待识别的动态图像的长度和宽度的长宽比大于或等于第三阈值。

11.一种图像识别装置，包括：

第一获取模块，用于获取待识别的动态图像；

确定模块，用于从所述待识别的动态图像所包含的多帧图像中确定目标帧图像，其中，所述目标帧图像为动态图像；

第二获取模块，用于获取所述目标帧图像的帧图像信息，其中，所述帧图像信息至少包括尺寸信息以及区域占比信息，所述区域占比信息表征所述待识别的动态图像中的不同区域在所述待识别的动态图像中的比例；

识别模块，用于根据所述帧图像信息对所述待识别的动态图像进行识别，得到识别结果；

其中，所述识别模块用于通过如下步骤来根据所述帧图像信息对所述待识别的动态图像进行识别，得到识别结果：根据所述尺寸信息确定所述目标帧图像的宽度与高度的宽高比；根据所述宽高比与所述待识别的动态图像进行识别，得到初始识别结果；基于所述区域占比信息对所述初始识别结果进行识别，得到所述识别结果，其中，所述识别结果用于表示待识别的所述动态图像为异常图像或正常图像。

12. 一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至10中任一项所述的图像识别方法。

13.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1至10中任一项所述的图像识别方法。