CN112468792B - 图像识别方法、装置、电子设备及存储介质 - Google Patents
图像识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112468792B CN112468792B CN202011224753.2A CN202011224753A CN112468792B CN 112468792 B CN112468792 B CN 112468792B CN 202011224753 A CN202011224753 A CN 202011224753A CN 112468792 B CN112468792 B CN 112468792B
- Authority
- CN
- China
- Prior art keywords
- image data
- format
- image
- preset
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/64—Circuits for processing colour signals
- H04N9/67—Circuits for processing colour signals for matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本申请实施例公开了一种图像识别方法、装置、电子设备以及存储介质。所述方法包括:获取第一编码格式的图像数据;从所述第一编码格式的图像数据中获取预设区域的图像数据;将所述预设区域的图像数据转换为第二编码格式的图像数据;基于所述第二编码格式的图像数据进行图像识别操作。通过上述方法,不需要对所有的第一编码格式的图像数据进行图像数据转换,而只需要对预设区域的图像数据进行转换,在将预设区域的图像数据转换为第二编码格式的图像数据后,对该第二编码格式的图像数据进行图像识别,减少了图像识别的耗时,同时也减少了对系统资源的消耗。
Description
技术领域
本申请涉及图像识别领域,更具体地,涉及一种图像识别方法、装置、电子设备以及存储介质。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。相关的图像识别方法中,在对图像数据进行识别的过程中,需要消耗极大的系统资源。
发明内容
鉴于上述问题,本申请实施例提出了一种图像识别方法、装置、电子设备以及存储介质,以改善上述问题。
第一方面,本申请实施例提供了一种图像识别方法,所述方法包括:获取第一编码格式的图像数据;从所述第一编码格式的图像数据中获取预设区域的图像数据;将所述预设区域的图像数据转换为第二编码格式的图像数据;基于所述第二编码格式的图像数据进行图像识别操作。
第二方面,本申请实施例提供了一种图像识别装置,所述装置包括:第一数据获取单元,用于获取第一编码格式的图像数据;第二数据获取单元,用于从所述第一编码格式的图像数据中获取预设区域的图像数据;转换单元,用于将所述预设区域的图像数据转换为第二编码格式的图像数据;图像识别单元,用于基于所述第二编码格式的图像数据进行图像识别操作。
第三方面,本申请实施例提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行以实现上述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行上述的方法。
本申请实施例提供的一种图像识别方法、装置、电子设备以及存储介质,获取第一编码格式的图像数据,从第一编码格式的图像数据中获取预设区域的图像数据,然后将预设区域的图像数据转换为第二编码格式的图像数据,进而对第二编码格式的图像数据进行图像识别操作。通过上述方法,不需要对所有的第一编码格式的图像数据进行图像数据转换,而只需要对预设区域的图像数据进行转换,在将预设区域的图像数据转换为第二编码格式的图像数据后,对该第二编码格式的图像数据进行图像识别,减少了图像识别的耗时,同时也减少了对系统资源的消耗。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一实施例提出的一种图像识别方法的流程图;
图2示出了本申请另一实施例提出的一种图像识别方法的流程图;
图3示出了本申请另一实施例中提出的一种台标识别的应用场景的示意图;
图4示出了本申请另一实施例中提出的一种人脸识别的应用场景的示意图;
图5示出了本申请又一实施例提出的一种图像识别方法的流程图;
图6示出了本申请再一实施例中提出的一种图像识别方法的流程图;
图7示出了本申请一实施例提出的一种图像识别装置的结构框图;
图8示出了本申请实时中的用于执行根据本申请实施例的图像识别方法的电子设备的结构框图;
图9示出了本申请实时中的用于保存或者携带实现根据本申请实施例的图像识别方法的程序代码的存储单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在对图像数据进行处理时,经常需要将一种编码格式的图像数据转换为另一种编码格式的图像数据。比如,可以将YUV编码格式的图像数据转换为RGB编码格式的图像数据,其中,RGB和YUV都是色彩空间,用于表示颜色,两者可以相互转化。YUV中的“Y”表示明亮度,也就是灰阶值;而“U”和“V”表示的则是影像色彩及饱和度,用于指定像素的颜色。RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的。在将图像数据进行转换后,可以对转换后的图像数据进行图像处理,比如图像识别或者图像渲染等。
而发明人在对相关的图像识别方法的研究中发现,随着广播电视数字化、高清化技术应用的发展,通过摄像机等视频图像采集设备采集的实时高清图像数据文件非常大,因此,在相关的图像识别方式中,在对图像数据进行转换后,在对图像数据进行识别的过程中,因为需要对数据量非常大的图像数据进行转换识别,所以需要消耗极大的系统资源。
因此,发明人提出了本申请实施例中的获取第一编码格式的图像数据,从第一编码格式的图像数据中获取预设区域的图像数据,然后将预设区域的图像数据转换为第二编码格式的图像数据,进而对第二编码格式的图像数据进行图像识别操作,只需要对预设区域的图像数据进行转换,在将预设区域的图像数据转换为第二编码格式的图像数据后,对该第二编码格式的图像数据进行图像识别,减少了图像识别的耗时,同时也减少了对系统资源的消耗的图像识别的方法、装置、电子设备以及存储介质。
下面将结合附图具体描述本申请的各实施例。
请参阅图1,本申请实施例提供的一种图像识别方法,所述方法包括:
S110:获取第一编码格式的图像数据。
在本申请实施例中,所述第一编码格式的图像数据为一种基于应用于图像处理、传输领域的颜色编码方法进行编码得到的图像数据。比如,第一编码格式的图像数据可以为YUV编码格式的图像数据。并且,所述第一编码格式的图像数据可以为获取的一帧完整的YUV编码格式的图像数据。
作为一种方式,当检测到图像数据获取请求时,获取第一编码格式的图像数据。其中,所述图像数据获取请求中可以包括需要获取的指定帧的第一编码格式的图像数据的标识,进而在获取第一编码格式的图像数据时,可以根据图像数据的标识获取到指定帧的第一编码格式的图像数据。
可选的,图像数据的标识可以为在对第一编码格式的图像数据进行存储时,对第一编码格式的图像数据设置的标识。具体的,每存储一帧第一编码格式的图像数据时,为该帧第一编码格式的图像数据设置一个对应的标识。
在本申请实施例中,在获取第一编码格式的图像数据时,可以比较当前帧第一编码格式的图像数据与上一帧第一编码格式的图像数据的相似程度,若当前帧第一编码格式的图像数据与上一帧第一编码格式的图像数据的相似程度大于预设值,则不对当前帧第一编码格式的图像数据进行获取。其中,预设值表征当前帧第一编码格式的图像数据与上一帧第一编码格式的图像数据的相似程度为百分之八十,进一步的,预设值可以设置为大于百分之八十的任意值。
S120:从所述第一编码格式的图像数据中获取预设区域的图像数据。
其中,所述预设区域的图像数据为所述第一编码格式的图像数据中指定数据长度的图像数据,其中,所述指定数据长度为满足指定数值的倍数的数据长度。进一步的,所述预设区域的图像数据也可以为第一编码格式的图像数据中指定区域大小的图像数据。
具体的,在YUV编码格式的图像数据中,指定数据可以设为4或者8。考虑兼容各种YUV编码格式的图像数据的采样格式,在选取预设区域的图像数据时,该预设区域的图像数据的起始点的xy坐标及该局预设区域的图像数据的宽和高都应满足8的倍数。
作为一种方式,在从第一编码格式的图像数据中获取预设区域的图像数据时,可以将预设区域的图像数据的编号与第一编码格式的图像数据中所包括的多个局部区域的图像数据的编号进行对比,将与预设区域的图像数据的编号相同的局部区域的图像数据作为预设区域的图像数据。具体的,可以预先将第一编码格式的图像数据划分为多个同样大小的局部区域的图像数据,在划分局部区域图像数据时,可以对每一个局部区域的图像数据进行编号,进而可以通过查找编号,从第一编码格式的图像数据中获取到预设区域的图像数据。
S130:将所述预设区域的图像数据转换为第二编码格式的图像数据。
其中,所述第二编码格式的图像数据为一种基于应用于图像显示领域的颜色编码方法进行编码得到的图像数据,第一编码格式的图像数据与第二编码格式的图像数据之间可以进行相互转换。比如,第二编码格式的图像数据可以为RGB编码格式的图像数据,第一编码格式的图像数据可以为YUV编码格式的图像数据,YUV编码格式的图像数据和RGB编码格式的图像数据之间可以进行相互转换。
为了更好的显示图像数据,需要将第一编码格式的图像数据转换为第二编码格式的图像数据。在进行不同编码格式的图像数据转换时,可以通过不同的转换规则进行转换。
具体的,在将YUV编码格式的图像数据转换为RGB编码格式的图像数据时,可以通过以下计算公式进行转换,计算公式如下:
Y=0.299*R+0.587*G+0.114*B,
U=-0.147*R-0.289*G+0.436*B=0.492*(B-Y),
V=0.615*R-0.515*G-0.100*B=0.877*(R-Y)。
在将RGB编码格式的图像数据转换为YUV编码格式的图像数据时,可以通过以下计算公式进行转换,计算公式如下:
R=Y+1.140*V,
G=Y-0.394*U-0.581*V,
B=Y+2.032*U。
根据上述方法,可以通过上述计算公式将YUV编码格式的图像数据转换为RGB编码格式的图像数据。
S140:基于所述第二编码格式的图像数据进行图像识别操作。
作为一种方式,在将第一编码格式的预设区域的图像数据转换为第二编码格式的图像数据后,可以对第二编码格式的图像数据进行图像识别处理或者图像渲染处理。
其中,对第二编码格式的图像数据进行渲染处理可以理解为对识别出的图像信息进行着色处理,或者提高图像信息的现实效果等。
可选的,在对第二编码格式的图像数据进行图像识别操作时,可以通过预先设置的图像识别算法对第二编码格式的图像数据进行识别,比如,CNN卷积神经网络算法等。
进一步的,在识别出第二编码格式的图像数据后,可以根据识别出的图像信息针对性的为用户推荐不同的浏览信息。示例性的,当识别出图像中包含篮球和篮球场时,可以向用户推荐关于篮球方面的浏览信息。
本实施例提供的一种图像识别方法,获取第一编码格式的图像数据,从第一编码格式的图像数据中获取预设区域的图像数据,然后将预设区域的图像数据转换为第二编码格式的图像数据,进而对第二编码格式的图像数据进行图像识别操作。通过上述方法,不需要对所有的第一编码格式的图像数据进行图像数据转换,而只需要对预设区域的图像数据进行转换,在将预设区域的图像数据转换为第二编码格式的图像数据后,对该第二编码格式的图像数据进行图像识别,减少了图像识别的耗时,同时也减少了对系统资源的消耗。
请参阅图2,本申请实施例提供的一种图像识别方法,所述方法包括:
S210:当检测到缓冲区就绪后,从所述缓冲区获取所述第一编码格式的图像数据。
作为一种方式,可以通过是否接收到缓冲区返回的应答信号来确定缓冲区是否就绪。具体的,可以通过摄像头实时采集图像数据,当检测到采集到一帧完整的第一编码格式的图像数据时,实时对采集到的完整的第一编码格式的图像数据进行存储,当缓冲区存储完采集到的完整的第一编码格式的图像数据后,可以返回一个应答信号,以使电子设备确定该帧完整的第一编码格式的图像数据存储完成。当电子设备接收到缓冲区发送的应答信号时,确定缓冲区就绪。
当基于应答信号确定缓冲区就绪后,从缓冲区中获取存储的第一编码格式的图像数据。
进一步的,所述缓冲区可以为预先建立的,用以保存实时通过摄像头采集到的完整的第一编码格式的图像数据。在本申请实施例中,为了方便存取,缓冲区可以是利用先进先出(FIFO,First In First Out)缓存策略建立的缓冲区。
缓冲区建立好之后,在缓冲区对完整的第一编码格式的图像数据进行存储时,可以基于预先设置的存储时间间隔进行存储。进一步的,还可以将与完整的第一编码格式的图像数据对应的缓存标记存储至缓冲区中,所述存储时间间隔一般设置为1s。其中,缓存标记是根据当前存储的时间戳确定,也可以根据当前存储的序号确定,也可以根据当前的存储位置确定。
示例性的,缓存标记为当前存储的时间戳。比如,在2020年10月28日9点15分存储某帧完整的第一编码格式的图像数据时,那么该帧完整的第一编码格式的图像数据对应的时间戳就是202010280915,那么这帧完整的第一编码格式的图像数据对应的缓存标记就为202010280915。
进而,在对完整的第一编码格式的图像数据进行存储时,可以为每帧完整的第一编码格式的图像数据标记对应的时间戳缓存标记,生成带有时间戳缓存标记的数据包,并将带有时间戳缓存标记的数据包存储至缓冲区。
又比如,缓存标记为序号,若当前次是第10次采集到同一帧完整的第一编码格式的图像数据,那么该帧完整的第一编码格式的图像数据的缓存标记就为10。
进而,在对完整的第一编码格式的图像数据进行存储时,可以为每帧完整的第一编码格式的图像数据标记对应的序号缓存标记,生成带有序号缓存标记的数据包,并将带有序号缓存标记的数据包存储至缓冲区。
在对完整的第一编码格式的图像数据缓存完成后,可以根据缓存标记从缓冲区获取与缓存标记对应的第一编码格式的图像数据。
S220:获取当前的应用场景。
作为一种方式,可以对获取到的第一编码格式的图像数据进行识别,识别出当前的应用场景。具体的,可以预先设置多个应用场景,并为每一个应用场景设置一个特定的标识,进而可以根据在第一编码格式的图像数据中是否检测到特定的标识来确定当前的应用场景。其中,特定的标识可以为能够区分应用场景的标志性目标物,比如,如果当前特定的标识为人脸,那么就可以确定当前的应用场景为人脸识别的应用场景。
可选的,还可以在通过摄像头实时采集第一编码格式的图像数据时就对应用场景进行识别,进而在对第一编码格式的图像数据进行存储时,可以将与该第一编码格式的图像数据所对应的应用场景信息进行存储。
当从缓冲区获取指定帧第一编码格式的图像数据时,可以同时获取该帧第一编码格式的图像数据的应用场景信息,进而可以根据应用场景信息来确定当前的应用场景。
S230:从所述第一编码格式的图像数据中获取与所述应用场景对应的预设区域的图像数据。
作为一种方式,可以预先为不同的应用场景设置不同的预设区域,不同的预设区域对应的图像数据不同,进而可以根据当前的应用场景针对性的获取局部区域的图像数据,从而可以极大的节约系统资源消耗和内存占用。在对图像数据转换时,也只需对局部区域的图像数据进行转换,减少了转换耗时。
在通过上述方式确定了当前帧第一编码格式的图像数据的应用场景后,从当前帧第一编码格式的图像数据中获取与当前的应用场景对应的局部区域的图像数据。
示例性的,比如在电视频道标识识别的应用场景中,可以理解的是,通常电视频道标识是在整个显示屏的显示区域的左上角,如图3所示,图3中的长方形表示的是一个电视频道标识。因此,在对电视频道标识识别的应用场景所对应的预设区域进行设置时,可以将预设区域设置在显示区域的左上角区域。
在从第一编码格式的图像数据中获取与应用场景对应的预设区域的图像数据时,只需要获取显示屏的显示区域中电视频道标识所在的左上角的显示区域的图像数据。
又比如,在人脸识别的应用场景中,电视节目在拍摄时,在显示屏最边缘的显示区域通常是没有人脸图像的,因此,在对人脸识别的应用场景所对应的预设区域进行设置时,可以将预设区域设置在显示屏的中间区域。在从第一编码格式的图像数据中获取与应用场景对应的预设区域的图像数据时,只需要获取显示屏的中间区域的图像数据即可满足人脸识别需求,该中间区域可以只占整个显示屏的显示区域的1/4。
可选的,在对人脸识别的应用场景所对应的预设区域进行设置时,预设区域的大小可以根据需要进行人脸识别的对象的多少进行设置,需要进行人脸识别的对象越多,设置的预设区域越大。如图4所示,在图4a中,只有一个需要进行人脸识别的对象,因此预设区域可以设置为如图4a中的虚线所框选的区域;在图4b中,有两个需要进行人脸识别的对象,因此预设区域可以设置为如图4b中的虚线所框选的区域。可以明显的看出,图4b中的预设区域比图4a中的预设区域大。
S240:将所述预设区域的图像数据转换为第二编码格式的图像数据。
作为一种方式,在将预设区域的图像数据转换为第二编码格式的图像数据之后,可以实时对第二编码格式的图像数据进行存储,进而,当需要根据该第二编码格式的图像数据生成位图图像时,可以直接从存储区域中查找到对应的第二编码格式的图像数据。
S250:基于所述第二编码格式的图像数据生成位图图像。
可以理解的是,位图是由像素(Pixel)组成的,像素是位图最小的信息单元,存储在图像栅格中。每个像素都具有特定的位置和颜色值。按从左到右、从上到下的顺序来记录图像中每一个像素的信息,如:像素在屏幕上的位置、像素的颜色等。位图图像质量是由单位长度内像素的多少来决定的。单位长度内像素越多,分辨率越高,图像的效果越好。位图也称为"位图图像""点阵图像""数据图像""数码图像"。
在将第二编码格式的图像数据生成位图图像时,可以将第二编码格式的图像数据按照位图结构写入文件,进而生成位图图像。可选的,位图结构可以包括位图文件头、位图信息头、彩色表以及位图数据。其中,位图数据就是第二编码格式的图像数据。
作为一种方式,当接收到请求获取指定缓存标记对应的第二编码格式的图像数据的请求信息时,在存储区域中查找这是否存在与指定缓存标记一致的缓存标记,若存在,则直接从存储区域读取指定缓存标记对应的第二编码格式的图像数据。
在读取到与指定缓存标记对应的第二编码格式的图像数据后,基于该第二编码格式的图像数据生成位图图像。
S260:对所述位图图像进行图像识别操作。
作为一种方式,在通过上述方式生成位图图像之后,可以对位图图像进行识别操作,也可以对位图图像进行图像处理,具体的,可以对位图图像进行去噪处理,或者也可以对位图图像的显示效果进行调节。
本实施例提供的一种图像识别方法,首先当检测到缓冲区就绪后,从缓冲区获取第一编码格式的图像数据,然后获取当前的应用场景,并从第一编码格式的图像数据中获取与应用场景对应的预设区域的图像数据,然后将预设区域的图像数据转换为第二编码格式的图像数据,再基于第二编码格式的图像数据生成位图图像,对位图图像进行图像识别操作。通过上述方法,对不同的应用场景有目的的获取预设区域的第一编码格式的图像数据,极大的节约了系统资源的消耗和内存占用,进一步的,不需要对所有的第一编码格式的图像数据进行图像数据转换,而只需要对预设区域的图像数据进行转换,在将预设区域的图像数据转换为第二编码格式的图像数据后,对该第二编码格式的图像数据进行图像识别,减少了图像识别的耗时。
请参阅图5,本申请实施例提供的一种图像识别方法,所述方法包括:
S310:当检测到缓冲区就绪后,从所述缓冲区获取所述第一编码格式的图像数据。
S310所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
S320:获取所述第一编码格式的图像数据的存储格式。
其中,第一编码格式的图像数据可以为YUV编码格式的图像数据,对于YUV编码格式的图像数据来说,YUV编码格式的图像数据的数据格式有两大类:打包(planar)格式和平面(packed)格式。对于planar格式的YUV编码格式的图像数据,先连续存储图像数据中所有像素点的Y通道数据,紧接着存储图像数据中所有像素点的U通道数据,随后是存储图像数据中所有像素点的V通道数据;对于packed格式的YUV编码格式的图像数据,在存储图像数据时,图像数据中每个像素点的Y通道数据、U通道数据和V通道数据是连续交叉存储的。
进一步的,YUV编码格式的图像数据的存储格式其实与其采样的方式密切相关,YUV编码格式的图像数据的采样方式主要有三种:YUV 4:4:4采样、YUV 4:2:2采样以及YUV4:2:0采样,上述3种采样方式所对应的YUV编码格式的图像数据的存储格式不同。
可选的,YUV编码格式的图像数据的存储格式可以包括YUYV格式、UYVY格式、YUV422P格式、YUV 420P格式以及YUV 420SP格式等。其中,YUYV格式、UYVY格式以及YUV 422P格式是基于YUV 4:2:2采样的存储格式;YUV 420P格式以及YUV 420SP格式是基于YUV 4:2:0采样的存储格式。其中,YUV 420P格式又包含YU12格式和YV12格式,YUV 420SP格式又包含NV12格式和NV21格式。
示例性的,对于YUV 4:2:2采样格式的图像数据来说,图像数据中Y通道的采样率与UV通道的采样率不同,每两个Y通道数据共用一组UV通道数据,进而在存储通过YUV 4:2:2采样格式采集到的图像数据时,可以以YUYV格式进行存储,也可以以UYVY格式进行存储,或者以YUV 422P格式进行存储。比如,有四个像素点分别为[Y0 U0 V0]、[Y1 U1 V1]、[Y2U2 V2]和[Y3 U3 V3]。以YUYV格式对上述四个像素点进行存储,YUYV格式是采用打包格式进行存储的,指每个像素点都采样Y通道数据,但是每隔一个像素点采样它的UV通道数据。上述四个像素点的存储格式为:Y0、U0、Y1、V1、Y2、U2、Y3、V3。
而对于基于YUV 4:2:0采样格式中的YU12存储格式的图像数据来说,YU12是基于Planar平面模式进行存储的,是先存储Y通道数据,再存储U通道数据,后存储V通道数据。YU12存储格式下,像素点的存储格式为:Y0、Y1、Y2、Y3、Y4、Y5、Y6、Y7、...、U0、U2、...、V4、V6...。
通过上述方法,在对第一编码格式的图像数据进行存储时,可以将第一编码格式的图像数据按照上述预设的存储格式进行存储。进一步的,在按照上述预设的存储格式对第一编码格式的图像数据进行存储的同时,可以将每一帧第一编码格式的图像数据的存储格式的标识进行存储,进而,在获取到某一帧第一编码格式的图像数据时,也可以获取到与该帧第一编码格式的图像数据对应的存储格式的标识。可选的,通过获取到的存储格式的标识可以确定该帧第一编码格式的图像数据的存储格式。
S330:获取与所述存储格式对应的预设区域的图像数据的获取方法。
作为一种方式,所述与存储格式对应的预设区域的图像数据的获取方法可以为不同的获取算法。具体的,可以预先设置多种不同的获取算法,并将不同的获取算法与不同的图像数据的存储格式建立对应关系,进而可以获取与存储格式对应的预设区域的图像数据的获取方法。
具体的,不同的获取算法可以与不同的采样方式对应,通过哪种采样方式对第一编码格式的图像数据进行采样,就利用同样的方式从缓冲区域中获取第一编码格式的图像数据。
S340:基于所述获取方法,从所述第一编码格式的图像数据中获取预设区域的图像数据。
作为一种方式,通过上述方法,在获取与预设区域的图像数据的存储格式对应的获取方法后,利用该获取方法从第一编码格式的图像数据中获取预设区域的图像数据。
S350:将所述预设区域的图像数据转换为第二编码格式的图像数据。
S360:基于所述第二编码格式的图像数据进行图像识别操作。
S350以及S360所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
本实施例提供的一种图像识别方法,首先当检测到缓冲区就绪后,从缓冲区获取第一编码格式的图像数据,然后获取第一编码格式的图像数据的存储格式,再获取与存储格式对应的预设区域的图像数据的获取方法,基于该获取方法,从第一编码格式的图像数据中获取预设区域的图像数据,将预设区域的图像数据转换为第二编码格式的图像数据,基于第二编码格式的图像数据进行图像识别操作。通过上述方法,不同的第一编码格式的图像数据的存储格式不同,对应的预设区域的图像数据的获取方法也不同,通过不同的获取方法从第一编码格式的图像数据中获取预设区域的图像数据,增加了获取图像数据的多样性。
请参阅图6,本申请实施例提供的一种图像识别方法,所述方法包括:
S410:当检测到缓冲区就绪后,从所述缓冲区获取所述第一编码格式的图像数据。
S420:从所述第一编码格式的图像数据中获取预设区域的图像数据。
S410以及S420所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
S430:获取预设区域的图像数据中每个像素点的第一编码值。
作为一种方式,所述预设区域的图像数据由多个像素点组成。其中,每个像素点的第一编码值可以通过预设规则进行计算。
在将第一编码格式的图像数据存储至缓冲区时,可以同时将第一编码格式的图像数据中所有像素点的第一编码值计算出来存储在缓冲区中。当从第一编码格式的图像数据中获取预设区域的图像数据时,可以同时从缓冲区中获取预设区域的图像数据所包括的像素点的第一编码值。
S440:从预设存储列表中查找与所述每个像素点的第一编码值对应的第二编码值,其中,所述第一编码值为第一编码格式的图像数据所对应的像素点的编码值,所述第二编码值为第二编码格式的图像数据所对应的像素点的编码值。
作为一种方式,所述预设存储列表用于存储每个像素点对应的第一编码值和第二编码值,因而,每个像素点的第一编码值和第二编码值也相互对应。示例性的,一个像素点的YUV编码值与RGB编码值相对应。
可选的,可以预先建立一个预设存储列表,用于存储每个像素点的第一编码值和第二编码值,其中,第一编码值与第二编码值可以通过公式进行转换。根据一个第一编码值可以计算出一个对应的第二编码值。
可选的,第一编码值和第二编码值的取值都大于等于0,小于等于255。因此,可以预先将每个像素的第一编码值和第二编码值计算好,存储在预设存储列表中。
当获取到预设区域的图像数据中的每个像素点的第一编码值时,可以从预先建立的预设存储列表中查找到与每个像素点的第一编码值对应的第二编码值。通过上述方法,可以获取到预设区域的图像数据中所包括的所有像素点所对应的第二编码值。
S450:基于所述第二编码值,将所述预设区域的图像数据转换为第二编码格式的图像数据。
作为一种方式,通过上述方法,通过查表的方式,获取到了与预设区域的图像数据中每个像素点的第一编码值对应的第二编码值后,可以将预设区域的图像数据中每个像素点的第一编码值替换为第二编码值,进而将第一编码格式的图像数据转换为了第二编码格式的图像数据。示例性的,可以预先建立一个预设存储列表,用于存储每个像素点的YUV编码值和RGB编码值。当获取到预设区域的图像数据的某个像素点的YUV编码值时,可以从预设存储列表中查找到与该像素点的YUV编码值对应的RGB编码值,进而,可以将该像素点的YUV编码值替换为RGB编码值,铜鼓上述方式,将该像素点从YUV编码格式转换成了RGB编码格式。
通过上述方法,通过查表转换方法,可以大大的减少图像数据转换过程中的耗时,进而可以提高图像数据转换的效率。
S460:基于所述第二编码格式的图像数据生成位图图像。
S470:对所述位图图像进行图像识别操作。
S460以及S470所包括的步骤的详细解释可以参照前述实施例中的对应步骤,这里不再赘述。
本实施例提供的一种图像识别方法,首先当检测到缓冲区就绪后,从缓冲区获取第一编码格式的图像数据,然后从第一编码格式的图像数据中获取预设区域的图像数据,再获取预设区域的图像数据中每个像素点的第一编码值,从预设存储列表中查找与每个像素点的第一编码值对应的第二编码值,再基于第二编码值,将预设区域的图像数据转换为第二编码格式的图像数据,并基于第二编码格式的图像数据生成位图图像,对该位图图像进行图像识别操作。通过上述方法,通过查表的方式,将第一编码格式的预设区域的图像数据转换为第二编码格式的图像数据,减少了数据转换过程中的耗时,进一步的,不需要对所有的第一编码格式的图像数据进行图像数据转换,而只需要对第二编码格式的预设区域的图像数据进行图像识别,减少了图像识别过程中的耗时,同时也减少了对系统资源的消耗。
请参阅图7,本申请提供的一种图像识别装置500,所述装置500包括第一数据获取单元510、第二数据获取单元520、转换单元530以及图像识别单元540:
所述第一数据获取单元510,用于获取第一编码格式的图像数据。
具体的,所述第一数据获取单元510用于当检测到缓冲区就绪后,从所述缓冲区获取所述第一编码格式的图像数据。
所述第二数据获取单元520,用于从所述第一编码格式的图像数据中获取预设区域的图像数据。所述预设区域的图像数据为所述第一编码格式的图像数据中指定数据长度的图像数据,其中,所述指定数据长度为满足指定数值的倍数的数据长度。
作为一种方式,所述第二数据获取单元520具体用于获取当前的应用场景;从所述第一编码格式的图像数据中获取与所述应用场景对应的预设区域的图像数据。
作为另一种方式,所述第二数据获取单元520具体用于获取所述第一编码格式的图像数据的存储格式;获取与所述存储格式对应的预设区域的图像数据的获取方法;基于所述获取方法,从所述第一编码格式的图像数据中获取预设区域的图像数据。
所述转换单元530,用于将所述预设区域的图像数据转换为第二编码格式的图像数据。
具体的,所述转换单元530还用于获取预设区域的图像数据中每个像素点的第一编码值;从预设存储列表中查找与所述每个像素点的第一编码值对应的第二编码值,其中,所述第一编码值为第一编码格式的图像数据所对应的像素点的编码值,所述第二编码值为第二编码格式的图像数据所对应的像素点的编码值;基于所述第二编码值,将所述预设区域的图像数据转换为第二编码格式的图像数据。
所述图像识别单元540,用于基于所述第二编码格式的图像数据进行图像识别操作。
具体的,所述图像识别单元540用于基于所述第二编码格式的图像数据生成位图图像;对所述位图图像进行图像识别操作。
需要说明的是,本申请中装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。
下面将结合图8对本申请提供的一种电子设备进行说明。
请参阅图8,基于上述的图像识别方法、装置,本申请实施例还提供的另一种可以执行前述图像识别方法的电子设备100。电子设备100包括相互耦合的一个或多个(图中仅示出一个)处理器102、存储器104以及网络模块106。其中,该存储器104中存储有可以执行前述实施例中内容的程序,而处理器102可以执行该存储器104中存储的程序。
其中,处理器102可以包括一个或者多个处理核。处理器102利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器104内的指令、程序、代码集或指令集,以及调用存储在存储器104内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器102可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable GateArray,FPGA)、可编程逻辑阵列(ProgrammableLogicArray,PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器102中,单独通过一块通信芯片进行实现。
存储器104可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
所述网络模块106用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。所述网络模块106可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。所述网络模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如,网络模块106可以与基站进行信息交互。
请参考图9,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。
本实施例提供的一种图像识别方法、装置、电子设备以及存储介质,获取第一编码格式的图像数据,从第一编码格式的图像数据中获取预设区域的图像数据,然后将预设区域的图像数据转换为第二编码格式的图像数据,进而对第二编码格式的图像数据进行图像识别操作。通过上述方法,不需要对所有的第一编码格式的图像数据进行图像数据转换,而只需要对预设区域的图像数据进行转换,在将预设区域的图像数据转换为第二编码格式的图像数据后,对该第二编码格式的图像数据进行图像识别,减少了图像识别的耗时,同时也减少了对系统资源的消耗。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (9)
1.一种图像识别方法,其特征在于,所述方法包括:
获取第一编码格式的图像数据,所述第一编码格式的图像数据为YUV编码格式的图像数据;
从所述第一编码格式的图像数据中获取预设区域的图像数据,其中,在选取所述预设区域的图像数据时,所述预设区域的图像数据的起始点的xy坐标及所述预设区域的图像数据的宽和高均满足8的倍数;
所述从所述第一编码格式的图像数据中获取预设区域的图像数据,包括:
获取当前的应用场景;
从所述第一编码格式的图像数据中获取与所述应用场景对应的预设区域的图像数据,其中,不同的应用场景对应不同的预设区域,不同的预设区域对应的图像数据不同,不同的预设区域的大小不同;
将所述预设区域的图像数据转换为第二编码格式的图像数据;
基于所述第二编码格式的图像数据进行图像识别操作。
2.根据权利要求1所述的方法,其特征在于,所述从所述第一编码格式的图像数据中获取预设区域的图像数据,包括:
获取所述第一编码格式的图像数据的存储格式;
获取与所述存储格式对应的预设区域的图像数据的获取方法;
基于所述获取方法,从所述第一编码格式的图像数据中获取预设区域的图像数据。
3.根据权利要求1所述的方法,其特征在于,所述将所述预设区域的图像数据转换为第二编码格式的图像数据,包括:
获取预设区域的图像数据中每个像素点的第一编码值;
从预设存储列表中查找与所述每个像素点的第一编码值对应的第二编码值,其中,所述第一编码值为第一编码格式的图像数据所对应的像素点的编码值,所述第二编码值为第二编码格式的图像数据所对应的像素点的编码值;
基于所述第二编码值,将所述预设区域的图像数据转换为第二编码格式的图像数据。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第二编码格式的图像数据进行图像识别操作,包括:
基于所述第二编码格式的图像数据生成位图图像;
对所述位图图像进行图像识别操作。
5.根据权利要求1所述的方法,其特征在于,所述获取第一编码格式的图像数据,包括:
当检测到缓冲区就绪后,从所述缓冲区获取所述第一编码格式的图像数据。
6.根据权利要求1-5任一所述的方法,其特征在于,所述预设区域的图像数据为所述第一编码格式的图像数据中指定数据长度的图像数据,其中,所述指定数据长度为满足指定数值的倍数的数据长度。
7.一种图像识别装置,其特征在于,所述装置包括:
第一数据获取单元,用于获取第一编码格式的图像数据,所述第一编码格式的图像数据为YUV编码格式的图像数据;
第二数据获取单元,用于从所述第一编码格式的图像数据中获取预设区域的图像数据,其中,在选取所述预设区域的图像数据时,所述预设区域的图像数据的起始点的xy坐标及所述预设区域的图像数据的宽和高均满足8的倍数;所述从所述第一编码格式的图像数据中获取预设区域的图像数据,包括:获取当前的应用场景;从所述第一编码格式的图像数据中获取与所述应用场景对应的预设区域的图像数据,其中,不同的应用场景对应不同的预设区域,不同的预设区域对应的图像数据不同,不同的预设区域的大小不同;
转换单元,用于将所述预设区域的图像数据转换为第二编码格式的图像数据;
图像识别单元,用于基于所述第二编码格式的图像数据进行图像识别操作。
8.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行权利要求1-6任一所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行权利要求1-6任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011224753.2A CN112468792B (zh) | 2020-11-05 | 2020-11-05 | 图像识别方法、装置、电子设备及存储介质 |
PCT/CN2021/117455 WO2022095595A1 (zh) | 2020-11-05 | 2021-09-09 | 图像识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011224753.2A CN112468792B (zh) | 2020-11-05 | 2020-11-05 | 图像识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112468792A CN112468792A (zh) | 2021-03-09 |
CN112468792B true CN112468792B (zh) | 2023-03-28 |
Family
ID=74826674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011224753.2A Active CN112468792B (zh) | 2020-11-05 | 2020-11-05 | 图像识别方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112468792B (zh) |
WO (1) | WO2022095595A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112468792B (zh) * | 2020-11-05 | 2023-03-28 | Oppo广东移动通信有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN114928730B (zh) * | 2022-06-23 | 2023-08-22 | 湖南国科微电子股份有限公司 | 图像处理方法和图像处理装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442260A (zh) * | 2013-08-28 | 2013-12-11 | 天津三星电子有限公司 | 一种电视频道生活信息的获取方法及其电视机 |
KR20160146231A (ko) * | 2015-06-12 | 2016-12-21 | 현대모비스 주식회사 | 영상 인식 전 처리 장치 및 영상 인식 전 처리 방법 |
CN106897747A (zh) * | 2017-02-28 | 2017-06-27 | 深圳市捷顺科技实业股份有限公司 | 一种基于卷积神经网络模型鉴别车辆颜色的方法及装置 |
CN107103606A (zh) * | 2017-02-27 | 2017-08-29 | 口碑控股有限公司 | 一种图像识别方法及装置 |
CN110248177A (zh) * | 2019-05-29 | 2019-09-17 | 深圳英飞拓智能技术有限公司 | 一种图像数据的处理方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4302661B2 (ja) * | 2005-05-02 | 2009-07-29 | 富士通マイクロエレクトロニクス株式会社 | 画像処理システム |
US7689035B2 (en) * | 2005-06-17 | 2010-03-30 | The Regents Of The University Of California | Methods for identifying, separating and editing reflection components in multi-channel images and videos |
CN106096574A (zh) * | 2016-06-24 | 2016-11-09 | 百度在线网络技术(北京)有限公司 | 屏幕图像的识别方法及装置 |
CN106651969A (zh) * | 2016-12-28 | 2017-05-10 | 深圳市捷顺科技实业股份有限公司 | 一种针对车辆的颜色识别方法及装置 |
CN109919030B (zh) * | 2019-01-31 | 2021-07-13 | 深圳和而泰数据资源与云技术有限公司 | 黑眼圈类型识别方法、装置、计算机设备和存储介质 |
CN111126383A (zh) * | 2019-12-06 | 2020-05-08 | 广州烽火众智数字技术有限公司 | 车牌检测方法、系统、装置及存储介质 |
CN111476849B (zh) * | 2020-04-03 | 2023-08-29 | 腾讯科技(深圳)有限公司 | 对象颜色识别方法、装置、电子设备以及存储介质 |
CN112468792B (zh) * | 2020-11-05 | 2023-03-28 | Oppo广东移动通信有限公司 | 图像识别方法、装置、电子设备及存储介质 |
-
2020
- 2020-11-05 CN CN202011224753.2A patent/CN112468792B/zh active Active
-
2021
- 2021-09-09 WO PCT/CN2021/117455 patent/WO2022095595A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442260A (zh) * | 2013-08-28 | 2013-12-11 | 天津三星电子有限公司 | 一种电视频道生活信息的获取方法及其电视机 |
KR20160146231A (ko) * | 2015-06-12 | 2016-12-21 | 현대모비스 주식회사 | 영상 인식 전 처리 장치 및 영상 인식 전 처리 방법 |
CN107103606A (zh) * | 2017-02-27 | 2017-08-29 | 口碑控股有限公司 | 一种图像识别方法及装置 |
CN106897747A (zh) * | 2017-02-28 | 2017-06-27 | 深圳市捷顺科技实业股份有限公司 | 一种基于卷积神经网络模型鉴别车辆颜色的方法及装置 |
CN110248177A (zh) * | 2019-05-29 | 2019-09-17 | 深圳英飞拓智能技术有限公司 | 一种图像数据的处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2022095595A1 (zh) | 2022-05-12 |
CN112468792A (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108833938B (zh) | 用于选取视频封面的方法和设备 | |
CN112468792B (zh) | 图像识别方法、装置、电子设备及存储介质 | |
US20150117540A1 (en) | Coding apparatus, decoding apparatus, coding data, coding method, decoding method, and program | |
CN109783658B (zh) | 图像处理方法、装置及存储介质 | |
US20220264091A1 (en) | Information compression/decompression methods and apparatuses, and storage medium | |
CN108737875B (zh) | 图像处理方法及装置 | |
CN116188808B (zh) | 图像特征提取方法和系统、存储介质及电子设备 | |
CN110691246B (zh) | 视频编码方法、装置及电子设备 | |
CN114040246A (zh) | 图形处理器的图像格式转换方法、装置、设备及存储介质 | |
CN111179370A (zh) | 一种图片生成方法、装置、电子设备及存储介质 | |
CN111200693A (zh) | 一种图像数据传输方法、装置及系统 | |
CN108184101B (zh) | 处理视频的设备和方法 | |
CN113127637A (zh) | 一种字符的还原方法及装置、存储介质、电子装置 | |
CN116030114A (zh) | 物电同源电子印模的制作方法、装置、设备及介质 | |
CN113613024B (zh) | 视频预处理方法及设备 | |
CN110378973B (zh) | 图像信息处理方法、装置以及电子设备 | |
CN110365962B (zh) | 色域转换处理方法、装置以及电子设备 | |
CN107197295A (zh) | 一种编码系统和方法 | |
CN113453017A (zh) | 视频处理方法、装置、设备及计算机程序产品 | |
CN107197287A (zh) | 一种基于arm处理器的视频录播方法和装置 | |
CN113420168A (zh) | 一种图片存储方法、装置、设备和存储介质 | |
CN113473150B (zh) | 一种图像处理方法、装置以及计算机可读存储装置 | |
CN109977734B (zh) | 图像处理方法和装置 | |
CN111385579B (zh) | 视频压缩方法、装置、设备和存储介质 | |
CN108810537B (zh) | 一种图片转码方法、装置及图像处理设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |