CN110188748B

CN110188748B - 图像内容识别方法、装置以及计算机可读存储介质

Info

Publication number: CN110188748B
Application number: CN201910362067.2A
Authority: CN
Inventors: 李奇倚; 温舒; 胡宏辉
Original assignee: Shanghai Shanghu Information Technology Co ltd
Current assignee: Shanghai Shanghu Information Technology Co ltd
Priority date: 2019-04-30
Filing date: 2019-04-30
Publication date: 2021-07-13
Anticipated expiration: 2039-04-30
Also published as: CN110188748A

Abstract

一种图像内容识别方法、装置以及计算机可读存储介质，所述方法包括：定位得到所述目标内容的位置范围后；对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。采用上述方案，在定位目标内容的位置后，通过对目标内容的位置进行多次调整，针对每次调整后的位置进行识别，在识别结果中筛选得到最终识别结果，以提升图像内容识别的准确度。

Description

图像内容识别方法、装置以及计算机可读存储介质

技术领域

本发明涉及图像识别领域，尤其涉及一种图像内容识别方法、装置以及计算机可读存储介质。

背景技术

现今，基于深度学习的图像识别技术在工业界得到越来越广泛的应用。

对于目标识别、文字识别、人脸识别等多种图像识别的应用场景中，现有技术中采用的方案分为以下两步：1、先定位目标内容的位置；2、对框选的目标进行识别。

然而，现有技术中采用的方案在实际应用过程中，在定位目标内容这一步骤中会产生误差，而目标内容定位的准确性会影响后续的识别结果。

发明内容

本发明解决的技术问题是目标内容定位不准确导致识别结果产生误差。

为解决上述技术问题，本发明实施例提供一种图像内容识别方法，包括：在原始图像上定位目标内容，定位得到所述目标内容的位置范围；对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。

可选的，所述目标内容包括以下至少一种：文字内容、图像内容。

可选的，根据目标内容的性质，使用相应的定位算法于所述原始图像上定位目标内容。

可选的，对所述原始图像进行图像处理。

可选的，所述图像处理包括以下至少一种：锐化处理、亮度调整。

可选的，将相同的识别结果归于同一类别。

可选的，将识别结果数量最多的类别内的识别结果作为最终识别结果。

本发明实施例还提供一种图像内容识别装置，包括：定位单元，用于在原始图像上定位目标内容，定位得到所述目标内容的位置范围；识别单元，用于对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；筛选单元，用于将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。

可选的，所述定位单元，用于根据目标内容的性质，使用相应的定位算法于所述原始图像上定位目标内容。

可选的，所述识别单元，用于对所述原始图像进行图像处理。

可选的，所述筛选单元，用于将相同的识别结果归于同一类别。

可选的，所述筛选单元，用于将识别结果数量最多的类别内的识别结果作为最终识别结果。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机指令，所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质，所述计算机指令运行时执行本发明实施例提供的图像内容识别方法的步骤。

本发明实施例还提供一种图像内容识别装置，包括存储器和处理器，所述存储器上存储有计算机指令，所述计算机指令运行时所述处理器执行本发明实施例提供的图像内容识别方法的步骤。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

通过定位得到所述目标内容的位置范围后；对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。采用上述方案，在定位目标内容的位置后，通过对目标内容的位置进行多次调整，针对每次调整后的位置进行识别，在识别结果中筛选得到最终识别结果，从而可以提升图像内容识别的准确度。

附图说明

图1是本发明实施例中的一种图像内容识别方法的流程示意图；

图2是本发明实施例中的一种图像内容识别装置的结构示意图。

具体实施方式

本发明实施例中，通过定位得到所述目标内容的位置范围后；对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。采用上述方案，在定位目标内容的位置后，通过对目标内容的位置进行多次调整，针对每次调整后的位置进行识别，在识别结果中筛选得到最终识别结果，以提升图像内容识别的准确度。

为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

参阅图1，其为本发明实施例中的一种图像内容识别方法的流程示意图，以下结合具体步骤进行详细说明。

步骤S101，在原始图像上定位目标内容，定位得到所述目标内容的位置范围。

在具体实施中，原始图像可以为包括待识别内容的图像，待识别内容即为目标内容。对原始图像上的目标内容进行定位，若目标内容分散于所述原始图像的多处区域时，可以逐一对处于各个区域的目标内容进行定位。

本发明实施例中，所述目标内容包括以下至少一种：文字内容、图像内容。

在具体实施中，目标内容可以仅为文字内容或图像内容，也可以为文字内容与图像内容的结合。

本发明实施例中，可以根据目标内容的性质，使用相应的定位算法于所述原始图像上定位目标内容。

在具体实施中，可以使用定位算法对目标内容进行定位，当目标内容的性质不同时，使用的定位算法可以不相同。在目标内容的性质为文字时，可以使用文字定位算法；在目标内容的性质为图像时，可以使用图像定位算法；在目标内容的性质为图像和文字结合时，可以分别使用文字定位算法和图像定位算法。

步骤S102，对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；

在具体实施中，由于定位算法的定位结果存在出现误差的情况，在定位结果存在误差的情况下，识别结果会产生更大的误差。因此，在定位得到所述目标内容的位置范围后，可以对所述目标内容的位置范围进行多次调整。

在具体实施中，所述目标内容的位置范围的调整可以是将获得的位置范围整体右移、左移、上移、下移、扩大等，具体调整的方式和程度可以由用户根据实际应用场景进行相应的设定。

在具体实施中，在每次调整所述目标内容的位置范围后进行识别，可以获得多个识别结果，以此可以避免将出现误差的结果进行输出，进而提升图像内容识别的准确度。

本发明实施例中，在所述针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果之前，还可以对所述原始图像进行图像处理。

本发明实施例中，所述图像处理包括以下至少一种：锐化处理、亮度调整。

在具体实施中，通过对原始图像进行图像处理，使得原始图像上的目标内容的可识别度提升。在使用识别算法对所述目标内容的位置范围内的内容进行识别时，可以更加高效、准确地获取位置范围内的内容，避免在识别阶段出现误差，进而提升图像内容识别的准确度。

步骤S103，将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。

本发明实施例中，将相同的识别结果归于同一类别。

本发明实施例中，将识别结果数量最多的类别内的识别结果作为最终识别结果。

在具体实施中，在获得多个识别结果后，以是否相同作为划分标准，将识别结果数量最多的内容作为最终识别结果。例如，获得以下三个识别结果：“显示更多”、“显示更多”、“目示更多”，其中“显示更多”这一识别结果数量最多，将“显示更多”作为最终识别结果。

参阅图2，其为本发明实施例中的一种图像内容识别装置20的结构示意图，具体包括：

定位单元201，用于在原始图像上定位目标内容，定位得到所述目标内容的位置范围；

识别单元202，用于对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；

筛选单元203，用于将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。

本发明实施例中，所述目标内容可以包括以下至少一种：文字内容、图像内容。

本发明实施例中，所述定位单元201，还可以用于根据目标内容的性质，使用相应的定位算法于所述原始图像上定位目标内容。

本发明实施例中，所述识别单元202，还可以用于对所述原始图像进行图像处理。

本发明实施例中，所述图像处理可以包括以下至少一种：锐化处理、亮度调整。

本发明实施例中，所述筛选单元203，还可以用于将相同的识别结果归于同一类别。

本发明实施例中，所述筛选单元203，还可以用于将识别结果数量最多的类别内的识别结果作为最终识别结果。

本发明实施例中还提供一种计算机可读存储介质，其上存储有计算机指令，所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质，所述计算机指令运行时执行本发明实施例中提供的图像内容识别方法的步骤。

本发明实施例中还提供一种图像内容识别装置，包括存储器和处理器，所述存储器上存储有计算机指令，所述计算机指令运行时所述处理器执行本发明实施例中提供的图像内容识别方法的步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指示相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims

1.一种图像内容识别方法，其特征在于，包括：

在原始图像上定位目标内容，定位得到所述目标内容的位置范围；

对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；

将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。

2.根据权利要求1所述的图像内容识别方法，其特征在于，所述目标内容包括以下至少一种：文字内容、图像内容。

3.根据权利要求1所述的图像内容识别方法，其特征在于，所述在原始图像上定位目标内容，包括：

根据目标内容的性质，使用相应的定位算法于所述原始图像上定位目标内容。

4.根据权利要求1所述的图像内容识别方法，其特征在于，在所述针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果之前，还包括：

对所述原始图像进行图像处理。

5.根据权利要求4所述的图像内容识别方法，其特征在于，所述图像处理包括以下至少一种：锐化处理、亮度调整。

6.根据权利要求1所述的图像内容识别方法，其特征在于，所述将多个识别结果进行归类，包括：

将相同的识别结果归于同一类别。

7.一种图像内容识别装置，其特征在于，包括：

定位单元，用于在原始图像上定位目标内容，定位得到所述目标内容的位置范围；

识别单元，用于对所述目标内容的位置范围进行多次调整，针对每次调整后的所述目标内容的位置范围内的内容进行识别，得到多个识别结果；

筛选单元，用于将多个识别结果进行归类，选取识别结果数量最多的类别作为最终识别结果。

8.根据权利要求7所述的图像内容识别装置，其特征在于，所述目标内容包括以下至少一种：文字内容、图像内容。

9.根据权利要求7所述的图像内容识别装置，其特征在于，所述定位单元，用于根据目标内容的性质，使用相应的定位算法于所述原始图像上定位目标内容。

10.根据权利要求7所述的图像内容识别装置，其特征在于，所述识别单元，用于对所述原始图像进行图像处理。

11.根据权利要求10所述的图像内容识别装置，其特征在于，所述图像处理包括以下至少一种：锐化处理、亮度调整。

12.根据权利要求7所述的图像内容识别装置，其特征在于，所述筛选单元，用于将相同的识别结果归于同一类别。

13.一种计算机可读存储介质，其上存储有计算机程序，所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质，其特征在于，所述计算机程序被处理器运行时执行权利要求1～6任一项所述的图像内容识别方法的步骤。

14.一种图像内容识别装置，包括存储器和处理器，所述存储器上存储有计算机程序，其特征在于，所述计算机程序运行时所述处理器执行权利要求1～6任一项所述的图像内容识别方法的步骤。