CN106777083A

CN106777083A - 一种标记图片中物体的方法及装置

Info

Publication number: CN106777083A
Application number: CN201611147559.2A
Authority: CN
Inventors: 姚磊
Original assignee: Sichuan Yanbao Technology Co Ltd
Current assignee: Sichuan Yanbao Technology Co Ltd
Priority date: 2016-12-13
Filing date: 2016-12-13
Publication date: 2017-05-31

Abstract

本发明公开了一种标记图片中物体的方法及装置，其中，本发明首先基于模型识别库，识别出图片中的物体，并获取相匹配的物体信息，然后根据被识别到的物体的轮廓，将该物体所在的图片区域划分为相应的子图片，然后将所获取的物体信息关联至该子图片，以标记该子图片，从而实现对图片中被识别到的物体的标记，因此，本发明通过将识别图片中的物体，并将相匹配的物体信息关联至该物体对应的子图片，能够适应用户更高要求的图片统计分类的应用。

Description

一种标记图片中物体的方法及装置

技术领域

本发明涉及图像处理技术领域，特别涉及一种标记图片中物体的方法及终端。

背景技术

目前，图片在被拍摄时或被制作编辑时，通常会被标记上拍摄地理位置、拍摄时间、最后一次制作编辑的时间或者一些参数信息(光圈、快门速度等)，通常，图片被标记的信息作为统计分类的依据，以生成不同的集合，但这样分类的方式过于简单，无法满足用户更高层次的需求。比如，由于图片比较多，需要找出图片中有某个特定物或者某个人的图片，并将这些图片作为一个集合。因此，为了更准确地对图片进行分类统计，需要一种新的标记图片的方法。

发明内容

本发明的目的在于：适应用户对更高要求的统计分类的应用，提供一种标记图片中物体的方法及装置。

为了实现上述发明目的，本发明提供一种标记图片中物体的方法，其包括，

确定需要标记的图片，并基于模型识别库，识别所述图片中的物体，并获取相匹配的物体信息；

根据所述图片中被识别到的物体的轮廓，将所述物体所在的图片区域划分为相应的子图片；

以及通过将所述物体信息关联至相对应的所述子图片，以标记所述子图片。

根据一种具体的实施方式，基于模型识别库，识别所述图片中的物体，包括，

提取所述图片的特征数据，并从模型识别库中查询与所述特征数据中任意部分相匹配的模型数据，并且每个所述模型数据分别对应一条所述物体信息。

根据一种具体的实施方式，根据所述图片中被识别到的物体的轮廓，将所述物体所在的图片区域划分为相应的子图片，包括，

根据所述特征数据中与所述模型数据相匹配的部分，确定所述图片中对应物体的轮廓；根据物体的轮廓上的像素值梯度，确定所述子图片的边界。

根据一种具体的实施方式，将所述物体信息关联至相对应的所述子图片，包括，

若所述物体信息为图片格式，则将所述物体信息与其对应的所述子图片相关联地显示在所述图片中；

或者，若所述物体信息为音频格式，则在所述子图片处于被选取状态时播放所述物体信息。

根据一种具体的实施方式，标记所述子图片还包括，对所述子图片进行渲染操作。

基于同一发明构思，本发明还提供一种用于实施本发明标记图片中物体的方法的装置，其包括，

识别模块，用于基于模型识别库，识别所述图片中的物体，并获取相匹配的物体信息；

图片划分模块，用于根据所述图片中被识别到的物体的轮廓，将所述物体所在的图片区域划分为相应的子图片；

标记模块，用于将所述物体信息关联至相对应的所述子图片，以标记所述子图片。

根据一种具体的实施方式，所述识别模块包括，

特征提取子模块，用于提取所述图片的特征数据；

模型匹配子模块，用于从模型识别库中查询与所述特征数据中任意部分相匹配的模型数据，并且每个所述模型数据分别对应一条所述物体信息。

根据一种具体的实施方式，所述图片划分模块包括，

像素值检测子模块，用于检测所述图片中像素的值；

子图片生成子模块，用于根据各个所述模型数据分别与所述特征数据相匹配的部分，确定所述模型数据对应的图片中物体的轮廓；以及根据物体的轮廓上的像素值梯度，确定所述子图片的边界。

根据一种具体的实施方式，所述标记模块包括，

关联子模块，用于将为图片格式的所述物体信息与所述子图片相关联地显示在所述图片中，或者将为音频格式的所述物体信息在所述子图片处于被选取状态时播放。

根据一种具体的实施方式，所述标记模块包括，

渲染子模块，用于对所述子图片进行渲染操作。

与现有技术相比，本发明的有益效果：本发明首先基于模型识别库，识别出图片中的物体，并获取相匹配的物体信息，然后根据被识别到的物体的轮廓，将该物体所在的图片区域划分为相应的子图片，然后将所获取的物体信息关联至该子图片，以标记该子图片，从而实现对图片中被识别到的物体的标记，因此，本发明通过将识别图片中的物体，并将相匹配的物体信息关联至该物体对应的子图片，能够适应用户更高要求的图片统计分类的应用。

附图说明：

图1是本发明方法工作示意图；

图2是本发明装置的结构示意图；

图3是本发明识别模块的结构示意图

图4是本发明图片划分模块的结构示意图；

图5是本发明标记模块的结构示意图。

具体实施方式

下面结合具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例，凡基于本发明内容所实现的技术均属于本发明的范围。

如图1的本发明方法工作示意图；其中，首先确定需要标记的图片，结合图1可以看出，该需要标记的图片中物体为：一张桌子，放在桌子上的笔记本电脑和显示器。

首先，基于模型识别库，识别该图片中的物体，并获取相匹配的物体信息。按照图1中所示的情况，基于模型识别库，识别出来了桌子上的笔记本电脑和显示器，由于桌子上笔记本电脑和显示器的遮挡，造成无法准确识别出桌子，但是并不影响本发明的实施。

具体的，基于模型识别库，识别图片中的物体的方式为：首先提取图片的特征数据，即包含笔记本电脑、显示器和桌子的特征数据，然后从模型识别库中查询与提取的特征数据中任意部分相匹配的模型数据，即如图1中所示的情况，查询到与笔记本电脑对应的部分特征数据相匹配的模型数据，以及与显示器对应的部分特征数据相匹配的模型数据，但没有查询到与桌子对应的部分特征数据相匹配的模型数据。因此，只识别出了笔记本电脑和显示器，并获得笔记本电脑和显示器分别对应的物体信息。其中，没有识别出图片中的桌子，主要由于桌子对应的部分特征数据相匹配的模型数据不完整，造成在查询过程中其匹配度低于设定阈值。

然后，根据需要标记的图片中，被识别出来的笔记本电脑和显示器的轮廓，将笔记本电脑和显示器所在的图片区域划分为相应的子图片，即根据笔记本电脑的轮廓而生成的第一子图片，以及根据显示器的轮廓而生成的第二子图片。

具体的，根据所提取的特征数据中与模型识别库中的模型数据相匹配的部分，确定该图片中对应物体的轮廓，然后根据该物体的轮廓上的像素值梯度，确定相应的子图片的边界，然后根据所确定的各个子图片的边界，实现子图片的划分。

最后，通过将物体信息关联至相对应的子图片，以标记该子图片。即将笔记本电脑对应的物体信息关联至第一子图片，将显示器对应的物体信息关联至第二子图片。

具体的，将物体信息关联至相对应的子图片的方式为：若物体信息为图片格式，则将该物体信息与其对应的子图片相关联地显示在图片中；若物体信息为音频格式，则在子图片处于被选取状态时播放该物体信息。

此外，标记子图片的方式还可以为：对子图片进行渲染操作。通过渲染操作，使子图片在图片中突出显示。通常的渲染操作为轮廓渲染。

在本发明实施过程中，由于模型识别库中的模型数据的不完善，造成一些子图片无法成功识别，这时通过人为操作，为无法识别的子图片配置相应的物体信息，然后再将基于该子图片而提取的特征数据，添加至该物体信息对应的一组模型数据中，从而完成模型数据的完善。

本发明中，模型识别库中模型数据对应的物体信息为物体的名称或者其他相关的信息，比如图片中的物体为笔记本电脑，那么物体信息是“笔记本电脑”或者“PersonalComputer”的中文名称或者英文名称，再比如图片中的物体为人物，那么物体信息是人的姓名。

而且，在将物体信息关联至子图片前，可根据设置物体信息的格式为图片格式或者音频格式，若选择设置为图片格式，则将物体信息嵌入图片模板，并生成相应的图片，从而以图片格式呈现物体信息，或者选择设置为音频格式，则将物体信息转换为相应的语音，从而以音频格式呈现物体信息。

结合图2所示的本发明装置的结构示意图；其中，本发明标记图片中物体的装置包括，

识别模块，用于基于模型识别库，识别图片中的物体，并获取相匹配的物体信息。

图片划分模块，用于根据图片中被识别到的物体的轮廓，将物体所在的图片区域划分为相应的子图片。

标记模块，用于将物体信息关联至相对应的子图片，以标记子图片。

结合图3所示的本发明识别模块的结构示意图；其中，识别模块包括特征提取子模块和模型匹配子模块。并且，特征提取子模块用于提取图片的特征数据；模型匹配子模块用于从模型识别库中查询与特征数据中任意部分相匹配的模型数据，并且每个模型数据分别对应一条物体信息。

结合图4所示的本发明图片划分模块的结构示意图；其中，图片划分模块包括像素值检测子模块和子图片生成子模块。并且，像素值检测子模块用于检测图片中像素的值；子图片生成子模块用于根据各个模型数据分别与特征数据相匹配的部分，确定模型数据对应的图片中物体的轮廓；以及根据物体的轮廓上的像素值梯度，确定子图片的边界。

结合图5所示的本发明标记模块的结构示意图；其中，标记模块包括关联子模块和渲染子模块。并且，关联子模块用于将为图片格式的物体信息与子图片相关联地显示在图片中，或者将为音频格式的物体信息在子图片处于被选取状态时播放。渲染子模块用于对子图片进行渲染操作。

具体的，渲染子模块与图片划分模块中的子图片生成模块连接，获取需进行渲染操作的子图片，比如通常的渲染操作采用轮廓渲染，使子图片在图片中突出显示。

在实施时，标记模块还包括格式转换子模块，其主要的功能是：若物体信息设置为图片格式，则将物体信息嵌入图片模板，并生成相应的图片，从而以图片格式呈现物体信息；若物体信息设置为音频格式，则将物体信息转换为相应的语音，从而以音频格式呈现物体信息。

本发明标记图片中物体的装置由于需要显示图片以及标记后的效果，应当具备显示元件，而且若物体信息需要转换为音频格式，则还需具备音频输出元件。

上面结合附图对本发明的具体实施方式进行了详细说明，但本发明并不限制于上述实施方式，在不脱离本申请的权利要求的精神和范围情况下，本领域的技术人员可以作出各种修改或改型。

Claims

1.一种标记图片中物体的方法，应用于呈现标记图片的装置，其特征在于，包括，

2.如权利要求1所述的标记图片中物体的方法，其特征在于，基于模型识别库，识别所述图片中的物体，包括，

3.如权利要求2所述的标记图片中物体的方法，其特征在于，根据所述图片中被识别到的物体的轮廓，将所述物体所在的图片区域划分为相应的子图片，包括，

4.如权利要求1所述的标记图片中物体的方法，其特征在于，将所述物体信息关联至相对应的所述子图片，包括，

5.如权利要求1或4所述的标记图片中物体的方法，其特征在于，标记所述子图片还包括，对所述子图片进行渲染操作。

6.一种用于实施如权利要求1所述的标记图片中物体的方法的装置，其特征在于，包括，

7.如权利要求6所述的装置，其特征在于，所述识别模块包括，

特征提取子模块，用于提取所述图片的特征数；

模型匹配子模块，用于从模型识别库中查询与所述特征数据中任意部分相匹配的模型数据，并且每个相匹配的所述模型数据分别对应一条所述物体信息。

8.如权利要求6所述的装置，其特征在于，所述图片划分模块包括，

像素值检测子模块，用于检测所述图片中像素的值；

9.如权利要求6所述的装置，其特征在于，所述标记模块包括，

10.如权利要求6或9所述的装置，其特征在于，所述标记模块包括，

渲染子模块，用于对所述子图片进行渲染操作。