CN106777083A - 一种标记图片中物体的方法及装置 - Google Patents
一种标记图片中物体的方法及装置 Download PDFInfo
- Publication number
- CN106777083A CN106777083A CN201611147559.2A CN201611147559A CN106777083A CN 106777083 A CN106777083 A CN 106777083A CN 201611147559 A CN201611147559 A CN 201611147559A CN 106777083 A CN106777083 A CN 106777083A
- Authority
- CN
- China
- Prior art keywords
- picture
- pictures
- sub
- mark
- object information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种标记图片中物体的方法及装置,其中,本发明首先基于模型识别库,识别出图片中的物体,并获取相匹配的物体信息,然后根据被识别到的物体的轮廓,将该物体所在的图片区域划分为相应的子图片,然后将所获取的物体信息关联至该子图片,以标记该子图片,从而实现对图片中被识别到的物体的标记,因此,本发明通过将识别图片中的物体,并将相匹配的物体信息关联至该物体对应的子图片,能够适应用户更高要求的图片统计分类的应用。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种标记图片中物体的方法及终端。
背景技术
目前,图片在被拍摄时或被制作编辑时,通常会被标记上拍摄地理位置、拍摄时间、最后一次制作编辑的时间或者一些参数信息(光圈、快门速度等),通常,图片被标记的信息作为统计分类的依据,以生成不同的集合,但这样分类的方式过于简单,无法满足用户更高层次的需求。比如,由于图片比较多,需要找出图片中有某个特定物或者某个人的图片,并将这些图片作为一个集合。因此,为了更准确地对图片进行分类统计,需要一种新的标记图片的方法。
发明内容
本发明的目的在于:适应用户对更高要求的统计分类的应用,提供一种标记图片中物体的方法及装置。
为了实现上述发明目的,本发明提供一种标记图片中物体的方法,其包括,
确定需要标记的图片,并基于模型识别库,识别所述图片中的物体,并获取相匹配的物体信息;
根据所述图片中被识别到的物体的轮廓,将所述物体所在的图片区域划分为相应的子图片;
以及通过将所述物体信息关联至相对应的所述子图片,以标记所述子图片。
根据一种具体的实施方式,基于模型识别库,识别所述图片中的物体,包括,
提取所述图片的特征数据,并从模型识别库中查询与所述特征数据中任意部分相匹配的模型数据,并且每个所述模型数据分别对应一条所述物体信息。
根据一种具体的实施方式,根据所述图片中被识别到的物体的轮廓,将所述物体所在的图片区域划分为相应的子图片,包括,
根据所述特征数据中与所述模型数据相匹配的部分,确定所述图片中对应物体的轮廓;根据物体的轮廓上的像素值梯度,确定所述子图片的边界。
根据一种具体的实施方式,将所述物体信息关联至相对应的所述子图片,包括,
若所述物体信息为图片格式,则将所述物体信息与其对应的所述子图片相关联地显示在所述图片中;
或者,若所述物体信息为音频格式,则在所述子图片处于被选取状态时播放所述物体信息。
根据一种具体的实施方式,标记所述子图片还包括,对所述子图片进行渲染操作。
基于同一发明构思,本发明还提供一种用于实施本发明标记图片中物体的方法的装置,其包括,
识别模块,用于基于模型识别库,识别所述图片中的物体,并获取相匹配的物体信息;
图片划分模块,用于根据所述图片中被识别到的物体的轮廓,将所述物体所在的图片区域划分为相应的子图片;
标记模块,用于将所述物体信息关联至相对应的所述子图片,以标记所述子图片。
根据一种具体的实施方式,所述识别模块包括,
特征提取子模块,用于提取所述图片的特征数据;
模型匹配子模块,用于从模型识别库中查询与所述特征数据中任意部分相匹配的模型数据,并且每个所述模型数据分别对应一条所述物体信息。
根据一种具体的实施方式,所述图片划分模块包括,
像素值检测子模块,用于检测所述图片中像素的值;
子图片生成子模块,用于根据各个所述模型数据分别与所述特征数据相匹配的部分,确定所述模型数据对应的图片中物体的轮廓;以及根据物体的轮廓上的像素值梯度,确定所述子图片的边界。
根据一种具体的实施方式,所述标记模块包括,
关联子模块,用于将为图片格式的所述物体信息与所述子图片相关联地显示在所述图片中,或者将为音频格式的所述物体信息在所述子图片处于被选取状态时播放。
根据一种具体的实施方式,所述标记模块包括,
渲染子模块,用于对所述子图片进行渲染操作。
与现有技术相比,本发明的有益效果:本发明首先基于模型识别库,识别出图片中的物体,并获取相匹配的物体信息,然后根据被识别到的物体的轮廓,将该物体所在的图片区域划分为相应的子图片,然后将所获取的物体信息关联至该子图片,以标记该子图片,从而实现对图片中被识别到的物体的标记,因此,本发明通过将识别图片中的物体,并将相匹配的物体信息关联至该物体对应的子图片,能够适应用户更高要求的图片统计分类的应用。
附图说明:
图1是本发明方法工作示意图;
图2是本发明装置的结构示意图;
图3是本发明识别模块的结构示意图
图4是本发明图片划分模块的结构示意图;
图5是本发明标记模块的结构示意图。
具体实施方式
下面结合具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
如图1的本发明方法工作示意图;其中,首先确定需要标记的图片,结合图1可以看出,该需要标记的图片中物体为:一张桌子,放在桌子上的笔记本电脑和显示器。
首先,基于模型识别库,识别该图片中的物体,并获取相匹配的物体信息。按照图1中所示的情况,基于模型识别库,识别出来了桌子上的笔记本电脑和显示器,由于桌子上笔记本电脑和显示器的遮挡,造成无法准确识别出桌子,但是并不影响本发明的实施。
具体的,基于模型识别库,识别图片中的物体的方式为:首先提取图片的特征数据,即包含笔记本电脑、显示器和桌子的特征数据,然后从模型识别库中查询与提取的特征数据中任意部分相匹配的模型数据,即如图1中所示的情况,查询到与笔记本电脑对应的部分特征数据相匹配的模型数据,以及与显示器对应的部分特征数据相匹配的模型数据,但没有查询到与桌子对应的部分特征数据相匹配的模型数据。因此,只识别出了笔记本电脑和显示器,并获得笔记本电脑和显示器分别对应的物体信息。其中,没有识别出图片中的桌子,主要由于桌子对应的部分特征数据相匹配的模型数据不完整,造成在查询过程中其匹配度低于设定阈值。
然后,根据需要标记的图片中,被识别出来的笔记本电脑和显示器的轮廓,将笔记本电脑和显示器所在的图片区域划分为相应的子图片,即根据笔记本电脑的轮廓而生成的第一子图片,以及根据显示器的轮廓而生成的第二子图片。
具体的,根据所提取的特征数据中与模型识别库中的模型数据相匹配的部分,确定该图片中对应物体的轮廓,然后根据该物体的轮廓上的像素值梯度,确定相应的子图片的边界,然后根据所确定的各个子图片的边界,实现子图片的划分。
最后,通过将物体信息关联至相对应的子图片,以标记该子图片。即将笔记本电脑对应的物体信息关联至第一子图片,将显示器对应的物体信息关联至第二子图片。
具体的,将物体信息关联至相对应的子图片的方式为:若物体信息为图片格式,则将该物体信息与其对应的子图片相关联地显示在图片中;若物体信息为音频格式,则在子图片处于被选取状态时播放该物体信息。
此外,标记子图片的方式还可以为:对子图片进行渲染操作。通过渲染操作,使子图片在图片中突出显示。通常的渲染操作为轮廓渲染。
在本发明实施过程中,由于模型识别库中的模型数据的不完善,造成一些子图片无法成功识别,这时通过人为操作,为无法识别的子图片配置相应的物体信息,然后再将基于该子图片而提取的特征数据,添加至该物体信息对应的一组模型数据中,从而完成模型数据的完善。
本发明中,模型识别库中模型数据对应的物体信息为物体的名称或者其他相关的信息,比如图片中的物体为笔记本电脑,那么物体信息是“笔记本电脑”或者“PersonalComputer”的中文名称或者英文名称,再比如图片中的物体为人物,那么物体信息是人的姓名。
而且,在将物体信息关联至子图片前,可根据设置物体信息的格式为图片格式或者音频格式,若选择设置为图片格式,则将物体信息嵌入图片模板,并生成相应的图片,从而以图片格式呈现物体信息,或者选择设置为音频格式,则将物体信息转换为相应的语音,从而以音频格式呈现物体信息。
结合图2所示的本发明装置的结构示意图;其中,本发明标记图片中物体的装置包括,
识别模块,用于基于模型识别库,识别图片中的物体,并获取相匹配的物体信息。
图片划分模块,用于根据图片中被识别到的物体的轮廓,将物体所在的图片区域划分为相应的子图片。
标记模块,用于将物体信息关联至相对应的子图片,以标记子图片。
结合图3所示的本发明识别模块的结构示意图;其中,识别模块包括特征提取子模块和模型匹配子模块。并且,特征提取子模块用于提取图片的特征数据;模型匹配子模块用于从模型识别库中查询与特征数据中任意部分相匹配的模型数据,并且每个模型数据分别对应一条物体信息。
结合图4所示的本发明图片划分模块的结构示意图;其中,图片划分模块包括像素值检测子模块和子图片生成子模块。并且,像素值检测子模块用于检测图片中像素的值;子图片生成子模块用于根据各个模型数据分别与特征数据相匹配的部分,确定模型数据对应的图片中物体的轮廓;以及根据物体的轮廓上的像素值梯度,确定子图片的边界。
结合图5所示的本发明标记模块的结构示意图;其中,标记模块包括关联子模块和渲染子模块。并且,关联子模块用于将为图片格式的物体信息与子图片相关联地显示在图片中,或者将为音频格式的物体信息在子图片处于被选取状态时播放。渲染子模块用于对子图片进行渲染操作。
具体的,渲染子模块与图片划分模块中的子图片生成模块连接,获取需进行渲染操作的子图片,比如通常的渲染操作采用轮廓渲染,使子图片在图片中突出显示。
在实施时,标记模块还包括格式转换子模块,其主要的功能是:若物体信息设置为图片格式,则将物体信息嵌入图片模板,并生成相应的图片,从而以图片格式呈现物体信息;若物体信息设置为音频格式,则将物体信息转换为相应的语音,从而以音频格式呈现物体信息。
本发明标记图片中物体的装置由于需要显示图片以及标记后的效果,应当具备显示元件,而且若物体信息需要转换为音频格式,则还需具备音频输出元件。
上面结合附图对本发明的具体实施方式进行了详细说明,但本发明并不限制于上述实施方式,在不脱离本申请的权利要求的精神和范围情况下,本领域的技术人员可以作出各种修改或改型。
Claims (10)
1.一种标记图片中物体的方法,应用于呈现标记图片的装置,其特征在于,包括,
确定需要标记的图片,并基于模型识别库,识别所述图片中的物体,并获取相匹配的物体信息;
根据所述图片中被识别到的物体的轮廓,将所述物体所在的图片区域划分为相应的子图片;
以及通过将所述物体信息关联至相对应的所述子图片,以标记所述子图片。
2.如权利要求1所述的标记图片中物体的方法,其特征在于,基于模型识别库,识别所述图片中的物体,包括,
提取所述图片的特征数据,并从模型识别库中查询与所述特征数据中任意部分相匹配的模型数据,并且每个所述模型数据分别对应一条所述物体信息。
3.如权利要求2所述的标记图片中物体的方法,其特征在于,根据所述图片中被识别到的物体的轮廓,将所述物体所在的图片区域划分为相应的子图片,包括,
根据所述特征数据中与所述模型数据相匹配的部分,确定所述图片中对应物体的轮廓;根据物体的轮廓上的像素值梯度,确定所述子图片的边界。
4.如权利要求1所述的标记图片中物体的方法,其特征在于,将所述物体信息关联至相对应的所述子图片,包括,
若所述物体信息为图片格式,则将所述物体信息与其对应的所述子图片相关联地显示在所述图片中;
或者,若所述物体信息为音频格式,则在所述子图片处于被选取状态时播放所述物体信息。
5.如权利要求1或4所述的标记图片中物体的方法,其特征在于,标记所述子图片还包括,对所述子图片进行渲染操作。
6.一种用于实施如权利要求1所述的标记图片中物体的方法的装置,其特征在于,包括,
识别模块,用于基于模型识别库,识别所述图片中的物体,并获取相匹配的物体信息;
图片划分模块,用于根据所述图片中被识别到的物体的轮廓,将所述物体所在的图片区域划分为相应的子图片;
标记模块,用于将所述物体信息关联至相对应的所述子图片,以标记所述子图片。
7.如权利要求6所述的装置,其特征在于,所述识别模块包括,
特征提取子模块,用于提取所述图片的特征数;
模型匹配子模块,用于从模型识别库中查询与所述特征数据中任意部分相匹配的模型数据,并且每个相匹配的所述模型数据分别对应一条所述物体信息。
8.如权利要求6所述的装置,其特征在于,所述图片划分模块包括,
像素值检测子模块,用于检测所述图片中像素的值;
子图片生成子模块,用于根据各个所述模型数据分别与所述特征数据相匹配的部分,确定所述模型数据对应的图片中物体的轮廓;以及根据物体的轮廓上的像素值梯度,确定所述子图片的边界。
9.如权利要求6所述的装置,其特征在于,所述标记模块包括,
关联子模块,用于将为图片格式的所述物体信息与所述子图片相关联地显示在所述图片中,或者将为音频格式的所述物体信息在所述子图片处于被选取状态时播放。
10.如权利要求6或9所述的装置,其特征在于,所述标记模块包括,
渲染子模块,用于对所述子图片进行渲染操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147559.2A CN106777083A (zh) | 2016-12-13 | 2016-12-13 | 一种标记图片中物体的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147559.2A CN106777083A (zh) | 2016-12-13 | 2016-12-13 | 一种标记图片中物体的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106777083A true CN106777083A (zh) | 2017-05-31 |
Family
ID=58876695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611147559.2A Pending CN106777083A (zh) | 2016-12-13 | 2016-12-13 | 一种标记图片中物体的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106777083A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107895581A (zh) * | 2017-11-16 | 2018-04-10 | 福建弧聚网络科技有限公司 | 一种图像与音频结合的方法及装置 |
WO2020140607A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 一种语音信号处理方法、设备及计算机可读存储介质 |
CN111522969A (zh) * | 2020-03-31 | 2020-08-11 | 北京旷视科技有限公司 | 图像检索方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2560145A2 (en) * | 2011-08-18 | 2013-02-20 | Layar B.V. | Methods and systems for enabling the creation of augmented reality content |
CN103218854A (zh) * | 2013-04-01 | 2013-07-24 | 成都理想境界科技有限公司 | 在增强现实过程中实现部件标注的方法及增强现实系统 |
CN103426003A (zh) * | 2012-05-22 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 增强现实交互的实现方法和系统 |
CN104657458A (zh) * | 2015-02-06 | 2015-05-27 | 腾讯科技(深圳)有限公司 | 场景图像中的前景目标的目标信息的展示方法及装置 |
-
2016
- 2016-12-13 CN CN201611147559.2A patent/CN106777083A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2560145A2 (en) * | 2011-08-18 | 2013-02-20 | Layar B.V. | Methods and systems for enabling the creation of augmented reality content |
CN103426003A (zh) * | 2012-05-22 | 2013-12-04 | 腾讯科技(深圳)有限公司 | 增强现实交互的实现方法和系统 |
CN103218854A (zh) * | 2013-04-01 | 2013-07-24 | 成都理想境界科技有限公司 | 在增强现实过程中实现部件标注的方法及增强现实系统 |
CN104657458A (zh) * | 2015-02-06 | 2015-05-27 | 腾讯科技(深圳)有限公司 | 场景图像中的前景目标的目标信息的展示方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107895581A (zh) * | 2017-11-16 | 2018-04-10 | 福建弧聚网络科技有限公司 | 一种图像与音频结合的方法及装置 |
WO2020140607A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 一种语音信号处理方法、设备及计算机可读存储介质 |
CN111522969A (zh) * | 2020-03-31 | 2020-08-11 | 北京旷视科技有限公司 | 图像检索方法、装置、计算机设备和存储介质 |
WO2021196551A1 (zh) * | 2020-03-31 | 2021-10-07 | 北京旷视科技有限公司 | 图像检索方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109729420B (zh) | 图片处理方法及装置、移动终端及计算机可读存储介质 | |
CN110557678B (zh) | 视频处理方法、装置及设备 | |
CN109918987B (zh) | 一种视频字幕关键词识别方法及装置 | |
US8285006B2 (en) | Human face recognition and user interface system for digital camera and video camera | |
JP7381775B2 (ja) | 署名に基づく一意の識別子 | |
CN107885430B (zh) | 一种音频播放方法、装置、存储介质及电子设备 | |
CN106024009A (zh) | 音频处理方法及装置 | |
US20140348394A1 (en) | Photograph digitization through the use of video photography and computer vision technology | |
KR20080060265A (ko) | 디지털 영상 컬렉션의 특정 인물 식별 방법 | |
WO2022089170A1 (zh) | 字幕区域识别方法、装置、设备及存储介质 | |
CN112669515B (zh) | 票据图像识别方法、装置、电子设备和存储介质 | |
CN105094760A (zh) | 一种图片标记方法及装置 | |
CN111310634B (zh) | 证件类型识别模板的生成方法、证件识别方法及装置 | |
CN103854019B (zh) | 图像中的字段提取方法及装置 | |
CN106576142B (zh) | 用于使用闪光照明捕捉具有文字的场景图像的设备和方法 | |
CN106649629B (zh) | 一种关联书本与电子资源的系统 | |
CN106777083A (zh) | 一种标记图片中物体的方法及装置 | |
CN106161873A (zh) | 一种视频信息提取推送方法及系统 | |
JP2016189158A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
WO2020125481A1 (zh) | 生成标识图案的方法和终端设备 | |
US20160104052A1 (en) | Text-based thumbnail generation | |
CN104298694A (zh) | 一种照片信息添加方法、装置及移动终端 | |
CN108805519A (zh) | 纸质日程表电子化生成方法、装置及电子日程表生成方法 | |
CN104978577B (zh) | 信息处理方法、装置及电子设备 | |
CN102945377A (zh) | 获取纸质笔记本中内容的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170531 |
|
RJ01 | Rejection of invention patent application after publication |