CN112712000A - 一种信息处理装置及其控制方法 - Google Patents
一种信息处理装置及其控制方法 Download PDFInfo
- Publication number
- CN112712000A CN112712000A CN202011555029.8A CN202011555029A CN112712000A CN 112712000 A CN112712000 A CN 112712000A CN 202011555029 A CN202011555029 A CN 202011555029A CN 112712000 A CN112712000 A CN 112712000A
- Authority
- CN
- China
- Prior art keywords
- image
- posture
- acquisition module
- predetermined
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims description 19
- 238000001514 detection method Methods 0.000 claims abstract description 22
- 230000003068 static effect Effects 0.000 claims description 23
- 230000009471 action Effects 0.000 claims description 12
- 241001465754 Metazoa Species 0.000 claims description 8
- 230000007704 transition Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种信息处理装置,所述信息处理装置包括:图像获取模块,用于获取由摄像装置拍摄的图像;检测模块,用于检测所述图像获取模块所获取的图像中有关的位置和姿势因素;信息处理模块,基于检测到的因素来确定是否登记所述图像获取模块所获取的图像;数据处理模块,用于对所述图像进行注册登记,并标记所述图像所对应的位置及姿势因素;图像数据库,对所述图像及标记信息进行存储。以对图像信息进行处理,并将图像信息进行识别并标记,以建立数据库,便于对图像信息进行查找。
Description
技术领域
本发明涉及智能识别领域,具体涉及一种信息处理装置及控制方法。
背景技术
随着科技的进步,利用图片信息记录凭借其详细直观的优点已经成为常规的记录方式,然而,图片信息数据库中,需要对图片信息进行标注,以供后期进行图片查找,在一些领域,由于图片数量较多,手动标注所浪费的时间成本较大。
发明内容
为了解决上述问题,提供一种能够对图片信息进行自动标注的方式,本发明提供了一种信息处理装置及控制方法。
本发明所采取的具体技术方案为:一种信息处理装置,所述信息处理装置包括:
图像获取模块,用于获取由摄像装置拍摄的图像;
检测模块,用于检测所述图像获取模块所获取的图像中有关的位置和姿势因素;
信息处理模块,基于检测到的因素来确定是否登记所述图像获取模块所获取的图像;
数据处理模块,用于对所述图像进行注册登记,并标记所述图像所对应的位置及姿势因素;
图像数据库,对所述图像及标记信息进行存储。
作为优选地,所述检测模块检测图像获取模块获取的图像中存在的预定静态物体和作为所述位置因素;
所述检测模块检测图像获取模块获取的图像中存在的预定运动物体和作为所述姿势因素。
作为优选地,所述检测模块所检测的所述预定静态物体包括山脉、河流、建筑物、摆件、树木以及道路中的至少一者。
作为优选地,所述检测模块所检测的所述预定动态物体包括人体的手势、肢体动作和体态中的至少一者;或者包括动物的体态和肢体动作的至少一者。
作为优选地,所述检测模块包括:分割单元,基于区域的属性将所述图像划分为多个区域,其中,所述区域包括文本属性区域、预定静态物体区域和预定运动物体区域;
检测识别单元,用于分别对所述包括文本属性区域、预定静态物体区域和预定运动物体区域进行识别。一种信息处理装置的控制方法,所述控制方法包括:
S1,获取由摄像装置拍摄的图像;
S2,检测所述图像获取模块所获取的图像中有关的位置和姿势因素;
S3,基于检测到的因素来确定是否登记所述图像获取模块所获取的图像;
S4,用于对所述图像进行注册登记,并标记所述图像所对应的位置及姿势因素;
S5,对所述图像及标记信息进行存储。
如上所一种信息处理装置的控制方法,作为优选地,步骤S2中,检测图像获取模块获取的图像中存在的预定静态物体和作为所述位置因素;
检测图像获取模块获取的图像中存在的预定运动物体和作为所述姿势因素
如上所一种信息处理装置的控制方法,作为优选地,所述预定静态物体包括山脉、河流、建筑物、摆件、树木以及道路中的至少一者。
如上所一种信息处理装置的控制方法,作为优选地,所述预定动态物体包括人体的手势、肢体动作和体态中的至少一者;或者包括动物的体态和肢体动作的至少一者。
如上所一种信息处理装置的控制方法,作为优选地,步骤S2中,基于区域的属性将所述图像划分为多个区域,其中,所述区域包括文本属性区域、预定静态物体区域和预定运动物体区域;
分别对所述包括文本属性区域、预定静态物体区域和预定运动物体区域进行识别。
有益技术效果:本发明提供了一种信息处理装置及控制方法,以对图像信息进行处理,并将图像信息进行识别并标记,以建立数据库,便于对图像信息进行查找。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
其中:
图1是本申请实施例中所提供信息处理装置的线框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作,因此不能理解为对本发明的限制。本发明中使用的术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接;可以是直接相连,也可以通过中间部件间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
一种信息处理装置,所述信息处理装置包括:
图像获取模块,用于获取由摄像装置拍摄的图像;
检测模块,用于检测所述图像获取模块所获取的图像中有关的位置和姿势因素;该位置和姿势因素因素作为标注对象。
信息处理模块,基于检测到的因素来确定是否登记所述图像获取模块所获取的图像;
数据处理模块,用于对所述图像进行注册登记,并标记所述图像所对应的位置及姿势因素;对获取的因素印象分类和筛分,判断对哪些因素进行登记遵循以下原则,大面积优先于小面积,近处优先于远处,数量多优先于数量少。
图像数据库,对所述图像及标记信息进行存储。
本发明提供了一种信息处理装置以对图像信息进行处理,并将图像信息进行识别并标记,以建立数据库,便于对图像信息进行查找。
本发明还具有如下实施方式,所述检测模块检测图像获取模块获取的图像中存在的预定静态物体和作为所述位置因素;
所述检测模块检测图像获取模块获取的图像中存在的预定运动物体和作为所述姿势因素。其中,基于静态物体进行识别,对该图像所处位置因素标记;基于运动物体识别结果,对图像所做动作因素进行标记。
本发明还具有如下实施方式,所述检测模块所检测的所述预定静态物体包括山脉、河流、建筑物、摆件、树木以及道路中的至少一者。
例如识别出图片具有山脉,则位置因素标记为山脉。
本发明还具有如下实施方式,所述检测模块所检测的所述预定动态物体包括人体的手势、肢体动作和体态中的至少一者;或者包括动物的体态和肢体动作的至少一者。
例如识别的预定动作物体为人呈站立姿势,则姿势因素标记为人、站立;
识别的预定动作物体为狗在奔跑,则姿势因素标记为狗、奔跑;
本发明还具有如下实施方式,所述检测模块包括:
分割单元,基于区域的属性将所述图像划分为多个区域,其中,所述区域包括文本属性区域、预定静态物体区域和预定运动物体区域;
将图像进行分割,对分割后的区域进行独立检测,以保证识别精度。
检测识别单元,用于分别对所述包括文本属性区域、预定静态物体区域和预定运动物体区域进行识别。设置文本属性区域,以进行文本类图像的识别。
在一些实施例中,本系统还具有图像推理单元,可通过上述注释信息进行相互关联;即依据已注释的信息之间的相互关系来预测相互关系;
其中可关联的依据来自于图像中所处位置的推移、人或动物肢体动作的转变中的至少一者,从而建立相对位置移动的、姿态转变连续的关联,以进行图像的连续性关联,以基于图像的拍摄位置推移进行位移的关联排列;基于图像内包含人或者动物姿态变化进行时间的关联排列。
一种信息处理装置的控制方法,所述控制方法包括:
S1,获取由摄像装置拍摄的图像;
S2,检测所述图像获取模块所获取的图像中有关的位置和姿势因素;
S3,基于检测到的因素来确定是否登记所述图像获取模块所获取的图像;
S4,用于对所述图像进行注册登记,并标记所述图像所对应的位置及姿势因素;
S5,对所述图像及标记信息进行存储。
本发明提供了一种信息处理装置以对图像信息进行处理,并将图像信息进行识别并标记,以建立数据库,便于对图像信息进行查找。
本发明还具有如下实施方式,步骤S2中,检测图像获取模块获取的图像中存在的预定静态物体和作为所述位置因素;
检测图像获取模块获取的图像中存在的预定运动物体和作为所述姿势因素其中,基于静态物体进行识别,对该图像所处位置因素标记;
基于运动物体识别结果,对图像所做动作因素进行标记。
本发明还具有如下实施方式,所述预定静态物体包括山脉、河流、建筑物、摆件、树木以及道路中的至少一者。
例如识别出图片具有山脉,则位置因素标记为山脉。更进一步的,可以通过互联网与线上类似的风景图片(包含山脉、湖泊、水流、建筑、道路等特征)进行比对,当在互联网上比对出高度符合的图片时,将互联网上图片的说明及属性或地理位置加入该图片信息中。
本发明还具有如下实施方式,所述预定动态物体包括人体的手势、肢体动作和体态中的至少一者;或者包括动物的体态和肢体动作的至少一者。
例如识别的预定动作物体为人呈站立姿势,则姿势因素标记为人、站立;
识别的预定动作物体为狗在奔跑,则姿势因素标记为狗、奔跑;
本发明还具有如下实施方式,步骤S2中,基于区域的属性将所述图像划分为多个区域,其中,所述区域包括文本属性区域、预定静态物体区域和预定运动物体区域;
分别对所述包括文本属性区域、预定静态物体区域和预定运动物体区域进行识别。
将图像进行分割,对分割后的区域进行独立检测,以保证识别精度。设置文本属性区域,以进行文本类图像的识别。
更具体的,例如照片中包含多个已知人名的人物头像,通过搜索人名可以将包含该人物头像的照片搜索出来,或者,照片中包含生日蛋糕,可以通过图像识别将蛋糕进行标示并提供索引,当搜索生日或蛋糕时,将包含生日元素或蛋糕的图像搜出。
在其他实施例中,本发明还以包含语音识别模块,通过语音识别判断使用者欲搜索的关键特征,并将关键特征转为图像的搜索条件,通过标注索引将图像搜出。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上实施方式仅用于说明本申请实施例,而非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专业保护范围应由权利要求限定。
Claims (10)
1.一种信息处理装置,其特征在于,所述信息处理装置包括:
图像获取模块,用于获取由摄像装置拍摄的图像;
检测模块,用于检测所述图像获取模块所获取的图像中有关的位置和姿势因素;
信息处理模块,基于检测到的因素来确定是否登记所述图像获取模块所获取的图像;
数据处理模块,用于对所述图像进行注册登记,并标记所述图像所对应的位置及姿势因素;
图像数据库,对所述图像及标记信息进行存储。
2.根据权利要求1所述的信息处理装置,其特征在于,所述检测模块检测图像获取模块获取的图像中存在的预定静态物体和作为所述位置因素;
所述检测模块检测图像获取模块获取的图像中存在的预定运动物体和作为所述姿势因素。
3.根据权利要求2所述的信息处理装置,其特征在于,所述检测模块所检测的所述预定静态物体包括山脉、河流、建筑物、摆件、树木以及道路中的至少一者。
4.根据权利要求2所述的信息处理装置,其特征在于,所述检测模块所检测的所述预定动态物体包括人体的手势、肢体动作和体态中的至少一者;或者包括动物的体态和肢体动作的至少一者。
5.根据权利要求2-4任一所述的信息处理装置,其特征在于,所述检测模块包括:
分割单元,基于区域的属性将所述图像划分为多个区域,其中,所述区域包括文本属性区域、预定静态物体区域和预定运动物体区域;
检测识别单元,用于分别对所述包括文本属性区域、预定静态物体区域和预定运动物体区域进行识别。
6.一种信息处理装置的控制方法,其特征在于,所述控制方法包括:
S1,获取由摄像装置拍摄的图像;
S2,检测所述图像获取模块所获取的图像中有关的位置和姿势因素;
S3,基于检测到的因素来确定是否登记所述图像获取模块所获取的图像;
S4,用于对所述图像进行注册登记,并标记所述图像所对应的位置及姿势因素;
S5,对所述图像及标记信息进行存储。
7.根据权利要求6所述的一种信息处理装置的控制方法,其特征在于,步骤S2中,检测图像获取模块获取的图像中存在的预定静态物体和作为所述位置因素;
检测图像获取模块获取的图像中存在的预定运动物体和作为所述姿势因素。
8.根据权利要求7所述的一种信息处理装置的控制方法,其特征在于,所述预定静态物体包括山脉、河流、建筑物、摆件、树木以及道路中的至少一者。
9.根据权利要求7所述的一种信息处理装置的控制方法,其特征在于,所述预定动态物体包括人体的手势、肢体动作和体态中的至少一者;或者包括动物的体态和肢体动作的至少一者。
10.根据权利要求7-9所述的一种信息处理装置的控制方法,其特征在于,步骤S2中,基于区域的属性将所述图像划分为多个区域,其中,所述区域包括文本属性区域、预定静态物体区域和预定运动物体区域;
分别对所述包括文本属性区域、预定静态物体区域和预定运动物体区域进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011555029.8A CN112712000A (zh) | 2020-12-24 | 2020-12-24 | 一种信息处理装置及其控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011555029.8A CN112712000A (zh) | 2020-12-24 | 2020-12-24 | 一种信息处理装置及其控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112712000A true CN112712000A (zh) | 2021-04-27 |
Family
ID=75545401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011555029.8A Pending CN112712000A (zh) | 2020-12-24 | 2020-12-24 | 一种信息处理装置及其控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112712000A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219765A (ja) * | 2006-02-15 | 2007-08-30 | Toyota Motor Corp | 画像処理装置、その方法、および画像処理用プログラム |
CN107274450A (zh) * | 2016-04-01 | 2017-10-20 | 佳能株式会社 | 信息处理装置及其控制方法 |
CN107516099A (zh) * | 2017-08-21 | 2017-12-26 | 腾讯科技(深圳)有限公司 | 一种标记图片检测的方法、装置及计算机可读存储介质 |
CN109947975A (zh) * | 2017-11-13 | 2019-06-28 | 株式会社日立制作所 | 图像检索装置、图像检索方法及其中使用的设定画面 |
-
2020
- 2020-12-24 CN CN202011555029.8A patent/CN112712000A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219765A (ja) * | 2006-02-15 | 2007-08-30 | Toyota Motor Corp | 画像処理装置、その方法、および画像処理用プログラム |
CN107274450A (zh) * | 2016-04-01 | 2017-10-20 | 佳能株式会社 | 信息处理装置及其控制方法 |
CN107516099A (zh) * | 2017-08-21 | 2017-12-26 | 腾讯科技(深圳)有限公司 | 一种标记图片检测的方法、装置及计算机可读存储介质 |
CN109947975A (zh) * | 2017-11-13 | 2019-06-28 | 株式会社日立制作所 | 图像检索装置、图像检索方法及其中使用的设定画面 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109117836B (zh) | 一种基于焦点损失函数的自然场景下文字检测定位方法和装置 | |
CN109829467A (zh) | 图像标注方法、电子装置及非暂态电脑可读取储存媒体 | |
CN101410872B (zh) | 道路图像解析装置及道路图像解析方法 | |
CN107657639A (zh) | 一种快速定位目标的方法和装置 | |
CN105430211A (zh) | 内容管理系统、管理内容生成方法以及管理内容再生方法 | |
US9471982B2 (en) | Information processing apparatus and information processing method for associating an image with related information | |
JP2009514107A (ja) | 集合体からの特定の人物の割り出し | |
CN106203237A (zh) | 集装箱拖车编号的识别方法和装置 | |
CN108846333A (zh) | 标志牌地标数据集生成及车辆定位方法 | |
CN104615986A (zh) | 利用多检测器对场景变化的视频图像进行行人检测的方法 | |
Vimina et al. | A sub-block based image retrieval using modified integrated region matching | |
CN113597614A (zh) | 图像处理方法和装置、电子设备及存储介质 | |
Revaud et al. | Did it change? learning to detect point-of-interest changes for proactive map updates | |
CN105760999A (zh) | 一种衣服推荐管理方法及系统 | |
CN106250396B (zh) | 一种图像标签自动生成系统及方法 | |
CN112581495A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111753601B (zh) | 一种图像处理的方法、装置以及存储介质 | |
CN111797704B (zh) | 一种基于相关物体感知的动作识别方法 | |
CN111126102A (zh) | 人员搜索方法、装置及图像处理设备 | |
CN116778347A (zh) | 数据更新方法、装置、电子设备和存储介质 | |
CN112712000A (zh) | 一种信息处理装置及其控制方法 | |
CN112509009A (zh) | 一种基于自然语言信息辅助的目标追踪方法 | |
CN114332435A (zh) | 一种基于三维重建的图像标注方法及装置 | |
KR100790867B1 (ko) | 지역 분할 템플릿을 이용한 카테고리 기반 사진 클러스터링방법 및 장치 | |
JP2000030033A (ja) | 人物検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |