CN108154091A - 图像展示方法、图像处理方法及装置 - Google Patents

图像展示方法、图像处理方法及装置 Download PDF

Info

Publication number
CN108154091A
CN108154091A CN201711310851.6A CN201711310851A CN108154091A CN 108154091 A CN108154091 A CN 108154091A CN 201711310851 A CN201711310851 A CN 201711310851A CN 108154091 A CN108154091 A CN 108154091A
Authority
CN
China
Prior art keywords
image
target
event
target image
annotation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711310851.6A
Other languages
English (en)
Inventor
陈志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201711310851.6A priority Critical patent/CN108154091A/zh
Publication of CN108154091A publication Critical patent/CN108154091A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开是关于图像展示方法、图像处理方法及装置。该方法包括:获取目标图像;根据目标图像的图像特征,确定目标图像中发生的目标事件;获取与目标事件对应的注释信息;在显示目标图像时,显示注释信息。该技术方案可以增强目标图像的表现力,使用户能够通过观看注释信息感受到图像中所发生事件带来的氛围,从而改善了用户体验。

Description

图像展示方法、图像处理方法及装置
技术领域
本公开涉及信息技术领域,尤其涉及图像展示方法、图像处理方法及装置。
背景技术
随着科学技术的高速发展和人们生活水平的不断提高,近年来包括显示屏的电子设备例如智能手机、平板电脑、笔记本电脑以及智能可穿戴装置等在人们的生活中逐渐普及。其中,电子设备可以通过显示屏显示用户的图像,例如显示用户储存在电子设备中的图像,或用户上传至云相册的图像等。
发明内容
为克服相关技术中存在的问题,本公开的实施例提供一种图像展示方法、图像处理方法及装置。技术方案如下:
根据本公开的实施例的第一方面,提供一种图像展示方法,包括:
获取目标图像;
根据目标图像的图像特征,确定目标图像中发生的目标事件;
获取与目标事件对应的注释信息;
在显示目标图像时,显示注释信息。
本公开的实施例提供的技术方案中,通过获取目标头像,并根据目标图像的图像特征,确定目标图像中发生的目标事件,获取与目标事件对应的注释信息,在显示目标图像时,显示注释信息,以达到用显示注释信息的方式增强目标图像的表现力,使用户能够通过观看注释信息感受到图像中所发生事件带来的氛围,从而改善了用户体验。
在一个实施例中,获取目标图像,包括;
获取多张照片,并获取多张照片中每张照片的拍摄时间;
根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
在一个实施例中,根据目标图像的图像特征,确定目标图像中发生的目标事件,包括:
获取目标图像中每一张图像的图像特征;
基于获取的图像特征,确定目标图像中发生的目标事件。
在一个实施例中,获取与目标事件对应的注释信息,包括:
获取与目标事件对应的事件标识,并根据事件标识在事件注释数据库中进行搜索以获取与目标事件标识对应的注释信息,事件注释数据库用于指示事件标识与注释信息的对应关系。
在一个实施例中,获取目标图像,包括:
获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄;
在至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为目标图像。
在一个实施例中,图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
根据本公开的实施例的第二方面,提供一种图像处理方法,包括:
获取多张图像;
获取多张图像中每一张图像的图像特征;
基于获取的图像特征,确定多张图像中发生的目标事件。
本公开的实施例提供的技术方案中,通过获取多张图像,并获取多张图像中每一张图像的图像特征,基于获取的图像特征,确定多张图像中发生的目标事件,上述方案将多张图像作为一个整体进行考虑,根据多张图像中不同图像的图像特征之间的相互关联性确定该多张图像中发生的事件,与仅确定单张图像中发生的事件相比较,能够提高事件识别的准确性。
在一个实施例中,获取多张图像,包括:
获取多张照片,并获取多张照片中每张照片的拍摄时间;
根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为多张图像。
在一个实施例中,基于获取的图像特征,确定多张图像中发生的目标事件,包括:
获取每种图像特征对应的权重或每种图像特征在多张图像中的出现次数;
确定多张图像中出现的目标图像特征,目标图像特征为权重或出现次数满足要求的图像特征;
根据目标图像特征确定多张图像中发生的目标事件。
在一个实施例中,图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
根据本公开的实施例的第三方面,提供一种图像显示装置,包括:
图像获取模块,用于获取目标图像;
事件确定模块,用于根据目标图像的图像特征,确定目标图像中发生的目标事件;
注释信息获取模块,用于获取与目标事件对应的注释信息;
注释信息显示模块,用于在显示目标图像时,显示注释信息。
在一个实施例中,图像获取模块,包括;
照片获取子模块,用于获取多张照片,并获取多张照片中每张照片的拍摄时间;
目标图像确定子模块,用于根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
在一个实施例中,事件确定模块,包括:
图像特征获取子模块,用于获取目标图像中每一张图像的图像特征;
目标事件确定子模块,用于基于获取的图像特征,确定目标图像中发生的目标事件。
在一个实施例中,注释信息获取模块,包括:
注释信息获取子模块,用于获取与目标事件对应的事件标识,并根据事件标识在事件注释数据库中进行搜索以获取与目标事件标识对应的注释信息,事件注释数据库用于指示事件标识与注释信息的对应关系。
在一个实施例中,图像获取模块,包括:
年龄获取子模块,用于获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄;
图像获取子模块,用于在至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为目标图像。
在一个实施例中,图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
根据本公开的实施例的第四方面,提供一种图像处理装置,包括:
图像获取模块,用于获取多张图像;
图像特征获取模块,用于获取多张图像中每一张图像的图像特征;
目标事件确定模块,用于基于获取的图像特征,确定多张图像中发生的目标事件。
在一个实施例中,图像获取模块,包括:
照片获取子模块,用于获取多张照片,并获取多张照片中每张照片的拍摄时间;
照片聚类子模块,用于根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为多张图像。
在一个实施例中,目标事件确定模块,包括:
参数获取子模块,用于获取每种图像特征对应的权重或每种图像特征在多张图像中的出现次数;
目标图像特征确定子模块,用于确定多张图像中出现的目标图像特征,目标图像特征为权重或出现次数满足要求的图像特征;
事件确定子模块,用于根据目标图像特征确定多张图像中发生的目标事件。
在一个实施例中,图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
根据本公开的实施例的第五方面,提供一种图像展示装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
获取目标图像;
根据目标图像的图像特征,确定目标图像中发生的目标事件;
获取与目标事件对应的注释信息;
在显示目标图像时,显示注释信息。
根据本公开的实施例的第六方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现本公开的实施例的第一方面中任一项方法的步骤。
根据本公开的实施例的第七方面,提供一种图像展示装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
获取多张图像;
获取多张图像中每一张图像的图像特征;
基于获取的图像特征,确定多张图像中发生的目标事件。
根据本公开的实施例的第八方面,提供一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现本公开的实施例的第一方面或第二方面中任一项方法的步骤。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1a是根据一示例性实施例示出的图像展示方法的流程示意图1;
图1b是根据一示例性实施例示出的图像展示方法的流程示意图2;
图1c是根据一示例性实施例示出的图像展示方法的流程示意图3;
图1d是根据一示例性实施例示出的图像展示方法的流程示意图4;
图2a是根据一示例性实施例示出的图像展示方法的流程示意图1;
图2b是根据一示例性实施例示出的图像展示方法的流程示意图2;
图2c是根据一示例性实施例示出的图像展示方法的流程示意图3;
图3是根据一示例性实施例示出的图像展示方法的流程示意图;
图4a是根据一示例性实施例示出的图像展示装置的结构示意图1;
图4b是根据一示例性实施例示出的图像展示装置的结构示意图2;
图4c是根据一示例性实施例示出的图像展示装置的结构示意图3;
图4d是根据一示例性实施例示出的图像展示装置的结构示意图4;
图4e是根据一示例性实施例示出的图像展示装置的结构示意图5;
图5a是根据一示例性实施例示出的图像展示装置的结构示意图1;
图5b是根据一示例性实施例示出的图像展示装置的结构示意图2;
图5c是根据一示例性实施例示出的图像展示装置的结构示意图3;
图6是根据一示例性实施例示出的一种装置的框图;
图7是根据一示例性实施例示出的一种装置的框图;
图8是根据一示例性实施例示出的一种装置的框图;
图9是根据一示例性实施例示出的一种装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
随着科学技术的高速发展和人们生活水平的不断提高,近年来包括显示屏的电子设备例如智能手机、平板电脑、笔记本电脑以及智能可穿戴装置等在人们的生活中逐渐普及。其中当在电子设备中储存有用户的图像,或其他装置或系统例如云端服务器上储存有用户的图像时,电子设备可以获取用户的图像,并通过显示屏展示该图像,以便于用户观看显示屏所展示的图像。虽然上述方案可以使用户观看到相应图像,但仅显示图像的表现力较差,用户无法感受到图像中所发生事件带来的氛围,从而损害了用户体验。
为了解决上述问题,本公开的实施例提供的技术方案中,通过获取目标头像,并根据目标图像的图像特征,确定目标图像中发生的目标事件,获取与目标事件对应的注释信息,在显示目标图像时,显示注释信息,以达到用显示注释信息的方式增强目标图像的表现力,使用户能够通过观看注释信息感受到图像中所发生事件带来的氛围,从而改善了用户体验。
本公开的实施例提供了一种图像展示方法,该方法应用于电子设备,电子设备可以为手机,平板电脑,智能可穿戴装置等,如图1a所示,包括如下步骤101至步骤104:
在步骤101中,获取目标图像。
示例性的,获取目标图像可以为读取事先储存在电子设备中的目标图像,也可以为电子设备从其他装置或系统处获取目标图像。
在步骤102中,根据目标图像的图像特征,确定目标图像中发生的目标事件。
示例性的,图像特征可以包括图像中的物体、图像中的人物以及图像中的场景中至少一项。根据目标图像的图像特征,确定目标图像中发生的目标事件,可以为识别目标图像的图像特征,并确定与图像特征对应的事件。例如:
当图像特征包括目标图像中的物体时,可以使用物体识别算法例如haar特征识别算法等,对目标图像进行物体识别以确定目标图像中的物体,并根据物体识别结果确定目标图像中的物体,在物体事件数据库中查询与目标图像中的物体对应的事件即目标图像中发生的事件。其中,物体事件数据库用于指示至少一项物体与事件的对应关系,物体事件数据库可以为事先储存在电子设备中,也可以为电子设备从其他装置或系统处获取。
当图像特征包括目标图像中的人物时,可以对目标图像进行人脸识别以确定目标图像中的人物,并在人物事件数据库中查询与目标图像中的人物对应的事件即目标图像中发生的事件。其中,人物事件数据库用于指示至少一个人物与事件的对应关系,人物事件数据库可以为事先储存在电子设备中,也可以为电子设备从其他装置或系统处获取,需要说明的是,对目标图像进行人脸识别,可以为获取由用户提供的多张标准人物照片,每张标准人物照片中的人脸分别为不同人物的人脸,将目标图像中的人脸分别与每一张标准人物照片中的人脸进行对比以获取两者的相似程度,当目标图像中的人脸与目标标准人物照片中的人脸的相似度大于或等于目标人物相似度时,确定该目标图像中的人脸为目标标准人物照片对应的人物。例如,可以获取由用户提供的家庭相册,该家庭相册包括父亲的照片、母亲的照片、祖父的照片,其中父亲的照片包括父亲的人脸、母亲的照片包括母亲的人脸、祖父的照片包括祖父的人脸,通过对比目标图像中的人脸与家庭相册中每一张图像中的人脸的相似程度,当目标图像中的人脸与父亲的照片中的人脸的相似程度大于或等于目标人物相似度时,确定目标图像中的人脸为父亲的人脸。
当图像特征包括目标图像中的场景时,可以对目标图像进行场景识别以确定目标图像中的场景,并在场景事件数据库中查询与目标图像中的场景对应的事件即目标图像中发生的事件。其中,场景事件数据库用于指示至少一个场景与事件的对应关系,场景事件数据库可以为事先储存在电子设备中,也可以为电子设备从其他装置或系统处获取。需要说明的是,对目标图像进行场景识别,可以为将目标图像输入场景卷积神经网络进行检测,并根据检测结果确定目标图像中的场景,其中场景卷积神经网络为根据至少两帧训练图像对卷积神经网络进行训练获取,至少两帧训练图像分别包括不同的场景。通过将包括不同场景的图像输入预设的卷积神经网络模型,用于对该卷积神经网络进行训练,该卷积神经网络可以根据输入的包括不同场景的图像自适应的提取各场景的图像特征,并自适应的调整以及生成该卷积神经网络中每一个节点对应的参数。例如,可以将包括吃饭场景的图片、包括睡觉场景的图片、包括玩耍场景的图片输入预设的卷积神经网络模型以生成场景卷积神经网络。在场景卷积神经网络中,可以包括输入层、卷积层、链接层以及输出层,其中输入层用于为待检测图像提供输入通道;卷积层用于对场景的图像特征进行提取,链接层可以对卷积层提取出的场景的图像特征进行整合;输出层用于输出对输入的待检测图像的检测结果。
在步骤103中,获取与目标事件对应的注释信息。
示例性的,注释信息可以为文字信息例如儿歌歌词,也可以为图片信息例如卡通图片等。获取与目标事件对应的注释信息,可以为根据目标事件在事件注释数据库中进行搜索以获取与目标事件标识对应的注释信息,其中事件注释数据库用于指示事件标识与注释信息的对应关系,事件注释数据库可以为事先储存在电子设备中,也可以存储在其他装置或系统处,通过向所述装置或系统进行查询得到所述注释信息。
在步骤104中,在显示目标图像时,显示注释信息。
示例性的,在显示目标图像时,显示注释信息,可以为通过显示屏展示目标图像以及注释信息,其中注释信息可以位于目标图像的上方、下方、左侧或右侧,也可以叠加在目标图像上进行显示,其中注释信息可以叠加在目标图像上的偏下部、偏左部、偏右部或偏上部,也可以叠加在目标图像上的中央,例如,当注释信息为目标儿歌中的至少一句歌词时,可以将该句歌词叠加在目标图像的偏下部一同进行显示,进一步的,还可以通过扬声器播放朗读目标文字信息的语音。
本公开的实施例提供的技术方案中,通过获取目标头像,并根据目标图像的图像特征,确定目标图像中发生的目标事件,获取与目标事件对应的注释信息,在显示目标图像时,显示注释信息,以达到用显示注释信息的方式增强目标图像的表现力,使用户能够通过观看注释信息感受到图像中所发生事件带来的氛围,从而改善了用户体验。
在一个实施例中,如图1b所示,在步骤101中,获取目标图像,可以通过步骤1011至步骤1012实现:
在步骤1011中,获取多张照片,并获取多张照片中每张照片的拍摄时间。
示例性的,可以通过终端例如智能手机拍摄多张照片,并记录终端拍摄每一张照片时的时间,即每张照片的拍摄时间。
在步骤1012中,根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
示例性的,可以使用混合高斯模型(Gaussian Mixture-based Model,GMM)聚类方法或K均值(K-means)聚类方法根据拍摄时间将多张照片聚成多个类,其中每个类包含至少一张照片,并在该多个类中任选一个类中的照片为目标图像。
需要说明的是,还可以根据预设方案将多张照片的拍摄时间分为多个时间区间,并确定拍摄时间属于同一个时间区间的照片确定为目标图像,例如,可以根据多张照片的拍摄时间将多找照片分为1月1日上午(1月1日8:00至1月1日12:00)、1月1日下午(1月1日12:00至1月1日18:00)、1月1日晚上(1月1日18:00至1月1日22:00)等3个时间区间,并将属于同一个时间区间的照片确定为目标图像。
通过获取多张照片,获取多张照片中每张照片的拍摄时间,并根据拍摄时间对多张照片进行聚类,确定同属于一类的一张以上照片为目标图像,可以确保目标图像中的照片是在同一时段内拍摄的,而在同一时段拍摄的照片通常都是针对同一主题或相似主题的事件,因此目标图像的图像特征与同一主题或相似主题的事件即目标事件之间的关系也较为单一,在根据目标图像的图像特征确定目标事件时,其准确性更高。
在一个实施例中,如图1c所示,在步骤102中,根据目标图像的图像特征,确定目标图像中发生的目标事件,可以通过步骤1021至1022实现:
在步骤1021中,获取目标图像中每一张图像的图像特征。
示例性的,获取目标图像中每一张图像的图像特征,可以为参照上述实施例102中的内容获取目标图像中每一张图像的物体、人物以及场景中至少一项。
在步骤1022中,基于获取的图像特征,确定目标图像中发生的目标事件。
需要说明的是,所获取的图像特征,可以理解为发生在同一时段的多张图像的特征。示例性的,基于获取的图像特征,确定目标图像中发生的目标事件,可以为对目标图像中所有图像中的图像特征进行统计,并根据统计结果确定目标图像中发生的目标事件。例如,获取目标图像中每一张图像中的物体与场景,并统计在目标图像中所有图像中出现过的所有物体与场景,根据统计结果中的物体与场景在物体场景事件数据库中进行查询,并根据查询结果确定目标事件,该物体场景事件数据库用于指示物体以及场景与事件的对应关系。需要说明的是,确定目标图像中发生的目标事件,并不限定于以上方式。确定目标图像中发生的目标事件,还可以为根据获取的图像特征依据预设方法确定目标图像中发生的目标事件发生的时间,并根据目标时间确定目标事件。
通过获取目标图像中每一张图像的图像特征,并基于获取的图像特征,确定目标图像中发生的目标事件,是将目标图像中的多张图像中发生的事件作为一个整体进行考虑,确保目标事件与目标图像中每一张图像中的图像特征均存在关联,提高了确定目标事件的准确性。
在一个实施例中,如图1d所示,在步骤101中,获取目标图像,可以通过步骤1013至步骤1014实现:
在步骤1013中,获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄。
示例性的,对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄,可以为将至少一张待展示图像中的所有人脸作为待识别人脸,并对所有待识别人脸进行年龄识别,以确定至少一张待展示图像中所有人脸的年龄。
其中,对待识别人脸进行年龄识别,可以在人脸模板数据库中确定与待识别人脸匹配的人脸图像样本,其中人脸模板数据库中储存有若干人脸图像样本以及与各图像样本对应的年龄,当查找到匹配的人脸图像样本时,得到与该匹配的人脸图像样本对应的用户年龄,即待识别人脸的年龄。需要说明的是,人脸模板数据库中确定与待识别人脸图像匹配的人脸图像样本,可以为提取待识别人脸的人脸特征向量,并计算待识别人脸的人脸特征向量与人脸模板数据库各图像样本的人脸特征向量的相似度,将相似度超过预设阈值的图像样本确定为与待识别人脸图像匹配的人脸图像样本。需要说明的是,对待识别人脸进行年龄识别可参照相关技术,本公开的实施例在此不做限定。
在步骤1014中,在至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为目标图像。
示例性的,目标年龄可以为一个或多个预设年龄区间。例如,目标年龄可以为0至6岁。
通过获取至少一张待展示图像,对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄,并在至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为目标图像,其中目标年龄可以被理解为用户所关心的人物的年龄,例如当目标年龄为0至6岁时,用户所关心的人物为婴幼儿,从而确保所获取的目标图像为包括用户所关心的人物的图像。
本公开的实施例提供了一种图像展示方法,该方法应用于电子设备,电子设备可以为手机,平板电脑,智能可穿戴装置等,如图2a所示,包括如下步骤201至步骤203:
在步骤201中,获取多张图像。
示例性的,获取多张图像,可以为读取事先储存在电子设备中的目标图像,也可以为电子设备从其他装置或系统处获取目标图像。
在步骤202中,获取多张图像中每一张图像的图像特征。
示例性的,图像特征可以包括图像中的物体、图像中的人物以及图像中的场景中至少一项。获取图像的图像特征,可以参照上述实施例102中内容,在此不再赘述。
在步骤203中,基于获取的图像特征,确定多张图像中发生的目标事件。
示例性的,基于获取的图像特征,确定多张图像中发生的目标事件,可以为对所获取的图像特征进行统计以确定在多张图像中出现的图像特征,并根据统计结果确定目标图像中发生的目标事件。例如,所获取的图像特征包括多张图像中每一张图像中的场景,进行统计并根据统计结果能够获取场景集合,该场景集合包括在多张图像中出现过的所有场景,根据统计结果中的场景在场景事件数据库中进行查询,并根据查询结果确定目标事件,该场景事件数据库用于指示场景集合与事件的对应关系。
本公开的实施例提供的技术方案中,通过获取多张图像,并获取多张图像中每一张图像的图像特征,基于获取的图像特征,确定多张图像中发生的目标事件,上述方案将多张图像作为一个整体进行考虑,根据多张图像中不同图像的图像特征之间的相互关联性确定该多张图像中发生的事件,与仅确定单张图像中发生的事件相比较,能够提高事件识别的准确性。
在一个实施例中,如图2b所示,在步骤201中,获取多张图像,可以通过步骤2011至步骤2012实现:
在步骤2011中,获取多张照片,并获取多张照片中每张照片的拍摄时间。
示例性的,可以通过终端例如智能手机拍摄多张照片,并记录终端拍摄每一张照片时的时间,即每张照片的拍摄时间。
在步骤2012中,根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为多张图像。
示例性的,可以使用混合高斯模型(Gaussian Mixture-based Model,GMM)聚类方法或K均值(K-means)聚类方法根据拍摄时间将多张照片聚成多个类,其中每个类包含至少一张照片,并在该多个类中任选一个类中的照片为目标图像。
通过获取多张照片,获取多张照片中每张照片的拍摄时间,并根据拍摄时间对多张照片进行聚类,确定同属于一类的一张以上照片为目标图像,可以确保目标图像中发生的目标事件为发生时间较为接近的事件,由于发生时间较为接近的事件的主题较为单一,因此目标图像的图像特征与目标事件之间的关系也较为单一,在根据目标图像的图像特征确定目标事件时,其准确性更高。
在一个实施例中,如图2c所示,在步骤203中,基于获取的图像特征,确定多张图像中发生的目标事件,可以通过步骤2031至步骤2033实现:
在步骤2031中,获取每种图像特征对应的权重或每种图像特征在多张图像中的出现次数。
示例性的,获取每种图像特征对应的权重,可以为在图像特征权重数据库中进行查询以确定每种图像特征对应的权重,其中图像特征权重数据库用于指示图像特征与权重的对应关系,图像特征权重数据库可以为事先储存在电子设备中,也可以为从其他装置或系统处获取。
在步骤2032中,确定多张图像中出现的目标图像特征,目标图像特征为权重或出现次数满足要求的图像特征。
示例性的,当图像特征对应的权重大于或等于权重阈值时,确定该图像特征为权重满足要求的目标图像特征,同样的,当图像特征的出现次数大于或等于出现次数阈值时,确定该图像特征为出现次数满足要求的目标图像特征。需要说明的是,目标图像特征可以包括一个或多个图像特征。权重阈值与出现次数阈值可以为事先储存在电子设备中,也可以为从其他装置或系统处获取。
在步骤2033中,根据目标图像特征确定多张图像中发生的目标事件。
通过获取每种图像特征对应的权重或每种图像特征在多张图像中的出现次数,确定多张图像中出现的权重或出现次数满足要求的目标图像特征,即与用户所关心事件关系较为密切的图像特征或与发生频率较高的事件关系较为密切的图像特征,并根据目标图像特征确定多张图像中发生的目标事件,可以使所确定的目标事件为用户所关心的事件或发生频率较高的事件。
图3是根据一示例性实施例示出的一种图像展示方法的示意性流程图进行说明。如图3所示,包括以下步骤:
在步骤301中,获取多张照片,并获取多张照片中每张照片的拍摄时间。
在步骤302中,根据拍摄时间对多张照片进行聚类。
在步骤303中,对多张照片进行人脸年龄识别以获取每张照片中人脸的年龄。
在步骤304中,在同属于一类的一张以上照片中确定包括年龄为目标年龄的人脸的照片为目标图像。
在步骤305中,获取目标图像中每一张图像的图像特征。
在步骤306中,基于获取的图像特征,确定目标图像中发生的目标事件。
在步骤307中,获取与目标事件对应的事件标识,并根据事件标识在事件注释数据库中进行搜索以获取与目标事件标识对应的注释信息。
事件注释数据库用于指示事件标识与注释信息的对应关系。
在步骤308中,在显示目标图像时,显示注释信息。
本公开的实施例提供的技术方案中,通过获取目标头像,并根据目标图像的图像特征,确定目标图像中发生的目标事件,获取与目标事件对应的注释信息,在显示目标图像时,显示注释信息,以达到用显示注释信息的方式增强目标图像的表现力,使用户能够通过观看注释信息感受到图像中所发生事件带来的氛围,从而改善了用户体验。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图4a是根据一个示例性实施例示出的一种图像展示装置40的框图,图像展示装置40可以为电子设备也可以为电子设备的一部分,图像展示装置40可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图4a所示,该图像展示装置40包括:
图像获取模块401,用于获取目标图像。
事件确定模块402,用于根据目标图像的图像特征,确定目标图像中发生的目标事件。
注释信息获取模块403,用于获取与目标事件对应的注释信息。
注释信息显示模块404,用于在显示目标图像时,显示注释信息。
在一个实施例中,如图4b所示,图像获取模块401,包括;
照片获取子模块4011,用于获取多张照片,并获取多张照片中每张照片的拍摄时间。
目标图像确定子模块4012,用于根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
在一个实施例中,如图4c所示,事件确定模块402,包括:
图像特征获取子模块4021,用于获取目标图像中每一张图像的图像特征。
目标事件确定子模块4022,用于基于获取的图像特征,确定目标图像中发生的目标事件。
在一个实施例中,如图4d所示,注释信息获取模块403,包括:
注释信息获取子模块4031,用于获取与目标事件对应的事件标识,并根据事件标识在事件注释数据库中进行搜索以获取与目标事件标识对应的注释信息,事件注释数据库用于指示事件标识与注释信息的对应关系。
在一个实施例中,如图4e所示,图像获取模块401,包括:
年龄获取子模块4013,用于获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄。
图像获取子模块4014,用于在至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为目标图像。
在一个实施例中,图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
本公开的实施例提供的一种图像展示装置,该图像展示装置通过获取目标头像,并根据目标图像的图像特征,确定目标图像中发生的目标事件,获取与目标事件对应的注释信息,在显示目标图像时,显示注释信息,以达到用显示注释信息的方式增强目标图像的表现力,使用户能够通过观看注释信息感受到图像中所发生事件带来的氛围,从而改善了用户体验。
图5a是根据一个示例性实施例示出的一种图像展示装置50的框图,图像展示装置50可以为电子设备也可以为电子设备的一部分,图像展示装置50可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图5a所示,该图像展示装置50包括:
图像获取模块501,用于获取多张图像。
图像特征获取模块502,用于获取多张图像中每一张图像的图像特征。
目标事件确定模块503,用于基于获取的图像特征,确定多张图像中发生的目标事件。
在一个实施例中,如图5b所示,图像获取模块501,包括:
照片获取子模块5012,用于获取多张照片,并获取多张照片中每张照片的拍摄时间。
照片聚类子模块5013,用于根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为多张图像。
在一个实施例中,如图5c所示,目标事件确定模块503,包括:
参数获取子模块5031,用于获取每种图像特征对应的权重或每种图像特征在多张图像中的出现次数。
目标图像特征确定子模块5032,用于确定多张图像中出现的目标图像特征,目标图像特征为权重或出现次数满足要求的图像特征。
事件确定子模块5033,用于根据目标图像特征确定多张图像中发生的目标事件。
本公开的实施例提供的一种图像展示装置,该图像展示装置通过获取多张图像,并获取多张图像中每一张图像的图像特征,基于获取的图像特征,确定多张图像中发生的目标事件,上述方案将多张图像作为一个整体进行考虑,根据多张图像中不同图像的图像特征之间的相互关联性确定该多张图像中发生的事件,与仅确定单张图像中发生的事件相比较,能够提高事件识别的准确性。
图6是根据一示例性实施例示出的一种图像展示装置60的框图,该图像展示装置60可以为电子设备也可以为电子设备的一部分,图像展示装置60包括:
处理器601;
用于存储处理器601可执行指令的存储器602;
其中,处理器601被配置为:
获取目标图像;
根据目标图像的图像特征,确定目标图像中发生的目标事件;
获取与目标事件对应的注释信息;
在显示目标图像时,显示注释信息。
在一个实施例中,处理器601还被配置为:
获取目标图像,包括;
获取多张照片,并获取多张照片中每张照片的拍摄时间;
根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
在一个实施例中,处理器601还被配置为:
根据目标图像的图像特征,确定目标图像中发生的目标事件,包括:
获取目标图像中每一张图像的图像特征;
基于获取的图像特征,确定目标图像中发生的目标事件。
在一个实施例中,处理器601还被配置为:
获取与目标事件对应的注释信息,包括:
获取与目标事件对应的事件标识,并根据事件标识在事件注释数据库中进行搜索以获取与目标事件标识对应的注释信息,事件注释数据库用于指示事件标识与注释信息的对应关系。
在一个实施例中,处理器601还被配置为:
获取目标图像,包括:
获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄;
在至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为目标图像。
在一个实施例中,处理器601还被配置为:
图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
图7是根据一示例性实施例示出的一种图像展示装置70的框图,该图像展示装置70可以为电子设备也可以为电子设备的一部分,图像展示装置70包括:
处理器701;
用于存储处理器701可执行指令的存储器702;
其中,处理器701被配置为:
获取多张图像;
获取多张图像中每一张图像的图像特征;
基于获取的图像特征,确定多张图像中发生的目标事件。
在一个实施例中,处理器701还被配置为:
获取多张图像,包括:
获取多张照片,并获取多张照片中每张照片的拍摄时间;
根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为多张图像。
在一个实施例中,处理器701还被配置为:
基于获取的图像特征,确定多张图像中发生的目标事件,包括:
获取每种图像特征对应的权重或每种图像特征在多张图像中的出现次数;
确定多张图像中出现的目标图像特征,目标图像特征为权重或出现次数满足要求的图像特征;
根据目标图像特征确定多张图像中发生的目标事件。
在一个实施例中,处理器701还被配置为:
图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
图8是根据一示例性实施例示出的一种用于展示图像的装置800的框图,该装置800适用于终端。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置未存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置800的处理器执行时,使得装置800能够执行上述图像展示方法,所述方法包括:
获取目标图像;
根据目标图像的图像特征,确定目标图像中发生的目标事件;
获取与目标事件对应的注释信息;
在显示目标图像时,显示注释信息。
在一个实施例中,获取目标图像,包括;
获取多张照片,并获取多张照片中每张照片的拍摄时间;
根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
在一个实施例中,根据目标图像的图像特征,确定目标图像中发生的目标事件,包括:
获取目标图像中每一张图像的图像特征;
基于获取的图像特征,确定目标图像中发生的目标事件。
在一个实施例中,获取与目标事件对应的注释信息,包括:
获取与目标事件对应的事件标识,并根据事件标识在事件注释数据库中进行搜索以获取与目标事件标识对应的注释信息,事件注释数据库用于指示事件标识与注释信息的对应关系。
在一个实施例中,获取目标图像,包括:
获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄;
在至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为目标图像。
在一个实施例中,图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
图9是根据一示例性实施例示出的一种用于展示图像的装置900的框图,该装置900适用于第一终端。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置未存储各种类型的数据以支持在装置900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。
多媒体组件908包括在装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当装置900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到装置900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由装置900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置900的处理器执行时,使得装置900能够执行上述图像展示方法,所述方法包括:
获取多张图像;
获取多张图像中每一张图像的图像特征;
基于获取的图像特征,确定多张图像中发生的目标事件。
在一个实施例中,获取多张图像,包括:
获取多张照片,并获取多张照片中每张照片的拍摄时间;
根据拍摄时间对多张照片进行聚类,并确定同属于一类的一张以上照片为多张图像。
在一个实施例中,基于获取的图像特征,确定多张图像中发生的目标事件,包括:
获取每种图像特征对应的权重或每种图像特征在多张图像中的出现次数;
确定多张图像中出现的目标图像特征,目标图像特征为权重或出现次数满足要求的图像特征;
根据目标图像特征确定多张图像中发生的目标事件。
在一个实施例中,图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (23)

1.一种图像展示方法,其特征在于,包括:
获取目标图像;
根据所述目标图像的图像特征,确定所述目标图像中发生的目标事件;
获取与所述目标事件对应的注释信息;
在显示所述目标图像时,显示所述注释信息。
2.根据1所述的图像展示方法,其特征在于,所述获取目标图像,包括;
获取多张照片,并获取所述多张照片中每张照片的拍摄时间;
根据所述拍摄时间对所述多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
3.根据权利要求2所述的图像展示方法,其特征在于,所述根据所述目标图像的图像特征,确定所述目标图像中发生的目标事件,包括:
获取所述目标图像中每一张图像的图像特征;
基于获取的图像特征,确定所述目标图像中发生的目标事件。
4.根据权利要求1所述的图像展示方法,其特征在于,所述获取与所述目标事件对应的注释信息,包括:
获取与所述目标事件对应的事件标识,并根据所述事件标识在事件注释数据库中进行搜索以获取与所述目标事件标识对应的注释信息,所述事件注释数据库用于指示事件标识与注释信息的对应关系。
5.根据权利要求1所述的图像展示方法,其特征在于,所述获取目标图像,包括:
获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄;
在所述至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为所述目标图像。
6.根据1所述的图像展示方法,其特征在于,所述图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
7.一种图像处理方法,其特征在于,包括:
获取多张图像;
获取所述多张图像中每一张图像的图像特征;
基于获取的图像特征,确定所述多张图像中发生的目标事件。
8.根据权利要求7所述的图像处理方法,其特征在于,所述获取多张图像,包括:
获取多张照片,并获取所述多张照片中每张照片的拍摄时间;
根据所述拍摄时间对所述多张照片进行聚类,并确定同属于一类的一张以上照片为所述多张图像。
9.根据7所述的图像处理方法,其特征在于,所述基于获取的图像特征,确定所述多张图像中发生的目标事件,包括:
获取每种图像特征对应的权重或每种图像特征在所述多张图像中的出现次数;
确定所述多张图像中出现的目标图像特征,所述目标图像特征为权重或出现次数满足要求的图像特征;
根据所述目标图像特征确定所述多张图像中发生的目标事件。
10.根据7所述的图像处理方法,其特征在于,所述图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
11.一种图像显示装置,其特征在于,包括:
图像获取模块,用于获取目标图像;
事件确定模块,用于根据所述目标图像的图像特征,确定所述目标图像中发生的目标事件;
注释信息获取模块,用于获取与所述目标事件对应的注释信息;
注释信息显示模块,用于在显示所述目标图像时,显示所述注释信息。
12.根据11所述的图像显示装置,其特征在于,所述图像获取模块,包括;
照片获取子模块,用于获取多张照片,并获取所述多张照片中每张照片的拍摄时间;
目标图像确定子模块,用于根据所述拍摄时间对所述多张照片进行聚类,并确定同属于一类的一张以上照片为目标图像。
13.根据权利要求12所述的图像显示装置,其特征在于,所述事件确定模块,包括:
图像特征获取子模块,用于获取所述目标图像中每一张图像的图像特征;
目标事件确定子模块,用于基于获取的图像特征,确定所述目标图像中发生的目标事件。
14.根据权利要求11所述的图像展示装置,其特征在于,所述注释信息获取模块,包括:
注释信息获取子模块,用于获取与所述目标事件对应的事件标识,并根据所述事件标识在事件注释数据库中进行搜索以获取与所述目标事件标识对应的注释信息,所述事件注释数据库用于指示事件标识与注释信息的对应关系。
15.根据权利要求11所述的图像展示装置,其特征在于,所述图像获取模块,包括:
年龄获取子模块,用于获取至少一张待展示图像,并对至少一张待展示图像进行人脸年龄识别以获取每张待展示图像中人脸的年龄;
图像获取子模块,用于在所述至少一张待展示图像中确定包括年龄为目标年龄的人脸的待展示图像为所述目标图像。
16.根据11所述的图像显示装置,其特征在于,所述图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
17.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取多张图像;
图像特征获取模块,用于获取所述多张图像中每一张图像的图像特征;
目标事件确定模块,用于基于获取的图像特征,确定所述多张图像中发生的目标事件。
18.根据权利要求17所述的图像处理装置,其特征在于,所述图像获取模块,包括:
照片获取子模块,用于获取多张照片,并获取所述多张照片中每张照片的拍摄时间;
照片聚类子模块,用于根据所述拍摄时间对所述多张照片进行聚类,并确定同属于一类的一张以上照片为所述多张图像。
19.根据17所述的图像处理装置,其特征在于,所述目标事件确定模块,包括:
参数获取子模块,用于获取每种图像特征对应的权重或每种图像特征在所述多张图像中的出现次数;
目标图像特征确定子模块,用于确定所述多张图像中出现的目标图像特征,所述目标图像特征为权重或出现次数满足要求的图像特征;
事件确定子模块,用于根据所述目标图像特征确定所述多张图像中发生的目标事件。
20.根据17所述的图像处理装置,其特征在于,所述图像特征包括图像中的物体、图像中的人物以及图像中的场景中至少一项。
21.一种图像展示装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取目标图像;
根据所述目标图像的图像特征,确定所述目标图像中发生的目标事件;
获取与所述目标事件对应的注释信息;
在显示所述目标图像时,显示所述注释信息。
22.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-6任一项或权利要求7-10任一项所述方法的步骤。
23.一种图像展示装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取多张图像;
获取所述多张图像中每一张图像的图像特征;
基于获取的图像特征,确定所述多张图像中发生的目标事件。
CN201711310851.6A 2017-12-11 2017-12-11 图像展示方法、图像处理方法及装置 Pending CN108154091A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711310851.6A CN108154091A (zh) 2017-12-11 2017-12-11 图像展示方法、图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711310851.6A CN108154091A (zh) 2017-12-11 2017-12-11 图像展示方法、图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN108154091A true CN108154091A (zh) 2018-06-12

Family

ID=62466941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711310851.6A Pending CN108154091A (zh) 2017-12-11 2017-12-11 图像展示方法、图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN108154091A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109557109A (zh) * 2018-12-29 2019-04-02 中国肉类食品综合研究中心 冷冻肉品包装状态的检测方法及装置
CN110321935A (zh) * 2019-06-13 2019-10-11 上海上湖信息技术有限公司 业务事件关系确定方法及装置、计算机可读存储介质
CN110996030A (zh) * 2019-12-20 2020-04-10 Tcl移动通信科技(宁波)有限公司 视频生成方法、装置、存储介质及终端设备
CN111526287A (zh) * 2020-04-27 2020-08-11 北京达佳互联信息技术有限公司 图像拍摄方法、装置、电子设备、服务器、系统及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150161094A1 (en) * 2013-12-10 2015-06-11 Electronics And Telecommunications Research Institute Apparatus and method for automatically generating visual annotation based on visual language
CN105302315A (zh) * 2015-11-20 2016-02-03 小米科技有限责任公司 图片处理方法及装置
CN106547850A (zh) * 2016-10-18 2017-03-29 北京小米移动软件有限公司 表情注释方法及装置
CN106792004A (zh) * 2016-12-30 2017-05-31 北京小米移动软件有限公司 内容项目推送方法、装置及系统
CN107133576A (zh) * 2017-04-17 2017-09-05 北京小米移动软件有限公司 用户年龄识别方法及装置
CN107133354A (zh) * 2017-05-25 2017-09-05 北京小米移动软件有限公司 图像描述信息的获取方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150161094A1 (en) * 2013-12-10 2015-06-11 Electronics And Telecommunications Research Institute Apparatus and method for automatically generating visual annotation based on visual language
CN105302315A (zh) * 2015-11-20 2016-02-03 小米科技有限责任公司 图片处理方法及装置
CN106547850A (zh) * 2016-10-18 2017-03-29 北京小米移动软件有限公司 表情注释方法及装置
CN106792004A (zh) * 2016-12-30 2017-05-31 北京小米移动软件有限公司 内容项目推送方法、装置及系统
CN107133576A (zh) * 2017-04-17 2017-09-05 北京小米移动软件有限公司 用户年龄识别方法及装置
CN107133354A (zh) * 2017-05-25 2017-09-05 北京小米移动软件有限公司 图像描述信息的获取方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109557109A (zh) * 2018-12-29 2019-04-02 中国肉类食品综合研究中心 冷冻肉品包装状态的检测方法及装置
CN110321935A (zh) * 2019-06-13 2019-10-11 上海上湖信息技术有限公司 业务事件关系确定方法及装置、计算机可读存储介质
CN110996030A (zh) * 2019-12-20 2020-04-10 Tcl移动通信科技(宁波)有限公司 视频生成方法、装置、存储介质及终端设备
CN111526287A (zh) * 2020-04-27 2020-08-11 北京达佳互联信息技术有限公司 图像拍摄方法、装置、电子设备、服务器、系统及存储介质

Similar Documents

Publication Publication Date Title
CN105631403B (zh) 人脸识别方法及装置
KR101906827B1 (ko) 연속 사진 촬영 장치 및 방법
CN105389304B (zh) 事件提取方法及装置
CN105608425B (zh) 对照片进行分类存储的方法及装置
CN105302315A (zh) 图片处理方法及装置
CN106024009A (zh) 音频处理方法及装置
CN105069083B (zh) 关联用户的确定方法及装置
CN103944804B (zh) 推荐联系人的方法及装置
CN110188236A (zh) 一种音乐的推荐方法、装置及系统
CN104700353B (zh) 图像滤镜生成方法及装置
CN105354543A (zh) 视频处理方法及装置
CN104408404B (zh) 人脸识别方法及装置
CN108154091A (zh) 图像展示方法、图像处理方法及装置
CN108985176A (zh) 图像生成方法及装置
EP3173969B1 (en) Method, apparatus and terminal device for playing music based on a target face photo album
CN110147467A (zh) 一种文本描述的生成方法、装置、移动终端及存储介质
CN106600530B (zh) 照片合成方法及装置
CN109168062A (zh) 视频播放的展示方法、装置、终端设备及存储介质
CN105100193B (zh) 云名片推荐方法及装置
CN110399934A (zh) 一种视频分类方法、装置及电子设备
CN109242045B (zh) 图像聚类处理方法、装置、电子设备及存储介质
CN108108671A (zh) 产品说明信息获取方法及装置
CN110135349A (zh) 识别方法、装置、设备及存储介质
CN109544716A (zh) 学生签到方法及装置、电子设备和存储介质
CN104573642B (zh) 人脸识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180612

RJ01 Rejection of invention patent application after publication