CN117649419A - 图像处理方法、装置、设备及存储介质 - Google Patents
图像处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117649419A CN117649419A CN202210957723.5A CN202210957723A CN117649419A CN 117649419 A CN117649419 A CN 117649419A CN 202210957723 A CN202210957723 A CN 202210957723A CN 117649419 A CN117649419 A CN 117649419A
- Authority
- CN
- China
- Prior art keywords
- image
- composition
- compressed
- current
- preview
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000003860 storage Methods 0.000 title claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 31
- 230000004044 response Effects 0.000 claims abstract description 18
- 238000009826 distribution Methods 0.000 claims description 32
- 238000005520 cutting process Methods 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 14
- 241001465754 Metazoa Species 0.000 claims description 9
- 235000013305 food Nutrition 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 238000012937 correction Methods 0.000 description 5
- 210000003414 extremity Anatomy 0.000 description 5
- 230000005484 gravity Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000001513 elbow Anatomy 0.000 description 1
- 210000001624 hip Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/63—Control of cameras or camera modules by using electronic viewfinders
- H04N23/631—Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
- H04N23/632—Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/24—Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/22—Cropping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本公开是关于一种图像处理方法、装置、设备及存储介质,该方法包括:获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;基于所述压缩图像裁剪出至少一幅构图预览图像;响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。本公开可以实现自动裁剪当前图像,节省用户的人力和时间,提高图像处理效率,并且可以节省实施本实施例的图像处理算法的系统内存,降低对系统性能的要求。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、设备及存储介质。
背景技术
随着终端技术的发展以及多媒体时代的进步,用户使用终端设备获取图像的需求越来越多。相关技术中,当用户拍摄图像后,如果对所拍摄图像的构图不满意,则需要手动对拍摄的图像进行裁剪,以使裁剪后的图像中主体图像呈现位置更合理。然而,这种处理方式会耗费用户较多人力和时间,且处理效率低下,无法满足用户的需求。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种图像处理方法、装置、设备及存储介质,用以解决相关技术中的缺陷。
根据本公开实施例的第一方面,提供一种图像处理方法,所述方法包括:
获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
基于所述压缩图像裁剪出至少一幅构图预览图像;
响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
在一些实施例中,所述方法还包括:
响应于所述当前图像满足图像处理条件,执行所述获取当前图像的压缩图像的操作;
所述当前图像满足图像处理条件,包括以下至少一项:
检测到用于拍摄所述当前图像的指令;
检测到针对预设的构图功能入口的触发操作,所述构图功能入口位于相册应用程序中所述当前图像的大图浏览页面。
在一些实施例中,所述基于所述压缩图像裁剪出至少一幅构图预览图像,包括:
确定所述压缩图像中的目标主体图像类型;
基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则;
基于所述目标构图规则对所述压缩图像进行裁剪,得到至少一幅构图预览图像。
在一些实施例中,所述确定所述压缩图像中的目标主体图像类型,包括:
基于预设的图像识别算法识别所述压缩图像中的目标主体图像类型;和/或,
基于预先获取的所述当前图像的标签信息,确定所述压缩图像中的目标主体图像类型,所述标签信息包括所述当前图像的人脸检测结果以及人工智能场景检测结果中的至少一项。
在一些实施例中,所述主体图像类型包括人像类型和非人像类型;
所述人像类型还包括以下至少一种子类型:单人、双人、多人;
所述非人像类型还包括以下至少一种子类型:
动物、植物、风景、建筑、食物。
在一些实施例中,所述目标构图规则包括以下至少一项:
所述构图预览图像的预设图像比例;
所述构图预览图像中主体图像的分布原则,所述分布原则包括以下至少一种:基于图像中分线的分布原则、基于图像三分线的分布原则、基于预设的图像优质点的分布原则、基于预设的图像内框区域的分布原则、设置主体图像周围的边缘或外框的原则;
所述构图预览图像中主体图像的裁切规避原则,所述裁切规避原则包括在裁剪图像边缘时规避人像和/或宠物的脸部、四肢和特定关节中的至少一种;
所述构图预览图像中主体图像的倾斜角度矫正原则。
在一些实施例中,所述基于所述压缩图像裁剪出至少一幅构图预览图像,包括:
将所述压缩图像输入至预先训练好的构图预览图像生成模型,得到所述至少一幅构图预览图像。
在一些实施例中,所述方法还包括基于以下方式训练所述构图预览图像生成模型:
获取主体图像类型不同的多幅样本图像;
根据每种主体图像类型对应的构图规则,对每幅所述样本图像进行裁剪,得到每幅所述样本图像的至少一幅样本构图预览图像;
基于每幅所述样本图像以及所述至少一幅样本构图预览图像,建立样本图像数据库;
基于所述样本图像数据库,对预先构建的构图预览图像生成模型进行训练,以得到训练好的构图预览图像生成模型,所述构图预览图像生成模型采用基于深度学习的神经网络模型。
根据本公开实施例的第二方面,提供一种图像处理装置,所述装置包括:
压缩图像获取模块,用于获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
预览图像裁剪模块,用于基于所述压缩图像裁剪出至少一幅构图预览图像;
当前图像裁剪模块,用于响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
在一些实施例中,所述压缩图像获取模块还用于响应于所述当前图像满足图像处理条件,执行所述获取当前图像的压缩图像的操作;
所述当前图像满足图像处理条件,包括以下至少一项:
检测到用于拍摄所述当前图像的指令;
检测到针对预设的构图功能入口的触发操作,所述构图功能入口位于相册应用程序中所述当前图像的大图浏览页面。
在一些实施例中,所述预览图像裁剪模块,包括:
主体类型确定单元,用于确定所述压缩图像中的目标主体图像类型;
构图规则确定单元,用于基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则;
预览图像裁剪单元,用于基于所述目标构图规则对所述压缩图像进行裁剪,得到至少一幅构图预览图像。
在一些实施例中,所述主体类型确定单元还用于:
基于预设的图像识别算法识别所述压缩图像中的目标主体图像类型;和/或,
基于预先获取的所述当前图像的标签信息,确定所述压缩图像中的目标主体图像类型,所述标签信息包括所述当前图像的人脸检测结果以及人工智能场景检测结果中的至少一项。
在一些实施例中,所述主体图像类型包括人像类型和非人像类型;
所述人像类型还包括以下至少一种子类型:单人、双人、多人;
所述非人像类型还包括以下至少一种子类型:
动物、植物、风景、建筑、食物。
在一些实施例中,所述目标构图规则包括以下至少一项:
所述构图预览图像的预设图像比例;
所述构图预览图像中主体图像的分布原则,所述分布原则包括以下至少一种:基于图像中分线的分布原则、基于图像三分线的分布原则、基于预设的图像优质点的分布原则、基于预设的图像内框区域的分布原则、设置主体图像周围的边缘或外框的原则;
所述构图预览图像中主体图像的裁切规避原则,所述裁切规避原则包括在裁剪图像边缘时规避人像和/或宠物的脸部、四肢和特定关节中的至少一种;
所述构图预览图像中主体图像的倾斜角度矫正原则。
在一些实施例中,所述预览图像裁剪模块还用于将所述压缩图像输入至预先训练好的构图预览图像生成模型,得到所述至少一幅构图预览图像。
在一些实施例中,所述装置还包括模型训练模块;
所述模型训练模块包括:
样本图像获取单元,用于获取主体图像类型不同的多幅样本图像;
样本图像裁剪单元,用于根据每种主体图像类型对应的构图规则,对每幅所述样本图像进行裁剪,得到每幅所述样本图像的至少一幅样本构图预览图像;
样本图像库建立单元,用于基于每幅所述样本图像以及所述至少一幅样本构图预览图像,建立样本图像数据库;
模型训练单元,用于基于所述样本图像数据库,对预先构建的构图预览图像生成模型进行训练,以得到训练好的构图预览图像生成模型,所述构图预览图像生成模型采用基于深度学习的神经网络模型。
根据本公开实施例的第三方面,提供一种电子设备,所述设备包括:
处理器以及用于存储计算机程序的存储器;
其中,所述处理器被配置为在执行所述计算机程序时,实现:
获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
基于所述压缩图像裁剪出至少一幅构图预览图像;
响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现:
获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
基于所述压缩图像裁剪出至少一幅构图预览图像;
响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开通过获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率,并基于所述压缩图像裁剪出至少一幅构图预览图像,进而响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪,可以实现自动裁剪当前图像,节省用户的人力和时间,提高图像处理效率,并且通过展示至少一幅构图预览图像供用户从中选择目标构图图像,可以确保所选定的目标构图图像的构图方式符合用户自身需求,而且通过获取当前图像的压缩图像剪切预览图为用户进行展示,待用户选定目标构图图像后再对当前图像进行裁剪,可以节省实施本实施例的图像处理算法的系统内存,降低对系统性能的要求。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据本公开一示例性实施例示出的一种图像处理方法的流程图;
图2是根据本公开一示例性实施例示出的如何基于所述压缩图像裁剪出至少一幅构图预览图像的流程图;
图3是根据本公开一示例性实施例示出的如何训练所述构图预览图像生成模型的流程图;
图4A是根据本公开一示例性实施例示出的图像中分线、图像三分线以及图像优质点的示意图;
图4B是根据本公开一示例性实施例示出的图像内框区域的示意图;
图4C是根据本公开一示例性实施例示出的主体图像周围的边缘或外框的示意图;
图5A是根据本公开一示例性实施例示出的人像类型的原始图像示意图;
图5B是根据本公开一示例性实施例示出的1:1比例的双人图像构图规则示意图;
图5C是根据本公开一示例性实施例示出的3:4比例的单人图像构图规则示意图;
图5D是根据本公开又一示例性实施例示出的3:4比例的单人图像构图规则示意图;
图5E是根据本公开一示例性实施例示出的4:3比例的双人图像构图规则示意图;
图5F是根据本公开一示例性实施例示出的16:9比例的双人图像构图规则示意图;
图6A是根据本公开一示例性实施例示出的建筑类型的原始图像示意图;
图6B是根据本公开一示例性实施例示出的1:1比例的建筑图像构图规则示意图;
图6C是根据本公开一示例性实施例示出的3:4比例的建筑图像构图规则示意图;
图6D是根据本公开一示例性实施例示出的9:16比例的建筑图像构图规则示意图;
图6E是根据本公开一示例性实施例示出的4:3比例的建筑图像构图规则示意图;
图6F是根据本公开一示例性实施例示出的16:9比例的建筑图像构图规则示意图;
图7是根据本公开一示例性实施例示出的一种图像处理装置的框图;
图8是根据本公开一示例性实施例示出的又一种图像处理装置的框图;
图9是根据本公开一示例性实施例示出的一种电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施例并不代表与本公开相一致的所有实施例。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种图像处理方法的流程图;本实施例的方法可以应用于具有图像处理功能的终端设备(如,智能手机、平板电脑、照相机、可穿戴设备等)。
如图1所示,该方法包括以下步骤S101-S103:
在步骤S101中,获取当前图像的压缩图像。
本实施例中,当终端设备展示当前图像时,可以获取所述当前图像的压缩图像。具体地,可以判断当前图像是否满足图像处理条件,进而可以当判定当前图像满足图像处理条件时,获取所述当前图像的压缩图像,其中,当前图像的分辨率大于其压缩图像的分辨率。示例性地,当前图像可以为1亿像素等超清图像,进而该图像的分辨率可以是12032x9024;而压缩图像可以为1200万像素的高清图像,进而该图像的分辨率可以是4000x3000。
在一些实施例中,可以采用预设的图像压缩算法对当前图像进行压缩,以得到压缩图像。值得说明的是,该图像压缩算法可以基于实际业务需要从相关技术中进行选择,本实施例对此不进行限定。
在一些实施例中,当前图像满足图像处理条件的情况,可以包括以下(a)和(b)中的任一项:
(a)检测到用于拍摄所述当前图像的指令,例如当用户在终端设备上基于相机应用程序拍摄当前图像时,检测到用户通过按快门等方式来触发用于拍摄当前图像的指令等;
(b)检测到针对预设的构图功能入口的触发操作,例如当用户在终端设备上通过相册应用程序中的大图浏览方式浏览当前图像时,检测到用户触发针对当前图像的大图浏览页面中预设的构图功能入口的触发操作等,其中该构图功能入口可以为基于本实施例的图像处理功能所创建的交互接口。
在步骤S102中,基于所述压缩图像裁剪出至少一幅构图预览图像。
本实施例中,当获取当前图像的压缩图像后,可以基于所述压缩图像裁剪出至少一幅构图预览图像。
在一些实施例中,当裁剪的构图预览图像的数量大于1时,各幅构图预览图像的构图方式可以不同。其中,构图方式可以包括相应构图预览图像的图像比例以及主体图像位于图像内的位置中的至少一项。
可以理解的是,主体图像即图像中的主要拍摄对象,如人物、建筑物、动物、植物、风景、建筑、食物中的至少一种。
在另一些实施例中,上述基于所述压缩图像裁剪出至少一幅构图预览图像的方式可以参见下述图2所示实施例,在此先不进行详述。
在步骤S103中,响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
本实施例中,当基于所述压缩图像裁剪出至少一幅构图预览图像后,可以在终端设备上述展示该至少一幅构图预览图像,以供用户基于自身喜好从中进行选择。进而,当检测到用户从展示的至少一幅构图预览图像中选定目标构图图像(即,用户喜好的构图预览图像)时,可以基于该目标构图图像的裁剪范围对当前图像进行裁剪。可以理解的是,裁剪范围即目标构图图像在压缩图像上对应的区域,基于该裁剪范围裁剪当前图像,可以确保裁剪后的当前图像的构图方式与目标构图图像的构图方式相同,从而可以满足用户的喜好。
由上述描述可知,本实施例的方法通过获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率,并基于所述压缩图像裁剪出至少一幅构图预览图像,进而响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪,可以实现自动裁剪当前图像,节省用户的人力和时间,提高图像处理效率,并且通过展示至少一幅构图预览图像供用户从中选择目标构图图像,可以确保所选定的目标构图图像的构图方式符合用户自身需求,而且通过获取当前图像的压缩图像剪切预览图为用户进行展示,待用户选定目标构图图像后再对当前图像进行裁剪,可以节省实施本实施例的图像处理算法的系统内存,降低对系统性能的要求。
图2是根据本公开一示例性实施例示出的如何基于所述压缩图像裁剪出至少一幅构图预览图像的流程图;本实施例在上述实施例的基础上以如何基于所述压缩图像裁剪出至少一幅构图预览图像为例进行示例性说明。如图2所示,上述步骤S102中所述的基于所述压缩图像裁剪出至少一幅构图预览图像,可以包括以下步骤S201-S203:
在步骤S201中,确定所述压缩图像中的目标主体图像类型。
本实施例中,当获取所述当前图像的压缩图像后,可以确定所述压缩图像中的目标主体图像类型。
值得说明的是,主体图像类型即图像中的主要拍摄对象的类型。在一些实施例中,主体图像类型可以划分为人像类型和非人像类型。其中,非人像类型还可以进一步划分为以下至少一种子类型:动物、植物、风景、建筑、食物。
本实施例中,可以基于预设的图像识别算法识别所述压缩图像中的目标主体图像类型,和/或,可以基于预先获取的所述当前图像的标签信息,确定所述压缩图像中的目标主体图像类型。示例性地,该标签信息可以包括所述当前图像的人脸检测结果以及人工智能场景检测结果中的至少一项。
举例来说,若人脸检测结果为“有人脸”,则可以确定压缩图像中的目标主体图像类型为人像类型。在此基础上,还可以检测图像中的人像(人体或人脸)数量,确定目标主体图像类型为单人、双人以及多人中的哪种子类型;
而若人脸检测结果为“没有人脸”,则可以确定压缩图像中的目标主体图像类型为非人像类型。在此基础上,还可以结合人工智能场景检测结果进一步确定目标主体图像类型为动物、植物、景物以及食物中的哪种子类型。其中,人工智能场景检测结果的内容至少可以包括动物场景、植物场景、景物场景、食物场景等。
在步骤S202中,基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则。
本实施例中,当确定所述压缩图像中的目标主体图像类型后,可以基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则。
举例来说,可以预先根据不同主体图像类型的美学语义与主体特征,制定适合的构图规则,进而建立二者之间的对应关系,进而当确定当前图像的压缩图像中的目标主体图像类型后,可以基于该对应关系查询该目标主体图像类型对应的目标构图规则。
在一些实施例中,上述所述目标构图规则可以包括以下1)至4)中的至少一项:
1)所述构图预览图像的预设图像比例,例如:4:3、3:4、16:9、9:16等。
2)所述构图预览图像中主体图像的分布原则,所述分布原则包括以下(a)至(e)中的至少一种:
(a)基于图像中分线的分布原则;如:优先使图像主体的位置靠近图像中分线。
(b)基于图像三分线的分布原则;如:优先使图像主体的位置靠近最近的图像三分线上。
(c)基于预设的图像优质点的分布原则;如:优先使图像主体的位置覆盖最多的图像优质点。其中,图像优质点可以为图像中分线和/或图像三分线的焦点。
(d)基于预设的图像内框区域的分布原则;如:优先使图像主体的位置处于图像内框区域之内。其中,图像内框区域可以为图像优质点的最小外包矩形等。
(e)设置主体图像周围的边缘或外框的原则;如:优先为图像主体的周围留出一定大小的边缘或外框。
3)所述构图预览图像中主体图像的裁切规避原则,所述裁切规避原则可以包括在裁剪图像边缘时规避人像和/或宠物的脸部、四肢和特定关节(如,脖子、手腕、手肘、腰部、膝盖、脚腕等)中的至少一种。
4)所述构图预览图像中主体图像的倾斜角度矫正原则,也即针对非人像类型的图像可以采用水平线(地平线)校正算法,当检测到图像主体的倾斜角度小于或等于设定角度阈值(如,20°等)时,可以将其矫正至水平或垂直线上。值得说明的是,倾斜角度的矫正方式可以基于实际需要进行选择,如选择基于陀螺仪的矫正方式(即,在拍摄图像时获取终端设备的陀螺仪数据,进而在后续图像处理时基于该陀螺仪数据进行倾斜角度矫正)等,本实施例对此不进行限定。
在步骤S203中,基于所述目标构图规则对所述压缩图像进行裁剪,得到至少一幅构图预览图像。
本实施例中,当基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则后,可以基于所述目标构图规则对所述压缩图像进行裁剪,得到至少一幅构图预览图像。
在一些实施例中,上述至少一幅构图预览图像可以分别对应于一个预设图像比例,如分别裁剪出预设图像比例为4:3、3:4、16:9、9:16的构图预览图像。
由上述描述可知,本实施例通过确定所述压缩图像中的目标主体图像类型,并基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则,进而基于所述目标构图规则对所述压缩图像进行裁剪,得到至少一幅构图预览图像,可以实现基于所述压缩图像高质量地裁剪出至少一幅构图预览图像,进而可以实现后续根据用户从中选定的目标构图图像的裁剪范围对当前图像进行裁剪,可以节省用户的人力和时间,提高图像处理效率。
在另一些实施例中,当需要基于所述压缩图像裁剪出至少一幅构图预览图像时,还可以将所述压缩图像输入至预先训练好的构图预览图像生成模型,得到所述至少一幅构图预览图像。其中,该构图预览图像生成模型的输入为压缩图像,输出为基于该压缩图像裁剪出的至少一幅构图预览图像。
举例来说,图3是根据本公开一示例性实施例示出的如何训练所述构图预览图像生成模型的流程图。如图3所示,本实施例的图像处理方法还可以包括基于以下步骤S301-S304训练所述构图预览图像生成模型:
在步骤S301中,获取主体图像类型不同的多幅样本图像。
本实施例中,可以预先获取多幅样本图像,并通过人工或自动方式对每幅压缩图像的主体图像类型进行标注,以得到主体图像类型不同的多幅样本图像。值得说明的是,上述样本图像可以是通过任意图像处理方式得到的图像,也可以是视频中的图像帧。
其中,主体图像类型可以包括人像类型和非人像类型;
所述人像类型还包括以下至少一种子类型:单人、双人、多人;
所述非人像类型还包括以下至少一种子类型:
动物、植物、风景、建筑、食物。
在步骤S302中,根据每种主体图像类型对应的构图规则,对每幅所述样本图像进行裁剪,得到每幅所述样本图像的至少一幅样本构图预览图像。
本实施例中,当获取主体图像类型不同的多幅样本图像后,可以基于预先确定的每种主体图像类型对应的构图规则,对每幅所述样本图像进行裁剪,得到每幅所述样本图像的至少一幅样本构图预览图像。
其中,上述主体图像类型对应的构图规则可以包括以下1)至4)中的至少一项:
1)所述构图预览图像的预设图像比例,例如:4:3、3:4、16:9、9:16等。
2)所述构图预览图像中主体图像的分布原则,所述分布原则包括以下(a)至(e)中的至少一种:
(a)基于图像中分线的分布原则;
(b)基于图像三分线的分布原则;
(c)基于预设的图像优质点的分布原则;
(d)基于预设的图像内框区域的分布原则;
(e)设置主体图像周围的边缘或外框的原则;
3)所述构图预览图像中主体图像的裁切规避原则,所述裁切规避原则可以包括在裁剪图像边缘时规避人像和/或宠物的脸部、四肢和特定关节中的至少一种。
4)所述构图预览图像中主体图像的倾斜角度矫正原则。
在步骤S303中,基于每幅所述样本图像以及所述至少一幅样本构图预览图像,建立样本图像数据库。
本实施例中,当得到每幅所述样本图像的至少一幅样本构图预览图像后,可以基于每幅所述样本图像以及所述至少一幅样本构图预览图像确定一个训练样本,进而根据各个训练样本建立样本图像数据库,以用于后续构图预览图像的训练。
在步骤S304中,基于所述样本图像数据库,对预先构建的构图预览图像生成模型进行训练,以得到训练好的构图预览图像生成模型。
本实施例中,当基于每幅所述样本图像以及所述至少一幅样本构图预览图像,建立样本图像数据库后,可以基于所述样本图像数据库,对预先构建的构图预览图像生成模型进行训练,并在满足训练截止条件(如,训练轮数和/或模型的精度等条件)时,停止模型的训练,以得到训练好的构图预览图像生成模型。示例性地,上述构图预览图像生成模型可以采用基于深度学习的神经网络模型,本实施例对于具体的模型种类不进行限定。
由上述描述可知,本实施例通过获取主体图像类型不同的多幅样本图像,并根据每种主体图像类型对应的构图规则,对每幅所述样本图像进行裁剪,得到每幅所述样本图像的至少一幅样本构图预览图像,然后基于每幅所述样本图像以及所述至少一幅样本构图预览图像,建立样本图像数据库,进而基于所述样本图像数据库,对预先构建的构图预览图像生成模型进行训练,以得到训练好的构图预览图像生成模型,可以实现准确地训练构图预览图像生成模型,进而可以实现后续基于该训练好的构图预览图像生成模型对当前图像的压缩图像进行处理,得到至少一幅构图预览图像,可以提高生成至少一幅构图预览图像的质量和效率。
下面以一些具体的示例来介绍本公开实施例的构图规则。
图4A是根据本公开一示例性实施例示出的图像中分线、图像三分线以及图像优质点的示意图;图4B是根据本公开一示例性实施例示出的图像内框区域的示意图;图4C是根据本公开一示例性实施例示出的主体图像周围的边缘或外框的示意图。
其中,图4A中的直线1和直线2所构成的十字线即为图像中分线,该中分线可以用于居中构图的参考线。图4A中的直线3至直线6即为图像三分线,该三分线可以用于三分式构图的参考线。图4A中的各个点即为图像优质点。
上述图像中分线、图像三分线以及图像优质点中的至少一种,可以用于调整主体图像在裁剪出的构图预览图像中的位置。
图4B中的优质点的最小外包矩形即为图像内框区域,在对压缩图像进行裁剪构图时,优先使图像主体的位置处于图像内框区域之内。
图4C中的边框区域即为主体图像周围的边缘或外框,在对压缩图像进行裁剪构图时,优先为图像主体的周围留出一定大小的边缘或外框。
图5A是根据本公开一示例性实施例示出的人像类型的原始图像示意图(图中包含各个比例的构图预览图像的裁剪范围);图5B是根据本公开一示例性实施例示出的1:1比例的双人图像构图规则示意图;图5C是根据本公开一示例性实施例示出的3:4比例的单人图像构图规则示意图;图5D是根据本公开又一示例性实施例示出的3:4比例的单人图像构图规则示意图;图5E是根据本公开一示例性实施例示出的4:3比例的双人图像构图规则示意图;
图5F是根据本公开一示例性实施例示出的16:9比例的双人图像构图规则示意图。
如图5A至5F所示,针对单人像的主体图像类型,可以设置如下的图像构图规则中的至少一种:
a.把人物主体往图片的优质点或优质线移动;
b.主体距离哪个优质点或优质线线最近,构图裁剪时就将图像主体定位到哪个优质点或优质线上;
c.人像主体优选在水平中线或偏上位置,不宜过低;
d.人像主体尽量保持完整,图像边界留出一定保护区域(即,边缘或外框)。
针对双人像的主体图像类型,可以设置如下的图像构图规则中的至少一种:
a.横图比例(即,4:3、16:9等):人脸均包含在画面中,且画面重心无偏离;
b.竖图比例(即,3:4、9:16等):判断人脸能否都包含在画面中:若能,则进行裁切,并确保画面重心无偏离;若不能,则竖图可以只裁切出3:4比例的构图预览图像,并可以以画面人物分别为图像主体,各裁切出一幅单人图像;
c.正方形比例(即,1:1):同竖图的构图规则。
而针对多人像的主体图像类型(图中未示出),可以设置如下的图像构图规则中的至少一种:
a.横图比例(即,4:3、16:9等):人脸均包含在画面中,且画面重心无偏离;
b.竖图比例(即,3:4、9:16等):判断人脸能否都包含在画面中:若能,则进行裁切,并确保画面重心无偏离;若不能,则不出竖图;
c.五官保护:尽可能不裁切人脸;
d.组合推荐:对多人脸进行人脸聚合,得到一个组合主体,进而将组合主体当成一个主体处理,处理规则同单人像的构图规则。
图6A是根据本公开一示例性实施例示出的建筑类型的原始图像示意图(图中包含各个比例的构图预览图像的裁剪范围);图6B是根据本公开一示例性实施例示出的1:1比例的建筑图像构图规则示意图;图6C是根据本公开一示例性实施例示出的3:4比例的建筑图像构图规则示意图;图6D是根据本公开一示例性实施例示出的9:16比例的建筑图像构图规则示意图;图6E是根据本公开一示例性实施例示出的4:3比例的建筑图像构图规则示意图;
图6F是根据本公开一示例性实施例示出的16:9比例的建筑图像构图规则示意图。
如图6A至图6F所示,针对建筑类型的主体图像类型,可以设置如下的图像构图规则中的至少一种:
a.构图比例:1:1、4:3、3:4、16:9、9:16;
b.建筑主体距离哪个优质点或优质线线最近,在进行构图裁切时,就将建筑主体定位到哪个优质点或优质线上;
c.若识别出建筑主体具有明显特征时,构图边缘尽量不能裁切半个主体;
d.非人像类型的图像优选采用水平线(地平线)校正算法,即针对非人像类型的图像可以采用水平线(地平线)校正算法,当检测到图像主体的倾斜角度小于或等于设定角度阈值(如,20°等)时,可以将其矫正至水平或垂直线上。
图7是根据本公开一示例性实施例示出的一种图像处理装置的框图;本实施例的装置可以应用于具有图像处理功能的终端设备(如,智能手机、平板电脑、照相机、可穿戴设备等)。
如图7所示,该装置包括:压缩图像获取模块110、预览图像裁剪模块120以及当前图像裁剪模块130,其中:
压缩图像获取模块110,用于获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
预览图像裁剪模块120,用于基于所述压缩图像裁剪出至少一幅构图预览图像;
当前图像裁剪模块130,用于响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
由上述描述可知,本实施例的装置通过获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率,并基于所述压缩图像裁剪出至少一幅构图预览图像,进而响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪,可以实现自动裁剪当前图像,节省用户的人力和时间,提高图像处理效率,并且通过展示至少一幅构图预览图像供用户从中选择目标构图图像,可以确保所选定的目标构图图像的构图方式符合用户自身需求,而且通过获取当前图像的压缩图像剪切预览图为用户进行展示,待用户选定目标构图图像后再对当前图像进行裁剪,可以节省实施本实施例的图像处理算法的系统内存,降低对系统性能的要求。
图8是根据本公开一示例性实施例示出的又一种图像处理装置的框图;本实施例的装置可以应用于具有图像处理功能的终端设备(如,智能手机、平板电脑、照相机、可穿戴设备等)。其中,压缩图像获取模块210、预览图像裁剪模块220以及当前图像裁剪模块230与前述图7所示实施例中的压缩图像获取模块110、预览图像裁剪模块120以及当前图像裁剪模块130的功能相同,在此不进行赘述。
本实施例中,压缩图像获取模块210还可以用于响应于所述当前图像满足图像处理条件,执行所述获取当前图像的压缩图像的操作;
其中,上述当前图像满足图像处理条件,可以包括以下至少一项:
检测到用于拍摄所述当前图像的指令;
检测到针对预设的构图功能入口的触发操作,所述构图功能入口位于相册应用程序中所述当前图像的大图浏览页面。
在一些实施例中,如图8所示,预览图像裁剪模块220,可以包括:
主体类型确定单元221,用于确定所述压缩图像中的目标主体图像类型;
构图规则确定单元222,用于基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则;
预览图像裁剪单元223,用于基于所述目标构图规则对所述压缩图像进行裁剪,得到至少一幅构图预览图像。
在一些实施例中,主体类型确定单元221还可以用于:
基于预设的图像识别算法识别所述压缩图像中的目标主体图像类型;
和/或,
基于预先获取的所述当前图像的标签信息,确定所述压缩图像中的目标主体图像类型,所述标签信息包括所述当前图像的人脸检测结果以及人工智能场景检测结果中的至少一项。
在一些实施例中,主体图像类型可以包括人像类型和非人像类型;
所述人像类型还包括以下至少一种子类型:单人、双人、多人;
所述非人像类型还包括以下至少一种子类型:
动物、植物、风景、建筑、食物。
在一些实施例中,目标构图规则可以包括以下至少一项:
所述构图预览图像的预设图像比例;
所述构图预览图像中主体图像的分布原则,所述分布原则包括以下至少一种:基于图像中分线的分布原则、基于图像三分线的分布原则、基于预设的图像优质点的分布原则、基于预设的图像内框区域的分布原则、设置主体图像周围的边缘或外框的原则;
所述构图预览图像中主体图像的裁切规避原则,所述裁切规避原则包括在裁剪图像边缘时规避人像和/或宠物的脸部、四肢和特定关节中的至少一种;
所述构图预览图像中主体图像的倾斜角度矫正原则。
在另一些实施例中,所述预览图像裁剪模块还可以用于将所述压缩图像输入至预先训练好的构图预览图像生成模型,得到所述至少一幅构图预览图像。
在一些实施例中,上述装置还可以包括模型训练模块240;
模型训练模块240可以包括:
样本图像获取单元241,用于获取主体图像类型不同的多幅样本图像;
样本图像裁剪单元242,用于根据每种主体图像类型对应的构图规则,对每幅所述样本图像进行裁剪,得到每幅所述样本图像的至少一幅样本构图预览图像;
样本图像库建立单元243,用于基于每幅所述样本图像以及所述至少一幅样本构图预览图像,建立样本图像数据库;
模型训练单元244,用于基于所述样本图像数据库,对预先构建的构图预览图像生成模型进行训练,以得到训练好的构图预览图像生成模型,所述构图预览图像生成模型采用基于深度学习的神经网络模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图9是根据一示例性实施例示出的一种电子设备的框图。例如,设备900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图9,设备900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制设备900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在设备900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为设备900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为设备900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述设备900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当设备900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为设备900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为设备900的显示器和小键盘,传感器组件914还可以检测设备900或设备900一个组件的位置改变,用户与设备900接触的存在或不存在,设备900方位或加速/减速和设备900的温度变化。传感器组件914还可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于设备900和其他设备之间有线或无线方式的通信。设备900可以接入基于通信标准的无线网络,如WiFi,2G或3G,4G或5G或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,设备900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由设备900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (11)
1.一种图像处理方法,其特征在于,所述方法包括:
获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
基于所述压缩图像裁剪出至少一幅构图预览图像;
响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述当前图像满足图像处理条件,执行所述获取当前图像的压缩图像的操作;
所述当前图像满足图像处理条件,包括以下至少一项:
检测到用于拍摄所述当前图像的指令;
检测到针对预设的构图功能入口的触发操作,所述构图功能入口位于相册应用程序中所述当前图像的大图浏览页面。
3.根据权利要求1所述的方法,其特征在于,所述基于所述压缩图像裁剪出至少一幅构图预览图像,包括:
确定所述压缩图像中的目标主体图像类型;
基于预先构建的主体图像类型与构图规则之间的对应关系,确定所述目标主体图像类型对应的目标构图规则;
基于所述目标构图规则对所述压缩图像进行裁剪,得到至少一幅构图预览图像。
4.根据权利要求3所述的方法,其特征在于,所述确定所述压缩图像中的目标主体图像类型,包括:
基于预设的图像识别算法识别所述压缩图像中的目标主体图像类型;和/或,
基于预先获取的所述当前图像的标签信息,确定所述压缩图像中的目标主体图像类型,所述标签信息包括所述当前图像的人脸检测结果以及人工智能场景检测结果中的至少一项。
5.根据权利要求3所述的方法,其特征在于,所述主体图像类型包括人像类型和非人像类型;
所述人像类型还包括以下至少一种子类型:单人、双人、多人;
所述非人像类型还包括以下至少一种子类型:
动物、植物、风景、建筑、食物。
6.根据权利要求3所述的方法,其特征在于,所述目标构图规则包括以下至少一项:
所述构图预览图像的预设图像比例;
所述构图预览图像中主体图像的分布原则,所述分布原则包括以下至少一种:基于图像中分线的分布原则、基于图像三分线的分布原则、基于预设的图像优质点的分布原则、基于预设的图像内框区域的分布原则、设置主体图像周围的边缘或外框的原则;
所述构图预览图像中主体图像的裁切规避原则,所述裁切规避原则包括在裁剪图像边缘时规避人像和/或宠物的脸部、四肢和特定关节中的至少一种;
所述构图预览图像中主体图像的倾斜角度矫正原则。
7.根据权利要求1所述的方法,其特征在于,所述基于所述压缩图像裁剪出至少一幅构图预览图像,包括:
将所述压缩图像输入至预先训练好的构图预览图像生成模型,得到所述至少一幅构图预览图像。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括基于以下方式训练所述构图预览图像生成模型:
获取主体图像类型不同的多幅样本图像;
根据每种主体图像类型对应的构图规则,对每幅所述样本图像进行裁剪,得到每幅所述样本图像的至少一幅样本构图预览图像;
基于每幅所述样本图像以及所述至少一幅样本构图预览图像,建立样本图像数据库;
基于所述样本图像数据库,对预先构建的构图预览图像生成模型进行训练,以得到训练好的构图预览图像生成模型,所述构图预览图像生成模型采用基于深度学习的神经网络模型。
9.一种图像处理装置,其特征在于,所述装置包括:
压缩图像获取模块,用于获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
预览图像裁剪模块,用于基于所述压缩图像裁剪出至少一幅构图预览图像;
当前图像裁剪模块,用于响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
10.一种电子设备,其特征在于,所述设备包括:
处理器以及用于存储计算机程序的存储器;
其中,所述处理器被配置为在执行所述计算机程序时,实现:
获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
基于所述压缩图像裁剪出至少一幅构图预览图像;
响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现:
获取当前图像的压缩图像,所述当前图像的分辨率大于所述压缩图像的分辨率;
基于所述压缩图像裁剪出至少一幅构图预览图像;
响应于从展示的所述至少一幅构图预览图像中选定目标构图图像,基于所述目标构图图像的裁剪范围对所述当前图像进行裁剪。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210957723.5A CN117649419A (zh) | 2022-08-10 | 2022-08-10 | 图像处理方法、装置、设备及存储介质 |
EP22217145.6A EP4322163A1 (en) | 2022-08-10 | 2022-12-29 | Image processing method and device, and storage medium |
US18/091,021 US20240054691A1 (en) | 2022-08-10 | 2022-12-29 | Image processing method and device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210957723.5A CN117649419A (zh) | 2022-08-10 | 2022-08-10 | 图像处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117649419A true CN117649419A (zh) | 2024-03-05 |
Family
ID=84901509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210957723.5A Pending CN117649419A (zh) | 2022-08-10 | 2022-08-10 | 图像处理方法、装置、设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240054691A1 (zh) |
EP (1) | EP4322163A1 (zh) |
CN (1) | CN117649419A (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10516830B2 (en) * | 2017-10-11 | 2019-12-24 | Adobe Inc. | Guided image composition on mobile devices |
KR20200132569A (ko) * | 2019-05-17 | 2020-11-25 | 삼성전자주식회사 | 특정 순간에 관한 사진 또는 동영상을 자동으로 촬영하는 디바이스 및 그 동작 방법 |
US20230224575A1 (en) * | 2020-03-20 | 2023-07-13 | Huawei Technologies Co., Ltd. | Shooting method and device |
CN113709386A (zh) * | 2021-03-19 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及计算机可读存储介质 |
-
2022
- 2022-08-10 CN CN202210957723.5A patent/CN117649419A/zh active Pending
- 2022-12-29 EP EP22217145.6A patent/EP4322163A1/en active Pending
- 2022-12-29 US US18/091,021 patent/US20240054691A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4322163A1 (en) | 2024-02-14 |
US20240054691A1 (en) | 2024-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10565763B2 (en) | Method and camera device for processing image | |
EP3125158A2 (en) | Method and device for displaying images | |
CN112135046B (zh) | 视频拍摄方法、视频拍摄装置及电子设备 | |
US11030733B2 (en) | Method, electronic device and storage medium for processing image | |
US11308692B2 (en) | Method and device for processing image, and storage medium | |
CN112383830A (zh) | 视频封面确定方法及装置、存储介质 | |
CN108462833B (zh) | 拍摄方法、装置及计算机可读存储介质 | |
CN107566742B (zh) | 拍摄方法、装置、存储介质和电子设备 | |
WO2022227393A1 (zh) | 图像拍摄方法及装置、电子设备和计算机可读存储介质 | |
CN108848313B (zh) | 一种多人拍照方法、终端和存储介质 | |
CN112330570A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN108234888B (zh) | 一种图像处理方法及移动终端 | |
CN116363725A (zh) | 显示设备的人像追踪方法、系统、显示设备及存储介质 | |
CN117649419A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111726531B (zh) | 图像拍摄方法、处理方法、装置、电子设备及存储介质 | |
US20150279001A1 (en) | Method and device for displaying image | |
CN114390189A (zh) | 图像处理方法、装置、存储介质及移动终端 | |
CN114827445B (zh) | 图像处理方法及相关装置 | |
CN109948689B (zh) | 一种视频生成方法、装置、电子设备及存储介质 | |
CN115278060B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
US11527219B2 (en) | Method and apparatus for processing brightness of display screen | |
EP4304190A1 (en) | Focus chasing method, electronic device, and storage medium | |
CN116939351A (zh) | 拍摄方法、装置、电子设备及可读储存介质 | |
CN116600196A (zh) | 图像处理方法和装置 | |
CN117676310A (zh) | 拍摄方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |