CN107622497A - 图像裁剪方法、装置、计算机可读存储介质和计算机设备 - Google Patents

图像裁剪方法、装置、计算机可读存储介质和计算机设备 Download PDF

Info

Publication number
CN107622497A
CN107622497A CN201710911708.6A CN201710911708A CN107622497A CN 107622497 A CN107622497 A CN 107622497A CN 201710911708 A CN201710911708 A CN 201710911708A CN 107622497 A CN107622497 A CN 107622497A
Authority
CN
China
Prior art keywords
image
cut
target
target area
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710911708.6A
Other languages
English (en)
Other versions
CN107622497B (zh
Inventor
王会朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201710911708.6A priority Critical patent/CN107622497B/zh
Publication of CN107622497A publication Critical patent/CN107622497A/zh
Application granted granted Critical
Publication of CN107622497B publication Critical patent/CN107622497B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本申请涉及一种图像裁剪方法、装置、计算机可读存储介质和计算机设备。所述方法包括:获取待裁剪图像;根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;根据所述目标区域裁剪所述待裁剪图像。上述图像裁剪方法、装置、计算机可读存储介质和计算机设备,可以提高图像裁剪的精确度。

Description

图像裁剪方法、装置、计算机可读存储介质和计算机设备
技术领域
本发明涉及计算机技术领域,特别是涉及图像裁剪方法、装置、计算机可读存储介质和计算机设备。
背景技术
在图像裁剪的过程中,传统的方法是采用固定的模板进行裁剪,这样无法实现图像的精确裁剪。例如,利用矩形、圆形模板进行裁剪。用户如果想要更精确地裁剪,需要手动划分裁剪区域,经过多次调整,再根据手动调整的裁剪区域将图像进行裁剪。
发明内容
本发明实施例提供一种图像裁剪方法、装置、计算机可读存储介质和计算机设备,可以使得图像裁剪更加精确。
一种图像裁剪方法,所述方法包括:
获取待裁剪图像;
根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;
根据所述目标区域裁剪所述待裁剪图像。
一种图像裁剪装置,所述装置包括:
图像获取模块,用于获取待裁剪图像;
目标识别模块,用于根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;
图像裁剪模块,用于根据所述目标区域裁剪所述待裁剪图像。
一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行如下步骤:
获取待裁剪图像;
根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;
根据所述目标区域裁剪所述待裁剪图像。
一种计算机设备,包括存储器及处理器,所述存储器中储存有计算机可读指令,所述指令被所述处理器执行时,使得所述处理器执行如下步骤:
获取待裁剪图像;
根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;
根据所述目标区域裁剪所述待裁剪图像。
上述实施例提供的图像裁剪方法,在获取到待裁剪图像之后,会根据目标识别模型对待裁剪图像中的目标区域进行识别,根据目标区域将待裁剪图像进行裁剪。目标区域一般是用户比较关注的区域,裁剪图像的时候只保留目标区域,提高了图像处理的准确性,图像裁剪更加精确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中图像裁剪方法的应用环境图;
图2为一个实施例中图像裁剪方法的流程图;
图3为另一个实施例中图像裁剪方法的流程图;
图4为一个实施例中图像裁剪步骤的流程图;
图5为另一个实施例中图像裁剪步骤的流程图;
图6为一个实施例中获取物理距离的原理图;
图7为又一个实施例中图像裁剪方法的流程图;
图8为一个实施例中图像裁剪结果的终端展示图;
图9为一个实施例中图像裁剪装置的结构示意图;
图10为另一个实施例中图像裁剪装置的结构示意图;
图11为一个实施例中图像处理电路的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中图像裁剪方法的应用环境图。如图1所示,该应用环境包括用户终端102和服务器104。其中,用户终端102用于获取待裁剪图像;根据目标识别模型识别待裁剪图像中的目标区域;并根据目标区域裁剪待裁剪图像。服务器104可以用于根据训练图像集合及对应的区域标记训练得到目标识别模型,并将目标识别模型发送至用户终端102。可以理解的是,目标识别模型可以是在用户终端102中进行训练得到的。用户终端102是处于计算机网络最外围,主要用于输入用户信息以及输出处理结果的电子设备,例如可以是个人电脑、移动终端、个人数字助理、可穿戴电子设备等。服务器104是用于响应服务请求,同时提供计算服务的设备,例如可以是一台或者多台计算机。
图2为一个实施例中图像裁剪方法的流程图。如图2所示,该图像裁剪方法包括步骤202至步骤206。其中:
步骤202,获取待裁剪图像。
在一个实施例中,待裁剪图像是指需要进行裁剪的图像。一般地,用户可以发起裁剪指令,用户终端在接收裁剪指令之后,获取待裁剪图像进行裁剪。裁剪指令可以是触控操作、物理按键的按压操作、语音控制操作或对移动终端的晃动操作等触发操作。触控操作有触摸点击操作、触摸长按操作、触摸滑动操作、多点触控操作等,其中,触摸长按操作是超过预设时长的触摸按压操作。在接收到裁剪指令之后,可以从图像数据库中获取待裁剪图像,也可以实时获取待裁剪图像。例如,用户可以通过按压同时按压解锁键和HOME键发起裁剪指令,用户终端在接收到裁剪指令之后,截取用户终端的屏幕截图,并将获取的屏幕截图作为待裁剪图像进行裁剪处理。还可以通过长按鼠标在用户终端的屏幕上选定截屏区域,当释放鼠标时截取该截屏区域的所包含的图像,并将截取的图像作为待处理图像。
具体地,用户终端在接收到裁剪指令后,可以读取帧缓冲设备中缓存的图像数据,并将读取到的图像数据作为待裁剪图像。例如,可以通过ROOT权限读取Framebuffer中的图像数据,并将读取的图像数据作为待裁剪图像。其中,ROOT是系统中的超级管理员账户,ROOT权限是指系统的最高权限用户。
步骤204,根据目标识别模型识别待裁剪图像中的目标区域,其中,目标识别模型是根据训练图像集合及对应的区域标记训练得到的。
在一个实施例中,目标区域是指在裁剪图像的过程中,需要保留的图像区域。在裁剪过程中,将待裁剪图像中的目标区域进行保留,将目标区域之外的区域进行去除。一般来说,目标区域可以是一个物体的边界所围成的一个区域,也可以是一个特定的形状区域。例如,目标区域可以是人像所在的区域,也就是人像边界所围成的区域,也可以是一个矩形区域,该矩形区域包含了人像所在的区域。
目标识别模型是指对待裁剪图像中的目标区域进行识别的算法模型,例如目标识别模型可以是识别图像中的人像、物体等。训练图像集合是指用于训练目标识别模型的图像集合,区域标记是指目标物体所在区域的唯一标记,训练图像集合中的每张图像都对应了一个或多个目标物体,将这一个或多个目标物体所在的区域在图像中进行标记,得到每张图像对应的一个或多个区域标记。根据训练图像集合及对应的区域标记就可以训练得到目标识别模型。
训练图像集合中的每一张图像都有对应的区域标记,根据训练图像集合及对应的区域标记进行训练,得到目标识别模型。若区域标记为图像中目标图像所在区域的标记,那么可以首先根据该标记将训练图像集合中每一张图像中的目标物体所在区域提取出来,然后根据提取出来的所有目标物体所在区域进行模型训练,得到目标识别模型。获取到一张图像时,可以根据目标识别模型识别该图像中的目标区域。一般来说,训练图像集合中包含的图像越多,训练得到的目标识别模型越精准,对图像中目标区域进行识别的精度就越高。例如,在人脸识别过程中,区域标记就可以是人脸所在区域,根据区域标记将训练图像集合中的人脸区域提取出来,然后根据人脸区域提取对应的几何特征,通过这些几何特征训练得到人脸模板,通过人脸模板可以识别到图像中的人脸区域。
步骤206,根据目标区域裁剪待裁剪图像。
在一个实施例中,待裁剪图像是由若干个像素点构成的,这若干个像素点按照一定规律进行排列,通常可以组成一个二维矩阵。每个像素点都有对应的像素值以及对应的坐标,通过坐标可以表示像素点在图像中的具体位置,并通过不同像素值的像素点组成不同的图案。目标区域也是由若干个像素点构成的,也即目标区域包括待裁剪图像中的部分或全部像素点。在获取到目标区域之后,可以将目标区域进行标记,然后通过标记来查找目标区域。也可以提取目标区域所包含的像素的坐标,并通过坐标来查找目标区域。例如,在获取到目标区域之后,将目标区域的边缘像素点全部标记为红色,那么在查找目标区域时,遍历每个像素点的为红色的像素即为边缘像素点,获取图像中所有的边缘像素点,边缘像素点所围成的区域即为目标区域。具体地,还可以分别比较像素点的RGB三通道值,若RGB三通道值分别为255、0、0,则该像素点为边缘像素点。根据目标区域裁剪待裁剪图像,可以首先将待裁剪图像中的目标区域提取出来,然后将除目标区域之外的其他区域去除,只保留目标区域部分。
可以理解的是,识别出待裁剪图像中的目标区域之后,用户可以对目标区域进行调节。具体地,接收用户输入的区域调节指令,并根据该区域调节指令对目标区域进行调节。该区域调节指令用于指示调节目标区域的位置和范围。例如,识别出待裁剪图像中的目标区域之后,通过矩形框将目标区域进行标记,用户可以输入区域调节指令,任意调节矩形框的位置和大小。长按矩形框并拖动可以移动矩形框的位置,长按矩形框边界并拖动可以任意的扩大或缩小矩形框的大小。
上述实施例提供的图像裁剪方法,在获取到待裁剪图像之后,会根据目标识别模型对待裁剪图像中的目标区域进行识别,根据目标区域将待裁剪图像进行裁剪。目标区域一般是用户比较关注的区域,裁剪图像的时候只保留目标区域,提高了图像处理的准确性,图像裁剪更加精确。
图3为另一个实施例中图像裁剪方法的流程图。如图3所示,该图像裁剪方法包括步骤302至步骤310。其中:
步骤302,获取当前终端对应的历史裁剪图像及对应的区域标记。
在一个实施例中,历史裁剪图像是指进行过裁剪处理的原始图像。用户终端可以将历史处理过的待裁剪图像通过同一的规则进行命名,通过读取图像的名称就可以知道哪些图像是历史裁剪图像。例如,遍历图库中所有图像的标识,若图像标识包含“T”,则该图像为历史裁剪图像。用户终端历史处理过的待裁剪图像还可以存放在一个固定的文件夹中,通过读取该文件夹就可以获取历史处理过的待裁剪图像。
步骤304,根据历史裁剪图像及对应的区域标记进行模型训练,得到目标识别模型。
在一个实施例中,历史裁剪图像可以保存在用户终端本地,也可以保存在服务器。一般地,用户终端在将图像裁剪之后,可以将裁剪之前的图像和裁剪之后的图像同时进行保存,对不同的用户终端的历史裁剪图像进行训练,得到不同用户终端对应的目标识别模型。
可以理解的是,可以在用户终端本地进行模型训练,也可以在服务器上进行模型训练。在服务器中训练目标识别模型时,用户终端可以将每次剪裁之后的图像上传至服务器,服务器可以根据用户终端标识建立不同的文件夹,并将不同用户终端上传的图像存放在对应的文件夹中。其中,用户终端标识是指用户终端的唯一标识。例如,用户终端标识可以是IP(Internet Protocol,网络之间互连的协议)地址、MAC(Media Access Control,媒体访问控制)地址等中的至少一种。服务器可以设置定时器,定时启动模型训练的任务,对各个文件夹中的历史裁剪图像进行训练,并将训练得到的目标识别模型发送至对应的用户终端。在其他实施例中,还可以设置触发训练模型的条件,当满足触发条件时,根据历史裁剪图像和对应的区域标记进行模型训练。例如,触发条件可以是:新增的历史裁剪图像大于预设张数。
进行模型训练得到目标识别模型之后,会将目标识别模型建立对应的模型标识,新版本的目标识别模型会覆盖旧版本的目标识别模型。在一个实施例中,目标识别模型可以采用“终端标识+生成时间”的形式进行命名,在此不作限定。例如,目标识别模型的模型标识可以为“MT170512”,则表示2017年5月12日生成的终端标识为“MT”的用户终端对应的目标识别模型。
步骤306,获取待裁剪图像。
步骤308,根据目标识别模型识别待裁剪图像中的目标区域。
在一个实施例中,用户终端在获取到新版本的目标识别模型时,会以新版本的目标识别模型覆盖旧版本的目标识别模型。在获取到待裁剪图像时,会以最新版本的目标识别模型,对待裁剪图像进行识别。例如,用户终端当前的目标识别模型的模型标识为“MT170410”,若用户终端接收到模型标识为“MT170512”的目标识别模型,则以“MT170512”的目标识别模型覆盖“MT170410”的目标识别模型。当获取到待裁剪图像之后,会根据最新版本的目标识别模型识别待裁剪图像中的目标区域。
可以理解的是,在本申请提供的其他实施例中,可以针对不同的颜色通道建立目标识别模型。在获取到待裁剪图像之后,分别将待裁剪图像的颜色通道分别通过对应的目标识别模型进行识别,并根据各个颜色通道对应的识别结果得到最终的目标区域。例如,可以针对RBG三通道分别建立目标识别模型,也可以针对YUV三通道分别建立目标识别模型,通过各个颜色通道对应的目标识别模型,将待裁剪图像的各个颜色通道进行识别,并将各个颜色通道识别的目标区域合并,得到最终的目标区域。
步骤310,根据目标区域裁剪待裁剪图像。
在一个实施例中,待裁剪图像是由若干个像素点构成的,这若干个像素点按照一定规律进行排列,通常可以组成一个二维矩阵。每个像素点都有对应的像素值以及对应的坐标,通过坐标可以表示像素点在图像中的具体位置,并通过不同像素值的像素点组成不同的图案。目标区域也是由若干个像素点构成的,也即待裁剪图像中的部分或全部像素点。在获取到目标区域之后,可以将目标区域进行标记,然后通过标记来查找目标区域。也可以提取目标区域所包含的像素的坐标,并通过坐标来查找目标区域。
具体地,步骤310中还可以包括以下步骤:
步骤402,根据目标识别模型识别待裁剪图像中的目标区域所对应的目标属性。
在一个实施例中,目标属性是指目标区域中的目标物体对应的属性。例如,目标物体可以分为人物、风景、建筑等,目标属性就可以是指这些目标物体对应的类型。具体地,可以首先提取目标区域的特征信息,并根据该特征信息识别该目标区域所对应的目标属性。例如,特征信息可以是目标区域的大小、颜色、纹理等信息,根据获取的特征信息可以识别目标区域对应的目标属性。
步骤404,根据目标属性裁剪待裁剪图像。
根据目标区域对应的目标属性,将待裁剪图像进行裁剪。具体可以是,根据目标属性获取裁剪模式,并根据获取的裁剪模式对待裁剪图像进行裁剪。裁剪模式是指裁剪图像的方法,裁剪模式可以包括边缘裁剪模式、矩形裁剪模式等,在此不做限定。例如,目标区域为人像的话,采用边缘裁剪模型进行裁剪;目标区域为风景的话,采用矩形裁剪模式进行裁剪。其中,边缘裁剪模式是指根据目标物体的边缘进行裁剪的模式,矩形裁剪模式是指根据目标物体所在的最小矩形区域进行裁剪的模式。
在一个实施例中,在获取到目标区域之后,可以通过获取的目标区域判断图像中的目标区域的数量。一般来说,一个目标物体对应了一个连通区域,若目标区域是由多个连通区域构成的,说明该图像中存在多个目标物体。其中,连通区域是指一个封闭的区域,这一个封闭的区域表示了一个目标物体所在的区域。若图像中存在多个目标区域,则裁剪之后可以只保留部分目标区域,也可以保留全部的目标区域。
具体地,步骤310中还可以包括以下步骤:
步骤502,若待裁剪图像中包含两个及两个以上的目标区域,则获取各个目标区域的物理距离。
在一个实施例中,物理距离是指图像中所拍摄的物体到图像采集装置的距离,例如物理距离可以是1米。一般地,图像是由若干个像素点构成,每一个像素点都对应了某个物体的某个位置,因此每个像素点都有对应的物理距离。目标区域是由图像中的若干个像素点构成,每个像素点都有对应的物理距离。因此目标区域的物理距离,可以是指目标区域中所有像素点对应的物理距离的平均值,也可以是目标区域中某一个像素点对应的物理距离,在此不做限定。
在一个实施例中,在获取图像的过程中,一般可以通过双摄像头或者激光摄像头,来获取图像中每一个像素点对应的物理距离。具体的,通过第一摄像头和第二摄像头分别拍摄物体对应的图像;根据该图像获取第一夹角和第二夹角,其中,第一夹角为第一摄像头到物体所在水平线与第一摄像头到第二摄像头所在水平线之间的夹角,第二夹角为第二摄像头到物体所在水平线与第二摄像头到第一摄像头所在水平线之间的夹角;根据第一夹角、第二夹角及第一摄像头到第二摄像头之间的距离,获取图像采集装置到物体之间的物理距离。
图6为一个实施例中获取物理距离的原理图。如图6所示,已知第一摄像头602到第二摄像头604之间的距离Tc,通过第一摄像头602和第二摄像头604分别拍摄物体606对应的图像,根据该图像可以获取第一夹角A1和第二夹角A2,第一摄像头602到第二摄像头604所在水平线与物体602之间的垂直交点为交点608。假设第一摄像头602到交点608的距离为Tx,那么交点608到第二摄像头604的距离就为Tc-Tx,物体606的物理距离即物体606到交点608的垂直距离为Ts。根据第一摄像头602、物体606和交点608组成的三角形,则可以得到以下公式:
同理,根据第二摄像头604、物体606和交点608组成的三角形,则可以得到以下公式:
由上述公式可以得到物体606的物理距离为:
步骤504,根据物理距离裁剪待裁剪图像。
根据物理距离裁剪待裁剪图像,裁剪之后可以将同一物理距离范围内的目标区域保留,也可以是将物理距离最近的目标区域保留,在此不做限定。具体地,获取物理距离在预设距离范围内的目标区域,并根据获取的目标区域裁剪待裁剪图像。预设距离范围是预先设置的物理距离的取值范围,例如预设距离范围可以是1到3米之内的距离。
可以理解的是,该图像裁剪方法还可以包括:获取待裁剪图像对应的应用程序标识,根据应用程序标识获取目标识别模型。其中,应用程序是指为实现某种应用目的所撰写的软体,应用程序标识是指区分不同应用程序的唯一标识。待裁剪图像对应的应用程序标识可以是指生成该待裁剪图像的应用程序对应的标识,也可以是指该待裁剪图像中所显示的应用程序对应的标识。例如,当应用程序1在前台运行时,根据该应用程序1生成的截图作为待裁剪图像,则该待裁剪图像对应的应用程序标识就可以是“应用程序1”。
目标识别模型可以是与应用程序标识对应的,根据应用程序相关的训图像生成训练图像集合,再根据训练图像集合训练得到不同应用程序对应的目标识别模型。例如,针对社交类应用程序训练得到的目标识别模型,在生成截图的时候,可以将待裁剪图像中的敏感信息所在的区域作为目标区域,并将目标区域去掉,裁剪后的图像中就只会保留非敏感信息。
上述实施例提供的图像裁剪方法,根据用户终端对应的历史裁剪图像进行模型训练,能够得到更加准确的目标识别模型。在获取到待裁剪图像之后,会根据目标识别模型对待裁剪图像中的目标区域进行识别,根据目标区域将待裁剪图像进行裁剪。目标区域一般是用户比较关注的区域,裁剪图像的时候只保留目标区域,提高了图像处理的准确性,图像裁剪更加精确。
图7为又一个实施例中图像裁剪方法的流程图。如图7所示,该图像裁剪方法包括步骤702至步骤716。其中:
步骤702,获取当前终端对应的历史裁剪图像及对应的区域标记。
步骤704,根据历史裁剪图像及对应的区域标记进行模型训练,得到目标识别模型。
步骤706,获取待裁剪图像。
步骤708,获取待裁剪图像对应的应用程序标识,根据应用程序标识获取目标识别模型。
步骤710,根据目标识别模型识别待裁剪图像中的目标区域所对应的目标属性。
步骤712,若待裁剪图像中包含两个及两个以上的目标区域,则获取各个目标区域的物理距离。
步骤714,获取物理距离在预设距离范围内的目标区域。
步骤716,根据目标属性获取裁剪模式,并根据该裁剪模式裁剪待裁剪图像。
图8为一个实施例中图像裁剪结果的终端展示图。如图8所示,获取待裁剪图像802,通过目标识别模型识别该待裁剪图像804中的目标区域,并根据目标区域将待裁剪图像进行裁剪,得到裁剪后的图像804。可以理解的是,待裁剪图像802和裁剪后的图像804的展示方式不限于图中所示的展示结果,还可以是采用其他方式进行展示。
图9为一个实施例中图像裁剪装置的结构示意图。如图9所示,该图像裁剪装置900包括图像获取模块902、目标识别模块904和图像裁剪模块906。其中:
图像获取模块902,用于获取待裁剪图像。
目标识别模块904,用于根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的。
图像裁剪模块906,用于根据所述目标区域裁剪所述待裁剪图像。
上述实施例提供的图像裁剪装置,在获取到待裁剪图像之后,会根据目标识别模型对待裁剪图像中的目标区域进行识别,根据目标区域将待裁剪图像进行裁剪。目标区域一般是用户比较关注的区域,裁剪图像的时候只保留目标区域,提高了图像处理的准确性,图像裁剪更加精确。
图10为另一个实施例中图像裁剪装置的结构示意图。如图10所示,该图像裁剪装置1000包括图像获取模块902、目标识别模块904和图像裁剪模块906。其中:
模型生成模块1002,用于获取当前终端对应的历史裁剪图像及对应的区域标记;根据所述历史裁剪图像及对应的区域标记进行模型训练,得到目标识别模型。
图像获取模块1004,用于获取待裁剪图像。
模型获取模块1006,用于获取待裁剪图像对应的应用程序标识,根据所述应用程序标识获取目标识别模型。
目标识别模块1008,用于根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的。
图像裁剪模块1010,用于根据所述目标区域裁剪所述待裁剪图像。
上述实施例提供的图像裁剪装置,在获取到待裁剪图像之后,会根据目标识别模型对待裁剪图像中的目标区域进行识别,根据目标区域将待裁剪图像进行裁剪。目标区域一般是用户比较关注的区域,裁剪图像的时候只保留目标区域,提高了图像处理的准确性,图像裁剪更加精确。
在一个实施例中,目标识别模块1008还用于根据目标识别模型识别所述待裁剪图像中的目标区域所对应的目标属性。
在其中一个实施例中,图像裁剪模块1010还用于根据所述目标属性裁剪所述待裁剪图像。
在本申请提供的实施例中,图像裁剪模块1010还用于根据所述目标属性获取裁剪模式,并根据所述裁剪模式裁剪所述待裁剪图像。
在一个实施例中,图像裁剪模块1010还用于若所述待裁剪图像中包含两个及两个以上的目标区域,则获取各个目标区域的物理距离;根据所述物理距离裁剪所述待裁剪图像。
在一个实施例中,图像裁剪模块1010还用于获取所述物理距离在预设距离范围内的目标区域,并根据获取的目标区域裁剪所述待裁剪图像。
上述图像裁剪装置中各个模块的划分仅用于举例说明,在其他实施例中,可将图像裁剪装置按照需要划分为不同的模块,以完成上述图像裁剪装置的全部或部分功能。
本发明实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行如下步骤:
获取待裁剪图像;
根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;
根据所述目标区域裁剪所述待裁剪图像。
在一个实施例中,所述处理器执行的所述方法还包括:
根据目标识别模型识别所述待裁剪图像中的目标区域所对应的目标属性;
所述根据所述目标区域裁剪所述待裁剪图像包括:
根据所述目标属性裁剪所述待裁剪图像。
在本申请提供的实施例中,所述处理器执行的所述根据所述目标属性裁剪所述待裁剪图像包括:
根据所述目标属性获取裁剪模式,并根据所述裁剪模式裁剪所述待裁剪图像。
在其中一个实施例中,所述处理器执行的所述方法还包括:
获取待裁剪图像对应的应用程序标识,根据所述应用程序标识获取目标识别模型。
在又一个实施例中,所述处理器执行的所述根据所述目标区域裁剪所述待裁剪图像包括:
若所述待裁剪图像中包含两个及两个以上的目标区域,则获取各个目标区域的物理距离;
根据所述物理距离裁剪所述待裁剪图像。
在本申请提供的实施例中,所述处理器执行的所述根据所述物理距离裁剪所述待裁剪图像包括:
获取所述物理距离在预设距离范围内的目标区域,并根据获取的目标区域裁剪所述待裁剪图像。
在一个实施例中,所述处理器执行的所述方法还包括:
获取当前终端对应的历史裁剪图像及对应的区域标记;
根据所述历史裁剪图像及对应的区域标记进行模型训练,得到目标识别模型。
本发明实施例还提供一种计算机设备。上述计算机设备中包括图像处理电路,图像处理电路可以利用硬件和/或软件组件实现,可包括定义ISP(Image SignalProcessing,图像信号处理)管线的各种处理单元。图11为一个实施例中图像处理电路的示意图。如图11所示,为便于说明,仅示出与本发明实施例相关的图像处理技术的各个方面。
如图11所示,图像处理电路包括ISP处理器1140和控制逻辑器1150。成像设备1110捕捉的图像数据首先由ISP处理器1140处理,ISP处理器1140对图像数据进行分析以捕捉可用于确定和/或成像设备1110的一个或多个控制参数的图像统计信息。成像设备1110可包括具有一个或多个透镜1112和图像传感器1114的照相机。图像传感器1114可包括色彩滤镜阵列(如Bayer滤镜),图像传感器1114可获取用图像传感器1114的每个成像像素捕捉的光强度和波长信息,并提供可由ISP处理器1140处理的一组原始图像数据。传感器1120可基于传感器1120接口类型把原始图像数据提供给ISP处理器1140。传感器1120接口可以利用SMIA(Standard Mobile Imaging Architecture,标准移动成像架构)接口、其它串行或并行照相机接口或上述接口的组合。
ISP处理器1140按多种格式逐个像素地处理原始图像数据。例如,每个图像像素可具有8、10、12或14比特的位深度,ISP处理器1140可对原始图像数据进行一个或多个图像处理操作、收集关于图像数据的统计信息。其中,图像处理操作可按相同或不同的位深度精度进行。
ISP处理器1140还可从图像存储器1130接收像素数据。例如,从传感器1120接口将原始像素数据发送给图像存储器1130,图像存储器1130中的原始像素数据再提供给ISP处理器1140以供处理。图像存储器1130可为存储器装置的一部分、存储设备、或电子设备内的独立的专用存储器,并可包括DMA(Direct Memory Access,直接直接存储器存取)特征。
当接收到来自传感器1120接口或来自图像存储器1130的原始图像数据时,ISP处理器1140可进行一个或多个图像处理操作,如时域滤波。处理后的图像数据可发送给图像存储器1130,以便在被显示之前进行另外的处理。还可直接从ISP处理器1140接收“前端”处理数据,或从图像存储器1130接收“前端”处理数据,并对“前端”处理数据进行原始域中以及RGB和YCbCr颜色空间中的图像数据处理。处理后的图像数据可输出给显示器1170,以供用户观看和/或由图形引擎或GPU(Graphics Processing Unit,图形处理器)进一步处理。此外,ISP处理器1140的输出还可发送给图像存储器1130,且显示器1170可从图像存储器1130读取图像数据。在一个实施例中,图像存储器1130可被配置为实现一个或多个帧缓冲器。此外,ISP处理器1140的输出可发送给编码器/解码器1160,以便编码/解码图像数据。编码的图像数据可被保存,并在显示于显示器1170设备上之前解压缩。
ISP处理器1140确定的统计数据可发送给控制逻辑器1150单元。例如,统计数据可包括自动曝光、自动白平衡、自动聚焦、闪烁检测、黑电平补偿、透镜1112阴影校正等图像传感器1114统计信息。控制逻辑器1150可包括执行一个或多个例程(如固件)的处理器和/或微控制器,一个或多个例程可根据接收的统计数据,确定成像设备1110的控制参数以及的控制参数。例如,控制参数可包括传感器1120控制参数(例如增益、曝光控制的积分时间)、照相机闪光控制参数、透镜1112控制参数(例如聚焦或变焦用焦距)、或这些参数的组合。ISP控制参数可包括用于自动白平衡和颜色调整(例如,在RGB处理期间)的增益水平和色彩校正矩阵,以及透镜1112阴影校正参数。
以下为运用图11中图像处理技术实现上述图像裁剪方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种图像裁剪方法,其特征在于,所述方法包括:
获取待裁剪图像;
根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;
根据所述目标区域裁剪所述待裁剪图像。
2.根据权利要求1所述图像裁剪方法,其特征在于,所述方法还包括:
根据目标识别模型识别所述待裁剪图像中的目标区域所对应的目标属性;
所述根据所述目标区域裁剪所述待裁剪图像包括:
根据所述目标属性裁剪所述待裁剪图像。
3.根据权利要求2所述图像裁剪方法,其特征在于,所述根据所述目标属性裁剪所述待裁剪图像包括:
根据所述目标属性获取裁剪模式,并根据所述裁剪模式裁剪所述待裁剪图像。
4.根据权利要求1所述图像裁剪方法,其特征在于,所述方法还包括:
获取待裁剪图像对应的应用程序标识,根据所述应用程序标识获取目标识别模型。
5.根据权利要求1所述图像裁剪方法,其特征在于,所述根据所述目标区域裁剪所述待裁剪图像包括:
若所述待裁剪图像中包含两个及两个以上的目标区域,则获取各个目标区域的物理距离;
根据所述物理距离裁剪所述待裁剪图像。
6.根据权利要求5所述图像裁剪方法,其特征在于,所述根据所述物理距离裁剪所述待裁剪图像包括:
获取所述物理距离在预设距离范围内的目标区域,并根据获取的目标区域裁剪所述待裁剪图像。
7.根据权利要求1至6任一项所述图像裁剪方法,其特征在于,所述方法还包括:
获取当前终端对应的历史裁剪图像及对应的区域标记;
根据所述历史裁剪图像及对应的区域标记进行模型训练,得到目标识别模型。
8.一种图像裁剪装置,其特征在于,所述装置包括:
图像获取模块,用于获取待裁剪图像;
目标识别模块,用于根据目标识别模型识别所述待裁剪图像中的目标区域,其中,所述目标识别模型是根据训练图像集合及对应的区域标记训练得到的;
图像裁剪模块,用于根据所述目标区域裁剪所述待裁剪图像。
9.一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的方法。
10.一种计算机设备,包括存储器及处理器,所述存储器中储存有计算机可读指令,所述指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的方法。
CN201710911708.6A 2017-09-29 2017-09-29 图像裁剪方法、装置、计算机可读存储介质和计算机设备 Active CN107622497B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710911708.6A CN107622497B (zh) 2017-09-29 2017-09-29 图像裁剪方法、装置、计算机可读存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710911708.6A CN107622497B (zh) 2017-09-29 2017-09-29 图像裁剪方法、装置、计算机可读存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN107622497A true CN107622497A (zh) 2018-01-23
CN107622497B CN107622497B (zh) 2020-03-27

Family

ID=61091414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710911708.6A Active CN107622497B (zh) 2017-09-29 2017-09-29 图像裁剪方法、装置、计算机可读存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN107622497B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110223306A (zh) * 2019-06-14 2019-09-10 北京奇艺世纪科技有限公司 一种图像的裁剪方法及装置
WO2020186385A1 (zh) * 2019-03-15 2020-09-24 深圳市大疆创新科技有限公司 图像处理方法、电子设备及计算机可读存储介质
CN111768405A (zh) * 2020-08-05 2020-10-13 赛维森(广州)医疗科技服务有限公司 处理标注图像的方法、装置、设备和存储介质
CN112561938A (zh) * 2020-12-22 2021-03-26 陕西理工大学 一种计算机图像处理方法
CN112990144A (zh) * 2021-04-30 2021-06-18 德鲁动力科技(成都)有限公司 一种用于行人重识别的数据增强方法及系统
WO2021143642A1 (zh) * 2020-01-17 2021-07-22 维沃移动通信有限公司 图像裁剪方法及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496179A (zh) * 2011-11-08 2012-06-13 中国测绘科学研究院 一种三维场景的裁剪方法
CN104484855A (zh) * 2014-12-24 2015-04-01 北京奇虎科技有限公司 图片裁剪的方法和装置
CN104504649A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片的裁剪方法和装置
US20150145953A1 (en) * 2012-03-17 2015-05-28 Waseda University Image completion system for in-image cutoff region, image processing device, and program therefor
CN104933749A (zh) * 2013-12-11 2015-09-23 Arm有限公司 图形图元的裁剪
CN106296760A (zh) * 2015-05-21 2017-01-04 腾讯科技(深圳)有限公司 图片的裁剪方法及装置
CN106875433A (zh) * 2017-03-09 2017-06-20 广东欧珀移动通信有限公司 裁剪构图的控制方法、控制装置及电子装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496179A (zh) * 2011-11-08 2012-06-13 中国测绘科学研究院 一种三维场景的裁剪方法
US20150145953A1 (en) * 2012-03-17 2015-05-28 Waseda University Image completion system for in-image cutoff region, image processing device, and program therefor
CN104933749A (zh) * 2013-12-11 2015-09-23 Arm有限公司 图形图元的裁剪
CN104484855A (zh) * 2014-12-24 2015-04-01 北京奇虎科技有限公司 图片裁剪的方法和装置
CN104504649A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片的裁剪方法和装置
CN106296760A (zh) * 2015-05-21 2017-01-04 腾讯科技(深圳)有限公司 图片的裁剪方法及装置
CN106875433A (zh) * 2017-03-09 2017-06-20 广东欧珀移动通信有限公司 裁剪构图的控制方法、控制装置及电子装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨再祥: "图像序列裁剪技术", 《计算机应用》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020186385A1 (zh) * 2019-03-15 2020-09-24 深圳市大疆创新科技有限公司 图像处理方法、电子设备及计算机可读存储介质
CN110223306A (zh) * 2019-06-14 2019-09-10 北京奇艺世纪科技有限公司 一种图像的裁剪方法及装置
WO2021143642A1 (zh) * 2020-01-17 2021-07-22 维沃移动通信有限公司 图像裁剪方法及电子设备
CN111768405A (zh) * 2020-08-05 2020-10-13 赛维森(广州)医疗科技服务有限公司 处理标注图像的方法、装置、设备和存储介质
CN111768405B (zh) * 2020-08-05 2024-02-13 赛维森(广州)医疗科技服务有限公司 处理标注图像的方法、装置、设备和存储介质
CN112561938A (zh) * 2020-12-22 2021-03-26 陕西理工大学 一种计算机图像处理方法
CN112561938B (zh) * 2020-12-22 2024-01-19 陕西理工大学 一种计算机图像处理方法
CN112990144A (zh) * 2021-04-30 2021-06-18 德鲁动力科技(成都)有限公司 一种用于行人重识别的数据增强方法及系统
CN112990144B (zh) * 2021-04-30 2021-08-17 德鲁动力科技(成都)有限公司 一种用于行人重识别的数据增强方法及系统

Also Published As

Publication number Publication date
CN107622497B (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
CN107622497A (zh) 图像裁剪方法、装置、计算机可读存储介质和计算机设备
US10872420B2 (en) Electronic device and method for automatic human segmentation in image
JP6408019B2 (ja) 画像デバイスにおける写真構図および位置ガイダンス
CN106462766B (zh) 在预览模式中进行图像捕捉参数调整
TWI766201B (zh) 活體檢測方法、裝置以及儲存介質
CN110493527B (zh) 主体对焦方法、装置、电子设备和存储介质
WO2021022983A1 (zh) 图像处理方法和装置、电子设备、计算机可读存储介质
JP6209962B2 (ja) 情報処理装置及び情報処理プログラム
CN109871845B (zh) 证件图像提取方法及终端设备
WO2011148562A1 (ja) 画像情報処理装置
CN110516672A (zh) 卡证信息识别方法、装置及终端
JP2007503030A5 (zh)
CN109948420B (zh) 人脸比对方法、装置及终端设备
CN110276831B (zh) 三维模型的建构方法和装置、设备、计算机可读存储介质
CN112017137B (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN113642639B (zh) 活体检测方法、装置、设备和存储介质
US10699145B1 (en) Systems and methods for augmented reality assisted form data capture
CN107529071A (zh) 一种视频数据处理方法以及装置
TW201804786A (zh) 路跑活動的拍照系統及其操作方法
CN107016004A (zh) 图像处理方法及装置
Mani et al. A survey on digital image forensics: Metadata and image forgeries
US9286707B1 (en) Removing transient objects to synthesize an unobstructed image
CN110852172B (zh) 一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法
JP2018029270A (ja) 画像処理装置およびその制御方法、撮像装置、プログラム
CN111898525B (zh) 烟雾识别模型的构建方法、进行烟雾检测的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., Ltd.

Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., Ltd.

GR01 Patent grant
GR01 Patent grant