WO2019169772A1 - 图片处理方法、电子装置及存储介质 - Google Patents
图片处理方法、电子装置及存储介质 Download PDFInfo
- Publication number
- WO2019169772A1 WO2019169772A1 PCT/CN2018/089881 CN2018089881W WO2019169772A1 WO 2019169772 A1 WO2019169772 A1 WO 2019169772A1 CN 2018089881 W CN2018089881 W CN 2018089881W WO 2019169772 A1 WO2019169772 A1 WO 2019169772A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- picture
- sample
- target contour
- frame
- original
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种图片处理方法,包括:对样本图片库进行训练,得到带有标记框的样本图片及不带有标记框的样本图片的归类函数;基于归类函数计算原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;将原始图片从RGB空间转换到HSV空间,得到HSV图片;根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,对所述HSV图片中每个像素进行二值化处理,得到二值化图片;从二值化图片中提取目标轮廓的位置信息,根据所述位置信息对原始图片进行裁剪得到标记框对应的局部图片。本申请还提供一种电子装置及存储介质。利用本申请可以快速准确地从所述原始图片中裁剪出标记框对应的局部图片。
Description
本申请要求于2018年3月6日提交中国专利局,申请号为201810183143.9、发明名称为“图片处理方法、电子装置及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及计算机技术领域,尤其涉及一种图片处理方法、电子装置及存储介质。
随着互联网技术的发展,各类网络资源非常丰富,极大地便利了用户对资源的获取。例如,网络上有海量高清的风景图片,从而用户无需亲自实地拍摄也可能找到所需的图片。其中,为了标记出图片中需要关注的局部内容,有些图片带有采用某一颜色绘制的标记框,例如交通监控拍摄的照片中,以红方框在照片中标记出了违规的人或车辆等,而这些局部内容正是用户希望找到的内容。因此,用户不仅希望能找到所需的原始图片,更希望能获取原始图片中标记框对应的局部图片。然而,对于此类已带有标记框的原始图片,由于标记框的位置信息无法直接提取,从而难以对原始图片进行精确裁剪以得到所述标记框对应的局部图片。在原始图片数量较大的情况下,更加需要自动快速的方式实现所述局部图片的提取。
发明内容
鉴于以上原因,有必要提供一种图片处理方法、电子装置及存储介质,可以识别带有标记框的原始图片,并自动从带有标记框的原始图片中提取所述标记框的位置信息,根据所述位置信息从而实现快速准确地从所述原始图片中裁剪出标记框对应的局部图片。
为实现上述目的,本申请提供一种图片处理方法,该方法包括:样本训练步骤:获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线;归类判断步骤:获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;空间转换步骤:若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片;二值化处理步骤:根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各 个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片;轮廓检测步骤:通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
为实现上述目的,本申请还提供一种电子装置,该电子装置包括存储器和处理器,所述存储器中包括图片处理程序,该图片处理程序被所述处理器执行时实现如下步骤:获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线;归类判断步骤:获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;空间转换步骤:若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片;二值化处理步骤:根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片;轮廓检测步骤:通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中包括图片处理程序,该图片处理程序被处理器执行时,实现如上所述的图片处理方法的任意步骤。
本申请提出的图片处理方法、电子装置及存储介质,通过对样本图片库进行训练得到带有标记框的样本图片及对应的不带有标记框的样本图片的归类函数,并基于所述归类函数计算待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框,然后将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片,并根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片,最后通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位 置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片,从而可以快速准确地从所述原始图片中裁剪出标记框对应的局部图片。
图1为本申请电子装置较佳实施例的运行环境示意图;
图2为本申请电子装置与客户端较佳实施例的交互示意图;
图3为本申请图片处理方法较佳实施例的流程图;
图4为原始图片的示例图。
图5为HSV图片的示例图。
图6为二值化图片的示例图。
图7为标记框对应的局部图片的示例图。
图8为图1中图片处理程序的程序模块图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
下面将参考若干具体实施例来描述本申请的原理和精神。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本领域的技术人员知道,本申请的实施方式可以实现为一种方法、装置、设备、系统或计算机程序产品。因此,本申请可以具体实现为完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本申请的实施例,提出了一种图片处理方法、电子装置及存储介质。
参照图1所示,为本申请电子装置1较佳实施例的运行环境示意图。
该电子装置1可以是服务器、便携式计算机、桌上型计算机等具有存储和运算功能的终端设备。
该电子装置1包括存储器11、处理器12、网络接口13及通信总线14。所述网络接口13可选地可以包括标准的有线接口和无线接口(如WI-FI接口)。通信总线14用于实现上述组件之间的连接通信。
存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,所述可读存储介质可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。在另一些实施例中,所述可读存储介质也可以是所述电子装置1的外部存储器11,例如所述电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
在本实施例中,所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的图片处理程序10及存储有样本图片库的数据库4等。所述存储 器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行图片处理程序10等。
图1仅示出了具有组件11-14以及图片处理程序10的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)、语音输入装置比如麦克风(microphone)等具有语音识别功能的设备、语音输出装置比如音响、耳机等。可选地,用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置1还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)显示器等。显示器用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
可选地,该电子装置1还包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,所述触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,所述触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。用户可以通过触摸所述触控区域启动图片处理程序10。
此外,该电子装置1的显示器的面积可以与所述触摸传感器的面积相同,也可以不同。可选地,将显示器与所述触摸传感器层叠设置,以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。
该电子装置1还可以包括射频(Radio Frequency,RF)电路、传感器和音频电路等等,在此不再赘述。
参阅图2所示,为本申请电子装置1与客户端2较佳实施例的交互示意图。所述图片处理程序10运行于电子装置1中,在图2中所述电子装置1的较佳实施例为服务器。所述电子装置1通过网络3与客户端2通信连接。所述客户端2可以运行于各类终端设备中,例如智能手机、便携式计算机等。用户通过客户端2登录至所述电子装置1后,通过所述图片处理方法,图片处理程序10可以接收并识别带有标记框的原始图片,并自动从带有标记框的原始图片中提取所述标记框的位置信息,根据所述位置信息从而实现快速准确地从所述原始图片中裁剪出标记框对应的局部图片,并将所述局部图片返回至客户端2。所述图片处理程序10可以通过Python编程语言实现。
参阅图3所示,为本申请图片处理方法较佳实施例的流程图。电子装置1的处理器12执行存储器11中存储的图片处理程序10时实现图片处理方法的 如下步骤:
步骤S1,获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线。
具体地,所述样本图片库可以存储于所述数据库4中。所述样本图片库包括用户日常采集的已确认是否带有所述预设颜色的标记框的样本图片。由于用户通常会采用红色在图片中标记出需要关注的局部内容,例如在图片中绘制一个红框,以标记出若干大楼中需要关注的一座大楼,因此所述预设颜色可以为红色。所述样本图片库中的每一个样本图片都带有备注信息,所述备注信息用于指示相应的样本图片是否带有预设颜色的所述标记框。
所述对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数例如可以通过以下方式实现:
构建卷积神经网络,通过所述卷积神经网络对所述样本图片库进行训练,得到所述样本图片库对应的卷积神经网络模型;
根据样本图片库中每个图片是否带有所述标记框的备注信息,将所述样本图片库分为含标记框图片集和无标记框图片集,所述含标记框图片集包括所述多个带有标记框的样本图片,所述无标记框图片集包括所述对应的多个不带有标记框的样本图片;
将所述含标记框图片集和所述无标记框图片集分别输入所述卷积神经网络模型,通过所述卷积神经网络模型的卷积核卷积得到所述含标记框图片集对应的特征值向量集,以及所述无标记框图片集对应的特征值向量集;
通过支持向量机(Support Vector Machine)算法对所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集进行计算,得到所述含标记框图片集及所述无标记框图片集的归类函数。
所述支持向量机算法是一种归类算法,它在解决小样本、非线性及高维模式识别中具有优势,并能够推广应用到函数拟合等其他机器学习问题中,整体来说,支持向量机算法可以解决复杂事务的分类及分类标准的问题。将所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集通过支持向量机算法进行计算后,可以得到划分为带有标记框的图片和不带有标记框的图片这两类图片的分类条件,所述分类条件可以用所述归类函数表示。
在一个实施例中,若所述分类条件为线性分类,则所述归类函数例如可以通过以下函数式表示:
f(x)=wx+b;
其中,w为通过支持向量机算法对所述含标记框图片集对应的特征值向量集进行计算后得到的参数,b为通过支持向量机算法对所述无标记框图片集对应的特征值向量集进行计算后得到的参数,x表示待处理的原始图片对应的特征向量,即所述x为未知数的变量。
步骤S2,获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
具体地,步骤S2在获取所述待处理的原始图片后,可以先将所述待处理的原始图片输入步骤S1构建的所述卷积神经网络模型,得到该待处理的原始图片对应的特征向量,即所述变量x。
然后,步骤S2可以对所述原始图片对应的特征向量基于所述归类函数计算所述待处理的原始图片的归类值,并判断该归类值是否大于预设阈值,若该归类值大于所述预设阈值,则判定该原始图片中包括采用所述预设颜色绘制的标记框。在本实施例中,所述第一预设条件即为所述归类值大于所述预设阈值。
步骤S3,若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片。
具体地,通常用户使用或见到的图片为RGB格式,因此可以设所述原始图片为RGB格式的图片。例如图4所示为一个RGB格式的原始图片(为适应专利法要求,转成灰度图展示),该原始图片中用3个红色方形标记框分别标记出了3只小猫。
由于RGB格式的图片中红(R)、绿(G)、蓝(B)三个颜色通道的取值范围较广,为0~255,虽然从肉眼上看颜色差别很大,但从RGB取值范围上看差异并不大,取值范围相互会有重叠关系,因此很难判断出图4中红色方形标记框的红色区域的RGB取值范围。而HSV色彩空间不仅涉及到红绿蓝三原色成份,还会考虑到色调(H)、饱和度(S)、亮度(V)颜色参数的数值,因此使用HSV色彩空间更便于将指定颜色提取出来。
由此,步骤S3需要对所述原始图片进行HSV变换。在本实施例中,步骤S3可以使用跨平台计算机视觉库openCV中的cv2.COLOR_RGB2HLS函数来实现所述HSV变换,通过将所述原始图片中的每个像素都分解成色度(H)、饱和度(S)和亮度(V)值,将原始图片转换到HSV色彩空间中,从而得到所述HSV图片,例如图5所示。可以看出,图5中标记框的视觉效果变得更加突出。
步骤S4,根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度(H)、饱和度(S)和亮度(V)值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片。
具体地,所述预设颜色在HSV空间中的取值范围,即预设颜色在HSV空间中对应的色调(H)、饱和度(S)、亮度(V)参数的取值范围。以图5为例,在openCV的HSV图片中,色度H的取值范围是0~180,饱和度S的取值范围是0~255,亮度V的取值范围是0~255。其中,红色的色度H的取值范围大约是(0~10)∪(156~180),红色的饱和度S的取值范围大约是43~255, 红色的亮度V的取值范围大约是46~255。同时,当饱和度S低于一个阈值(参考值80)时则呈现灰色,当亮度V过低则呈现黑色,V亮度过高则呈现白色。在此基础上,由于图5中红框是采用计算机工具绘制的,饱和度S一般会比较机械均匀,因此图5中标记框的红色对应的取值范围可以确定得比较窄一些,例如可以确定为H:0~1,S:155~255,V:170~255。根据所确定的取值范围,可以设定所述二值化阈值。
根据所述二值化阈值,步骤S4对所述HSV图片进行二值化处理。具体地,步骤S4可以判断所述HSV图片中各个像素点的色度(H)、饱和度(S)和亮度(V)值是否满足所述二值化阈值,若满足所述二值化阈值,则相应的像素点的像素值设置为第一指定数值,例如255;若不满足所述二值化阈值,则将相应的像素点的像素值设置为第二指定数值,例如0,最终得到所述二值化图片。
结合上述图5中标记框的红色的取值范围为色度H:0~1,饱和度S:155~255,亮度V:170~255,针对图5设定的所述二值化阈值即可以为所述色度H:0~1,饱和度S:155~255,亮度V:170~255。根据针对图5设定的所述二值化阈值,步骤S4对所述HSV图片进行二值化处理,具体地,即可以为步骤S4检测图5中各像素点是否满足H:0~1,S:155~255,V:170~255,若满足,则步骤S4将图5中相应像素点的像素值设置为255,呈现为白色,若不满足,则步骤S4将图5中相应像素点的像素值设置为0,呈现为黑色,得到的二值化图片如图6所示。
步骤S5,通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
由于原始图片中可能存在一些标记框以外的区域颜色与标记框颜色一致的情况,因此,通过步骤S4得到的二值化图片中可能存在一些噪声,即将非标记框区域的像素点的像素值设置成与标记框像素点的像素值相同,为了避免非标记框区域位置信息的干扰,因此需要进行去噪声处理。由于这些非标记框区域的像素点理论上尺寸比较小,且通常不成具体的形状,所以步骤S5可以通过对所述二值化图片进行轮廓检测,排除大小不满足第二预设条件的轮廓作为所述去噪声处理。
由此,步骤S5通过轮廓检测算法,从所述二值化图片中检测出目标轮廓可以包括:
通过轮廓检测算法,从所述二值化图片中检测出一个或多个候选轮廓;
分别计算所述一个或多个候选轮廓的尺寸大小,并将计算结果与第二预设条件进行对比,将对应计算结果满足所述第二预设条件的候选轮廓作为目标轮廓。
所述第二预设条件例如可以为轮廓宽度和高度需要分别或同时大于某数值。结合图6所示,根据小猫在图4中的大小比例,步骤S5可以将所述第二 预设条件设置为轮廓宽度和高度需同时大于10。所述轮廓检测的方法例如可以使用OpenCV中的cv2.findContours函数。
在一个实施例中,根据一般用户使用的标记框的形状,所述目标轮廓可能为圆形、椭圆形、正方形和长方形,由此步骤S5提取所述目标轮廓的位置信息例如可以包括:
判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;
当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;
当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;
当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的顶点位置信息。
步骤S5提取所述目标轮廓的位置信息后,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。例如根据所提取的标记框的位置信息,步骤S5可以对图4进行裁剪,得到标记框在图4中对应的局部图片,如图7所示。
综上所述,根据本实施例提供的图片处理方法,通过对样本图片库进行训练得到带有标记框的样本图片及对应的不带有标记框的样本图片的归类函数,并基于所述归类函数计算待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框,然后将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片,并根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片,最后通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。通过本实施例提供的图片处理方法可以识别带有标记框的原始图片,并自动从带有标记框的原始图片中提取所述标记框的位置信息,根据所述位置信息从而实现快速准确地从所述原始图片中裁剪出标记框对应的局部图片。
参阅图8所示,为图1中图片处理程序10的程序模块图。在本实施例中,图片处理程序10被分割为多个模块,该多个模块被存储于存储器11中,并由处理器12执行,以完成本申请。本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段。
所述图片处理程序10可以被分割为:样本训练模块110、归类判断模块 120、空间转换模块130、二值化处理模块140和轮廓检测模块150。
样本训练模块110,用于获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线。
具体地,所述对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数包括:
样本训练模块110构建卷积神经网络,通过所述卷积神经网络对所述样本图片库进行训练,得到所述样本图片库对应的卷积神经网络模型;
样本训练模块110根据样本图片库中每个图片是否带有所述标记框的备注信息,将所述样本图片库分为含标记框图片集和无标记框图片集,所述含标记框图片集包括所述多个带有标记框的样本图片,所述无标记框图片集包括所述对应的多个不带有标记框的样本图片;
样本训练模块110将所述含标记框图片集和所述无标记框图片集分别输入所述卷积神经网络模型,通过所述卷积神经网络模型的卷积核卷积得到所述含标记框图片集对应的特征值向量集,以及所述无标记框图片集对应的特征值向量集;
样本训练模块110通过支持向量机算法对所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集进行计算,得到所述含标记框图片集及所述无标记框图片集的归类函数。
归类判断模块120,用于获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
其中,所述获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框包括:
获取待处理的原始图片,将所述待处理的原始图片输入所述卷积神经网络模型,得到该待处理的原始图片对应的特征向量;
对所述原始图片对应的特征向量基于所述归类函数计算所述待处理的原始图片的归类值,并判断该归类值是否大于预设阈值,若该归类值大于所述预设阈值,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
基于所述原始图片对应的特征向量,所述归类函数例如可以表示如下:
f(x)=wx+b;
其中,w为通过支持向量机算法对所述含标记框图片集对应的特征值向量集进行计算后得到的参数,b为通过支持向量机算法对所述无标记框图片集对应的特征值向量集进行计算后得到的参数,x表示所述待处理的原始图片对应的特征向量。
空间转换模块130,用于若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间, 将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片。
二值化处理模块140,用于根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片。
轮廓检测模块150,用于通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
其中,所述通过轮廓检测算法,从所述二值化图片中检测出目标轮廓包括:
通过轮廓检测算法,从所述二值化图片中检测出一个或多个候选轮廓;
分别计算所述一个或多个候选轮廓的尺寸大小,并将计算结果与第二预设条件进行对比,将对应计算结果满足所述第二预设条件的候选轮廓作为目标轮廓。
具体地,所述提取所述目标轮廓的位置信息例如可以包括:
判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;
当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;
当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;
当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的顶点位置信息。
在图1所示的电子装置1较佳实施例的运行环境示意图中,包含可读存储介质的存储器11中可以包括操作系统、图片处理程序10及数据库4。处理器12执行存储器11中存储的图片处理程序10时实现如下步骤:
样本训练步骤:获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线;
归类判断步骤:获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;
空间转换步骤:若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述 原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片;
二值化处理步骤:根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片;
轮廓检测步骤:通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
所述对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数包括:
构建卷积神经网络,通过所述卷积神经网络对所述样本图片库进行训练,得到所述样本图片库对应的卷积神经网络模型;
根据样本图片库中每个图片是否带有所述标记框的备注信息,将所述样本图片库分为含标记框图片集和无标记框图片集,所述含标记框图片集包括所述多个带有标记框的样本图片,所述无标记框图片集包括所述对应的多个不带有标记框的样本图片;
将所述含标记框图片集和所述无标记框图片集分别输入所述卷积神经网络模型,通过所述卷积神经网络模型的卷积核卷积得到所述含标记框图片集对应的特征值向量集,以及所述无标记框图片集对应的特征值向量集;
通过支持向量机算法对所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集进行计算,得到所述含标记框图片集及所述无标记框图片集的归类函数。
所述获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框包括:
获取待处理的原始图片,将所述待处理的原始图片输入所述卷积神经网络模型,得到该待处理的原始图片对应的特征向量;
对所述原始图片对应的特征向量基于所述归类函数计算所述待处理的原始图片的归类值,并判断该归类值是否大于预设阈值,若该归类值大于所述预设阈值,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
所述归类函数表示如下:
f(x)=wx+b;
其中,w为通过支持向量机算法对所述含标记框图片集对应的特征值向量集进行计算后得到的参数,b为通过支持向量机算法对所述无标记框图片集对应的特征值向量集进行计算后得到的参数,x表示所述待处理的原始图片对应的特征向量。
所述通过轮廓检测算法,从所述二值化图片中检测出目标轮廓包括:
通过轮廓检测算法,从所述二值化图片中检测出一个或多个候选轮廓;
分别计算所述一个或多个候选轮廓的尺寸大小,并将计算结果与第二预设条件进行对比,将对应计算结果满足所述第二预设条件的候选轮廓作为目标轮廓。
所述提取所述目标轮廓的位置信息包括:
判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;
当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;
当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;
当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的顶点位置信息。
具体原理请参照上述图8关于图片处理程序10的程序模块图及图3关于图片处理方法较佳实施例的流程图的介绍。
此外,本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储有所述样本图片库的数据库4及图片处理程序10等,所述图片处理程序10被所述处理器12执行时实现如下操作:
样本训练步骤:获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线;
归类判断步骤:获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;
空间转换步骤:若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片;
二值化处理步骤:根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片;
轮廓检测步骤:通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置 信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
所述对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数包括:
构建卷积神经网络,通过所述卷积神经网络对所述样本图片库进行训练,得到所述样本图片库对应的卷积神经网络模型;
根据样本图片库中每个图片是否带有所述标记框的备注信息,将所述样本图片库分为含标记框图片集和无标记框图片集,所述含标记框图片集包括所述多个带有标记框的样本图片,所述无标记框图片集包括所述对应的多个不带有标记框的样本图片;
将所述含标记框图片集和所述无标记框图片集分别输入所述卷积神经网络模型,通过所述卷积神经网络模型的卷积核卷积得到所述含标记框图片集对应的特征值向量集,以及所述无标记框图片集对应的特征值向量集;
通过支持向量机算法对所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集进行计算,得到所述含标记框图片集及所述无标记框图片集的归类函数。
所述获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框包括:
获取待处理的原始图片,将所述待处理的原始图片输入所述卷积神经网络模型,得到该待处理的原始图片对应的特征向量;
对所述原始图片对应的特征向量基于所述归类函数计算所述待处理的原始图片的归类值,并判断该归类值是否大于预设阈值,若该归类值大于所述预设阈值,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
所述归类函数表示如下:
f(x)=wx+b;
其中,w为通过支持向量机算法对所述含标记框图片集对应的特征值向量集进行计算后得到的参数,b为通过支持向量机算法对所述无标记框图片集对应的特征值向量集进行计算后得到的参数,x表示所述待处理的原始图片对应的特征向量。
所述通过轮廓检测算法,从所述二值化图片中检测出目标轮廓包括:
通过轮廓检测算法,从所述二值化图片中检测出一个或多个候选轮廓;
分别计算所述一个或多个候选轮廓的尺寸大小,并将计算结果与第二预设条件进行对比,将对应计算结果满足所述第二预设条件的候选轮廓作为目标轮廓。
所述提取所述目标轮廓的位置信息包括:
判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;
当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;
当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;
当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的顶点位置信息。
本申请之计算机可读存储介质的具体实施方式与上述图片处理方法以及电子装置1的具体实施方式大致相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (20)
- 一种图片处理方法,其特征在于,该方法包括以下步骤:样本训练步骤:获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线;归类判断步骤:获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;空间转换步骤:若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片;二值化处理步骤:根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片;轮廓检测步骤:通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
- 如权利要求1所述的图片处理方法,其特征在于,所述对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数包括:构建卷积神经网络,通过所述卷积神经网络对所述样本图片库进行训练,得到所述样本图片库对应的卷积神经网络模型;根据样本图片库中每个图片是否带有所述标记框的备注信息,将所述样本图片库分为含标记框图片集和无标记框图片集,所述含标记框图片集包括所述多个带有标记框的样本图片,所述无标记框图片集包括所述对应的多个不带有标记框的样本图片;将所述含标记框图片集和所述无标记框图片集分别输入所述卷积神经网络模型,通过所述卷积神经网络模型的卷积核卷积得到所述含标记框图片集对应的特征值向量集,以及所述无标记框图片集对应的特征值向量集;通过支持向量机算法对所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集进行计算,得到所述含标记框图片集及所述无标记框图片集的归类函数。
- 如权利要求2所述的图片处理方法,其特征在于,所述获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归 类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框包括:获取待处理的原始图片,将所述待处理的原始图片输入所述卷积神经网络模型,得到该待处理的原始图片对应的特征向量;对所述原始图片对应的特征向量基于所述归类函数计算所述待处理的原始图片的归类值,并判断该归类值是否大于预设阈值,若该归类值大于所述预设阈值,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
- 如权利要求3所述的图片处理方法,其特征在于,所述归类函数表示如下:f(x)=wx+b;其中,w为通过支持向量机算法对所述含标记框图片集对应的特征值向量集进行计算后得到的参数,b为通过支持向量机算法对所述无标记框图片集对应的特征值向量集进行计算后得到的参数,x表示所述待处理的原始图片对应的特征向量。
- 如权利要求1所述的图片处理方法,其特征在于,所述通过轮廓检测算法,从所述二值化图片中检测出目标轮廓包括:通过轮廓检测算法,从所述二值化图片中检测出一个或多个候选轮廓;分别计算所述一个或多个候选轮廓的尺寸大小,并将计算结果与第二预设条件进行对比,将对应计算结果满足所述第二预设条件的候选轮廓作为目标轮廓。
- 如权利要求1所述的图片处理方法,其特征在于,所述提取所述目标轮廓的位置信息包括:判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的顶点位置信息。
- 如权利要求2-5任一项所述的图片处理方法,其特征在于,所述提取所述目标轮廓的位置信息包括:判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的 顶点位置信息。
- 一种电子装置,包括存储器和处理器,其特征在于,所述存储器中包括图片处理程序,该图片处理程序被所述处理器执行时实现如下步骤:样本训练步骤:获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线;归类判断步骤:获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;空间转换步骤:若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片;二值化处理步骤:根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片;轮廓检测步骤:通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
- 如权利要求8所述的电子装置,其特征在于,所述对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数包括:构建卷积神经网络,通过所述卷积神经网络对所述样本图片库进行训练,得到所述样本图片库对应的卷积神经网络模型;根据样本图片库中每个图片是否带有所述标记框的备注信息,将所述样本图片库分为含标记框图片集和无标记框图片集,所述含标记框图片集包括所述多个带有标记框的样本图片,所述无标记框图片集包括所述对应的多个不带有标记框的样本图片;将所述含标记框图片集和所述无标记框图片集分别输入所述卷积神经网络模型,通过所述卷积神经网络模型的卷积核卷积得到所述含标记框图片集对应的特征值向量集,以及所述无标记框图片集对应的特征值向量集;通过支持向量机算法对所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集进行计算,得到所述含标记框图片集及所述无标记框图片集的归类函数。
- 如权利要求9所述的电子装置,其特征在于,所述获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类 值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框包括:获取待处理的原始图片,将所述待处理的原始图片输入所述卷积神经网络模型,得到该待处理的原始图片对应的特征向量;对所述原始图片对应的特征向量基于所述归类函数计算所述待处理的原始图片的归类值,并判断该归类值是否大于预设阈值,若该归类值大于所述预设阈值,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
- 如权利要求10所述的电子装置,其特征在于,所述归类函数表示如下:f(x)=wx+b;其中,w为通过支持向量机算法对所述含标记框图片集对应的特征值向量集进行计算后得到的参数,b为通过支持向量机算法对所述无标记框图片集对应的特征值向量集进行计算后得到的参数,x表示所述待处理的原始图片对应的特征向量。
- 如权利要求8所述的电子装置,其特征在于,所述通过轮廓检测算法,从所述二值化图片中检测出目标轮廓包括:通过轮廓检测算法,从所述二值化图片中检测出一个或多个候选轮廓;分别计算所述一个或多个候选轮廓的尺寸大小,并将计算结果与第二预设条件进行对比,将对应计算结果满足所述第二预设条件的候选轮廓作为目标轮廓。
- 如权利要求8所述的电子装置,其特征在于,所述提取所述目标轮廓的位置信息包括:判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的顶点位置信息。
- 如权利要求9-12任一项所述的电子装置,其特征在于,所述提取所述目标轮廓的位置信息包括:判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的 顶点位置信息。
- 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括图片处理程序,所述图片处理程序被处理器执行时,实现如下步骤:样本训练步骤:获取样本图片库,所述样本图片库包括多个带有标记框的样本图片以及对应的多个不带有标记框的样本图片,对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数,所述标记框为采用预设颜色绘制的闭合框线;归类判断步骤:获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值,若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框;空间转换步骤:若判定该原始图片中包括采用所述预设颜色绘制的标记框,则将所述包括标记框的原始图片从RGB空间转换到HSV空间,将所述原始图片中的每个像素都分解成色度H、饱和度S和亮度V值,从而得到HSV图片;二值化处理步骤:根据所述预设颜色在HSV空间中的取值范围,设定二值化阈值,使用所述二值化阈值,判断所述HSV图片中各个像素点的色度H、饱和度S和亮度V值是否满足所述二值化阈值,根据判断结果对所述HSV图片中每个像素进行二值化处理,得到所述HSV图片对应的二值化图片;轮廓检测步骤:通过轮廓检测算法,从所述二值化图片中检测出目标轮廓,并提取所述目标轮廓的位置信息作为所述原始图片中标记框对应的位置信息,根据所述位置信息对所述待处理的原始图片进行裁剪,得到原始图片中标记框对应的局部图片。
- 如权利要求15所述的计算机可读存储介质,其特征在于,所述对所述样本图片库进行训练,得到所述带有标记框的样本图片及所述对应的不带有标记框的样本图片的归类函数包括:构建卷积神经网络,通过所述卷积神经网络对所述样本图片库进行训练,得到所述样本图片库对应的卷积神经网络模型;根据样本图片库中每个图片是否带有所述标记框的备注信息,将所述样本图片库分为含标记框图片集和无标记框图片集,所述含标记框图片集包括所述多个带有标记框的样本图片,所述无标记框图片集包括所述对应的多个不带有标记框的样本图片;将所述含标记框图片集和所述无标记框图片集分别输入所述卷积神经网络模型,通过所述卷积神经网络模型的卷积核卷积得到所述含标记框图片集对应的特征值向量集,以及所述无标记框图片集对应的特征值向量集;通过支持向量机算法对所述含标记框图片集对应的特征值向量集和所述无标记框图片集对应的特征值向量集进行计算,得到所述含标记框图片集及所述无标记框图片集的归类函数。
- 如权利要求16所述的计算机可读存储介质,其特征在于,所述获取待处理的原始图片,基于所述归类函数计算所述待处理的原始图片的归类值, 若该归类值满足第一预设条件,则判定该原始图片中包括采用所述预设颜色绘制的标记框包括:获取待处理的原始图片,将所述待处理的原始图片输入所述卷积神经网络模型,得到该待处理的原始图片对应的特征向量;对所述原始图片对应的特征向量基于所述归类函数计算所述待处理的原始图片的归类值,并判断该归类值是否大于预设阈值,若该归类值大于所述预设阈值,则判定该原始图片中包括采用所述预设颜色绘制的标记框。
- 如权利要求17所述的计算机可读存储介质,其特征在于,所述归类函数表示如下:f(x)=wx+b;其中,w为通过支持向量机算法对所述含标记框图片集对应的特征值向量集进行计算后得到的参数,b为通过支持向量机算法对所述无标记框图片集对应的特征值向量集进行计算后得到的参数,x表示所述待处理的原始图片对应的特征向量。
- 如权利要求15所述的计算机可读存储介质,其特征在于,所述通过轮廓检测算法,从所述二值化图片中检测出目标轮廓包括:通过轮廓检测算法,从所述二值化图片中检测出一个或多个候选轮廓;分别计算所述一个或多个候选轮廓的尺寸大小,并将计算结果与第二预设条件进行对比,将对应计算结果满足所述第二预设条件的候选轮廓作为目标轮廓。
- 如权利要求15-18任一项所述的计算机可读存储介质,其特征在于,所述提取所述目标轮廓的位置信息包括:判断所述目标轮廓的形状为圆形、椭圆形、正方形、长方形之一;当所述目标轮廓的形状为圆形时,提取所述目标轮廓的圆心位置信息及半径长度信息;当所述目标轮廓的形状为椭圆形时,提取所述目标轮廓的两个焦点位置信息、四个顶点的位置信息,以及在目标轮廓上采样得到的预设数量个采样点的位置信息;当所述目标轮廓的形状为正方形或长方形时,提取所述所述目标轮廓的顶点位置信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810183143.9A CN108446697B (zh) | 2018-03-06 | 2018-03-06 | 图片处理方法、电子装置及存储介质 |
CN201810183143.9 | 2018-03-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2019169772A1 true WO2019169772A1 (zh) | 2019-09-12 |
Family
ID=63193729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2018/089881 WO2019169772A1 (zh) | 2018-03-06 | 2018-06-05 | 图片处理方法、电子装置及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108446697B (zh) |
WO (1) | WO2019169772A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111061933A (zh) * | 2019-11-21 | 2020-04-24 | 深圳壹账通智能科技有限公司 | 图片样本库构建方法、装置、可读存储介质及终端设备 |
CN111209922A (zh) * | 2020-01-14 | 2020-05-29 | 深圳市彬讯科技有限公司 | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 |
CN112508016A (zh) * | 2020-12-15 | 2021-03-16 | 深圳万兴软件有限公司 | 一种图像处理方法、装置、计算机设备及存储介质 |
CN112966786A (zh) * | 2021-04-15 | 2021-06-15 | 宁波九寰适创科技有限公司 | 一种用于卷积神经网络训练数据的自动化标记方法 |
CN113093556A (zh) * | 2020-01-08 | 2021-07-09 | 佛山市云米电器科技有限公司 | 衣物收取提醒方法、晾衣架、系统及存储介质 |
CN113538450A (zh) * | 2020-04-21 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 用于生成图像的方法及装置 |
CN114092456A (zh) * | 2021-11-26 | 2022-02-25 | 上海申挚医疗科技有限公司 | 细胞荧光图像判别方法及系统 |
CN114399617A (zh) * | 2021-12-23 | 2022-04-26 | 北京百度网讯科技有限公司 | 一种遮挡图案识别方法、装置、设备和介质 |
CN116469025A (zh) * | 2022-12-30 | 2023-07-21 | 以萨技术股份有限公司 | 一种识别任务的处理方法、电子设备及存储介质 |
CN113496139B (zh) * | 2020-03-18 | 2024-02-13 | 北京京东乾石科技有限公司 | 从图像中检测目标和训练目标检测模型的方法和设备 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447895B (zh) * | 2018-09-03 | 2021-06-08 | 腾讯科技(武汉)有限公司 | 图片生成方法和装置、存储介质及电子装置 |
CN109522898A (zh) * | 2018-09-18 | 2019-03-26 | 平安科技(深圳)有限公司 | 手写样本图片标注方法、装置、计算机设备及存储介质 |
CN110110750B (zh) * | 2019-03-29 | 2021-03-05 | 广州思德医疗科技有限公司 | 一种原始图片的分类方法及装置 |
CN110084132B (zh) * | 2019-04-03 | 2020-02-28 | 杭州深数科技有限公司 | 基于无人机的木料货场木料信息获取方法、系统、装置 |
CN110220480A (zh) * | 2019-05-07 | 2019-09-10 | 上海理工大学 | 一种眼镜镜框前倾角的测量方法 |
CN110162649B (zh) * | 2019-05-24 | 2021-06-18 | 北京百度网讯科技有限公司 | 样本数据获取方法、获取系统、服务器和计算机可读介质 |
CN110889882B (zh) * | 2019-11-11 | 2023-05-30 | 北京皮尔布莱尼软件有限公司 | 一种合成图片的方法及计算设备 |
CN112183554A (zh) * | 2020-09-01 | 2021-01-05 | 国交空间信息技术(北京)有限公司 | 一种自动化道路边界轮廓提取方法 |
CN114385256A (zh) * | 2020-10-22 | 2022-04-22 | 华为云计算技术有限公司 | 系统参数的配置方法和配置装置 |
CN112481839B (zh) * | 2020-11-27 | 2022-08-02 | 杭州数迈科技有限公司 | 织物缝合方法、系统、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732220A (zh) * | 2015-04-03 | 2015-06-24 | 中国人民解放军国防科学技术大学 | 一种面向监控视频的特定颜色人体检测方法 |
CN105678756A (zh) * | 2015-12-30 | 2016-06-15 | 天津盛购科技发展有限公司 | 一种基于颜色的库位定位系统 |
US20160275366A1 (en) * | 2015-03-19 | 2016-09-22 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing system, non-transitory computer readable medium, and image processing method |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101877126B (zh) * | 2009-11-19 | 2012-12-19 | 东软集团股份有限公司 | 一种车牌候选区域的分割方法及装置 |
CN103093181B (zh) * | 2011-11-01 | 2016-04-27 | 青岛海信网络科技股份有限公司 | 一种车牌图像定位的方法和装置 |
CN103617422B (zh) * | 2013-10-29 | 2017-01-11 | 浙江工业大学 | 一种基于名片识别的社交关系管理方法 |
EP3223237B1 (en) * | 2016-03-22 | 2020-05-27 | Tata Consultancy Services Limited | Systems and methods for detecting and tracking a marker |
-
2018
- 2018-03-06 CN CN201810183143.9A patent/CN108446697B/zh active Active
- 2018-06-05 WO PCT/CN2018/089881 patent/WO2019169772A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160275366A1 (en) * | 2015-03-19 | 2016-09-22 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing system, non-transitory computer readable medium, and image processing method |
CN104732220A (zh) * | 2015-04-03 | 2015-06-24 | 中国人民解放军国防科学技术大学 | 一种面向监控视频的特定颜色人体检测方法 |
CN105678756A (zh) * | 2015-12-30 | 2016-06-15 | 天津盛购科技发展有限公司 | 一种基于颜色的库位定位系统 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111061933A (zh) * | 2019-11-21 | 2020-04-24 | 深圳壹账通智能科技有限公司 | 图片样本库构建方法、装置、可读存储介质及终端设备 |
CN113093556A (zh) * | 2020-01-08 | 2021-07-09 | 佛山市云米电器科技有限公司 | 衣物收取提醒方法、晾衣架、系统及存储介质 |
CN111209922B (zh) * | 2020-01-14 | 2023-09-01 | 深圳市彬讯科技有限公司 | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 |
CN111209922A (zh) * | 2020-01-14 | 2020-05-29 | 深圳市彬讯科技有限公司 | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 |
CN113496139B (zh) * | 2020-03-18 | 2024-02-13 | 北京京东乾石科技有限公司 | 从图像中检测目标和训练目标检测模型的方法和设备 |
CN113538450A (zh) * | 2020-04-21 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 用于生成图像的方法及装置 |
US11810333B2 (en) | 2020-04-21 | 2023-11-07 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for generating image of webpage content |
CN112508016A (zh) * | 2020-12-15 | 2021-03-16 | 深圳万兴软件有限公司 | 一种图像处理方法、装置、计算机设备及存储介质 |
CN112508016B (zh) * | 2020-12-15 | 2024-04-16 | 深圳万兴软件有限公司 | 一种图像处理方法、装置、计算机设备及存储介质 |
CN112966786A (zh) * | 2021-04-15 | 2021-06-15 | 宁波九寰适创科技有限公司 | 一种用于卷积神经网络训练数据的自动化标记方法 |
CN114092456A (zh) * | 2021-11-26 | 2022-02-25 | 上海申挚医疗科技有限公司 | 细胞荧光图像判别方法及系统 |
CN114399617B (zh) * | 2021-12-23 | 2023-08-04 | 北京百度网讯科技有限公司 | 一种遮挡图案识别方法、装置、设备和介质 |
CN114399617A (zh) * | 2021-12-23 | 2022-04-26 | 北京百度网讯科技有限公司 | 一种遮挡图案识别方法、装置、设备和介质 |
CN116469025B (zh) * | 2022-12-30 | 2023-11-24 | 以萨技术股份有限公司 | 一种识别任务的处理方法、电子设备及存储介质 |
CN116469025A (zh) * | 2022-12-30 | 2023-07-21 | 以萨技术股份有限公司 | 一种识别任务的处理方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108446697B (zh) | 2019-11-12 |
CN108446697A (zh) | 2018-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019169772A1 (zh) | 图片处理方法、电子装置及存储介质 | |
US10127441B2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
US9754164B2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
CN110348294B (zh) | Pdf文档中图表的定位方法、装置及计算机设备 | |
WO2020232872A1 (zh) | 表格识别方法、装置、计算机设备和存储介质 | |
US9418283B1 (en) | Image processing using multiple aspect ratios | |
JP5972468B2 (ja) | 画像からのラベルの検出 | |
US9576196B1 (en) | Leveraging image context for improved glyph classification | |
WO2018068304A1 (zh) | 一种图像匹配的方法及装置 | |
WO2018233055A1 (zh) | 保单信息录入的方法、装置、计算机设备及存储介质 | |
CN110197238B (zh) | 一种字体类别的识别方法、系统及终端设备 | |
US10489636B2 (en) | Lip movement capturing method and device, and storage medium | |
Vanetti et al. | Gas meter reading from real world images using a multi-net system | |
WO2022134771A1 (zh) | 表格处理方法、装置、电子设备及存储介质 | |
US20180253852A1 (en) | Method and device for locating image edge in natural background | |
WO2019033570A1 (zh) | 嘴唇动作分析方法、装置及存储介质 | |
US9542756B2 (en) | Note recognition and management using multi-color channel non-marker detection | |
WO2021184718A1 (zh) | 卡片边框识别方法、装置、设备和计算机存储介质 | |
CN109033935B (zh) | 抬头纹检测方法及装置 | |
US9235757B1 (en) | Fast text detection | |
CN110047083B (zh) | 图像噪点识别方法、服务器及存储介质 | |
CN112101317A (zh) | 页面方向识别方法、装置、设备及计算机可读存储介质 | |
CN110717060B (zh) | 图像mask的过滤方法、装置及存储介质 | |
CN113627423A (zh) | 圆形印章字符识别方法、装置、计算机设备和存储介质 | |
JP6699048B2 (ja) | 特徴選択装置、タグ関連領域抽出装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18908886 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 08.12.2020) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 18908886 Country of ref document: EP Kind code of ref document: A1 |