CN114022843A - 图片处理方法、装置、计算机设备和存储介质 - Google Patents

图片处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114022843A
CN114022843A CN202111261534.6A CN202111261534A CN114022843A CN 114022843 A CN114022843 A CN 114022843A CN 202111261534 A CN202111261534 A CN 202111261534A CN 114022843 A CN114022843 A CN 114022843A
Authority
CN
China
Prior art keywords
picture
data set
monitoring
preprocessed
erasenet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111261534.6A
Other languages
English (en)
Inventor
徐梦佳
李斯
杨周龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongpu Software Co Ltd
Original Assignee
Dongpu Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongpu Software Co Ltd filed Critical Dongpu Software Co Ltd
Priority to CN202111261534.6A priority Critical patent/CN114022843A/zh
Publication of CN114022843A publication Critical patent/CN114022843A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图片处理技术领域,公开了一种图片处理方法、装置、计算机设备和存储介质。该方法利用掩膜处理对监控图片文字识别区域进行定位,对无需进行文字擦除的区域进行屏蔽,再通过优化后的EraseNet模型对屏蔽图片进行训练,对图片中的目标文字区域进行文字擦除,得到文字擦除处理后的图片。整个过程识别准确率高,仅对特定区域进行处理,保留了其他部分有效信息,处理速度快文字擦除效果明显,能极大的减少人工擦除的工作,节省了图片文字处理的时间,提高了图片处理的效率。

Description

图片处理方法、装置、计算机设备和存储介质
技术领域
本发明涉及图片处理技术领域,尤其涉及计算机视觉和深度学习领域的图片处理方法、装置、计算机设备和存储介质。
背景技术
随着机器学习和人工智能研究的进步,图像识别被应用到越来越多的领域,例如医疗、教育、房地产和智能驾驶等,在这些领域也取得了不错的效果。同时,电子商务的加速崛起给物流行业的发展带来了新需求和新挑战,人工智能等技术的应用也催生了智能物流。
在智能物流的发展中,图像识别占据重要的地位,图像数据的质量直接影响识别结果,合适的图像预处理方法有助于改善识别结果。由于现有的图像监控数据存在“具体分拨名称”等文字信息,对识别的结果有一定的干扰,人工对文字进行擦除工作量巨大,耗时耗力。海量的图片数据,无法进行快速处理,导致数据积压,造成工作效率低下。
发明内容
有鉴于此,有必要针对现有人工对图片中文字进行擦除工作量巨大、效率低下的技术问题,提供一种图片处理方法、装置、计算机设备和存储介质。
一种图片处理方法,包括:获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片;将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型;将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片。
在其中一个实施例中,所述获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片,包括:获取多个分拨中心监控摄像头拍摄的监控视频;将所述监控视频进行图片截取,得到所述多个分拨中心监控摄像头拍摄的不同时间段的原始监控图片。将所述监控图片进行预处理,通过图片处理软件将所述监控图片中含有监控信息文字的区域进行文字擦除,得到预处理图片;将所述原始监控图片和所述预处理图片分别保存在两个文件夹中,得到预处理图片数据集。
在其中一个实施例中,所述将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集,包括:获取所述预处理图片数据集中原始监控图片尺寸;定位所述预处理图片数据集中原始监控图片中的文字识别区域;选定所述预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;创建与所述指定区域的尺寸大小和位置坐标相同的掩膜图像;将所述掩膜图像与所述预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集。
在其中一个实施例中,所述搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型,包括:搭建EraseNet网络框架并定义所述EraseNet网络框架的生成器、判别器和损失函数;将所述损失函数中的mask loss函数删除,得到优化后的EraseNet模型。
在其中一个实施例中,所述将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型,包括:将所述屏蔽图片数据集输入所述EraseNet模型进行训练;所述屏蔽图片数据集中的掩膜图片,通过所述生成器来生成将所述文字识别区域擦除的目标图片;通过所述判别器使用所述目标图片和所述预处理图片进行判别;通过所述损失函数调整所述EraseNet模型迭代次数,直到EraseNet模型收敛,输出图片处理模型。
在其中一个实施例中,所述获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片,包括:获取分拨中心、网点监控摄像头拍摄的监控视频;将所述监控视频进行图片截取,得到待处理图片;将所述待处理监控图片输入到图片处理模型中进行识别处理,擦除所述待处理监控图片中的监控时间、地点等文字信息;输出擦除完成后的图片,得到图片处理结果。
一种图片处理装置,包括:获取模块,用于获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片;掩膜模块,用于将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;搭建模块,用于搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型;擦除模块,用于将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;输出模块,用于获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片。
在其中一个实施例中,所述掩膜模块,包括:获取子模块,用于获取所述预处理图片数据集中原始监控图片尺寸;定位子模块,用于定位所述预处理图片数据集中原始监控图片中的文字识别区域;选定子模块,用于选定所述预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;创建子模块,用于创建与所述指定区域的尺寸大小和位置坐标相同的掩膜图像;屏蔽子模块,用于将所述掩膜图像与所述预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述图片处理方法的步骤。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述图片处理方法的步骤。
上述图片处理方法、装置、计算机设备和存储介质,获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片;将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型;将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片。本发明采用上述技术方案后,利用掩膜处理对需要处理的监控图片文字识别区域进行定位,对无需进行文字擦除的区域进行屏蔽,再通过优化后的EraseNet模型对屏蔽图片进行训练,对图片中的目标文字区域进行文字擦除,得到文字擦除处理后的图片,整个过程识别准确率高,仅对特定区域进行处理,保留了其他部分有效信息,处理速度快文字擦除效果明显,能极大的减少人工擦除的工作,节省了图片文字处理的时间,提高了图片处理的效率。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。
图1为本发明实施例中图片处理方法的一个实施例示意图;
图2为本发明实施例中图片处理方法的一个实施例示意图;
图3为本发明实施例中图片处理方法的一个实施例示意图;
图4为本发明实施例中图片处理装置的一个实施例示意图;
图5为本发明实施例中掩膜模块的一个实施例示意图。
图6为本发明实施例中计算机设备的一个实施例示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
如图1所示,在一个实施例中,提出了一种图片处理方法,该图片处理方法包括:
步骤S101,获取原始监控图片样本,对图片样本进行预处理,得到预处理图片数据集,预处理图片数据集包括多个原始监控图片和多个预处理图片;
物流分拨中心是快递在运输过程中一个重要的物流据点,集存储、分拣、集散功能于一体。对分拨中心的日常运作,各个快递企业往往采取监控摄像头实时录像的方式来远程管理。从分拨中心监控摄像头拍摄的视频中截取图片,并将截取的原始监控图片样本保存在文件夹中。对图片样本进行预处理,擦除图片样本上面的目标文字,得到对应的预处理后的图片样本,并保存在另一个文件夹中。处理好的图片数据集包括了原始监控图片和预处理图片两个文件夹,每个文件夹中有多张对应的图片。
步骤S102,将预处理图片数据集中图片进行掩膜处理,定位图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;
数字图像处理中的掩膜的概念是借鉴于PCB制版的过程,在半导体制造中,许多芯片工艺步骤采用光刻技术,用于这些步骤的图形“底片”称为掩膜,其作用是:在硅片上选定的区域中对一个不透明的图形模板遮盖,继而下面的腐蚀或扩散将只影响选定的区域以外的区域。图像掩膜与其类似,用选定的图像、图形或物体,对处理的图像(全部或局部)进行遮挡,来控制图像处理的区域或处理过程。
将预处理图片数据集中的图片从对应的文件中取出,将要擦除文字的区域进行定位,采用掩膜的方式对不需要擦除文字的区域进行屏蔽,以保证在后续机器学习阶段对不需要擦除文字的区域不进行识别,确保图片识别的准确性。得到屏蔽图片数据集。
步骤S103,搭建EraseNet网络框架,优化EraseNet网络框架,将损失函数进行修改,去掉损失函数中的mask loss函数,得到优化后的EraseNet模型;
文字擦除不仅仅是给自然场景中的文字打上马赛克这样简单,而是要考虑在擦掉文字的同时保持文本区域背景的原特征,EraseNet网络框架在文字擦除任务中具有突出的性能。
通过搭建EraseNet网络框架,将其中的mask loss函数去掉,mask loss为像素分割损失,用于计算像素分割掩膜损失。去掉mask loss函数得到优化后的EraseNet模型。
步骤S104,将屏蔽图片数据集输入EraseNet模型进行训练,对屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;
提取屏蔽图片数据集中的图片,将图片输入到EraseNet模型进行训练,图片中分为两个区域,一个是被掩膜处理的屏蔽区域,另外一个是需要进行文字擦除的文字识别区域。输入到模型中后,经过对文字识别区域的识别和擦除处理,得到了训练后的图片处理模型。
步骤S105,获取待处理的监控图片,将待处理的监控图片输入图片处理模型进行识别处理,输出文字擦除后的图片;
从分拨中心监控拍摄的视频中截取图片,将需要处理的监控图片输入到图片处理模型中,经过模型对图片进行识别,确定文字擦除区域的位置,对区域内的文字内容进行擦除,得到文字擦除后的图片。
在一个实施例中,如图2所示,获取原始监控图片样本,对图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片包括:
步骤S201,获取多个分拨中心监控摄像头拍摄的监控视频;
物流企业对分拨中心使用监控摄像头监管日常运营活动,可通过监控办公室计算机实时监控到分拨中心的工作全景及过机安检的执行情况,实现了录像监控、语音监控、截屏抓拍、远程录像等功能。从存储下来的监控摄像头拍摄的视频中,挑选多个机位摄像头拍摄的监控视频,作为原始监控视频样本。
步骤S202,将监控视频进行图片截取,得到多个分拨中心监控摄像头拍摄的不同时间段的原始监控图片;
将多个机位摄像头拍摄的监控视频,每条视频任意截取2个不同时间段的监控图片。所截取下来的图片左上角带有白色文字,文字内容为拍摄时间、拍摄地点,例如:“2021-8-19 17:34:26上海分拨中心B3仓”。将截取下来的图片全部保存在文件夹中,得到原始监控图片。
步骤S203,将监控图片进行预处理,通过图片处理软件将监控图片中含有监控信息文字的区域进行文字擦除,得到预处理图片;
对原始的监控图片进行预处理,采用图片处理软件photoshop打开图片,选中监控图片左上方的白色文字区域,使用软件中的内容识别进行背景填充的方式,来对文字进行擦除,并使得被擦除的部分填充上背景,如有文字删除得不够干净,再重复进行前面的操作,直至删除干净即可,最终得到了预处理的图片。
步骤S204,将原始监控图片和预处理图片分别保存在两个文件夹中,得到预处理图片数据集;
全部的原始监控图片都按预处理的方式处理完成后,将原始监控图片和得到的预处理图片分别保存再两个文件夹中,这两个文件夹整体称为图片数据集。
在一个实施例中,如图3所示,将预处理图片数据集中图片进行掩膜处理,定位图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集包括:
步骤S301,获取预处理图片数据集中原始监控图片尺寸;
从图片数据集中取出原始监控图片,查看图片的大小尺寸,例如:图片的宽度为1280像素、高度为720像素。将图片右下角作为原点构建坐标系,图片的下边缘为坐标系Y轴,图片的右边缘为坐标系X轴,此时图片中任意区域都可用坐标表示。
步骤S302,定位预处理图片数据集中原始监控图片中的文字识别区域;
在图片中确定要进行文字识别和后续擦除的区域,例如:将需要擦除的文字用长方型进行框定,由此得到的长方形区域就为文字识别区域。
步骤S303,选定预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;
确定好文字识别区域后,对应的图片中其他区域就为非文字识别区域。选定非文字识别区域的大小,构建非文字识别区域的坐标,用坐标来描述区域的位置。
步骤S304,创建与指定区域的尺寸大小和位置坐标相同的掩膜图像;
将非文字识别区域作为掩膜处理的指定区域,根据非文字识别区域的坐标来创建一个形状和大小都相同的掩膜图像。
步骤S305,将掩膜图像与所述预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集;
将创建的掩膜图像和预处理图片数据集中原始监控图片进行拼接合并,掩膜图像覆盖在原始监控图片上,将不需要进行文字识别的区域进行遮挡屏蔽,得到了屏蔽图片。采用屏蔽图片进行后续识别,减少了要识别的区域面积,降低了识别过程中的工作量,提高了识别效率,同时对无关元素进行屏蔽,提高了识别的准确性。
在一个实施例中,搭建EraseNet网络框架,优化EraseNet网络框架,将损失函数进行修改,去掉损失函数中的mask loss函数,得到优化后的EraseNet模型,包括:
步骤S401,搭建EraseNet网络框架并定义EraseNet网络框架的生成器、判别器和损失函数;
EraseNet网络框架由三部分构成:生成器、判别器和损失函数。生成器负责两个任务,分别是文字检测和文字擦除。其中文字检测网络用于文字区域的分割,文字区域的分割可以帮助擦除网络去区分文字的区域和非文字的区域。判别器判断生成图片的真或假。生成器和判别器存在着对抗的关系,通过不断的对抗使最终结果无限接近我们想要的结果。损失函数是用来估量模型的预测值与真实值的不一致程度,损失函数的作用就是计算神经网络每次迭代的前向计算结果与真实值的差距,从而指导下一步的训练向正确的方向进行。
步骤S402,将所述损失函数中的mask loss函数删除,得到优化后的EraseNet模型;
将EraseNet网络框架损失函数中的mask loss函数删除,保留了Local-AwareReconstruction Loss函数,content loss函数。在之前已经对图片进行过掩膜处理了,去掉mask loss函数能减少模型的运算量,提高运行效率。
在一个实施例中,将屏蔽图片数据集输入EraseNet模型进行训练,对屏蔽图片数据集中图片进行文字擦除,得到图片处理模型包括:
步骤S501,将屏蔽图片数据集输入所述EraseNet模型进行训练;
从屏蔽图片数据集中取出掩膜处理后的屏蔽图片,再从预处理图片数据集中取出与之对应的预处理图片,这张预处理图片是经过图片处理软件处理过的,已经擦除了文字的,预处理图片在模型中的作用是做参照对比。将这两张图片输入到EraseNet模型中进行训练。
步骤S502,屏蔽图片数据集中的掩膜图片,通过生成器来生成将文字识别区域擦除的目标图片;
掩膜图片输入到模型中,通过生成器来进行文字检测和文字擦除,将掩膜图片中的文字区域进行擦除,得到处理好的目标图片。
步骤S503,通过判别器使用目标图片和预处理图片进行判别;
判别器将模型处理的目标图片与预处理图片进行对照判断,例如:生成器处理图片,判别器给处理成预处理图片效果相同的图片就标为1,判别器给处理效果几乎没有的图片就标为0。假设生成器和判别器的初始均为0,即生成器处理的图片完全没有对文字区域进行擦除,而判别器根本分不清是否擦除完成(比如:判别器给预处理图片标为0.4,给完全没有对文字区域进行擦除的图片标为0.3),随着二者的不断博弈,生成器处理图片的能力得到了增强,判别器判别图片处理效果的能力也不断进步,最终二者达到平衡,此时模型对图片的文字区域擦除处理能力达到最佳。
步骤S504,通过损失函数调整EraseNet模型迭代次数,直到EraseNet模型收敛,输出图片处理模型。
通过预置的损失函数,计算结果与对照图片之间的损失值,通过反向传播,将损失值传递回EraseNet模型中,并根据随机梯度下降法,对其中各个网络进行参数的调整,直到EraseNet模型收敛,则将此时的EraseNet模型作为图片处理模型。
在一个实施例中,获取待处理的监控图片,将待处理的监控图片输入图片处理模型进行识别处理,输出文字擦除后的图片包括:
步骤S601,获取分拨中心、网点监控摄像头拍摄的监控视频;
从视频存储空间中找出一段分拨中心、网点监控摄像头拍摄的监控视频,视频右上角带有白色文字,文字内容显示为时间和地点。
步骤S602,将监控视频进行图片截取,得到待处理图片;
在监控视频中任意时间点截取一张图片,作为待处理图片。
步骤S603,将待处理监控图片输入到图片处理模型中进行识别处理,擦除待处理监控图片中的监控时间、地点等文字信息;
将待处理图片输入到图片处理模型中,模型先对图片文字区域进行识别,确定好需要擦除的区域后,对区域内的监控时间、地点等文字信息进行擦除处理。
步骤S604,输出擦除完成后的图片,得到图片处理结果;
将已经擦除掉文字信息的图片输出,得到处理完成的图片。
在一个实施例中,如图4所示,提供了一种图片处理装置,该图片处理装置包括:获取模块,用于获取原始监控图片样本,对图片样本进行预处理,得到预处理图片数据集,图片数据集包括多个原始监控图片和多个预处理图片;掩膜模块,用于将预处理图片数据集中图片进行掩膜处理,定位图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;搭建模块,用于搭建EraseNet网络框架,优化EraseNet网络框架,将损失函数进行修改,去掉损失函数中的mask loss函数,得到优化后的EraseNet模型;擦除模块,用于将屏蔽图片数据集输入EraseNet模型进行训练,对屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;输出模块,用于获取待处理的监控图片,将待处理的监控图片输入图片处理模型进行识别处理,输出文字擦除后的图片。
在一个实施例中,如图5所示,掩膜模块,包括:获取子模块,用于获取预处理图片数据集中原始监控图片尺寸;定位子模块,用于定位预处理图片数据集中原始监控图片中的文字识别区域;选定子模块,用于选定预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;创建子模块,用于创建与指定区域的尺寸大小和位置坐标相同的掩膜图像;屏蔽子模块,用于将掩膜图像与预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集。
在一实施例中,如图6所示,提出了一种计算机设备,该计算机设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)810(例如,一个或一个以上处理器)和存储器820,一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备800中的一系列指令操作。更进一步地,处理器810可以设置为与存储介质830通信,在计算机设备800上执行存储介质830中的一系列指令操作。
计算机设备800还可以包括一个或一个以上电源840,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口860,和/或,一个或一个以上操作系统831,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
所述计算机可读指令被所述处理器执行时,使得所述处理器执行所述计算机可读指令时实现以下步骤:获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片;将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型;将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片。
在一个实施例中,所述获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片,包括:获取多个分拨中心监控摄像头拍摄的监控视频;将所述监控视频进行图片截取,得到所述多个分拨中心监控摄像头拍摄的不同时间段的原始监控图片。将所述监控图片进行预处理,通过图片处理软件将所述监控图片中含有监控信息文字的区域进行文字擦除,得到预处理图片;将所述原始监控图片和所述预处理图片分别保存在两个文件夹中,得到预处理图片数据集。
在一个实施例中,所述将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集,包括:获取所述预处理图片数据集中原始监控图片尺寸;定位所述预处理图片数据集中原始监控图片中的文字识别区域;选定所述预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;创建与所述指定区域的尺寸大小和位置坐标相同的掩膜图像;将所述掩膜图像与所述预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集。
在一个实施例中,所述搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型,包括:搭建EraseNet网络框架并定义所述EraseNet网络框架的生成器、判别器和损失函数;将所述损失函数中的mask loss函数删除,得到优化后的EraseNet模型。
在一个实施例中,所述将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型,包括:将所述屏蔽图片数据集输入所述EraseNet模型进行训练;所述屏蔽图片数据集中的掩膜图片,通过所述生成器来生成将所述文字识别区域擦除的目标图片;通过所述判别器使用所述目标图片和所述预处理图片进行判别;通过所述损失函数调整所述EraseNet模型迭代次数,直到EraseNet模型收敛,输出图片处理模型。
在一个实施例中,所述获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片,包括:获取分拨中心、网点监控摄像头拍摄的监控视频;将所述监控视频进行图片截取,得到待处理图片;将所述待处理监控图片输入到图片处理模型中进行识别处理,擦除所述待处理监控图片中的监控时间、地点等文字信息;输出擦除完成后的图片,得到图片处理结果。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片;将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型;将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片。
在一个实施例中,所述获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片,包括:获取多个分拨中心监控摄像头拍摄的监控视频;将所述监控视频进行图片截取,得到所述多个分拨中心监控摄像头拍摄的不同时间段的原始监控图片。将所述监控图片进行预处理,通过图片处理软件将所述监控图片中含有监控信息文字的区域进行文字擦除,得到预处理图片;将所述原始监控图片和所述预处理图片分别保存在两个文件夹中,得到图片数据集。
在一个实施例中,所述将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集,包括:获取所述预处理图片数据集中原始监控图片尺寸;定位所述预处理图片数据集中原始监控图片中的文字识别区域;选定所述预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;创建与所述指定区域的尺寸大小和位置坐标相同的掩膜图像;将所述掩膜图像与所述预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集。
在一个实施例中,所述搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型,包括:搭建EraseNet网络框架并定义所述EraseNet网络框架的生成器、判别器和损失函数;将所述损失函数中的mask loss函数删除,得到优化后的EraseNet模型。
在一个实施例中,所述将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型,包括:将所述屏蔽图片数据集输入所述EraseNet模型进行训练;所述屏蔽图片数据集中的掩膜图片,通过所述生成器来生成将所述文字识别区域擦除的目标图片;通过所述判别器使用所述目标图片和所述预处理图片进行判别;通过所述损失函数调整所述EraseNet模型迭代次数,直到EraseNet模型收敛,输出图片处理模型。
在一个实施例中,所述获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片,包括:获取分拨中心、网点监控摄像头拍摄的监控视频;将所述监控视频进行图片截取,得到待处理图片;将所述待处理监控图片输入到图片处理模型中进行识别处理,擦除所述待处理监控图片中的监控时间、地点等文字信息;输出擦除完成后的图片,得到图片处理结果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种图片处理方法,其特征在于,所述图片处理方法包括以下步骤:
获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片;
将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;
搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型;
将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;
获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片。
2.根据权利要求1所述的图片处理方法,其特征在于,所述获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片,包括:
获取多个分拨中心监控摄像头拍摄的监控视频;
将所述监控视频进行图片截取,得到所述多个分拨中心监控摄像头拍摄的不同时间段的原始监控图片;
将所述监控图片进行预处理,通过图片处理软件将所述监控图片中含有监控信息文字的区域进行文字擦除,得到预处理图片;
将所述原始监控图片和所述预处理图片分别保存在两个文件夹中,得到预处理图片数据集。
3.根据权利要求1所述的图片处理方法,其特征在于,所述将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集,包括:
获取所述预处理图片数据集中原始监控图片尺寸;
定位所述预处理图片数据集中原始监控图片中的文字识别区域;
选定所述预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;
创建与所述指定区域的尺寸大小和位置坐标相同的掩膜图像;
将所述掩膜图像与所述预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集。
4.根据权利要求1所述的图片处理方法,其特征在于,所述搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型,包括:
搭建EraseNet网络框架并定义所述EraseNet网络框架的生成器、判别器和损失函数;
将所述损失函数中的mask loss函数删除,得到优化后的EraseNet模型。
5.根据权利要求4所述的图片处理方法,其特征在于,所述将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型,包括:
将所述屏蔽图片数据集输入所述EraseNet模型进行训练;
所述屏蔽图片数据集中的掩膜图片,通过所述生成器来生成将所述文字识别区域擦除的目标图片;
通过所述判别器使用所述目标图片和所述预处理图片进行判别;
通过所述损失函数调整所述EraseNet模型迭代次数,直到EraseNet模型收敛,输出图片处理模型。
6.根据权利要求1所述的图片处理方法,其特征在于,所述获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片,包括:
获取分拨中心、网点监控摄像头拍摄的监控视频;
将所述监控视频进行图片截取,得到待处理图片;
将所述待处理监控图片输入到图片处理模型中进行识别处理,擦除所述待处理监控图片中的监控时间、地点等文字信息;
输出擦除完成后的图片,得到图片处理结果。
7.一种图片处理装置,其特征在于,所述图片处理装置包括:
获取模块,用于获取原始监控图片样本,对所述图片样本进行预处理,得到预处理图片数据集,所述预处理图片数据集包括多个原始监控图片和多个预处理图片;
掩膜模块,用于将所述预处理图片数据集中图片进行掩膜处理,定位所述图片数据集中图片的文字识别区域,并将指定区域进行屏蔽,得到屏蔽图片数据集;
搭建模块,用于搭建EraseNet网络框架,优化所述EraseNet网络框架,将损失函数进行修改,去掉所述损失函数中的mask loss函数,得到优化后的EraseNet模型;
擦除模块,用于将所述屏蔽图片数据集输入所述EraseNet模型进行训练,对所述屏蔽图片数据集中图片进行文字擦除,得到图片处理模型;
输出模块,用于获取待处理的监控图片,将所述待处理的监控图片输入所述图片处理模型进行识别处理,输出文字擦除后的图片。
8.根据权利要求7所述的一种图片处理装置,其特征在于,所述掩膜模块,包括:
获取子模块,用于获取所述预处理图片数据集中原始监控图片尺寸;
定位子模块,用于定位所述预处理图片数据集中原始监控图片中的文字识别区域;
选定子模块,用于选定所述预处理图片数据集中原始监控图片中非文字识别的指定区域尺寸大小和位置坐标;
创建子模块,用于创建与所述指定区域的尺寸大小和位置坐标相同的掩膜图像;
屏蔽子模块,用于将所述掩膜图像与所述预处理图片数据集中原始监控图片进行图像拼接合并,得到指定区域全部覆盖的屏蔽图片数据集。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述的图片处理方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至6中任一项所述的图片处理方法的步骤。
CN202111261534.6A 2021-10-28 2021-10-28 图片处理方法、装置、计算机设备和存储介质 Pending CN114022843A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111261534.6A CN114022843A (zh) 2021-10-28 2021-10-28 图片处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111261534.6A CN114022843A (zh) 2021-10-28 2021-10-28 图片处理方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114022843A true CN114022843A (zh) 2022-02-08

Family

ID=80058176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111261534.6A Pending CN114022843A (zh) 2021-10-28 2021-10-28 图片处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114022843A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114973271A (zh) * 2022-05-26 2022-08-30 中国平安人寿保险股份有限公司 一种文本信息提取方法、提取系统、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114973271A (zh) * 2022-05-26 2022-08-30 中国平安人寿保险股份有限公司 一种文本信息提取方法、提取系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US9530045B2 (en) Method, system and non-transitory computer storage medium for face detection
CN111507958B (zh) 目标检测方法、检测模型的训练方法及电子设备
CN111914819B (zh) 一种多摄像头融合的人群密度预测方法、装置、存储介质及终端
EP2956891B1 (en) Segmenting objects in multimedia data
US7751627B2 (en) Image dominant line determination and use
CN112734641A (zh) 目标检测模型的训练方法、装置、计算机设备及介质
WO2021139197A1 (zh) 一种图像处理方法及装置
CN111899270A (zh) 卡片边框检测方法、装置、设备及可读存储介质
CN112651953A (zh) 图片相似度计算方法、装置、计算机设备及存储介质
CN106331524A (zh) 一种识别镜头切换的方法及装置
CN114758145B (zh) 一种图像脱敏方法、装置、电子设备及存储介质
CN108229281B (zh) 神经网络的生成方法和人脸检测方法、装置及电子设备
CN110390295B (zh) 一种图像信息识别方法、装置及存储介质
CN114022843A (zh) 图片处理方法、装置、计算机设备和存储介质
CN111179287A (zh) 人像实例分割方法、装置、设备及存储介质
CN113177941B (zh) 一种钢卷边裂识别方法、系统、介质和终端
CN112149745B (zh) 确定难例样本的方法、装置、设备及存储介质
Saeed et al. Implementation and advanced results on the non-interrupted skeletonization algorithm
CN117057996A (zh) 光伏板图像的处理方法、装置、设备及介质
CN116862920A (zh) 一种人像分割方法、装置、设备及介质
CN113780269A (zh) 图像识别方法、装置、计算机系统及可读存储介质
CN113191210A (zh) 一种图像处理方法、装置及设备
JP2007025901A (ja) 画像処理装置、画像処理方法
CN114745500B (zh) 图像处理方法及输出检测系统
CN113420616B (zh) 一种人脸识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination