CN114299478A - 结合rpa和ai的图像处理方法、装置及电子设备 - Google Patents
结合rpa和ai的图像处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114299478A CN114299478A CN202111527581.0A CN202111527581A CN114299478A CN 114299478 A CN114299478 A CN 114299478A CN 202111527581 A CN202111527581 A CN 202111527581A CN 114299478 A CN114299478 A CN 114299478A
- Authority
- CN
- China
- Prior art keywords
- target
- original image
- image
- position information
- target object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 141
- 238000000034 method Methods 0.000 claims abstract description 136
- 238000001514 detection method Methods 0.000 claims abstract description 107
- 230000008569 process Effects 0.000 claims abstract description 98
- 238000005516 engineering process Methods 0.000 claims abstract description 43
- 238000013473 artificial intelligence Methods 0.000 claims description 51
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012015 optical character recognition Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 11
- 238000004801 process automation Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
Abstract
本申请涉及一种结合RPA和AI的图像处理方法、装置及电子设备,涉及RPA和AI技术领域,该方法应用于RPA应用端,方法包括:获取业务办理过程中对业务办理流程进行录制产生的原始图像;基于目标检测技术,获取原始图像中目标对象的目标位置信息;根据目标位置信息对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。通过采用RPA和AI结合的方式自动获取原始图像中目标对象的目标位置信息,使得能够准确确定原始图像中目标对象所在区域,进而准确对目标对象所在区域进行隐私处理,避免了出现遗漏原始图像中需要处理的区域的情况及原始图像中隐私信息的泄露,且通过采用RPA应用端代替人工进行图像处理,大大降低了人工成本,提高了图像处理效率。
Description
技术领域
本申请涉及机器人流程自动化和人工智能技术领域,特别涉及一种结合RPA和AI的图像处理方法、装置及电子设备。
背景技术
机器人流程自动化(Robotic Process Automation,简称RPA),是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
人工智能(Artificial Intelligence,简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
目前,很多繁琐、重复的业务需要人工来进行处理。比如,对于某些包含用户电话号码、住址等隐私信息的图像,需要人工在图像处理应用程序中进行操作,来选定图像中隐私信息所在区域,进而通过图像处理应用程序来对图像中人工选定的区域进行处理,以遮蔽图像中的隐私信息。这种方式,易出现遗漏图像中部分隐私信息所在区域,从而导致未对所有隐私信息所在区域进行处理而引起隐私信息泄露的情况,并且,在图像中的隐私信息很多时,需要人工一个个的选定隐私信息所在区域,不仅人工成本高,且对图像的处理效率低。
发明内容
本申请提供一种结合RPA和AI的图像处理方法、装置及电子设备,以解决相关技术中的图像处理方法存在的,易出现未对所有隐私信息所在区域进行处理而引起隐私信息泄露的情况,且人工成本高、图像的处理效率低的技术问题。
本公开第一方面实施例提供一种结合RPA和AI的图像处理方法,应用于RPA应用端,该方法包括:获取待处理的原始图像;其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的;基于目标检测技术,获取原始图像中目标对象的目标位置信息;根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。
本公开第二方面实施例提供一种结合RPA和AI的图像处理装置,应用于RPA应用端,该装置,包括:第一获取模块,用于获取待处理的原始图像;其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的;第二获取模块,用于基于目标检测技术,获取原始图像中目标对象的目标位置信息;第一处理模块,用于根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。
本公开第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时,实现如本公开上述第一方面实施例所述的方法。
本公开第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本公开上述第一方面实施例所述的方法。
本公开第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本公开上述第一方面实施例所述的方法。
本申请实施例提供的技术方案可以包括以下有益效果:
通过对于在业务办理过程中对业务办理流程进行录制产生的原始图像,采用RPA和AI结合的方式,自动获取原始图像中目标对象的目标位置信息,使得能够准确确定原始图像中目标对象所在区域,进而准确对目标对象所在区域进行隐私处理,并且避免了出现遗漏原始图像中需要处理的区域的情况,避免了原始图像中隐私信息的泄露,且通过采用RPA应用端代替人工,自动获取原始图像中目标对象的目标位置信息,并根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,得到目标图像,大大降低了人工成本,提高了图像处理效率。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1是根据本公开第一实施例的结合RPA和AI的图像处理方法的流程示意图;
图2是根据本公开第二实施例的结合RPA和AI的图像处理方法的流程示意图;
图3是根据本公开第二实施例的截图图像的展示示例图;
图4是根据本公开第二实施例的原始图像的部分区域的示例图;
图5是根据本公开第二实施例的目标图像的示例图;
图6是根据本申请第三实施例的结合RPA和AI的图像处理方法的流程示意图;
图7是根据本申请第四实施例的结合RPA和AI的图像处理装置的结构示意图;
图8是用来实现本公开实施例的结合RPA和AI的图像处理方法的电子设备的框图。
具体实施方式
下面详细描述本申请/公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请/公开,而不能理解为对本申请/公开的限制。
参照下面的描述和附图,将清楚本申请/公开的实施例的这些和其他方面。在这些描述和附图中,具体公开了本申请/公开的实施例中的一些特定实施方式,来表示实施本申请/公开的实施例的原理的一些方式,但是应当理解,本申请/公开的实施例的范围不受此限制。相反,本申请/公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
在本申请/公开的描述中,术语“多个”指两个或两个以上。
可以理解的是,目前,很多繁琐、重复的业务需要人工来进行处理。比如,对于某些包含用户电话号码、住址等隐私信息的图像,需要人工在图像处理应用程序中进行操作,来选定图像中隐私信息所在区域,进而通过图像处理应用程序来对图像中人工选定的区域进行处理,以遮蔽图像中的隐私信息。这种方式,易出现遗漏图像中部分隐私信息所在区域,从而导致未对所有隐私信息所在区域进行处理而引起隐私信息泄露的情况,并且,在图像中的隐私信息很多时,需要人工一个个的选定隐私信息所在区域,不仅人工成本高,且对图像的处理效率低。
本申请提供一种通过RPA和AI结合的方式,代替人工自动对图像中的隐私信息进行处理的思路。通过对于在业务办理过程中对业务办理流程进行录制产生的原始图像,采用RPA和AI结合的方式,自动获取原始图像中目标对象的目标位置信息,使得能够准确确定原始图像中目标对象所在区域,进而准确对目标对象所在区域进行隐私处理,并且避免了出现遗漏原始图像中需要处理的区域的情况,避免了原始图像中隐私信息的泄露,且通过采用RPA应用端代替人工,自动获取原始图像中目标对象的目标位置信息,并根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,得到目标图像,大大降低了人工成本,提高了图像处理效率。
为了清楚说明本发明的各实施例,首先对本发明实施例中涉及到的技术名词进行解释说明。
在本申请的描述中,OCR(Optical Character Recognition,光学字符识别),具体是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
人脸识别,具体是指基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
二维码(2-dimensional bar code),是用特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的矩形方阵记录数据符号信息的,由一个二维码矩阵图形和一个二维码号,以及下方的说明文字组成,具有信息量大,纠错能力强,识读速度快,全方位识读等特点。
二维码识别,具体是指检测图像中的二维码以及二维码的位置和内容的一种技术,通常用于二维码读取、图像审核等场景。
原始图像,是指待处理的图像;目标图像,是指处理完成后得到的图像;截图图像,是指对某个显示界面进行截图处理得到的图像;目标截图图像,是指截图图像中用户选定的截图图像;预设图像,是指预先设置的任意图像,其可以为纯色图像,也可以为其它图像,本申请对此不作限制。
目标对象,是指待处理的原始图像中,需要进行隐私处理的对象,比如原始图像中的身份证号、邮箱地址、人脸等用户的隐私信息。
字符片段,为由单个字符或连续的多个字符组成的片段。比如连续的两个字符组成的“姓名”为一个字符片段,连续的两个字符组成的“张三”为一个字符片段,连续的几个数字组成的电话号码“157XXXXXXXX”为一个字符片段。
以下结合附图描述根据本申请/公开实施例的结合RPA和AI的图像处理方法、装置、电子设备及存储介质。
图1是本申请第一实施例的结合RPA和AI的图像处理方法的流程图。如图1所示,该方法可包括以下步骤:
步骤101,获取待处理的原始图像;其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的。
需要说明的是,本申请实施例的结合RPA和AI的图像处理方法,可以由结合RPA和AI的图像处理装置执行,以下将结合RPA和AI的图像处理装置简称为图像处理装置。其中,图像处理装置可以由软件和/或硬件实现,可以应用于RPA应用的应用端(即RPA应用端),比如图像处理装置可以为RPA应用端,也可以配置在RPA应用端,本申请对此不作限制。其中,图像处理装置可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。本申请实施例以图像处理装置为终端设备中安装的RPA应用端为例进行说明。
在本申请实施例中,在业务办理过程中,RPA应用端可以对业务办理流程进行录制,得到一帧或多帧截图图像,进而RPA应用端可以从录制得到的一帧或多帧截图图像中,获取待进行处理的原始图像。
举例来说,在用户结合Word办公软件进行视频会议的过程中,RPA应用端可以对会议过程中用户所使用终端设备的屏幕显示界面进行多次截图,得到多帧截图图像。由于截图图像中可能会包含用户的隐私信息,比如用户的邮箱地址、电话号码等,则RPA应用端可以从多帧截图图像中获取待处理的原始图像,以对原始图像进行后续处理,避免原始图像中的隐私信息泄露。
其中,原始图像,可以包括业务处理过程中对业务办理流程进行录制产生的所有截图图像,也可以包括所有截图图像中的任意一帧或多帧图像,本申请对此不作限制。
需要说明的是,获取待处理的原始图像,进而对原始图像执行后续的处理的过程,可以在业务办理过程中进行,即在对业务办理流程进行录制得到每帧截图后,立即进行后续的图像处理过程,也可以在业务办理完成后进行,即在业务办理完成,结束对业务办理流程的录制过程后,再进行后续的图像处理过程,本申请对此不作限制。
步骤102,基于目标检测技术,获取原始图像中目标对象的目标位置信息。
目标对象的目标位置信息,具体可以包括目标对象在原始图像中的位置坐标。比如,目标对象的目标位置信息,可以包括原始图像中的身份证号所属文本框在原始图像中的位置坐标,或者原始图像中的包含人脸的检测框在原始图像中的位置坐标等。
作为一种可能的实现方式,RPA应用端可以基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息。
作为另一种可能的实现方式,基于目标检测技术,对原始图像进行目标检测的过程,也可以不在RPA应用端中进行,从而减少RPA应用端的数据处理量。即,RPA应用端可以将原始图像发送至服务端,以使服务端基于目标检测技术对原始图像进行目标检测,得到原始图像中目标对象的目标位置信息。服务端获取原始图像中目标对象的目标位置信息后,可以将目标位置信息返回RPA应用端,相应的,RPA应用端可以接收服务端返回的原始图像中目标对象的目标位置信息。
步骤103,根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。
在本申请实施例中,RPA应用端可以在获取目标对象的目标位置信息后,根据目标对象的目标位置信息,确定原始图像中目标对象所在区域,进而对该区域进行隐私处理,以得到处理后的目标图像。
在本申请实施例中,RPA应用端得到处理后的目标图像后,还可以展示目标图像,以使用户可以知晓RPA应用端对原始图像进行了何种处理。
本申请实施例提供的结合RPA和AI的图像处理方法,获取待处理的原始图像,其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的,基于目标检测技术,获取原始图像中目标对象的目标位置信息,进而根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。由此,通过对于在业务办理过程中对业务办理流程进行录制产生的原始图像,采用RPA和AI结合的方式,自动获取原始图像中目标对象的目标位置信息,使得能够准确确定原始图像中目标对象所在区域,进而准确对目标对象所在区域进行隐私处理,并且避免了出现遗漏原始图像中需要处理的区域的情况,避免了原始图像中隐私信息的泄露,且通过采用RPA应用端代替人工,自动获取原始图像中目标对象的目标位置信息,并根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,得到目标图像,大大降低了人工成本,提高了图像处理效率。
通过上述分析可知,待处理的原始图像,可以是从业务办理过程中对业务办理流程进行录制产生的截图图像中获取的,下面结合图2,对本申请实施例提供的结合RPA和AI的图像处理方法中,如何在业务办理过程中对业务办理流程进行录制产生截图图像,以及如何从截图图像中获取待处理的原始图像的过程进一步说明。
图2是根据本申请第二实施例的结合RPA和AI的图像处理方法的流程图,如图2所示,该方法包括:
步骤201,在业务办理过程中,响应于检测到预设操作,对预设显示界面进行截图处理,以得到截图图像。
其中,预设操作,为预先设置的触发对预设显示界面进行截图处理的特定用户操作。
预设显示界面,可以根据需要任意设置。比如,可以为办理业务的终端设备的屏幕显示界面,也可以为办理业务所使用的应用软件的软件显示界面等,本申请对此不作限制。
在本申请实施例中,在业务办理过程中,RPA应用端可以持续检测用户操作,每检测到一次预设操作,即可响应于检测到预设操作,对预设显示界面进行截图处理,得到截图图像。
需要说明的是,业务办理过程中对业务办理流程进行录制得到的截图图像的数量,可以为一帧或多帧,与检测到预设操作的次数有关,在每检测到一次预设操作即进行一次截图处理的情况下,业务办理过程中对业务办理流程进行录制得到的截图图像的数量,与检测到预设操作的次数相等。
在本申请实施例中,预设操作,可以包括预设键盘录入操作和预设鼠标录入操作中的至少一种。相应的,步骤201具体可以包括:在业务办理过程中,响应于检测到预设键盘录入操作和预设鼠标录入操作中的至少一种,对预设显示界面进行截图处理,以得到截图图像。
其中,预设鼠标录入操作,包括以下操作中的至少一种:鼠标左键单击、鼠标右键单击、鼠标左键双击、鼠标中键单击;
预设键盘录入操作,包括以下操作中的至少一种:预设按键的触控操作、第一操作和第二操作之间的首个按键的触控操作;其中,第一操作或第二操作包括预设鼠标录入操作和预设按键的触控操作中的一种。
其中,预设按键,可以由RPA应用端的开发人员根据需要任意设置,比如可以设置为“Enter”键和“Tab”键,本申请对此不作限制。
首个按键的触控操作,可以包括两个预设鼠标录入操作之间的首个按键的触控操作、两个预设按键的触控操作之间的首个按键的触控操作、预设鼠标录入操作和预设按键的触控操作之间的首个按键的触控操作中的至少一种,本申请对此不作限制。
举例来说,假设预设操作,包括预设键盘录入操作和预设鼠标录入操作,预设鼠标录入操作包括鼠标左键单击、鼠标右键单击、鼠标左键双击、鼠标中键单击,预设按键包括“Enter”键和“Tab”键,且假设在业务办理过程中,用户按下键盘的“Enter”键后,依次输入了“hello,world。Tank you”中的各字符,然后又按下了“Tab”键,再依次输入了“OK”中的各字符,再执行了鼠标右键单击操作。
则用户按下“Enter”键时,RPA应用端可以检测到“Enter”键的触控操作,并响应于该触控操作,对预设显示界面进行截图处理,得到一帧截图图像;在用户输入“h”字符时,由于RPA应用端之前检测到了预设按键“Enter”的触控操作,则此时用户输入“h”字符时对应的触控操作,为预设按键的触控操作与其它第二操作之间的首个按键的触控操作,则RPA应用端可以响应于该触控操作,对预设显示界面进行截图处理,得到一帧截图图像;在用户依次输入“ello,world。Tank you”中的各字符时,由于这些字符对应的键盘录入操作不属于预设操作,则不进行截图处理;在用户按下“Tab”键时,RPA应用端可以检测到“Enter”键的触控操作,并响应于该触控操作,对预设显示界面进行截图处理,得到一帧截图图像;在用户输入“O”字符时,由于之前检测到了预设按键“Tab”的触控操作,则此时用户输入“O”值时对应的触控操作,为预设按键的触控操作与其它第二操作之间的首个按键的触控操作,则可以响应于该触控操作,对预设显示界面进行截图处理,得到一帧截图图像;在用户输入“K”字符时,由于这些字符对应的键盘录入操作不属于预设操作,则不进行截图处理;在用户执行鼠标右键单击操作时,RPA应用端可以检测到鼠标右键单击操作,并响应于该触控操作,对预设显示界面进行截图处理,得到一帧截图图像。由此,RPA应用端可以获取5帧截图图像。
通过在业务办理过程中,响应于检测到预设键盘录入操作和预设鼠标录入操作中的至少一种,对预设显示界面进行截图处理,以得到截图图像,实现了在业务办理过程中,根据用户的预设操作,对业务办理流程中的预设显示界面进行录制,得到截图图像。
步骤202,展示截图图像。
步骤203,响应于对截图图像中目标截图图像的选定操作,将目标截图图像作为原始图像。
在本申请实施例中,在业务办理完成,结束对业务办理流程的录制过程,得到所有截图图像后,可以由用户从对业务办理流程进行录制得到的所有截图图像中,选定需要RPA应用端自动进行隐私处理的目标截图图像,进而由RPA应用端结合RPA和AI自动对用户选定的目标截图图像进行处理。
具体的,对业务办理流程进行录制得到所有截图图像后,可以展示所有截图图像,进而用户可以从所有截图图像中选定需要RPA应用端自动进行隐私处理的目标截图图像,RPA应用端可以响应于用户对截图图像中目标截图图像的选定操作,将目标截图图像作为原始图像,进而对原始图像进行后续的处理。
由此,实现了在业务办理过程中,根据用户的预设操作,对业务办理流程中的预设显示界面进行截图处理,得到截图图像,并且,在业务办理完成后,根据用户对截图图像的选择,灵活将任意截图图像作为待进行处理的原始图像,提高了图像处理的灵活性。
需要说明的是,在业务办理完成,结束对业务办理流程的录制过程,得到所有截图图像后,RPA应用端还可以允许用户对截图图像添加标题和描述等文字信息,也可以允许用户编辑截图图像,手动选定任意截图图像中需要隐私处理的区域。
步骤204,基于目标检测技术,获取原始图像中目标对象的目标位置信息。
作为一种可能的实现方式,RPA应用端可以基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息。
作为另一种可能的实现方式,RPA应用端可以将原始图像发送至服务端,以使服务端基于目标检测技术对原始图像进行目标检测,得到原始图像中目标对象的目标位置信息,并接收服务端返回的原始图像中目标对象的目标位置信息。
步骤205,根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。
在本申请实施例中,可以根据目标位置信息,采用预设方式,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。
作为一种可能的实现方式,RPA应用端可以根据目标位置信息,确定原始图像中目标对象所在的目标区域,并获取与目标区域的尺寸相同的预设图像,进而将预设图像叠加至原始图像中目标对象所在的目标区域,以得到目标图像。
作为另一种可能的实现方式,RPA应用端可以根据目标位置信息,确定原始图像中目标对象所在的目标区域,进而将原始图像中目标区域对应的像素值调整为预设像素值,以得到目标图像。
其中,预设像素值,可以根据需要任意设置,且目标区域中各像素点分别对应的预设像素值可以相同,也可以不同,本申请对此不作限制。
下面结合图3-5,对本申请实施例提供的结合RPA和AI的图像处理方法中,从截图图像中获取原始图像,并对原始图像进行处理得到目标图像的过程进行说明。
参考图3,在业务办理完成,结束对业务办理流程的录制过程后,可以如图3所示,展示所有的截图图像,其中,图3中左侧的304表示对业务办理流程进行录制得到的多帧截图图像。在用户需要对某帧截图图像进行隐私处理时,可以从所有截图图像中选定该帧截图图像,假设用户选定了图3中左上角的截图图像1,即截图图像1为目标截图图像,则RPA应用端可以检测到对截图图像1的选定操作,并响应于对截图图像1的选定操作,如图3右侧所示,展示截图图像1,并将截图图像1作为原始图像,对截图图像1进行后续的处理,得到目标图像。其中,图3中的301表示截图图像1。
需要说明的是,在开启RPA应用端时,终端设备的屏幕显示界面上可以展示一个录制状态界面,录制状态界面中可以包括录制状态比如“录制中”或“录制完成”,并且,在对业务流程进行录制的过程中,录制状态界面中可以包括用于暂停录制过程的“暂停”按钮和停止录制过程的“停止”按钮,且在响应于检测到预设操作,对预设显示界面进行截图处理,得到截图图像时,录制状态界面中可以包括触发截图处理动作的预设操作具体为何种操作。
假设预设显示界面包含录制状态界面,即在业务办理过程中,响应于检测到预设操作,对包含录制状态界面的预设显示界面进行截图处理,则得到的截图图像中会包含如图3中的303所示的录制状态界面。其中,图3中的303所示的录制状态界面中,包括对预设显示界面进行截图处理得到截图图像1时的录制状态“录制中”,以及触发截图处理得到截图图像1的预设操作“动作:1”。其中,参考图3可知,“动作:1”表示第一个步骤对应的动作,动作类型为单击。
假设图4为图3所示的截图图像1(301)中302所示的部分区域的放大图像,则RPA应用端对截图图像1进行处理,得到的目标图像为如图5所示。参考图4和图5可知,RPA应用端对截图图像1中的人脸所在区域、手机号码所在区域、固定电话所在区域、电子邮箱所在区域进行了隐私处理,从而避免了人脸信息、手机号码信息、固定电话信息、电子邮箱信息的泄露。
需要说明的是,在对截图图像1进行处理,得到目标图像的过程中,可以在图3所示的显示界面上覆盖一层半透明图层,并显示“打码中”或“隐私处理中”等文字信息,以提示用户RPA应用端正在对用户选定的截图图像1进行处理。在得到目标图像后,可以在图3中301所示的区域展示目标图像。
在用户需要对某帧截图图像或目标图像添加标题或描述等文字信息时,可以在图3所示的显示界面中的“标题”对应的输入框中,输入需要添加的标题文字信息,在“描述”对应的输入框中,输入需要添加的描述文字信息。在用户需要删除某帧截图图像或目标图像时,可以触控图3所示的“删除步骤”按钮,以删除该帧截图图像或目标图像。
通过上述过程,实现了在业务办理过程中,根据用户的预设操作,对业务办理流程中的预设显示界面进行截图处理,得到截图图像,并且,在业务办理完成后,根据用户对截图图像的选择,灵活将任意截图图像作为待进行处理的原始图像,提高了图像处理的灵活性。另外,通过对于在业务办理过程中对业务办理流程进行录制产生的原始图像,采用RPA和AI结合的方式,自动获取原始图像中目标对象的目标位置信息,使得能够准确确定原始图像中目标对象所在区域,进而准确对目标对象所在区域进行隐私处理,并且避免了出现遗漏原始图像中需要处理的区域的情况,避免了原始图像中隐私信息的泄露,且通过采用RPA应用端代替人工,自动获取原始图像中目标对象的目标位置信息,并根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,得到目标图像,大大降低了人工成本,提高了图像处理效率。
通过上述分析可知,本申请实施例中,RPA应用端可以基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息,下面结合图6,对本申请实施例提供的结合RPA和AI的图像处理方法中,获取原始图像中目标对象的目标位置信息的过程进行进一步说明。
图6是根据本申请第三实施例的结合RPA和AI的图像处理方法的流程图,如图6所示,该方法包括:
步骤601,获取待处理的原始图像;其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的。
其中,获取待处理的原始图像的过程,可以参考上述实施例的描述,此处不再赘述。
步骤602,基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息。
在本申请实施例中,目标对象的类型,可以包括文字类型和图像类型中的至少一种。其中,图像类型可以包括人脸图像类型、二维码图像类型中的至少一种。
作为一种可能的实现方式,在目标对象的类型包括文字类型的情况下,可以采用以下方式,基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息,即步骤602可以包括:采用光学字符识别OCR技术对原始图像进行识别,以获取原始图像中至少一个字符片段所属文本框的第一位置信息;将至少一个字符片段中需要进行隐私处理的目标字符片段,确定为目标对象,并将目标字符片段所属文本框的第一位置信息,确定为目标对象的位置信息。
其中,第一位置信息,具体可以包括字符片段所属文本框的四个角点的位置坐标。
具体的,RPA应用端可以与人工智能技术领域中通用OCR识别接口通信,从而在采用通用OCR识别接口对原始图像进行识别,获取原始图像中至少一个字符片段所属文本框的第一位置信息后,RPA应用端可以从通用OCR识别接口获取原始图像中至少一个字符片段所属文本框的第一位置信息。进而,RPA应用端可以判断原始图像中各字符片段是否属于需要进行隐私处理的目标字符片段,并将属于需要进行隐私处理的目标字符片段,确定为目标对象,将目标字符片段所属文本框的第一位置信息,确定为目标对象的位置信息。
作为另一种可能的实现方式,目标对象的类型除了文字类型,还可以包括人脸图像类型,对于人脸图像类型的目标对象,可以采用以下方式,基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息,即步骤602还可以包括:采用人脸识别技术对原始图像进行人脸检测,以确定包括人脸的第一检测框,并确定第一检测框在原始图像中的第二位置信息;将第一检测框在原始图像中的第二位置信息,确定为目标对象的位置信息。
其中,第二位置信息,具体可以包括第一检测框在原始图像中的位置坐标。
具体的,可以将原始图像输入人工智能技术领域中的人脸检测模型进行第一检测框的位置坐标预测,人脸检测模型可以提取原始图像中的识别特征,并根据不同尺度特征图进行人脸二分类以及第一检测框的位置坐标回归,得到人脸二分类得分以及第一检测框的位置坐标。其中,人脸二分类得分可以用来确定原始图像中是否包含人脸,比如在人脸二分类得分大于预设分值阈值时,确定原始图像中包含人脸,在人脸二分类得分小于或等于预设分值阈值时,确定原始图像中未包含人脸。第一检测框的位置坐标,用来表示第一检测框在原始图像中的位置。
RPA应用端根据人脸检测模型的输出,即可确定原始图像中是否包含人脸,并在包含人脸时,确定第一检测框在原始图像中的第二位置信息,进而将第一检测框在原始图像中的第二位置信息,确定为目标对象的位置信息。
作为另一种可能的实现方式,目标对象的类型还可以包括二维码图像类型,对于二维码图像类型的目标对象,可以采用以下方式,基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息,即步骤602还可以包括:采用二维码识别技术对原始图像进行二维码检测,以确定包括二维码的第二检测框,并确定第二检测框在原始图像中的第三位置信息;将第二检测框在原始图像中的第三位置信息,确定为目标对象的位置信息。
其中,第三位置信息,具体可以包括第二检测框在原始图像中的位置坐标。
具体的,可以将原始图像输入人工智能技术领域中的二维码检测模型进行第二检测框的位置坐标预测,二维码检测模型可以提取原始图像中的识别特征,并根据不同尺度特征图进行二维码二分类以及第二检测框的位置坐标回归,得到二维码二分类得分以及第二检测框的位置坐标。其中,二维码二分类得分可以用来确定原始图像中是否包含二维码,比如在二维码二分类得分大于预设分值阈值时,确定原始图像中包含二维码,在二维码二分类得分小于或等于预设分值阈值时,确定原始图像中未包含二维码。第二检测框的位置坐标,用来表示第二检测框在原始图像中的位置。
RPA应用端根据二维码检测模型的输出,即可确定原始图像中是否包含二维码,并在包含二维码时,确定第二检测框在原始图像中的第三位置信息,进而将第二检测框在原始图像中的第三位置信息,确定为目标对象的位置信息。
需要说明的是,目标对象的类型可以包括文字类型、人脸图像类型和二维码图像类型中的任一种,对于每种类型的目标对象,可以参考上述方式分别进行目标检测;在目标对象的类型包括文字类型、人脸图像类型和二维码图像类型中的两种或三种时,可以结合上述各方式对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息,具体过程不再赘述。
步骤603,根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。
作为一种可能的实现方式,可以根据目标位置信息,确定原始图像中目标对象所在的目标区域,获取与目标区域的尺寸相同的预设图像,进而将预设图像叠加至原始图像中目标对象所在的目标区域,以得到目标图像。
作为另一种可能的实现方式,可以根据目标位置信息,确定原始图像中目标对象所在的目标区域,进而将原始图像中目标区域对应的像素值调整为预设像素值,以得到目标图像。
本申请实施例提供的结合RPA和AI的图像处理方法,获取待处理的原始图像,其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的,基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息,进而根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。由此,通过对于在业务办理过程中对业务办理流程进行录制产生的原始图像,采用RPA和AI结合的方式,自动获取原始图像中目标对象的目标位置信息,使得能够准确确定原始图像中目标对象所在区域,进而准确对目标对象所在区域进行隐私处理,并且避免了出现遗漏原始图像中需要处理的区域的情况,避免了原始图像中隐私信息的泄露,且通过采用RPA应用端代替人工,自动获取原始图像中目标对象的目标位置信息,并根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,得到目标图像,大大降低了人工成本,提高了图像处理效率。
为了实现上述实施例,本申请还提出了一种结合RPA和AI的图像处理装置。图7是根据本申请第四实施例的结合RPA和AI的图像处理装置的结构示意图。
如图7所示,该结合RPA和AI的图像处理装置700,应用于RPA应用端,包括:第一获取模块701、第二获取模块702和第一处理模块703。
其中,第一获取模块701,用于获取待处理的原始图像;其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的;
第二获取模块702,用于基于目标检测技术,获取原始图像中目标对象的目标位置信息;
第一处理模块703,用于根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。
需要说明的是,本申请实施例的结合RPA和AI的图像处理装置,可以执行上述实施例提供的结合RPA和AI的图像处理方法。其中,结合RPA和AI的图像处理装置可以由软件和/或硬件实现,可以应用于RPA应用的应用端(即RPA应用端),比如图像处理装置可以为RPA应用端,也可以配置在RPA应用端,本申请对此不作限制。其中,图像处理装置可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
在本申请的一个实施例中,结合RPA和AI的图像处理装置700,还可以包括:
第二处理模块,用于在业务办理过程中,响应于检测到预设操作,对预设显示界面进行截图处理,以得到截图图像;
第一获取模块701,包括:
展示单元,用于展示截图图像;
第一处理单元,用于响应于对截图图像中目标截图图像的选定操作,将目标截图图像作为原始图像。
在本申请的一个实施例中,第二处理模块,包括:
第二处理单元,用于在业务办理过程中,响应于检测到预设键盘录入操作和预设鼠标录入操作中的至少一种,对预设显示界面进行截图处理,以得到截图图像;
其中,预设鼠标录入操作,包括以下操作中的至少一种:鼠标左键单击、鼠标右键单击、鼠标左键双击、鼠标中键单击;
预设键盘录入操作,包括以下操作中的至少一种:预设按键的触控操作、第一操作和第二操作之间的首个按键的触控操作;其中,第一操作或第二操作包括预设鼠标录入操作和预设按键的触控操作中的一种。
在本申请的一个实施例中,第二获取模块702,包括:发送单元,用于将原始图像发送至服务端,以使服务端基于目标检测技术对原始图像进行目标检测,得到原始图像中目标对象的目标位置信息;
接收单元,用于接收服务端返回的原始图像中目标对象的目标位置信息。
在本申请的一个实施例中,第二获取模块702,包括:
检测单元,用于基于目标检测技术,对原始图像进行目标检测,以获取原始图像中目标对象的目标位置信息。
在本申请的一个实施例中,目标对象的类型包括文字类型;检测单元,具体用于:
采用光学字符识别OCR技术对原始图像进行识别,以获取原始图像中至少一个字符片段所属文本框的第一位置信息;
将至少一个字符片段中需要进行隐私处理的目标字符片段,确定为目标对象,并将目标字符片段所属文本框的第一位置信息,确定为目标对象的位置信息。
在本申请的一个实施例中,目标对象的类型还包括人脸图像类型;检测单元,还用于:
采用人脸识别技术对原始图像进行人脸检测,以确定包括人脸的第一检测框,并确定第一检测框在原始图像中的第二位置信息;
将第一检测框在原始图像中的第二位置信息,确定为目标对象的位置信息。
在本申请的一个实施例中,目标对象的类型包括二维码图像类型;检测单元,还用于:
采用二维码识别技术对原始图像进行二维码检测,以确定包括二维码的第二检测框,并确定第二检测框在原始图像中的第三位置信息;
将第二检测框在原始图像中的第三位置信息,确定为目标对象的位置信息。
在本申请的一个实施例中,第一处理模块703,包括:
第一确定单元,用于根据目标位置信息,确定原始图像中目标对象所在的目标区域;
获取单元,用于获取与目标区域的尺寸相同的预设图像;
叠加单元,用于将预设图像叠加至原始图像中目标对象所在的目标区域,以得到目标图像。
在本申请的一个实施例中,第一处理模块703,包括:
第二确定单元,用于根据目标位置信息,确定原始图像中目标对象所在的目标区域;
调整单元,用于将原始图像中目标区域对应的像素值调整为预设像素值,以得到目标图像。
需要说明的是,前述对结合RPA和AI的图像处理方法实施例的解释说明也适用于该实施例的结合RPA和AI的图像处理装置,本申请结合RPA和AI的图像处理装置实施例中未公布的细节,此处不再赘述。
综上,本申请实施例的结合RPA和AI的图像处理装置,获取待处理的原始图像,其中,原始图像是在业务办理过程中对业务办理流程进行录制产生的,基于目标检测技术,获取原始图像中目标对象的目标位置信息,进而根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,以得到目标图像。由此,通过对于在业务办理过程中对业务办理流程进行录制产生的原始图像,采用RPA和AI结合的方式,自动获取原始图像中目标对象的目标位置信息,使得能够准确确定原始图像中目标对象所在区域,进而准确对目标对象所在区域进行隐私处理,并且避免了出现遗漏原始图像中需要处理的区域的情况,避免了原始图像中隐私信息的泄露,且通过采用RPA应用端代替人工,自动获取原始图像中目标对象的目标位置信息,并根据目标位置信息,对原始图像中目标对象所在区域进行隐私处理,得到目标图像,大大降低了人工成本,提高了图像处理效率。
为了实现上述实施例,本公开实施例还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如前述任一方法实施例所述的结合RPA和AI的图像处理方法。
为了实现上述实施例,本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前述任一方法实施例所述的结合RPA和AI的图像处理方法。
为了实现上述实施例,本公开实施例还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如前述任一方法实施例所述的结合RPA和AI的图像处理方法。
图8示出了适于用来实现本公开实施方式的示例性电子设备的框图。图8显示的电子设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图8所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图7中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (15)
1.一种结合机器人流程自动化RPA和人工智能AI的图像处理方法,其特征在于,应用于RPA应用端,所述方法包括:
获取待处理的原始图像;其中,所述原始图像是在业务办理过程中对业务办理流程进行录制产生的;
基于目标检测技术,获取所述原始图像中目标对象的目标位置信息;
根据所述目标位置信息,对所述原始图像中所述目标对象所在区域进行隐私处理,以得到目标图像。
2.根据权利要求1所述的方法,其特征在于,在所述获取待处理的原始图像之前,还包括:
在业务办理过程中,响应于检测到预设操作,对预设显示界面进行截图处理,以得到截图图像;
所述获取待处理的原始图像,包括:
展示所述截图图像;
响应于对所述截图图像中目标截图图像的选定操作,将所述目标截图图像作为所述原始图像。
3.根据权利要求2所述的方法,其特征在于,所述在业务办理过程中,响应于检测到预设操作,对预设显示界面进行截图处理,以得到截图图像,包括:
在业务办理过程中,响应于检测到预设键盘录入操作和预设鼠标录入操作中的至少一种,对预设显示界面进行截图处理,以得到所述截图图像;
其中,所述预设鼠标录入操作,包括以下操作中的至少一种:鼠标左键单击、鼠标右键单击、鼠标左键双击、鼠标中键单击;
所述预设键盘录入操作,包括以下操作中的至少一种:预设按键的触控操作、第一操作和第二操作之间的首个按键的触控操作;其中,所述第一操作或第二操作包括所述预设鼠标录入操作和所述预设按键的触控操作中的一种。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于目标检测技术,获取所述原始图像中目标对象的目标位置信息,包括:
将所述原始图像发送至服务端,以使所述服务端基于目标检测技术对所述原始图像进行目标检测,得到所述原始图像中目标对象的目标位置信息;
接收所述服务端返回的所述原始图像中目标对象的目标位置信息。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述基于目标检测技术,获取所述原始图像中目标对象的目标位置信息,包括:
基于目标检测技术,对所述原始图像进行目标检测,以获取所述原始图像中目标对象的目标位置信息。
6.根据权利要求5所述的方法,其特征在于,所述目标对象的类型包括文字类型;所述基于目标检测技术,对所述原始图像进行目标检测,以获取所述原始图像中目标对象的目标位置信息,包括:
采用光学字符识别OCR技术对所述原始图像进行识别,以获取所述原始图像中至少一个字符片段所属文本框的第一位置信息;
将所述至少一个字符片段中需要进行隐私处理的目标字符片段,确定为所述目标对象,并将所述目标字符片段所属文本框的第一位置信息,确定为所述目标对象的位置信息。
7.根据权利要求6所述的方法,其特征在于,所述目标对象的类型还包括人脸图像类型;所述基于目标检测技术,对所述原始图像进行目标检测,以获取所述原始图像中目标对象的目标位置信息,还包括:
采用人脸识别技术对所述原始图像进行人脸检测,以确定包括人脸的第一检测框,并确定所述第一检测框在所述原始图像中的第二位置信息;
将所述第一检测框在所述原始图像中的第二位置信息,确定为所述目标对象的位置信息。
8.根据权利要求7所述的方法,其特征在于,所述目标对象的类型包括二维码图像类型;所述基于目标检测技术,对所述原始图像进行目标检测,以获取所述原始图像中目标对象的目标位置信息,还包括:
采用二维码识别技术对所述原始图像进行二维码检测,以确定包括二维码的第二检测框,并确定所述第二检测框在所述原始图像中的第三位置信息;
将所述第二检测框在所述原始图像中的第三位置信息,确定为所述目标对象的位置信息。
9.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标位置信息,对所述原始图像中所述目标对象所在区域进行隐私处理,以得到目标图像,包括:
根据所述目标位置信息,确定所述原始图像中所述目标对象所在的目标区域;
获取与所述目标区域的尺寸相同的预设图像;
将所述预设图像叠加至所述原始图像中所述目标对象所在的目标区域,以得到所述目标图像。
10.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标位置信息,对所述原始图像中所述目标对象所在区域进行隐私处理,以得到目标图像,包括:
根据所述目标位置信息,确定所述原始图像中所述目标对象所在的目标区域;
将所述原始图像中所述目标区域对应的像素值调整为预设像素值,以得到所述目标图像。
11.一种结合RPA和AI的图像处理装置,其特征在于,应用于RPA应用端,所述装置包括:
第一获取模块,用于获取待处理的原始图像;其中,所述原始图像是业务办理过程中对业务办理流程进行录制产生的;
第二获取模块,用于基于目标检测技术,获取所述原始图像中目标对象的目标位置信息;
第一处理模块,用于根据所述目标位置信息,对所述原始图像中所述目标对象所在区域进行隐私处理,以得到目标图像。
12.根据权利要求11所述的装置,其特征在于,还包括:
第二处理模块,用于在业务办理过程中,响应于检测到预设操作,对预设显示界面进行截图处理,以得到截图图像;
所述第一获取模块,包括:
展示单元,用于展示所述截图图像;
第一处理单元,用于响应于对所述截图图像中目标截图图像的选定操作,将所述目标截图图像作为所述原始图像。
13.根据权利要求12所述的装置,其特征在于,所述第二处理模块,包括:
第二处理单元,用于在业务办理过程中,响应于检测到预设键盘录入操作和预设鼠标录入操作中的至少一种,对预设显示界面进行截图处理,以得到所述截图图像;
其中,所述预设鼠标录入操作,包括以下操作中的至少一种:鼠标左键单击、鼠标右键单击、鼠标左键双击、鼠标中键单击;
所述预设键盘录入操作,包括以下操作中的至少一种:预设按键的触控操作、第一操作和第二操作之间的首个按键的触控操作;其中,所述第一操作或第二操作包括所述预设鼠标录入操作和所述预设按键的触控操作中的一种。
14.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-10中任一项所述的方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111527581.0A CN114299478A (zh) | 2021-12-14 | 2021-12-14 | 结合rpa和ai的图像处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111527581.0A CN114299478A (zh) | 2021-12-14 | 2021-12-14 | 结合rpa和ai的图像处理方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114299478A true CN114299478A (zh) | 2022-04-08 |
Family
ID=80968555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111527581.0A Pending CN114299478A (zh) | 2021-12-14 | 2021-12-14 | 结合rpa和ai的图像处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114299478A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840700A (zh) * | 2022-05-30 | 2022-08-02 | 来也科技(北京)有限公司 | 结合rpa和ai实现ia的图像检索方法、装置及电子设备 |
CN115061769A (zh) * | 2022-08-08 | 2022-09-16 | 杭州实在智能科技有限公司 | 用于支持跨分辨率的自迭代rpa界面元素匹配方法及系统 |
-
2021
- 2021-12-14 CN CN202111527581.0A patent/CN114299478A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840700A (zh) * | 2022-05-30 | 2022-08-02 | 来也科技(北京)有限公司 | 结合rpa和ai实现ia的图像检索方法、装置及电子设备 |
CN114840700B (zh) * | 2022-05-30 | 2023-01-13 | 来也科技(北京)有限公司 | 结合rpa和ai实现ia的图像检索方法、装置及电子设备 |
WO2023231159A1 (zh) * | 2022-05-30 | 2023-12-07 | 来也科技(北京)有限公司 | 结合rpa和ai实现ia的图像检索方法、装置及电子设备 |
CN115061769A (zh) * | 2022-08-08 | 2022-09-16 | 杭州实在智能科技有限公司 | 用于支持跨分辨率的自迭代rpa界面元素匹配方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101346539B1 (ko) | 얼굴들을 상관시킴으로써 디지털 이미지들을 구조화하기 | |
CN114299478A (zh) | 结合rpa和ai的图像处理方法、装置及电子设备 | |
JP5229050B2 (ja) | 画像からの文書領域抽出装置、方法、及びプログラム | |
CN110928507A (zh) | 基于智能书写的同步显示及数据电子化系统及实现方法 | |
CN108764352B (zh) | 重复页面内容检测方法和装置 | |
JP6653929B1 (ja) | 自動判別処理装置、自動判別処理方法、検査システム、プログラム、および記録媒体 | |
CN111104813A (zh) | 二维码图像关键点检测方法、装置、电子设备及存储介质 | |
CN113255516A (zh) | 活体检测方法、装置和电子设备 | |
JP5111055B2 (ja) | 画像処理装置及び画像処理方法、コンピュータプログラム | |
US11348254B2 (en) | Visual search method, computer device, and storage medium | |
JP2017120503A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
US7280693B2 (en) | Document information input apparatus, document information input method, document information input program and recording medium | |
CN111626145A (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
WO2022111461A1 (zh) | 识别方法、装置及电子设备 | |
CN108363485A (zh) | 非触摸屏显示终端的控制方法、装置、系统和计算机设备 | |
CN115019324A (zh) | 文本扫描的交互方法、装置、计算机设备和存储介质 | |
US20170242647A1 (en) | Information processing device, information processing method and non-transitory computer readable medium | |
CN109141457A (zh) | 导航评估方法、装置、计算机设备和存储介质 | |
CN115953744A (zh) | 一种基于深度学习的车辆识别追踪方法 | |
JP4321251B2 (ja) | 合成画像を生成・表示する装置及び方法 | |
JP2023533297A (ja) | 連続する動的スキャンのセグメンテーション | |
CN106775701A (zh) | 一种客户端自动取证方法和系统 | |
JP5005633B2 (ja) | 画像検索装置、画像検索方法、情報処理プログラム及び記録媒体 | |
JP3090070B2 (ja) | 帳票識別方法及び装置 | |
JP2020119368A (ja) | 映像情報管理システムおよび映像情報管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |