CN111966734A - 结合rpa和ai的电子表格的数据处理方法与电子设备 - Google Patents

结合rpa和ai的电子表格的数据处理方法与电子设备 Download PDF

Info

Publication number
CN111966734A
CN111966734A CN202010840222.XA CN202010840222A CN111966734A CN 111966734 A CN111966734 A CN 111966734A CN 202010840222 A CN202010840222 A CN 202010840222A CN 111966734 A CN111966734 A CN 111966734A
Authority
CN
China
Prior art keywords
spreadsheet
screening
rpa system
data
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010840222.XA
Other languages
English (en)
Inventor
邱黎芳
吴德龙
褚瑞
李玮
胡一川
汪冠春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Original Assignee
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Benying Network Technology Co Ltd, Beijing Laiye Network Technology Co Ltd filed Critical Beijing Benying Network Technology Co Ltd
Publication of CN111966734A publication Critical patent/CN111966734A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了一种结合RPA和AI的电子表格的数据处理方法与电子设备,在该方法中,RPA系统通过采集对第一电子表格的第一操作信息,可以由此确定目标筛选对象,由此,RPA系统可以在目标筛选对象中对关键词分别进行筛选,从而,基于筛选结果生成每个关键词对应的第二电子表格。如此,在本方案中,无需用户过多的操作,RPA系统即可根据针对电子表格的操作信息来实现自动的数据筛选、表格生成,提高了电子表格的筛选效率,能够适应大批量数据筛选的场景,并且,避免了由于人工筛选过程导致的出错率较高的问题,有利于降低出错率,并提高准确率。

Description

结合RPA和AI的电子表格的数据处理方法与电子设备
相关申请的交叉引用
本申请要求北京奔影网络科技有限公司于2020年3月30日提交的、申请名称为“基于电子表格的数据处理方法与电子设备、可读存储介质”的、中国专利申请号“202010235899.0”的优先权。
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种结合RPA(Robotic ProcessAutomation,机器人流程自动化)和AI(Artificial Intelligence,人工智能)的电子表格的数据处理方法与电子设备、可读存储介质。
背景技术
机器人流程自动化(Robotic Process Automation,简称:RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
人工智能(Artificial Intelligence,简称:AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。目前,RPA和AI技术具有自动化程度高、精确度高、成本低的优点,得到了广泛的应用。
电子表格作为一种方便的数据处理工具,成为人们办公的常用数据存储工具。在实际场景中,经常涉及到需要对电子表格中的一类对象进行筛选的情况。
目前,针对电子表格的数据筛选一般还是依赖于用户的手动处理。具体的,用户需要在表格中选择目标筛选对象,然后,针对目标筛选对象中的多个关键词,进行逐个筛选,得到筛选结果。之后,还需要用户手动新建电子表格,并将筛选结果粘贴到该新建的电子表格中,再进行存储。
现有的针对电子表格的筛选处理方式依赖于人工实现,在大数据量关键词需要进行筛选的情况下,人工筛选处理数据的方式效率较低,且出错率较高。
发明内容
针对上述问题,本公开提供了一种结合RPA和AI的电子表格的数据处理方法与电子设备、可读存储介质,用以提高电子表格的数据筛选效率,并降低出错率,提高准确率。
第一方面,本公开实施例提供了一种结合RPA和AI的电子表格的数据处理方法,该方法包括:
RPA系统采集针对第一电子表格的第一操作信息;
RPA系统基于所述第一操作信息,在所述第一电子表格中确定目标筛选对象;
RPA系统在所述目标筛选对象内,对多个关键词分别进行筛选,得到每个所述关键词的筛选结果;
RPA系统基于所述筛选结果,生成每个所述关键词对应的第二电子表格。
第二方面,本公开实施例提供了一种电子设备,包括:处理模块与收发模块;其中,
所述收发模块,用于采集针对第一电子表格的第一操作信息;
所述处理模块,用于:
基于所述第一操作信息,在所述第一电子表格中确定目标筛选对象;
在所述目标筛选对象内,对多个关键词分别进行筛选,得到每个所述关键词的筛选结果;
基于所述筛选结果,生成每个所述关键词对应的第二电子表格。
第三方面,本公开实施例提供了一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面所述的方法。
第四方面,本公开实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面所述的方法。
本公开实施例提供了一种结合RPA和AI的电子表格的数据处理方法与电子设备、可读存储介质,在该方法中,RPA系统通过采集对第一电子表格的第一操作信息,可以由此确定目标筛选对象,由此,RPA系统可以在目标筛选对象中对关键词分别进行筛选,从而,基于筛选结果生成每个关键词对应的第二电子表格。如此,在本方案中,无需用户过多的操作,RPA系统即可根据针对电子表格的操作信息来实现自动的数据筛选、表格生成,提高了电子表格的筛选效率,能够适应大批量数据筛选的场景,并且,避免了由于人工筛选过程导致的出错率较高的问题,有利于降低出错率,并提高准确率。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种针对电子表格的筛选场景的示意图;
图2为本公开实施例提供的一种结合RPA和AI的电子表格的数据处理方法的流程示意图;
图3为本公开实施例提供的一种电子表格的示意图;
图4为本公开实施例提供的电子设备的功能方块图;
图5为本公开实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开实施例所提供的结合RPA和AI的电子表格的数据处理方法应用于电子设备。具体而言,该电子设备可以为终端。
其中,本公开实施例所涉及到的终端可以为无线终端也可以是有线终端。无线终端可以是指向用户提供语音和/或其他业务数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(RadioAccess Network,简称RAN)与一个或多个核心网设备进行通信,无线终端可以是移动终端,如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。再例如,无线终端还可以是个人通信业务(Personal Communication Service,简称PCS)电话、无绳电话、会话发起协议(Session Initiation Protocol,简称SIP)话机、无线本地环路(Wireless Local Loop,简称WLL)站、个人数字助理(Personal Digital Assistant,简称PDA)等设备。无线终端也可以称为系统、订户单元(Subscriber Unit)、订户站(SubscriberStation),移动站(Mobile Station)、移动台(Mobile)、远程站(Remote Station)、远程终端(Remote Terminal)、接入终端(Access Terminal)、用户终端(User Terminal)、用户代理(User Agent)、用户设备(User Device or User Equipment),在此不作限定。可选的,上述终端设备还可以是智能手表、平板电脑等设备。
本公开实施例用于实现对电子表格的自动筛选与存储。
其中,本公开实施例所涉及到的电子表格可以包括但不限于:Excel表格。
示例性的,图1示出了本公开实施例所提供的一种针对电子表格的筛选场景的示意图。如图1所示,电子表格1中包含10行3列数据,各列的数据依次为:姓名、性别和年龄。那么,若对该电子表格1中的性别进行筛选,则可以以“男”作为关键词进行数据筛选,即可得到电子表格2,并以“女”作为关键词进行数据筛选,可得到电子表格3。
应当理解,图1所示场景仅为示例性的,本公开实施例对于电子表格中携带的数据内容无特别限制。
在图1所示的针对电子表格进行数据筛选的场景中,现有技术中一般是依赖于用户手动处理来实现,用户需要在表格中选择目标筛选对象,然后,针对目标筛选对象中的多个关键词,进行逐个筛选,得到筛选结果。之后,还需要用户手动新建电子表格,并将筛选结果粘贴到该新建的电子表格中,再手动进行存储。现有的数据筛选过程的处理效率较低,且出错率较高,并且,这种处理方式在电子表格的数据量较大时,适用性较差。
本发明提供的技术方案,旨在解决如上技术问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
实施例一
本公开实施例提供了一种结合RPA和AI的电子表格的数据处理方法。请参考图2,该方法包括如下步骤:
S202,RPA系统采集针对第一电子表格的第一操作信息。
在本公开实施例中,执行主体为RPA(Robotic Process Automation,机器人流程自动化)系统,RPA系统可预先设置在工作站、服务器,计算机、用户终端及其他电子设备上。
在本公开实施例中,第一操作信息为RPA系统采集到的用户对第一电子表格进行操作的信息,本公开实施例对于操作方式、类型无特别限制。
示例性的,采集到的第一操作信息可以包括:点击第一电子表格中的功能控件,例如查找功能控件、格式刷功能控件等,的操作信息、对第一电子表格中的数据内容进行编辑的操作信息、对第一电子表格进行格式调整的操作信息,等,不作穷举。
示例性的,第一操作信息的类型可以包括但不限于:点击(包括左键和/或右键的单击、双击操作)、滑动、选取、长按中的一种或多种。
S204,RPA系统基于第一操作信息,在第一电子表格中确定目标筛选对象。
本公开实施例用以实现对目标筛选对象的筛选处理,换言之,当第一操作信息指示对第一电子表格进行数据筛选时,才会执行后续步骤。后续对此作具体说明。
当RPA系统采集到的第一操作信息指示对第一电子表格进行数据筛选时,即可根据第一操作信息确定目标筛选对象。该步骤在实现时,与第一操作信息相关,后续结合第一操作信息作具体说明。
在电子表格这种行、列形式的数据中,一类数据一般成行或成列排布。例如,图1所示场景中,从“列”的角度看,第一列数据为姓名,第二列数据为性别,第三列数据为年龄;从“行”的角度看,每一行数据都对应一个人的数据。
由此,针对电子表格的前述特征,可以将电子表格中的一类或多类数据作为目标筛选对象。示例性的,可以将电子表格中的一列或多列数据作为目标筛选对象。或者,基于电子表格的设计不同,也可以将电子表格中的一行或多行数据作为目标筛选对象。
以图1所示场景为例进行说明。例如,在对电子表格1进行数据筛选时,可以将“性别”作为目标筛选对象。又例如,在对电子表格1进行数据筛选时,可以将“性别”和“年龄”都作为目标筛选对象。
S206,RPA系统在目标筛选对象内,对多个关键词分别进行筛选,得到每个关键词的筛选结果。
如前,目标筛选对象可以为一类或多类数据,由此,其中可以包括多个关键词。在本公开实施例所提供的数据处理方法中,RPA系统可以对目标筛选对象中包含的每个关键词分别进行筛选,得到每个关键词各自对应的筛选结果。
仍以图1所示场景为例。如图1所示,RPA系统在对电子表格1进行数据筛选时,可以以“性别”作为目标筛选对象,对该目标筛选对象中的包含的两个关键词“男”、“女”分别进行筛选,得到这两个关键词各自对应的筛选结果,然后,将其处理后(后续步骤,下面详述)得到电子表格2和电子表格3。
除此之外,在图1所示场景中,当目标筛选对象为“性别”和“年龄”时,则RPA系统需要分别对“性别”包含的两个关键词“男”、“女”,以及,“年龄”包含的3个关键词“30”、“28”、“25”,分别进行数据筛选,如此,可以得到5个关键词各自对应的筛选结果。
由于目标筛选对象中包含多个关键词,在该步骤中,RPA系统可以遍历各关键词,从而,针对每个关键词,都在目标筛选对象内分别进行筛选,得到每个关键词的筛选结果。
S208,RPA系统基于筛选结果,生成每个关键词对应的第二电子表格。
该步骤用于基于关键词的筛选结果生成关键词的第二电子表格。例如,图1所示场景中,RPA系统基于“男”这一关键词在“性别”中进行筛选,并基于该筛选结果,生成电子表格2,以及,基于“女”这一关键词在“性别”中进行筛选,并基于该筛选结果,生成电子表格3。
在本公开实施例中,第二电子表格的数据格式与第一电子表格的数据格式相同。换言之,第二电子表格包含与筛选结果相关的全部筛选数据。例如,图1中,电子表格2并非仅包含“性别”列的数据,而是包含性别为男的所有人的相关信息,电子表格2的数据格式与电子表格1的数据格式相同,均包含3列数据,每一列的数据含义相同,且行数据的数据含义也相同。
因此,在实现该步骤时,RPA系统针对任意一个关键词,在第一电子表格中,获取关键词的筛选结果相关的全部的筛选数据,然后,RPA系统基于全部的筛选数据,生成关键词对应的第二电子表格。
所谓生成电子表格,可以有多种实现方式。
示例性的一种实施例中,可以新建一个电子表格,然后,按照第一电子表格的格式,将与筛选结果相关的全部筛选数据添加到该新建电子表格中,即可得到第二电子表格。
示例性的另一实施例中,可以复制第一电子表格,然后,将第一电子表格中的数据替换为与筛选结果相关的全部筛选数据,如此,即可得到第二电子表格。
S210,RPA系统分别存储各第二电子表格。
也就是,RPA系统将各第二电子表格分别进行存储。为了便于识别,在第二电子表格的名称中还可以包含相对应的关键词的指示信息。
可以理解,该指示信息用于对关键词进行指示。实际实现场景中,该指示信息可以为关键词自身,或者,还可以为与该关键词存在映射关系的指示符。指示符可以包括但不限于:数字、文字、符号等的组合。
举例说明。在图1所示场景中,电子表格2是在“性别”中对“男”这一关键词进行筛选后生成的,由此,RPA系统可以将电子表格2命名为“性别-男-筛选结果”;又例如,RPA系统还可以将电子表格2命名为“性别1-筛选结果”,其中,性别1为为“男”的指示信息。
此外,本公开实施例中,针对关键词的指示信息在表格名称中所处的位置,则可以根据实际场景,对其进行自定义设置或随机,本公开实施例对此无特别限定。
此外,RPA系统在对各第二电子表格进行存储时,各电子表格可以存储在同一个存储位置,或者,可以存储在不同的存储位置,对此无特别限制。
还需要说明的是,在具体实现本方案时,RPA系统可针对多个关键词,依次执行前述S206~S210步骤。例如,针对“男”、“女”这两个关键词,RPA系统可以先对“男”进行筛选,并基于筛选结果生成对应的第二电子表格并存储,之后,RPA系统再对“女”进行筛选,并基于筛选结果生成对应的第二电子表格并存储。
在另一实施例中,RPA系统也可以同时对多个关键词中的全部或部分关键词进行筛选。例如,针对“男”、“女”这两个关键词,RPA系统可以对“男”进行筛选,并基于筛选结果生成对应的第二电子表格并存储,同时,RPA系统也对“女”进行筛选,并基于筛选结果生成对应的第二电子表格并存储。
基于如图2所示的前述方法,无需用户过多的操作,RPA系统即可根据针对电子表格的操作信息来实现自动的数据筛选、表格生成与存储,提高了电子表格的筛选效率,能够适应大批量数据筛选的场景,并且,避免了由于人工筛选过程导致的出错率较高的问题,有利于降低出错率,并提高准确率。
现以图2所示实施例为基础,对本公开实施例作进一步说明。
首先对第一操作信息进行说明。如前,当第一操作信息用于指示对第一电子表格进行数据筛选操作时,才会执行该数据筛选方法。由此,实际实现场景中,可以对用于指示对第一电子表格进行数据筛选的操作信息进行预设,从而,当RPA系统采集到的第一操作信息与预设操作信息相匹配(或相同)时,则执行该数据筛选处理。
本公开实施例示例性的提供了几种可能的预设方式,当第一操作信息为如下的一种或多种时,可以执行本方案。以及,基于第一操作信息不同,确定目标目标筛选对象的方式也不同,以下详述。
示例性的一种实施例中,当第一操作信息为在第一电子表格中选取数据的操作信息时,执行本方案。例如,在图1所示出的电子表格1中,若RPA系统采集到用户选取了第2列的数据时,则可执行本方案。
在该实施例中,RPA系统可以将采集该第一操作信息所选中的目标区域,这可以通过采集鼠标光标在第一电子表格中的坐标的方式实现。进而,RPA系统将该目标区域中包含的对象都作为目标筛选对象,分别进行后续筛选处理。
仍以图1所示举例。若RPA系统采集到的第一操作信息指示用户选中的区域为第二列和第三列数据,则将“性别”和“年龄”都作为目标筛选对象,进行后续筛选处理。
示例性的另一种实施例中,若第一操作信息为在第一电子表格中点击筛选功能控件的操作信息,则执行本方案。其中,筛选功能控件可以是针对一类数据,也可以是针对整个电子表格。此时,筛选功能控件所针对的筛选范围内的所有对象,都可以作为目标筛选对象。
示例性的,可以参考图3,图3示出了一种电子表格的示意图。为便于示意,图3所示的电子表格与图1所示的电子表格1的格式相同。区别于图1中的电子表格1,图3中的电子表格中,在每列数据的标题栏所在的每个单元格中,还显示了该单元格对应的筛选功能控件31。此时,若用户点击了“姓名”这一单元格的筛选功能控件,则将“姓名”这一列数据作为目标筛选对象,执行后续的筛选过程。
图3所示的实施例中,筛选功能控件是针对电子表格中的局部数据。除此之外,筛选功能控件还可以针对整个电子表格。例如,当用户点击电子表格的功能区中的筛选功能控件时,也可以将整个第一电子表格中的所有数据都作为目标筛选对象进行后续筛选过程。
示例性的另一种实施例中,若第一操作信息为在第一电子表格中的一个或多个预设坐标位置进行点击的操作信息时,也可以触发执行本方案。在该实施例中,基于预设的坐标位置对应的筛选区域可以不同。例如,在图3所示电子表格中,若用户点击电子表格左上角处,则可以触发针对整个电子表格中所有数据的数据筛选处理;或者,若RPA系统采集到的第一操作信息指示用户仅点击了第二列数据的末尾单元格或标题单元格(“性别”所在单元格)的筛选功能控件,则可以触发对第二列数据的数据筛选过程。
以上几种实施例仅为示意性的,实际场景中,前述各实施例可以结合使用。
示例性的,当用户在第一电子表格中选取了部分数据,并针对这部分区域点击筛选功能控件时,则RPA系统基于采集到的这些操作信息确定用户选取的部分数据为目标筛选对象,进而,对目标筛选对象进行后续筛选处理。
不作穷举。
除此之外,本公开实施例中,RPA系统在确定目标筛选对象时,还可以基于电子设备的显示装置(例如,可以为显示屏)的显示信息,来引导用户实现对目标筛选对象的确定,这有利于解决不同显示装置的效果不同,对目标筛选对象的选择准确性的不利影响。
具体而言,该方法还可以包括如下步骤:RPA系统获取第一电子表格所属显示装置的显示信息,然后,RPA系统基于显示信息,确定第一电子表格的第一提示信息,第一提示信息用于引导用户确定目标筛选对象,进而,RPA系统显示第一提示信息。
其中,显示装置的显示信息可以包括但不限于:屏幕分辨率、第一电子表格中各单元格在显示装置中的坐标位置,等。
具体实现时,RPA系统可以在获取到显示装置的显示信息之后,可以采用创建屏幕写屏的方式,在显示装置中显示文字提示(第一提示信息),以引导用户点击必要的坐标,从而,RPA系统可以采集到用户点击这些必要坐标的操作信息(第一操作信息),进而,RPA系统可以确定出目标筛选对象。
在该实施例中,当RPA系统采集到用户点击这些必要坐标(例如,筛选功能控件的坐标)后,还可以生成坐标文档,坐标文档用于记录显示装置中的必要坐标的位置。除此之外,坐标文档还可以用于记录第一电子表格中各单元格的坐标,这些坐标可以基于单元格的格式与必要坐标的位置计算得到。
如此,在后续用户对该第一电子表格进行数据筛选操作或其他操作时,可以直接调用坐标文档,并依据坐标文档来确定鼠标光标的坐标,实现对数据的精确选取,方便后续操作的实现。
在前述任意一种实施例的基础上,本公开实施例还为用户提供了二次确定目标筛选对象的选择空间。
示例性的一种实施例中,RPA系统基于第一操作信息,在第一电子表格中确定目标筛选对象时,还可以按照如下方案实现:
首先,RPA系统基于第一操作信息,生成模拟操作视频,模拟操作视频用于演示第一操作信息对应的操作过程,然后,RPA系统播放模拟操作视频。当模拟操作视频播放结束时,RPA系统输出第二提示信息,第二提示信息用于确定是否重新确定目标筛选对象,并采集针对第二提示信息的第二操作信息,从而,RPA系统基于第二操作信息,将第一操作信息所指示的筛选对象确定为目标筛选对象,或者,重新采集第一操作信息。
换言之,在该实施例中,RPA系统在获取到鼠标坐标,初步确定出筛选对象(在前述实施例中,无后续步骤,则为目标筛选对象)之后,可以生成模拟操作视频,该模拟操作视频是RPA系统基于采集到的第一操作信息而生成的。
从而,RPA系统通过播放该模拟操作视频,用户可以据此确定当前选择的筛选对象是否有误,进而,当模拟操作视频播放结束,RPA系统可以输出可供用户操作的第二提示信息。例如,第二提示信息可以为:是否需要重新选择筛选对象,并提供选择控件“是”与“否”,用户可以通过点击选择控件的方式对其进行操作。
那么,若第二操作信息指示用户点击了选择控件“是”,则RPA系统重新采集第一操作信息。此时,用户可以重新对第一电子表格进行操作,以重新确定目标筛选对象。反之,若第二操作信息指示用户点击了选择控件“否”,则RPA系统将当前的第一操作信息确定的筛选对象确定为目标筛选对象。
基于前述各实施例的处理,RPA系统可以基于用户的操作信息确定出目标筛选对象。在此基础上,RPA系统对目标筛选对象中的各关键词分别进行筛选时,除前述实现方式之外,还可以获取目标筛选对象,并基于各关键词的坐标(一种具体实现方式)来遍历关键词,其中,关键词所在单元格的坐标可以基于前述的坐标文档中获取得到。换言之,RPA系统在遍历各关键词时,也可以通过遍历目标筛选对象的坐标来实现。
在具体进行筛选时,针对任意一个关键词,RPA系统可以模拟用户操作,将该关键词输入筛选框,并对筛选框中的关键词进行全局筛选,得到关键词的筛选结果。
如前,该遍历筛选过程可以同时执行,或者,也可以依次实现。例如,RPA系统可以将各关键词模拟输入筛选框,并进行筛选,待生成(或存储)当前的一个关键词对应的第二电子表格后,再将下一个关键词模拟输入筛选框,依次重复前述步骤,直至所有关键词被遍历完。
本公开实施例中,考虑到RPA系统进行自动筛选时,可能会由于系统故障或人为操作等原因,中断数据筛选过程。这种情况下,RPA系统可以基于中断前已经筛选得到的数据,自动生成并存储该关键词的第二电子表格。或者,RPA系统也可以直接放弃已筛选到的数据,不作额外处理。
由此,考虑到存储器中可能已经存储有某些关键词(一个或多个)的第二电子表格,但第二电子表格中的数据可能仅为该关键词在第一电子表格中的筛选结果的一部分。
这种情况下,若RPA系统再次触发对该关键词的数据筛选过程,则可以按照前述方法获取该关键词的筛选结果对应的全部筛选数据。在此基础上,生成第二电子表格时,RPA系统可以检测是否存在关键词的第三电子表格,第三电子表格为在第一电子表格中对关键词进行筛选后得到的,那么,RPA系统当存在第三电子表格时,获取第三电子表格的表格数据,然后,RPA系统在全部的筛选数据中,过滤掉表格数据,得到筛选数据,进而,RPA系统基于筛选数据,生成关键词对应的第二电子表格。
换言之,在面对数据筛选中断又再次重启的情况,本公开实施例的RPA系统能够将筛选出来的数据去重后,再生成并存储表格。
例如,在图1所示场景中,初次对“性别”中的关键词“男”进行筛选时,当筛选了前5行数据后发生了筛选中断。则RPA系统可以将前5行数据中针对“男”的筛选结果,生成并存储第二电子表格1(也可执行前述判断是否有第三电子表格的过程,此处不赘述)。之后,RPA系统采集到第一操作信息,又再次对“性别”中的关键词“男”进行筛选,得到类似于图1中电子表格2的筛选结果。而RPA系统检测发现存储器中已经存储有针对该关键词“男”的第二电子表格1,则RPA系统可以在电子表格2对应的筛选结果中过滤掉第二电子表格1的内容,实际得到图1中电子表格1中后5行中,针对“性别”中的关键词“男”的筛选数据,进而,基于此生成第二电子表格2,并存储第二电子表格2。
除前述实施例之外,在发生筛选中断的场景中,还可以有其他处理方式。
示例性的另一种实施例中,当RPA系统检测到存在第三电子表格时,还可以删除第三电子表格,并按照前述方法,生成并存储第二电子表格。仍以前述图1场景为例。在该实施例中,RPA系统可以将存储器中存储的第二电子表格1删除,并按照前述方法,生成图1所示的电子表格2(也即,第二电子表格),并存储该电子表格2。
示例性的另一种实施例中,当RPA系统检测到存在第三电子表格时,还可以按照前述方法,生成第二电子表格,其中,第二电子表格中包括至少两个工作表,一个工作表用于记录对第一电子表格进行完整筛选后生成的电子表格,另一个工作表用于记录筛选中断时生成的电子表格。仍以前述图1场景为例。在该实施例中,生成的第二电子表格可以包括2个工作表,一个工作表的内容可以为前述电子表格2中包含的所有数据,另一个工作表的内容可以为前述提及的第二电子表格1中包含的所有数据。
在此基础上的另一个实施例中,该第二电子表格还可以包括第三个工作表,第三个工作表用于记录对中断筛选前的数据去重后的筛选数据。仍以前述图1场景为例。在该实施例中,RPA系统生成的第二电子表格可以包括3个工作表,一个工作表的内容可以为前述电子表格2中包含的所有数据,另一个工作表的内容可以为前述提及的第二电子表格1中包含的所有数据,还有一个工作表的内容为前述第二电子表格2包含的所有数据。
综上,本公开实施例所提供的方案可以代替人工完成对电子表格(如EXCEL文档)中大批量内容的筛选以及生产对应表格的操作,大大节省了相关工作人员的时间,释放了劳动力,提升了筛选效率,并降低出错率。
当用于本申请中时,虽然术语“第一”、“第二”等可能会在本申请中使用以描述各电子表格等,但这些电子表格不应受到这些术语的限制。这些术语仅用于将一个电子表格与另一个电子表格区别开。比如,在不改变描述的含义的情况下,第一电子表格可以叫做第二电子表格,并且同样地,第二电子表格可以叫做第一电子表格,只要所有出现的“第一电子表格”一致重命名并且所有出现的“第二电子表格”一致重命名即可。第一电子表格和第二电子表格都是电子表格,但可以不是相同的电子表格。
本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。
实施例二
基于上述实施例一所提供的结合RPA和AI的电子表格的数据处理方法,本公开实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
本公开实施例提供了一种电子设备,请参考图4,该电子设备400,包括:处理模块42与收发模块44;其中,
收发模块44,用于采集针对第一电子表格的第一操作信息;
处理模块42,用于:
基于第一操作信息,在第一电子表格中确定目标筛选对象;
在目标筛选对象内,对多个关键词分别进行筛选,得到每个关键词的筛选结果;
基于筛选结果,生成每个关键词对应的第二电子表格。
在一种具体的实施例中,处理模块42,具体用于:
遍历各关键词;
针对每个关键词,在目标筛选对象内分别进行筛选,得到每个关键词的筛选结果。
在另一种具体的实施例中,处理模块42,具体用于:
针对任意一个关键词,在第一电子表格中,获取关键词的筛选结果相关的全部的筛选数据;
基于全部的筛选数据,生成关键词对应的第二电子表格。
在另一种具体的实施例中,处理模块42,具体用于:
检测是否存在关键词的第三电子表格,第三电子表格为在第一电子表格中对关键词进行筛选后得到的;
当存在第三电子表格时,获取第三电子表格的表格数据;
在全部的筛选数据中,过滤掉表格数据,得到筛选数据;
基于筛选数据,生成关键词对应的第二电子表格。
在另一种具体的实施例中,处理模块42,还用于:
生成每个关键词对应的第二电子表格之后,分别存储各第二电子表格。
在另一种具体的实施例中,第二电子表格的数据格式与第一电子表格的数据格式相同。
在另一种具体的实施例中,第二电子表格的名称包含相对应的关键词的指示信息。
在另一种具体的实施例中,处理模块42,还用于:
获取第一电子表格所属显示装置的显示信息;
基于显示信息,确定第一电子表格的第一提示信息,第一提示信息用于引导用户确定目标筛选对象;
显示第一提示信息。
在另一种具体的实施例中,处理模块42,还用于:
基于第一操作信息,生成模拟操作视频,模拟操作视频用于演示第一操作信息对应的操作过程;
播放模拟操作视频;
当模拟操作视频播放结束时,输出第二提示信息,第二提示信息用于确定是否重新确定目标筛选对象;
收发模块44,还用于采集针对第二提示信息的第二操作信息;
处理模块42,还用于基于第二操作信息,将第一操作信息所指示的筛选对象确定为目标筛选对象,或者,重新采集第一操作信息。
在另一种具体的实施例中,第一操作信息包括:
在第一电子表格中选取数据的操作信息;或者,
在第一电子表格中点击筛选功能控件的操作信息;或者,
在第一电子表格中的一个或多个预设坐标位置进行点击的操作信息。
图4所示实施例的电子设备400可用于执行上述方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述,如前,该电子设备400可以终端。
应理解以上图4所示电子设备400的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块以软件通过处理元件调用的形式实现,部分模块通过硬件的形式实现。例如,处理模块42可以为单独设立的处理元件,也可以集成在电子设备400中,例如电子设备的某一个芯片中实现,此外,也可以以程序的形式存储于电子设备400的存储器中,由电子设备400的某一个处理元件调用并执行以上各个模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)等。再如,当以上某个模块通过处理元件调度程序的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central ProcessingUnit,CPU)或其它可以调用程序的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
并且,本公开实施例提供了一种电子设备,请参考图5,该电子设备400,包括:至少一个处理器420和存储器410;其中,所述存储器410存储计算机执行指令;至少一个处理器420执行所述存储器410存储的计算机执行指令,使得所述至少一个处理器420执行以实现如上述实施例的方法。
其中,电子设备400中处理器420的数目可以为一个或多个,处理器420也可以称为处理单元,可以实现一定的控制功能。处理器420可以是通用处理器或者专用处理器等。在一种可选地设计中,处理器420也可以存有指令,指令可以被处理器420运行,使得电子设备400执行上述方法实施例中描述的方法。
在又一种可能的设计中,电子设备400可以包括电路,电路可以实现前述方法实施例中发送或接收或者通信的功能。
可选地,电子设备400中存储器410的数目可以为一个或多个,存储器410上存有指令或者中间数据,指令可在处理器420上被运行,使得电子设备400执行上述方法实施例中描述的方法。可选地,存储器410中还可以存储有其他相关数据。可选地处理器420中也可以存储指令和/或数据。处理器420和存储器410可以单独设置,也可以集成在一起。
此外,如图5所示,在该电子设备400中还设置有收发器430,其中,收发器430可以称为收发单元、收发机、收发电路、或者收发器等,用于与测试设备或其他终端设备进行数据传输或通信,在此不再赘述。
如图5所示,存储器410、处理器420与收发器430通过总线连接并通信。
若该电子设备400用于实现对应于图2中的方法时,例如,可以由收发器430接收来自于用户的待识别语句。而处理器420用于完成相应的确定或者控制操作,可选的,还可以在存储器410中存储相应的指令。各个部件的具体的处理方式可以参考前述实施例的相关描述。
此外,本公开实施例提供了一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行以实现如实施例一的方法。
由于本实施例中的各模块能够执行实施例一所示的方法,本实施例未详细描述的部分,可参考对实施例一的相关说明。
以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本发明的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (13)

1.一种结合RPA和AI的电子表格的数据处理方法,其特征在于,包括:
RPA系统采集针对第一电子表格的第一操作信息;
所述RPA系统基于所述第一操作信息,在所述第一电子表格中确定目标筛选对象;
所述RPA系统在所述目标筛选对象内,对多个关键词分别进行筛选,得到每个所述关键词的筛选结果;
所述RPA系统基于所述筛选结果,生成每个所述关键词对应的第二电子表格。
2.根据权利要求1所述的方法,其特征在于,所述在所述目标筛选对象内,对多个关键词分别进行筛选,得到每个所述关键词的筛选结果,包括:
所述RPA系统遍历各所述关键词;
所述RPA系统针对每个所述关键词,在所述目标筛选对象内分别进行筛选,得到每个所述关键词的筛选结果。
3.根据权利要求1所述的方法,其特征在于,所述基于所述筛选结果,生成每个所述关键词对应的第二电子表格,包括:
所述RPA系统针对任意一个所述关键词,在所述第一电子表格中,获取所述关键词的所述筛选结果相关的全部的筛选数据;
所述RPA系统基于所述全部的筛选数据,生成所述关键词对应的所述第二电子表格。
4.根据权利要求3所述的方法,其特征在于,所述基于所述全部的筛选数据,生成所述关键词对应的所述第二电子表格,包括:
所述RPA系统检测是否存在所述关键词的第三电子表格,所述第三电子表格为在所述第一电子表格中对所述关键词进行筛选后得到的;
所述RPA系统当存在所述第三电子表格时,获取所述第三电子表格的表格数据;
所述RPA系统在所述全部的筛选数据中,过滤掉所述表格数据,得到筛选数据;
所述RPA系统基于所述筛选数据,生成所述关键词对应的所述第二电子表格。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述生成每个所述关键词对应的第二电子表格之后,还包括:
所述RPA系统分别存储各所述第二电子表格。
6.根据权利要求5所述的方法,其特征在于,所述第二电子表格的数据格式与所述第一电子表格的数据格式相同。
7.根据权利要求5所述的方法,其特征在于,所述第二电子表格的名称包含相对应的所述关键词的指示信息。
8.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
所述RPA系统获取所述第一电子表格所属显示装置的显示信息;
所述RPA系统基于所述显示信息,确定所述第一电子表格的第一提示信息,所述第一提示信息用于引导用户确定所述目标筛选对象;
所述RPA系统显示所述第一提示信息。
9.根据权利要求1-4任一项所述的方法,其特征在于,所述基于所述第一操作信息,在所述第一电子表格中确定目标筛选对象,包括:
所述RPA系统基于所述第一操作信息,生成模拟操作视频,所述模拟操作视频用于演示所述第一操作信息对应的操作过程;
所述RPA系统播放所述模拟操作视频;
所述RPA系统当所述模拟操作视频播放结束时,输出第二提示信息,所述第二提示信息用于确定是否重新确定所述目标筛选对象;
所述RPA系统采集针对所述第二提示信息的第二操作信息;
所述RPA系统基于所述第二操作信息,将所述第一操作信息所指示的筛选对象确定为所述目标筛选对象,或者,重新采集所述第一操作信息。
10.根据权利要求1所述的方法,其特征在于,所述第一操作信息包括:
在所述第一电子表格中选取数据的操作信息;或者,
在所述第一电子表格中点击筛选功能控件的操作信息;或者,
在所述第一电子表格中的一个或多个预设坐标位置进行点击的操作信息。
11.一种电子设备,其特征在于,包括:处理模块与收发模块;其中,
所述收发模块,用于采集针对第一电子表格的第一操作信息;
所述处理模块,用于:
基于所述第一操作信息,在所述第一电子表格中确定目标筛选对象;
在所述目标筛选对象内,对多个关键词分别进行筛选,得到每个所述关键词的筛选结果;
基于所述筛选结果,生成每个所述关键词对应的第二电子表格。
12.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-10任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-10任一项所述的方法。
CN202010840222.XA 2020-03-30 2020-08-19 结合rpa和ai的电子表格的数据处理方法与电子设备 Pending CN111966734A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020102358990 2020-03-30
CN202010235899 2020-03-30

Publications (1)

Publication Number Publication Date
CN111966734A true CN111966734A (zh) 2020-11-20

Family

ID=73389381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010840222.XA Pending CN111966734A (zh) 2020-03-30 2020-08-19 结合rpa和ai的电子表格的数据处理方法与电子设备

Country Status (1)

Country Link
CN (1) CN111966734A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113900561A (zh) * 2021-10-27 2022-01-07 北京字跳网络技术有限公司 表格处理方法、装置、电子设备、介质及程序产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140369602A1 (en) * 2013-06-14 2014-12-18 Lexmark International Technology S.A. Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data
CN106227773A (zh) * 2016-07-14 2016-12-14 广州视睿电子科技有限公司 数据处理方法和系统
CN106709032A (zh) * 2016-12-29 2017-05-24 深圳市华傲数据技术有限公司 抽取电子表格文档中结构化信息的方法及装置
CN108280767A (zh) * 2017-08-28 2018-07-13 平安科技(深圳)有限公司 名单切分的方法、装置、存储介质及终端
CN109213979A (zh) * 2017-07-03 2019-01-15 珠海金山办公软件有限公司 对电子表格进行筛选的方法、装置、电子设备及存储介质
CN110377604A (zh) * 2019-07-23 2019-10-25 北京小米移动软件有限公司 一种提取表格信息的方法、装置及介质
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140369602A1 (en) * 2013-06-14 2014-12-18 Lexmark International Technology S.A. Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data
CN106227773A (zh) * 2016-07-14 2016-12-14 广州视睿电子科技有限公司 数据处理方法和系统
CN106709032A (zh) * 2016-12-29 2017-05-24 深圳市华傲数据技术有限公司 抽取电子表格文档中结构化信息的方法及装置
CN109213979A (zh) * 2017-07-03 2019-01-15 珠海金山办公软件有限公司 对电子表格进行筛选的方法、装置、电子设备及存储介质
CN108280767A (zh) * 2017-08-28 2018-07-13 平安科技(深圳)有限公司 名单切分的方法、装置、存储介质及终端
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备
CN110377604A (zh) * 2019-07-23 2019-10-25 北京小米移动软件有限公司 一种提取表格信息的方法、装置及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QQ_41554671: "excel将一个工作表根据条件拆分成多个工作表,并将多个工作表怎么拆分成独立表格", pages 1 - 5, Retrieved from the Internet <URL:《http://t.csdnimg.cn/JugnS》> *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113900561A (zh) * 2021-10-27 2022-01-07 北京字跳网络技术有限公司 表格处理方法、装置、电子设备、介质及程序产品
CN113900561B (zh) * 2021-10-27 2023-07-25 北京字跳网络技术有限公司 表格处理方法、装置、电子设备、介质及程序产品

Similar Documents

Publication Publication Date Title
CN107102941B (zh) 一种测试用例的生成方法及装置
CN107273280B (zh) 一种日志处理方法、装置、电子设备和存储介质
CN109828903B (zh) 自动化测试方法、装置、计算机装置及存储介质
CN107491383A (zh) 应用崩溃操作日志的捕获方法、装置及移动终端
CN106484699B (zh) 数据库查询字段的生成方法及装置
CN107451112B (zh) 表格工具数据检查方法、装置、终端设备及存储介质
CN110348020A (zh) 一种英文单词拼写纠错方法、装置、设备及可读存储介质
CN108664665A (zh) 数据格式转化方法、装置、设备及可读存储介质
CN111782758A (zh) 基于cad的图纸审查结果查看方法及相关装置
CN102426567A (zh) 一种自动应答系统的图形化编辑调试系统
CN112995418A (zh) 视频彩铃播放方法、发送方法及相关设备
EP4224338A1 (en) Data labeling method, apparatus, and system, device, and storage medium
CN114564904A (zh) Fpga全路径快速时序分析方法、装置、计算机和存储介质
CN112783779A (zh) 测试用例的生成方法、装置、电子设备和存储介质
CN111966734A (zh) 结合rpa和ai的电子表格的数据处理方法与电子设备
CN113779269A (zh) 电网负荷数据的展示方法、装置、电子设备及存储介质
CN110427277B (zh) 数据校验方法、装置、设备及存储介质
CN117271645A (zh) 一种测试数据的处理方法、装置及计算机可读存储介质
CN117033309A (zh) 一种数据转换方法、装置、电子设备及可读存储介质
CN107239436B (zh) 一种数据转换方法和装置
CN116049215A (zh) 选项查询方法、装置、电子设备及介质
CN109324973A (zh) 一种软件测试方法、装置、设备及计算机可读存储介质
CN105991400B (zh) 一种群组搜索方法及其设备
CN114201600A (zh) 舆情文本的摘要抽取方法、装置、设备及计算机存储介质
CN109992505B (zh) 应用程序测试方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 1902, 19th Floor, China Electronics Building, No. 3 Danling Road, Haidian District, Beijing

Applicant after: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Applicant after: Laiye Technology (Beijing) Co.,Ltd.

Address before: 1902, 19 / F, China Electronics Building, 3 Danling Road, Haidian District, Beijing 100080

Applicant before: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Country or region before: China

Applicant before: BEIJING BENYING NETWORK TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information