CN117494702A - 一种结合rpa和ai的数据推送方法及系统 - Google Patents
一种结合rpa和ai的数据推送方法及系统 Download PDFInfo
- Publication number
- CN117494702A CN117494702A CN202410001636.1A CN202410001636A CN117494702A CN 117494702 A CN117494702 A CN 117494702A CN 202410001636 A CN202410001636 A CN 202410001636A CN 117494702 A CN117494702 A CN 117494702A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- item
- lottery
- verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012795 verification Methods 0.000 claims abstract description 91
- 230000002159 abnormal effect Effects 0.000 claims abstract description 72
- 238000000605 extraction Methods 0.000 claims description 34
- 239000000284 extract Substances 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000012216 screening Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 4
- 238000005429 filling process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000005086 pumping Methods 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理技术领域,具体地说,涉及一种结合RPA和AI的数据推送方法及系统。其通过在RPA系统中确定与抽调数据列对应填报的数据项,并以抽调数据列进行核验,以判定是否存在异常的差异数据;当存在异常的差异数据时,提取差异数据并生成判别队列集,对判别队列集中的差异数据进行分析,判定是否存在相同的异常项;当存在相同的异常项时,基于该异常项重新确定与异常项对应填报的数据项并将其标记为二次核验数据项,确定二次抽调数据列,并进行校验核对,以对差异数据进行矫正。通过仅对存在二次核验数据项进行异常分析,在大量填报的数据中筛选出需要进行重点核验的数据信息,以此提升目前数据填报的整体效率。
Description
技术领域
本发明涉及数据处理技术领域,具体地说,涉及一种结合RPA和AI的数据推送方法及系统。
背景技术
数据填报是指将客户的数据信息填报至相应的登记系统中,以便后续能够从登记系统中提取至相应的客户信息数据。
中国专利公开号为CN114818642A,公开了数据报表动态填报方法,包括数据采集模块、数据处理模块、导入模块、填报模板、总控制模块,其中,所述数据采集模块与总控制模块通信连接,通过数据采集模块对需要填报的数据进行采集;所述数据处理模块与总控制模块通信连接,通过数据处理模块对采集的填报数据进行处理;处理后的数据导出成excel;本发明的有益效果是:已发布的表单进行填报内容修改,修改结果可实现即时更新;支持对单张填报表单数据的历史记录查看,且支持单张表单多次修改表单结构的历史记录查看、导出;通过日期选项可实现历史填报表单的快速跳转,历史表单格式不受修改表单样式影响,点击导出,可实现当前所选的报表excel格式下载。
但是,在数据信息填报后,为了确保所填报的数据信息的准确性,如何能够对所填报的数据信息进行快速的核验,并基于核验的过程确定数据填报过程中异常数据信息的涵盖范围,以便于仅对于填报过程中存在的异常数据信息进行核验确定矫正,从而提高目前数据信息的整体填报效率是需要解决的问题。
发明内容
本发明的目的在于提供一种结合RPA和AI的数据推送方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明目的在于提供了一种结合RPA和AI的数据推送方法,包括如下步骤:
S1、获取客户信息调查表,并对其进行整合形成报表提取数据集;
S2、确定数据填报时间,通过RPA系统依据数据填报时间调用AI系统对报表提取数据集中的客户信息调查表进行识别并提取,并将所提取的数据信息生成JSON格式;当数据信息处于JSON格式时,通过RPA系统将其整合形成数据填报集,确定填报对象并通过数据填报集执行数据填报作业;
S3、通过在数据填报集内形成抽调数据并将其标记为抽调数据列,通过在RPA系统填报的数据信息中确定与抽调数据列对应填报的数据项,并以抽调数据列进行核验,以判定是否存在异常的差异数据;
S4、当存在异常的差异数据时,提取差异数据并生成判别队列集,基于同项特征点算法对判别队列集中的差异数据进行分析,判定是否存在相同的异常项;
S5、当存在相同的异常项时,基于该异常项重新于RPA系统中确定与异常项对应填报的数据项并将其标记为二次核验数据项,随之确定与之对应的二次抽调数据列,并以此重新进行校验核对,以对差异数据进行矫正。
作为本技术方案的进一步改进,所述客户信息调查表包括:
客户单位基本信息、代理单位基本信息、第三方单位基本信息、申请陈述意见、物质基本信息、反应状态基本信息。
作为本技术方案的进一步改进,所述RPA系统通过影刀、Uibot、GE-Worker或BluePrism对数据填报集执行数据填报作业。
作为本技术方案的进一步改进,所述AI系统通过AI生成式大模型对报表提取数据集中的客户信息调查表进行识别并提取,并将所提取的数据信息生成JSON格式。通过生成JSON格式,以便于后续进行数据填报作业,在本方案中,数据填报对象通常为向登记系统进行客户信息的数据填报。
作为本技术方案的进一步改进,所述S4中,在数据填报集填报完成时,在数据填报集内形成抽调数据,并将抽调数据标记为抽调数据列,通过在RPA系统填报的数据信息中确定与抽调数据列对应填报的数据项,并将此数据项标记为核验数据项,使抽调数据列与核验数据项进行校验核对,以判定是否存在异常的差异数据。
作为本技术方案的进一步改进,所述S4中,抽调数据列与核验数据项进行校验核对通过排序算法进行实现,其中,排序算法的算法步骤如下:
步骤一:对抽调数据列和核验数据项中的数据信息进行排序;
步骤二:遍历排序后的抽调数据列和核验数据项,比较对应的数据信息是否相同;
步骤三:当相同时,则不生成差异数据,当不相同时,生成差异数据。
作为本技术方案的进一步改进,所述S5中,基于同项特征点算法对判别队列集中的差异数据进行分析,以判定是否存在相同的异常项,其中,基于同项特征点算法的算法步骤如下:
步骤一:确定抽调数据列和核验数据项中所对应的差异数据;
步骤二:提取差异数据中的相同字符特征点,基于相同字符特征点确定异常项;
步骤三:根据所确定的异常项生成异常项集合。
作为本技术方案的进一步改进,当异常项集合生成时,使所述异常项集合输入至RPA系统中,以此确定与异常项集合内异常项对应填报的数据项,并将此数据项标记为二次核验数据项,依据二次核验数据项在数据填报集内确定与之对应的抽调数据,并形成二次抽调数据列,以二次核验数据项与二次抽调数据列进行校验核对,以对差异数据进行矫正。
本发明还提供了一种数据推送系统,该系统根据所述的结合RPA和AI的数据推送方法实现。
与现有技术相比,本发明的有益效果:
1、通过核验数据项基于排序算法、同项特征点算法对差异数据进行判定,并由差异数据生成异常项集合,由异常项集合确定所填报有关于异常项集合内的二次核验数据项,依据二次核验数据项确定二次抽调数据列,以二次核验数据项与二次抽调数据列进行校验核对,以使本系统在对登记系统进行数据填报时,对客户信息调查表具有准确的填报;
本方案依据客户信息调查表中的数据信息确定抽调数据的抽调量,并根据抽调数据形成抽调数据列,以此限定目前在通过抽调数据进行核对时,产生大量的抽调数据,经过抽调数据在核验的过程中,由此确定后续所生成的抽调数据是否执行再次核验,从而提升对RPA系统填报的数据信息的核验的效率。
2、依据于RPA系统数据填报中二次核验数据项于表格页上的的分布状态,以在所确定的二次抽调数据列中限定所需要核验的客户数据信息,以此缩减对整体二次抽调数据列进行核验的情况,在大量填报的数据中筛选出需要进行重点核验的数据信息范围,以此提升目前数据填报的整体效率。
附图说明
图1为本发明的整体方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在数据信息填报后,为了确保所填报的数据信息的准确性,如何能够对所填报的数据信息进行快速的核验,并基于核验的过程确定数据填报过程中异常数据信息的涵盖范围,以便于仅对于填报过程中存在的异常数据信息进行核验确定矫正,从而提高目前数据信息的整体填报效率是需要解决的问题。
因此,在本方案中,通过在填报数据中确定与抽调数据列对应填报的数据项并进行提取,并由多个数据项汇聚形成核验数据项,通过排序算法、同项特征点算法对差异数据进行判定,并由差异数据生成异常项集合,通过异常项集合确定所填报有关于异常项集合内的二次核验数据项,依据二次核验数据项确定二次抽调数据列,以二次核验数据项与二次抽调数据列进行校验核对,以使本系统在对登记系统进行数据填报时,对客户信息调查表具有准确的填报,同时因本方案仅对存在二次核验数据项进行异常分析,从而在大量填报的数据中筛选出需要进行重点核验的数据信息,以此提升目前数据填报的整体效率,进而,针对此方案,做出如下设计:
请参阅图1所示,本实施例提供了一种结合RPA和AI的数据推送方法,包括如下步骤:
S1、获取客户信息调查表,并对其进行整合形成报表提取数据集,其中,客户信息调查表包括:
客户单位基本信息:单位全称、国家/地区、互联网址、联系人姓名、联系人邮箱、联系人手机号、联系人固定电话、法定代表人或被授权人姓名、授权数有效期结束、经营类型(生产企业or贸易企业or加工使用企业)、实际活动地址(将地址分割为:省、市、区、详细地址)、企业地理位置经度和纬度;
代理单位基本信息:代理单位全称、经营类型(生产企业or贸易企业or加工使用企业)、互联网址、联系人姓名、联系人邮箱、联系人手机号、联系人固定电话、法定代表人或被授权人姓名、授权数有效期结束、代理合同/协议有效期开始、代理合同/协议有效期结束;
第三方单位基本信息:第三方单位名称、第三方单位联系人姓名、第三方单位邮箱、第三方单位手机、第三方单位固定电话;
申请陈述意见:申请理由(不足1 吨or<2%聚合物or 低关注聚合物)、生产量、进口量;
物质基本信息:中文化学名称、英文化学名称、命名方式(CASorIUPAC名)、物质类别(聚合物or化合物or无机化合物)、中文类名、英文类名、其他名称、CAS号、SMILES码;
反应状态基本信息:聚合反应机理、单体/反应体类型(单体or反应体)。
S2、通过RPA系统依据数据填报时间调用AI系统对报表提取数据集中的客户信息调查表进行识别并提取,并将所提取的数据信息生成JSON格式,当数据信息处于JSON格式时,通过RPA系统将其整合形成数据填报集(需要说明的是,通过AI系统对报表提取数据集进行提取整合,以形成常规的Excel表格,并根据多个Excel表格形成数据填报集,其中Excel表格内为上述中客户信息调查表内的数据信息),确定填报对象并通过数据填报集执行数据填报作业;具体是,RPA系统通过影刀、Uibot、GE-Worker或BluePrism对数据填报集执行数据填报作业,需要说明的是,影刀、Uibot、GE-Worker或BluePrism均是一种能够自动化执行数据填报、汇总和分析等任务的工具,因此,在本方案中可优选Uibot、影刀,以调用AI生成式大模型(如本申请中的chatgpt)进行识别报表提取数据集,从而实现较为便捷的数据填报,其中:
AI系统通过AI生成式大模型(可为chatgpt,也可以通过OCR与chatgpt结合实现更为精确的数据填报,在此不做限定)对报表提取数据集中的客户信息调查表进行识别并提取,并将所提取的数据信息生成JSON格式,通过生成JSON格式,以便于后续进行数据填报作业,在本方案中,数据填报对象通常为向登记系统进行客户信息的数据填报。
在本方案中,为了确保向登记系统填报数据信息的准确性:
S3、通过在数据填报集内形成抽调数据并将其标记为抽调数据列,通过在RPA系统中确定与抽调数据列对应填报的数据项,并以抽调数据列进行核验,以判定是否存在异常的差异数据;具体是,在数据填报集填报完成时,在数据填报集内形成抽调数据,并将抽调数据标记为抽调数据列,通过确定与抽调数据列对应填报的数据项,并将此数据项标记为核验数据项,使抽调数据列与核验数据项进行校验核对,以判定是否存在异常的差异数据,进而,通过在数据填报集内设定部分需要填报的数据信息为抽调数据,通过所限定的抽调数据生成抽调数据列,需要说明的是,此处的抽调数据可为数据填报集内某个Excel表格,其Excel表格内涵盖的客户信息数据,如客户的基本信息,其此处需要抽取多个不同Excel表格内的客户信息数据,及生成多个抽调数据且整合再形成抽调数据列,因此,在数据填报后,通过在RPA系统向登记系统的填报数据中确定与抽调数据列对应填报的数据项,将此类数据进行提取,并由多个数据项汇聚形成核验数据项,从而,再次通过排序算法进行判定,其中,排序算法的算法步骤如下:
步骤一:对抽调数据列和核验数据项中的数据信息进行排序;
步骤二:遍历排序后的抽调数据列和核验数据项,比较对应的数据信息是否相同;
步骤三:当相同时,则不生成差异数据,当不相同时,生成差异数据;
需要说明的是,对抽调数据列和核验数据项中的数据信息进行排序时,是以按照客户信息的客户单位基本信息(依次如联系人姓名、联系人邮箱、联系人手机号、联系人固定电话等)进行排序的,因此能够快速的核对出与客户信息不一致的基本信息,从而将其判定为差异数据,如存在客户信息的基本信息中姓名不一致,姓名不一致可包括:姓名中存在相同的汉字字符,但也存在不同的汉字字符,例如张兵(客户的姓名)和张乒(填报的姓名信息,下文与之同理)、李兵和李乒等,以此就确定兵为差异数据。
根据上述:
S4、当存在异常的差异数据时,提取差异数据并生成判别队列集,基于同项特征点算法对判别队列集中的差异数据进行分析,判定是否存在相同的异常项,其中,基于同项特征点算法的算法步骤如下:
步骤一:确定抽调数据列和核验数据项中所对应的差异数据;
步骤二:提取差异数据中的相同字符特征点,基于相同字符特征点确定异常项;
步骤三:根据所确定的异常项生成异常项集合,以此通过此处的同项特征点算法对上述客户信息的基本信息(差异数据)进行判别,以此就可在差异数据中确定异常项,异常项是指,如抽调数据列中的为张兵,RPA系统填报的为张乒,抽调数据列为李兵,RPA系统填报的为李乒,因此,确定兵为异常项,需要说明的是,因本方案所选取的抽调数据列内含有多个抽调数据,通过同项特征点算法比对后,能够在多个差异数据中确定多个异常项,例如兵、张等,以此生成异常项集合。
S5、当存在相同的异常项时,使异常项集合输入至RPA系统填报的数据信息中,以此确定与异常项集合内异常项对应填报的数据项及其对应的表格页,并将此数据项及表格页标记为二次核验数据项,依据二次核验数据项在数据填报集内确定与之对应的抽调数据,并形成二次抽调数据列,以二次核验数据项与二次抽调数据列进行校验核对,以对差异数据进行矫正;具体是,通过异常项集合输入至RPA系统填报的数据信息,确定其向登记系统中所填报有关于异常项集合内数据字符的数据项及其对应的表格页,如刘兵、徐兵等以及所在的表格页,并将此数据项及其对应的表格页均标记为二次核验数据项,依据二次核验数据项在数据填报集内确定与之对应的抽调数据,是指确定涵盖数据项的Excel表格(如整体的Excel表格),并形成二次抽调数据列,以二次核验数据项与二次抽调数据列进行整体的校验核对,以便于对差异数据进行矫正,从而使本系统在对登记系统进行数据填报时,对客户信息调查表具有准确的填报。
实施例2,在本实施例中,当异常项确定时,判定RPA系统填报中此类异常项是否分布于不同的表格页(是指RPA系统填报数据信息的表格页)中,如多个异常项处于相同的表格页,其他的异常项又分布在相同的表格页中,确定同一表格页中存在异常项最多的表格页,并确定该表格页异常项之间是否存在正确的数据项,是指:
如表格页的1列和5列之间,其3列、4列的位置中存在异常的数据项,如上述中的李乒,其中,1列和5列上均存在正确的数据项,正确的数据项如李兵时,以表格页中的1列和5列之间的区域数据信息设定为核查范围,以在上述所确定的二次抽调数据列的Excel表格中限定所需要核验的客户数据信息,以此缩减对整体Excel表格进行核验的情况,同时大幅提升核验效率。
实施例3,在本实施例中,给出从数据填报集内提取抽调数据并将其标记为抽调数据列的确定方法:
需要说明的是,对于客户信息调查表来说,其中的客户单位基本信息还可以包括客户的年龄信息,性别信息,具体住址信息,家庭情况信息、财务状况信息、业务状况信息、信用状况信息、消费行为信息等,并结合上述中的客户单位基本信息、代理单位基本信息、第三方单位基本信息、申请陈述意见、物质基本信息、反应状态基本信息的数据信息均分别标记为一个特征库;
按照相同特征点(如:在客户单位基本信息中,客户的年龄相同,详细地址相同,对于详细地址来说,录入该办公楼栋名称)来对多个特征库进行分析,并按照相同特征点的数量对特征库内的数据信息进行序列,数据信息按照相同特征点的数量由多至少生成等级序列表,其中:
当数据信息相同特征点的数量增多时,抽调数据的抽调量减少,反之,则增加;
根据等级序列表(对于等级序列表所限定抽调数据的抽调量的来说,在本方案中,不针对相同特征点的数量增多或减少导致抽调量的增加和减少做出具体的限定,但示例性的给出:如当相同特征点的数量为3(较多)时,抽调数据可为1份,当相同特征点的数量为2(一般)时,抽调数据可为2份;相同特征点的数量为1(较少)时,抽调数据可为3份(此过程中,是指针对相同特征点的数据信息所设置的抽调数据的抽调量份数,对于存在没有相同特征点的数据信息时,同样可按照此方式进行设定抽调量份数),当数据信息的相同特征点的数量增加,通过减少对此类数据信息进行核验,能够加快对抽调数据的核验效率,同时能够确定抽调数据所存在的异常)以限定抽调数据的抽调量,即通过上述抽调数据的抽调量形成抽调数据列,因此:
通过确定抽调数据列在RPA系统中对应填报的数据项,并将此数据项标记为核验数据项,便可确定不同数据库下需要进行核验的核验数据项,能够以较大的覆盖范围对RPA系统中所填报的数据信息进行核验,同时因不会对RPA系统内所有填报的数据信息进行核验,以此在以较大的覆盖范围进行核验来提升核验精度时,也能够提升本方案中对RPA系统内数据信息的核验效率;
进而,在进行核验的过程中,若是相同特征点抽调数据列对应的抽调数据与核验数据项存在异常时,便可以第一个相同特征点抽调数据对应的核验数据项标记为差异数据,此时使后续剩余相同特征点抽调数据对应的核验数据项不再执行核验,以将其判定为差异数据,需对其进行矫正处置,从而实现上述中核验效率的提升;需要说明的是,此处的相同特征点抽调数据是针对于抽调数据列中的一个,因抽调数据列中预存了多个不同的相同特征点对应的抽调数据,因此,不影响其他类别相同特征点抽调数据与其对应的核验数据项进行核验,但值得说明的是,后续以其他类别相同特征点抽调数据与其对应的核验数据项进行核验与上述同理进行判定差异数据以及矫正。
但需要说明的是,在后续核验的过程中,对无相同特征点的抽调数据与核验数据项核验之间核验确定差异数据时,则需要一一核验及矫正。
实施例4,在本实施例中,当通过多个数据填报集分别对应向RPA系统填报数据信息时,便可确定上述实施例1-4所确定的差异数据,此时多个差异数据形成,通过将多个差异数据进行比对,以剔除重复的差异数据,此时并将剔除后的差异数据整合形成差异数据集(需要考虑的是,RPA系统在录入数据信息时,会受到汉字字符谐音的影响,导致数据存在差异的情况),通过差异数据集中的汉字字符进行谐音转换形成其他的差异汉字字符,在当前的汉字字符生成过后,需要以此中的差异汉字字符剔除之前所生成的差异数据,并重新生成差异数据集,便可在后续进行RPA系统填报后,通过当前所生成的差异数据集进行特征预测对照核对,从而再次提升对RPA系统内数据信息核验的效率。
最后,本发明还提供了一种数据推送系统,该系统根据上述中结合RPA和AI的数据推送方法实现。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种结合RPA和AI的数据推送方法,其特征在于:包括如下步骤:
S1、获取客户信息调查表,并对其进行整合形成报表提取数据集;
S2、通过RPA系统依据数据填报时间调用AI系统对报表提取数据集中的客户信息调查表进行识别并提取,并将所提取的数据信息生成JSON格式,当数据信息处于JSON格式时,通过RPA系统将其整合形成数据填报集,确定填报对象并通过数据填报集执行数据填报作业;
S3、通过在数据填报集内形成抽调数据并将其标记为抽调数据列,其中,根据客户信息调查表中的数据信息确定本次抽调数据列中抽调数据的抽调量;
通过在RPA系统中确定与抽调数据列对应填报的数据项,并以抽调数据列进行核验,以判定是否存在异常的差异数据;
S4、当存在异常的差异数据时,提取差异数据并生成判别队列集,基于同项特征点算法对判别队列集中的差异数据进行分析,判定是否存在相同的异常项;
S5、当存在相同的异常项时,基于该异常项重新于RPA系统填报的数据信息中确定与异常项对应填报的数据项并将其标记为二次核验数据项,随之确定与之对应的二次抽调数据列,并以此重新进行校验核对,以对差异数据进行矫正。
2.根据权利要求1所述的结合RPA和AI的数据推送方法,其特征在于:所述客户信息调查表包括:
客户单位基本信息、代理单位基本信息、第三方单位基本信息、申请陈述意见、物质基本信息、反应状态基本信息。
3.根据权利要求1所述的结合RPA和AI的数据推送方法,其特征在于:所述RPA系统通过影刀、Uibot、GE-Worker或BluePrism对数据填报集执行数据填报作业。
4.根据权利要求1所述的结合RPA和AI的数据推送方法,其特征在于:所述AI系统通过AI生成式大模型对报表提取数据集中的客户信息调查表进行识别并提取,并将所提取的数据信息生成JSON格式。
5.根据权利要求1所述的结合RPA和AI的数据推送方法,其特征在于:所述S3中,在数据填报集填报完成时,在数据填报集内形成抽调数据,并将抽调数据标记为抽调数据列,通过在RPA系统中确定与抽调数据列对应填报的数据项,并将此数据项标记为核验数据项,使抽调数据列与核验数据项进行校验核对,以判定是否存在异常的差异数据。
6.根据权利要求1所述的结合RPA和AI的数据推送方法,其特征在于:所述S3中,抽调数据列与核验数据项进行校验核对通过排序算法进行实现,其中,排序算法的算法步骤如下:
步骤一:对抽调数据列和核验数据项中的数据信息进行排序;
步骤二:遍历排序后的抽调数据列和核验数据项,比较对应的数据信息是否相同;
步骤三:当相同时,则不生成差异数据,当不相同时,生成差异数据。
7.根据权利要求1所述的结合RPA和AI的数据推送方法,其特征在于:所述S4中,基于同项特征点算法对判别队列集中的差异数据进行分析,以判定是否存在相同的异常项,其中,基于同项特征点算法的算法步骤如下:
步骤一:确定抽调数据列和核验数据项中所对应的差异数据;
步骤二:提取差异数据中的相同字符特征点,基于相同字符特征点确定异常项;
步骤三:根据所确定的异常项生成异常项集合。
8.根据权利要求7所述的结合RPA和AI的数据推送方法,其特征在于:当异常项集合生成时,使所述异常项集合输入至RPA系统填报的数据信息中,以此确定与异常项集合内异常项对应填报的数据项,并将此数据项标记为二次核验数据项,依据二次核验数据项在数据填报集内确定与之对应的抽调数据,并形成二次抽调数据列,以二次核验数据项与二次抽调数据列进行校验核对,以对差异数据进行矫正。
9.根据权利要求1所述的结合RPA和AI的数据推送方法,其特征在于:通过在数据填报集内形成抽调数据并将其标记为抽调数据列,其中,抽调数据列的确定方法如下:
步骤一:将客户信息调查表中的数据信息分别标记为一个特征库;
步骤二:按照相同特征点对多个特征库进行分析,并按照相同特征点的数量对特征库内的数据信息进行序列,数据信息按照相同特征点的数量由多至少生成等级序列表,其中:
当数据信息相同特征点的数量增多时,抽调数据的抽调量减少,反之,则增加;
步骤三:根据等级序列表以限定抽调数据的抽调量,并通过抽调数据的抽调量形成抽调数据列。
10.一种数据推送系统,该系统根据权利要求1所述的结合RPA和AI的数据推送方法实现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410001636.1A CN117494702B (zh) | 2024-01-02 | 2024-01-02 | 一种结合rpa和ai的数据推送方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410001636.1A CN117494702B (zh) | 2024-01-02 | 2024-01-02 | 一种结合rpa和ai的数据推送方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117494702A true CN117494702A (zh) | 2024-02-02 |
CN117494702B CN117494702B (zh) | 2024-04-02 |
Family
ID=89683314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410001636.1A Active CN117494702B (zh) | 2024-01-02 | 2024-01-02 | 一种结合rpa和ai的数据推送方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117494702B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011142A (zh) * | 2021-03-11 | 2021-06-22 | 南京信息职业技术学院 | 一种基于RPA的Excel文档智能填报系统及其方法 |
CN113011143A (zh) * | 2021-03-11 | 2021-06-22 | 南京信息职业技术学院 | 一种基于RPA的Word文档智能填报系统及其方法 |
CN113657096A (zh) * | 2021-08-24 | 2021-11-16 | 北京来也网络科技有限公司 | 基于rpa和ai的异常业务数据处理方法、装置、设备及介质 |
CN114448693A (zh) * | 2022-01-24 | 2022-05-06 | 来也科技(北京)有限公司 | 结合rpa和ai的安全控制方法、装置、电子设备和介质 |
CN114744769A (zh) * | 2022-05-18 | 2022-07-12 | 国网智能电网研究院有限公司 | 一种电网调度系统业务处理方法及系统 |
US20220318929A1 (en) * | 2021-03-31 | 2022-10-06 | Blackspark Corporation | System and Method for Automated Electronic Tax Preparation and Filing |
CN115576950A (zh) * | 2022-10-31 | 2023-01-06 | 南京熊猫电子股份有限公司 | 一种基于json配置文件的报表生成方法 |
CN115936593A (zh) * | 2021-09-30 | 2023-04-07 | 智慧财税研究院(广东)股份有限公司 | 一种结合rpa自动化机器人对企业工商年审数据处理方法 |
CN116150199A (zh) * | 2022-11-15 | 2023-05-23 | 广东烟草广州市有限公司 | 一种基于rpa机器人的数据核对方法和系统 |
CN117078180A (zh) * | 2023-07-04 | 2023-11-17 | 国网江苏省电力有限公司物资分公司 | 一种基于rpa及ai技术的合同管理系统及方法 |
US20230385085A1 (en) * | 2020-10-14 | 2023-11-30 | UiPath, Inc. | Determining sequences of interactions, process extraction, and robot generation using generative artificial intelligence / machine learning models |
CN117171694A (zh) * | 2023-11-02 | 2023-12-05 | 北京龙德缘电力科技发展有限公司 | 一种基于ai技术的配电场景安全识别系统 |
CN117235062A (zh) * | 2023-11-10 | 2023-12-15 | 广州汇通国信科技有限公司 | 基于数据中台的业务系统数据建模方法 |
-
2024
- 2024-01-02 CN CN202410001636.1A patent/CN117494702B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230385085A1 (en) * | 2020-10-14 | 2023-11-30 | UiPath, Inc. | Determining sequences of interactions, process extraction, and robot generation using generative artificial intelligence / machine learning models |
CN113011143A (zh) * | 2021-03-11 | 2021-06-22 | 南京信息职业技术学院 | 一种基于RPA的Word文档智能填报系统及其方法 |
CN113011142A (zh) * | 2021-03-11 | 2021-06-22 | 南京信息职业技术学院 | 一种基于RPA的Excel文档智能填报系统及其方法 |
US20220318929A1 (en) * | 2021-03-31 | 2022-10-06 | Blackspark Corporation | System and Method for Automated Electronic Tax Preparation and Filing |
CN113657096A (zh) * | 2021-08-24 | 2021-11-16 | 北京来也网络科技有限公司 | 基于rpa和ai的异常业务数据处理方法、装置、设备及介质 |
CN115936593A (zh) * | 2021-09-30 | 2023-04-07 | 智慧财税研究院(广东)股份有限公司 | 一种结合rpa自动化机器人对企业工商年审数据处理方法 |
CN114448693A (zh) * | 2022-01-24 | 2022-05-06 | 来也科技(北京)有限公司 | 结合rpa和ai的安全控制方法、装置、电子设备和介质 |
CN114744769A (zh) * | 2022-05-18 | 2022-07-12 | 国网智能电网研究院有限公司 | 一种电网调度系统业务处理方法及系统 |
CN115576950A (zh) * | 2022-10-31 | 2023-01-06 | 南京熊猫电子股份有限公司 | 一种基于json配置文件的报表生成方法 |
CN116150199A (zh) * | 2022-11-15 | 2023-05-23 | 广东烟草广州市有限公司 | 一种基于rpa机器人的数据核对方法和系统 |
CN117078180A (zh) * | 2023-07-04 | 2023-11-17 | 国网江苏省电力有限公司物资分公司 | 一种基于rpa及ai技术的合同管理系统及方法 |
CN117171694A (zh) * | 2023-11-02 | 2023-12-05 | 北京龙德缘电力科技发展有限公司 | 一种基于ai技术的配电场景安全识别系统 |
CN117235062A (zh) * | 2023-11-10 | 2023-12-15 | 广州汇通国信科技有限公司 | 基于数据中台的业务系统数据建模方法 |
Non-Patent Citations (2)
Title |
---|
MOHAMMED SHIJAS THEKKETHIL: "Robotic_Process_Automation_in_Banking_and_Finance_Sector_for_Loan_Processing_and_Fraud_Detection", 《2021 9TH INTERNATIONAL CONFERENCE ON RELIABILITY, INFOCOM TECHNOLOGIES AND OPTIMIZATION (TRENDS AND FUTURE DIRECTIONS) (ICRITO)》, 15 November 2021 (2021-11-15), pages 1 - 6 * |
陈栋;陈钦;: "RPA条件下的中建财务一体化账表核对流程优化", 国际商务财会, no. 07, 15 July 2020 (2020-07-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117494702B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108156237B (zh) | 产品信息推送方法、装置、存储介质和计算机设备 | |
US10657530B2 (en) | Automated transactions clearing system and method | |
CN108628748B (zh) | 自动化测试管理方法和自动化测试管理系统 | |
CN111553779A (zh) | 中标候选人排序方法、装置、招标终端及存储介质 | |
US8666849B2 (en) | Computer implemented method for bill analysis over the internet | |
CN115409395B (zh) | 一种水利施工工程的质量验收检查方法及系统 | |
CN110020550B (zh) | 核对平台的评估方法、装置及设备 | |
CN114281784A (zh) | 分布式核心系统的交易日志回放方法、装置、设备和介质 | |
EP3764310A1 (en) | Prediction task assistance device and prediction task assistance method | |
CN117494702B (zh) | 一种结合rpa和ai的数据推送方法及系统 | |
CN109324963B (zh) | 自动测试收益结果的方法及终端设备 | |
CN114581219A (zh) | 一种反电信网络诈骗预警方法及系统 | |
CN110502675B (zh) | 基于数据分析的语音拨叫用户分类方法及相关设备 | |
CN113190562A (zh) | 一种报表生成方法、装置及电子设备 | |
CN113128188A (zh) | 一种银行工资表生成方法、装置和介质 | |
CN114327377B (zh) | 需求跟踪矩阵生成方法、装置、计算机设备及存储介质 | |
CN111507397A (zh) | 一种异常数据的分析方法及装置 | |
CN116860909B (zh) | 基于生化知识图谱的数据存储方法、系统及存储介质 | |
LU501931B1 (en) | Data exception analysis method and device | |
CN111708580B (zh) | 一种配置软件静态数据的处理方法及系统 | |
CN115203057B (zh) | 低代码测试自动化方法、装置、设备及存储介质 | |
CN112347095B (zh) | 数据表的处理方法、装置和服务器 | |
CN117421191A (zh) | 一种智能问答压测方法、装置、设备及介质 | |
CN117764621A (zh) | 客户筛选方法、装置、电子设备和存储介质 | |
CN115248778A (zh) | 一种代码检验方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |