CN114186019A - 结合rpa和ai的企业项目的审核方法及装置 - Google Patents

结合rpa和ai的企业项目的审核方法及装置 Download PDF

Info

Publication number
CN114186019A
CN114186019A CN202111296008.3A CN202111296008A CN114186019A CN 114186019 A CN114186019 A CN 114186019A CN 202111296008 A CN202111296008 A CN 202111296008A CN 114186019 A CN114186019 A CN 114186019A
Authority
CN
China
Prior art keywords
text information
enterprise
target text
auditing
audited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111296008.3A
Other languages
English (en)
Inventor
李飞
汪冠春
胡一川
褚瑞
李玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Original Assignee
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Laiye Network Technology Co Ltd, Laiye Technology Beijing Co Ltd filed Critical Beijing Laiye Network Technology Co Ltd
Priority to CN202111296008.3A priority Critical patent/CN114186019A/zh
Publication of CN114186019A publication Critical patent/CN114186019A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种结合RPA和AI的企业项目的审核方法及装置。其中,该审核方法包括:RPA系统获取待审核企业项目;RPA系统对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息;RPA系统基于自然语言处理NLP从文本信息中抽取目标文本信息;RPA系统基于目标文本信息生成待审核企业项目的审核结果。由此,RPA系统可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,基于自然语言处理从文本信息中抽取目标文本信息,并基于目标文本信息生成待审核企业项目的审核结果,RPA系统可实现待审核企业项目的目标文本信息的自动审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。

Description

结合RPA和AI的企业项目的审核方法及装置
技术领域
本申请涉及机器人流程自动化(Robotic Process Automation,RPA)、AI(Artificial Intelligence,人工智能)技术领域,特别涉及一种结合RPA和AI的企业项目的审核方法、装置、设备及介质。
背景技术
机器人流程自动化(Robotic Process Automation,RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
目前,RPA和AI技术具有自动化程度高、精确度高、成本低的优点,得到了广泛的应用。
相关技术中,企业项目审核完全依靠人工进行,工作人员需要将企业提交的项目文件与国家产业政策文件和投资政策文件进行比对,需要比对的内容较多,比如,《产业结构调查指导目录》中规定了109条限制类项目的内容,以及399条淘汰类项目的内容,工作人员需要在《产业结构调查指导目录》中逐条查看是否存在项目文件包含的内容,工作人员的审核工作量较大,整个审核过程耗时较多,审核效率较低。
发明内容
本申请旨在至少在一定程度上解决上述技术中的技术问题之一。
为此,本申请的一个目的在于提出一种结合RPA和AI的企业项目的审核方法,RPA系统可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并基于目标文本信息生成待审核企业项目的审核结果。由此,RPA系统可实现待审核企业项目的目标文本信息的自动审核,相较于相关技术中完全依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率。
本申请的第二个目的在于提出一种结合RPA和AI的企业项目的审核装置。
本申请的第三个目的在于提出一种电子设备。
本申请的第四个目的在于提出一种计算机可读存储介质。
为达到上述目的,本申请第一方面实施例提出了一种结合RPA和AI的企业项目的审核方法,包括:RPA系统获取待审核企业项目;所述RPA系统对所述待审核企业项目进行文本识别,得到所述待审核企业项目携带的文本信息;所述RPA系统基于自然语言处理NLP从所述文本信息中抽取目标文本信息;所述RPA系统基于所述目标文本信息生成所述待审核企业项目的审核结果。
根据本申请实施例的结合RPA和AI的企业项目的审核方法,RPA系统可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并基于目标文本信息生成待审核企业项目的审核结果。由此,RPA系统可实现待审核企业项目的目标文本信息的自动审核,相较于相关技术中完全依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
另外,根据本申请上述实施例提出的结合RPA和AI的企业项目的审核方法还可以具有如下附加的技术特征:
在本申请的一个实施例中,所述基于自然语言处理NLP从所述文本信息中抽取目标文本信息,包括:所述RPA系统获取所述目标文本信息对应的目标定位字段;所述RPA系统从所述文本信息中确定所述目标定位字段对应的抽取区域;所述RPA系统在所述抽取区域内进行信息抽取,得到所述目标文本信息。
在本申请的一个实施例中,所述基于所述目标文本信息生成所述待审核企业项目的审核结果,包括:所述RPA系统获取预设的参考词库和/或参考表达式,其中,所述参考词库包括至少一个参考词;所述RPA系统获取所述目标文本信息与所述参考词之间的相似度,并获取所述相似度大于第一预设阈值的第一目标文本信息,和/或获取与所述参考表达式匹配的第二目标文本信息;所述RPA系统识别所述第一目标文本信息和/或所述第二目标文本信息的数量大于或者等于第二预设阈值,生成所述待审核企业项目的所述审核结果为审核未通过。
在本申请的一个实施例中,所述方法还包括:所述RPA系统识别所述第一目标文本信息和/或所述第二目标文本信息的数量小于所述第二预设阈值,生成所述待审核企业项目的所述审核结果为审核通过。在本申请的一个实施例中,所述生成所述待审核企业项目的所述审核结果为审核未通过之后,还包括::所述RPA系统将所述第一目标文本信息和/或所述第二目标文本信息确定为所述审核结果对应的反馈信息;所述RPA系统将所述审核结果及其对应的所述反馈信息录入审核平台。
在本申请的一个实施例中,所述基于所述目标文本信息生成所述待审核企业项目的审核结果,包括:所述RPA系统将所述目标文本信息输入至预先训练好的审核模型,由所述审核模型输出所述待审核企业项目的所述审核结果。
在本申请的一个实施例中,所述获取待审核企业项目,包括:所述RPA系统打开审核平台;所述RPA系统使用第一账号登录所述审核平台;所述RPA系统从所述审核平台的待审核列表中获取所述待审核企业项目。在本申请的一个实施例中,所述生成所述待审核企业项目的审核结果之后,还包括:所述RPA系统将所述审核结果录入所述审核平台,并将所述待审核企业项目从所述待审核列表中删除。
为达到上述目的,本申请第二方面实施例提出了一种结合RPA和AI的企业项目的审核装置,包括:获取模块,用于获取待审核企业项目;识别模块,用于对所述待审核企业项目进行文本识别,得到所述待审核企业项目携带的文本信息;抽取模块,用于基于自然语言处理NLP从所述文本信息中抽取目标文本信息;生成模块,用于基于所述目标文本信息生成所述待审核企业项目的审核结果。
本申请实施例的结合RPA和AI的企业项目的审核装置,可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并基于目标文本信息生成待审核企业项目的审核结果。由此,可实现待审核企业项目的目标文本信息的自动审核,相较于相关技术中完全依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
另外,根据本申请上述实施例提出的结合RPA和AI的企业项目的审核装置还可以具有如下附加的技术特征:
在本申请的一个实施例中,所述抽取模块,还用于:获取所述目标文本信息对应的目标定位字段;从所述文本信息中确定所述目标定位字段对应的抽取区域;在所述抽取区域内进行信息抽取,得到所述目标文本信息。在本申请的一个实施例中,所述生成模块,还用于:获取预设的参考词库和/或参考表达式,其中,所述参考词库包括至少一个参考词;获取所述目标文本信息与所述参考词之间的相似度,并获取所述相似度大于第一预设阈值的第一目标文本信息,和/或获取与所述参考表达式匹配的第二目标文本信息;识别所述第一目标文本信息和/或所述第二目标文本信息的数量大于或者等于第二预设阈值,生成所述待审核企业项目的所述审核结果为审核未通过。
在本申请的一个实施例中,所述生成模块,还用于:识别所述第一目标文本信息和/或所述第二目标文本信息的数量小于所述第二预设阈值,生成所述待审核企业项目的所述审核结果为审核通过。
在本申请的一个实施例中,所述装置还包括:第一录入模块,所述第一录入模块,用于:将所述第一目标文本信息和/或所述第二目标文本信息确定为所述审核结果对应的反馈信息;将所述审核结果及其对应的所述反馈信息录入审核平台。
在本申请的一个实施例中,所述生成模块,还用于:将所述目标文本信息输入至预先训练好的审核模型,由所述审核模型输出所述待审核企业项目的所述审核结果。
在本申请的一个实施例中,所述获取模块,还用于:打开审核平台;使用第一账号登录所述审核平台;从所述审核平台的待审核列表中获取所述待审核企业项目。
在本申请的一个实施例中,所述装置还包括:第二录入模块,所述第二录入模块,用于:将所述审核结果录入所述审核平台,并将所述待审核企业项目从所述待审核列表中删除。
为达到上述目的,本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请第一方面实施例所述的结合RPA和AI的企业项目的审核方法。
本申请实施例的电子设备,通过处理器执行存储在存储器上的指令,可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并基于目标文本信息生成待审核企业项目的审核结果。由此,可实现待审核企业项目的目标文本信息的自动审核,相较于相关技术中完全依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
为达到上述目的,本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请第一方面实施例所述的结合RPA和AI的企业项目的审核方法。
本申请实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并基于目标文本信息生成待审核企业项目的审核结果。由此,可实现待审核企业项目的目标文本信息的自动审核,相较于相关技术中完全依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请一个实施例的结合RPA和AI的企业项目的审核方法的流程示意图;
图2为根据本申请一个实施例的结合RPA和AI的企业项目的审核方法中抽取目标文本信息的流程示意图;
图3为根据本申请一个实施例的结合RPA和AI的企业项目的审核方法中生成审核结果的流程示意图;
图4为根据本申请一个实施例的结合RPA和AI的企业项目的审核装置的框图;
图5为根据本申请一个实施例的电子设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
为了便于理解,首先介绍本申请涉及的术语。
在本申请的描述中,术语“多个”指两个或两个以上。
在本申请的描述中,术语“目标文本信息”指从待审核企业项目携带的文本信息中抽取出的文本信息,用于得到待审核企业项目的审核结果,比如,目标文本信息包括但不限于项目名称、项目内容、项目规模、采用的技术方案等。
在本申请的描述中,术语“审核结果”指对待审核企业项目进行审核后的结果,比如,审核结果包括但不限于审核通过、审核不通过、待审核企业项目的类别等。
在本申请的描述中,术语“字段”指与对象或类关联的变量,在数据库中,一般表的列称为字段,每个字段包含某一专题的信息。例如,通讯录数据库中,通常具有“姓名”字段和“联系电话”字段。
在本申请的描述中,术语“目标定位字段”指目标文本信息对应的字段,用于从待审核企业项目的文本信息中定位目标文本信息。比如,目标文本信息为项目名称时,对应的目标定位字段可包括名称、标题等。
在本申请的描述中,术语“抽取区域”指目标文本信息在待审核企业项目的文本信息中的区域,用于从文本信息中抽取出目标文本信息。抽取区域可包括文本信息中的第xx行第xx列至第xx行第xx列,或者第xx段至xx段。
在本申请的描述中,术语“参考词库”指包含大量参考词的词库,用于结合目标文本信息得到待审核企业项目的审核结果。比如,参考词库可包括“钠法百草枯生产工艺”、“敌百虫碱法敌敌畏生产工艺”等参考词。
在本申请的描述中,术语“参考词”指目标文本信息的参考词,用于结合目标文本信息得到待审核企业项目的审核结果。比如,参考词可包括“钠法百草枯生产工艺”、“敌百虫碱法敌敌畏生产工艺”等。
在本申请的描述中,术语“表达式”指由数字、算符、数字分组符号(括号)、自由变量和约束变量等以能求得数值的有意义排列方法所得的组合。约束变量在表达式中已被指定数值,自由变量则可以在表达式之外另行指定数值。
在本申请的描述中,术语“参考表达式”指目标文本信息的参考表达式,用于结合目标文本信息得到待审核企业项目的审核结果。比如,参考表达式可包括“氢氧化钾≤1万吨/年”等。
下面结合附图来描述本申请实施例的结合RPA和AI的企业项目的审核方法、装置、电子设备和计算机可读存储介质。
图1为根据本申请一个实施例的结合RPA和AI的企业项目的审核方法的流程示意图。
如图1所示,本申请实施例的结合RPA和AI的企业项目的审核方法,包括:
S101,RPA系统获取待审核企业项目。
需要说明的是,本申请实施例的结合RPA和AI的企业项目的审核方法的执行主体可为机器人流程自动化(Robotic Process Automation,RPA)系统,还可为本申请实施例的结合RPA和AI的企业项目的审核装置,上述RPA系统和/或结合RPA和AI的企业项目的审核装置可以配置在任意电子设备中,以执行本申请实施例的结合RPA和AI的企业项目的审核方法。可选的,上述RPA系统可包括RPA机器人。
需要说明的是,本申请的实施例中,对待审核企业项目的类型、格式等均不做过多限定,例如,待审核企业项目的类型包括但不限于项目文件、文章等,待审核企业项目的格式包括但不限于图片、文档等。
在一种实施方式中,获取待审核企业项目,可包括RPA系统打开审核平台,RPA系统使用第一账号登录审核平台,RPA系统从审核平台的待审核列表中获取待审核企业项目。其中,审核平台包括但不限于网站、应用程序(Application,APP)等,这里不做过多限定。其中,第一账号为RPA系统登录审核平台的登录账号,可根据实际情况进行设置,这里不做过多限定。
可以理解的是,用户可在审核平台的待审核列表中录入待审核企业项目,相应的,RPA系统可打开并使用第一账号登录审核平台,从审核平台的待审核列表中获取待审核企业项目。例如,RPA系统可打开并使用第一账号登录项目审核网站,从项目审核网站的待审核列表中获取项目文件;或者,RPA系统可打开并使用第一账号登录文章网站,从文章网站的待审核列表中获取文章。由此,该方法中RPA系统可自动打开并登录审核平台,并自动从审核平台的待审核列表中获取待审核企业项目,可实现待审核企业项目的自动获取。
S102,RPA系统对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息。
本申请的实施例中,RPA系统可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息。可以理解的是,不同类型的待审核企业项目可携带不同类型的文本信息。
在一种实施方式中,对待审核企业项目进行文本识别,可包括RPA系统对待审核企业项目进行光学字符识别(Optical Character Recognition,OCR)。
S103,RPA系统基于自然语言处理NLP从文本信息中抽取目标文本信息。
本申请的实施例中,RPA系统可基于自然语言处理(Natural LanguageProcessing,NLP)从文本信息中抽取目标文本信息。
可以理解的是,文本信息包括目标文本信息,目标文本信息指的是用户想要抽取的文本信息。例如,待提取对象为项目文件时,目标文本信息包括但不限于项目名称、项目内容、项目规模、采用的技术方案等;或者,目标对象为文章时,目标文本信息包括但不限于标题、摘要、关键词、作者等。
在一种实施方式中,RPA系统可将文本信息输入至基于NLP的抽取模型,其中,抽取模型用于从文本信息中抽取目标文本信息。应说明的是,抽取模型可根据实际情况进行设置,这里不做过多限定。由此,该方法中RPA系统可自动将文本信息输入至抽取模型,通过抽取模型来实现目标文本信息的自动抽取。
在一种实施方式中,可获取样本文本信息及其对应的样本目标文本信息,并利用样本文本信息及其对应的样本目标文本信息,对候选抽取模型进行训练,以生成抽取模型。例如,可将样本文本信息输入至候选抽取模型,候选抽取模型从样本文本信息中抽取预测目标文本信息,并利用预测目标文本信息和样本目标文本信息的误差调整候选抽取模型的参数,直至达到模型训练结束条件,以生成抽取模型。其中,模型训练结束条件可根据实际情况进行设置,这里不做过多限定。
S104,RPA系统基于目标文本信息生成待审核企业项目的审核结果。
本申请的实施例中,RPA系统可基于目标文本信息生成待审核企业项目的审核结果。需要说明的是,审核结果指的是对待审核企业项目进行审核后的结果,包括但不限于审核通过、审核不通过、待审核企业项目的类别等,这里不做过多限定。
在一种实施方式中,项目审核应用场景中,待审核企业项目包括项目文档,审核结果可包括审核通过、审核不通过、项目文档的类别。
例如,目标文本信息包括“敌百虫碱法敌敌畏生产工艺”,则可识别审核结果为审核不通过,且项目文档的类别为淘汰类项目文档。
例如,目标文本信息包括“1万吨/年以下氢氧化钾”,则可识别审核结果为审核不通过,且项目文档的类别为淘汰类项目文档。
在一种实施方式中,基于目标文本信息生成待审核企业项目的审核结果之后,还包括RPA系统将审核结果录入审核平台,并将待审核企业项目从待审核列表中删除。由此,该方法中RPA系统可在生成待审核企业项目的审核结果之后,自动将审核结果录入审核平台中,可实现审核结果的自动录入,并可将待审核企业项目从待审核列表中删除,以及时更新待审核列表。
综上,根据本申请实施例的结合RPA和AI的企业项目的审核方法,RPA系统可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,基于目标文本信息生成待审核企业项目的审核结果。由此,可实现待审核企业项目的自动审核,相较于相关技术中完全依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
在上述任一实施例的基础上,如图2所示,步骤S103中基于自然语言处理NLP从文本信息中抽取目标文本信息,可包括:
S201,RPA系统获取目标文本信息对应的目标定位字段。
本申请的实施例中,RPA系统可基于目标文本信息获取对应的目标定位字段。需要说明的是,目标定位字段可根据实际情况进行设置,这里不做过多限定。
例如,目标文本信息为项目名称时,对应的目标定位字段可包括名称、标题等,目标文本信息为项目内容时,对应的目标定位字段可包括简介、大纲、介绍等,目标文本信息为项目规模时,对应的目标定位字段可包括范围、区间、大小等,目标文本信息为技术方案时,对应的目标定位字段可包括装置、材料、含量等。
S202,RPA系统从文本信息中确定目标定位字段对应的抽取区域。
本申请的实施例中,RPA系统可从文本信息中确定目标定位字段对应的抽取区域。可以理解的是,不同的目标定位字段可确定不同的抽取区域。
在一种实施方式中,从文本信息中确定目标定位字段对应的抽取区域,可包括获取目标定位字段在文本信息的定位位置,其中,定位位置包括目标定位字段的所处行和/或列的编号,并基于定位位置确定目标定位字段对应的抽取区域。
在一种实施方式中,基于定位位置确定目标定位字段对应的抽取区域,可包括将定位位置的周围区域确定为抽取区域,比如,可获取以定位位置为中心,按照预设值向外扩散形成的区域,作为抽取区域。应说明的是,预设值指的是抽取区域的面积,可根据实际情况进行设置,这里不做过多限定。对抽取区域的形状不做过多限定,例如,形状包括但不限于圆形、矩形等。
S203,RPA系统在抽取区域内进行信息抽取,得到目标文本信息。
本申请的实施例中,RPA系统可在抽取区域内进行信息抽取,得到对应的目标文本信息。
例如,目标文本信息为项目名称时,对应的目标定位字段可包括名称、标题等,则可确定名称对应的第一抽取区域,以及标题对应的第二抽取区域,在第一抽取区域、第二抽取区域内分别进行信息抽取,得到项目名称对应的目标文本信息。
例如,目标文本信息为项目内容时,对应的目标定位字段可包括简介、大纲、介绍等,则可确定简介对应的第三抽取区域,大纲对应的第四抽取区域,以及介绍对应的第五抽取区域,在第三抽取区域、第四抽取区域内分别进行信息抽取,得到项目内容对应的目标文本信息。
由此,该方法中RPA系统可获取目标文本信息对应的目标定位字段,并从文本信息中确定目标定位字段对应的抽取区域,并在抽取区域内进行信息抽取,来实现目标文本信息的自动抽取。
在上述任一实施例的基础上,如图3所示,步骤S104中基于目标文本信息生成待审核企业项目的审核结果,可包括:
S301,RPA系统获取预设的参考词库和/或参考表达式,其中,参考词库包括至少一个参考词。
本申请的实施例中,参考词库和/或参考表达式均可根据实际情况进行设置,并可预先设置在RPA系统的存储空间中。相应的,RPA系统可从自身的存储空间中获取预设的参考词库和/或参考表达式。
在一种实施方式中,参考词库可根据枚举方式或者正则方式来进行设置。例如,项目审核应用场景中,可基于项目审核相关的政策文件中关于淘汰类项目和限制类项目的内容,采用枚举方式或者正则方式来设置参考词库。比如,可采用枚举方式设置参考词“钠法百草枯生产工艺”、“敌百虫碱法敌敌畏生产工艺”,可采用正则方式设置参考词“单线产能0.3万吨/年以下氰化钠(100%氰化钠)”、“1万吨/年以下氢氧化钾”、“1.5万吨/年以下普通级白炭黑”。
在一种实施方式中,参考表达式包括正则表达式。
S302,RPA系统获取目标文本信息与参考词之间的相似度,并获取相似度大于第一预设阈值的第一目标文本信息,和/或获取与参考表达式匹配的第二目标文本信息。
本申请的实施例中,RPA系统可获取目标文本信息与参考词之间的相似度,并获取相似度大于第一预设阈值的第一目标文本信息,第一目标文本信息与参考词之间的相似度较高,和/或获取与参考表达式匹配的第二目标文本信息。应说明的是,第一预设阈值可根据实际情况进行设置,这里不做过多限定,例如可设置为80%。
在一种实施方式中,RPA系统获取目标文本信息与参考词之间的相似度,可包括RPA系统将目标文本信息和参考词输入至相似度模型,由相似度模型输出目标文本信息和参考词之间的相似度。应说明的是,相似度模型可根据实际情况进行设置,这里不做过多限定。
在一种实施方式中,RPA系统获取与参考表达式匹配的第二目标文本信息,可包括RPA系统识别第二目标文本信息是否符合参考表达式,若第二目标文本信息符合参考表达式,则可确定第二目标文本信息与参考表达式匹配。例如,参考表达式可为“氢氧化钾≤1万吨/年”,若第二目标文本信息为“1万吨/年以下氢氧化钾”,则可识别“1万吨/年以下氢氧化钾”符合“氢氧化钾≤1万吨/年”,可确定“1万吨/年以下氢氧化钾”与“氢氧化钾≤1万吨/年”匹配。
S303,RPA系统识别第一目标文本信息和/或第二目标文本信息的数量大于或者等于第二预设阈值,生成待审核企业项目的审核结果为审核未通过。
S304,RPA系统识别第一目标文本信息和/或第二目标文本信息的数量小于第二预设阈值,生成待审核企业项目的审核结果为审核通过。
本申请的实施例中,RPA系统可获取第一目标文本信息和/或第二目标文本信息的数量,并根据上述数量和第二预设阈值之间的大小关系,生成待审核企业项目的审核结果。应说明的是,第二预设阈值可根据实际情况进行设置,这里不做过多限定,例如可设置为1。
在一种实施方式中,RPA系统识别第一目标文本信息和/或第二目标文本信息的数量大于或者等于第二预设阈值,表明第一目标文本信息和/或第二目标文本信息的数量较多,则可生成待审核企业项目的审核结果为审核未通过。
在一种实施方式中,RPA系统识别第一目标文本信息和/或第二目标文本信息的数量小于第二预设阈值,表明第一目标文本信息和/或第二目标文本信息的数量较少,则可生成待审核企业项目的审核结果为审核通过。
在一种实施方式中,生成待审核企业项目的审核结果为审核未通过之后,还包括RPA系统将第一目标文本信息和/或第二目标文本信息确定为审核结果对应的反馈信息,并将审核结果及其对应的反馈信息录入审核平台。由此,该方法中RPA系统可在生成审核未通过的审核结果之后,自动将审核结果和反馈信息录入审核平台中,可实现审核结果和反馈信息的自动录入。
由此,该方法中RPA系统可基于参考词库和/或参考表达式,生成待审核企业项目的审核结果,可实现审核结果的自动获取,提高审核效率。
在上述任一实施例的基础上,步骤S104中基于目标文本信息生成待审核企业项目的审核结果,可包括RPA系统将目标文本信息输入至预先训练好的审核模型,由审核模型输出待审核企业项目的审核结果。应说明的是,审核模型可根据实际情况进行设置,这里不做过多限定。
在一种实施方式中,审核模型可获取预设的参考词库和/或参考表达式,并基于参考词库和/或参考表达式,以及目标文本信息获取待审核企业项目的审核结果。应说明的是,基于参考词库和/或参考表达式,以及目标文本信息获取待审核企业项目的审核结果的相关内容,可参见上述实施例,这里不再赘述。
由此,该方法中RPA系统可基于审核模型生成待审核企业项目的审核结果,可实现审核结果的自动获取,提高审核效率。
图4为根据本申请一个实施例的结合RPA和AI的企业项目的审核装置的框图。
如图4所示,本申请实施例的结合RPA和AI的企业项目的审核装置100,包括:获取模块110、识别模块120、抽取模块130和生成模块140。
获取模块110,用于获取待审核企业项目;
识别模块120,用于对所述待审核企业项目进行文本识别,得到所述待审核企业项目携带的文本信息;
抽取模块130,用于基于自然语言处理NLP从所述文本信息中抽取目标文本信息;
生成模块140,用于基于所述目标文本信息生成所述待审核企业项目的审核结果。
在本申请的一个实施例中,所述抽取模块130,还用于:获取所述目标文本信息对应的目标定位字段;从所述文本信息中确定所述目标定位字段对应的抽取区域;在所述抽取区域内进行信息抽取,得到所述目标文本信息。在本申请的一个实施例中,所述生成模块140,还用于:获取预设的参考词库和/或参考表达式,其中,所述参考词库包括至少一个参考词;获取所述目标文本信息与所述参考词之间的相似度,并获取所述相似度大于第一预设阈值的第一目标文本信息,和/或获取与所述参考表达式匹配的第二目标文本信息;识别所述第一目标文本信息和/或所述第二目标文本信息的数量大于或者等于第二预设阈值,生成所述待审核企业项目的所述审核结果为审核未通过。
在本申请的一个实施例中,所述生成模块140,还用于:识别所述第一目标文本信息和/或所述第二目标文本信息的数量小于所述第二预设阈值,生成所述待审核企业项目的所述审核结果为审核通过。
在本申请的一个实施例中,所述结合RPA和AI的企业项目的审核装置100还包括:第一录入模块,所述第一录入模块,用于:将所述第一目标文本信息和/或所述第二目标文本信息确定为所述审核结果对应的反馈信息;将所述审核结果及其对应的所述反馈信息录入审核平台。
在本申请的一个实施例中,所述生成模块140,还用于:将所述目标文本信息输入至预先训练好的审核模型,由所述审核模型输出所述待审核企业项目的所述审核结果。
在本申请的一个实施例中,所述获取模块110,还用于:打开审核平台;使用第一账号登录所述审核平台;从所述审核平台的待审核列表中获取所述待审核企业项目。
在本申请的一个实施例中,所述结合RPA和AI的企业项目的审核装置100还包括:第二录入模块,所述第二录入模块,用于:将所述审核结果录入所述审核平台,并将所述待审核企业项目从所述待审核列表中删除。
需要说明的是,本申请实施例的结合RPA和AI的企业项目的审核装置中未披露的细节,请参照本申请上述实施例中的结合RPA和AI的企业项目的审核方法所披露的细节,这里不再赘述。
综上,本申请实施例的结合RPA和AI的企业项目的审核装置,可对待审核企业项目进行文本识别,得到待审核企业项目携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并基于目标文本信息生成待审核企业项目的审核结果。由此,可实现待审核企业项目的目标文本信息的自动审核,相较于相关技术中完全依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
为了实现上述实施例,如图5所示,本申请还提出一种电子设备200,包括至少一个处理器210;以及与所述至少一个处理器210通信连接的存储器220;其中,所述存储器220存储有可被所述至少一个处理器210执行的指令,所述指令被所述至少一个处理器210执行,以使所述至少一个处理器210能够执行上述结合RPA和AI的企业项目的审核方法。
本申请实施例的电子设备,通过处理器执行存储在存储器上的指令,可对目标对象进行文本识别,得到目标对象携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并将目标文本审核信息管理系统。由此,可实现目标对象的目标文本信息的自动录入,相较于相关技术中大多依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
为了实现上述实施例,本申请还提出一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述结合RPA和AI的企业项目的审核方法。
本申请实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,可对目标对象进行文本识别,得到目标对象携带的文本信息,并基于自然语言处理从文本信息中抽取目标文本信息,并将目标文本审核信息管理系统。由此,可实现目标对象的目标文本信息的自动录入,相较于相关技术中大多依靠人工进行项目审核,节省了大量的人力物力,有助于提升项目审核的效率和准确性。
在本申请的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在本申请所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
另外,在本申请各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本申请的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本申请实施例公开的一种结合RPA和AI的企业项目的审核方法、训练方法、装置、设备及介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (15)

1.一种结合RPA和AI的企业项目的审核方法,其特征在于,由机器人流程自动化RPA系统执行,所述方法包括:
所述RPA系统获取待审核企业项目;
所述RPA系统对所述待审核企业项目进行文本识别,得到所述待审核企业项目携带的文本信息;
所述RPA系统基于自然语言处理NLP从所述文本信息中抽取目标文本信息;
所述RPA系统基于所述目标文本信息生成所述待审核企业项目的审核结果。
2.根据权利要求1所述的方法,其特征在于,所述基于自然语言处理NLP从所述文本信息中抽取目标文本信息,包括:
所述RPA系统获取所述目标文本信息对应的目标定位字段;
所述RPA系统从所述文本信息中确定所述目标定位字段对应的抽取区域;
所述RPA系统在所述抽取区域内进行信息抽取,得到所述目标文本信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本信息生成所述待审核企业项目的审核结果,包括:
所述RPA系统获取预设的参考词库和/或参考表达式,其中,所述参考词库包括至少一个参考词;
所述RPA系统获取所述目标文本信息与所述参考词之间的相似度,并获取所述相似度大于第一预设阈值的第一目标文本信息,和/或获取与所述参考表达式匹配的第二目标文本信息;
所述RPA系统识别所述第一目标文本信息和/或所述第二目标文本信息的数量大于或者等于第二预设阈值,生成所述待审核企业项目的所述审核结果为审核未通过。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述RPA系统识别所述第一目标文本信息和/或所述第二目标文本信息的数量小于所述第二预设阈值,生成所述待审核企业项目的所述审核结果为审核通过。
5.根据权利要求3所述的方法,其特征在于,所述生成所述待审核企业项目的所述审核结果为审核未通过之后,还包括:
所述RPA系统将所述第一目标文本信息和/或所述第二目标文本信息确定为所述审核结果对应的反馈信息;
所述RPA系统将所述审核结果及其对应的所述反馈信息录入审核平台。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本信息生成所述待审核企业项目的审核结果,包括:
所述RPA系统将所述目标文本信息输入至预先训练好的审核模型,由所述审核模型输出所述待审核企业项目的所述审核结果。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述获取待审核企业项目,包括:
所述RPA系统打开审核平台;
所述RPA系统使用第一账号登录所述审核平台;
所述RPA系统从所述审核平台的待审核列表中获取所述待审核企业项目。
8.根据权利要求7所述的方法,其特征在于,所述生成所述待审核企业项目的审核结果之后,还包括:
所述RPA系统将所述审核结果录入所述审核平台,并将所述待审核企业项目从所述待审核列表中删除。
9.一种结合RPA和AI的企业项目的审核装置,其特征在于,包括:
获取模块,用于获取待审核企业项目;
识别模块,用于对所述待审核企业项目进行文本识别,得到所述待审核企业项目携带的文本信息;
抽取模块,用于基于自然语言处理NLP从所述文本信息中抽取目标文本信息;
生成模块,用于基于所述目标文本信息生成所述待审核企业项目的审核结果。
10.根据权利要求9所述的装置,其特征在于,所述抽取模块,还用于:
获取所述目标文本信息对应的目标定位字段;
从所述文本信息中确定所述目标定位字段对应的抽取区域;
在所述抽取区域内进行信息抽取,得到所述目标文本信息。
11.根据权利要求9所述的装置,其特征在于,所述生成模块,还用于:
获取预设的参考词库和/或参考表达式,其中,所述参考词库包括至少一个参考词;
获取所述目标文本信息与所述参考词之间的相似度,并获取所述相似度大于第一预设阈值的第一目标文本信息,和/或获取与所述参考表达式匹配的第二目标文本信息;
识别所述第一目标文本信息和/或所述第二目标文本信息的数量大于或者等于第二预设阈值,生成所述待审核企业项目的所述审核结果为审核未通过。
12.根据权利要求11所述的装置,其特征在于,所述生成模块,还用于:
识别所述第一目标文本信息和/或所述第二目标文本信息的数量小于所述第二预设阈值,生成所述待审核企业项目的所述审核结果为审核通过。
13.根据权利要求11所述的装置,所述装置还包括:第一录入模块,所述第一录入模块,用于:
将所述第一目标文本信息和/或所述第二目标文本信息确定为所述审核结果对应的反馈信息;
将所述审核结果及其对应的所述反馈信息录入审核平台。
14.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8任一项所述的结合RPA和AI的企业项目的审核方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8任一项所述的结合RPA和AI的企业项目的审核方法。
CN202111296008.3A 2021-11-03 2021-11-03 结合rpa和ai的企业项目的审核方法及装置 Pending CN114186019A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111296008.3A CN114186019A (zh) 2021-11-03 2021-11-03 结合rpa和ai的企业项目的审核方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111296008.3A CN114186019A (zh) 2021-11-03 2021-11-03 结合rpa和ai的企业项目的审核方法及装置

Publications (1)

Publication Number Publication Date
CN114186019A true CN114186019A (zh) 2022-03-15

Family

ID=80540620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111296008.3A Pending CN114186019A (zh) 2021-11-03 2021-11-03 结合rpa和ai的企业项目的审核方法及装置

Country Status (1)

Country Link
CN (1) CN114186019A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114708582A (zh) * 2022-05-31 2022-07-05 国网浙江省电力有限公司 基于ai和rpa的电力数据智慧稽查方法及装置
CN115022385A (zh) * 2022-05-27 2022-09-06 来也科技(北京)有限公司 基于rpa和ai实现ia的对话式流程数据处理方法和装置
CN115271970A (zh) * 2022-09-28 2022-11-01 珠海金智维信息科技有限公司 一种用于证券业务的智能审核系统、方法和装置
CN116663525A (zh) * 2023-07-21 2023-08-29 科大讯飞股份有限公司 一种文档审核方法、装置、设备及存储介质
WO2024055862A1 (zh) * 2022-09-13 2024-03-21 北京来也网络科技有限公司 结合rpa和ai实现ia的文档审核方法、装置及电子设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022385A (zh) * 2022-05-27 2022-09-06 来也科技(北京)有限公司 基于rpa和ai实现ia的对话式流程数据处理方法和装置
CN114708582A (zh) * 2022-05-31 2022-07-05 国网浙江省电力有限公司 基于ai和rpa的电力数据智慧稽查方法及装置
CN114708582B (zh) * 2022-05-31 2022-08-26 国网浙江省电力有限公司 基于ai和rpa的电力数据智慧稽查方法及装置
WO2024055862A1 (zh) * 2022-09-13 2024-03-21 北京来也网络科技有限公司 结合rpa和ai实现ia的文档审核方法、装置及电子设备
CN115271970A (zh) * 2022-09-28 2022-11-01 珠海金智维信息科技有限公司 一种用于证券业务的智能审核系统、方法和装置
CN116663525A (zh) * 2023-07-21 2023-08-29 科大讯飞股份有限公司 一种文档审核方法、装置、设备及存储介质
CN116663525B (zh) * 2023-07-21 2023-12-01 科大讯飞股份有限公司 一种文档审核方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110765265B (zh) 信息分类抽取方法、装置、计算机设备和存储介质
CN114186019A (zh) 结合rpa和ai的企业项目的审核方法及装置
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
CN111325037B (zh) 文本意图识别方法、装置、计算机设备和存储介质
CN108345686B (zh) 一种基于搜索引擎技术的数据分析方法及系统
CN109471889B (zh) 报表加速方法、系统、计算机设备和存储介质
CN115328756A (zh) 一种测试用例生成方法、装置及设备
CN110765235A (zh) 训练数据的生成方法、装置、终端及可读介质
CN110674131A (zh) 财务报表数据处理方法、装置、计算机设备和存储介质
CN109146625B (zh) 一种基于内容的多版本App更新评价方法及系统
CN114238629A (zh) 一种基于自动提示推荐的语言处理方法、装置及终端
CN111190946A (zh) 报告生成方法、装置、计算机设备和存储介质
CN111178064B (zh) 基于字段分词处理的信息推送方法、装置和计算机设备
CN110781673B (zh) 文档验收方法、装置、计算机设备及存储介质
CN115168615A (zh) 结合数据可视化的知识图谱大数据处理方法及系统
US20200034724A1 (en) Risk analysis support device, risk analysis support method, and risk analysis support program
CN114610894A (zh) 一种基于篇章语境的多任务联合知识挖掘方法及装置
CN115858776B (zh) 一种变体文本分类识别方法、系统、存储介质和电子设备
CN109344385B (zh) 自然语言处理方法、装置、计算机设备和存储介质
WO2020057023A1 (zh) 自然语言的语义解析方法、装置、计算机设备和存储介质
CN105138513A (zh) 确定汉语词汇相似度的方法和装置
CN112363929B (zh) 系统上线方法、装置、计算机设备及存储介质
CN111460268B (zh) 数据库查询请求的确定方法、装置和计算机设备
CN113901793A (zh) 结合rpa和ai的事件抽取方法及装置
CN114661684A (zh) 基于条件随机场的日志报错信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination