CN115511441A - 结合rpa和ai实现ia的文档审核方法、装置及电子设备 - Google Patents
结合rpa和ai实现ia的文档审核方法、装置及电子设备 Download PDFInfo
- Publication number
- CN115511441A CN115511441A CN202211110169.3A CN202211110169A CN115511441A CN 115511441 A CN115511441 A CN 115511441A CN 202211110169 A CN202211110169 A CN 202211110169A CN 115511441 A CN115511441 A CN 115511441A
- Authority
- CN
- China
- Prior art keywords
- document
- audited
- auditing
- target
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种结合RPA和AI实现IA的文档审核方法、装置及电子设备,涉及机器人流程自动化RPA及人工智能AI技术领域,方法包括:获取目标业务事项对应的至少一个待审核文档;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题;在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。由此,实现了基于AI技术,对目标业务事项对应的待审核文档进行自动审核,减少了文档审核所需的人力成本,提高了文档审核的效率。本申请还能结合RPA和AI实现IA的获取提供方的联系方式,并将各待审核文档的审核结果自动反馈至对应的提供方,从而进一步减少反馈审核结果所需的人力成本。
Description
技术领域
本申请涉及机器人流程自动化和人工智能技术领域,特别涉及一种结合RPA和AI实现IA的文档审核方法、装置及电子设备。
背景技术
机器人流程自动化(Robotic Process Automation,简称RPA),是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
人工智能(Artificial Intelligence,简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
智能自动化(Intelligent Automation,简称IA)是一系列从机器人流程自动化到人工智能的技术总称,将RPA与光学字符识别(Optical Character Recognition,OCR)、智能字符识别(Intelligent Character Recognition,ICR)、流程挖掘(Process Mining)、深度学习(Deep Learning,DL)、机器学习(Machine Learning,ML)、自然语言处理(NaturalLanguage Processing,NLP)、语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、计算机视觉(Computer Vision,CV)等多种AI技术相结合,以创建能够思考、学习及自适应的端到端的业务流程,涵盖从流程发现、流程自动化,到通过自动而持续的数据收集、理解数据的含义,使用数据来管理和优化业务流程的整个历程。
在很多业务场景中,需要对用户提交的文档进行审核。比如,医药企业为了办理医疗器械注册、药品注册等医药注册事项,可以向药品监督管理局(简称药监局)提交相关的申请文档,药监局的审批部门会对医药企业提交的文档进行审核,并在审核通过时,下发相应证书,在审核不通过时,通知医药企业对文档进行修改。相关技术中,通常是通过人工进行文档审核,不仅人力成本高,且效率低。如何以较低的人力成本,高效的对文档进行审核,已经成为一个亟待解决的问题。
发明内容
本申请提供一种结合RPA和AI实现IA的文档审核方法、装置及电子设备,以解决相关技术中的文档审核方法存在的人力成本高且效率低的技术问题。
本申请第一方面实施例提供一种结合RPA和AI实现IA的文档审核方法,包括:获取目标业务事项对应的至少一个待审核文档;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题;在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。
在一些实施例中,预设类型包括信息补全类型;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题,包括:获取各待审核文档的标识;基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项所要求的至少一个目标文档的标识;将各待审核文档的标识与各目标文档的标识进行比对,以确定各待审核文档是否齐全。
在一些实施例中,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题,还包括:基于光学字符识别OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;对各待审核文档所包含的文本信息进行信息抽取,以获取各文本信息所包含的待审核字段以及对应的字段值;基于目标业务事项,查询知识图谱,以获取各目标文档中所要求的字段;判断各文本信息所包含的待审核字段中,是否存在与对应的目标文档中所要求的字段一致的目标字段,以及判断目标字段是否存在对应的字段值,以确定各待审核文档中的信息是否齐全。
在一些实施例中,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题,还包括:获取所有的文本信息中的相同待审核字段;在相同待审核字段存在对应的字段值的情况下,将相同待审核字段对应的字段值进行比对,以确定各待审核文档中的信息是否一致。
在一些实施例中,预设类型包括流程规范类型;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题,包括:基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项对应的流程规范;基于各待审核文档以及所包含的文本信息,判断各待审核文档是否满足流程规范。
在一些实施例中,预设类型包括行文规范类型;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题,包括:基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;将各待审核文档所包含的文本信息,输入预先训练的语言模型,以通过语言模型,确定各待审核文档是否存在行文规范类型的问题。
在一些实施例中,结合RPA和AI实现IA的文档审核方法还包括:在确定各待审核文档不存在多个预设类型的问题的情况下,将各待审核文档发送至人工审核平台。
在一些实施例中,结合RPA和AI实现IA的文档审核方法还包括:调用机器人流程自动化RPA机器人访问业务系统,以获取各待审核文档的提供方的联系方式;采用RPA机器人,通过联系方式,将各待审核文档的审核结果反馈至对应的提供方。
在一些实施例中,目标业务事项为医药注册事项。
本申请第二方面实施例提供一种结合RPA和AI实现IA的文档审核装置,包括:获取模块,用于获取目标业务事项对应的至少一个待审核文档;审核模块,用于基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题;生成模块,用于在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。
在一些实施例中,预设类型包括信息补全类型;审核模块,用于:获取各待审核文档的标识;基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项所要求的至少一个目标文档的标识;将各待审核文档的标识与各目标文档的标识进行比对,以确定各待审核文档是否齐全。
在一些实施例中,审核模块,还用于:基于光学字符识别OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;对各待审核文档所包含的文本信息进行信息抽取,以获取各文本信息所包含的待审核字段以及对应的字段值;基于目标业务事项,查询知识图谱,以获取各目标文档中所要求的字段;判断各文本信息所包含的待审核字段中,是否存在与对应的目标文档中所要求的字段一致的目标字段,以及判断目标字段是否存在对应的字段值,以确定各待审核文档中的信息是否齐全。
在一些实施例中,审核模块,还用于:获取所有的文本信息中的相同待审核字段;在相同待审核字段存在对应的字段值的情况下,将相同待审核字段对应的字段值进行比对,以确定各待审核文档中的信息是否一致。
在一些实施例中,预设类型包括流程规范类型;审核模块,还用于:基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项对应的流程规范;基于各待审核文档以及所包含的文本信息,判断各待审核文档是否满足流程规范。
在一些实施例中,预设类型包括行文规范类型;审核模块,还用于:基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;将各待审核文档所包含的文本信息,输入预先训练的语言模型,以通过语言模型,确定各待审核文档是否存在行文规范类型的问题。
在一些实施例中,结合RPA和AI实现IA的文档审核装置还包括:第一发送模块,用于在确定各待审核文档不存在多个预设类型的问题的情况下,将各待审核文档发送至人工审核平台。
在一些实施例中,结合RPA和AI实现IA的文档审核装置还包括:调用模块,用于调用机器人流程自动化RPA机器人访问业务系统,以获取各待审核文档的提供方的联系方式;第二发送模块,用于采用RPA机器人,通过联系方式,将各待审核文档的审核结果反馈至对应的提供方。
在一些实施例中,目标业务事项为医药注册事项。
本申请第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时,实现如本申请上述实施例所述的方法。
本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本申请上述实施例所述的方法。
本申请第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本申请上述实施例所述的方法。
本申请实施例提供的技术方案可以包括以下有益效果:
通过获取目标业务事项对应的至少一个待审核文档,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题,在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息,实现了基于AI技术,对目标业务事项对应的待审核文档进行自动审核,减少了文档审核所需的人力成本,提高了文档审核的效率。另外,通过在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息,可以为待审核文档的提供方提供修改建议,方便提供方对待审核文档进行修改。本申请还能结合RPA和AI实现IA的获取提供方的联系方式,并将各待审核文档的审核结果自动反馈至对应的提供方,从而进一步减少反馈审核结果所需的人力成本。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1是根据本申请第一实施例的结合RPA和AI实现IA的文档审核方法的流程示意图;
图2是根据本申请第二实施例的结合RPA和AI实现IA的文档审核方法的流程示意图;
图3是根据本申请第三实施例的结合RPA和AI实现IA的文档审核方法的流程示意图;
图4是根据本申请第四实施例的结合RPA和AI实现IA的文档审核方法的流程示意图;
图5是根据本申请第五实施例的结合RPA和AI实现IA的文档审核方法的流程示意图;
图6是根据本申请第六实施例的结合RPA和AI实现IA的文档审核装置的结构示意图;
图7是用来实现本申请实施例的结合RPA和AI实现IA的文档审核方法的电子设备的框图。
具体实施方式
下面详细描述本申请/公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请/公开,而不能理解为对本申请/公开的限制。
参照下面的描述和附图,将清楚本申请/公开的实施例的这些和其他方面。在这些描述和附图中,具体公开了本申请/公开的实施例中的一些特定实施方式,来表示实施本申请/公开的实施例的原理的一些方式,但是应当理解,本申请/公开的实施例的范围不受此限制。相反,本申请/公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
需要说明的是,本公开申请的技术方案中,所涉及的数据的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
本申请提供一种结合RPA和AI实现IA的文档审核方法、装置、电子设备及存储介质。其中,方法包括:获取目标业务事项对应的至少一个待审核文档;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题;在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。由此,实现了基于AI技术,对目标业务事项对应的待审核文档进行自动审核,减少了文档审核所需的人力成本,提高了文档审核的效率。
本申请提供的结合RPA和AI实现IA的文档审核方法、装置、电子设备及存储介质,可以应用于医药领域、司法领域等任意需要进行文档审核的领域,本申请对此不作限制。本申请各实施例以医药领域为例进行说明。
为了清楚说明本发明的各实施例,首先对本发明实施例中涉及到的技术名词进行解释说明。
在本申请/公开的描述中,术语“多个”指两个或两个以上。
在本申请的描述中,“RPA机器人”是指可结合AI技术和RPA技术,自动进行在线业务办理的软件机器人。RPA机器人拥有“连接器”和“无侵入”两个特性,通过模拟人类的操作方法,在不更改信息系统的前提下,使用非侵入的方式,将不同系统的数据进行提取、整合和连通。
在本申请的描述中,“字段”和“字段值”,均为由单个字符或连续的多个字符组成的片段。其中,“字段”可以理解为属性项key,“字段值”可以理解为属性值value,且字段与字段值之间具有对应关系,字段和对应的字段值共同组成一条结构化数据。比如“张三”为字段“姓名”对应的字段值,“姓名”和“张三”组成一条结构化数据。
在本申请的描述中,“待审核文档”,指审批部门接收到的用于办理某项业务的文档资料。相应的,“目标业务事项”,即指该项业务。“提供方”,指向审批部门提交待审核文档的一方,其中,提供方可以为个人或企业等,本申请对此不作限制。
比如,医药企业为了办理医疗器械注册、药品注册、给药方式变更注册或者药品剂量变更注册等医药注册事项,可以向药监局提交申请,并且提交相关的申请文档。假设医药企业向药监局提交了药品注册申请,并提交了相关的申请文档,则药品注册事项即为目标业务事项,医药企业申请办理医药注册事项时提交的文档,即为目标业务事项对应的待审核文档,医药企业即为待审核文档的提供方。
在本申请的描述中,“目标文档”,指成功办理目标业务事项所需要的文档,即目标业务事项所要求的文档。
在本申请的描述中,“预设类型”,指预先设置的待审核文档可能存在的问题所属的类型。
在本申请的描述中,“信息补全类型”,即待审核文档存在文档不齐全,或者待审核文档中信息不齐全,或者待审核文档中信息不一致等问题,需要补充或修改。其中,属于信息补全类型的问题例如可以包括:待审核文档不齐全,比如目标业务事项所要求的目标文档包括文档A、文档B和文档C,而待审核文档仅包括文档A和文档B;待审核文档中的信息不齐全,比如目标业务事项所要求的文档A中,要求包括字段a以及对应的字段值,而待审核文档中包括文档A,但该文档A中不包括字段a及对应的字段值,或者,该文档A中包括字段a但不包括对应的字段值;待审核文档中信息不一致,比如,待审核文档包括文档A、文档B和文档C,其中文档A和文档B中均包括字段a以及对应的字段值,但文档A中的字段a对应的字段值,与文档B中的字段a对应的字段值不同。
在本申请的描述中,“流程规范类型”,即待审核文档不满足目标业务事项对应的流程规范。其中,目标业务事项对应的流程规范,即目标业务事项的办理流程中应该遵守的规范。比如,以目标业务事项为医疗器械注册事项为例,假设医疗器械注册事项对应的流程规范包括:如医疗器械注册证有效期内有新的强制性标准、国家标准发布实施,已注册产品为符合新的强制性标准、国家标准品所做的变化属于应当办理变更注册的,注册人应当先行办理变更注册手续,取得原审批部门批准的变更注册(备案)文件后,再提出延续注册申请。则在注册人(即本申请实施例中待审核资料的提供方)的医疗器械注册证有效期内有新的强制性标准发布实施,且医疗器械为符号新的强制性标准属于应当办理变更注册的情况下,若注册人提交的待审核文档中不包括原审批部门批准的变更注册(备案)文件,则待审核文档存在流程规范类型的问题。
在本申请的描述中,“行文规范类型”,即待审核文档中存在错别字、英文翻译错误、专业名词使用不规范等行文格式方面的问题。
在本申请的描述中,“OCR(Optical Character Recognition,光学字符识别)”,具体是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
在本申请的描述中,“信息抽取”,是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。其中,信息抽取可以包括命名实体识别和关系抽取。命名实体识别,即在一段文本中识别出各类命名实体。其中需要识别的命名实体通常包括人名、地名、组织机构名、药物、时间等,可以根据应用场景的不同进行设置。比如,对于医药注册事项,需要识别的命名实体可以包括医学专用名词、规范专用名词、注册人住所、注册人名称、代理医药注册事项的代理人的名称等。关系抽取,目的是为了识别出文本实体中的目标关系,通过识别实体之间的关系来提取实体之间的语义关系。关系抽取可以通过序列标注、分类、依存句法分析、语义依存分析等技术实现。
在本申请的描述中,“语言模型”,为用于确定待审核文档是否存在行文规范类型的问题的任意机器模型,比如神经网络模型。其中,语言模型可以预先通过对训练样本进行训练得到。
在本申请的描述中,“人工审核平台”,指能够通过人工对文档进行审核的平台,比如人机协同平台。
在本申请的描述中,“业务系统”,指审批部门办理业务事项的线上系统,比如药监局的管理系统等。
以下结合附图描述根据本申请/公开实施例的结合RPA和AI实现IA的文档审核方法、装置、电子设备及存储介质。
首先结合附图,对本申请实施例中的结合RPA和AI实现IA的文档审核方法进行说明。
图1是本申请第一实施例的结合RPA和AI实现IA的文档审核方法的流程图。如图1所示,该方法可包括以下步骤:
步骤101,获取目标业务事项对应的至少一个待审核文档。
需要说明的是,本申请实施例的结合RPA和AI实现IA的文档审核方法,可以由结合RPA和AI实现IA的文档审核装置执行,以下将结合RPA和AI实现IA的文档审核装置简称为文档审核装置。其中,该文档审核装置可以由软件和/或硬件实现,该文档审核装置可以为电子设备,或者也可以配置在电子设备中,以实现文档的自动审核,从而减少文档审核所需的人力成本,提高文档审核的效率。其中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
其中,目标业务事项对应的待审核文档,可以包括一个文档,也可以包括多个文档,本申请对此不作限制。
在一些实施例中,文档审核装置可以提供上传接口,从而提供方可以将办理目标业务事项所需的文档通过上传接口进行上传,相应的,文档审核装置可以获取目标业务事项对应的至少一个待审核文档。
步骤102,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题。
在一些实施例中,可以预先通过以下方式确定目标业务事项对应的多个预设类型:总结目标业务事项的办理过程中,待审核文档经常出现的问题,并对这些问题进行分类,以得到多个预设类型。进而文档审核装置可以对各待审核文档进行逐一审核,并针对每个预设类型,确定各待审核文档是否存在该预设类型的问题。
其中,多个预设类型,比如可以包括信息补全类型、流程规范类型、行文规范类型等。
其中,不同的目标业务事项,可以对应不同的预设类型。
步骤103,在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。
在一些实施例中,文档审核装置可以根据待审核文档存在的预设类型的问题,生成待审核文档对应的修改建议信息。
举例来说,假设文档审核装置确定待审核文档存在信息补全类型的问题,其中该问题具体为:提供方提交的各待审核文档中,缺少目标业务事项所要求的文档A,则文档审核装置可以生成修改建议信息“需要补充文档A”。
本申请实施例提供的结合RPA和AI实现IA的文档审核方法,获取目标业务事项对应的至少一个待审核文档;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题;在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。由此,实现了基于AI技术,对目标业务事项对应的待审核文档进行自动审核,减少了文档审核所需的人力成本,提高了文档审核的效率。另外,通过在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息,可以为待审核文档的提供方提供修改建议,方便提供方对待审核文档进行修改。
在一些实施例中,预设类型可以包括信息补全类型,下面结合图2,对本申请实施例中,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在信息补全类型的问题的过程进行说明。
图2是根据本申请第二实施例的结合RPA和AI实现IA的文档审核方法的流程图。如图2所示,结合RPA和AI实现IA的文档审核方法,可以包括:
步骤201,获取目标业务事项对应的至少一个待审核文档。
其中,步骤201的具体实现过程及原理,可以参考上述实施例的描述,此处不再赘述。
在一些实施例中,属于信息补全类型的问题可以包括:待审核文档不齐全。相应的,文档审核装置获取各待审核文档后,可以通过以下步骤202-205的方式,确定各待审核文档是否存在信息补全类型的问题。
步骤202,获取各待审核文档的标识。
其中,该标识用于唯一标识待审核文档。其中,待审核文档的标识,可以为待审核文档的文件名称,也可以为待审核文档对应的编号等,本申请对此不作限制。
步骤203,基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项所要求的至少一个目标文档的标识。
在一些实施例中,针对任意业务事项,可以根据办理该业务事项所需要的文档,预先创建该业务事项对应的知识图谱。其中,知识图谱中比如可以包括该业务事项对应的第一节点,以及办理该业务事项所需要的文档对应的第二节点,第一节点与第二节点通过边连接。从而文档审核装置可以基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,确定知识图谱中通过边与目标业务事项对应的第一节点连接的第二节点,并将该第二节点对应的文档的标识,确定为目标业务事项所要求的至少一个目标文档的标识。
步骤204,将各待审核文档的标识与各目标文档的标识进行比对,以确定各待审核文档是否齐全。
步骤205,在确定各待审核文档不齐全的情况下,确定各待审核文档存在信息补全类型的问题。
在一些实施例中,在对于各目标文档的标识,确定均存在与该标识相同的待审核文档的标识的情况下,可以确定各待审核文档齐全。在对于至少一个目标文档的标识,确定不存在与该标识相同的待审核文档的标识的情况下,可以确定各待审文档不齐全,进而可以确定各待审核文档存在信息补全类型的问题。
在一些实施例中,属于信息补全类型的问题还可以包括:待审核文档中信息不齐全。相应的,在步骤205之后,文档审核装置还可以通过以下步骤206-210所示的方式,确定各待审核文档是否存在信息补全类型的问题。
步骤206,基于光学字符识别OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息。
步骤207,对各待审核文档所包含的文本信息进行信息抽取,以获取各文本信息所包含的待审核字段以及对应的字段值。
步骤208,基于目标业务事项,查询知识图谱,以获取各目标文档中所要求的字段。
在一些实施例中,针对任意业务事项,在创建该业务事项对应的知识图谱时,还可以根据办理该业务事项所需要的各文档中需要包含的字段,来创建知识图谱。相应的,知识图谱中除了包括该业务事项对应的第一节点、办理该业务事项所需要的文档对应的第二节点,还包括每个文档中需要包含的各字段对应的第三节点,第三节点与对应的第二节点通过边连接。从而文档审核装置可以基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,确定知识图谱中通过边与各第二节点连接的第三节点,并将各第三节点对应的字段,确定为对应的目标文档(即与第三节点连接的第二节点对应的目标文档)中所要求的字段。
步骤209,判断各文本信息所包含的待审核字段中,是否存在与对应的目标文档中所要求的字段一致的目标字段,以及判断目标字段是否存在对应的字段值,以确定各待审核文档中的信息是否齐全。
步骤210,在确定各待审核文档中的信息不齐全的情况下,确定各待审核文档存在信息补全类型的问题。
在一些实施例中,对于各目标文档中所要求的各字段,在文档审核装置确定对应的待审核文档所包含的文本信息中的待审核字段中,均存在与该字段一致的目标字段,且各目标字段均存在对应的字段值的情况下,可以确定各待审核文档中的信息齐全。
在一些实施例中,对于各目标文档中所要求的至少一个字段,在文档审核装置确定对应的待审核文档所包含的文本信息中的待审核字段中,不存在与该字段一致的目标字段的情况下,可以确定各待审核文档中的信息不齐全,进而可以确定各待审核文档存在信息补全类型的问题。
在一些实施例中,可能出现某个待审核文档中某个字段没有对应的字段值的情况,那么,对各待审核文档所包含的文本信息进行信息抽取,可能存在没有获取到某个待审核字段对应的字段值的情况,即该待审核字段不存在对应的字段值。对于各目标文档中所要求的至少一个字段,在文档审核装置确定对应的待审核文档所包含的文本信息中的待审核字段中,存在与该字段一致的目标字段,但该目标字段不存在对应的字段值的情况下,可以确定各待审核文档中的信息不齐全,进而可以确定各待审核文档存在信息补全类型的问题。
在一些实施例中,属于信息补全类型的问题还可以包括:待审核文档中信息不一致。相应的,在步骤210之后,文档审核装置还可以通过以下步骤所示的方式,确定各待审核文档是否存在信息补全类型的问题:
获取所有的文本信息中的相同待审核字段;
在相同待审核字段存在对应的字段值的情况下,将相同待审核字段对应的字段值进行比对,以确定各待审核文档中的信息是否一致;
在确定各待审核文档中的信息不一致的情况下,确定各待审核文档存在信息补全类型的问题。
在一些实施例中,在文档审核装置确定所有文本信息中相同待审核字段对应的字段值均相同的情况下,可以确定各待审核文档中信息一致。在文档审核装置确定所有文本信息中,至少一个相同待审核字段对应的字段值不相同的情况下,可以确定各待审核文档中的信息不一致,进而可以确定各待审核文档存在信息补全类型的问题。
步骤211,在确定各待审核文档存在信息补全类型的问题下,生成待审核文档对应的修改建议信息。
在一些实施例中,文档审核装置确定各待审核文档不存在上述任一问题时,可以确定各待审核文档不存在信息补全类型的问题。在文档审核装置确定各待审核文档存在上述至少一个问题时,可以确定各待审核文档存在信息补全类型的问题,进而可以生成待审核文档对应的修改建议信息。
综上,本申请实施例提供的结合RPA和AI实现IA的文档审核方法,实现了基于AI技术,自动审核目标业务事项对应的待审核文档是否存在信息补全类型的问题,从而减少了文档审核所需的人力成本,提高了文档审核的效率。另外,通过在确定各待审核文档存在信息补全类型的问题的情况下,生成待审核文档对应的修改建议信息,可以为待审核文档的提供方提供修改建议,方便提供方对待审核文档进行信息补全或修改。
在一些实施例中,预设类型可以包括流程规范类型,下面结合图3,对本申请实施例中,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在流程规范类型的问题的过程进行说明。
图3是根据本申请第三实施例的结合RPA和AI实现IA的文档审核方法的流程图。如图3所示,结合RPA和AI实现IA的文档审核方法,可以包括:
步骤301,获取目标业务事项对应的至少一个待审核文档。
步骤302,基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息。
其中,步骤301-302的具体实现过程及原理,可以参考上述实施例的描述,此处不再赘述。
步骤303,基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项对应的流程规范。
在一些实施例中,针对任意业务事项,在创建该业务事项对应的知识图谱时,可以根据该业务事项的办理流程中应该遵守的规范,来创建知识图谱。相应的,知识图谱中除了包括该业务事项对应的第一节点,还可以包括该业务事项的办理流程中应该遵守的规范对应的第四节点,第四节点与第一节点通过边连接。从而文档审核装置可以基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,确定知识图谱中通过边与目标业务事项对应的第一节点连接的第四节点,并将该第四节点对应的规范,确定为目标业务事项对应的流程规范。
步骤304,基于各待审核文档以及所包含的文本信息,判断各待审核文档是否满足流程规范。
举例来说,以目标业务事项为医疗器械注册事项为例,假设医疗器械注册事项对应的流程规范包括:如医疗器械注册证有效期内有新的强制性标准、国家标准发布实施,已注册产品为符合新的强制性标准、国家标准品所做的变化属于应当办理变更注册的,注册人应当先行办理变更注册手续,取得原审批部门批准的变更注册(备案)文件后,再提出延续注册申请。待审核文档中包括医疗器械注册证。
则文档审核装置可以基于医疗器械注册证所包含的文本信息,确定医疗器械注册证的有效期,并查询有效期内是否有新的强制性标准、国家标准发布实施,以及确定已注册产品是否符合新的强制性标准、国家标准品所做的变化属于应当办理变更注册的。若是,则文档审核装置可以审核注册人提交的待审核文档中是否包括原审批部门批准的变更注册(备案)文件。若不包括,则文档审核装置可以确定各待审核文档不满足医疗器械注册事项对应的流程规范。若包括,则文档审核装置可以确定各待审核文档满足医疗器械注册事项对应的流程规范。
步骤305,在各待审核文档不满足流程规范的情况下,确定各待审核文档存在流程规范类型的问题,并生成待审核文档对应的修改建议信息。
在一些实施例中,文档审核装置可以根据待审核文档存在的流程规范类型的问题,生成待审核文档对应的修改建议信息。比如,继续上述示例,文档审核装置可以生成修改建议信息“请到原审批部门进行变更注册,取得原审批部门批准的变更注册(备案)文件后,再提出延续注册申请”。
综上,本申请实施例提供的结合RPA和AI实现IA的文档审核方法,实现了基于AI技术,自动审核目标业务事项对应的待审核文档是否存在流程规范类型的问题,从而减少了文档审核所需的人力成本,提高了文档审核的效率。另外,通过在确定各待审核文档存在流程规范类型的问题的情况下,生成待审核文档对应的修改建议信息,可以为待审核文档的提供方提供修改建议,方便提供方对待审核文档进行修改。
在一些实施例中,预设类型可以包括行文规范类型,下面结合图4,对本申请实施例中,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在行文规范类型的问题的过程进行说明。
图4是根据本申请第四实施例的结合RPA和AI实现IA的文档审核方法的流程图。如图4所示,结合RPA和AI实现IA的文档审核方法,可以包括:
步骤401,获取目标业务事项对应的至少一个待审核文档。
步骤402,基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息。
其中,步骤401-402的具体实现过程及原理,可以参考上述实施例的描述,此处不再赘述。
步骤403,将各待审核文档所包含的文本信息,输入预先训练的语言模型,以通过语言模型,确定各待审核文档是否存在行文规范类型的问题。
在一些实施例中,可以预先训练生成语言模型,语言模型的输入为文本信息,输出为该文本信息中存在的行文规范类型的问题以及对应的置信度。从而可以将各待审核文档所包含的文本信息,输入预先训练的语言模型,以通过语言模型,预测各文本信息中存在的行文规范类型的问题,并确定对应的置信度,从而文档审核装置,可以根据语言模型预测的各文本信息中存在的行文规范类型的问题以及对应的置信度,确定各待审核文档是否存在行文规范类型的问题。比如,可以设置置信度阈值,并在某个待审核文档所包含的文本信息中,存在行文规范类型的问题1对应的置信度大于置信度阈值的情况下,确定该待审核文档存在行文规范类型的问题1。其中,置信度阈值可以根据需要任意设置,比如可以设置为0.7、0.8等,本申请对此不作限制。
步骤404,在确定各待审核文档存在行文规范类型的问题的情况下,生成待审核文档对应的修改建议信息。
在一些实施例中,文档审核装置可以根据待审核文档存在的行文规范类型的问题,生成待审核文档对应的修改建议信息。比如,假设待审核文档存在的行文规范类型的问题为:文档A中某个中文词x的英文翻译错误,则文档审核装置可以生成修改建议信息“请修改词语x的英文翻译”。
综上,本申请实施例提供的结合RPA和AI实现IA的文档审核方法,实现了基于AI技术,自动审核目标业务事项对应的待审核文档是否存在行文规范类型的问题,从而减少了文档审核所需的人力成本,提高了文档审核的效率。另外,通过在确定各待审核文档存在行文规范类型的问题的情况下,生成待审核文档对应的修改建议信息,可以为待审核文档的提供方提供修改建议,方便提供方对待审核文档进行修改。
下面结合图5,对本申请实施例提供的结合RPA和AI实现IA的文档审核方法进行进一步说明。图5是本申请第五实施例的结合RPA和AI实现IA的文档审核方法的流程图,如图5所示,该方法可以包括以下步骤:
步骤501,获取目标业务事项对应的至少一个待审核文档。
步骤502,基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题,其中,多个预设类型包括信息补全类型、流程规范类型和行文规范类型。
步骤503,在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。
其中,步骤501-503的具体实现过程及原理,可以参考上述实施例的描述,此处不再赘述。
步骤504,在确定各待审核文档不存在多个预设类型的问题的情况下,将待审核文档发送至人工审核平台。
在一些实施例中,本申请实施例提供的结合RPA和AI实现IA的文档审核方法,可以应于通过人工对文档进行审核之前的预审过程。相应的,在文档审核装置确定各待审核文档不存在多个预设类型的问题的情况下,可以确定各待审核文档预审通过,从而可以将各待审核文档发送至人工审核平台,以通过人工对各待审核文档进行进一步审核。
通过文档审核装置对各待审核文档进行自动审核,在确定各待审核文档不存在多个预设类型的问题的情况下,再将各待审核文档发送至人工审核平台进一步审核,减少了对各待审核文档进行审核所需的人力成本,且减少了各待审核文档的提供方与审批部门之间的交互次数,提高了目标业务事项的办理效率。
比如,对于医药注册事项,可以采用本申请实施例提供的结合RPA和AI实现IA的文档审核方法,对医药企业提交的注册申请文档进行预审。在文档审核装置确定注册申请文档存在信息补全类型、流程规范类型、行文规范类型中至少一个类型的问题的情况下,可以生成相应的修改建议信息,以使医药企业根据修改建议信息,对待审核文档进行修改。在文档审核装置确定注册申请文档不存在信息补全类型、流程规范类型、行文规范类型中各类型的问题的情况下,可以将各待审核文档发送至人工审核平台,以使审批部门对各待审核文档进一步审核。由此,在医药企业提交注册申请文档后,可以及时给予医药企业反馈,降低医药注册申请周期,提高注册申请效率。
步骤505,调用机器人流程自动化RPA机器人访问业务系统,以获取各待审核文档的提供方的联系方式。
其中,提供方的联系方式,可以是电话号码、邮箱地址等,本申请对此不作限制。
在一些实施例中,业务系统中存储了各待审核文档的提供方的联系方式,文档审核装置可以通过后台数据访问的方式,从业务系统中获取各待审核文档的提供方的联系方式。
在一些实施例中,文档审核装置也可以调用RPA机器人,通过web页面访问的方式,访问业务系统,以获取各待审核文档的提供方的联系方式。其中,web页面指万维网上的一个按照HTML(Hyper Text Markup Language,超文本标记语言)格式组织起来的文件。
步骤506,采用RPA机器人,通过联系方式,将各待审核文档的审核结果反馈至对应的提供方。
其中,审核结果,可以包括各待审核文档审核通过,或者各待审核文档审核不通过以及不通过的原因及修改建议信息等。
在一些实施例中,文档审核装置完成对某个提供方提供的各待审核文档的审核之后,可以采用RPA机器人,将审核结果通过该提供方的联系方式反馈至对应的提供方,以使提供方及时获取待审核文档的审核结果。
由此,通过调用RPA机器人获取业务系统中的提供方的联系方式,能够实现文档审核装置与业务系统的联动,通过采用RPA机器人获取提供方的联系方式,并将各待审核文档的审核结果通过联系方式反馈至对应的提供方,能够结合RPA和AI实现IA的获取提供方的联系方式,并将各待审核文档的审核结果自动反馈至对应的提供方,从而进一步减少反馈审核结果所需的人力成本。
为了实现上述实施例,本申请还提出了一种结合RPA和AI实现IA的文档审核装置。图6是根据本申请第六实施例的结合RPA和AI实现IA的文档审核装置的结构示意图。
如图6所示,该结合RPA和AI实现IA的文档审核装置600,包括:获取模块610、审核模块620以及生成模块630。
其中,获取模块610,用于获取目标业务事项对应的至少一个待审核文档;
审核模块620,用于基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题;
生成模块630,用于在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。
需要说明的是,本申请实施例的结合RPA和AI实现IA的文档审核装置600,可以执行上述实施例提供的结合RPA和AI实现IA的文档审核方法。其中,结合RPA和AI实现IA的文档审核装置600可以由软件和/或硬件实现,该结合RPA和AI实现IA的文档审核装置600可以为电子设备,或者也可以配置在电子设备中,以实现文档的自动审核,从而减少文档审核所需的人力成本,提高文档审核的效率。其中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
在本申请的一个实施例中,预设类型包括信息补全类型;审核模块620,用于:
获取各待审核文档的标识;
基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项所要求的至少一个目标文档的标识;
将各待审核文档的标识与各目标文档的标识进行比对,以确定各待审核文档是否齐全。
在本申请的一个实施例中,审核模块620,还用于:
基于光学字符识别OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;
对各待审核文档所包含的文本信息进行信息抽取,以获取各文本信息所包含的待审核字段以及对应的字段值;
基于目标业务事项,查询知识图谱,以获取各目标文档中所要求的字段;
判断各文本信息所包含的待审核字段中,是否存在与对应的目标文档中所要求的字段一致的目标字段,以及判断目标字段是否存在对应的字段值,以确定各待审核文档中的信息是否齐全。
在本申请的一个实施例中,审核模块620,还用于:
获取所有的文本信息中的相同待审核字段;
在相同待审核字段存在对应的字段值的情况下,将相同待审核字段对应的字段值进行比对,以确定各待审核文档中的信息是否一致。
在本申请的一个实施例中,预设类型包括流程规范类型;审核模块620,还用于:
基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;
基于目标业务事项,查询预先创建的目标业务事项对应的知识图谱,以获取目标业务事项对应的流程规范;
基于各待审核文档以及所包含的文本信息,判断各待审核文档是否满足流程规范。
在本申请的一个实施例中,预设类型包括行文规范类型;审核模块620,还用于:
基于OCR技术,对各待审核文档进行文本识别,以获取各待审核文档所包含的文本信息;
将各待审核文档所包含的文本信息,输入预先训练的语言模型,以通过语言模型,确定各待审核文档是否存在行文规范类型的问题。
在本申请的一个实施例中,结合RPA和AI实现IA的文档审核装置600还包括:
第一发送模块,用于在确定各待审核文档不存在多个预设类型的问题的情况下,将各待审核文档发送至人工审核平台。
在本申请的一个实施例中,结合RPA和AI实现IA的文档审核装置600还包括:
调用模块,用于调用机器人流程自动化RPA机器人访问业务系统,以获取各待审核文档的提供方的联系方式;
第二发送模块,用于采用RPA机器人,通过联系方式,将各待审核文档的审核结果反馈至对应的提供方。
在本申请的一个实施例中,目标业务事项为医药注册事项。
需要说明的是,前述对结合RPA和AI实现IA的文档审核方法实施例的解释说明也适用于该实施例的结合RPA和AI实现IA的文档审核装置,本申请结合RPA和AI实现IA的文档审核装置实施例中未公布的细节,此处不再赘述。
综上,本申请实施例的结合RPA和AI实现IA的文档审核装置,获取目标业务事项对应的至少一个待审核文档;基于AI技术对各待审核文档进行审核,以确定各待审核文档是否存在多个预设类型的问题;在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息。由此,实现了基于AI技术,对目标业务事项对应的待审核文档进行自动审核,减少了文档审核所需的人力成本,提高了文档审核的效率。另外,通过在确定各待审核文档存在至少一个预设类型的问题的情况下,生成待审核文档对应的修改建议信息,可以为待审核文档的提供方提供修改建议,方便提供方对待审核文档进行修改。
为了实现上述实施例,本申请实施例还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如前述任一方法实施例所述的结合RPA和AI实现IA的文档审核方法。
为了实现上述实施例,本申请实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前述任一方法实施例所述的结合RPA和AI实现IA的文档审核方法。
为了实现上述实施例,本申请实施例还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如前述任一方法实施例所述的结合RPA和AI实现IA的文档审核方法。
图7示出了适于用来实现本申请实施方式的示例性电子设备的框图。图7显示的电子设备10仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,电子设备10以通用计算设备的形式表现。电子设备10的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备10典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备10访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备10可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
电子设备10也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备10交互的设备通信,和/或与使得该电子设备10能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备10还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器20通过总线18与电子设备10的其它模块通信。应当明白,尽管图7中未示出,可以结合电子设备10使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (15)
1.一种结合机器人流程自动化RPA和人工智能AI实现智能自动化IA的文档审核方法,其特征在于,所述方法包括:
获取目标业务事项对应的至少一个待审核文档;
基于AI技术对各所述待审核文档进行审核,以确定各所述待审核文档是否存在多个预设类型的问题;
在确定各所述待审核文档存在至少一个所述预设类型的问题的情况下,生成所述待审核文档对应的修改建议信息。
2.根据权利要求1所述的方法,其特征在于,所述预设类型包括信息补全类型;
所述基于AI技术对各所述待审核文档进行审核,以确定各所述待审核文档是否存在多个预设类型的问题,包括:
获取各所述待审核文档的标识;
基于所述目标业务事项,查询预先创建的所述目标业务事项对应的知识图谱,以获取所述目标业务事项所要求的至少一个目标文档的标识;
将各所述待审核文档的标识与各所述目标文档的标识进行比对,以确定各所述待审核文档是否齐全。
3.根据权利要求2所述的方法,其特征在于,所述基于AI技术对各所述待审核文档进行审核,以确定各所述待审核文档是否存在多个预设类型的问题,还包括:
基于光学字符识别OCR技术,对各所述待审核文档进行文本识别,以获取各所述待审核文档所包含的文本信息;
对各所述待审核文档所包含的文本信息进行信息抽取,以获取各所述文本信息所包含的待审核字段以及对应的字段值;
基于所述目标业务事项,查询所述知识图谱,以获取各所述目标文档中所要求的字段;
判断各所述文本信息所包含的待审核字段中,是否存在与对应的目标文档中所要求的字段一致的目标字段,以及判断所述目标字段是否存在对应的字段值,以确定各所述待审核文档中的信息是否齐全。
4.根据权利要求3所述的方法,其特征在于,所述基于AI技术对各所述待审核文档进行审核,以确定各所述待审核文档是否存在多个预设类型的问题,还包括:
获取所有的所述文本信息中的相同待审核字段;
在所述相同待审核字段存在对应的字段值的情况下,将所述相同待审核字段对应的字段值进行比对,以确定各所述待审核文档中的信息是否一致。
5.根据权利要求1所述的方法,其特征在于,所述预设类型包括流程规范类型;
所述基于AI技术对各所述待审核文档进行审核,以确定各所述待审核文档是否存在多个预设类型的问题,包括:
基于OCR技术,对各所述待审核文档进行文本识别,以获取各所述待审核文档所包含的文本信息;
基于所述目标业务事项,查询预先创建的所述目标业务事项对应的知识图谱,以获取所述目标业务事项对应的流程规范;
基于各所述待审核文档以及所包含的文本信息,判断各所述待审核文档是否满足所述流程规范。
6.根据权利要求1所述的方法,其特征在于,所述预设类型包括行文规范类型;
所述基于AI技术对各所述待审核文档进行审核,以确定各所述待审核文档是否存在多个预设类型的问题,包括:
基于OCR技术,对各所述待审核文档进行文本识别,以获取各所述待审核文档所包含的文本信息;
将各所述待审核文档所包含的文本信息,输入预先训练的语言模型,以通过所述语言模型,确定各所述待审核文档是否存在所述行文规范类型的问题。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
在确定各所述待审核文档不存在所述多个预设类型的问题的情况下,将各所述待审核文档发送至人工审核平台。
8.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
调用机器人流程自动化RPA机器人访问业务系统,以获取各所述待审核文档的提供方的联系方式;
采用所述RPA机器人,通过所述联系方式,将各所述待审核文档的审核结果反馈至对应的提供方。
9.根据权利要求1-6中任一项所述的方法,其特征在于,所述目标业务事项为医药注册事项。
10.一种结合RPA和AI实现IA的文档审核装置,其特征在于,所述装置包括:
获取模块,用于获取目标业务事项对应的至少一个待审核文档;
审核模块,用于基于AI技术对各所述待审核文档进行审核,以确定各所述待审核文档是否存在多个预设类型的问题;
生成模块,用于在确定各所述待审核文档存在至少一个所述预设类型的问题的情况下,生成所述待审核文档对应的修改建议信息。
11.根据权利要求10所述的装置,其特征在于,所述预设类型包括信息补全类型;
所述审核模块,用于:
获取各所述待审核文档的标识;
基于所述目标业务事项,查询预先创建的所述目标业务事项对应的知识图谱,以获取所述目标业务事项所要求的至少一个目标文档的标识;
将各所述待审核文档的标识与各所述目标文档的标识进行比对,以确定各所述待审核文档是否齐全。
12.根据权利要求11所述的装置,其特征在于,所述审核模块,还用于:
基于光学字符识别OCR技术,对各所述待审核文档进行文本识别,以获取各所述待审核文档所包含的文本信息;
对各所述待审核文档所包含的文本信息进行信息抽取,以获取各所述文本信息所包含的待审核字段以及对应的字段值;
基于所述目标业务事项,查询所述知识图谱,以获取各所述目标文档中所要求的字段;
判断各所述文本信息所包含的待审核字段中,是否存在与对应的目标文档中所要求的字段一致的目标字段,以及判断所述目标字段是否存在对应的字段值,以确定各所述待审核文档中的信息是否齐全。
13.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-9中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-9中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211110169.3A CN115511441A (zh) | 2022-09-13 | 2022-09-13 | 结合rpa和ai实现ia的文档审核方法、装置及电子设备 |
PCT/CN2023/116767 WO2024055862A1 (zh) | 2022-09-13 | 2023-09-04 | 结合rpa和ai实现ia的文档审核方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211110169.3A CN115511441A (zh) | 2022-09-13 | 2022-09-13 | 结合rpa和ai实现ia的文档审核方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115511441A true CN115511441A (zh) | 2022-12-23 |
Family
ID=84503117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211110169.3A Pending CN115511441A (zh) | 2022-09-13 | 2022-09-13 | 结合rpa和ai实现ia的文档审核方法、装置及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115511441A (zh) |
WO (1) | WO2024055862A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11132755B2 (en) * | 2018-10-30 | 2021-09-28 | International Business Machines Corporation | Extracting, deriving, and using legal matter semantics to generate e-discovery queries in an e-discovery system |
CN110134800A (zh) * | 2019-04-17 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 一种文档关系可视化处理方法及装置 |
CN110852065B (zh) * | 2019-11-07 | 2024-04-05 | 达观数据有限公司 | 一种文档审核方法、装置、系统、设备及存储介质 |
CN114186019A (zh) * | 2021-11-03 | 2022-03-15 | 北京来也网络科技有限公司 | 结合rpa和ai的企业项目的审核方法及装置 |
-
2022
- 2022-09-13 CN CN202211110169.3A patent/CN115511441A/zh active Pending
-
2023
- 2023-09-04 WO PCT/CN2023/116767 patent/WO2024055862A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024055862A1 (zh) | 2024-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6278996B1 (en) | System and method for message process and response | |
AU2016210590B2 (en) | Method and System for Entity Relationship Model Generation | |
US9858385B2 (en) | Identifying errors in medical data | |
US20140120513A1 (en) | Question and Answer System Providing Indications of Information Gaps | |
US20140172417A1 (en) | Vital text analytics system for the enhancement of requirements engineering documents and other documents | |
Lyon et al. | Plagiarism is easy, but also easy to detect | |
WO2021121158A1 (zh) | 公文文件处理方法、装置、计算机设备及存储介质 | |
US11531821B2 (en) | Intent resolution for chatbot conversations with negation and coreferences | |
US11562134B2 (en) | Method and system for advanced document redaction | |
CN113190689B (zh) | 一种电力安全知识图谱的构建方法、装置、设备和介质 | |
CN115049508A (zh) | 页面生成方法、装置、电子设备及存储介质 | |
WO2022247231A1 (zh) | 简历筛选方法、简历筛选装置、终端设备及存储介质 | |
CN113657096A (zh) | 基于rpa和ai的异常业务数据处理方法、装置、设备及介质 | |
CN117828042A (zh) | 用于金融服务的问答处理方法、装置、设备及介质 | |
CN115511441A (zh) | 结合rpa和ai实现ia的文档审核方法、装置及电子设备 | |
Jeners et al. | Towards an integration of multiple process improvement reference models based on automated concept extraction | |
CN113050933B (zh) | 脑图数据处理方法、装置、设备及存储介质 | |
Tornés et al. | Receipt Dataset for Document Forgery Detection | |
CN114511858A (zh) | 基于ai和rpa的公文文件处理方法、装置、设备和介质 | |
CN113539518A (zh) | 基于rpa和ai的药品数据处理方法、装置及电子设备 | |
CN112597295A (zh) | 摘要提取方法、装置、计算机设备和存储介质 | |
CN113517047A (zh) | 医学数据的获取方法、装置、电子设备及存储介质 | |
Flynn | Document classification in support of automated metadata extraction form heterogeneous collections | |
US12124799B2 (en) | Method and system for advanced document redaction | |
CN116303102B (zh) | 测试数据的生成方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |